Skip to content

Latest commit

 

History

History
346 lines (216 loc) · 12.9 KB

File metadata and controls

346 lines (216 loc) · 12.9 KB

第0节课

开启Python大模型开发之旅:踏上智能冒险前的准备!

Intro

特此鸣谢隔壁Go组Lesson_00为我带来的启发!go_py一家亲😋

现在的你,可能正盯着屏幕,心里想:

“Python?AI?听起来好高大上啊,但我连 pip 是啥都还没整明白😢。”

别怕!本攻略将带你从“人工智障”一路变身为“人工智能家”!
从小白 Pythonista 到大模型魔法师,我们将一起点亮属于你的技能树🧙‍♂️。

这篇攻略不会手把手教你写出 Transformer(虽然你迟早会),
但会帮你养成一名优秀 AI 工程师的素养,让你少走弯路、多点自信。


合格AI玩家的必备素养

AI 开发的学习过程,就像在玩一款开放世界的科技游戏
下面是你要点亮的三大天赋👇

1. 好奇心:永远的探索者 🕵️‍♀️

AI 世界的知识就像数据集一样——永远不够多
每次你看到别人用一句 prompt 就让模型写出论文,
请不要感叹“这也太神了吧”,而要问:

“为什么这句 prompt 效果这么好?”
“LLM 背后到底是怎么算出来的?”

这种好奇心会驱动你去理解模型结构、微调逻辑,
甚至自己训练一个“小ChatGPT”。


2. 内驱力:来自未来的召唤 ⚡

没人逼你去训练模型。
也不会有老师每天追着你写 prompt。
但当你第一次看到自己写的模型识别图片、回答问题、生成音乐时——
那种满足感堪比打通魂系游戏!

AI 世界变化快到离谱,每个月都有新框架、新API。
只有靠内驱力才能让你在浪潮中稳住姿态。


3. 坚持:Debug 是信仰 ✊

训练模型时 GPU 烧了、依赖装不上、API 报 429……
这都是 Pythonista 的日常。

每一个能调通 PyTorch 的人,都是从无数 ModuleNotFoundError 中爬出来的。
不要怕报错,报错其实是 Python 在跟你说话!

当你有一天能看懂错误堆栈并笑着修完它,
你就不再是萌新,而是“人机共舞”的掌控者。


如何正确查找攻略

在 AI 世界里,Google 是你的魔法书,AI 是你的导师。

自己先分析:

看看是不是 dtype 不匹配、是不是路径没对、是不是模型权重没下载。
先动脑再动手,这是 AI 工程师的基本修养。

Google / Bing / Kimi / Claude / ChatGPT:

当你遇到 "CUDA out of memory" 时——
复制报错粘贴搜索!
网络上 99% 的问题别人都帮你踩过坑了。

向AI提问:

ChatGPT、Kimi、Claude、豆包、通义千问……
他们都是你随时在线的助教。
但请记住:AI 是导师,不是保姆!
别动不动就问“怎么写Python大模型代码”,先试着自己写点。

看官方文档:

PyTorch、Transformers、LangChain、OpenAI SDK……
官方文档永远是最准确、最前沿的学习材料。

向学长/学姐/同行请教:

不要怕问,但要学会提问。
你提的问题越精准,别人越乐于帮你。

提问的智慧

请避免“🐂🐎问题”:

  • “为什么我运行不出来?”(截图都没有)
  • “我AI报错了,怎么办?”(报错都不贴)
  • “我装不起来PyTorch!”(版本、显卡、系统全没说)
  • ……

例子

你以为的傲慢

  • 学弟:学长我vscode装不上了怎么办?
  • 学长:你到官网下载安装包下载完双击它,一直点下一步就安装好了
  • 学弟:官网是什么
  • 学长:https://code.visualstudio.com/
  • 学弟:下载按钮在哪?
  • 学长:(截图)
  • 学弟:好了,下载到了,然后呢?
  • 学长:这个都不会还是别学了
  • 学弟:(感觉学长很傲慢)...

实际上的傲慢:

  • 学弟:学长我的电脑是64位的windows 10,我在vscode官网下载 了对应版本,在我安装过程中出现了这个问题,使用百度搜索后还是没有办法解决,你能帮我看看吗?谢谢。(同时贴上安装失败的图片)

  • 学长:这个都不会还是别学了

我们为什么对你们提的问题感到厌烦?

  • 提的问题“过于简单“
  • 提问题的方式不对
  • 遇到问题就提问

怎么问问题?

  • 精确地描述问题并言之有物

  • 话不在多,在于精

  • 清楚明确地表达你的需求

  • 询问有关代码的问题时

  • 截图的方式

    不要手机拍照!不要手机拍照!不要手机拍照!

  • 有礼貌地提问

    多用谢谢你的回答,让回答者知道你对他们能够花费掉自己宝贵地时间来对你提供帮助心存感激。

当然,对于很多问题大家都是 0 基础,问很正常,大家不要怕,学长们都很乐意与小登打好关系,希望大家在学习过程中可以和老登们亦师亦友

✅ 正确姿势:

我在 Windows 11 + Python 3.10 + PyTorch 2.2 环境下安装时遇到 CUDA 版本不匹配的问题提示RuntimeError: CUDA error: invalid device function
我试了 conda 重装但依旧不行请问我该如何检查 CUDA 版本

必备工具

AI 工程师的武器库丰富又花哨,让我们来看看你要装备什么👇

Python & Anaconda

Python 是语言,其最大的特点就是在于其强大的可拓展性,你可以为他装很多很nice的工具,几行代码让他帮你处理事情 。

Anaconda 再原生Python的基础上加入了很多工具包,是一个开箱即用的工具箱。

Anaconda 官网 下载即可。
它会自动帮你装 pip、虚拟环境、Jupyter Notebook 等好东西。

Jupyter Notebook

这是 AI 开发者的“实验室笔记”。 他可以写几行直接运行,方便你快速查看结果你可以一边运行代码,一边写注释、画图、展示结果。

Jupyter = 代码 + 文档 + 图表 + 魔法 ✨

安装命令:

pip install notebook
jupyter notebook

PyCharm(或 VSCode)

JetBrains 出品的 IDE 永远不让人失望。 大部分人不会在命令行敲代码,所以你需要一个趁手的写代码,调试,运行集成环境,简称继承开发环境(IDE)

PyCharm 专为 Python 打造,智能补全、调试体验一流。
而且同样可以通过 JetBrains 学生包 免费申请。

Important

免费使用:Jetbrains会有教育优惠pack,申请以后可以免费使用大部分IDE和产品(老东西把焚决交出来了)

申请流程:

​ 首先打开学信网,登录后点击自己主页

​ 之后按照图片所示点击

10

进去后选择教育部学籍验证报告

​ 之后去到JetBrains教育包申请地址,选择第三个官方文件,按照指示填写即可(填写学校教育邮箱,一般是学号@stu.cqupt.edu.cn)

11

GitHub

GitHub 是一个基于 Git 的代码托管平台,广泛用于软件开发和版本控制。它提供了一个协作环境,使开发者能够在全球范围内共享和管理代码。以下是 GitHub 的一些关键功能和特点:

  1. 版本控制:利用 Git 的分布式版本控制系统,开发者可以跟踪代码的更改历史,轻松管理项目的不同版本。
  2. 协作工具:通过 pull requests、issues 和 project boards,团队可以高效地进行代码审查、任务分配和项目管理。
  3. 代码托管:GitHub 提供免费的公共仓库和付费的私有仓库存储,支持多种编程语言的项目。
  4. 社区和开源:GitHub 是开源项目的热门平台,开发者可以贡献代码、报告问题和参与讨论。
  5. 集成和扩展:支持与 CI/CD 工具、项目管理软件和其他开发工具的集成,增强了开发流程的自动化和效率。
  6. GitHub Actions:允许开发者创建自定义的自动化工作流,以实现持续集成和部署。
  7. 安全性:提供代码扫描、依赖项管理和安全警报,帮助开发者识别和修复潜在的安全漏洞。

GitHub 不仅是一个代码托管平台,也是一个开发者社区,促进了全球范围内的协作和创新 这是他的url👇 github education官网地址

Hugging Face

全世界最大的开源 AI 模型乐园。上面有很多各式各样的模型,初学阶段要学会站在巨人的肩膀上看世界
上面有无数 NLP、CV、语音模型——
你可以下载、微调、甚至一键部署。

👉就是这个 https://huggingface.co

LangChain & OpenAI API

LangChain 是目前主流的大模型开发框架,使用它使你开发一个智能体轻而易举
结合 OpenAI API(或其他 LLM 接口),
你可以快速打造一个智能客服、代码助手、AI 导游……

Git

无论你是在写 Web 后端,还是在训练模型,再多人写作中,Git尤为重要,不然你就只能和前端小姐姐(qinyaojj)线下对接口了,用复制粘贴来和同时同时处理代码了。是不是想想就痛苦。。。
Git 都是你的时间机器。你可以回到之前任意一个版本,还能开出多个版本进行开发,总之,很牛而逼之!一定要用熟练了

以下就是一个推仓库的最简单方法:

git clone <repo_url>
git add .
git commit -m "AI: my first training script"
git push

GitHub 是你的作品展示墙。
你调好的模型、写的工具、甚至失败的实验日志,都可以放上去。

WSL / Docker

当你的环境变得复杂时,用 Docker 打包一切最省心。 他类似一个个独立的小型裁切Linux系统 尤其是训练模型、部署微服务的时候。学会环境部署。用它杠杠的~~

Typora

Markdown 笔记神器。基本上工程文档都用它来编写,他的语法很简单,去CSDN自学十分钟就能熟练掌握
写学习笔记、写项目文档都离不开它。
本篇文档也是用 Typora 敲的😉。

Copilot

俗话说得好,不喜欢薅羊毛的小登不是好小登,特别是当下好AI都付费的情况下,github的copilot可以让你在边查看自己/他人的仓库代码边问询,还可以嵌入大部分IDE,是内置IDE的AI工具首选之一**(主要是申请教育包后额度上限变高,每天和GPT等大模型轮转使用其实够了)**

但是!但是!但是!

我强烈建议大家一开始不要依赖ai写代码,py语法很多细枝末节真是越用才会越熟练。大家千万切忌急功近利。踏踏实实思考,一行一行写代码,才能平步青云,像我们的荣誉Py成员王家宽gg一样

如何高效学习

Python + AI 的学习,就像升级打怪:
先练基本功,再点技能树。

我们后期会分开发agent方向和算法类方向

具体的学习路线就看README.md吧,自己多去做拓展,

给大家推荐点个人觉得还ok的资料

Python 基础

数据科学三剑客

  • NumPy(数值计算)
  • Pandas(数据处理)
  • Matplotlib / Seaborn(数据可视化)

深度学习框架

  • PyTorch(推荐)
  • TensorFlow(了解即可)

模型与项目实战

  • Transformers(BERT / GPT / LLaMA)
  • LangChain(大模型应用)
  • Gradio / Streamlit(快速部署前端)

进阶方向

  • 微调与 LoRA
  • 向量数据库(FAISS / Milvus)
  • RAG(检索增强生成)
  • Prompt Engineering(提示工程)

📚 学习资源

时间管理与成长

AI 行业日新月异,但你要学会不焦虑。
别想着一口吃成 GPT-5。

每天挤出两小时学习,
一周写个小脚本、调个小模型、部署个小项目。
慢慢地,你的仓库、你的简历、你的自信都会亮起来✨

后记

选择大于努力。
选择 Python,是你对未来科技浪潮的入场券。
选择坚持学习 AI,则是你从“使用者”到“创造者”的转变。

that's All.