学习路线图 (Learning Path)¶
从Python后端工程师到AI工程师的完整学习路径,循序渐进,每个阶段都有明确的里程碑和时间预估。
🎯 学习目标总览¶
| 阶段 | 核心技能 | 时间预估 | 适合人群 |
|---|---|---|---|
| 阶段3 | 数据分析 + 传统ML | 4-6小时 | 所有人(CPU即可) |
| 阶段4 | 深度学习 + CV/NLP | 6-10小时 | 推荐有GPU |
| 阶段5 | AIGC + 大模型应用 | 1-2天 | LLM应用开发 |
总学习时间: 15-20小时理论学习 + 30-40小时项目实践 = 45-60小时 (约2-3周全职学习)
📚 阶段3: 机器学习与数据挖掘 (MVP核心)¶
🎓 学习目标¶
掌握数据分析与传统机器学习算法,能完成端到端ML项目。
📝 前置知识¶
- ✅ Python基础(3-5年后端经验)
- ✅ 基础数学(高中数学水平即可)
- ❌ 不需要GPU
- ❌ 不需要深度学习经验
📖 学习路径¶
第1周: 科学计算与数据分析基础¶
M01: 科学计算库 (1.5小时) - [ ] NumPy数组操作 (30min) - 数组创建、索引、切片、广播 - 数学运算、统计函数 - 实践: 完成20+练习题 - [ ] Pandas数据处理 (45min) - Series与DataFrame操作 - 数据读取与导出 - 实践: 处理一个CSV数据集 - [ ] 数据可视化 (15min) - Matplotlib绘图基础 - Seaborn统计图表 - 实践: 绘制5种常用图表
里程碑1: 能用Pandas分析10000+行的真实数据集
M02: Pandas项目实战 (2小时) - [ ] Pandas高级操作 (45min) - 分组聚合 (groupby/agg/transform) - 数据透视表 (pivot_table) - 实践: 销售数据多维度分析 - [ ] 时间序列分析 (45min) - 日期解析与重采样 - 滚动窗口计算 - 实践: 月度销售趋势预测 - [ ] 数据清洗技巧 (30min) - 缺失值处理策略 - 异常值检测与处理 - 实践: 清洗脏数据集
里程碑2: 完成一个端到端数据清洗+分析项目
第2周: 机器学习理论与实践¶
M03: AI数学基础 (2小时) - [ ] 线性代数直觉 (45min) - 向量、矩阵的几何意义 - SVD分解的应用 - 可视化: 看懂矩阵变换动画 - [ ] 概率统计基础 (45min) - 概率分布、期望、方差 - 贝叶斯定理直觉 - 实践: 计算条件概率 - [ ] 微积分与优化 (30min) - 导数、梯度的直觉理解 - 梯度下降可视化 - 实践: 手动实现梯度下降
里程碑3: 能解释ML公式背后的数学直觉
M04: 机器学习进阶 (3小时) - [ ] 监督学习算法 (1小时) - 逻辑回归、决策树、SVM、KNN - 算法对比与选择 - 实践: 对比4种算法效果 - [ ] 集成学习 (1小时) - 随机森林、GBDT、XGBoost - Bagging vs Boosting - 实践: XGBoost调参 - [ ] 无监督学习 (30min) - K-means、层次聚类、DBSCAN - 实践: 客户分群 - [ ] 模型评估 (30min) - 交叉验证、混淆矩阵、ROC-AUC - 实践: 完整评估流程
里程碑4: 能独立完成分类/回归/聚类项目
🚀 实战项目 (9个项目)¶
推荐学习顺序:
入门级 (必做 3个): 1. P01: 朝阳医院数据分析 (2h) - 难度: ⭐️⭐️ - 技能: Pandas基础、数据透视表 - 输出: 销售汇总报表
- P02: 服装零售分析 (3h)
- 难度: ⭐️⭐️⭐️
- 技能: RFM模型、客户细分
-
输出: 4P营销分析报告
-
P05: 零售超市分析 (2h)
- 难度: ⭐️⭐️
- 技能: SWOT分析、关联规则
- 输出: 经营优化建议
进阶级 (选做 3个): 4. P03: 银行营销分析 (3h) - 难度: ⭐️⭐️⭐️ - 技能: 分类模型、不平衡数据 - 输出: 响应预测模型
- P04: 通讯客户流失 (3h)
- 难度: ⭐️⭐️⭐️
- 技能: 流失预测、特征工程
-
输出: 客户留存策略
-
P08: 航空客户价值 (3h)
- 难度: ⭐️⭐️⭐️
- 技能: K-means聚类、LRFMC模型
- 输出: 客户分层体系
挑战级 (有余力再做 3个): 7. P06: 滴滴异常检测 (4h) - 难度: ⭐️⭐️⭐️⭐️ - 技能: Isolation Forest、时间序列 - 输出: 异常订单识别
- P07: 淘宝用户行为 (5h)
- 难度: ⭐️⭐️⭐️⭐️⭐️
- 技能: 大数据处理、推荐系统
-
输出: 年度数据复盘
-
P09: 信贷风控模型 (4h)
- 难度: ⭐️⭐️⭐️⭐️
- 技能: XGBoost、SHAP解释
- 输出: 信用评分卡
里程碑5: 完成≥7个项目,建立ML项目Portfolio
✅ 阶段3学习检查清单¶
理论知识: - [ ] 理解NumPy向量化计算 - [ ] 熟练使用Pandas处理数据 - [ ] 理解机器学习核心概念 - [ ] 掌握至少3种分类算法 - [ ] 掌握至少1种聚类算法 - [ ] 理解评估指标(准确率/F1/AUC)
实践能力: - [ ] 能清洗和探索真实数据集 - [ ] 能画出有洞察的可视化图表 - [ ] 能训练和评估ML模型 - [ ] 能解释模型预测结果 - [ ] 能调优超参数 - [ ] 能写出规范的Python代码
项目输出: - [ ] 完成≥7个项目(78%完成率) - [ ] 每个项目有分析报告 - [ ] 代码通过质量检查 - [ ] 输出指标在预期范围
时间投入: 理论4-6h + 实践15-25h = 20-30h总投入
🧠 阶段4: 深度学习 (GPU加速推荐)¶
🎓 学习目标¶
掌握深度学习框架和现代神经网络架构,能完成CV/NLP迁移学习项目。
📝 前置知识¶
- ✅ 完成阶段3学习
- ✅ 理解神经网络基本原理
- ⚠️ 推荐有GPU(CPU也可但慢5-10倍)
📖 学习路径¶
第3周: 深度学习基础¶
M01: 深度学习基础理论 (3.5小时) - [ ] 神经网络原理 (1h) - 感知机、多层网络、激活函数 - 反向传播算法 - 实践: 手写前向+反向传播 - [ ] PyTorch基础 (1h) - Tensor操作、autograd - nn.Module、DataLoader - 实践: 实现简单神经网络 - [ ] TensorFlow基础 (1h) - Keras API、Model Subclassing - fit/evaluate流程 - 实践: 对比PyTorch实现 - [ ] 训练技巧 (30min) - 优化器选择、学习率调度 - Dropout、Batch Norm - 实践: 训练MNIST分类器
里程碑6: 能用PyTorch/TensorFlow训练简单神经网络
第4周: 计算机视觉¶
M02: 计算机视觉基础 (4小时) - [ ] CNN架构 (1h) - 卷积层、池化层原理 - 经典网络(VGG/ResNet) - 可视化: 看懂卷积过程 - [ ] 图像分类 (1h) - 迁移学习(ImageNet预训练) - Fine-tuning技巧 - 实践: 猫狗分类(准确率>90%) - [ ] 目标检测 (1h) - YOLO原理与使用 - 实时检测系统 - 实践: YOLOv11实时检测 - [ ] 图像分割 (1h) - U-Net、DeepLab架构 - 语义分割与实例分割 - 实践: 道路场景分割
里程碑7: 能完成图像分类/检测/分割任务
第5周: 自然语言处理¶
M03: NLP基础 (3.5小时) - [ ] 文本预处理 (45min) - Tokenization、编码 - 词向量(Word2Vec/GloVe) - 实践: 中文分词与词向量 - [ ] Transformer架构 (1.5h) - Self-Attention机制 - Multi-Head Attention - 可视化: 注意力权重热力图 - [ ] 预训练模型 (1h) - BERT原理与使用 - 文本分类Fine-tuning - 实践: 情感分析(F1>85%) - [ ] 序列生成 (15min) - 机器翻译、文本摘要 - Beam Search解码 - 实践: 中英翻译(BLEU>30)
里程碑8: 能用BERT完成NLP任务
🚀 实战项目 (7个项目)¶
推荐学习顺序:
CV入门 (必做 2个): 1. P01: 工业视觉检测 (3h) - 难度: ⭐️⭐️⭐️ - 框架: TensorFlow - 技能: 图像分类、TF Lite部署 - 输出: 准确率>90%, 边缘设备部署
- P03: OCR票据识别 (3h)
- 难度: ⭐️⭐️⭐️
- 框架: PaddleOCR
- 技能: 文本检测、文本识别
- 输出: 端到端F1>85%
CV进阶 (选做 2个): 2. P02: YOLOv11实时检测 (5h) ⭐️双框架 - 难度: ⭐️⭐️⭐️⭐️ - 框架: PyTorch + TensorFlow - 技能: 目标检测、实时推理 - 输出: mAP>0.45, 30+ FPS
- P04: 自动驾驶分割 (5h) ⭐️双框架
- 难度: ⭐️⭐️⭐️⭐️
- 框架: PyTorch + TensorFlow
- 技能: 语义分割、U-Net
-
输出: mIoU>0.65
-
P05: 医学影像分析 (4h)
- 难度: ⭐️⭐️⭐️⭐️
- 框架: PyTorch + MONAI
- 技能: 3D图像、Grad-CAM
- 输出: AUC>0.88
NLP应用 (必做 2个): 6. P06: Transformer翻译 (5h) ⭐️双框架 - 难度: ⭐️⭐️⭐️⭐️ - 框架: PyTorch + TensorFlow - 技能: Seq2Seq、Attention - 输出: BLEU>25
- P07: 信息提取系统 (4h)
- 难度: ⭐️⭐️⭐️⭐️
- 框架: PyTorch + Transformers
- 技能: NER、关系抽取、BERT
- 输出: F1>0.85
里程碑9: 完成≥5个项目,掌握CV+NLP核心技能
✅ 阶段4学习检查清单¶
理论知识: - [ ] 理解反向传播与梯度计算 - [ ] 掌握PyTorch或TensorFlow一种 - [ ] 理解CNN卷积与池化原理 - [ ] 理解Transformer架构 - [ ] 理解迁移学习与Fine-tuning - [ ] 理解注意力机制
实践能力: - [ ] 能训练和调试深度学习模型 - [ ] 能使用预训练模型 - [ ] 能完成图像分类/检测任务 - [ ] 能完成文本分类/NER任务 - [ ] 能部署模型(ONNX/TFLite) - [ ] 能可视化注意力权重
项目输出: - [ ] 完成≥5个项目(71%完成率) - [ ] 至少1个双框架对比项目 - [ ] GPU训练速度提升≥5倍 - [ ] 模型指标达到预期
时间投入: 理论11h + 实践25-35h = 36-46h总投入
🤖 阶段5: AIGC与大模型 (LLM应用)¶
🎓 学习目标¶
掌握大语言模型应用开发,能构建RAG知识库问答和Agent工具调用系统。
📝 前置知识¶
- ✅ 完成阶段4学习
- ✅ 理解Transformer架构
- ⚠️ 本地LLM推理需32GB+内存(可用API)
📖 学习路径¶
第6周: LLM应用开发¶
M01: AIGC与LLM概述 (1小时) - [ ] 生成式AI发展史 (15min) - GPT系列演进 - 主流LLM对比 - 阅读: GPT-4技术报告 - [ ] Prompt Engineering (30min) - Zero-shot、Few-shot - Chain-of-Thought - 实践: 写出高质量Prompt - [ ] LLM能力评估 (15min) - MMLU、HumanEval基准 - 能力边界与局限性 - 实践: 对比GPT-4 vs Claude
里程碑10: 能写出高质量Prompt,理解LLM原理
M02: 大模型开发 (3小时) - [ ] LangChain框架 (1h) - Chain、Prompt Template - Memory管理 - 实践: 构建对话Chain - [ ] RAG系统 (1h) - 向量数据库(Chroma/FAISS) - 检索、排序、生成 - 实践: 知识库问答(准确率>85%) - [ ] Agent框架 (45min) - ReAct、工具调用 - Multi-Agent协作 - 实践: Agent调用3+工具 - [ ] 模型微调 (15min) - LoRA、QLoRA原理 - 微调流程 - 演示: 微调7B模型
里程碑11: 能构建RAG+Agent系统
🚀 实战项目 (1个综合项目)¶
P01: LLM对话系统 (8-16h) 🎯终极项目 - 难度: ⭐️⭐️⭐️⭐️⭐️ - 框架: LangChain + ChromaDB + Transformers - 技能: RAG、Agent、Prompt Engineering - 模块: 1. 知识库构建 (2h) - 文档解析、分块、向量化 - 索引构建(FAISS/Chroma) 2. RAG问答 (3h) - 检索策略优化 - 生成质量控制 3. Agent工具调用 (3h) - 实现≥3个工具(搜索/计算/查询) - 工具选择与参数填充 4. 系统集成 (2h) - API服务部署 - 前端交互界面 5. 评估优化 (2h) - ROUGE/BLEU评估 - 用户反馈优化
输出: - ✅ RAG检索准确率>85% - ✅ Agent工具调用成功率>90% - ✅ ROUGE-L>0.35 - ✅ API服务可用 - ✅ 演示视频≥5分钟
里程碑12: 完成端到端LLM应用系统
✅ 阶段5学习检查清单¶
理论知识: - [ ] 理解LLM工作原理 - [ ] 掌握Prompt Engineering - [ ] 理解RAG架构 - [ ] 理解Agent框架 - [ ] 了解模型微调技术 - [ ] 理解向量检索原理
实践能力: - [ ] 能使用LangChain开发应用 - [ ] 能构建向量数据库 - [ ] 能实现RAG问答系统 - [ ] 能实现Agent工具调用 - [ ] 能评估生成质量 - [ ] 能部署LLM应用
项目输出: - [ ] 完成对话系统综合项目 - [ ] RAG检索准确率>85% - [ ] Agent成功率>90% - [ ] 系统可用性演示
时间投入: 理论4h + 实践8-16h = 12-20h总投入
🏆 总结: 完整学习路径¶
时间轴 (全职学习)¶
第1-2周: 阶段3 (20-30h) - 数据分析基础 - 传统机器学习 - 完成9个小项目
第3-5周: 阶段4 (36-46h) - 深度学习基础 - CV + NLP应用 - 完成7个小项目
第6-7周: 阶段5 (12-20h) - AIGC与大模型 - RAG + Agent - 完成1个综合项目
总计: 68-96小时 ≈ 2-3个月业余时间 或 2-3周全职学习
学习节奏建议¶
全职学习者 (每天8小时): - 阶段3: 3-4天 - 阶段4: 5-6天 - 阶段5: 2-3天 - 总计: 10-13天
业余学习者 (每天2小时): - 阶段3: 10-15天 - 阶段4: 18-23天 - 阶段5: 6-10天 - 总计: 34-48天 (约1.5-2个月)
周末学习者 (每周末8小时): - 阶段3: 3-4周 - 阶段4: 5-6周 - 阶段5: 2-3周 - 总计: 10-13周 (约2.5-3个月)
学习策略¶
1. 理论与实践结合 - 看完理论立刻做练习 - 边做项目边查文档 - 不要只看不练
2. 循序渐进 - 不跳过前置知识 - 从简单项目开始 - 逐步增加难度
3. 注重质量 - 每个项目做到预期指标 - 代码规范(PEP 8) - 文档完整(README+报告)
4. 主动学习 - 提问: 为什么这样设计? - 对比: 不同算法差异? - 扩展: 还能怎么改进?
5. 建立Portfolio - 所有项目推到GitHub - 写技术博客总结 - 参加Kaggle竞赛练手
学习资源¶
官方文档: - NumPy文档 - Pandas文档 - scikit-learn文档 - PyTorch教程 - TensorFlow教程 - LangChain文档
推荐书籍: - 《Python数据分析实战》- 阶段3 - 《深度学习》(花书) - 阶段4 - 《动手学深度学习》- 阶段4 - 《大模型应用开发》- 阶段5
社区资源: - Kaggle竞赛与Notebook - GitHub优秀项目 - HuggingFace模型库 - Papers with Code论文复现
常见问题¶
Q1: 没有GPU能学吗? A: 阶段3完全可以(CPU),阶段4推荐有GPU但不强制,阶段5可用API模式。推荐Google Colab免费GPU。
Q2: 数学基础差怎么办? A: 教程有"AI数学基础"模块,通俗化讲解,边学边补。高中数学水平足够。
Q3: 每天学多久合适? A: 建议2-3小时,保持连续性。周末可4-6小时集中攻坚。
Q4: 项目做不出来怎么办? A: 先看Notebook教学版,再写脚本生产版。参考IMPLEMENTATION_GUIDE.md详细说明。
Q5: 学完能找到工作吗? A: 完成全部项目+GitHub Portfolio,可应聘初级AI工程师/ML工程师岗位。继续深造可参加Kaggle竞赛。
准备好了吗? 开始你的AI学习之旅! 🚀