Skip to content

dwSun/AI-Tutorial

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

从深度学习到 AI 实战:全体系人工智能教程


📚 教程简介

这是一套面向零基础到中高级学习者的人工智能完整体系教程,涵盖从数学基础、机器学习、深度学习,到大语言模型、多模态学习、AI Agent 等各个方向。

特点:

  • 🐣 从浅入深:无需深厚背景知识,循序渐进
  • 📖 图文并茂:善用 mermaid 图表、架构图、流程图
  • 🔬 专业准确:每个概念均有公开资料支撑,附参考资料
  • 💡 直白易懂:用通俗语言讲解专业概念

适合人群:

  • AI 初学者,想系统学习人工智能
  • 已有一定基础,想深入某个专项方向
  • 开发者,想了解 AI 前沿进展
  • 产品经理、研究者,想了解 AI 技术原理

📂 教程结构

📦 AI-Tutorial
├── README.md                      ← 你在这里
├── SUMMARY.md                     ← 完整目录(用于文档导航)
└── chapters/                      ← 正文章节
    ├── PART0-人工智能导论/
    ├── PART1-数学基础/
    ├── PART2-机器学习基础/
    ├── PART3-深度学习核心/
    ├── PART4-卷积神经网络CNN/
    ├── PART5-序列建模与循环网络/
    ├── PART6-Transformer与预训练/
    ├── PART7-大语言模型LLM/
    ├── PART8-生成式AI/
    ├── PART9-高级学习范式/
    ├── PART10-训练优化与部署/
    ├── PART11-计算机视觉进阶/
    ├── PART12-多模态与Agent/
    ├── PART13-行业应用与前沿/
    └── PART14-AI伦理与安全/

🗂️ 完整章节导航

🌱 入门篇(打牢基础)

部分 章节 内容
PART0 0-1 人工智能概述 什么是AI?弱/强/超AI分类、图灵测试
PART0 0-2 人工智能发展史 1950s感知机 → 深度学习崛起 → LLM时代
PART1 1-1 线性代数基础 向量、矩阵、特征值、SVD、张量
PART1 1-2 概率论基础 概率分布、贝叶斯定理、MLE
PART1 1-3 微积分基础 导数、链式法则、梯度下降
PART1 1-4 信息论基础 熵、交叉熵、KL散度
PART2 2-1 机器学习概述 监督/无监督/半监督/弱监督/自监督
PART2 2-2 经典机器学习算法 线性回归、决策树、SVM、朴素贝叶斯、KNN
PART2 2-3 模型评估与验证 交叉验证、ROC/AUC、过拟合/欠拟合
PART2 2-4 特征工程 特征提取/选择/降维、PCA、标准化

🔥 核心篇(深度学习)

部分 章节 内容
PART3 3-1 神经网络基础 感知机、MLP、权重偏差
PART3 3-2 激活函数 Sigmoid、ReLU、Tanh、GELU
PART3 3-3 损失函数 MSE、交叉熵、对比损失
PART3 3-4 正向传播与反向传播 计算图、链式法则、梯度消失/爆炸
PART3 3-5 优化算法与正则化 SGD→Adam、Dropout、BN、L1/L2
PART4 4-1 CNN原理 卷积核、步幅、填充、感受野
PART4 4-2 CNN核心操作 池化、BN、全连接层
PART4 4-3 经典CNN架构 LeNet→AlexNet→VGG→ResNet
PART4 4-4 CNN应用 图像分类、目标检测、语义分割
PART5 5-1 RNN原理 循环神经元、BPTT、梯度消失
PART5 5-2 RNN变体 LSTM、GRU、BiLSTM
PART5 5-3 Seq2Seq模型 编码器-解码器、注意力机制
PART6 6-1 注意力机制 Self-Attention、Q/K/V、多头注意力
PART6 6-2 Transformer架构 编码器-解码器、位置编码
PART6 6-3 BERT与预训练语言模型 MLM、NSP、预训练+微调
PART6 6-4 GPT系列与生成式预训练 GPT-1→GPT-4、零样本学习
PART6 6-5 注意力机制在CV中的应用 ⭐补充 SE-Net、CBAM、ECA、SimAM
PART6 6-6 词向量与预训练技术 ⭐补充 Word2Vec、CBOW/Skip-Gram、MoCo、SimCLR
PART6 6-7 Transformer变体与高效注意力 ⭐补充 Longformer、BigBird、Reformer、Performer、Linformer
PART6 6-8 CNN在NLP中的应用与膨胀卷积 ⭐补充 TextCNN、膨胀卷积、GLU、ConvNeXt、CoAtNet
PART6 6-9 混合专家模型MoE与Switch Transformer ⭐补充 MoE、Switch Transformer、负载均衡、Mixtral、DeepSeek

🚀 进阶篇(主流技术)

部分 章节 内容
PART7 7-1 LLM基础与主流模型 GPT-4/Claude/LLaMA/Qwen/DeepSeek
PART7 7-2 LLM训练技术 预训练、SFT、RLHF、DPO
PART7 7-3 Prompt Engineering Zero-shot、Few-shot、CoT、结构化输出
PART7 7-4 LLM进阶技术 LoRA、QLoRA、Flash Attention、RAG
PART8 8-1 生成对抗网络GAN GAN原理、DCGAN、WGAN、StyleGAN
PART8 8-2 扩散模型Diffusion DDPM、DDIM、CFG、vs GAN对比
PART8 8-3 文生图与视频生成 Stable Diffusion、Sora、Runway
PART9 9-1 小样本学习与元学习 Few-shot、MAML、Prototypical Networks
PART9 9-2 零样本学习与CLIP CLIP、Zero-shot、Prompt Tuning
PART9 9-3 强化学习基础 MDP、Q-Learning、DQN、PPO
PART9 9-4 图神经网络与知识图谱 GCN、GraphSAGE、GAT、TransE
PART9 9-5 联邦学习与隐私保护 ⭐补充 联邦学习、隐私计算、FedAvg
PART9 9-6 知识图谱与智能问答系统 ⭐补充 KGQA、SPARQL、多轮问答

⚙️ 实战篇(工程部署)

部分 章节 内容
PART10 10-1 学习率与Batch-Size Warmup、Cosine衰减、线性缩放
PART10 10-2 混合精度与分布式训练 FP16/BF16、DDP、FSDP、DeepSpeed
PART10 10-3 模型压缩与优化 知识蒸馏、剪枝、量化、TensorRT
PART10 10-4 模型部署实战 ONNX导出、Docker、OpenVINO、TFLite
PART10 10-5 梯度累加与显存优化 ⭐补充 梯度累加、显存优化

🎯 应用篇(行业落地)

部分 章节 内容
PART11 11-1 目标检测进阶 R-CNN、YOLO、Anchor-Free、NMS
PART11 11-2 语义分割与实例分割 FCN、U-Net、DeepLab、Mask R-CNN
PART11 11-3 图像生成与编辑 ESRGAN、风格迁移、CycleGAN
PART11 11-4 神经渲染与3D视觉 NeRF、3D Gaussian Splatting、SLAM
PART11 11-5 视觉应用补充阅读 ⭐补充 OCR、细粒度识别、运动检测
PART12 12-1 多模态学习 BLIP、LLaVA、GPT-4V、Gemini
PART12 12-2 AI Agent 基础 自主规划、Function Calling、记忆系统
PART12 12-3 Multi-Agent与具身智能 多智能体协作、VLA模型、具身AI
PART13 13-1 AI for Science AlphaFold、GraphCast、材料发现
PART13 13-2 自动驾驶AI 端到端、BEV感知、占用网络
PART13 13-3 地理空间AI 遥感影像、GIS+深度学习
PART13 13-4 时间序列AI Transformer时序预测、金融量化
PART13 13-5 World Model与AI Safety 世界模型、具身智能、Constitutional AI
PART13 13-6 数字孪生 ⭐补充 数字孪生、仿真、工业应用

🛡️ 伦理篇(安全责任)

部分 章节 内容
PART14 14-1 AI伦理与对齐 AI伦理原则、RLHF对齐、Constitutional AI
PART14 14-2 AI安全与对抗 FGSM/PGD攻击、数据投毒、差分隐私

📊 教程统计

项目 数值
总部分数 14
总章节数 65
补充阅读章节数 10
总行数 ~18,500 行
Mermaid 图表 179 个
思维导图 65 个
配图图片 34 张
绘图代码 32 个 Python 脚本
预计总字数 ~8万字
涵盖领域 数学基础 → ML → DL → CV → NLP → LLM → 多模态 → Agent → 行业应用 → AI伦理

🔗 快速导航


这个教程的来源

这个教程里面的一些内容,是我曾经上网课的一些课件,里面还有很多是我的经验和一些网络资料,素材的积累。

曾经一直说要花点时间整理一下,做一个系统性的,完整的扫盲教程,但是苦于没有足够的精力,以及个人的懒惰(当然也有一部分是因为版权的束缚)。现在有了AI agent,吩咐我的agent,花了几块钱的token,整理了一下。重新编写了所有内容,重绘所有的图表,提取知识点,精炼内容等等。

现在,公开发布共享。


About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages