GitHub - luhengshiwo/LLMForEverybody: 每个人都能看懂的大模型知识分享，LLMs春/秋招大模型面试前必看，让你和面试官侃侃而谈

Learning LLM is all you need.

👉 点击 LearnLLM.AI | 学习大模型，从这里开始

LearnLLM.AI 核心亮点

精选大模型面试题库：覆盖从基础到前沿的实战题目，助您高效备战求职，抓住职业机遇；

系统化论文研读：从2017年Transformer奠基性论文出发，按清晰的知识体系梳理技术演进，适合不同基础的开发者循序渐进地深度提升；

精选实战课程：围绕 AI Agent、RAG 知识库、大模型微调与 LLM 应用开发等核心方向，打磨成体系的中文实战课程，覆盖 LangChain、LlamaIndex、Dify、MCP 等主流工具链，配套项目代码与讲师答疑，支持按主题灵活拆分、按需选学，帮你由点及面搭建完整的大模型知识体系。👉 浏览全部课程

Name		Name	Last commit message	Last commit date
Latest commit History 479 Commits
00-序-AGI之路		00-序-AGI之路
01-第一章-预训练		01-第一章-预训练
02-第二章-部署与推理		02-第二章-部署与推理
03-第三章-微调		03-第三章-微调
04-第四章-量化		04-第四章-量化
05-第五章-显卡与并行		05-第五章-显卡与并行
06-第六章-Prompt Engineering		06-第六章-Prompt Engineering
07-第七章-Agent		07-第七章-Agent
08-第八章-大模型企业落地		08-第八章-大模型企业落地
09-第九章-评估指标		09-第九章-评估指标
10-第十章-热点		10-第十章-热点
11-第十一章-数学		11-第十一章-数学
12-第十二章-企业与个人思考		12-第十二章-企业与个人思考
docs		docs
draft		draft
pic		pic
.gitignore		.gitignore
LICENSE		LICENSE
README.en.md		README.en.md
README.md		README.md
README.ru.md		README.ru.md

时间	论文	介绍
2017-06-12	Transformer	提出自注意力与 Transformer 架构
2018-06-11	GPT-1	预训练 + 微调的生成式 Transformer
2018-10-11	BERT	双向编码器：MLM + NSP
2019-02-14	GPT-2	大规模无监督文本生成
2019-10-23	T5	文本到文本统一框架
2020-05-28	GPT-3	大模型与少样本学习能力
2020-10	ViT	将 Transformer 主干引入视觉领域
2021-02	ViLT	极简视觉语言预训练架构
2021-02	CLIP	用自然语言监督实现零样本视觉学习
2021-02	DALL·E 1	自回归文本生成图像的开端
2021-07-07	CodeX	面向代码生成的 GPT 系列模型
2021-12	Stable Diffusion	潜空间扩散模型推动文生图开源化
2022-02-08	AlphaCode	竞赛级代码生成系统
2022-03-04	InstructGPT	人类反馈对齐与指令微调
2022-04	DALL·E 2	基于 CLIP Latents 的高保真文生图
2022-12	Whisper	大规模弱监督语音识别基础模型
2023-02-27	LLaMA-1	高效开源预训练基座模型
2023-04	LLaVA	开源多模态指令微调的重要起点
2023-07-18	LLaMA-2	LLaMA 升级版，开放商用
2023-08	Qwen-VL	通义千问早期视觉语言基座模型
2023-09-28	Qwen 1	通义千问第一代基座模型
2023-10-10	Mistral 7B	高效 7B 级开源模型
2023-12	LVM	纯视觉自回归建模的大视觉模型路线
2024-02	Mixtral 8x7B	开源稀疏 MoE 的代表作
2024-03	Gemma 1	Google 轻量开源模型家族首作
2024-05	DeepSeek-V2	高效 MoE 语言模型，兼顾性能与推理经济性
2024-06	ChatGLM	从 GLM-130B 演进到 GLM-4 的国产模型家族
2024-07	Llama 3	Meta 新一代开源旗舰模型
2024-07	Gemma 2	在实用尺寸上继续提升开源模型性能
2024-12	DeepSeek-V3	高效 MoE 架构，兼顾训练成本与模型性能
2025-01	DeepSeek-R1	通过强化学习增强大模型推理能力
2025-03	Gemma 3	原生多模态与 128K 长上下文的 Gemma
持续更新中...

Folders and files

Latest commit

History

Repository files navigation

LearnLLM.AI 核心亮点

LLM 精选论文

AGI 之路

目录

序-AGI之路

大模型年度论文总结

第一章-大模型之Pre-Training

架构

Optimizer

激活函数

Attention机制

位置编码

Tokenizer

并行策略

大模型训练框架

第二章-大模型之部署与推理

第三章-大模型微调

第四章-大模型量化

第五章-显卡与大模型并行

第六章-Prompt-Engineering

第七章-Agent

RAG

第八章-大模型企业落地

第九章-大模型评估指标

第十章-热点

第十一章-数学

线性代数

微积分

概率统计

🌐 点击 LearnLLM.AI | 学习大模型，从这里开始

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages