Skip to content

jiaran-king/Re-Zero---Starting-LLM-

Repository files navigation

LLM-start

这是一个面向长期学习和复盘的 Obsidian LLM-WIKI,主要整理大语言模型相关知识、论文资料、工程框架和实验经验。

仓库的目标是把资料逐步整理成可复用的知识网络:

原始资料
  -> 资料索引
  -> 概念笔记
  -> 主题地图
  -> 项目 / 实验沉淀

快速入口

主题地图

01-主题地图 是本仓库的知识导航层。它只负责主题路由和概念入口,不直接堆原始资料。

主题 说明
基础架构 Tokenizer、Embedding、Transformer、Attention、位置编码、激活函数、多模态输入和接口协议
预训练 语言建模目标、数据、Scaling Law、优化闭环、compute budget 和基座能力形成
参数高效微调 LoRA、QLoRA、Adapter、Prefix / Prompt Tuning 等低成本适配方法
后训练与对齐 SFT、RLHF、PPO、DPO、GRPO、Rollout、Expert Iteration、Reasoning RL
推理优化 KV Cache、Flash Attention、MQA/GQA、MLA、稀疏注意力、vLLM 和推理服务
训练系统工程 显存、FLOPs、吞吐、并行、checkpoint、veRL、Ray、FSDP 等横切工程问题

仓库结构

.
├── 00-首页与索引/       # 主页、使用指南、工作规范、笔记规范
├── 01-主题地图/         # 主题导航层
├── 02-概念笔记/         # 正式概念页和部分框架学习笔记
├── 03-项目笔记/         # 项目上下文和项目总结
├── 04-实验与日志/       # 实验过程、调试记录和阶段日志
├── 05-资料摘录/         # 论文、报告、网页、对话等资料摘录和索引
├── 06-模板/             # 笔记模板
├── 07-待整理/           # 临时 inbox
├── 08-图片/             # Canvas、图片和附件
├── tools/               # GitHub 渲染辅助脚本
├── AGENTS.md            # LLM / Codex 维护本仓库时的总规则
└── README.md

目录职责

目录 角色 说明
00-首页与索引 控制层 仓库入口、LLM 工作规范、笔记规范、自检清单、处理日志
01-主题地图 导航层 总图和主主题页,帮助按主题进入知识网络
02-概念笔记 知识层 可复用概念、机制解释、方法对比和框架学习笔记
03-项目笔记 项目层 项目目标、项目结构、项目总结和应用案例
04-实验与日志 过程层 实验过程、排障记录、阶段复盘和产物说明
05-资料摘录 Source 层 原始资料、论文阅读、技术报告摘录和资料状态索引
06-模板 模板层 概念笔记、项目笔记等模板
07-待整理 Inbox 临时材料,只进不久留
08-图片 附件层 Obsidian Canvas、图片、Canvas 静态预览和其他附件
tools 维护工具 GitHub 渲染适配、Canvas 预览生成等脚本

如何阅读

如果你是第一次打开这个仓库,建议按下面顺序:

  1. 先看 LLM 全流程总览,建立整体框架。
  2. 再看 LLM 学习地图,选择具体主题。
  3. 进入对应主题页,例如 基础架构后训练与对齐
  4. 从主题页进入 02-概念笔记 中的具体概念页。
  5. 需要追溯来源时,再回到 资料索引05-资料摘录

当前重点内容

当前仓库主要覆盖:

  • Transformer、Attention、位置编码、BPE、激活函数等基础结构
  • KV Cache、Flash Attention、MHA/MQA/GQA、MLA、稀疏注意力等推理优化主题
  • LoRA、参数高效微调和低成本适配方法
  • RLHF、PPO、DPO、GRPO、Rollout、Expert Iteration、DAPO 等后训练与对齐主题
  • Scaling Law、资源预算、FLOPs、显存估算等训练规划主题
  • vLLM、veRL、Ray、FSDP 等系统工程和框架学习笔记
  • Qwen2.5、Qwen2.5-VL、DeepSeek-V4、EAGLE-3、ReAct 等论文 / 报告资料摘录

Obsidian 使用说明

这个仓库按 Obsidian vault 组织。直接用 Obsidian 打开仓库根目录即可。

需要注意:

  • 仓库中的正文链接已尽量转换为标准 Markdown 相对链接,方便 GitHub 网页浏览;Obsidian 也可以打开这些链接。
  • .obsidian 中只保留必要配置;本地缓存、插件、主题、工作区状态等已通过 .gitignore 排除。
  • Obsidian Canvas 源文件仍保留在 08-图片/*.canvas;GitHub 页面中使用 08-图片/canvas-preview/*.svg 作为静态预览。
  • 如果新增或修改 Canvas / 双链,提交前运行 python3 tools/github_render.py,重新生成预览并把 Obsidian 双链转换成 GitHub 可渲染的 Markdown 链接。

资料与版权边界

本仓库用于个人学习、整理和知识索引。

  • 论文、技术报告、项目页面等外部资料尽量登记官方链接。
  • PDF 原文默认不作为公开分发对象,已在 .gitignore 中排除 *.pdf
  • 资料摘录和读书笔记只作为学习整理,不替代原文。
  • 如果要引用具体结论,应优先回到原论文、官方文档或项目页面核对。

维护原则

本仓库的整理规则写在 AGENTS.md00-首页与索引 中。核心原则是:

  • 总图只做导航,不直接连接大量具体概念。
  • 主题页承接概念页,概念页沉淀可复用知识。
  • 原始资料留在 05-资料摘录07-待整理,不要直接混入主题图谱。
  • 项目记录和实验日志保留过程语境,不强行改成概念页。
  • 批量整理后同步更新主页、索引、资料索引和处理日志。

GitHub 同步前检查

同步到 GitHub 前建议检查:

git status --short
git add .
git status --short

重点确认不要提交:

  • 本地工作区状态:.obsidian/workspace.json
  • 插件、主题和缓存:.obsidian/plugins/.obsidian/themes/.obsidian/cache/
  • PDF 原文:*.pdf
  • 实验输出、checkpoint、日志:outputs/checkpoints/wandb/*.log
  • 私钥、证书、环境变量:.env*.pem*.key

License

当前仓库尚未指定开源许可证。未经明确许可,请不要将本仓库内容视为可自由再分发材料。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages