Skip to content

alchaincyf/deepseek-v4-deep-dive

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

DeepSeek-V4 深度解读

73 页 PPT · 20 分钟视频讲稿 · 15 秒发布动画

把 DeepSeek 58 页论文 + 官方发布文 + 最新竞品数据(含 Opus 4.7 / GPT-5.5)拆给你看。

PPT Pages Runtime PDF Made with License


🌐 在线浏览

Live Landing  ·  Live PPT · 键盘翻页  ·  📄 下载 PDF


DeepSeek-V4 Deep Dive · 9 key pages

一句话

DeepSeek-V4 不是一个冲破天花板的世界最佳模型的发布,而是让普通人用上 1M 超长上下文 Agent 模型的发布

Claude Opus 4.7(2026-04-16)和 GPT-5.5(2026-04-23)已经跑在前面。V4 选择的是把 1M 上下文、Agent 工具链和开源权重做到人人用得起。


四个核心观点(贯穿 73 页)

# 观点 展开章节
01 不是世界最佳,是 1M Agent 的普惠 第 9 幕(59-65 页)
02 竞赛选手基因 · 擅长做题解题 —— 数学和编程是开源天花板 第 7 幕(44-50 页)
03 品味类任务还差一截 —— 创意写作不如 Opus 4.5 第 8 幕(51-58 页)
04 整体是最诚实、本分的模型 —— 论文自认局限 + 昇腾 950 降价预告 第 10 幕(66-70 页)

多入口地图

入口 看什么 适合
🌐 Live Landing 产品页风格的概览 2 分钟快速钩子
🎞️ Live PPT 73 页完整 deck,键盘翻页 20 分钟深度看
📄 PDF 下载 13MB 矢量 PDF · 文字可复制可搜 离线 / 打印 / 分享
📝 视频讲稿 21.5 分钟完整脚本 录视频参考 / 逐页文字版
🎬 发布动画 15 秒 1080p 带音频 社媒传播素材

键盘操作(Live PPT):← / → 翻页 · I 开目录 · 数字键 1-9 跳页 · P 打印全部


11 幕 · 73 页结构

第 0 幕 · 开场 + 四论点(00-04,5 页)

第 1 幕 · 两款模型 · 一套架构(05-10,6 页)

第 2 幕 · 架构 ① mHC 残差升级(11-16,6 页)

第 3 幕 · 架构 ② 混合注意力 CSA + HCA(17-24,8 页)

核心数据:1M 上下文下 FLOPs 降到 27%、KV cache 只剩 2%

第 4 幕 · 架构 ③ Muon 优化器(25-29,5 页)

第 5 幕 · 基础设施(30-36,7 页)

第 6 幕 · 训练范式革命 · Specialist + OPD(37-43,7 页)

⭐ 第 7 幕 · 擅长什么 · 观点 ②(44-50,7 页)

高光:Codeforces 3206(超 GPT-5.4,全球人类排名第 23)· Putnam-2025 120/120 满分(超所有已知 AI 系统)。

⭐ 第 8 幕 · 不擅长什么 · 观点 ③(51-58,8 页)

高光:创意写作胜率不如 Claude Opus 4.5(论文 Table 18 原数据)· Terminal Bench 2.0 比 GPT-5.5 低 15pp。

⭐ 第 9 幕 · 普惠的真相 · 观点 ①(59-65,7 页)

核心:V4-Pro 1元/12元/24元(缓存命中/未命中/输出,per M tokens),V4-Flash 0.2元/1元/2元。Flash 是真正的价格屠夫

⭐ 第 10 幕 · 诚实与本分 · 观点 ④(66-70,5 页)

官方原话:「受限于高端算力,目前 Pro 的服务吞吐十分有限,预计下半年昇腾 950 超节点批量上市后,Pro 的价格会大幅下调。」

收官金句:不诱于誉,不恐于诽,率道而行,端然正己。(《荀子·非十二子》)

第 11 幕 · 收尾(71-72,2 页)


这份 PPT 是怎么做的

这 73 页 HTML + PDF + 讲稿 + 发布动画,全部由 huashu-design 一个 skill 产出。全程没用 Figma,没用 After Effects。

huashu-design · 用 HTML 做高保真产品发布级设计的 skill。一句话输入,3-30 分钟拿到发布动画 / 可点击 App 原型 / 可编辑 PPT / 印刷级信息图。

安装(支持 Claude Code / Cursor / Codex / OpenClaw / Hermes 等所有 skill-aware agent)

npx skills add alchaincyf/huashu-design

仓库地址

👉 https://github.com/alchaincyf/huashu-design

huashu-design 的几个关键设计原则被这份 PPT 从头到尾贯穿:

  • 核心资产协议:从 DeepSeek 官网抠真实 logo 和主色 #4D6BFE,不是凭记忆猜
  • 反 AI slop:零紫渐变 / 零 emoji 图标 / 零 GitHub dark mode 味 / 衬线 + 无衬线双字体
  • Junior Designer 模式:先 showcase 2 页定调,再批量推,避免方向错了做完 16 页才发现
  • 子 agent 并行:11 幕 PPT 由 5 个子 agent 并行完成;5 份讲稿由另外 5 个子 agent 并行写;Master Review 再整合压缩到 20 分钟

如果你也想做类似的产品发布物料,上面这个仓库就是入口。


数据来源

  • DeepSeek-V4 Tech Report (PDF)
  • DeepSeek 官方发布文(chat.deepseek.com · 2026-04-24)
  • Claude Opus 4.7 · OpenAI GPT-5.5 · Gemini 3.1 Pro 官方 System Card
  • Kimi K2.6 · GLM-5 · MiniMax-M2.7 · Qwen3.6-Max 官方技术报告

鸣谢


License

本解读内容(文字、设计、讲稿)采用 CC-BY 4.0 许可 —— 可自由转载、改编,需注明作者(花叔)和本仓库链接。

PPT 中引用的 DeepSeek-V4 技术报告数据、logo、官方原话版权归 DeepSeek-AI 所有。

About

DeepSeek V4 深度解读 · 73 页 PPT + 20 分钟讲稿 + 发布动画 · Designed with huashu-design

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors