Soul2Humanoid — 具身大脑技术方案调研

系统性调研全球主流机器人公司的具身智能（Embodied AI）技术路线，聚焦「大脑」层面的算法架构、模型演进与工程实践。

项目简介

本项目旨在追踪和梳理人形机器人/具身智能领域中，头部公司的技术方案与产品演进。核心关注维度包括：

感知架构：视觉-语言-动作（VLA）融合、多模态输入处理
决策大脑：端到端神经网络、任务规划、长程推理
动作生成：Flow Matching / Diffusion、动作 Tokenization、高频控制
数据飞轮：仿真到真实（Sim2Real）、人类视频迁移、自主数据生成
硬件协同：AI-First 硬件设计、执行器与传感器选型

调研覆盖公司

公司	核心产品	技术路线关键词	报告
Figure AI	Figure 03 + Helix VLA	人形通用机器人、VLA 端到端、BotQ 数据飞轮	`reports/figure-ai/`
Physical Intelligence (π)	π0.7 通用策略	跨本体 VLA 基础模型、Flow Matching、可组合泛化	`reports/physical-intelligence/`
Tesla	Optimus 人形机器人	FSD 技术迁移、端到端神经网络、大规模数据闭环	`reports/tesla-optimus/`
Boston Dynamics	Atlas 电动版	MPC+RL 混合控制、Hyundai 供应链、工业级可靠性	`reports/boston-dynamics/`
1X Technologies	NEO 家用机器人	肌腱驱动、World Model、Redwood VLA、OpenAI 合作	`reports/1x-technologies/`
Unitree 宇树科技	H1/G1 人形机器人	极致性价比、开源生态、RL+模仿学习	`reports/unitree/`
Google DeepMind	Gemini Robotics / RT 系列	VLA 奠基者、Open X-Embodiment、跨本体泛化	`reports/google-deepmind/`
Agility Robotics	Digit 仓库机器人	仓储物流专用、传统控制、RaaS 商业模式	`reports/agility-robotics/`
Apptronik	Apollo 通用人形	模块化硬件、NASA 执行器、Google Gemini 合作	`reports/apptronik/`
NVIDIA Isaac	GR00T / Jetson / Isaac Sim	具身智能基础设施、仿真平台、卖铲人	`reports/nvidia-isaac/`
Enchanted Tools	Miroki 服务机器人	社交/康养场景、Pepper 团队、轮式服务	`reports/enchanted-tools/`

持续更新中，后续计划覆盖：国内创业公司（智元、傅利叶、星动纪元等）深度跟进。

横向对比概览

评分基于公开信息的主观评估，维度包括：AI 成熟度、硬件成熟度、商业化进展、开源开放度、成本效率、数据策略。

目录结构

Soul2Humanoid/
├── README.md                          # 项目概述（本文档）
├── .gitignore                         # Git 忽略规则
│
├── reports/                           # 调研报告
│   ├── figure-ai/                     # Figure AI 技术路线
│   ├── physical-intelligence/         # Physical Intelligence (π) 技术路线
│   ├── tesla-optimus/                 # Tesla Optimus 深度调研
│   ├── boston-dynamics/               # Boston Dynamics Atlas 调研
│   ├── 1x-technologies/               # 1X Technologies NEO 调研
│   ├── unitree/                       # 宇树科技 H1/G1 调研
│   ├── google-deepmind/               # Google DeepMind RT/Gemini 调研
│   ├── agility-robotics/              # Agility Robotics Digit 调研
│   ├── apptronik/                     # Apptronik Apollo 调研
│   ├── nvidia-isaac/                  # NVIDIA Isaac / GR00T 调研
│   └── enchanted-tools/               # Enchanted Tools Miroki 调研
│
├── assets/                            # 图表与可视化资源
│   ├── figure-ai/                     # Figure AI 相关图表（SVG + PNG）
│   ├── physical-intelligence/         # PI 相关图表（SVG + PNG）
│   ├── company-comparison-radar.svg   # 公司能力雷达图
│   ├── company-comparison-radar.png
│   ├── company-comparison-bars.svg    # 公司能力柱状图
│   ├── company-comparison-bars.png
│   ├── data-strategy-comparison.svg   # 数据策略对比图
│   ├── data-strategy-comparison.png
│   ├── data-flywheel-patterns.svg     # 数据飞轮模式图
│   └── data-flywheel-patterns.png
│
├── whiteboards/                       # 飞书画板源文件
│   └── vla-arch.*
│
└── scripts/                           # 工具脚本
    ├── generate_diagrams.py           # PI 图表批量生成脚本（matplotlib）
    ├── generate_comparison_chart.py   # 公司对比图表生成脚本
    └── generate_data_flywheel_chart.py # 数据策略对比图生成脚本

参考资源

资源	说明
`comparisons.md`	横向对比分析 — 11 家公司在 VLA 架构、数据策略、安全机制、硬件设计、商业化路径的详细对比
`papers.md`	核心论文索引 — 按时间线整理的具身智能标志性论文，含 arXiv 链接、核心贡献和技术演进脉络
`tags.md`	技术标签索引 — 按架构范式、数据策略、应用场景等标签检索公司报告
`podcasts-videos.md`	中文播客与视频资源汇总 — 播客、B站、YouTube、会议演讲等中文学习资源
`resources.md`	开源资源汇总 — 模型权重、数据集、仿真器、开发框架、硬件平台、评估基准
`people.md`	关键人物追踪 — 各公司核心技术人员、研究负责人及其职业动向和技术观点
`funding.md`	投资与估值追踪 — 融资历程、估值分析、投资方格局和未来预测
`CHANGELOG.md`	更新日志 — 仓库演进历史和每次重大更新的记录

技术关键词索引

关键词	相关公司	说明
VLA (Vision-Language-Action)	Figure AI, PI, DeepMind, 1X	视觉-语言-动作统一模型，当前具身智能主流架构
Flow Matching	PI, Boston Dynamics	连续动作生成方法，相比自回归更平滑高频
End-to-End Neural Network	Tesla, Figure AI	端到端神经网络，替代传统感知-规划-控制分层架构
Cross-Embodiment	PI, DeepMind	跨机器人形态迁移，同一策略控制多种机器人
Data Flywheel	Tesla, Figure AI	数据闭环飞轮，自主采集→训练→部署→再采集
Sim2Real	Figure AI, Unitree, BD	仿真到真实的迁移学习，降低真实世界数据成本
BotQ	Figure AI	自主数据生成系统，大规模合成机器人操作数据
FSD Transfer	Tesla	自动驾驶全栈技术向人形机器人的直接迁移
Tendon-Driven	1X	肌腱驱动执行器，高反向可驱动性，本质安全
World Model	1X, DeepMind	基于物理的视频预测模型，用于动作结果仿真
MPC (Model Predictive Control)	Boston Dynamics	模型预测控制，传统但可靠的实时轨迹优化方法
Open X-Embodiment	DeepMind, PI	全球最大规模的跨机器人数据集
RL (Reinforcement Learning)	Unitree, Boston Dynamics	强化学习，用于运动控制和策略优化
Diffusion Transformer	PI, Boston Dynamics	扩散模型+Transformer，用于连续动作生成

使用方式

阅读报告

直接进入 reports/ 目录下的各公司文件夹，查看 README.md。

重新生成图表

cd scripts
python3 generate_diagrams.py           # PI 技术图表
python3 generate_comparison_chart.py   # 公司对比图表

依赖：matplotlib, numpy

贡献与更新

调研时间：2026年4月
信息来源：各公司官网、技术博客、学术论文、公开演讲
更新策略：跟随各公司重大技术发布（新模型、新产品、新论文）进行增量更新

License

本仓库内容为技术研究笔记，仅供学习交流。各公司商标与技术归属各自所有者。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Soul2Humanoid — 具身大脑技术方案调研

目录

项目简介

调研覆盖公司

横向对比概览

目录结构

参考资源

技术关键词索引

使用方式

阅读报告

重新生成图表

贡献与更新

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
.github		.github
assets		assets
reports		reports
scripts		scripts
whiteboards		whiteboards
.gitignore		.gitignore
AGENTS.md		AGENTS.md
CHANGELOG.md		CHANGELOG.md
Makefile		Makefile
README.md		README.md
comparisons.md		comparisons.md
funding.md		funding.md
papers.md		papers.md
people.md		people.md
podcasts-videos.md		podcasts-videos.md
resources.md		resources.md
tags.md		tags.md

Folders and files

Latest commit

History

Repository files navigation

Soul2Humanoid — 具身大脑技术方案调研

目录

项目简介

调研覆盖公司

横向对比概览

目录结构

参考资源

技术关键词索引

使用方式

阅读报告

重新生成图表

贡献与更新

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages