系统性调研全球主流机器人公司的具身智能(Embodied AI)技术路线,聚焦「大脑」层面的算法架构、模型演进与工程实践。
本项目旨在追踪和梳理人形机器人/具身智能领域中,头部公司的技术方案与产品演进。核心关注维度包括:
- 感知架构:视觉-语言-动作(VLA)融合、多模态输入处理
- 决策大脑:端到端神经网络、任务规划、长程推理
- 动作生成:Flow Matching / Diffusion、动作 Tokenization、高频控制
- 数据飞轮:仿真到真实(Sim2Real)、人类视频迁移、自主数据生成
- 硬件协同:AI-First 硬件设计、执行器与传感器选型
| 公司 | 核心产品 | 技术路线关键词 | 报告 |
|---|---|---|---|
| Figure AI | Figure 03 + Helix VLA | 人形通用机器人、VLA 端到端、BotQ 数据飞轮 | reports/figure-ai/ |
| Physical Intelligence (π) | π0.7 通用策略 | 跨本体 VLA 基础模型、Flow Matching、可组合泛化 | reports/physical-intelligence/ |
| Tesla | Optimus 人形机器人 | FSD 技术迁移、端到端神经网络、大规模数据闭环 | reports/tesla-optimus/ |
| Boston Dynamics | Atlas 电动版 | MPC+RL 混合控制、Hyundai 供应链、工业级可靠性 | reports/boston-dynamics/ |
| 1X Technologies | NEO 家用机器人 | 肌腱驱动、World Model、Redwood VLA、OpenAI 合作 | reports/1x-technologies/ |
| Unitree 宇树科技 | H1/G1 人形机器人 | 极致性价比、开源生态、RL+模仿学习 | reports/unitree/ |
| Google DeepMind | Gemini Robotics / RT 系列 | VLA 奠基者、Open X-Embodiment、跨本体泛化 | reports/google-deepmind/ |
| Agility Robotics | Digit 仓库机器人 | 仓储物流专用、传统控制、RaaS 商业模式 | reports/agility-robotics/ |
| Apptronik | Apollo 通用人形 | 模块化硬件、NASA 执行器、Google Gemini 合作 | reports/apptronik/ |
| NVIDIA Isaac | GR00T / Jetson / Isaac Sim | 具身智能基础设施、仿真平台、卖铲人 | reports/nvidia-isaac/ |
| Enchanted Tools | Miroki 服务机器人 | 社交/康养场景、Pepper 团队、轮式服务 | reports/enchanted-tools/ |
持续更新中,后续计划覆盖:国内创业公司(智元、傅利叶、星动纪元等)深度跟进。
评分基于公开信息的主观评估,维度包括:AI 成熟度、硬件成熟度、商业化进展、开源开放度、成本效率、数据策略。
Soul2Humanoid/
├── README.md # 项目概述(本文档)
├── .gitignore # Git 忽略规则
│
├── reports/ # 调研报告
│ ├── figure-ai/ # Figure AI 技术路线
│ ├── physical-intelligence/ # Physical Intelligence (π) 技术路线
│ ├── tesla-optimus/ # Tesla Optimus 深度调研
│ ├── boston-dynamics/ # Boston Dynamics Atlas 调研
│ ├── 1x-technologies/ # 1X Technologies NEO 调研
│ ├── unitree/ # 宇树科技 H1/G1 调研
│ ├── google-deepmind/ # Google DeepMind RT/Gemini 调研
│ ├── agility-robotics/ # Agility Robotics Digit 调研
│ ├── apptronik/ # Apptronik Apollo 调研
│ ├── nvidia-isaac/ # NVIDIA Isaac / GR00T 调研
│ └── enchanted-tools/ # Enchanted Tools Miroki 调研
│
├── assets/ # 图表与可视化资源
│ ├── figure-ai/ # Figure AI 相关图表(SVG + PNG)
│ ├── physical-intelligence/ # PI 相关图表(SVG + PNG)
│ ├── company-comparison-radar.svg # 公司能力雷达图
│ ├── company-comparison-radar.png
│ ├── company-comparison-bars.svg # 公司能力柱状图
│ ├── company-comparison-bars.png
│ ├── data-strategy-comparison.svg # 数据策略对比图
│ ├── data-strategy-comparison.png
│ ├── data-flywheel-patterns.svg # 数据飞轮模式图
│ └── data-flywheel-patterns.png
│
├── whiteboards/ # 飞书画板源文件
│ └── vla-arch.*
│
└── scripts/ # 工具脚本
├── generate_diagrams.py # PI 图表批量生成脚本(matplotlib)
├── generate_comparison_chart.py # 公司对比图表生成脚本
└── generate_data_flywheel_chart.py # 数据策略对比图生成脚本
| 资源 | 说明 |
|---|---|
comparisons.md |
横向对比分析 — 11 家公司在 VLA 架构、数据策略、安全机制、硬件设计、商业化路径的详细对比 |
papers.md |
核心论文索引 — 按时间线整理的具身智能标志性论文,含 arXiv 链接、核心贡献和技术演进脉络 |
tags.md |
技术标签索引 — 按架构范式、数据策略、应用场景等标签检索公司报告 |
podcasts-videos.md |
中文播客与视频资源汇总 — 播客、B站、YouTube、会议演讲等中文学习资源 |
resources.md |
开源资源汇总 — 模型权重、数据集、仿真器、开发框架、硬件平台、评估基准 |
people.md |
关键人物追踪 — 各公司核心技术人员、研究负责人及其职业动向和技术观点 |
funding.md |
投资与估值追踪 — 融资历程、估值分析、投资方格局和未来预测 |
CHANGELOG.md |
更新日志 — 仓库演进历史和每次重大更新的记录 |
| 关键词 | 相关公司 | 说明 |
|---|---|---|
| VLA (Vision-Language-Action) | Figure AI, PI, DeepMind, 1X | 视觉-语言-动作统一模型,当前具身智能主流架构 |
| Flow Matching | PI, Boston Dynamics | 连续动作生成方法,相比自回归更平滑高频 |
| End-to-End Neural Network | Tesla, Figure AI | 端到端神经网络,替代传统感知-规划-控制分层架构 |
| Cross-Embodiment | PI, DeepMind | 跨机器人形态迁移,同一策略控制多种机器人 |
| Data Flywheel | Tesla, Figure AI | 数据闭环飞轮,自主采集→训练→部署→再采集 |
| Sim2Real | Figure AI, Unitree, BD | 仿真到真实的迁移学习,降低真实世界数据成本 |
| BotQ | Figure AI | 自主数据生成系统,大规模合成机器人操作数据 |
| FSD Transfer | Tesla | 自动驾驶全栈技术向人形机器人的直接迁移 |
| Tendon-Driven | 1X | 肌腱驱动执行器,高反向可驱动性,本质安全 |
| World Model | 1X, DeepMind | 基于物理的视频预测模型,用于动作结果仿真 |
| MPC (Model Predictive Control) | Boston Dynamics | 模型预测控制,传统但可靠的实时轨迹优化方法 |
| Open X-Embodiment | DeepMind, PI | 全球最大规模的跨机器人数据集 |
| RL (Reinforcement Learning) | Unitree, Boston Dynamics | 强化学习,用于运动控制和策略优化 |
| Diffusion Transformer | PI, Boston Dynamics | 扩散模型+Transformer,用于连续动作生成 |
直接进入 reports/ 目录下的各公司文件夹,查看 README.md。
cd scripts
python3 generate_diagrams.py # PI 技术图表
python3 generate_comparison_chart.py # 公司对比图表依赖:
matplotlib,numpy
- 调研时间:2026年4月
- 信息来源:各公司官网、技术博客、学术论文、公开演讲
- 更新策略:跟随各公司重大技术发布(新模型、新产品、新论文)进行增量更新
本仓库内容为技术研究笔记,仅供学习交流。各公司商标与技术归属各自所有者。