Skip to content

wikieden/Soul2Humanoid

Repository files navigation

Soul2Humanoid — 具身大脑技术方案调研

系统性调研全球主流机器人公司的具身智能(Embodied AI)技术路线,聚焦「大脑」层面的算法架构、模型演进与工程实践。

Links Last Updated Companies Papers


目录


项目简介

本项目旨在追踪和梳理人形机器人/具身智能领域中,头部公司的技术方案与产品演进。核心关注维度包括:

  • 感知架构:视觉-语言-动作(VLA)融合、多模态输入处理
  • 决策大脑:端到端神经网络、任务规划、长程推理
  • 动作生成:Flow Matching / Diffusion、动作 Tokenization、高频控制
  • 数据飞轮:仿真到真实(Sim2Real)、人类视频迁移、自主数据生成
  • 硬件协同:AI-First 硬件设计、执行器与传感器选型

调研覆盖公司

公司 核心产品 技术路线关键词 报告
Figure AI Figure 03 + Helix VLA 人形通用机器人、VLA 端到端、BotQ 数据飞轮 reports/figure-ai/
Physical Intelligence (π) π0.7 通用策略 跨本体 VLA 基础模型、Flow Matching、可组合泛化 reports/physical-intelligence/
Tesla Optimus 人形机器人 FSD 技术迁移、端到端神经网络、大规模数据闭环 reports/tesla-optimus/
Boston Dynamics Atlas 电动版 MPC+RL 混合控制、Hyundai 供应链、工业级可靠性 reports/boston-dynamics/
1X Technologies NEO 家用机器人 肌腱驱动、World Model、Redwood VLA、OpenAI 合作 reports/1x-technologies/
Unitree 宇树科技 H1/G1 人形机器人 极致性价比、开源生态、RL+模仿学习 reports/unitree/
Google DeepMind Gemini Robotics / RT 系列 VLA 奠基者、Open X-Embodiment、跨本体泛化 reports/google-deepmind/
Agility Robotics Digit 仓库机器人 仓储物流专用、传统控制、RaaS 商业模式 reports/agility-robotics/
Apptronik Apollo 通用人形 模块化硬件、NASA 执行器、Google Gemini 合作 reports/apptronik/
NVIDIA Isaac GR00T / Jetson / Isaac Sim 具身智能基础设施、仿真平台、卖铲人 reports/nvidia-isaac/
Enchanted Tools Miroki 服务机器人 社交/康养场景、Pepper 团队、轮式服务 reports/enchanted-tools/

持续更新中,后续计划覆盖:国内创业公司(智元、傅利叶、星动纪元等)深度跟进。


横向对比概览

技术演进时间线总览

公司能力雷达图

公司能力柱状图

数据策略对比图

评分基于公开信息的主观评估,维度包括:AI 成熟度、硬件成熟度、商业化进展、开源开放度、成本效率、数据策略。


目录结构

Soul2Humanoid/
├── README.md                          # 项目概述(本文档)
├── .gitignore                         # Git 忽略规则
│
├── reports/                           # 调研报告
│   ├── figure-ai/                     # Figure AI 技术路线
│   ├── physical-intelligence/         # Physical Intelligence (π) 技术路线
│   ├── tesla-optimus/                 # Tesla Optimus 深度调研
│   ├── boston-dynamics/               # Boston Dynamics Atlas 调研
│   ├── 1x-technologies/               # 1X Technologies NEO 调研
│   ├── unitree/                       # 宇树科技 H1/G1 调研
│   ├── google-deepmind/               # Google DeepMind RT/Gemini 调研
│   ├── agility-robotics/              # Agility Robotics Digit 调研
│   ├── apptronik/                     # Apptronik Apollo 调研
│   ├── nvidia-isaac/                  # NVIDIA Isaac / GR00T 调研
│   └── enchanted-tools/               # Enchanted Tools Miroki 调研
│
├── assets/                            # 图表与可视化资源
│   ├── figure-ai/                     # Figure AI 相关图表(SVG + PNG)
│   ├── physical-intelligence/         # PI 相关图表(SVG + PNG)
│   ├── company-comparison-radar.svg   # 公司能力雷达图
│   ├── company-comparison-radar.png
│   ├── company-comparison-bars.svg    # 公司能力柱状图
│   ├── company-comparison-bars.png
│   ├── data-strategy-comparison.svg   # 数据策略对比图
│   ├── data-strategy-comparison.png
│   ├── data-flywheel-patterns.svg     # 数据飞轮模式图
│   └── data-flywheel-patterns.png
│
├── whiteboards/                       # 飞书画板源文件
│   └── vla-arch.*
│
└── scripts/                           # 工具脚本
    ├── generate_diagrams.py           # PI 图表批量生成脚本(matplotlib)
    ├── generate_comparison_chart.py   # 公司对比图表生成脚本
    └── generate_data_flywheel_chart.py # 数据策略对比图生成脚本

参考资源

资源 说明
comparisons.md 横向对比分析 — 11 家公司在 VLA 架构、数据策略、安全机制、硬件设计、商业化路径的详细对比
papers.md 核心论文索引 — 按时间线整理的具身智能标志性论文,含 arXiv 链接、核心贡献和技术演进脉络
tags.md 技术标签索引 — 按架构范式、数据策略、应用场景等标签检索公司报告
podcasts-videos.md 中文播客与视频资源汇总 — 播客、B站、YouTube、会议演讲等中文学习资源
resources.md 开源资源汇总 — 模型权重、数据集、仿真器、开发框架、硬件平台、评估基准
people.md 关键人物追踪 — 各公司核心技术人员、研究负责人及其职业动向和技术观点
funding.md 投资与估值追踪 — 融资历程、估值分析、投资方格局和未来预测
CHANGELOG.md 更新日志 — 仓库演进历史和每次重大更新的记录

技术关键词索引

关键词 相关公司 说明
VLA (Vision-Language-Action) Figure AI, PI, DeepMind, 1X 视觉-语言-动作统一模型,当前具身智能主流架构
Flow Matching PI, Boston Dynamics 连续动作生成方法,相比自回归更平滑高频
End-to-End Neural Network Tesla, Figure AI 端到端神经网络,替代传统感知-规划-控制分层架构
Cross-Embodiment PI, DeepMind 跨机器人形态迁移,同一策略控制多种机器人
Data Flywheel Tesla, Figure AI 数据闭环飞轮,自主采集→训练→部署→再采集
Sim2Real Figure AI, Unitree, BD 仿真到真实的迁移学习,降低真实世界数据成本
BotQ Figure AI 自主数据生成系统,大规模合成机器人操作数据
FSD Transfer Tesla 自动驾驶全栈技术向人形机器人的直接迁移
Tendon-Driven 1X 肌腱驱动执行器,高反向可驱动性,本质安全
World Model 1X, DeepMind 基于物理的视频预测模型,用于动作结果仿真
MPC (Model Predictive Control) Boston Dynamics 模型预测控制,传统但可靠的实时轨迹优化方法
Open X-Embodiment DeepMind, PI 全球最大规模的跨机器人数据集
RL (Reinforcement Learning) Unitree, Boston Dynamics 强化学习,用于运动控制和策略优化
Diffusion Transformer PI, Boston Dynamics 扩散模型+Transformer,用于连续动作生成

使用方式

阅读报告

直接进入 reports/ 目录下的各公司文件夹,查看 README.md

重新生成图表

cd scripts
python3 generate_diagrams.py           # PI 技术图表
python3 generate_comparison_chart.py   # 公司对比图表

依赖:matplotlib, numpy


贡献与更新

  • 调研时间:2026年4月
  • 信息来源:各公司官网、技术博客、学术论文、公开演讲
  • 更新策略:跟随各公司重大技术发布(新模型、新产品、新论文)进行增量更新

License

本仓库内容为技术研究笔记,仅供学习交流。各公司商标与技术归属各自所有者。

About

Soul2Humanoid — 具身大脑技术方案调研

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors