vla-mini

仓库：https://github.com/HelloJessieee/vla-tutorial

面向教学的最小 VLA 工作台：2D 仿真 + 自动生成数据 + 网页 Demo + 可选训练（CLIP 小模型 + 动作头）。
不依赖 LeRobot / MuJoCo 安装；可选 Edu-π₀ 对齐 LeRobot π₀ policy 格式。

npm 包：https://www.npmjs.com/package/@jxhs/vla-mini

三种用法（一个项目，三个档位）

档位	干什么	要 GPU？	要联网？
① 演示 `demo --dry-run`	网页 + 改代码 + 2D 画面；规则专家动，不训练神经网络	否	否
② 真 VLA `train` → `demo`	自动生成数据 → 训练 → 模型推理	建议有	训练时要（下 CLIP）
③ Edu-π₀ `train_pi0`	与 ② 同类，代码格式像 LeRobot π₀	建议有	训练时要

不是三个软件，是同一仓库里的三条命令路径。

教学任务阶梯（仿真）

同一套 train / eval / demo / collect；只改 task 与输出维度。

级别	`task`	看图+指令 → 输出	`output_dim`	配置
L0	`reach`	单步靠近 `(dx, dy)`	2	`configs/default.yaml`
L1	`push`	push_t 连续推动 `K×(dx,dy)`，默认 K=4	8	`configs/push.yaml`
L2	`grasp`	`(dx, dy, gripper)`，夹爪 ∈ [-1,1]	3	`configs/grasp.yaml`
课外	LIBERO 等	3D / 真机	—	见升级路径

仍 无 Bullet、自动 collect + expert。

课堂固定流程表（config → 数据 → 权重）

课次	配置文件	`--collect` 数据目录	权重目录	启动时会打印
L0 reach	`configs/default.yaml`	`data/synthetic/`	`runs/default/`	`task=reach` `output_dim=2`
L1 push	`configs/push.yaml`	`data/synthetic_push/`	`runs/push/`	`task=push` `output_dim=8`
L2 grasp	`configs/grasp.yaml`	`data/synthetic_grasp/`	`runs/grasp/`	`task=grasp` `output_dim=3`

不要混用：用 push 的 config 却读 runs/default/action_head.pt 会直接报 checkpoint 维度不匹配。

L1/L2 默认 300 episodes、5 epochs（push.yaml / grasp.yaml）；L0 仍为 120 / 3，便于快速试跑。

REM 每一层：dry-run → collect+train → eval → demo（同一 config）
.\.venv\Scripts\python.exe -m vla_mini.dry_run --config configs\push.yaml
.\.venv\Scripts\python.exe -m vla_mini.train --config configs\push.yaml --collect
.\.venv\Scripts\python.exe -m vla_mini.eval --config configs\push.yaml
set NO_PROXY=127.0.0.1,localhost
.\.venv\Scripts\python.exe -m vla_mini.demo --config configs\push.yaml

自测（开发/CI）：pip install -e ".[dev]" 后 pytest -q

环境要求

Python 3.12 或 3.13
Windows / macOS / Linux（演示模式 Windows 可跑）
GPU：仅 ① 不需要；②③ 建议 NVIDIA（CPU 也能跑，慢）
Node 18+：仅在使用 npx @jxhs/vla-mini 时需要

一、本地安装（首次必做）

在 CMD 或 PowerShell 中，必须在 d:\vla 根目录操作（不要在 npm\vla-mini 里用系统 python）。

CMD（推荐你当前环境）

cd /d d:\vla
python -m venv .venv
.\.venv\Scripts\python.exe -m pip install -U pip
.\.venv\Scripts\python.exe -m pip install -e .

PowerShell

cd d:\vla
python -m venv .venv
.\.venv\Scripts\Activate.ps1
python -m pip install -U pip
python -m pip install -e .

检查安装是否成功

cd /d d:\vla
.\.venv\Scripts\python.exe -c "import vla_mini; print('OK')"

二、① 演示模式（啥都不懂先跑这个）

无需 GPU、无需下载 VLM 权重。

cd /d d:\vla
.\.venv\Scripts\python.exe -m vla_mini.dry_run

可选：顺带生成/校验合成数据：

.\.venv\Scripts\python.exe -m vla_mini.dry_run --collect

打开网页 Demo（浏览器访问 http://127.0.0.1:7860 ）：

scripts\run-demo.cmd --dry-run

等价命令：

set NO_PROXY=127.0.0.1,localhost
.\.venv\Scripts\python.exe -m vla_mini.demo --dry-run

换端口（7860 被占用时）：

.\.venv\Scripts\python.exe -m vla_mini.demo --dry-run --port 7861

网页操作： 重置环境 → 运行代码 / 单步执行。
说明： 这是演示，不是训练好的 VLA 大模型。

三、② 真 VLA：训练 + 推理

1. 生成训练数据（约 120 局，已有数据可跳过）

cd /d d:\vla
.\.venv\Scripts\python.exe -m vla_mini.train --collect

数据位置：data\synthetic\manifest.jsonl 与 data\synthetic\images\。

只用已有数据、不再生成：

.\.venv\Scripts\python.exe -m vla_mini.train

2. 训练（首次会从 Hugging Face 下载 CLIP，需联网）

.\.venv\Scripts\python.exe -m vla_mini.train --collect

权重输出：runs\default\action_head.pt

3. 评测

.\.venv\Scripts\python.exe -m vla_mini.eval

4. 用训练好的模型打开 Demo

scripts\run-demo.cmd

或：

.\.venv\Scripts\python.exe -m vla_mini.demo

四、③ Edu-π₀（LeRobot 风格 policy）

cd /d d:\vla
.\.venv\Scripts\python.exe -m vla_mini.train_pi0 --collect

配置：configs\edu_pi0.yaml（可改 vlm_backbone: clip / minimind2-small-v）
权重输出：runs\edu_pi0\edu_pi0.pt
说明文档：docs/EDU_PI0.md

五、用 npm / npx（给别人一键装）

发布包：@jxhs/vla-mini（npm 0.1.2+：L0/L1/L2 任务 + train-pi0）。

# 全局安装（推荐，不用每次 npx）
npm install -g @jxhs/vla-mini
vla-mini install
vla-mini demo --dry-run

# 或一次性 npx（不写入全局）
npx @jxhs/vla-mini install
npx @jxhs/vla-mini dry-run
npx @jxhs/vla-mini demo --dry-run
npx @jxhs/vla-mini train --collect
npx @jxhs/vla-mini train-pi0 --collect
npx @jxhs/vla-mini eval
npx @jxhs/vla-mini demo

开发者在仓库内调试 npm CLI：

cd /d d:\vla\npm\vla-mini
node bin\vla-mini.js dry-run
node bin\vla-mini.js demo --dry-run
node bin\vla-mini.js train --collect

六、推荐完整跑通顺序（复制执行）

cd /d d:\vla
.\.venv\Scripts\python.exe -m pip install -e .
.\.venv\Scripts\python.exe -m vla_mini.dry_run --collect
scripts\run-demo.cmd --dry-run
.\.venv\Scripts\python.exe -m vla_mini.train --collect
.\.venv\Scripts\python.exe -m vla_mini.eval
scripts\run-demo.cmd

有 GPU 时训练更快；无 GPU 时前两步（dry-run + demo --dry-run）即可完成课堂演示。

七、常见问题

现象	处理
`No module named 'vla_mini'`	未在 `d:\vla` 安装，或用了 `C:\Python313\python` 而非 `.\.venv\Scripts\python.exe`
`$env:...` 报错	你在 CMD 里；改用 `set NO_PROXY=...` 或 `scripts\run-demo.cmd`
Gradio 502	代理问题；用 `run-demo.cmd` 或关系统 HTTP 代理
`train` 很慢 / 超时	无 GPU 或网络下 HF 模型；可先只跑 ①
注释行 `# ...` 报错	CMD 不要粘贴以 `#` 开头的行

项目结构

d:\vla\
  src/vla_mini/
    env/toy_reach.py      # L0 reach
    env/toy_push.py       # L1 push_t
    env/toy_grasp.py      # L2 grasp (+ gripper dim)
    env/factory.py        # make_env(task=reach|push|grasp)
    env/tasks.py          # action_dim × action_chunk 规格
  configs/push.yaml
  configs/grasp.yaml
    data/synthetic.py     # 合成数据
    model/vla.py          # 基础 VLA（CLIP + 动作头）
    policy/               # EduPI0Policy（π₀ 格式）
    train.py / train_pi0.py / eval.py / demo.py / dry_run.py
  configs/default.yaml
  configs/edu_pi0.yaml
  data/synthetic/         # 运行 collect 后生成
  runs/                   # 训练后生成
  scripts/run-demo.cmd    # Windows 启动 Demo
  npm/vla-mini/           # npm 封装

数据说明

自带数据：运行 --collect 后在本地 自动生成（不是 LIBERO / lerobot/*）。
不会在安装时自动下载 Hugging Face 机器人大数据集。
训练时下载的是 模型权重（如 CLIP），不是示范数据集。

升级路径

本仓库内：pick、多任务混合（make_env / collect_episodes 已支持扩展）
换仿真：PyBullet / LIBERO（单独环境，课堂外）
换数据：接入 lerobot/* 或 HDF5
换大 VLM / LoRA
完整 LeRobot：lerobot[libero] 等

许可

Apache-2.0

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
configs		configs
docs		docs
npm/vla-mini		npm/vla-mini
scripts		scripts
src/vla_mini		src/vla_mini
tests		tests
.gitignore		.gitignore
README.md		README.md
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

vla-mini

三种用法（一个项目，三个档位）

教学任务阶梯（仿真）

课堂固定流程表（config → 数据 → 权重）

环境要求

一、本地安装（首次必做）

CMD（推荐你当前环境）

PowerShell

检查安装是否成功

二、① 演示模式（啥都不懂先跑这个）

三、② 真 VLA：训练 + 推理

1. 生成训练数据（约 120 局，已有数据可跳过）

2. 训练（首次会从 Hugging Face 下载 CLIP，需联网）

3. 评测

4. 用训练好的模型打开 Demo

四、③ Edu-π₀（LeRobot 风格 policy）

五、用 npm / npx（给别人一键装）

六、推荐完整跑通顺序（复制执行）

七、常见问题

项目结构

数据说明

升级路径

许可

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

vla-mini

三种用法（一个项目，三个档位）

教学任务阶梯（仿真）

课堂固定流程表（config → 数据 → 权重）

环境要求

一、本地安装（首次必做）

CMD（推荐你当前环境）

PowerShell

检查安装是否成功

二、① 演示模式（啥都不懂先跑这个）

三、② 真 VLA：训练 + 推理

1. 生成训练数据（约 120 局，已有数据可跳过）

2. 训练（首次会从 Hugging Face 下载 CLIP，需联网）

3. 评测

4. 用训练好的模型打开 Demo

四、③ Edu-π₀（LeRobot 风格 policy）

五、用 npm / npx（给别人一键装）

六、推荐完整跑通顺序（复制执行）

七、常见问题

项目结构

数据说明

升级路径

许可

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages