GitHub - meituan/LIBERO-X: LIBERO-X Robustness Litmus for Vision-Language-Action Models

LIBERO-X Robustness Litmus for Vision-Language-Action Models

Guodong Wang*, Chenkai Zhang*, Qingjie Liu, Jinjin Zhang, Jiancheng Cai, Junjie Liu^†, Xinmin Liu^‡

^*Equal Contribution ^†Corresponding Author ^‡Project Leader

LIBERO-X is a comprehensive benchmark designed for robotic manipulation, featuring a progressively challenging evaluation framework. It systematically characterizes model performance under multi-dimensional distribution shifts by jointly perturbing spatial layouts, object properties, and instruction semantics. Key features of LIBERO-X include:

Multi-level evaluation framework: Comprising 5 distinct difficulty levels, each annotated with multi-labels for spatial, visual, and semantic attributes to enable fine-grained analysis.
High-diversity training dataset: Collected via human teleoperation, it includes 2,520 demonstrations, 600 tasks, and 100 scenes, ensuring broad generalization across diverse scenarios.

TODO

Release multi-level & multi-label evaluation scenes and tasks
Release fine-tuned VLA models
Release LIBERO-X training data

Installation

conda create -n liberox python=3.9
conda activate liberox
git clone https://github.com/meituan/LIBERO-X
cd LIBERO-X
pip install -r requirements.txt

Then install the libero-x package:

pip install -e .

Training Data (coming soon)

LIBERO-X introduces finer-grained task-level extensions to expose models to diverse task formulations and workspace configurations, featuring:

Multi-Task Scene Design
Attribute-Conditioned Manipulation
Spatial Relationship Reasoning
Human Demonstration Collection

LIBERO-X exhibits a broader spread and higher trajectory density, demonstrating its greater diversity.

Evaluation

To enable more fine-grained evaluation of VLA models, we improve the original LIBERO by introducing new objects with diverse shapes and textures, along with additional predicates (including ExactIn, UprightOn and SideOn to enrich the goal states.

eval_template.py implements a client-server mode for VLA model evaluation and rollout video recording.

python eval_template.py \
  --scene-group LEVEL1 \               # LEVEL1–LEVEL5
  --load-mode init \                   # bddl or init
  --bddl-root libero/libero_x/bddl \   # BDDL root (default libero/libero_x/bddl)
  --init-root libero/libero_x/init \   # init root (default libero/libero_x/init)
  --video-out-path data/eval_videos \  # output directory for videos and results
  --num-trials-per-task 10 \           # trials per task
  --host 127.0.0.1 \
  --port 8000

Acknowledgements

We sincerely thank the authors of LIBERO and openpi for their valuable open-source contributions to the research community. Their well-designed frameworks have not only enabled our work but also significantly benefited the broader robotics field by providing accessible, high-quality tools for reproducible research.

Citation

If you find LIBERO-X to be useful in your own research, please consider citing our paper:

@article{wang2026libero,
  title={LIBERO-X: Robustness Litmus for Vision-Language-Action Models},
  author={Wang, Guodong and Zhang, Chenkai and Liu, Qingjie and Zhang, Jinjin and Cai, Jiancheng and Liu, Junjie and Liu, Xinmin},
  journal={arXiv preprint arXiv:2602.06556},
  year={2026}
}

License

Component	License
Codebase	MIT License
Datasets	Creative Commons Attribution 4.0 International (CC BY 4.0)

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
docs		docs
images		images
libero		libero
packages/openpi-client		packages/openpi-client
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
eval_template.py		eval_template.py
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LIBERO-X Robustness Litmus for Vision-Language-Action Models

TODO

Installation

Training Data (coming soon)

Evaluation

Acknowledgements

Citation

License

About

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

LIBERO-X Robustness Litmus for Vision-Language-Action Models

TODO

Installation

Training Data (coming soon)

Evaluation

Acknowledgements

Citation

License

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Contributors

Uh oh!

Languages