# データセットの作成

## 有用な情報ソース

- [Record a Dataset][d-3]
- [Setup Cameras][d-1]
- [LeRobot Datasets][d-2]
- [Visualize dataset][d-4]

[d-1]: https://huggingface.co/docs/lerobot/main/en/cameras#setup-cameras
[d-2]: https://huggingface.co/blog/lerobot-datasets
[d-3]: https://huggingface.co/docs/lerobot/main/en/getting_started_real_world_robot#record-a-dataset
[d-4]: https://huggingface.co/spaces/lerobot/visualize_dataset

## 公式のデータセットの例

- lerobot/svla_so100_sorting
    - [データセット][d-1]
        - 9 episodes
        - 30 FPS
        - 480x640
    - [可視化][d-2]

![](asset/d-1.png)

[d-1]: https://huggingface.co/datasets/lerobot/svla_so100_sorting
[d-2]: https://huggingface.co/spaces/lerobot/visualize_dataset?path=%2Flerobot%2Fsvla_so100_sorting%2Fepisode_0

- lerobot/svla_so100_stacking
    - [データセット][d-1]
        - 40 episodes
        - 30 FPS
        - 480x640
    - [可視化][d-2]

![](asset/d-2.png)

[d-1]: https://huggingface.co/datasets/lerobot/svla_so100_stacking
[d-2]: https://huggingface.co/spaces/lerobot/visualize_dataset?path=%2Flerobot%2Fsvla_so100_stacking%2Fepisode_0

- lerobot/svla_so101_pickplace
    - [データセット][d-1]
        - 50 episodes
        - 30 FPS
        - 480x640

[d-1]: https://huggingface.co/datasets/lerobot/svla_so101_pickplace

![](asset/d-3.png)

![](asset/d-4.png)

- lerobot/svla_so100_pickplace
    - [データセット][d-1]
        - 50 spisodes
        - 30 FPS
        - 480x640

[d-1]: https://huggingface.co/datasets/lerobot/svla_so100_pickplace

![](asset/d-5.png)

![](asset/d-6.png)

## 個性的なデータセットの例

- lirislab/close_top_drawer_teabox
    - [データセット][d-4]
        - 30 episodes
        - 30 FPS
        - 480x640
    - [可視化][d-1]
- Chojins/chess_game_001_blue_stereo
    - [データセット][d-5]
        - 30 episodes
        - 30 FPS
        - 480x640
    - [可視化][d-2]
- pierfabre/chicken
    - [データセット][d-6]
        - 10 episodes
        - 30 FPS
        - 480x640
    - [可視化][d-3]

[d-1]: https://huggingface.co/spaces/lerobot/visualize_dataset?path=%2Flirislab%2Fclose_top_drawer_teabox%2Fepisode_1
[d-2]: https://huggingface.co/spaces/lerobot/visualize_dataset?path=%2FChojins%2Fchess_game_001_blue_stereo%2Fepisode_1
[d-3]: https://huggingface.co/spaces/lerobot/visualize_dataset?path=%2Fpierfabre%2Fchicken%2Fepisode_6
[d-4]: https://huggingface.co/datasets/lirislab/close_top_drawer_teabox
[d-5]: https://huggingface.co/datasets/Chojins/chess_game_001_blue_stereo
[d-6]: https://huggingface.co/datasets/pierfabre/chicken

## 必要なUSBポート数

アーム1組の場合は4つのUSBポートが必要

- リーダーアーム x 1
- フォロワーアーム x 1
- 上方カメラ x 1
- アームカメラ x 1 (3ピンコネクタを使用する場合は不要)

アーム2組の場合は7つのUSBポートが必要

- リーダーアーム x 2 
- フォロワーアーム x 2
- フォロワーアームカメラ x 2 （3ピンコネクタを使用する場合は不要）
- 上方カメラ x 1

上方カメラ用にUSB延長ケーブルがあると良い

アームカメラ用の3ピンコネクタの規格は「5264/2.54 3P connector」

## セットアップ

![](asset/env.png)

- [データセット][d-1]
- [可視化][d-2]

[d-1]: https://huggingface.co/datasets/EngineerCafeJP/record-test-2025-08-23-17-44-23
[d-2]: https://huggingface.co/spaces/lerobot/visualize_dataset?path=%2FEngineerCafeJP%2Frecord-test-2025-08-23-17-44-23%2Fepisode_0

In [None]:
if False:
    # 1. マイコンボードをUSBで接続する
    # 2. find_portコマンドを実行
    !python -m lerobot.find_port
    # 3. USBを外して、エンターキーを押す
    # 4. 「/dev/tty.usbmodem5A7A0182121」のようなポートが出力されるので変数に保存する
    #   !export LEADER_PORT="/dev/tty.usbmodem5A7A0182121"
    #   !export FOLLOWER_PORT="/dev/tty.usbmodem5A7A0182121"

In [None]:
# フォロワーアームのIDを設定する
!export FOLLOWER_ID="follower_arm_0"

# リーダーのIDを設定する
!export LEADER_ID="leader_arm_0"

In [None]:
# カメラのIDを確認する

if False:
    !lerobot-find-cameras opencv

In [None]:
# カメラを設定し遠隔操作できるかを確認する

if False:
    !export CAMERAS="{ images.wrist.top: {type: opencv, index_or_path: 1, width: 640, height: 480, fps: 30}, images.top: {type: opencv, index_or_path: 0, width: 640, height: 480, fps: 30}}"

    !python -m lerobot.teleoperate \
        --robot.type=so101_follower \
        --robot.port=$FOLLOWER_PORT \
        --robot.id=$FOLLOWER_ID \
        --robot.cameras=$CAMERAS \
        --teleop.type=so101_leader \
        --teleop.port=$LEADER_PORT \
        --teleop.id=$LEADER_ID \
        --display_data=true

In [None]:
# Hugging Faceにデータセットをアップロードする場合は必須

# if False:
#     assert $HF_TOKEN
#     assert $HF_USER

汎化性能を高めるため、10エピソードごとに場所を変え、最低50エピソードあると良い

カメラは固定し、記録中は一貫した掴み方を維持する

操作している物体がカメラに写っていることを確認する

カメラ映像だけを見て自分でタスクを実行できると良い

訓練して性能が上がったら、掴む場所を追加したり、異なる掴み方をしたり、カメラの位置を変更する

バリエーションは、性能の向上に伴い少しつづ導入していく

## データセットの作成

大まかな流れ

1. コマンドを実行
1. 「Recording episode 0」の音声後にアームを動かす
1. キーボードのキーをタイプ
    - 右矢印キーを押した場合: このエピソードの記録が完了
        - 「Reset the environment」の音声後にアームなどを初期位置に戻す
        - 右矢印キーを押し、次のエピソードの記録に進む
    - 左矢印キーを押した場合: エピソードの記録をやり直す
    - エスケープキーを押した場合: 全てのエピソードの記録を終了
1. 全て完了後、Hugging Face Hubにアップロード

RecordConfigクラスにコマンドの引数の説明がある

- robot: フォロワーアームの設定
- dataset: データセットの設定
- teleop: リーダーアーム設定
- display_data: 全てのカメラをスクリーンに表示するか（False）
- play_sounds: 音声を再生するか

DatasetRecordConfigクラスにデータセットのコマンドラインの引数の詳細の説明がある

- repo_id: `lerobot/test`などのリポジトリID
- single_task: "Pick the Lego block"などのタスク概要
- root: `dataset/path`などのデータセットの保存ディレクトリ
- fps: フレームレート（デフォルトは30）
- episode_time_s: データ記録時のマージンタイム（デフォルトは60秒）
- reset_time_s: データ記録時の初期位置に戻すマージンタイム（デフォルトは60秒）
- num_episodes: 記録するエピソード数（デフォルトは50）
- video: 画像を動画に書き出すか（デフォルトはtrue）
- push_to_hub: Hubにアップロードするか（デフォルトはtrue）
- private: リポジトリを非公開にするか（デフォルトはfalse）
- tags: データセットのタグ
- num_image_writer_processes: PNGに変換時のサブプロセス数（デフォルトは0）
- num_image_writer_threads_per_camera: カメラごとのPNG変換時のサブプロセスう（デフォルトは4）
- video_encoding_batch_size: 動画エンコード前に記録するエピソード数（デフォルトは1）

In [None]:
# 10エピソード分のデータセットを記録する

if False:
    !python -m lerobot.record \
        --robot.type=so101_follower \
        --robot.port=$FOLLOWER_PORT \
        --robot.id=$FOLLOWER_ID \
        --robot.cameras=$CAMERAS \
        --teleop.type=so101_leader \
        --teleop.port=$LEADER_PORT \
        --teleop.id=$LEADER_ID \
        --display_data=true \
        --dataset.repo_id=${HF_USER}/record-test-2025-10-07-21-26-29 \
        --dataset.num_episodes=50 \
        --dataset.single_task="Grab a green cap and put it in the box"

## 保存したデータセットの実演

In [None]:
if False:
    !python -m lerobot.replay \
        --robot.type=so101_follower \
        --robot.port=$FOLLOWER_PORT \
        --robot.id=$FOLLOWER_ID \
        --dataset.repo_id=${HF_USER}/record-test \
        --dataset.episode=0