# ステップ2: 学習実行ノートブック

このノートブックは、強化学習の実験を実行するためものです。

**前提条件:**
このノートブックと同じフォルダ (`final_version`) に、`train.py`や`student_code.py`などのスクリプトファイルがすべて存在している必要があります。

**使い方:**
1. このノートブックのセルを上から順番にすべて実行してください。
2. 最後のセルで、実行したい実験のパターンのコメントを解除して、学習を開始します。

## 1. セットアップ（システム＆Pythonライブラリ）

In [None]:
# このセルは、新しいColabセッションを開始するたびに一度だけ実行してください
!apt-get update
!apt-get install -y ffmpeg xvfb libsdl2-dev python3-opengl cmake zlib1g-dev
!pip install gymnasium[classic_control,atari,accept-rom-license] moviepy imageio wandb opencv-python matplotlib tqdm pillow torchvision

0% [Working]            Get:1 https://cli.github.com/packages stable InRelease [3,917 B]
0% [Connecting to archive.ubuntu.com (185.125.190.83)] [Waiting for headers] [W                                                                               Get:2 https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/ InRelease [3,632 B]
Get:3 http://security.ubuntu.com/ubuntu jammy-security InRelease [129 kB]
Hit:4 http://archive.ubuntu.com/ubuntu jammy InRelease
Get:5 https://r2u.stat.illinois.edu/ubuntu jammy InRelease [6,555 B]
Get:6 https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64  InRelease [1,581 B]
Get:7 http://archive.ubuntu.com/ubuntu jammy-updates InRelease [128 kB]
Get:8 https://cli.github.com/packages stable/main amd64 Packages [354 B]
Get:9 https://ppa.launchpadcontent.net/deadsnakes/ppa/ubuntu jammy InRelease [18.1 kB]
Get:10 https://ppa.launchpadcontent.net/graphics-drivers/ppa/ubuntu jammy InRelease [24.3 kB]
Get:11 http://archive.ubuntu.com/ubu

## 2. Googleドライブのマウントと作業ディレクトリへの移動

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [None]:
import os

# このプロジェクトのファイルがあるGoogle Driveのパス
project_path = '//content/drive/MyDrive/noisy_on_off/'

try:
    os.chdir(project_path)
    print(f"カレントディレクトリを次に変更しました: {os.getcwd()}")
    # ファイルが存在するか確認
    assert os.path.exists('train.py'), "train.pyが見つかりません。ファイルが正しく配置されているか確認してください。"
    print("必要なスクリプトファイルが見つかりました。学習を開始できます。")
except (FileNotFoundError, AssertionError) as e:
    print(f"エラー: {e}")

カレントディレクトリを次に変更しました: /content/drive/MyDrive/final_version
必要なスクリプトファイルが見つかりました。学習を開始できます。


## 3. WandB ログイン

In [None]:
import wandb
wandb.login()

## 4. 学習の実行

以下の3つの実行パターンのうち、実行したいもののコメントアウトを解除し、他をコメントアウトしてください。

In [None]:
import os
os.environ['MUJOCO_GL'] = 'egl'

# --- 実行したいコマンドの行頭の「#」を削除してください（一度に一つのみ） --- #

# パターン1: Noisy-TV機能なしで実行
# !python train.py --env-name "ALE/Breakout-v5" --steps 50000 --wandb

# パターン2: Noisy-TV機能あり（当初の、単純なノイズ混入版）
!python train.py --env-name "ALE/Breakout-v5" --steps 50000 --noisy-tv --noisy-wrapper-type simple # --wandb

# パターン3: Noisy-TV機能あり（行動空間拡張版）
# !python train.py --env-name "ALE/Breakout-v5" --steps 50000 --noisy-tv --noisy-wrapper-type action_space --wandb

Using device: cuda
A.L.E: Arcade Learning Environment (version 0.11.2+ecc1138)
[Powered by Stella]
Loading CIFAR-10 dataset...
✅ Loaded 50000 CIFAR-10 images
Using simple noise injection for Noisy-TV
Pre-filling buffer: 100% 1000/1000 [00:01<00:00, 766.95it/s]
Starting Main Loop...
Training Steps:  20% 9997/50000 [04:24<09:30, 70.11it/s]Eval(iter=9999) mean: 1.80
Training Steps:  40% 19993/50000 [09:00<07:24, 67.45it/s]Eval(iter=19999) mean: 1.60
Training Steps:  60% 29999/50000 [13:34<04:54, 67.99it/s]Eval(iter=29999) mean: 0.60
Training Steps:  80% 39999/50000 [18:09<02:52, 58.11it/s]Eval(iter=39999) mean: 0.80
Training Steps: 100% 49998/50000 [22:44<00:00, 70.73it/s]Eval(iter=49999) mean: 1.80
Training Steps: 100% 50000/50000 [22:51<00:00, 36.45it/s]
