# **Example of wrappers.rendering**
ソースコードは以下から参照されたい  
[Source code for gymnasium.wrappers.rendering](https://gymnasium.farama.org/main/_modules/gymnasium/wrappers/rendering/#HumanRendering)

In [None]:
if str(get_ipython()).startswith('<google.colab.'):
    !pip install gymnasium

## <font color= "#ff2200">**RenderCollectionラッパーの使い方**</font>

In [None]:
import gymnasium as gym
from gymnasium.wrappers import RenderCollection

# 環境を作成し、RenderCollectionラッパーを適用
env = gym.make("CartPole-v1", render_mode="rgb_array")
env = RenderCollection(env)

# 環境をリセット
observation, info = env.reset(seed=42)

# 200ステップ実行し、フレームを収集
frames = []
for _ in range(200):
    action = env.action_space.sample()
    observation, reward, terminated, truncated, info = env.step(action)

    if terminated or truncated:
        break

# 収集したフレームを取得
frames = env.render()

# フレーム数を出力
print(f"Collected {len(frames)} frames.")

env.close()

### **使い方**

RenderCollectionラッパーは、環境のレンダリングされたフレームをリストに収集するためのものです。以下のように適用します。

```python
import gymnasium as gym
from gymnasium.wrappers import RenderCollection

env = gym.make("env_id", render_mode="rgb_array")
env = RenderCollection(env)
```

レンダリングされたフレームは `env.render()` を呼び出すことで取得できます。さらに、以下のパラメータを指定できます。

- `pop_frames` (デフォルト: True) - `render()`が呼び出された後にフレームリストを空にするかどうか
- `reset_clean` (デフォルト: True) - `reset()`が呼び出された時にフレームリストを空にするかどうか



上記のコードでは、CartPole-v1環境を作成し、RenderCollectionラッパーを適用しています。その後、200ステップ実行し、レンダリングされたフレームを収集しています。

最後に `env.render()` を呼び出すと、収集したフレームのリストが返されます。デフォルトでは、この呼び出し後にフレームリストは空になります(`pop_frames=True`)。

出力例:

```
Collected 200 frames.
```

収集したフレームは、後で動画に変換したり、フレーム単位での処理に使用できます。RenderCollectionは、レンダリングされた環境の経過を記録しておく際に便利です。

## <font color= "#00ff00">**RecordVideoラッパーの使い方**</font>

In [None]:
import os
import gymnasium as gym
from gymnasium.wrappers import RecordVideo

# 動画を保存するフォルダを作成
os.makedirs("videos", exist_ok=True)

# 環境を作成し、RecordVideoラッパーを適用
env = gym.make("CartPole-v1", render_mode="rgb_array")
trigger = lambda episode_id: episode_id % 10 == 0  # 10エピソードごとに録画
env = RecordVideo(env, video_folder="videos/", episode_trigger=trigger)

# 100エピソード実行
for episode in range(100):
    observation, info = env.reset()
    done = False
    while not done:
        action = env.action_space.sample()
        observation, reward, terminated, truncated, info = env.step(action)
        done = terminated or truncated

env.close()

### **使い方**

RecordVideoラッパーは、環境のエピソードの動画を録画するためのものです。以下のようにして適用します。

```python
import gymnasium as gym
from gymnasium.wrappers import RecordVideo

env = gym.make("env_id", render_mode="rgb_array")
env = RecordVideo(env, 
                  video_folder="videos/", 
                  episode_trigger=lambda x: x % 10 == 0, 
                  step_trigger=None,
                  video_length=0)
```

引数の説明:

- `video_folder`: 動画を保存するフォルダパス
- `episode_trigger`: エピソードを録画するかどうかを判断する関数
- `step_trigger`: ステップを録画するかどうかを判断する関数
- `video_length`: 動画の長さ(フレーム数)。0の場合はエピソード全体を録画

`episode_trigger`と`step_trigger`はどちらか一方を指定する必要があります。どちらも指定しない場合は、特定のエピソードで自動的に録画が開始されます。


上記のコードでは、CartPole-v1環境を作成し、RecordVideoラッパーを適用しています。`episode_trigger`として、10エピソードごとに録画を開始する関数を与えています。

100エピソード実行した後、動画ファイルが `videos/` フォルダに保存されます。ファイル名は `rl-video-episode-{episode_id}.mp4` という形式になります。

録画されたエピソードを確認するには、作成された動画ファイルを再生してみてください。

RecordVideoラッパーは、エージェントの学習過程を可視化したり、特定のエピソードの振る舞いを記録したりするのに便利です。`episode_trigger`と`step_trigger`を適切に設定することで、必要な部分だけを選択的に録画できます。

## <font color= "#0055ff">**HumanRenderingクラスの使い方**</font>

In [None]:
import gymnasium as gym

# 環境作成時にHumanRenderingラッパーを適用
env = gym.make("CartPole-v1", render_mode="human")

# 環境をリセット
observation, info = env.reset(seed=42)

# 50ステップ実行しながら、レンダリングを行う
for _ in range(1000):
    action = env.action_space.sample() # ランダムなアクションを選択
    observation, reward, terminated, truncated, info = env.step(action)

    if terminated or truncated:
        observation, info = env.reset()

env.close()

### **使い方**

HumanRenderingラッパーは、環境の"rgb_array"レンダリングモードをウィンドウに表示するためのものです。以下の2つの方法でラッパーを適用できます。

1. **環境ラッパー適用後**

```python
import gymnasium as gym
from gymnasium.wrappers import HumanRendering

env = gym.make("env_id", render_mode="rgb_array")
env = HumanRendering(env)
```

2. **環境作成時**

```python
import gymnasium as gym

env = gym.make("env_id", render_mode="human")
```

この方法では、環境が"human"レンダリングモードをネイティブにサポートしていない場合にのみ、HumanRenderingラッパーが自動的に適用されます。

上記のコードを実行すると、LunarLanderの画面がウィンドウに表示され、環境が50ステップ進行するたびにフレームがレンダリングされます。

環境がリセットされるたびに、新しいエピソードが始まり、ウィンドウにレンダリングされた最初のフレームが表示されます。

HumanRenderingラッパーは、人間が環境を視覚化したり、動作を確認したりするのに便利です。ただし、レンダリングの [overhead](https://hldc.co.jp/blog/2022/12/15/11611/) が高いため、実際の強化学習トレーニングなどでは使用しないことをお勧めします。