# Practica 0 - Introduccion a Gym

> En la presente sesión, se va a realizar una introduccion a la libreria gym. Esta libreria de acceso abierto, desarrollada por OpenAI, ofrece entornos para distintos juegos de Atari. En dichos entornos, se pueden desarrollar, implementar, y comparar distintas soluciones de aprendizaje por refuerzo, de forma flexible.






---
## **PARTE 1** - Instalación y requisitos previos

> Las prácticas han sido preparadas para poder realizarse en el entorno de trabajo de Google Colab. Sin embargo, esta plataforma presenta ciertas incompatibilidades a la hora de visualizar la renderización en gym. Por ello, para obtener estas visualizaciones, se deberá trasladar el entorno de trabajo a local. Por ello, el presente dosier presenta instrucciones para poder trabajar en ambos entornos. Siga los siguientes pasos para un correcto funcionamiento:
1.   **LOCAL:** Preparar el enviroment, siguiendo las intrucciones detalladas en la sección *1.1.Preparar enviroment*.
2.  **AMBOS:** Modificar las variables "mount" y "drive_mount" a la carpeta de trabajo en drive en el caso de estar en Colab, y ejecturar la celda *1.2.Localizar entorno de trabajo*.
3. **COLAB:** se deberá ejecutar las celdas correspondientes al montaje de la carpeta de trabajo en Drive. Esta corresponde a la sección *1.3.Montar carpeta de datos local*.
4.  **AMBOS:** Instalar las librerías necesarias, siguiendo la sección *1.4.Instalar librerías necesarias*.



---
### 1.1. Preparar enviroment (solo local)



> Para preparar el entorno de trabajo en local, se han seguido los siguientes pasos:
1. En Windows, puede ser necesario instalar las C++ Build Tools. Para ello, siga los siguientes pasos: https://towardsdatascience.com/how-to-install-openai-gym-in-a-windows-environment-338969e24d30.
2. Instalar Anaconda
3. Siguiendo el código que se presenta comentado en la próxima celda: Crear un enviroment, cambiar la ruta de trabajo, e instalar librerías básicas.


```
conda update --all
conda create --name miar_rl python=3.8
conda activate miar_rl
cd "PATH_TO_FOLDER"
conda install git
pip install jupyter
```


4. Abrir la notebook con *jupyter-notebook*.



```
jupyter-notebook
```




---
### 1.2. Localizar entorno de trabajo: Google colab o local

In [2]:
# ATENCIÓN!! Modificar ruta relativa a la práctica si es distinta (drive_root)
mount='/content/gdrive'
drive_root = mount + "/My Drive/08_MIAR/sesiones_practicas/sesion_practica_0"

try:
  from google.colab import drive
  IN_COLAB=True
except:
  IN_COLAB=False

---
### 1.3. Montar carpeta de datos local (solo Colab)

In [3]:
# Switch to the directory on the Google Drive that you want to use
import os
if IN_COLAB:
  print("We're running Colab")

  if IN_COLAB:
    # Mount the Google Drive at mount
    print("Colab: mounting Google drive on ", mount)

    drive.mount(mount)

    # Create drive_root if it doesn't exist
    create_drive_root = True
    if create_drive_root:
      print("\nColab: making sure ", drive_root, " exists.")
      os.makedirs(drive_root, exist_ok=True)

    # Change to the directory
    print("\nColab: Changing directory to ", drive_root)
    %cd $drive_root
# Verify we're in the correct working directory
%pwd
print("Archivos en el directorio: ")
print(os.listdir())

We're running Colab
Colab: mounting Google drive on  /content/gdrive
Drive already mounted at /content/gdrive; to attempt to forcibly remount, call drive.mount("/content/gdrive", force_remount=True).

Colab: making sure  /content/gdrive/My Drive/08_MIAR/sesiones_practicas/sesion_practica_0  exists.

Colab: Changing directory to  /content/gdrive/My Drive/08_MIAR/sesiones_practicas/sesion_practica_0
/content/gdrive/My Drive/08_MIAR/sesiones_practicas/sesion_practica_0
Archivos en el directorio: 
[]


---
### 1.4. Instalar librerías necesarias


In [6]:
if IN_COLAB:
  %pip install gym==0.17.3
  %pip install git+https://github.com/Kojoley/atari-py.git
  %pip install keras-rl2==1.0.5
  %pip install tensorflow==2.8
else:
  %pip install gym==0.17.3
  %pip install git+https://github.com/Kojoley/atari-py.git
  %pip install pyglet==1.5.0
  %pip install h5py==3.1.0
  %pip install Pillow==9.5.0
  %pip install keras-rl2==1.0.5
  %pip install Keras==2.2.4
  %pip install tensorflow==2.5.3
  %pip install torch==2.0.1
  %pip install agents==1.4.0

Collecting gym==0.17.3
  Downloading gym-0.17.3.tar.gz (1.6 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.6/1.6 MB[0m [31m18.6 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting pyglet<=1.5.0,>=1.4.0 (from gym==0.17.3)
  Downloading pyglet-1.5.0-py2.py3-none-any.whl (1.0 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.0/1.0 MB[0m [31m56.2 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting cloudpickle<1.7.0,>=1.2.0 (from gym==0.17.3)
  Downloading cloudpickle-1.6.0-py3-none-any.whl (23 kB)
Building wheels for collected packages: gym
  Building wheel for gym (setup.py) ... [?25l[?25hdone
  Created wheel for gym: filename=gym-0.17.3-py3-none-any.whl size=1654618 sha256=88e406ad613c2a314f1339a5449353e667800afaadfbe2f9b080bceb95668baf
  Stored in directory: /root/.cache/pip/wheels/af/4b/74/fcfc8238472c34d7f96508a63c962ff3ac9485a9a4137afd4e
Successfully built gym
Installing collected packages: py

---
## **PARTE 2** - *Librerias de RL*

> A continuacion, se introducen una serie de librerias para desarrollar soluciones de deep learning para el aprendizaje profundo.

>**Librerias focalizadas en implementar entrenamiento:**
*   Tensorflow: https://www.tensorflow.org/
*   Keras-rl: https://github.com/keras-rl/keras-rl
*   Pytorch: https://pytorch.org/
*   SpinningUp: https://spinningup.openai.com/en/latest/

>**Librerias centradas en trabajar con entornos:**
*   Gym: https://gym.openai.com/
*   Retro: https://github.com/openai/retro
*   Unity: https://unity.com/es/products/machine-learning-agents
*   Carla:  https://github.com/carla-simulator/carla



---
## **PARTE 3** - *Ejemplo de entornos con gym*

In [4]:
import gym  # Importamos libreria

In [5]:
# Creamos el entorno sobre el que vamos a ejecutar nuestro agente
env = gym.make("BreakoutDeterministic-v4")
env.seed(123)  # Definimos la semilla para la reproducibilidad de la ejecución

[123, 151010689]

In [None]:
# Dimensions de las observaciones del entorno
print("Dimensiones del espacio de observaciones: ")
print(env.observation_space.shape)

Dimensiones del espacio de observaciones: 
(210, 160, 3)


In [None]:
print("Formato de las observaciones:")
env.observation_space
env.action_space

Formato de las observaciones:


Discrete(4)

# Esto es de LOIS PARA EL COLAB

HAY COMENTARIOS EN LOS CODIGOS DE ABAJO




In [6]:
##--CELDA MIA--
if IN_COLAB:
  !pip install gym[atari-py]
  !apt-get install -y xvfb ffmpeg
  !pip install imageio

  import gym
  import imageio
  import numpy as np
  import matplotlib.pyplot as plt
  from IPython.display import HTML
  from base64 import b64encode

  # Función para crear un video a partir de imágenes
  def create_video(frames, video_name):
      imageio.mimsave(video_name, frames, fps=30)

Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
ffmpeg is already the newest version (7:4.4.2-0ubuntu0.22.04.1).
xvfb is already the newest version (2:21.1.4-2ubuntu1.7~22.04.10).
0 upgraded, 0 newly installed, 0 to remove and 45 not upgraded.


In [15]:
observation = env.reset()
steps = 1000

frames = []

for _ in range(steps):
    if not IN_COLAB:
        env.render()
    else:
        frame = env.render(mode='rgb_array')
        frames.append(frame)
    action = env.action_space.sample()  # tu agente aquí (esto toma acciones aleatorias)
    observation, reward, done, info = env.step(action)

    if done:
        observation = env.reset()

env.close()

# Mostrar el video en el notebook si estamos en Colab

if IN_COLAB:
    # Crear y guardar el video
    create_video(frames, 'gym_video.mp4')
    video_path = 'gym_video.mp4'
    video = open(video_path, "rb").read()
    video_encoded = b64encode(video).decode()
    display(HTML(f'<video width="640" height="480" controls><source src="data:video/mp4;base64,{video_encoded}" type="video/mp4"></video>'))





In [19]:
# Bucle de ejecución con episodios
num_episodes = 5
steps_per_episode = 1000

for episode in range(num_episodes):
    observation = env.reset()
    frames = []
    for _ in range(steps_per_episode):
        if not IN_COLAB:
            env.render()
        else:
            frame = env.render(mode='rgb_array')
            frames.append(frame)
        action = env.action_space.sample()  # tu agente aquí (esto toma acciones aleatorias)
        observation, reward, done, info = env.step(action)

        if done:
            observation = env.reset()


    # Crear y guardar el video para el episodio actual
    video_name = f'gym_video_episode_{episode + 1}.mp4'
    create_video(frames, video_name)

    # Mostrar el video en el notebook si estamos en Colab
    if IN_COLAB:
        print(len(frames))
        video_path = video_name
        video = open(video_path, "rb").read()
        video_encoded = b64encode(video).decode()
        display(HTML(f'<h3>Episode {episode + 1}</h3><video width="640" height="480" controls><source src="data:video/mp4;base64,{video_encoded}" type="video/mp4"></video>'))

env.close()



1000




1000




1000




1000




1000


---