# Practica 0 - Introduccion a Gym

> En la presente sesión, se va a realizar una introduccion a la libreria gym. Esta libreria de acceso abierto, desarrollada por OpenAI, ofrece entornos para distintos juegos de Atari. En dichos entornos, se pueden desarrollar, implementar, y comparar distintas soluciones de aprendizaje por refuerzo, de forma flexible.






---
## **PARTE 1** - Instalación y requisitos previos

> Las prácticas han sido preparadas para poder realizarse en el entorno de trabajo de Google Colab. Sin embargo, esta plataforma presenta ciertas incompatibilidades a la hora de visualizar la renderización en gym. Por ello, para obtener estas visualizaciones, se deberá trasladar el entorno de trabajo a local. Por ello, el presente dosier presenta instrucciones para poder trabajar en ambos entornos. Siga los siguientes pasos para un correcto funcionamiento:
1.   **LOCAL:** Preparar el enviroment, siguiendo las intrucciones detalladas en la sección *1.1.Preparar enviroment*.
2.  **AMBOS:** Modificar las variables "mount" y "drive_mount" a la carpeta de trabajo en drive en el caso de estar en Colab, y ejecturar la celda *1.2.Localizar entorno de trabajo*.
3. **COLAB:** se deberá ejecutar las celdas correspondientes al montaje de la carpeta de trabajo en Drive. Esta corresponde a la sección *1.3.Montar carpeta de datos local*.
4.  **AMBOS:** Instalar las librerías necesarias, siguiendo la sección *1.4.Instalar librerías necesarias*.



---
### 1.1. Preparar enviroment (solo local)



> Para preparar el entorno de trabajo en local, se han seguido los siguientes pasos:
1. En Windows, puede ser necesario instalar las C++ Build Tools. Para ello, siga los siguientes pasos: https://towardsdatascience.com/how-to-install-openai-gym-in-a-windows-environment-338969e24d30.
2. Instalar Anaconda
3. Siguiendo el código que se presenta comentado en la próxima celda: Crear un enviroment, cambiar la ruta de trabajo, e instalar librerías básicas.


```
conda create --name miar_rl python=3.8
conda activate miar_rl
cd "PATH_TO_FOLDER"
conda install git
pip install jupyter
```


4. Abrir la notebook con *jupyter-notebook*.



```
jupyter-notebook
```




---
### 1.2. Localizar entorno de trabajo: Google colab o local

In [1]:
# ATENCIÓN!! Modificar ruta relativa a la práctica si es distinta (drive_root)
mount='/content/gdrive'
drive_root = mount + "/My Drive/08_MIAR/sesiones_practicas/sesion_practica_0"

try:
  from google.colab import drive
  IN_COLAB=True
except:
  IN_COLAB=False

---
### 1.3. Montar carpeta de datos local (solo Colab)

In [3]:
# Switch to the directory on the Google Drive that you want to use
import os
if IN_COLAB:
  print("We're running Colab")

  if IN_COLAB:
    # Mount the Google Drive at mount
    print("Colab: mounting Google drive on ", mount)

    drive.mount(mount)

    # Create drive_root if it doesn't exist
    create_drive_root = True
    if create_drive_root:
      print("\nColab: making sure ", drive_root, " exists.")
      os.makedirs(drive_root, exist_ok=True)

    # Change to the directory
    print("\nColab: Changing directory to ", drive_root)
    %cd $drive_root
# Verify we're in the correct working directory
%pwd
print("Archivos en el directorio: ")
print(os.listdir())

We're running Colab
Colab: mounting Google drive on  /content/gdrive
Mounted at /content/gdrive

Colab: making sure  /content/gdrive/My Drive/08_MIAR/sesiones_practicas/sesion_practica_0  exists.

Colab: Changing directory to  /content/gdrive/My Drive/08_MIAR/sesiones_practicas/sesion_practica_0
/content/gdrive/My Drive/08_MIAR/sesiones_practicas/sesion_practica_0
Archivos en el directorio: 
[]


---
### 1.4. Instalar librerías necesarias


In [14]:
if IN_COLAB:
  %pip install gym==0.19.0
  %pip install git+https://github.com/Kojoley/atari-py.git
  %pip install keras-rl2==1.0.5
  %pip install tensorflow==2.8
else:
  %pip install gym==0.17.3
  %pip install git+https://github.com/Kojoley/atari-py.git
  %pip install pyglet==1.5.0
  %pip install h5py==3.1.0
  %pip install Pillow==9.5.0
  %pip install keras-rl2==1.0.5
  %pip install Keras==2.2.4
  %pip install tensorflow==2.5.3
  %pip install torch==2.0.1
  %pip install agents==1.4.0

  and should_run_async(code)


Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting gym==0.19.0
  Using cached gym-0.19.0.tar.gz (1.6 MB)
  [1;31merror[0m: [1msubprocess-exited-with-error[0m
  
  [31m×[0m [32mpython setup.py egg_info[0m did not run successfully.
  [31m│[0m exit code: [1;36m1[0m
  [31m╰─>[0m See above for output.
  
  [1;35mnote[0m: This error originates from a subprocess, and is likely not a problem with pip.
  Preparing metadata (setup.py) ... [?25l[?25herror
[1;31merror[0m: [1mmetadata-generation-failed[0m

[31m×[0m Encountered error while generating package metadata.
[31m╰─>[0m See above for output.

[1;35mnote[0m: This is an issue with the package mentioned above, not pip.
[1;36mhint[0m: See above for details.
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting git+https://github.com/Kojoley/atari-py.git
  Cloning https://github.com/Kojoley/atari-py.git

---
## **PARTE 2** - *Librerias de RL*

> A continuacion, se introducen una serie de librerias para desarrollar soluciones de deep learning para el aprendizaje profundo.

>**Librerias focalizadas en implementar entrenamiento:**
*   Tensorflow: https://www.tensorflow.org/
*   Keras-rl: https://github.com/keras-rl/keras-rl
*   Pytorch: https://pytorch.org/
*   SpinningUp: https://spinningup.openai.com/en/latest/

>**Librerias centradas en trabajar con entornos:**
*   Gym: https://gym.openai.com/
*   Retro: https://github.com/openai/retro
*   Unity: https://unity.com/es/products/machine-learning-agents
*   Carla:  https://github.com/carla-simulator/carla



---
## **PARTE 3** - *Ejemplo de entornos con gym*

In [15]:
import gym  # Importamos libreria

In [16]:
# Creamos el entorno sobre el que vamos a ejecutar nuestro agente
# Deterministic para que siempre se inicialice igual el env en base a una semilla.
env = gym.make("BreakoutDeterministic-v4")
env.seed(123)  # Definimos la semilla para la reproducibilidad de la ejecución

NameNotFound: ignored

In [None]:
# Dimensions de las observaciones del entorno
print("Dimensiones del espacio de observaciones: ")
print(env.observation_space.shape)
#Nos encontramos una imagen, que es la pantalla del videojuego.

Dimensiones del espacio de observaciones: 
(210, 160, 3)


In [None]:
print("Formato de las observaciones:")
env.observation_space

Formato de las observaciones:


Box(0, 255, (210, 160, 3), uint8)

In [None]:
# Bucle básico de ejecución
#en t=0, reset el environment
observation = env.reset()
print(observation)

#Establecemos el número de steps/iteraciones
steps = 1000

for _ in range(steps):
    if not IN_COLAB:
      env.render()

    action = env.action_space.sample()  # your agent here (this takes random actions)
    observation, reward, done, info = env.step(action)

    #Cuando llegamos al game over, hacemos un reset del environment.
    if done:
        observation = env.reset()

env.close()

In [None]:
# Bucle de ejecución con episodios
#Esto es como testeo luego de entrenar, un ejemplo nada más.
observation = env.reset()
episodes = 5

for episode in range(episodes):
    done = False
    episode_reward = 0
    while not done:
        if not IN_COLAB:
          env.render()

        action = env.action_space.sample()  # your agent here (this takes random actions)
        observation, reward, done, info = env.step(action)

        episode_reward += reward

        if done:
            observation = env.reset()

    print(episode_reward)

env.close()

1.0
2.0
0.0
1.0
1.0


---