# Practica 0 - Introduccion a Gym

> En la presente sesión, se va a realizar una introduccion a la libreria gym. Esta libreria de acceso abierto, desarrollada por OpenAI, ofrece entornos para distintos juegos de Atari. En dichos entornos, se pueden desarrollar, implementar, y comparar distintas soluciones de aprendizaje por refuerzo, de forma flexible.






---
## **PARTE 1** - Instalación y requisitos previos

> Las prácticas han sido preparadas para poder realizarse en el entorno de trabajo de Google Colab. Sin embargo, esta plataforma presenta ciertas incompatibilidades a la hora de visualizar la renderización en gym. Por ello, para obtener estas visualizaciones, se deberá trasladar el entorno de trabajo a local. Por ello, el presente dosier presenta instrucciones para poder trabajar en ambos entornos. Siga los siguientes pasos para un correcto funcionamiento:
1.   **LOCAL:** Preparar el enviroment, siguiendo las intrucciones detalladas en la sección *1.1.Preparar enviroment*.
2.  **AMBOS:** Modificar las variables "mount" y "drive_mount" a la carpeta de trabajo en drive en el caso de estar en Colab, y ejecturar la celda *1.2.Localizar entorno de trabajo*.
3. **COLAB:** se deberá ejecutar las celdas correspondientes al montaje de la carpeta de trabajo en Drive. Esta corresponde a la sección *1.3.Montar carpeta de datos local*.
4.  **AMBOS:** Instalar las librerías necesarias, siguiendo la sección *1.4.Instalar librerías necesarias*.



---
### 1.1. Preparar enviroment (solo local)



> Para preparar el entorno de trabajo en local, se han seguido los siguientes pasos:
1. En Windows, puede ser necesario instalar las C++ Build Tools. Para ello, siga los siguientes pasos: https://towardsdatascience.com/how-to-install-openai-gym-in-a-windows-environment-338969e24d30.
2. Instalar Anaconda
3. Siguiendo el código que se presenta comentado en la próxima celda: Crear un enviroment, cambiar la ruta de trabajo, e instalar librerías básicas.


```
conda update --all
conda create --name miar_rl python=3.8
conda activate miar_rl
cd "PATH_TO_FOLDER"
conda install git
pip install jupyter
```


4. Abrir la notebook con *jupyter-notebook*.



```
jupyter-notebook
```




---
### 1.2. Localizar entorno de trabajo: Google colab o local

In [1]:
# ATENCIÓN!! Modificar ruta relativa a la práctica si es distinta (drive_root)
mount='/content/gdrive'
drive_root = mount + "/My Drive/08_MIAR/sesiones_practicas/sesion_practica_0"

try:
  from google.colab import drive
  IN_COLAB=True
except:
  IN_COLAB=False

---
### 1.3. Montar carpeta de datos local (solo Colab)

In [None]:
# # Switch to the directory on the Google Drive that you want to use
# import os
# if IN_COLAB:
#   print("We're running Colab")

#   if IN_COLAB:
#     # Mount the Google Drive at mount
#     print("Colab: mounting Google drive on ", mount)

#     drive.mount(mount)

#     # Create drive_root if it doesn't exist
#     create_drive_root = True
#     if create_drive_root:
#       print("\nColab: making sure ", drive_root, " exists.")
#       os.makedirs(drive_root, exist_ok=True)

#     # Change to the directory
#     print("\nColab: Changing directory to ", drive_root)
#     %cd $drive_root
# # Verify we're in the correct working directory
# %pwd
# print("Archivos en el directorio: ")
# print(os.listdir())

---
### 1.4. Instalar librerías necesarias


In [3]:
# if IN_COLAB:
#   %pip install gym==0.17.3
#   %pip install git+https://github.com/Kojoley/atari-py.git
#   %pip install keras-rl2==1.0.5
#   %pip install tensorflow==2.8
# else:
#   %pip install --upgrade pip
#   %pip install gym==0.17.3
#   %pip install git+https://github.com/Kojoley/atari-py.git
#   %pip install pyglet==1.5.0
#   %pip install h5py==3.1.0
#   %pip install Pillow==9.5.0
#   %pip install keras-rl2==1.0.5
#   %pip install Keras==2.2.4
#   %pip install tensorflow==2.5.3
#   %pip install torch==2.0.1
#   %pip install agents==1.4.0

---
## **PARTE 2** - *Librerias de RL*

> A continuacion, se introducen una serie de librerias para desarrollar soluciones de deep learning para el aprendizaje profundo.

>**Librerias focalizadas en implementar entrenamiento:**
*   Tensorflow: https://www.tensorflow.org/
*   Keras-rl: https://github.com/keras-rl/keras-rl
*   Pytorch: https://pytorch.org/
*   SpinningUp: https://spinningup.openai.com/en/latest/

>**Librerias centradas en trabajar con entornos:**
*   Gym: https://gym.openai.com/
*   Retro: https://github.com/openai/retro
*   Unity: https://unity.com/es/products/machine-learning-agents
*   Carla:  https://github.com/carla-simulator/carla




## **PARTE 3** - *Ejemplo de entornos con gym*

### AGENTE ALEATORIO

In [2]:
import gym  # Importamos libreria - Si no os salta error, lo tenéis bien instalado. Especial Atención a las librerías de C++.

In [3]:
# creamos el entorno donde se va a ejecutar nuestro agente
env = gym.make("BreakoutDeterministic-v4")
env.seed(123)

[123, 151010689]

In [4]:
# observamos dimennsiones de espacio de observaciones y acciones
print("Dimensiones del espacion de observaciones")
print(env.observation_space.shape)

Dimensiones del espacion de observaciones
(210, 160, 3)


In [5]:
# observamos el espacio de acciones
print("dimensiones del espacio de acciones")
env.action_space

dimensiones del espacio de acciones


Discrete(4)

In [6]:
# Bucle básico de ejecución
env = gym.make("BreakoutDeterministic-v4")
observation = env.reset()                    # resetear el entorno inicial
steps= 3000                                    # iteraciones a realizar dentro de la trayectoria limite máximo

for _ in range(steps):
    # renderizar - visualizar steps
    if not IN_COLAB:
        env.render()

    action = env.action_space.sample()       # seleccionamos accion aleatoria
    observation, reward, done, info = env.step(action)   # pasarle al entorno la accion seleccionada por el agente

    if done: 
        observation = env.reset()
env.close()

In [6]:
# bucle bueno para entrenar
env = gym.make("BreakoutDeterministic-v4")
observation = env.reset()

episodes = 100
steps_max = 1000

for episode in range(episodes): 
    done = False
    episode_rewar = 0   # calculamos la recompensa del episodio

    step_i = 0
    while not done: 
        step_i += 1
        # renderizar - visualizar steps
        if not IN_COLAB:
            env.render()

        # seleccionamos accion aleatoriamente
        action = env.action_space.sample()
        # Pasarel al etorno la accion seleccionada por el agente
        observation, reward, done, info = env.step(action)

        episode_rewar += reward

        if done: 
            observation = env.reset()
        if steps_max < step_i: 
            done= True
            observation = env.reset()

    print(f'Recompensa obtenida en el episodio: {episode_rewar}')
env.close()

Recompensa obtenida en el episodio: 1.0
Recompensa obtenida en el episodio: 2.0
Recompensa obtenida en el episodio: 1.0
Recompensa obtenida en el episodio: 0.0
Recompensa obtenida en el episodio: 0.0
Recompensa obtenida en el episodio: 1.0
Recompensa obtenida en el episodio: 0.0
Recompensa obtenida en el episodio: 1.0
Recompensa obtenida en el episodio: 0.0
Recompensa obtenida en el episodio: 2.0
Recompensa obtenida en el episodio: 0.0
Recompensa obtenida en el episodio: 0.0
Recompensa obtenida en el episodio: 2.0
Recompensa obtenida en el episodio: 1.0
Recompensa obtenida en el episodio: 0.0
Recompensa obtenida en el episodio: 3.0
Recompensa obtenida en el episodio: 0.0
Recompensa obtenida en el episodio: 1.0
Recompensa obtenida en el episodio: 0.0
Recompensa obtenida en el episodio: 1.0
Recompensa obtenida en el episodio: 0.0
Recompensa obtenida en el episodio: 1.0
Recompensa obtenida en el episodio: 1.0
Recompensa obtenida en el episodio: 2.0
Recompensa obtenida en el episodio: 2.0
