## Random action CartPole
---

Vamos a utilizar uno de los _wrapper_ de la clase **Environment**, en este caso **_ActionWrapper_**, para crear un entorno que, de forma automática y con un propabilidad _epsilon_, sustituya algunas de las acciones recibidas por el agente (step) por una acción obtenida al azar del espacio de acciones

In [3]:
import gym
import random

class RandomActionWrapper(gym.ActionWrapper):
    def __init__(self, env, epsilon=0.1):
        super().__init__(env)
        self.epsilon = epsilon
        
    def action(self, action):
        if random.random() < self.epsilon:
            print("Random action!")
            return(self.env.action_space.sample())
        return action

Nuestra nueva clase pasa el entorno recibido a su clase padre (_ActionWrapper_) y sobre escribe el método **action()**. Este método será invocado de forma transparente cada vez que llamemos al método **step()** del entorno. Dependiendo de la probabilidad que se haya definido, sustituirá la acción recibida por otra obtenida de forma aleatoria

In [9]:
env = RandomActionWrapper(gym.make("CartPole-v1"))

obs = env.reset()
total_reward = 0.0

while True:
    env.render()
    obs, reward, done, _ = env.step(0)
    total_reward += reward
    if done:
        break
        
print(f'Reward: {total_reward:.2f}')

env.close()

Random action!
Reward: 9.00
