In [None]:
### 4.2. Análisis gráfico de los entrenamientos y sus resultados

Para poder evaluar el impacto de los cambios en cada uno de los experimentos que hemos realizado, 
hemos unificado la forma de visualización de dichos resultados a través de gráficas que nos muestran la evolución 
de los distintos parámetros: Mean-Q, MAE, Loss, Reward, Steps y Duration.

Todos esta información la obtenemos del fichero JSON generado durante el entrenamiento.

Mostramos a continuación las gráficas obtenidas para el mejor modelo experimentado.

In [None]:
# Función pra leer el json resultante del entrenamiento
def read_json_log(file_path):
    with open(file_path, 'r') as f:
        try:
            logs = json.load(f)
        except json.JSONDecodeError as e:
            print(f"Error leyendo el archivo JSON: {e}")
            return None
    return logs

# Función para imprimir las gráficas de las variables que nos interesan de los logs obtenidos
def plot_training_log(logs):
    if logs is None:
        print("No se pudo leer el archivo JSON.")
        return

    try:
        episodes = list(range(1, len(logs['loss']) + 1))
        losses = logs['loss']
        mean_qs = logs['mean_q']
        maes = logs['mae']
        rewards = logs['episode_reward']
        nb_episode_steps = logs['nb_episode_steps']
        durations = logs['duration']
    except KeyError as e:
        print(f"No se encuentra la clar en los datos de log: {e}")
        return

    fig, axs = plt.subplots(2, 3, figsize=(15, 10))

    # Plot para Mean Q
    axs[0, 0].plot(episodes, mean_qs, 'tab:blue')
    axs[0, 0].set_title('Mean Q')
    axs[0, 0].set_xlabel('Episodes')
    axs[0, 0].set_ylabel('Mean Q')

    # Plot para MAE
    axs[0, 1].plot(episodes, maes, 'tab:red')
    axs[0, 1].set_title('MAE')
    axs[0, 1].set_xlabel('Episodes')
    axs[0, 1].set_ylabel('MAE')

    # Plot para Loss con tendencia polinomial
    axs[0, 2].plot(episodes, losses, 'tab:green')
    axs[0, 2].set_title('Loss')
    axs[0, 2].set_xlabel('Episodes')
    axs[0, 2].set_ylabel('Loss')
    
    # Ajuste polinomial de grado 3 para la tendencia
    z_loss = np.polyfit(episodes, losses, 3)
    p_loss = np.poly1d(z_loss)
    axs[0, 2].plot(episodes, p_loss(episodes), "r--", label='Tendencia')
    axs[0, 2].legend()

    # Plot para Episode Reward con tendencia polinomial
    axs[1, 0].plot(episodes, rewards, 'tab:purple')
    axs[1, 0].set_title('Episode Reward')
    axs[1, 0].set_xlabel('Episodes')
    axs[1, 0].set_ylabel('Episode Reward')
    
    # Ajuste polinomial de grado 3 para la tendencia
    z_reward = np.polyfit(episodes, rewards, 3)
    p_reward = np.poly1d(z_reward)
    axs[1, 0].plot(episodes, p_reward(episodes), "r--", label='Tendencia')
    axs[1, 0].legend()

    # Plot para Nb Episode Steps con tendencia polinomial
    axs[1, 1].plot(episodes, nb_episode_steps, 'tab:orange')
    axs[1, 1].set_title('Nb Episode Steps')
    axs[1, 1].set_xlabel('Episodes')
    axs[1, 1].set_ylabel('Nb Episode Steps')
    
    # Ajuste polinomial de grado 3 para la tendencia
    z_steps = np.polyfit(episodes, nb_episode_steps, 3)
    p_steps = np.poly1d(z_steps)
    axs[1, 1].plot(episodes, p_steps(episodes), "r--", label='Tendencia')
    axs[1, 1].legend()

    # Plot para Duration con tendencia polinomial
    axs[1, 2].plot(episodes, durations, 'tab:brown')
    axs[1, 2].set_title('Duration')
    axs[1, 2].set_xlabel('Episodes')
    axs[1, 2].set_ylabel('Duration')
    
    # Ajuste polinomial de grado 3 para la tendencia
    z_duration = np.polyfit(episodes, durations, 3)
    p_duration = np.poly1d(z_duration)
    axs[1, 2].plot(episodes, p_duration(episodes), "r--", label='Tendencia')
    axs[1, 2].legend()

    # Añadimos el título y pintamos las gráficas
    fig.tight_layout()
    plt.suptitle('Training Progress', y=1.02)
    plt.show()

# Leemos los logs desde el archivo JSON que indicamos
log_file = 'best_dqn_{}_log_extend.json'.format(env_name)
logs = read_json_log(log_file)

# Llamamos a la función que hace el plot con los datos del log
plot_training_log(logs)