# FrozenLake Game - Visualiza√ß√£o com Matplotlib

Este notebook demonstra o ambiente FrozenLake, onde um agente deve navegar de um ponto de partida (0,0) at√© o objetivo (3,3), evitando buracos (c√©lulas azuis).

**Legenda:**
- ‚¨ú Branco: Caminho livre
- üü¶ Azul: Buraco (meleca)
- üü© Verde: Objetivo
- üî¥ Vermelho: Agente

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches
from IPython.display import clear_output
import pandas as pd

## 1. Definindo o Ambiente FrozenLake

Criamos um mapa 4x4 onde:
- `0` = Caminho livre
- `1` = Buraco (meleca/obst√°culo)
- `2` = Objetivo

In [None]:
# Definindo o tamanho do ambiente (tabuleiro 2D)
n_rows, n_cols = 4, 4

# Criando o mapa FrozenLake (0 para caminhos livres, 1 para buracos, 2 para o objetivo)
frozen_lake_map = np.array([
    [0, 0, 0, 0],
    [0, 1, 0, 1],
    [0, 0, 0, 0],
    [0, 1, 0, 2]
])

print("Mapa do FrozenLake:")
print(frozen_lake_map)
print("\nLegenda: 0=Livre, 1=Buraco, 2=Objetivo")

## 2. Fun√ß√£o para Desenhar o Tabuleiro

Renderizamos o ambiente usando matplotlib para visualiza√ß√£o no Colab.

In [None]:
# Fun√ß√£o para desenhar o tabuleiro do FrozenLake com matplotlib
def draw_frozen_lake(agent_position, title="FrozenLake Game", show_path=None):
    fig, ax = plt.subplots(1, 1, figsize=(6, 6))
    
    # Desenha o mapa
    for row in range(n_rows):
        for col in range(n_cols):
            if frozen_lake_map[row, col] == 0:
                color = 'white'
            elif frozen_lake_map[row, col] == 1:
                color = 'lightblue'
            elif frozen_lake_map[row, col] == 2:
                color = 'lightgreen'
            
            rect = patches.Rectangle((col, n_rows - 1 - row), 1, 1, 
                                     linewidth=2, edgecolor='black', 
                                     facecolor=color)
            ax.add_patch(rect)
    
    # Desenha o caminho percorrido (opcional)
    if show_path is not None:
        for i in range(len(show_path) - 1):
            x1 = show_path[i][1] + 0.5
            y1 = n_rows - 1 - show_path[i][0] + 0.5
            x2 = show_path[i+1][1] + 0.5
            y2 = n_rows - 1 - show_path[i+1][0] + 0.5
            ax.plot([x1, x2], [y1, y2], 'b-', alpha=0.3, linewidth=2)
    
    # Desenha o agente (c√≠rculo vermelho)
    agent_x = agent_position[1] + 0.5
    agent_y = n_rows - 1 - agent_position[0] + 0.5
    circle = patches.Circle((agent_x, agent_y), 0.2, color='red', zorder=5)
    ax.add_patch(circle)
    
    # Configurar o eixo
    ax.set_xlim(0, n_cols)
    ax.set_ylim(0, n_rows)
    ax.set_aspect('equal')
    ax.set_xticks(range(n_cols + 1))
    ax.set_yticks(range(n_rows + 1))
    ax.set_xticklabels([])
    ax.set_yticklabels([])
    ax.set_title(title, fontsize=14, fontweight='bold')
    ax.invert_yaxis()
    
    # Adicionar grid
    ax.grid(True, which='both', color='black', linewidth=0.5)
    
    plt.tight_layout()
    return fig

# Testando a fun√ß√£o com posi√ß√£o inicial
agent_position = [0, 0]
draw_frozen_lake(agent_position, "Posi√ß√£o Inicial do Agente")
plt.show()

## 3. Fun√ß√£o para Movimentar o Agente

Define como o agente se move no ambiente.

In [None]:
# Fun√ß√£o para movimentar o agente com base na a√ß√£o
def move_agent(current_position, action):
    """
    Move o agente em uma dire√ß√£o espec√≠fica.
    
    Args:
        current_position: Lista [row, col] com posi√ß√£o atual
        action: String indicando a dire√ß√£o ('up', 'down', 'left', 'right')
    """
    if action == 'down' and current_position[0] < n_rows - 1:
        current_position[0] += 1
    elif action == 'up' and current_position[0] > 0:
        current_position[0] -= 1
    elif action == 'left' and current_position[1] > 0:
        current_position[1] -= 1
    elif action == 'right' and current_position[1] < n_cols - 1:
        current_position[1] += 1

print("Fun√ß√£o de movimento definida!")

## 4. Executando a Simula√ß√£o com Rastreamento de Todos os Passos

O agente faz movimentos aleat√≥rios e rastreamos cada etapa.

In [None]:
# N√∫mero de passos que o agente dar√°
num_steps = 20

# Posi√ß√£o inicial do agente
agent_position = [0, 0]

# Listas para rastrear todos os passos
positions_history = [agent_position.copy()]  # Posi√ß√µes visitadas
actions_history = []                          # A√ß√µes tomadas
step_counter = 0                              # Contador de passos

print("\n" + "="*70)
print("INICIANDO SIMULA√á√ÉO DO FROZENLAKE")
print("="*70 + "\n")

# Simula√ß√£o do jogo
for step in range(num_steps):
    # Escolhe uma a√ß√£o aleat√≥ria
    action = np.random.choice(['up', 'down', 'left', 'right'])
    actions_history.append(action)
    
    # Posi√ß√£o antes do movimento
    previous_position = agent_position.copy()
    
    # Move o agente
    move_agent(agent_position, action)
    
    # Adiciona a nova posi√ß√£o ao hist√≥rico
    positions_history.append(agent_position.copy())
    step_counter += 1
    
    # Verifica o tipo de c√©lula
    cell_type = frozen_lake_map[agent_position[0], agent_position[1]]
    
    if cell_type == 1:
        print(f"‚ùå Passo {step_counter}: {previous_position} ‚Üí {agent_position} (a√ß√£o: {action.upper()}) = BURACO!")
        agent_position = [0, 0]
        positions_history = [[0, 0]]
        
    elif cell_type == 2:
        print(f"üéâ Passo {step_counter}: {previous_position} ‚Üí {agent_position} (a√ß√£o: {action.upper()}) = OBJETIVO!")
        agent_position = [0, 0]
        positions_history = [[0, 0]]
    else:
        print(f"‚úì  Passo {step_counter}: {previous_position} ‚Üí {agent_position} (a√ß√£o: {action.upper()})")

print(f"\n‚úì Simula√ß√£o conclu√≠da!")
print(f"Total de passos realizados: {step_counter}")
print(f"Total de posi√ß√µes visitadas: {len(positions_history)}")

## 5. Visualiza√ß√£o Gr√°fica de Cada Passo

Mostra uma grade com v√°rios momentos da simula√ß√£o.

In [None]:
# Mostrar alguns passos selecionados em uma grade
steps_to_show = min(12, len(positions_history))  # Mostrar at√© 12 passos

fig, axes = plt.subplots(3, 4, figsize=(16, 12))
axes = axes.flatten()

# Distribuir os passos uniformemente ao longo da simula√ß√£o
indices = np.linspace(0, len(positions_history) - 1, steps_to_show, dtype=int)

for idx, step_idx in enumerate(indices):
    ax = axes[idx]
    pos = positions_history[step_idx]
    
    # Desenha o mapa completo
    for row in range(n_rows):
        for col in range(n_cols):
            if frozen_lake_map[row, col] == 0:
                color = 'white'
            elif frozen_lake_map[row, col] == 1:
                color = 'lightblue'
            elif frozen_lake_map[row, col] == 2:
                color = 'lightgreen'
            
            rect = patches.Rectangle((col, n_rows - 1 - row), 1, 1, 
                                     linewidth=1, edgecolor='black', 
                                     facecolor=color)
            ax.add_patch(rect)
    
    # Desenha o agente
    agent_x = pos[1] + 0.5
    agent_y = n_rows - 1 - pos[0] + 0.5
    circle = patches.Circle((agent_x, agent_y), 0.2, color='red', zorder=5)
    ax.add_patch(circle)
    
    # Adiciona texto com posi√ß√£o
    ax.text(0.5, -0.3, f'Posi√ß√£o: ({pos[0]}, {pos[1]})', 
           transform=ax.transAxes, ha='center', fontsize=10, fontweight='bold')
    
    # Configurar o eixo
    ax.set_xlim(0, n_cols)
    ax.set_ylim(0, n_rows)
    ax.set_aspect('equal')
    ax.set_xticks([])
    ax.set_yticks([])
    ax.set_title(f"Passo {step_idx}", fontweight='bold', fontsize=12)
    ax.invert_yaxis()
    ax.grid(True, which='both', color='gray', linewidth=0.5, alpha=0.3)

plt.suptitle('Sequ√™ncia de Passos Selecionados do Agente', fontsize=16, fontweight='bold', y=0.995)
plt.tight_layout()
plt.show()

## 6. Visualiza√ß√£o do Caminho Completo

Mostra o caminho total percorrido pelo agente em um √∫nico gr√°fico com numera√ß√£o.

In [None]:
fig, ax = plt.subplots(1, 1, figsize=(10, 10))

# Desenha o mapa
for row in range(n_rows):
    for col in range(n_cols):
        if frozen_lake_map[row, col] == 0:
            color = 'white'
        elif frozen_lake_map[row, col] == 1:
            color = 'lightblue'
        elif frozen_lake_map[row, col] == 2:
            color = 'lightgreen'
        
        rect = patches.Rectangle((col, n_rows - 1 - row), 1, 1, 
                                 linewidth=2, edgecolor='black', 
                                 facecolor=color)
        ax.add_patch(rect)

# Desenha o caminho percorrido com cores gradientes
for i in range(len(positions_history) - 1):
    x1 = positions_history[i][1] + 0.5
    y1 = n_rows - 1 - positions_history[i][0] + 0.5
    x2 = positions_history[i+1][1] + 0.5
    y2 = n_rows - 1 - positions_history[i+1][0] + 0.5
    
    # Cor muda a cada passo (mais escuro conforme progride)
    alpha = (i + 1) / max(len(positions_history), 2)
    ax.arrow(x1, y1, x2-x1, y2-y1, head_width=0.1, head_length=0.1,
            fc=(0, 0.2, 0.5), ec=(0, 0.2, 0.5), alpha=alpha, linewidth=2.5)

# Marca a posi√ß√£o inicial
ax.plot(0.5, n_rows - 0.5, 'g*', markersize=30, label='In√≠cio', zorder=10)

# Marca a posi√ß√£o final
final_pos = positions_history[-1]
final_x = final_pos[1] + 0.5
final_y = n_rows - 1 - final_pos[0] + 0.5
ax.plot(final_x, final_y, 'r*', markersize=30, label='Final', zorder=10)

# Configurar o eixo
ax.set_xlim(0, n_cols)
ax.set_ylim(0, n_rows)
ax.set_aspect('equal')
ax.set_xticks(range(n_cols + 1))
ax.set_yticks(range(n_rows + 1))
ax.set_xticklabels([])
ax.set_yticklabels([])
ax.set_title('Caminho Completo do Agente (com Setas)', fontsize=14, fontweight='bold')
ax.invert_yaxis()
ax.grid(True, which='both', color='black', linewidth=0.5)
ax.legend(loc='upper left', fontsize=12)

plt.tight_layout()
plt.show()

## 7. Tabela de Todos os Passos

Visualiza cada passo em formato de tabela.

In [None]:
# Criar DataFrame com todos os dados dos passos
data_steps = []

for i, pos in enumerate(positions_history):
    if i < len(actions_history):
        action = actions_history[i].upper()
    else:
        action = '-'
    
    cell_type = frozen_lake_map[pos[0], pos[1]]
    
    if cell_type == 0:
        cell_status = 'Caminho Livre'
    elif cell_type == 1:
        cell_status = '‚ö†Ô∏è BURACO'
    elif cell_type == 2:
        cell_status = '‚úì OBJETIVO'
    
    data_steps.append({
        'Passo': i,
        'Linha': pos[0],
        'Coluna': pos[1],
        'Posi√ß√£o': f'({pos[0]}, {pos[1]})',
        'A√ß√£o': action,
        'Tipo de C√©lula': cell_status
    })

df_steps = pd.DataFrame(data_steps)

print("\n" + "="*80)
print("TABELA COMPLETA DE TODOS OS PASSOS REALIZADOS")
print("="*80 + "\n")
print(df_steps.to_string(index=False))

## 8. Estat√≠sticas Detalhadas da Simula√ß√£o

An√°lise completa do comportamento do agente.

In [None]:
# Contar a√ß√µes
actions_count = {}
for action in actions_history:
    actions_count[action] = actions_count.get(action, 0) + 1

# Posi√ß√µes √∫nicas visitadas
unique_positions = len(set(map(tuple, positions_history)))

print("\n" + "="*80)
print("ESTAT√çSTICAS DETALHADAS DA SIMULA√á√ÉO")
print("="*80)

print(f"\nüìä Informa√ß√µes Gerais:")
print(f"   ‚Ä¢ Total de passos planejados: {num_steps}")
print(f"   ‚Ä¢ Total de passos realizados: {len(actions_history)}")
print(f"   ‚Ä¢ Total de posi√ß√µes no hist√≥rico: {len(positions_history)}")
print(f"   ‚Ä¢ Posi√ß√µes √öNICAS visitadas: {unique_positions}")
print(f"   ‚Ä¢ Posi√ß√£o final: {positions_history[-1]}")

print(f"\nüéØ Distribui√ß√£o de A√ß√µes (Movimentos):")
total_actions = len(actions_history)
for direction in ['up', 'down', 'left', 'right']:
    count = actions_count.get(direction, 0)
    percentage = (count / total_actions) * 100 if total_actions > 0 else 0
    bar = "‚ñà" * int(percentage / 5) + "‚ñë" * (20 - int(percentage / 5))
    print(f"   {direction.upper():6} : {count:2} vezes ({percentage:5.1f}%) {bar}")

print(f"\n" + "="*80)