# Agente em um Labirinto com Pygame (Versão Google Colab)

Este notebook demonstra como criar um agente que navega aleatoriamente em um labirinto usando Pygame. O agente é representado como uma bola vermelha que se move em um tabuleiro 5x5, respeitando obstáculos no caminho.

> **Nota**: Esta é uma versão adaptada para funcionar no Google Colab, utilizando Matplotlib para visualizar o labirinto em vez de Pygame (que requer display gráfico).

## 1. Importar Bibliotecas Necessárias

Importamos as bibliotecas necessárias para o desenvolvimento do jogo, incluindo NumPy para manipulação de arrays, Pygame para gráficos e eventos, e sys para controle do sistema.

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches
from IPython.display import clear_output
import time

## 2. Definir o Ambiente (Labirinto)

Criamos um labirinto 5x5 onde:
- **0** representa caminhos livres (células brancas)
- **1** representa obstáculos (células azuis)

In [None]:
# Definindo o tamanho do ambiente (tabuleiro 2D)
n_rows, n_cols = 5, 5

# Definindo o labirinto (1 para obstáculos, 0 para caminhos livres)
maze = np.array([
    [0, 0, 0, 0, 0],
    [0, 1, 1, 1, 0],
    [0, 0, 0, 0, 0],
    [0, 1, 1, 1, 0],
    [0, 1, 0, 0, 0]
])

## 3. Inicializar Pygame e Configurar a Janela

Inicializamos o Pygame e criamos a janela do jogo com as dimensões apropriadas. Definimos também as cores que serão usadas para desenhar o labirinto e o agente.

In [None]:
# Configuração para melhor visualização no Colab
plt.style.use('default')

# Tamanho de cada célula em pixels (para visualização)
cell_size = 50

# Cores (em formato RGB normalizado para matplotlib)
white = (1, 1, 1)
blue = (135/255, 206/255, 250/255)
red = (1, 0, 0)
black = (0, 0, 0)

## 4. Definir Funções de Desenho

Essas funções são responsáveis por desenhar o labirinto e o agente na tela.

In [None]:
# Função para desenhar o labirinto e o agente
def visualize_maze(agent_position, step=None):
    """
    Desenha o labirinto com o agente usando matplotlib
    """
    fig, ax = plt.subplots(1, 1, figsize=(6, 6))
    
    # Desenhar o labirinto
    for row in range(n_rows):
        for col in range(n_cols):
            if maze[row, col] == 0:
                color = white
                rect = patches.Rectangle((col, row), 1, 1, linewidth=1, 
                                        edgecolor='black', facecolor=color)
            else:
                color = blue
                rect = patches.Rectangle((col, row), 1, 1, linewidth=1, 
                                        edgecolor='black', facecolor=color)
            ax.add_patch(rect)
    
    # Desenhar o agente (círculo vermelho)
    agent_circle = patches.Circle((agent_position[1] + 0.5, agent_position[0] + 0.5), 
                                 0.3, color=red, zorder=5)
    ax.add_patch(agent_circle)
    
    # Configurar os eixos
    ax.set_xlim(0, n_cols)
    ax.set_ylim(n_rows, 0)  # Invertido para corresponder ao array
    ax.set_aspect('equal')
    ax.set_xticks(range(n_cols + 1))
    ax.set_yticks(range(n_rows + 1))
    ax.grid(True, alpha=0.3)
    
    # Título
    if step is not None:
        ax.set_title(f'Agente em um Labirinto - Passo {step}', fontsize=14, fontweight='bold')
    else:
        ax.set_title('Agente em um Labirinto', fontsize=14, fontweight='bold')
    
    plt.tight_layout()
    plt.show()

## 5. Definir Funções de Ação e Movimento

O agente escolhe ações aleatoriamente (cima, baixo, esquerda, direita) e atualiza sua posição apenas se a ação for válida (não colidir com obstáculos ou sair do mapa).

In [None]:
# Função para movimentar o agente aleatoriamente
def take_random_action():
    return np.random.choice(['up', 'down', 'left', 'right'])

# Função para atualizar a posição do agente com base na ação
def update_position(current_position, action):
    if action == 'down' and current_position[0] > 0 and maze[current_position[0] - 1, current_position[1]] == 0:
        return [current_position[0] - 1, current_position[1]]
    elif action == 'up' and current_position[0] < n_rows - 1 and maze[current_position[0] + 1, current_position[1]] == 0:
        return [current_position[0] + 1, current_position[1]]
    elif action == 'left' and current_position[1] > 0 and maze[current_position[0], current_position[1] - 1] == 0:
        return [current_position[0], current_position[1] - 1]
    elif action == 'right' and current_position[1] < n_cols - 1 and maze[current_position[0], current_position[1] + 1] == 0:
        return [current_position[0], current_position[1] + 1]
    else:
        return current_position

## 6. Configurar Variáveis do Jogo

Definimos o número de passos que o agente dará e a posição inicial do agente no labirinto.

In [None]:
# Número de passos que o agente dará
num_steps = 20

# Definindo a posição inicial do agente
agent_position = [0, 0]

## 7. Loop Principal do Jogo

O loop principal executa o jogo para o número de passos especificado. A cada iteração:
1. O agente escolhe uma ação aleatória
2. A posição do agente é atualizada
3. O labirinto e o agente são desenhados
4. A tela é atualizada
5. Informações sobre o movimento são exibidas
6. O jogo aguarda 500ms antes do próximo passo

In [None]:
# Loop principal do jogo
print("="*60)
print("Simulação: Agente Navegando em um Labirinto")
print("="*60)
print()

for step in range(num_steps):
    # Movimento aleatório do agente
    action = take_random_action()
    previous_position = agent_position.copy()
    agent_position = update_position(agent_position, action)

    # Imprime a posição atual, ação tomada e posição final do agente
    print(f"Step {step:2d}: Ação = {action:6s} | De {previous_position} → {agent_position}")

print()
print("="*60)
print("Simulação Concluída!")
print("="*60)

# Visualizar a posição final do agente
print("\nPosição final do agente:")
visualize_maze(agent_position, step=num_steps-1)