# O Jogo do Mundo de Wumpus

## Introdução

O Mundo de Wumpus é um jogo de tabuleiro simulado que serve como um ambiente de teste padrão para algoritmos de raciocínio e aprendizado em IA. O jogo foi introduzido por Gregory Yob em 1973 e, desde então, tornou-se um exemplo clássico usado para ensinar conceitos de IA, especialmente em lógica proposicional e raciocínio sob incerteza.

## Objetivo do Jogo

O jogador controla um agente (o explorador) cujo objetivo é encontrar um tesouro escondido em um mundo cavernoso e sair vivo. O mundo é composto por uma grade de salas conectadas por passagens. O jogador deve evitar ou neutralizar perigos como poços e o temido Wumpus, uma criatura que habita uma das salas.

## Regras do Jogo

1. **Ambiente de Grelha**: O mundo é uma grade quadrada 4x4, onde cada quadrado pode conter um poço, o Wumpus, ouro, ou nada. As salas (células da matriz 4x4) são conectadas na vertical e na horizontal. O agente inicia na posição [1,1] que é a entrada e saída da caverna.

2. **Percepções**:
   - **Brisa**: Sentida em quadrados adjacentes a poços.
   - **Fedor**: Sentida em quadrados adjacentes ao Wumpus.
   - **Brilho**: O ouro está no mesmo quadrado.
   - **Bump**: O agente tentou se mover através de uma parede.
   - **Grito**: O Wumpus foi morto.

3. **Ações do Agente**:
   - **Mover-se** para frente.
   - **Virar à esquerda** ou **à direita**.
   - **Atirar** uma flecha na direção que está olhando (o agente tem apenas uma flecha).
   - **Pegar** o ouro.
   - **Sair** do mundo, uma vez que o ouro tenha sido coletado.

4. **Condições de Encerramento**:
   - O agente pega o ouro e sai da caverna.
   - O agente cai em um poço ou é devorado pelo Wumpus.
   - O agente decide deixar a caverna sem o ouro.

5. **Medida de desempenho**:
   - **+1000** por pegar o ouro.
   - **-1000** se cair e um poço oou for devorado pelo Wumpus.
   - **-1** para cada ação executada.
   - **-10** pelo uso da flecha.

In [2]:
class WumpusWorld:
    def __init__(self, size=4):
        self.size = size  # Tamanho do tabuleiro (size x size)
        self.board = [[None for _ in range(size)] for _ in range(size)]  # Cria o tabuleiro
        self.agent = {'x': 0, 'y': 0, 'direction': 'north'}  # Posição e direção inicial do agente
        self.wumpus = {'x': 1, 'y': 1}  # Localização do Wumpus
        self.pits = []                  # Lista de localizações dos poços
        self.gold = {'x': 3, 'y': 3}    # Localização do ouro
        self.has_gold = False           # O agente tem o ouro?
        self.arrows = 1                 # Flechas disponíveis

    def move_forward(self):
        # Função para mover o agente para frente
        pass

    def turn_left(self):
        # Função para virar o agente à esquerda
        pass

    def turn_right(self):
        # Função para virar o agente à direita
        pass

    def shoot_arrow(self):
        # Função para atirar uma flecha
        pass

    def pick_gold(self):
        # Função para pegar o ouro
        pass

    def check_perceptions(self):
        # Função para gerar percepções baseadas na localização atual do agente
        pass

    def check_game_state(self):
        # Função para verificar o estado do jogo
        pass

# Exemplo de criação de uma instância do jogo
game = WumpusWorld()


In [27]:
import numpy as np

m = np.random.rand(4, 4)

def print_float_matrix(M):
    for row in M:
        for cell in row:
            print(f"{cell:>5.2f}", end=" ")
        print()

print('float matrix')
print_float_matrix(m)

m = np.random.randint(1, 100, size=(4, 4))

def print_int_matrix(M):
    for row in M:
        for cell in row:
            print(f"{cell:>5}", end=" ")
        print()

print('\nint matrix')
print_int_matrix(m)

float matrix
 0.86  0.28  0.22  0.03 
 0.62  0.40  0.50  0.85 
 0.96  0.05  0.39  0.45 
 0.14  0.90  0.33  0.05 

int matrix
    4    23    49    88 
   34    64    74    57 
   21    21    98     4 
   46    39    70    70 


In [51]:
import itertools

def probabilityDistribution(S, M, n_dangers=3, n_rows=4, n_cols=4):
    # Conjunto de todas as células
    B = {(i, j) for i in range(n_rows) for j in range(n_cols)}

    # Conjunto das células possíveis para perigos (não seguras)
    uS = B - S

    def is_valid_combination(C, M):        
        adjC = set()
        for cell in C:
            for elem in get_adjacent_cells(cell):
                adjC.add(elem)

        for i in range(n_rows):
            for j in range(n_cols):
                if (i,j) in M and (i,j) not in adjC:
                    return False
                
        return True

    def get_adjacent_cells(cell):
        i, j = cell
        adjacent = [(i-1, j), (i+1, j), (i, j-1), (i, j+1)]
        return [(x, y) for x, y in adjacent if 0 <= x < n_rows and 0 <= y < n_cols]

    V = [c for c in itertools.combinations(uS, n_dangers) if is_valid_combination(c, M)]

    print(f"number of valid combinations: {len(V)}")

    if len(V) <= 6:
        for C in V:
            print(C)
            m = [[0 for _ in range(n_rows)] for _ in range(n_cols)]
            for c in C:
                m[c[0]][c[1]]=1
            print_int_matrix(m)    
        

    def calculate_probability(cell, V):
        count = sum(1 for C in V if cell in C)
        return count / len(V)

    probabilities = [[0.0 for _ in range(n_cols)] for _ in range(n_rows)]

    for cell in uS:
        probabilities[cell[0]][cell[1]] = calculate_probability(cell, V)

    print_float_matrix(probabilities)

In [53]:
# Conjunto de células seguras
S = {(0, 0), (0, 1), (1, 0)}

# Conjunto de células visitadas com indicação de perigo
M = set()

probabilityDistribution(S, M)

number of valid combinations: 286
 0.00  0.00  0.23  0.23 
 0.00  0.23  0.23  0.23 
 0.23  0.23  0.23  0.23 
 0.23  0.23  0.23  0.23 


In [54]:
S = {(0,0), (0,1), (1,0), (1,1), (2,0), (2,1)}

M = {(0,1)}

probabilityDistribution(S,M)

number of valid combinations: 36
 0.00  0.00  1.00  0.22 
 0.00  0.00  0.22  0.22 
 0.00  0.00  0.22  0.22 
 0.22  0.22  0.22  0.22 


In [58]:
S = {(0,0), (0,1), (1,0), (1,1), (2,0), (2,1), (1,2)}

M = {(0,1), (2,0), (1,2)}

probabilityDistribution(S,M)

number of valid combinations: 7
 0.00  0.00  1.00  0.14 
 0.00  0.00  0.00  0.14 
 0.00  0.00  0.14  0.14 
 1.00  0.14  0.14  0.14 


In [60]:
S = {(0,0), (0,1), (1,0), (1,1), (2,0), (2,1), (1,2), (2,2), (2,1), (3,1)}

M = {(0,1), (2,0)}

probabilityDistribution(S,M)

number of valid combinations: 5
((0, 3), (3, 0), (0, 2))
    0     0     1     1 
    0     0     0     0 
    0     0     0     0 
    1     0     0     0 
((3, 0), (2, 3), (0, 2))
    0     0     1     0 
    0     0     0     0 
    0     0     0     1 
    1     0     0     0 
((3, 0), (0, 2), (3, 3))
    0     0     1     0 
    0     0     0     0 
    0     0     0     0 
    1     0     0     1 
((3, 0), (0, 2), (3, 2))
    0     0     1     0 
    0     0     0     0 
    0     0     0     0 
    1     0     1     0 
((3, 0), (0, 2), (1, 3))
    0     0     1     0 
    0     0     0     1 
    0     0     0     0 
    1     0     0     0 
 0.00  0.00  1.00  0.20 
 0.00  0.00  0.00  0.20 
 0.00  0.00  0.00  0.20 
 1.00  0.00  0.20  0.20 


In [None]:
S = {(0,0), (0,1), (1,0), (1,1), (2,0), (2,1), (1,2), (2,2), (2,1), (3,1)}

M = {(0,1), (2,0)}

probabilityDistribution(S,M)