In [None]:
import numpy as np
import random

# Função de avaliação do fitness do agente
def fitness_function(agent):
    position = (0, 0)
    score = 0
    path = [position]

    for move in agent:
        new_pos, movement = agent_random_mov(wumpus_world, position)
        path.append(new_pos)
        if new_pos == (0, 0):
            score += 1000  # Pontuação por voltar à posição inicial
        else:
            score -= 1  # Penalidade por movimentação

        if wumpus_world[new_pos[0], new_pos[1]] == 2:
            score -= 1000  # Penalidade por cair no poço
            break
        elif wumpus_world[new_pos[0], new_pos[1]] == 3:
            score -= 1000  # Penalidade por ser pego pelo Wumpus
            break
        elif wumpus_world[new_pos[0], new_pos[1]] == 1:
            score += 1000  # Pontuação por pegar o ouro
            break

        position = new_pos

    return score

# Função de crossover
def crossover(parent1, parent2):
    crossover_point = random.randint(1, len(parent1) - 1)
    return parent1[:crossover_point] + parent2[crossover_point:]

# Função de mutação
def mutate(agent):
    mutation_point = random.randint(0, len(agent) - 1)
    directions = ['up', 'down', 'right', 'left']
    agent[mutation_point] = random.choice(directions)
    return agent

# Inicializa a população
def initialize_population(size):
    return [[random.choice(['up', 'down', 'right', 'left']) for _ in range(num_moves)] for _ in range(size)]

# Seleção dos melhores indivíduos
def select_population(population, scores, num_parents):
    selected_indices = np.argsort(scores)[-num_parents:]
    return [population[i] for i in selected_indices]



In [None]:
# Configurações do algoritmo genético
population_size = 50
num_generations = 1000
crossover_rate = 0.85
mutation_rate = 0.05
num_moves = 50  # Número máximo de movimentos que um agente pode fazer

In [None]:
# Inicializa o ambiente
cols, rows = 20,20
total_pit = 3
wumpus_world = np.zeros((rows, cols), dtype=int)
wumpus_world[0, 0] = 5  # Agente começa na posição [0,0]

possible_positions = np.arange(1, rows * cols)
pit_random_positions = np.random.choice(possible_positions, total_pit, replace=False)



for pos in pit_random_positions:
    row = pos // cols
    col = pos % cols
    wumpus_world[row, col] = 3

remaining_pos_wumps_gold = np.setdiff1d(possible_positions, pit_random_positions)
np.random.shuffle(remaining_pos_wumps_gold)
pos_random_wumpus_gold = remaining_pos_wumps_gold[:2]

for pos, content in zip(pos_random_wumpus_gold, [1, 2]):
    row = pos // cols
    col = pos % cols
    wumpus_world[row, col] = content


In [None]:
# Inicializa a população
population = initialize_population(population_size)

In [None]:
# Executa o algoritmo genético
results = []
for execution_ag in range(20):

  for generation in range(num_generations):
      # Avalia a população
      scores = [fitness_function(agent) for agent in population]

      # Calcula estatísticas
      best_score = max(scores)
      worst_score = min(scores)
      average_score = np.mean(scores)

      # Exibe estatísticas da geração
      print(f"Geração {generation + 1}: Melhor pontuação = {best_score}, Pior pontuação = {worst_score}, Pontuação média = {average_score:.2f}")

      # Seleciona os melhores indivíduos
      parents = select_population(population, scores, population_size // 2)

      # Cria a próxima geração
      next_generation = []
      while len(next_generation) < population_size:
          if random.random() < crossover_rate:
              parent1 = random.choice(parents)
              parent2 = random.choice(parents)
              child = crossover(parent1, parent2)
          else:
              child = random.choice(parents)

          if random.random() < mutation_rate:
              child = mutate(child)

          next_generation.append(child)

      population = next_generation


  # Avalia a população final
  final_scores = [fitness_function(agent) for agent in population]
  best_agent = population[np.argmax(final_scores)]

  print("\nResultados Finais:")
  print("Melhor agente encontrado:", best_agent)
  print("Pontuação do melhor agente:", max(final_scores))
  print("Pontuação do pior agente:", min(final_scores))
  print("Pontuação média dos agentes:", np.mean(final_scores))

  results.append("\nResultados Finais:")
  results.append("Exedcução:" + str(execution_ag + 1))
  results.append(f"Melhor agente encontrado: {best_agent}")
  results.append(f"Pontuação do melhor agente: {max(final_scores)}")
  results.append(f"Pontuação do pior agente: {min(final_scores)}")
  results.append(f"Pontuação média dos agentes: {np.mean(final_scores):.2f}")

  results.append("\n")

import json

with open('resultados_algoritmo_genetico_10.json', 'w') as arquivo:
    json.dump(results, arquivo, indent=4)

print("Resultados salvos no arquivo 'resultados_algoritmo_genetico.json'")



[1;30;43mA saída de streaming foi truncada nas últimas 5000 linhas.[0m
Geração 32: Melhor pontuação = 15966, Pior pontuação = -1047, Pontuação média = 3315.02
Geração 33: Melhor pontuação = 16967, Pior pontuação = -1024, Pontuação média = 2955.20
Geração 34: Melhor pontuação = 11962, Pior pontuação = -1026, Pontuação média = 3594.82
Geração 35: Melhor pontuação = 17968, Pior pontuação = -1037, Pontuação média = 4375.36
Geração 36: Melhor pontuação = 13964, Pior pontuação = -1049, Pontuação média = 4077.82
Geração 37: Melhor pontuação = 12963, Pior pontuação = -1046, Pontuação média = 4237.10
Geração 38: Melhor pontuação = 13964, Pior pontuação = -1032, Pontuação média = 3996.10
Geração 39: Melhor pontuação = 18969, Pior pontuação = -1026, Pontuação média = 3614.96
Geração 40: Melhor pontuação = 15966, Pior pontuação = -50, Pontuação média = 4197.20
Geração 41: Melhor pontuação = 15966, Pior pontuação = -1037, Pontuação média = 3017.84
Geração 42: Melhor pontuação = 26977, Pior pontua