# Definição do agente do jogo Pacman

Baseamos nossa escolha de agente como um pacman que decide o próximo passo a ser dado ao analisar em seu estado atual qual a posição de todos os fantasmas, do fantasma mais próximo, das comidas dentro de um raio e da comida mais próxima.

In [1]:
from pacman import GameState,readCommand
from collections import Counter
from game import Agent
from game import Directions
from util import manhattanDistance
from heuristic import heuristicDistance
import pacman
import random
import numpy

class theBestAgentOnEarth(Agent):
    '''O melhor agente da Terra que recebe pesos para a relevância de funções de busca, como
    a posição da melhor comida, do fantasma mais próximo, etc, para calcular o próximo passo do Agente'''
    
    def __init__(self,weights):
        self.weights = weights
        
    def registerInitialState(self, state):
        return    
    
    
    
    def getAction(self,state):
        
        def dirComida(state,weight1,weight2,lado_quadrado):
            '''Função que recebe dois pesos e um número. Ela verifica por comida num quadrado em torno do pacman.
            A função recebe o tamanho do lado do quadrado. Ela retorna a direção em que mais comidas estão nesse
            quadrado (Oeste,Leste,Norte, Sul), ponderada pelo peso 1 e a direção da comida mais próxima ponderada
            pelo peso 2.'''
            east=west=north=south=0 #inicializando as variaveis para contar as direções mais frequentes
            best_east=best_west=best_north=best_south=0 #inicializando as variaveis para contar as direções mais frequentes
            near_x=near_y=0
            near_food=10000
            #Cria o quadrado 4x4 em volta do pacman para checar se tem comida e qual a direção da comida
            for eixo_x in range(int(-(lado_quadrado/2)),int((lado_quadrado/2)+1)):
                for eixo_y in range(int(-(lado_quadrado/2)),int((lado_quadrado/2)+1)):
                    try:
                        #Se tem muro, vai para outro quadrado
                        if state.hasWall(state.getPacmanPosition()[0]+eixo_x,state.getPacmanPosition()[1]+eixo_y):
                            continue
                        else:
                            #Se não tem muro, atualiza o x e y do quadrado
                            x = state.getPacmanPosition()[0]+eixo_x
                            y = state.getPacmanPosition()[1]+eixo_y
                            has_food = state.getFood()[x][y]
                            #Verifica se tem comida no quadrado e adiciona a direção mais forte(sul,norte,leste,oeste)
                            if has_food:
                                #Ve se é a comida mais proxima, se for irá armazenar as direções para o weight 2
                                #Utilizamos a distância de Manhattan pra ver qual comida é a mais próxima
                                dist=manhattanDistance(state.getPacmanPosition(),[x,y])
                                if dist<near_food:
                                    near_food=dist
                                    near_x= x
                                    near_y= y
                                    #Aqui vereficamos o maior eixo e o sinal. Se for,por exemplo, eixo x e sinal 
                                    #positivo, será direção oeste. Se for o mesmo eixo e sinal contrário, será 
                                    #direção este. Do mesmo modo se o eixo y for o maior, será norte se for
                                    #positivo e sul se for negativo
                                    if abs(eixo_x)>abs(eixo_y) and eixo_x<0:
                                        best_west = 0
                                        best_west += 1
                                    elif abs(eixo_x)>abs(eixo_y) and eixo_x>0:
                                        best_east=0
                                        best_east += 1
                                    elif abs(eixo_y)>abs(eixo_x) and eixo_y<0:
                                        best_south=0
                                        best_south += 1
                                    elif abs(eixo_y)>abs(eixo_x) and eixo_y>0:
                                        best_north=0
                                        best_north += 1
                                    elif abs(eixo_y)==abs(eixo_x) and eixo_y>0 and eixo_x>0:
                                        best_north=best_east=0
                                        best_north += 1
                                        best_east += 1
                                    elif abs(eixo_y)==abs(eixo_x) and eixo_y>0 and eixo_x<0:
                                        best_north=best_west=0
                                        best_north += 1
                                        best_west += 1
                                    elif abs(eixo_y)==abs(eixo_x) and eixo_y<0 and eixo_x>0:
                                        best_south=best_east=0
                                        best_south += 1
                                        best_east += 1
                                    elif abs(eixo_y)==abs(eixo_x) and eixo_y<0 and eixo_x<0:
                                        best_south=best_west=0
                                        best_south += 1
                                        best_west += 1
                                #Depois de vermos se é a comida mais próxima, agora chegamos a mesma coisa para
                                #as demais comidas. Mesmo se for a comida mais próxima, ela entrará na conta da
                                #comida total.
                                if abs(eixo_x)>abs(eixo_y) and eixo_x<0:
                                    west += 1
                                elif abs(eixo_x)>abs(eixo_y) and eixo_x>0:
                                    east += 1
                                elif abs(eixo_y)>abs(eixo_x) and eixo_y<0:
                                    south += 1
                                elif abs(eixo_y)>abs(eixo_x) and eixo_y>0:
                                    north += 1
                                elif abs(eixo_y)==abs(eixo_x) and eixo_y>0 and eixo_x>0:
                                    north += 1
                                    east += 1
                                elif abs(eixo_y)==abs(eixo_x) and eixo_y>0 and eixo_x<0:
                                    north += 1
                                    west += 1
                                elif abs(eixo_y)==abs(eixo_x) and eixo_y<0 and eixo_x>0:
                                    south += 1
                                    east += 1
                                elif abs(eixo_y)==abs(eixo_x) and eixo_y<0 and eixo_x<0:
                                    south += 1
                                    west += 1                            
                    except:
                        continue
                        
            #Agora que fizemos a contagem das direções, a função retorna
            #dois dicionários, um para a comida mais próxima e outro para o total de comidas.
            # Cada dicionário contém todas as direções como keys e a contagem das direções, já ponderada
            #pelo reespectivos pesos, 1 e 2 (Peso 1 para a comida total e peso 2 para a comida mais próxima.
            actions_count_all={'East':weight1*east,'West':weight1*west,'North':weight1*north,'South':weight1*south}
            
            actions_count_near={'East':weight2*best_east,'West':weight2*best_west,
                                'North':weight2*best_north,'South':weight2*best_south}
            return actions_count_all , actions_count_near
        
        def dirNearGhost(state,weight):
            '''Função que recebe um peso, verifica pelo fantasma mais perto e retorna direção oposta ponderada
            pelo peso recebido.'''
            
            east=west=north=south=0 #inicializando as variaveis para contar as direções mais frequentes
            numGhost = state.getNumAgents() #Número de fantasmas
            near_dist = 10000 #Estabelecendo um valor de distância alto para ser substituido
            #função que busca o fantasma mais perto, baseado na distância de manhattan
            for ghost in range(1,numGhost):
                dist=manhattanDistance(state.getPacmanPosition(),state.getGhostPosition(ghost))
                if dist<near_dist:
                    near_dist=dist
                    near_ghost=ghost
            #Selecionamos agora a direção do fantasma mais proximo
            x,y=heuristicDistance(state.getPacmanPosition(),state.getGhostPosition(near_ghost))
            #Aqui inevertemos a melhor direção, para o pacman ir para uma direção oposta do fantasma
            if abs(x)>abs(y):
                if x>0:
                    east += 1
                else:
                    west += 1
                    
            elif abs(x)==abs(y):
                if x>0:
                    east += 1
                    north += 1
                else:
                    west += 1
                    south += 1
            else:
                if y>0:
                        north += 1
                else:
                        south += 1
            #Retornamos um dicionário com todas as direções como key e a contagem, já ponderada pelo peso,
            #como values                         
            actions_count={'East':weight*east,'West':weight*west,'North':weight*north,'South':weight*south}
            return actions_count
         
        def dirAllGhost(state,weight):
            '''Função que recebe um peso, verifica os fantasmas e retorna a direção oposta da somatória dos fantasmas
            ponderada pelo peso passado na função.'''
           
            east=west=north=south=0 #inicializando as variaveis para contar as direções mais frequentes
            numGhost = state.getNumAgents() #Número de fantasmas. Sabemos que o pacman é contado aqui, mas não importa
                                            # porque na função range() utilizada abaixo começamos no 1, e não no zero

            for ghost in range(1,numGhost):
                x,y=heuristicDistance(state.getPacmanPosition(),state.getGhostPosition(ghost))
                #Aqui inevertemos a melhor direção, para o pacman ir para uma direção oposta ao do fantasma
                if abs(x)>abs(y):
                    if x>0:
                        east += 1
                    else:
                        west += 1
                    
                elif abs(x)==abs(y):
                    if x>0:
                        east += 1
                        north += 1
                    else:
                        west += 1
                        south += 1
                else:
                    if y>0:
                        north += 1
                    else:
                        south += 1
            #Retornamos um dicionário com todas as direções como key e a contagem, já ponderada pelo peso,
            #como values            
            actions_count={'East':weight*east,'West':weight*west,'North':weight*north,'South':weight*south}
            return actions_count
        
        #Agora iniciamos a função getAction, retirando um dos cromossomos do indivíduo (cada
        #passo dado pelo indivíduo no jogo, ponderada pelos pesos). Ou seja, o gene contém a lista de pesos
        #para cada uma das funções estabelecidas: peso 1 dado para a melhor direção para comidas, peso dois 
        #para a melhor direção para comida mais próxima, peso três para a direção oposta
        # de todos os fantasmas e direção oposta do fantasma mais próximo.
        gene=self.weights.pop(0) #Retira um gene da lista de passos
        legal = state.getLegalPacmanActions() #Verifica as ações legais do agente
        tentativas=0 #Inicializa a variável de tentativas para achar a melhor direção dado os pesos
        lado_quadrado=2 #Inicializa o tamanho do lado do quadrado do pacman para a busca da comida
        while tentativas<25:#Tenta 25 vezes encontrar alguma direção
            tentativas+=1
            lado_quadrado+=2
            all_food_best_dir, near_food_best_dir = dirComida(state,int(gene[0]),int(gene[1]),lado_quadrado)
            all_ghost_best_dir = dirAllGhost(state,int(gene[2]))
            near_ghost_best_dir = dirNearGhost(state,int(gene[3]))

            final = dict(Counter(all_food_best_dir) + Counter(near_food_best_dir) + 
                     Counter(all_ghost_best_dir)+
                     Counter(near_ghost_best_dir))
            final = dict(sorted(final.items(), key=lambda item: item[1],reverse=True))
            for i in range(len(final)):
                melhor_direcao = list(final.keys())[i]
                if melhor_direcao in legal:
                    return melhor_direcao
        #Se nenhuma dessas tentativas derem certo, para evitar erro, retornamos uma direção aleatória dentre
        # as direções legais dos agentes
        return random.choice(legal)

# Funções para o algoritmo genético

In [5]:
def generateCromossomo():
    '''Função que retorna um cromossomo. Ela gera uma lista com 5 números de 0 a 100 criados aleatoriamente'''
    cromossomo=[]
    for weight in range(0,5):
        cromossomo.append(random.uniform(0,100))
    return cromossomo
def generateIndividuo():
    '''Função que retorna um indivíduo. Ela gera um indivíduo com 2000 passos, valor suficiente para resolver
    até o layout mais complexo do pacman.'''
    individuo=[]
    for jogadas in range(0,2000):
        individuo.append(generateCromossomo())
    return individuo
def pacmanAvarageScore(individuo,num_tentativas,layout,flag):
    '''Função que recebe o indivíduo, a quantidade de jogos que ele irá realizar e o layout do jogo.
    Ela retorna o score médio da quantidade de jogos realizados para esse indivíduo.'''
    tentativas_ind=[]
    for tentativas in range(0,num_tentativas):
        if flag:
            args = ['--layout',layout,'--pacman','DumbAgent','-q']
        else:
            args = ['--layout',layout,'--pacman','DumbAgent']
        args_list = readCommand(args)
        test = theBestAgentOnEarth(individuo)
        score= pacman.runGames(pacman=test,layout=args_list['layout'],ghosts=args_list['ghosts'],display=args_list['display'],
                       numGames=args_list['numGames'],record=args_list['record'])
        tentativas_ind.append(score)
    return numpy.mean(tentativas_ind)

def generatePopulation(size,layout,flag):
    '''Função que recebe o layout do jogo e um tamanho e cria uma população de indivíduos. Ela
    retorna duas listas, a população e os scores de cada indivíduo. O score na posição 0 da lista será do 
    indivíduo da população na posição 0.'''
    population=[]
    scores=[]
    for pacmans in range(0,size):
        print('individuo ',pacmans+1)
        individuo = generateIndividuo()
        individuo_temp=individuo #Passamos para uma variável temporária pois o .pop(0)do getAction
                                    #remove os passos dados dos indivíduos
        avg_score = pacmanAvarageScore(individuo_temp,5,layout,flag)
        population.append(individuo)
        scores.append(avg_score)
    return population,scores

def mutation(population,rate):
    '''Função que recebe uma população e uma taxa e define uma porcentagem da população para realizar mutação
    de cromossomos nos seus indivíduos da essa taxa recebida'''
    for selected in range(len(population)*rate): #Seleciona uma quantidade x de indivíduos, dado a rate
        position_individual = random.randit(0,len(population)) #seleciona um indivíduo aleatório na população
        position_cromossom1 = random.randit(0,len(population[position_individual]))#Seleciona um cromossomo aleatório
        position_cromossom2 = random.randit(0,len(population[position_individual]))#Seleciona outro cromossomo aleatório
        crom1 = population[position_individual][position_cromossom1]
        crom2 = population[position_individual][position_cromossom2]
        crom1_temp = crom1 # define um cromossomo temporário para fazer essa trocagem
        crom1 = crom2
        crom2 = crom1_temp
    return population
        
def crossover(population,rate,range_cromossomos):
    '''Função que recebe uma população e uma taxa e um range de valores e define uma porcentagem da população
    para realizar crossover desse range de valores (recebido pela função) para os cromossomos dos indivíduos'''
    for selected in range(len(population)*rate): #Seleciona uma quantidade x de indivíduos, dado a rate
        position_individual1 = random.randit(0,len(population)) #seleciona um indivíduo aleatório na população
        
        
        position_cromossom1 = random.randit(0,len(population[position_individual]))#Seleciona um cromossomo aleatório
        position_cromossom2 = random.randit(0,len(population[position_individual]))#Seleciona um cromossomo aleatório
        crom1_list = []
        for i in range(0,range_cromossomos):
            crom1_list.append(population[position_individual][position_cromossom1])
        crom2_list = population[position_individual][position_cromossom2]
        crom1_temp = crom1 # define um cromossomo temporário para fazer essa trocagem
        crom1 = crom2
        crom2 = crom1_temp
    return population



# Main

In [7]:
#Layouts que queremos explorar do jogo
layout=['originalClassic','mediumClassic','smallClassic']
#Gerando a população inicial com seus scores no jogo
population,scores = generatePopulation(2,layout[2],flag=False)
#Separando os 2 melhores indivíduos da população inicial para próxima geração e realizando uma nova geração de
# n-2 indivíduos

individuo  1
Pacman died! Score: -253
Pacman died! Score: -339
Pacman emerges victorious! Score: 953
Pacman died! Score: -337
Pacman died! Score: 59
individuo  2
Pacman died! Score: -100
Pacman died! Score: -321
Pacman died! Score: -86
Pacman died! Score: -170
Pacman died! Score: -369


In [8]:
scores

[16.6, -209.2]

In [11]:
args = ['--layout','smallClassic','--pacman','DumbAgent']
args_list = readCommand(args)
test = testAgent([1,5,2,4,5])
score= pacman.runGames(pacman=test,layout=args_list['layout'],ghosts=args_list['ghosts'],display=args_list['display'],
                       numGames=args_list['numGames'],record=args_list['record'])

TypeError: 'int' object is not subscriptable

In [26]:
len(individuo)

1206