<img src="logo.png">

# Minimax y Alpha-Beta prunning

# #  JUEGO 3 EN RAYA

In [None]:
from easyAI import TwoPlayersGame, Human_Player, AI_Player, Negamax
import numpy as np

In [None]:
class TresEnRaya(TwoPlayersGame):
    
    def __init__(self,nplayers):
        self.tablero = np.zeros((3,3),dtype = int)
        self.nplayer = 1
        self.mapa = {}
        cont = 1
        for i in range(len(self.tablero)):
            for j in range(len(self.tablero)):
                self.mapa[cont]=(i,j)
                cont+=1
                
        #print(self.mapa)
        self.players = nplayers
        

    def possible_moves(self):
        moves = []
        cont = 1
        for i in range(len(self.tablero)):
            for j in range(len(self.tablero)):
                if self.tablero[i][j] == 0:
                    moves.append(cont)
                cont+=1
                
        #print(moves)
        return moves
    
    def make_move(self,casillero):
        pos = self.mapa[casillero]
        self.tablero[pos[0]][pos[1]] = self.nplayer
        
    def unmake_move(self,casillero):
        pos = self.mapa[casillero]
        self.tablero[pos[0]][pos[1]] = 0
        
    def lose(self):
        for i in range(len(self.tablero)):
            if np.all(self.tablero[i,:]==self.nopponent,axis = 0) or np.all(self.tablero[:,i]==self.nopponent,axis = 0):
                return True
        
        
        if self.tablero[0][0]==self.nopponent and self.tablero[1][1]==self.nopponent and self.tablero[2][2]==self.nopponent:
            return True
        
        if self.tablero[2][0]==self.nopponent and self.tablero[1][1]==self.nopponent and self.tablero[0][2]==self.nopponent:
            return True
        
        return False
    
    
    def show(self):
        print(self.tablero)
        
        
    def scoring(self):
        return -100 if self.lose() else 0

        
    def is_over(self):
        return (self.possible_moves() == [] or self.lose())
            
    
if __name__=="__main__":
    ai_algo = Negamax(6)
    tresenraya = TresEnRaya([Human_Player(),AI_Player(ai_algo)])
    tresenraya.play()

# Realizar una investigación sobre el algoritmo Minimax y Alpha-Beta prunning

# ¿Que es minimax?

Minimax es un método de decisión para minimizar la pérdida esperada en juegos con adversario y con información perfecta, es un algoritmo recursivo. 
John Von Neumann es el creador del teorema minimax un procedimiento recursivo y el corte de la recursión está dado por alguna de las siguientes condiciones: Gana algún jugador Se han explorado N capas, siendo N el límite establecido Se ha agotado el tiempo de exploración Se ha llegado a una situación estática donde no hay grandes cambios de un nivel a otro. En simples palabras el algoritmo de minimax consiste en la elección del mejor movimiento para el computador, suponiendo que el contrincante escogerá uno que lo pueda perjudicar, para escoger la mejor opción este algoritmo realiza un árbol de búsqueda con todos los posibles movimientos, luego recorre todo el árbol de soluciones del juego a partir de un estado dado, es decir, según las casillas que ya han sido rellenadas. Por tanto, minimax se ejecutará cada vez que le toque mover a la IA.


# Espacio de busqueda queda definido por:

* Estado inicial: es decir estado en el que el juego inicia
* Operadores: Corresponde a las jugadas legales que se pueden hacer en el juego.
* Condición Terminal: Determina cuando el juego se acabó, es decir cuando unos de los dos gano.
* Función de Utilidad: Da un valor numérico a una configuración final de un juego. En un juego en donde se puede ganar, perder o empatar, los valores pueden ser 1, 0, o -1.


# Funcionamiento
1.Generación del árbol de juego. Segenerarán todos los nodos hasta llegar a un estado terminal.
2.Cálculo de los valores de la función de utilidad para cada nodo terminal. 
3.Calcular el valor de los nodos superiores a partir del valor de los inferiores.Alternativamente se elegirán los valores mínimos y máximos representando los movimientos del jugador y del oponente, de ahí el nombre de Minimax.
4.Elegir la jugada valorando los valores que han llegado al nivel superior. 

El algoritmo primero generar un árbol de soluciones completo a partir de un nodo dado.
Para cada nodo final, buscamos la función de utilidad de estos, entre los pioneros en el uso de esta técnica encontramos a Arthur Samuel, D.J Edwards y T.P. Hart,1 Alan Kotok,2 Alexander Brudno,3 Donald Knuth y Ronald W. Moore4

El problema de la búsqueda Minimax es que el número de estados a explorar es exponencial al número de movimientos. Partiendo de este hecho, la técnica de poda alfa-beta trata de eliminar partes grandes del árbol, aplicándolo a un árbol Minimax estándar, de forma que se devuelva el mismo movimiento que devolvería este, gracias a que la poda de dichas ramas no influye en la decisión final.

# Ejemplo 

* Funcionamiento de Minimax en un árbol generado para un juego imaginario.
* Los posibles valores de la función de utilidad tienen un rango de [1-9].
* En los movimientos del contrincante suponemos que escogerá los movimientos que minimicen nuestra utilidad
* En nuestros movimientos suponemos que escogeremos los movimientos que maximizan nuestra utilidad.
* 1er. Paso: Calcular los nodos
terminales, en verde. 
* 2º. Paso: Calcular el cuarto nivel, movimiento MIN, minimizando lo elegido (5, 2 y 1).
* 3er. Paso: Calcular el tercer nivel, movimiento MAX, maximizando la utilidad (5, 9).
* El segundo nivel es un movimiento MIN (5, 3 y 1).
* Finalmente llegamos al primer nivel, el movimiento actual, elegiremos el nodo que maximize nuestra utilidad (5). 
<img src="ejemploMin.png">



# ¿Que es Alpha-Beta prunning?

Es un algoritmo de búsqueda que busca disminuir el número de nodos que evalúa el algoritmo minimax en su árbol de búsqueda . Es un algoritmo de búsqueda de adversarios que se usa comúnmente para jugar en máquinas de juegos de dos jugadores. Deja de evaluar un movimiento cuando se ha encontrado al menos una posibilidad que demuestra que el movimiento es peor que un movimiento examinado previamente. Tales movimientos no necesitan ser evaluados más a fondo. Cuando se aplica a un árbol minimax estándar, devuelve el mismo movimiento que minimax, pero elimina las ramas que no pueden influir en la decisión final.

# Funcionamiento

La poda alfa-beta toma dicho nombre de la utilización de dos parámetros que describen los límites sobre los valores hacia atrás que aparecen a lo largo de cada camino.

α es el valor de la mejor opción hasta el momento a lo largo del camino para MAX, esto implicará por lo tanto la elección del valor más alto*
β es el valor de la mejor opción hasta el momento a lo largo del camino para MIN, esto implicará por lo tanto la elección del valor más bajo.*

Esta búsqueda alfa-beta va actualizando el valor de los parámetros según se recorre el árbol. El método realizará la poda de las ramas restantes cuando el valor actual que se está examinando sea peor que el valor actual de α o β para MAX o MIN, respectivamente.

# Ejemplo 

Un ejemplo pedagógico de animación que intentos de ser humano-amistoso mediante la sustitución de valores infinitos inicial (o arbitrariamente grande) para vacío y evitando el uso de la negamax simplificaciones codificación.

<img src="ejemploAl.png">

# Historia de los algoritmos

Historia de los algoritmos (de acuerdo a lo planteado por Alan Turing para el caso del Minimax)
Alan Turing, fue de los primeros que relacionó algoritmo y ordenadores. De hecho, fue de los primeros que imaginó un ordenador tal y como los conocemos. Incluso llegó a pensar que las máquinas podrían pensar, y hasta escribir poemas de amor.

La Máquina de Turing no es una máquina que exista en el mundo físico, sino un constructo mental. Consiste en una cinta infinita sobre la que se van haciendo operaciones repetitivas hasta dar soluciones, viene a ser una definición informática del algoritmo y un ordenador, el primero, conceptualizado: “En esencia, es el precursor de los ordenadores: tiene una memoria, unas instrucciones (un programa), unas operaciones elementales, una entrada y una salida”, explica el profesor Peña. Lo más interesante es que es una máquina universal, que puede llevar a cabo cualquier programa que se le ordene. Dentro de los problemas del mundo hay de dos tipos: los que puede resolver una Máquina de Turing (llamados computables) y los que no (los no computables), igual que vemos en el mundo real tareas que pueden realizar las máquinas (cada vez más) y otras que solo pueden realizar los humanos. Todos los ordenadores, tablets, smartphones, etc, que conocemos son máquinas de Turing.

Alan M. Turing desarrolló el primer programa de ordenador de la historia para jugar al ajedrez. Fue a finales de los años 40, y está descrito en su artículo Digital Computers Applied to Games (que se publicó en el libro Faster than Thought, editado por B. V. Bowden, Pitman, Londres 1953). Allí Turing sienta lo que serán las bases de los programas posteriores de ajedrez por ordenador: la simulación de secuencias de movimientos, la evaluación de los estados finales de esas secuencias y la propagación de esa evaluación a los estados directamente sucesores de la configuración actual de juego.


Para explicar de una mejor manera se realizara con el ejemplo con tres jugadores en donde cada uno tendrá asignado un nodo, este para poder obtener el estado terminal tendrá que hacer uso de la función de utilidades la cual nos va a devolver un vector de utilidades, seguido de esto tendremos que analizar los estados no terminales para reconocer los movimientos que nos conducirán hacia un estado terminal con utilidades, se podría decir que el valor hacia atrás de un nodo será el vector de utilidades de cualquier estado sucesor que tiene el valor más alto para cada jugador.


# CONCLUSION

El algoritmo Minimax es muy util el desarrollo de video juegos tempranos los cuales nos facilitan de como adquirir y entender una lógica para juegos, ademas nos da la poibilidad de poner en practica pequeños juegos ya desarrollados con este tipo de algoritmo, ademas alpha-beta es un complemento de minimax que nos permite aprovechar mas aun dicho algoritmo para mejorar ciertos procesos que minimax no considera.

# REFERENCIAS

* http://razonartificial.com/2010/08/algoritmo-minimax-un-jugador-incansable/
* https://ccc.inaoep.mx/~emorales/Cursos/Busqueda/node49.html

# Actividad Práctica No.6a y 6b
Desarrollar un mini-juego (tema libre) empleando una de las 2 siguientes alternativas:
easyAI
Universe + GYM
El juego deberá implementar algún algoritmo de IA y de igual forma, generar un informe de movimientos, puntajes y quién 
gana la partida. El informe deberá ser cargado junto con el trabajo de revisión del algoritmo MiniMax.