# Minimax y Alpha-Beta prunning

### Algoritmo minimax

El algoritmo de búsqueda Minimax, es una búsqueda de profundidad limitada. El nombre del algoritmo se da al considerar que dada una función estática que devuelve valores en relación al jugador maximizante, este trata de maximizar su valor mientras que el oponente trata de minimizarlo. En un árbol de juego donde los valores de la función estática, están en relación con el jugador maximizante, se maximiza y minimiza de forma alterna de un nivel a otro.

Entre las principales características que posee este algoritmo tenemos:

- Facilidad de problemas complejos con reglas simples.
- Pruebas contra humanos escalables
- Existencia de un solo ganador
- Exploración de N capas
- Tiempo de exploración agotado
- Situaciones estáticas sin cambios significativos

### Historia minimax

Alan Turing, es uno de los más notables y grandes científicos nacido el 23 de junio de 1912, podemos decir que Alan Turing fue uno de los impulsadores más notables en la creación de las computadoras.

Alan Turing era un entusiasta por el juego del ajedrez esto debido a que el juego no solo le permitía distracción si no porque era una posibilidad divertida de elaborar ideas, analizar problemas y profundizar los campos de las matemáticas. Debido a esto fue que Alan Turing tubo gran parte de sus inicios de la IA usando el ajedrez como campo de prueba.
En el juego del ajedrez los movimientos de los dos jugadores están completamente a la vista de los mismo por lo que el juego requiere de mucha estrategia, además con un solo movimiento podemos desplegar un árbol de muchas posibilidades entres las cuales están las más favorables y desfavorables para el oponente es así como con cada movimiento el árbol de posibilidades crece más y más.

Alan Turing deseaba crear una maquina peor no deseaba que esta sea enorme en poder de cálculo sino más bien que esta tenga la capacidad de aprender de su experiencia y así modifique su funcionamiento para mejorar.
Fue por esto por lo que Turing se apoyo en la herramienta Minimax creada por Neumann la cual minimizaba la perdida máxima es decir el movimiento menos perjudicial y que ponga en una posición más vulnerable al oponente.

### Ejemplo MINIMAX

En el algoritmo Minimax el espacio de búsqueda queda definido por:

Estado inicial: Es una configuración inicial del juego, es decir, un estado en el que se encuentre el juego. Para nuestro ejemplo sería:

![1.PNG](attachment:1.PNG)

 Operadores: Corresponden a las jugadas legales que se pueden hacer en el juego, en el caso del tres en raya no puedes marcar una casilla ya antes marcada.
 
 ![2.PNG](attachment:2.PNG)
 
  Condición Terminal: Determina cuando el juego se acabó, en nuestro ejemplo el juego termina cuando un jugador marca tres casillas seguidas iguales, ya se horizontalmente, verticalmente o en diagonal, o se marcan todas las casillas (empate).
  
  ![3.PNG](attachment:3.PNG)
  
  Función de Utilidad: Da un valor numérico a una configuración final de un juego. En un juego en donde se puede ganar, perder o empatar, los valores pueden ser 1, 0, o -1.
  
  ![4.PNG](attachment:4.PNG)
  
  
### Algoritmo Poda Alfa-Beta

El algoritmo poda Alfa-Beta como ya lo habíamos mencionado anteriormente es una técnica mejorada del algoritmo Minimax en la cual es posible calcular un estado objetivo sin la necesidad de recorrer todos los nodos del árbol de juegos, este tipo de algoritmo suele utilizarse para cualquier tipo de árbol de búsqueda en profundidad y para subárboles enteros. Este algoritmo al igual que el Minimax hace uso de la búsqueda en profundidad asi que para poder encontrar un resultado solo tendremos que considerar los nodos a lo largo de un solo camino.

Entre las principales características que posee este algoritmo en comparación con el Minimax tenemos:

- Omisión de expansión de nodos que por sus valores no pueden ser los mejores.
- No afecta al resultado final.
- Permite búsquedas el doble de profundas que el Minimax
- Importancia de orden y no de valores exactos

### Historia Poda Alfa-Beta

Donald Knuth y Ronald Moore (1975) fueron los primeros en analizar a fondo la eficiencia de la poda
alfa-beta, en su libro “An analysis of alpha-beta pruning”. Es posible calcular en un determinado
juego una decisión correcta sin tener que explorar todos los nodos de un árbol de búsqueda. A
la técnica que consideramos en particular se le conoce como poda alfa-beta. Aplicada a un árbol
minimax estándar, produce la misma jugada que se obtendría con minimax, pero elimina todas
las ramas que posiblemente no influirán en la decisión final. La eficiencia de alfa-beta dependerá
del orden como se exploren los sucesores dentro de un árbol, es mejor primero explorar aquellos
sucesores que aparentemente tienen más posibilidades de ser los mejores.

### Ejemplo de Poda Alfa-Beta

Considera el árbol en figura siguiente de un juego de dos personas, donde los círculos son nodos max y los cuadrados son nodos min. Aplica el algoritmo minimax con poda alfa-beta, propaga los valores de evaluación hasta el nodo raíz, marca la mejor jugada para max, y marca todos los subárboles que se podan.

![.PNG](attachment:.PNG)

### Emplear el algoritmo en su problema Laberinto

Los árboles de juego, en general, requieren mucho tiempo para construir, y es solo para juegos simples que se pueden generar en poco tiempo.

Si hay si movimientos legales, es decir, si nodos en cada punto y la profundidad máxima del árbol es metro, la complejidad temporal del algoritmo minimax es del orden.

Para frenar esta situación, hay algunas optimizaciones que se pueden agregar al algoritmo.

Afortunadamente, es viable encontrar la decisión real de minimax sin siquiera mirar cada nodo del árbol del juego. Por lo tanto, eliminamos nodos del árbol sin analizar, y este proceso se llama poda.

La construcción al azar permite generar gran cantidad de laberintos conteniendo corredores como las ramas de un árbol, persiguiendo la desorientación del explorador, siendo a su vez ésta la forma más fácil de implementarse en un programa de computadora. Los algoritmos explicados a continuación, generan laberintos LCS completamente conectados.

### 4 papers científicos de aplicaciones prácticas de este algoritmo y su variante

1.
https://riunet.upv.es/bitstream/handle/10251/76628/GRANADOS%20-%20An%C3%A1lisis%20y%20aplicaci%C3%B3n%20de%20t%C3%A9cnicas%20inteligentes%20a%20un%20jugador%20autom%C3%A1tico%20en%20videojuegos%20t%C3%A1cticos.pdf?sequence=2

2.
https://riuma.uma.es/xmlui/bitstream/handle/10630/15438/JesusdesosacruzMemoria.pdf?sequence=1

3.
https://www.sciencedirect.com/science/article/abs/pii/S016501148680029X

4.
https://e-archivo.uc3m.es/bitstream/handle/10016/23725/TFG_Ignacio_Saez_Lahidalga.pdf?sequence=1


# Juego Nim 

En este juego, colocan un número arbitrario de fichas sobre una superficie, separadas en filas o grupos. Tanto el número de filas como el número de fichas en cada fila son también arbitrarios. El primer jugador, toma cualquier número de fichas de una fila, entre uno y el total de la fila, pero sólo de una fila. El otro jugador hace su jugada de manera similar, retirando algunos de las fichas que quedan, y los jugadores van alternándose en sus jugadas. 

Se puede jugar de modo que gane el que retire la última ficha, que es el modo más fácil, o el "modo miseria" en el que perdería el que retire la última ficha.

Este juego ha sido objeto de profundos análisis en el campo de la teoría de juegos y la matemática combinatoria.



In [4]:
from easyAI import TwoPlayersGame, Human_Player, AI_Player, Negamax
import numpy as np


class JuegoNim(TwoPlayersGame):

    def __init__(self, nplayers):
        self.n = int(input("Ingrese el numero de fichas con las que va a jugar: \n"))
        self.fichas = np.zeros(self.n, dtype=int)
        self.nplayer = 1
        self.players = nplayers

    def possible_moves(self):

        moves = []
        cont = 1        
        for i in range(len(self.fichas)):

                if self.fichas[i] == 0:
                    moves.append(cont)
                cont += 1
        # print(moves)        
        return moves

    def make_move(self, casillero):
        self.fichas=np.delete(self.fichas,casillero-1)
        #print(self.fichas)
    def lose(self):
        if self.fichas.size==0:
            return True
        return False
    def show(self):
        print(self.fichas)

    def scoring(self):
        return -100 if self.lose() else 0
    def is_over(self):

        if (self.fichas.size==0):
            print("Juego terminado, gano el jugador: ", self.nplayer)

        return (self.possible_moves()==0 or self.lose())


if __name__ == "__main__":
    ai_algo = Negamax(6)
    jNim = JuegoNim([Human_Player(), AI_Player(ai_algo)])
    jNim.play()
    
    
    

Ingrese el numero de fichas con las que va a jugar: 
10
[0 0 0 0 0 0 0 0 0 0]

Player 1 what do you play ? 1

Move #1: player 1 plays 1 :
[0 0 0 0 0 0 0 0 0]

Move #2: player 2 plays 1 :
[0 0 0 0 0 0 0 0]

Player 1 what do you play ? 2

Move #3: player 1 plays 2 :
[0 0 0 0 0 0 0]

Move #4: player 2 plays 1 :
[0 0 0 0 0 0]

Player 1 what do you play ? 2

Move #5: player 1 plays 2 :
[0 0 0 0 0]
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego terminado, gano el jugador:  1
Juego termin