**Nombre:** Jorge arévalo
**Fecha:** 15/06/2020

# Algoritmo MiniMax

## Historia

Aunque existen evidencias de que Charles Babbage ya había trabajado antes sobre una idea similar, fue el matemático francés Émile Borel el primero en ofrecer en 1921 un tratamiento riguroso a los juegos competitivos y en estudiar las estrategias aplicables a los juegos de suma cero. Sin embargo suele atribuirse a John von Neumann el principal mérito de la concepción del principio minimax, ya que fue él quien, en su artículo de 1928 «Zur Theorie der Gesellschaftsspiele» («Sobre la teoría de los juegos de sociedad») publicado en la revista Mathematische Annalen,puso las bases de la moderna teoría de juegos y probó el teorema fundamental del minimax, por el que se demuestra que para juegos de suma cero con información perfecta entre dos competidores existe una única solución óptima.

## Ejemplo

El algoritmo de minimax en simples palabras consiste en la elección del mejor movimiento para el computador, suponiendo que el contrincante escogerá uno que lo pueda perjudicar, para escoger la mejor opción este algoritmo realiza un árbol de búsqueda con todos los posibles movimientos, luego recorre todo el árbol de soluciones del juego a partir de un estado dado, es decir, según las casillas que ya han sido rellenadas. Por tanto, minimax se ejecutará cada vez que le toque mover a la IA.

**En el algoritmo Minimax el espacio de búsqueda queda definido por:**

**Estado inicial:** Es una configuración inicial del juego, es decir, un estado en el que se encuentre el juego. Para nuestro ejemplo sería:
<img src="img/img1.png">
**Operadores:** Corresponden a las jugadas legales que se pueden hacer en el juego, en el caso del tres en raya no puedes marcar una casilla ya antes marcada.
<img src="img/img2.png">
Condición Terminal: Determina cuando el juego se acabó, en nuestro ejemplo el juego termina cuando un jugador marca tres casillas seguidas iguales, ya se horizontalmente, verticalmente o en diagonal, o se marcan todas las casillas (empate).
<img src="img/img3.png">
Función de Utilidad: Da un valor numérico a una configuración final de un juego. En un juego en donde se puede ganar, perder o empatar, los valores pueden ser 1, 0, o -1.
<img src="img/img4.png">
Implementación Minimax: Los pasos que sigue minimax pueden variar, pero lo importante es tener una idea clara de cómo es su funcionamiento, los pasos a seguir son:

El algoritmo primero generar un árbol de soluciones completo a partir de un nodo dado. veamos el siguiente ejemplo:
<img src="img/img5.png">
Para cada nodo final, buscamos la función de utilidad de estos. En nuestro ejemplo usaremos un 0 para las partidas que terminen en empate, un 1 para las que gane la IA y un -1 para las que gane el jugador humano.
<img src="img/img6.png">

Comprendamos la terminología definida.
1.- El estado inicial es la primera capa que define que el tablero está en blanco, es el turno de MAX para jugar.

2.- La función de sucesor enumera todos los movimientos sucesores posibles. Se define para todas las capas del árbol.

3.- El estado terminal es la última capa del árbol que muestra el estado final, es decir, si el jugador MAX gana, pierde o empata con el oponente.

4.- Las utilidades en este caso para los estados terminales son 1, 0 y -1 como se discutió anteriormente, y también pueden usarse para determinar las utilidades de los otros nodos.
<img src="img/img7.png">

**Para resumir**

Decisión de Minimax = MAX {MIN {3,5,10}, MIN {2,2}}

= MAX {3,2}

= 3

**Psuedocode:**

## Emplear el algoritmo en su problema Laberinto

Los árboles de juego, en general, requieren mucho tiempo para construir, y es solo para juegos simples que se pueden generar en poco tiempo.

Si hay si movimientos legales, es decir, si nodos en cada punto y la profundidad máxima del árbol es metro, la complejidad temporal del algoritmo minimax es del orden.

Para frenar esta situación, hay algunas optimizaciones que se pueden agregar al algoritmo.

Afortunadamente, es viable encontrar la decisión real de minimax sin siquiera mirar cada nodo del árbol del juego. Por lo tanto, eliminamos nodos del árbol sin analizar, y este proceso se llama poda.

La construcción al azar permite generar gran cantidad de laberintos conteniendo corredores como las ramas de un árbol, persiguiendo la desorientación del explorador, siendo a su vez ésta la forma más fácil de implementarse en un programa de computadora. Los algoritmos explicados a continuación, generan laberintos LCS completamente conectados.

**Cavar túneles.** Como su nombre lo indica, se refiere a cavar túneles a lo largo y ancho del laberinto hasta cubrirlo en su totalidad, como la explotación de una mina. A este tipo de construcción, pertenecen:

Algoritmo de construcción Kruscal.
Algoritmo de construcción Aldous-Broder.
Algoritmo de construcción Prim’s.
Algoritmo de construcción Recursivo Bactracker.
Algoritmo de construcción de Anderson.

**Levantar muros.** Consiste en elevar los muros de los corredores por todo el cuerpo del laberinto, como en la construcción de un edificio.

# 4 Papers

1.- El algoritmo minimax, también llamado algoritmo negamax, sigue siendo hoy la técnica de búsqueda más utilizada para juegos de información perfecta para dos jugadores. Sin embargo, se ha demostrado que el minimaxing es susceptible a la patología del árbol de juego, una situación paradójica en la que la precisión de la búsqueda puede disminuir a medida que aumenta la altura del árbol. El algoritmo minimax alternativo de Althöfer ha demostrado ser invulnerable a la patología. Sin embargo, no ha quedado claro si la poda alfa-beta, un componente crucial de los programas de juegos prácticos, podría aplicarse en el contexto del algoritmo de Alhöfer. En este breve documento, mostramos cómo la poda alfa-beta se puede adaptar al algoritmo de Althöfer.

2.- La poda alfa-beta es una de las mejoras de búsqueda de MiniMax más poderosas y fundamentales. Fue diseñado para juegos secuenciales de dos jugadores con información perfecta de suma cero. En este artículo presentamos un método de poda de sonido similar a Alpha-Beta para la clase más general de "juegos de matriz apilados" que permiten movimientos simultáneos de ambos jugadores. Esto se logra al mantener los límites superior e inferior para obtener ganancias alcanzables en estados con acciones simultáneas y podas de acción dominadas basadas en la viabilidad de ciertos programas lineales. Los datos empíricos muestran ahorros considerables en términos de nodos expandidos y tiempo de computación en comparación con la ingenua computación de primer movimiento de profundidad sin poda.

3.- Cuando usamos la búsqueda alfa-beta, es posible usar casi todas las modernizaciones conocidas (cambiar el orden de los movimientos de cálculo, la creación de varias tablas auxiliares, profundización progresiva e iterativa, etc.) Por lo tanto, como resultado del rendimiento del algoritmo, no se examinarán todos los movimientos sin objetivo (movimientos que no traen sobrepeso, movimientos realizados no bajo el plan de juego). Esta voluntad esencialmente mejorar el algoritmo de búsqueda alfa-beta (sin usar el algoritmo descrito anteriormente). De hecho, el mejor algoritmo es el algoritmo que visita el menor número de nodos Nuestro algoritmo no exige la clasificación de movimientos con división en buenos y malos cursos, es suficiente para ahorrar en la generación de la lista de posibles movimientos su ventaja (beneficio) (una estimación de un solo movimiento del programa sin respuesta del oponente, por ejemplo, una captura de un caballo del oponente es +3, un movimiento posicional fuerte es +0.5, etc.

4.- Luckhardt e Irani extendieron el minimax a juegos multijugador, llamando al algoritmo resultante max ". Por conveniencia tipográfica nos referimos a él como maxn. Asumen que los jugadores alternan movimientos, que cada jugador intenta maximizar su retorno percibido, y es indiferente a los retornos de los jugadores restantes.En los nodos fronterizos, se aplica una función de evaluación que devuelve una N-tupla de valores, donde N es el número de jugadores, con cada componente correspondiente al mérito estimado de la posición con respecto a uno de los jugadores. Entonces, el valor de cada nodo interior donde se moverá el jugador i es la N-tupla completa del niño para el cual el componente i-ésimo es un máximo.

# Juego easyAI

### Desarrollar un mini-juego (tema libre) empleando una de las 2 siguientes alternativas:

In [None]:
from easyAI import TwoPlayersGame, Human_Player, AI_Player, Negamax
from flask import Flask, render_template_string, request, make_response


class TicTacToe(TwoPlayersGame):
    """ The board positions are numbered as follows:
            7 8 9
            4 5 6
            1 2 3
    """

    def __init__(self, players):
        self.players = players
        self.board = [0 for i in range(9)]
        self.nplayer = 1  # player 1 starts.

    def possible_moves(self):
        return [i + 1 for i, e in enumerate(self.board) if e == 0]

    def make_move(self, move):
        self.board[int(move) - 1] = self.nplayer

    def unmake_move(self, move):  # optional method (speeds up the AI)
        self.board[int(move) - 1] = 0

    WIN_LINES = [
        [1, 2, 3], [4, 5, 6], [7, 8, 9],  # horiz.
        [1, 4, 7], [2, 5, 8], [3, 6, 9],  # vertical
        [1, 5, 9], [3, 5, 7]  # diagonal
    ]

    def lose(self, who=None):
        """ Has the opponent "three in line ?" """
        if who is None:
            who = self.nopponent
        wins = [all(
            [(self.board[c - 1] == who) for c in line]
        ) for line in self.WIN_LINES]
        return any(wins)

    def is_over(self):
        return (self.possible_moves() == []) or self.lose() or \
            self.lose(who=self.nplayer)

    def show(self):
        print ('\n' + '\n'.join([
            ' '.join(
                [['.', 'O', 'X'][self.board[3 * j + i]] for i in range(3)]
            )
            for j in range(3)
        ]))

    def spot_string(self, i, j):
        return ["_", "O", "X"][self.board[3 * j + i]]

    def scoring(self):
        opp_won = self.lose()
        i_won = self.lose(who=self.nplayer)
        if opp_won and not i_won:
            return -100
        if i_won and not opp_won:
            return 100
        return 0

    def winner(self):
        if self.lose(who=2):
            return "AI Wins"
        return "Tie"


TEXT = '''
<!doctype html>
<html>
  <head><title>Tic Tac Toe</title></head>
  <body>
    <h1>Tic Tac Toe</h1>
    <h2>{{msg}}</h2>
    <form action="" method="POST">
      <table>
        {% for j in range(2, -1, -1) %}
        <tr>
          {% for i in range(0, 3) %}
          <td>
            <button type="submit" name="choice" value="{{j*3+i+1}}"
             {{"disabled" if ttt.spot_string(i, j)!="_"}}>
              {{ttt.spot_string(i, j)}}
            </button>
          </td>
          {% endfor %}
        </tr>
        {% endfor %}
      </table>
      <button type="submit" name="reset">Start Over</button>
    </form>
  </body>
</html>
'''

app = Flask(__name__)
ai_algo = Negamax(6)


@app.route("/", methods=['GET', 'POST'])
def play_game():
    ttt = TicTacToe([Human_Player(), AI_Player(ai_algo)])
    game_cookie = request.cookies.get('game_board')
    if game_cookie:
        ttt.board = [int(x) for x in game_cookie.split(",")]
    if "choice" in request.form:
        ttt.play_move(request.form["choice"])
        if not ttt.is_over():
            ai_move = ttt.get_move()
            ttt.play_move(ai_move)
    if "reset" in request.form:
        ttt.board = [0 for i in range(9)]
    if ttt.is_over():
        msg = ttt.winner()
    else:
        msg = "play move"
    resp = make_response(render_template_string(TEXT, ttt=ttt, msg=msg))
    c = ",".join(map(str, ttt.board))
    resp.set_cookie("game_board", c)
    return resp


if __name__ == "__main__":
    app.run()

 * Serving Flask app "__main__" (lazy loading)
 * Environment: production
   Use a production WSGI server instead.
 * Debug mode: off


 * Running on http://127.0.0.1:5000/ (Press CTRL+C to quit)


# Movimientos

### Resultados

**1
<img src="img/tic1.png">
2
<img src="img/tic2.png">
3
<img src="img/tic3.png">
4
<img src="img/tic4.png">
5
<img src="img/tic5.png">
6**
<img src="img/tic6.png">