In [None]:
%%html
<style>
.container {
  width: 100%;
}
</style>

In [None]:
%load_ext nb_black
%load_ext nb_mypy

In [None]:
import nbimporter
from Exercise03AI import Exercise03AI

# Aufgabe 05: Minimax mit Alpha-Beta-Pruning

Dieses Notebook implementiert den Minimax-Algorithmus mit Alpha-Beta-Pruning (ohne Memoisierung). Hierzu wird die `minimax`-Funktion adaptiert.

In [None]:
import chess


class Exercise05AI(Exercise03AI):
    """Chooses middle game moves using minimax algorithm and alpha-beta-pruning"""

    def __init__(self, **kwargs) -> None:
        super().__init__(**kwargs)

## Minimax (aktualisiert)

Die rekursive `minimax`-Funktion betrachtet bei einem gegebenen Board alle möglichen Stellungen (Boards) nach einer gegebenen Anzahl von Halbzügen (Tiefe) und gibt die beste Evaluierung (`evaluate`-Funktion) für den aktuellen Spieler zurück. Hierfür bekommt die Funktion als Argumente das aktuelle Board (`board`), die Evaluierungstiefe in Halbzügen (`depth`), die Evaluierung des übergebenen Boards (`current_evaluation`), eine untere Grenze für die Evaluierung (`alpha`) und eine obere Grenze für die Evaluierung (`beta`). Zurückgegeben wird ein Tupel bestehend aus der besten Evaluierung und des Halbzuges, der auf den Pfad zu dieser Evaluierung führt.

Die folgende Implementierung des Minimax-Algorithmus ist zu großen Teilen mit der von `Exercise02AI` identisch. Als Neuerung wurde Alpha-Beta-Pruning hinzugefügt. Im Folgenden werden nur die Änderungen betrachtet:

1. Die `minimax`-Funktion bekommt zwei zusätzliche Parameter $\texttt{alpha}$ und $\texttt{beta}$ welche mithilfe von Standardwerten beim ersten Aufruf auf das positive bzw. negative Limit gesetzt werden.
2. Wenn der weiße Spieler am Zug ist (Maximierung) wird `maxEvaluation` auf den Wert $\texttt{alpha}$ gesetzt. Wie bisher wird nun jeder Zug evaluiert. Hierbei wird das Maximum der bisherigen Evaluationen jeweils als neue untere Grenze $\texttt{alpha}$ eingesetzt. Falls eine Evaluierung größer oder gleich $\texttt{beta}$ ist, wird die Suche abgebrochen (pruning) und diese Evaluierung zurückgegeben.
2. Falls der schwarze Spieler am Zug ist (Minimierung) wird `minEvaluation` auf den Wert $\texttt{beta}$ gesetzt. Wie bisher wird nun jeder Zug evaluiert. Hierbei wird das Minimum der bisherigen Evaluationen jeweils als neue obere Grenze $\texttt{beta}$ eingesetzt. Falls eine Evaluierung kleiner oder gleich $\texttt{alpha}$ ist, wird die Suche abgebrochen (pruning) und diese Evaluierung zurückgegeben.

Für einen Aufruf mit Weiß am Zug gilt also: 
$$\texttt{return_value} = \begin{cases}
\texttt{alpha} \quad \textrm{falls} \quad \texttt{evaluation} < \texttt{alpha} \quad \textrm{für alle} \quad \texttt{move} \in \texttt{board.legal_moves},\\
\ge \texttt{beta} \quad \textrm{falls} \quad \texttt{move} \in \texttt{board.legal_moves} \quad \textrm{mit} \quad \texttt{evaluation} \ge \texttt{beta} \quad \textrm{existiert,}\\
\texttt{evaluation} \quad \textrm{sonst}.
\end{cases}$$
Für einen Aufruf mit Schwarz am Zug gilt: 
$$\texttt{return_value} = \begin{cases}
\texttt{beta} \quad \textrm{falls} \quad \texttt{evaluation} > \texttt{beta} \quad \textrm{für alle} \quad \texttt{move} \in \texttt{board.legal_moves},\\
\le \texttt{alpha} \quad \textrm{falls} \quad move \in \texttt{board.legal_moves} \quad \textrm{mit} \quad \texttt{evaluation} \le \texttt{alpha} \quad \textrm{existiert,}\\
\texttt{evaluation} \quad \textrm{sonst}.
\end{cases}$$
Somit ist in beiden Fällen die Spezifikation für das Alpha-Beta-Pruning erfüllt und das Programm liefert dieselbe Auswertung wie die Implementierung in `Exercise02AI`.

In [None]:
from typing import Any


class Exercise05AI(Exercise05AI):  # type: ignore
    def minimax(
        self,
        board: chess.Board,
        depth: int,
        current_evaluation: int,
        alpha: int = -Exercise05AI.LIMIT,
        beta: int = Exercise05AI.LIMIT,
    ) -> tuple[int, chess.Move | None]:
        """Searches the best value with a given depth using the minimax algorithm"""
        self.stats[-1]["nodes"] += 1
        early_abort_evaluation = self.minimax_early_abort(
            board, depth, current_evaluation
        )
        if early_abort_evaluation is not None:
            return early_abort_evaluation, None

        best_move = None

        # White to play (positive numbers are good)
        if board.turn:
            maxEvaluation = alpha
            for move in board.legal_moves:
                board.push(move)
                evaluation, _ = self.minimax(
                    board,
                    depth - 1,
                    self.evaluate(board, current_evaluation),
                    maxEvaluation,
                    beta,
                )
                board.pop()
                if evaluation >= beta:
                    return evaluation, move
                if depth == self.DEPTH and evaluation > maxEvaluation:
                    best_move = move
                maxEvaluation = max(maxEvaluation, evaluation)
            return maxEvaluation, best_move

        # Black to play (negative numbers are good)
        else:
            minEvaluation = beta
            for move in board.legal_moves:
                board.push(move)
                evaluation, _ = self.minimax(
                    board,
                    depth - 1,
                    self.evaluate(board, current_evaluation),
                    alpha,
                    minEvaluation,
                )
                board.pop()
                if evaluation <= alpha:
                    return evaluation, move
                if depth == self.DEPTH and evaluation < minEvaluation:
                    best_move = move
                minEvaluation = min(minEvaluation, evaluation)
            return minEvaluation, best_move

## Debugging Bereich

Die folgenden Zellen enthalten Unit-Tests der oben implementierten Funktionen.

In [None]:
from AIBaseClass import ChessAI
import Exercise02AI as Exercise02AI_

In [None]:
# Create player and board
unit_test_player = Exercise05AI(player_name="Ex05AI", search_depth=3)
board = chess.Board("5rk1/1b3p2/8/3p4/3p2P1/2Q4B/5P1K/R3R3 b - - 0 36")
board

In [None]:
# Use minimax test without memoization
Exercise02AI_.test_minimax(
    unit_test_player,
    board,
    current_evaluation=1240,
    expected_evaluation=325,
    expected_move="d4c3",
    expected_nodes=2788,
)

## Temporärer Bereich

Der folgende Bereich dient zum temporären Debuggen und kann nicht-funktionierenden Code enthalten. Dieser Bereich wird vor der Abgabe entfernt.