In [None]:
%%html
<style>
.container {
  width: 100%;
}
</style>

In [None]:
%load_ext nb_mypy

In [None]:
import nbimporter
from AIBaseClass import ChessAI

# Aufgabe 02: Minimax (einfacher Materialwert)

Diese Klasse implementiert den Minimax-Algorithmus zur Berechnung des nächsten Zuges im Mittelspiel. Die Evaluierung eines Boards wird dabei durch Betrachtung des Materialwertes der Figuren realisiert.

Die Klasse wird um eine neue Konstante `DEPTH` erweitert. Diese gibt an, wie viele zukünftige Halbzüge bei der Berechnung des nächsten Zuges betrachtet werden sollen, das heißt, welche Höhe der entsprechende Baum aller möglichen nächsten Halbzüge aufweist. Die Konstante wird als Parameter übergeben und im Konstruktor gesetzt.

In [None]:
import chess
import os

class Exercise02AI(ChessAI):
    """Chooses middle game moves using minimax algorithm and material values"""

    def __init__(self, player_name: str, search_depth: int = 3) -> None:
        super().__init__(player_name)
        self.DEPTH = int(os.environ.get("depth", search_depth))
        self.evaluations: dict[str, int] = {}

## Evaluierungsfunktion

Die Evaluierungsfunktion `evaluate` nimmt ein Board als Argument und berechnet eine Ganzzahl als Maß dafür, ob die gegebene Stellung für den weißen Spieler eher zu einem Sieg (positiver Wert) oder zu einer Niederlage (negativer Wert) führt.

Diese Implementierung verwendet dafür den Materialwert (Tauschwert in Bauerneinheiten) nach folgender Tabelle:

| Figurname  | Materialwert |
|---|---|
| Bauer (pawn) | 1  |
| Springer (knight) | 3  |
| Läufer (bishop) | 3  |
| Turm (rook) | 5  |
| Dame (queen) | 9  |
| König (king) | 20000 |

Für die Berechnung des nächsten Schrittes stehen mehrere Funktionen zur Verfügung:

- `full_evaluate`
- `get_cache_evaluation`
- `incremental_evaluate`
- `evaluate`

Die Funktion `full_evaluate` berechnet den Wert eines Boards von Grund auf neu und geht dabei wie folgt vor:

1. Es wird für jede Figur und für jede Farbe die Anzahl der Spielfiguren ermittelt.
2. Für jede Figur wird die Differenz der Anzahl pro Farbe gebildet ($\texttt{Weiß} - \texttt{Schwarz}$)
3. Jede Differenz wird mit dem figurenspezifischen Faktor multipliziert und zur Gesamtsumme addiert.

`get_cache_evaluation` greift auf den angelegten Cache zu, gibt den dort gespeicherten Wert zurück oder ruft die Funktion `full_evaluate` auf falls kein Eintrag vorhanden ist. 
Die Funktion `incremental_evaluate` greift über die zuvor beschriebene Cache-Funktion auf das bereits berechnete Board zurück, prüft die Änderung zum aktuellen Board und berechnet anhand dessen die Differenz. Hierfür werden die drei Fälle untersucht in denen sich der Wert verändert haben kann:

1. Ein En Passant Zug wurde durchgeführt
2. Eine Figur wurde geschlagen
3. Ein Bauer wurde in eine neue Figur umgewandelt

Die Funktion `evaluate` speichert den Rückgabewert der inkrementellen Berechnung im Cache und gibt ihn anschließend zurück.

In [None]:
class Exercise02AI(Exercise02AI): # type: ignore
    MATERIAL_VALUES = {
        chess.PAWN: 1,
        chess.KNIGHT: 3,
        chess.BISHOP: 3,
        chess.ROOK: 5,
        chess.QUEEN: 9,
        chess.KING: 20000
    }

    def full_evaluate(self, board: chess.Board) -> int:
        """Returns a full evaluation of the given board."""
        evaluation = 0
        for piece_type in chess.PIECE_TYPES:
            # Get the amount of pieces on the board per color
            amount_type_white   = len(board.pieces(piece_type,   chess.WHITE))
            amount_type_black   = len(board.pieces(piece_type,   chess.BLACK))
            # Get difference
            diff = amount_type_white - amount_type_black
            # Calculate material value
            evaluation += self.MATERIAL_VALUES[piece_type] * diff
        return evaluation

    def get_cache_evaluation(self, board: chess.Board) -> int:
        """Returns the evaluation for the given board from the cache."""
        # Calculate dictionary key
        short_fen = board.fen().split(" ")[0]
        # Get evaluation from cache
        evaluation = self.evaluations.get(short_fen)
        # Calculate if there is no evaluation yet
        if evaluation is None:
            evaluation = self.full_evaluate(board)
            self.evaluations[short_fen] = evaluation
        return evaluation

    def incremental_evaluate(self, board: chess.Board) -> int:
        """Returns an incrementally calculated evaluation of the given board."""
        # Get and remove last move
        move = board.pop()
        # Start with old evaluation as base value
        evaluation = self.get_cache_evaluation(board)
        change = 0
        
        if board.is_en_passant(move):
            change = self.MATERIAL_VALUES[chess.PAWN]

        if captured_piece_type := board.piece_type_at(move.to_square):
            change = self.MATERIAL_VALUES[captured_piece_type]

        if promotion_piece_type := move.promotion:
            change = self.MATERIAL_VALUES[promotion_piece_type] - self.MATERIAL_VALUES[chess.PAWN]
        
        # Add to old evaluation if white to move, else subtract
        factor = +1 if board.turn else -1
        evaluation += change * factor
        # Restore board
        board.push(move)
        return evaluation

    def evaluate(self, board: chess.Board) -> int:
        """Evaluates a given board. 
        Returns a positive value if white has a better material value than black."""
        # Calculate new dictionary key
        short_fen = board.fen().split(" ")[0]

        # Calculate evaluation incrementally
        evaluation = self.incremental_evaluate(board)

        # Save evaluation
        self.evaluations[short_fen] = evaluation
        return evaluation

## Fünffache Stellungswiederholung

Im Schach besagt die `fivefold repetition`-Regel, dass ein Spiel sofort als Remis gewertet wird, falls sich eine Stellung zum fünften Mal wiederholt. Zwei Stellungen gelten dabei als gleich g. d. w. die Boardbelegung (Farbe, Figurtyp, Position) und die möglichen Züge dieselben sind.
Die Prüfung auf eine Stellungswiederholung ist in der `chess`-Bibliothek sehr langsam, da im schlechtesten Fall das gesamte Spiel neu durchlaufen werden muss (siehe Dokumentation). Die Funktion `maybe_repetitions` führt daher nur eine einfache Prüfung mithilfe der Boardbelegung durch und gibt die Anzahl der möglichen Wiederholungen der aktuellen Position zurück. Das Restrisiko, dass eine erkannte Wiederholung keine solche ist (z.B. andere Rochade-Rechte oder En-Passant-Züge möglich) wird akzeptiert, da es als sehr gering eingestuft wird. Diese einfache Prüfung wird innerhalb des Minimax-Algorithmus verwendet, nach jedem abgeschlossenen Zug findet ein vollständiger Test statt.

In [None]:
class Exercise02AI(Exercise02AI): # type: ignore

    def maybe_repetitions(self, board: chess.Board) -> int:
        """Does a fast check if the current position has repeated multiple
        times and returns the number of repetitions.
        Does NOT check for castling rights and en passant captures."""
        # Fast check, based on occupancy only.
        maybe_repetitions = 1
        for state in reversed(board._stack):
            if state.occupied == board.occupied:
                maybe_repetitions += 1
        return maybe_repetitions

## Minimax

Die rekursive `minimax`-Funktion betrachtet bei einem gegebenen Board alle möglichen Stellungen (Boards) nach einer gegebenen Anzahl von Halbzügen (Tiefe) und gibt die beste Evaluierung (`evaluate`-Funktion) für den aktuellen Spieler zurück.

Die Konstante `LIMIT` wird als obere (+) beziehungsweise untere (-) Schranke für den Vergleich innerhalb der ersten Iteration verwendet.

Folgende Fälle werden unterschieden:

1. Falls das Spiel beendet ist, werden die drei folgenden Möglichkeiten unterschieden:
    - Das Spiel ist ein Remis:
    In diesem Fall wird 0 als Wert zurückgegeben. Der Zug welcher zu diesem Zustand führt wird also nur gewählt, sofern jeder andere Zug zu einem für die Seite schlechteren Wert (und somit eher zu einer Niederlage) führt.
    - Weiß hat das Spiel gewonnen:
    Hier wird das positive Limit (`99999`) zurückgegeben, welches auf jeden Fall größer oder gleich dem Evaluierungswert aller anderen Züge ist. Weiß wird daher diesen (oder einen in dieser Hinsicht gleichwertigen) Zug wählen um das Spiel zu gewinnen, Schwarz versucht den Zug möglichst zu vermeiden.
    - Schwarz hat das Spiel gewonnen:
    Das negative Limit (`-99999`) wird zurückgegeben. Dieses ist auf jeden Fall kleiner oder gleich dem Evaluierungswert aller anderen Züge. Schwarz wird daher diesen (oder einen in dieser Hinsicht gleichwertigen) Zug wählen um das Spiel zu gewinnen, Weiß versucht den Zug möglichst zu vermeiden.
2. Falls die Tiefe Null ist, wird die Auswertung des aktuellen Boards zurückgegeben (Rekursionsende).
3. Falls Weiß am Zug ist, wird jeder mögliche Zug rekursiv evaluiert und das Maximum der Ergebnisse zurückgegeben.
4. Falls Schwarz am Zug ist, wird jeder mögliche Zug rekursiv evaluiert und das Minimum der Ergebnisse zurückgegeben.

**Hinweis**:
Aufgrund der Prüfung auf die `fivefold repetition`-Regel (durch die Funktion `maybe_repetitions`) ist der hier implementierte Minimax-Algorithmus nicht nur von dem aktuellen Board (FEN), sondern auch von den bereits gespielten Zügen (Stack) abhängig.

In [None]:
class Exercise02AI(Exercise02AI): # type: ignore
    LIMIT = 99999

    def minimax(self, board: chess.Board, depth: int) -> tuple[int, chess.Move | None]:
        """Searches the best value with given depth using minimax algorithm"""
        best_move = None

        if board.is_checkmate() and not board.turn:
            # White has won the game
            return self.LIMIT, None
        elif board.is_checkmate() and board.turn:
            # Black has won the game
            return -self.LIMIT, None
        # Check if game is over
        elif board.is_insufficient_material() or not board.legal_moves or board.is_fifty_moves() or self.maybe_repetitions(board) > 4:
            # Game is very likely a draw
            return 0, None

        # Recursion abort case
        if depth == 0:
            return self.evaluate(board), None

        # White to play (positive numbers are good)
        if board.turn:
            maxEvaluation = -self.LIMIT
            for move in sorted(board.legal_moves, key=lambda move: move.uci()):
                board.push(move)
                evaluation, _ = self.minimax(board, depth - 1)
                board.pop()
                if depth == self.DEPTH and evaluation >= maxEvaluation:
                    best_move = move
                maxEvaluation = max(maxEvaluation, evaluation)
            return maxEvaluation, best_move

        # Black to play (negative numbers are good)
        else:
            minEvaluation = self.LIMIT
            for move in sorted(board.legal_moves, key=lambda move: move.uci()):
                board.push(move)
                evaluation, _ = self.minimax(board, depth - 1)
                board.pop()
                if depth == self.DEPTH and evaluation <= minEvaluation:
                    best_move = move
                minEvaluation = min(minEvaluation, evaluation)
            return minEvaluation, best_move

## Berechnung des besten Zuges

Die Funktion `get_next_middle_game_move` berechnet auf einem gegebenen Board den besten nächsten Zug. Dabei wird jeder mögliche Zug mithilfe der `minimax`-Funktion in der gewünschten Tiefe evaluiert und der Zug mit der besten Bewertung zurückgegeben.

In [None]:
class Exercise02AI(Exercise02AI): # type: ignore
    def get_next_middle_game_move(self, board: chess.Board) -> chess.Move | None:
        """Gets the best next move"""
        _, best_move = self.minimax(board, self.DEPTH)
        return best_move

## Debugging Bereich

Die folgenden Zellen enthalten Code zum Testen der oben implementierten Funktionen.

In [None]:
class Exercise02AI(Exercise02AI): # type: ignore
    def get_next_middle_game_move_debug(self, board: chess.Board) -> chess.Move | None:
        """Debugging version of get_next_middle_game_move: saves move path of best result"""
        if board.is_game_over():
            return None
        # Debugging start
        Exercise02AI.path_history = {}
        # Debugging end
        best_move_val = -self.LIMIT if board.turn else self.LIMIT
        final_move = None

        for move in sorted(board.legal_moves, key=lambda move: move.uci()):
            board.push(move)
            move_val = self.minimax_debug(board, self.DEPTH)
            # IF best value <= current value AND white to play OR best value >= current value AND black to play
            if (move_val <= best_move_val) and board.turn or (move_val >= best_move_val) and not board.turn:
                best_move_val = move_val
                final_move = move
            board.pop()
        return final_move

In [None]:
# Debugging start
from copy import deepcopy
# Debugging end
class Exercise02AI(Exercise02AI): # type: ignore
    LIMIT = 99999

    # Debugging start
    path_history: dict = {}
    # Debugging end

    def minimax_debug(self, board: chess.Board, depth: int) -> int:
        """Debugging version of minimax: saves move path of best result"""
        if board.is_checkmate() and not board.turn:
            # White has won the game
            return self.LIMIT
        elif board.is_checkmate() and board.turn:
            # Black has won the game
            return -self.LIMIT
        # Check if game is over
        elif board.is_insufficient_material() or not board.legal_moves or board.is_fifty_moves() or self.maybe_repetitions(board) > 4:
            # Game is very likely a draw
            return 0

        # Recursion abort case
        if depth == 0:
            return self.evaluate(board)

        # White to play (positive numbers are good)
        if board.turn:
            maxEvaluation = -self.LIMIT
            for move in board.legal_moves:
                board.push(move)
                evaluation = self.minimax_debug(board, depth - 1)
                # Debugging start
                if maxEvaluation <= evaluation:
                    board_copy = deepcopy(board)
                    board_copy.pop()
                    Exercise02AI.path_history[str(board_copy) + str(depth)] = move
                # Debugging end
                board.pop()
                maxEvaluation = max(maxEvaluation, evaluation)
            return maxEvaluation

        # Black to play (negative numbers are good)
        else:
            minEvaluation = self.LIMIT
            for move in board.legal_moves:
                board.push(move)
                evaluation = self.minimax_debug(board, depth - 1)
                # Debugging start
                if minEvaluation >= evaluation:
                    board_copy = deepcopy(board)
                    board_copy.pop()
                    Exercise02AI.path_history[str(board_copy) + str(depth)] = move
                # Debugging end
                board.pop()
                minEvaluation = min(minEvaluation, evaluation)
            return minEvaluation

In [None]:
# Debugging function
from IPython.display import display
def display_path(board_orig, move, depth):
    """Displays the move path to the best evaluation."""
    board = deepcopy(board_orig)
    display(board)
    board.push(move)
    display(board)
    for i in range(depth, 0, -1):
        move = Exercise02AI.path_history[str(board) + str(i)]
        board.push(move)
        display(board)

In [None]:
# Test evaluate
board = chess.Board()
board.set_fen("4k3/8/2n5/7K/5q2/2N5/8/2B5 b - - 0 1")
board.push(list(board.legal_moves)[0])
player = Exercise02AI("Testplayer", 3)
player.evaluate(board)

In [None]:
# Test evaluate
board = chess.Board("4k3/5p2/8/6P1/8/8/8/4K3 b - - 0 1")
board.push(chess.Move.from_uci('f7f5')) # two square pawn move
board.push(chess.Move.from_uci('g5f6')) # en passant capture
player = Exercise02AI("Testplayer", 3)
player.evaluate(board)

In [None]:
%%time
# Test get_next_middle_game_move
DEPTH = 2
board = chess.Board()
board.set_fen("4k3/8/2n5/7K/5q2/2N5/8/2B5 b - - 0 1")
player = Exercise02AI("Testplayer", DEPTH)
#print(player.minimax(board, DEPTH))
move = player.get_next_middle_game_move(board)
print(move)
#display_path(board, move, DEPTH)