<img src="images/logo.png" width="200">

# KogSys-KI-B - Assignment 2

### Adversarial Search, Constraint Satisfaction Problems

_Abgabefrist: **15.06.2025**_

---



#### Abgabe Informationen

Laden Sie Ihre Lösung über den VC-Kurs hoch. Bitte laden Sie **ein Zip-Archiv** pro Gruppe hoch. Dieses muss enthalten:

- Ihre Lösung als **Notebooks** (pro Gesamtaufgabe eine `.ipynb`-Datei)
- Ein Ordner mit dem Namen **images**, der alle Ihre Bilder enthält, falls Sie welche verwendet haben (halten Sie die Bildgrößen relativ klein)

Ihr Zip-Archiv sollte wie folgt benannt werden:

```
assignment_<Assignmentnummer>_solution_<Gruppennummer>.zip
```

In dieser Aufgabe können Sie insgesamt **30 Punkte** erreichen. Von diesen Punkten werden **3 Bonuspunkte** für die Prüfung wie folgt berechnet:

| **Points in Assignment** | **Bonus Points for Exam** |
| :----------------------: | :-----------------------: |
|            30            |             3             |
|            25            |            2.5            |
|            20            |             2             |
|            15            |            1.5            |
|            10            |             1             |
|            5             |            0.5            |

<div class='alert alert-block alert-danger'>

##### **Wichtige Hinweise**

1. **Diese Aufgabe wird benotet. Sie können Bonuspunkte für die Prüfung erwerben.**
2. **Wenn offensichtlich ist, dass eine Aufgabe von einer anderen Quelle kopiert wurde und keine eigenständige Arbeit geleistet wurde, werden keine Bonuspunkte vergeben. Bitte formulieren Sie alle Antworten in Ihren eigenen Worten!**
3. **Falls LLMs (wie ChatGPT oder Copilot) zur Erstellung Ihrer Einreichung verwendet wurden, geben Sie dies bitte gemäß den gängigen wissenschaftlichen Praktiken an. Siehe auch die [KI Policy im VC-Kurs](https://vc.uni-bamberg.de/mod/page/view.php?id=1980835)**

### Setup

Um euer Assignment aufzusetzen, müsst ihr die notwendigen pakete installieren, welche in der Datein `requirements.txt` gelistet sind. Dies könnt ihr machen, indem ihr die folgende Zelle ausführt.

In [43]:
# Installiert die benötigten Pakete mit dem akutell ausgewählten Python-Interpreter
%pip install -U -r requirements.txt

Note: you may need to restart the kernel to use updated packages.


### Bibliotheks-Imports

**_Import von Bibliotheken._** In der folgenden Zelle werden einige wichtige Bibliotheken importiert. Dies soll hier kurz erläutert werden. Verwenden Sie keine anderen Drittanbieterbibliotheken.

- `dataclasses.dataclass`: Einfache Erstellung von Immuatablen Klassen.
- `dataclasses.field`: Funktionen verwenden um Standart-Werte in `@dataclasses` festzulegen.
- `random`: Zufallszahlen erhalten.
- `typing.List`: Wird für Typanmerkungen in den Methodenspezifikationen benötigt.
- `connect4.Player` und `connect4.GameEngine`: Importiert den von uns vorgegebenen, ausgelagerten, Code. Dieser muss nicht selbst nachvollzogen werden.

**_In der nächsten Codezelle muss nichts geändert werden._**

In [44]:
# Python Core libraries
from dataclasses import dataclass, field
import random
from typing import List, Optional

# Connect4 Game Engine
from connect4 import Player, Connect4GameEngine, BoardType

## Aufgabe 1 | Adversarial Search am Beispiel "4 Gewinnt"

_Für insgesamt <mark>15</mark> Punkte_

In dieser Aufgabe wollen wir [4 Gewinnt](https://de.wikipedia.org/wiki/Vier_gewinnt) gegen unseren Computer spielen. Hierzu soll ein aus der Vorlesung bekannter Algorithmus für _Adversarial Games_ implementiert werden.

Betrachtet und versteht den gegebenen Code jedoch zuerst!

#### Spielfeld aufbauen

Im Folgenden definieren wir eine Funktion, und zwei Konstanten, welche es uns erlauben unser Spielfeld als zweidimensionale Liste zu erstellen.
Somit haben wir eine Matrix der Form:

```python
[
# Spalte  0     1     2     3     4     5     6  
        [None, None, None, None, None, None, None],  # Zeile 0
        [None, None, None, None, None, None, None],  # Zeile 1
        [None, None, None, None, None, None, None],  # Zeile 2
        [None, None, None, None, None, None, None],  # Zeile 3
        [None, None, None, None, None, None, None],  # Zeile 4
        [None, None, None, None, None, None, None]   # Zeile 5
]
```

***In der nächsten Codezelle muss nichts geändert werden.***

In [45]:
# The size of the game grid.
GRID_ROWS = 6
GRID_COLUMNS = 7


def create_grid() -> List[List[Optional[Player]]]:
    """
    Create a new grid of the correct size.

    :returns grid: The new grid.
    """
    return [[None] * GRID_COLUMNS for _ in range(GRID_ROWS)]

#### **(02.1.1)** Spielfeld Logik

_Für <mark>3</mark> Punkte_

Da wir nun wissen wie wir das Spielfeld speichern, wollen wir dies in einer Klasse umsetzen. Diesen Teil haben wir euch schon vorgegeben. Eure Aufgabe ist es nun, die beiden fehlenden Methoden `valid_moves` und `get_winner` zu implementieren. Zusätzlich dürft ihr natürlich weitere Funktionen implementieren, jedoch die vorgegebene Funktion `drop_in_column` nicht ändern!

##### Methode `valid_moves`
Diese Methode soll eine Liste aller Spalten zurückgeben, in die aktuell noch ein Spielstein geworfen werden kann. Vergesst nicht, das unser Spielfeld mit einem _Zero-Index_ arbeitet!

#### Methode `is_game_over`
Diese Methode soll überprüfen, ob das Spiel vorbei ist, weil es entweder bereits einen Gewinner gibt, oder weil kein Zug mehr möglich ist..

#### Methode `get_winner`
Diese Methode soll den Gewinner des aktuellen Spiels zurückgeben, oder eben `None`, falls es noch keinen gibt.

<details>

<summary>Tipp</summary>

Eine neue Hilfsfunktion kann euch die Arbeit erleichtern!

</details>


In [46]:
@dataclass(frozen=True)
class Board(BoardType):
    """The game board."""

    grid: List[List[Optional[Player]]] = field(default_factory=create_grid)

    def drop_in_column(self, player: Player, column: int) -> "Board":
        """
        Drop a disc for the given player in the given column.

        :param player: The player who should drop a disk.
        :param column: The column in which to drop a disk.
        :returns board: The resulting board.
        """
        for row in reversed(range(len(self.grid))):
            if not self.grid[row][column]:
                new_grid = [list(r) for r in self.grid]

                new_grid[row][column] = player

                return Board(grid=new_grid)

        raise ValueError(f"Could not drop in '{column}' for '{player.name}', is it full?")

    def valid_moves(self) -> List[int]:
        """
        Get all columns in which a disc can be dropped.
        
        :returns valid_moves: columns in which a disc can be dropped.
        """
        valid_moves = []
        for column in range(GRID_COLUMNS):
            if self.grid[0][column] is None:
                valid_moves.append(column)
        return valid_moves
    
    def is_game_over(self) -> bool:
        """
        Determine if the game is over.

        :returns over: If the game is over.
        """
        return self.get_winner() is not None

    def get_winner(self) -> Optional[Player]:
        """
        Get the currently winning player.

        :returns winner: The currently winning player or None if there is no winner (game not over / tie).
        """
        for row in range(GRID_ROWS):
            for col in range(GRID_COLUMNS):
                if self.grid[row][col] is not None:
                    player = self.grid[row][col]

                    # Check for horizontal match
                    if col + 3 < GRID_COLUMNS and all(self.grid[row][c] == player for c in range(col, col + 4)):
                        return player
                    
                    # Check for vertical match
                    if row + 3 < GRID_ROWS and all(self.grid[r][col] == player for r in range(row, row + 4)):
                        return player
                    
                    # Check diagonal bottom to top
                    if row + 3 < GRID_ROWS and col + 3 < GRID_COLUMNS and all(self.grid[row + d][col + d] == player for d in range(4)):
                        return player
                    
                    # Check diagonal top to bottom
                    if row - 3 >= 0 and col + 3 < GRID_COLUMNS and all(self.grid[row - d][col + d] == player for d in range(4)):
                        return player
        return None


#### **(02.1.2)** KI Gegner

_Für <mark>12</mark> Punkte_

Nun haben wir ein funktionsfähiges Spielfeld. Jetzt sollten wir uns darauf konzentrieren einen Gegner zu bauen.

Die aktuelle Implementierung von `ai_next_move` wählt eine zufälligen erlaubte Spalte aus, dies macht den Gegner jedoch ziemlich einfach zu besiegen. Implementiert deshalb einen Algorithmus _aus der Vorlesung_ eurer Wahl. Vergesst nicht, dass auch die Spalten mit einem _Zero-Index_ arbeiten, sprich wenn in Spalte 1 ein Spielstein geworfen werden soll, muss eure Funktion `0` zurückgeben.

Natürlich dürft ihr auch wieder weitere Funktionen definieren.

**Wichtig:** Vier-Gewinnt ist möglicherweise mit manchen der Algorithmen aus der Vorlesung nicht sehr performant. Macht entsprechend Anpassungen an eurer Implementation, um schneller Ergebnisse zu erhalten. Ihre Implementation muss in der Lage sein, einen Zug **in weniger als 30 Sekunden** zurückzugeben.

Bitte erklärt euren Ansatz und zusätzliche Anpassungen
 
<details>

<summary>Tipps</summary>

Ihr erhaltet in der Funktion, zusätzlich zum Spielfeld noch den `ai_player`, welcher einen guten Zug machen sollte. Auch erhaltet ihr den `opponent`, für welchen der Zug schlecht sein sollte.

Diese Spieler werden im `grid` des `Board`s gespeichert, sprich, wenn `board.grid[0][0] == ai_player` gilt, hat der KI-Spieler einen Spielstein im oberen linken Feld.

Eine mögliche Anpassung ist, dem Algorithmus ein zusätzliches Argument `depth` zu übergeben, welches die Rekursionstiefe limitiert. Wählt hierfür einen sinnvollen Wert aus.

Wenn euer Algorithm Tiefen-Limitiert ist, wie entscheiden sie den Score für einen nicht-Endzustand?

</details>

> 
> Implemtierung eines Minimax-Algorithmus mit alpha beta pruning

> Wurde nach überlegen so eingebaut, da ein reiner minimax zu langsam war 

> Höhere Depth ist möglich (kommen nicht mehr über die 30 Sekunden)
> 

In [None]:
def ai_next_move(board: BoardType, ai_player: Player, opponent: Player) -> int:
    """
    Get the next column the AI should put a disk in.

    :param ai_player: The instance of the AI player.
    :param opponent: The instance of the other player.
    :param board: The current game board.
    :returns column: The column in which to put a disk. This is zero indexed from left to right!
    """
    # Nurzung von AB Pruning, wenn es mehr als einen möglichen Zug gibt (optimierunszwecke)
    valid_moves = board.valid_moves()
    assert len(valid_moves) > 0, "No moves possible."

    # Bei nur einem möglichen Zug gibt es keine Entscheidung zu treffen
    if len(valid_moves) == 1:
        return valid_moves[0]

    # Bei einem möglichen Sieg oder Verhinderung eines Siegs
    for column in valid_moves:
        if board.drop_in_column(ai_player, column).get_winner() == ai_player:
            return column
        if board.drop_in_column(opponent, column).get_winner() == opponent:
            return column

    # Minimax with alpha-beta pruning
    best_score = float('-inf')
    best_move = valid_moves[0]
    depth = 5  # Anpassen für mehr oder weniger Tiefe

    # Iteriere über alle gültigen Züge
    for move in valid_moves:
        new_board = board.drop_in_column(ai_player, move)
        score = minimax_ab(new_board, depth, False, ai_player, opponent, float('-inf'), float('inf'))
        if score > best_score:
            best_score = score
            best_move = move
    return best_move

def minimax_ab(board: BoardType, depth: int, maximizing: bool, ai_player: Player, opponent: Player, alpha: float, beta: float) -> int:
    """
    Minimax algo mit Alpha-Beta Pruning.
    :param board: Das aktuelle Spielfeld.
    :param depth: Die maximale Tiefe des Minimax-Algorithmus.
    :param maximizing: Ob der aktuelle Spieler maximiert oder minimiert.
    :param ai_player: Der AI-Spieler.
    :param opponent: Der Gegner des AI-Spielers.
    :param alpha: Der beste Wert, den der Maximierer bisher gefunden hat.
    :param beta: Der beste Wert, den der Minimierer bisher gefunden hat.
    :returns score: Der Score für den aktuellen Zug.
    """
    winner = board.get_winner()

    # Schauen ob das Spiel zu Ende ist
    if winner == ai_player:
        return 100000
    elif winner == opponent:
        return -100000
    elif depth == 0 or not board.valid_moves():
        return heuristic(board, ai_player)

    if maximizing:
        max_eval = float('-inf')
        # Iteriere über alle gültigen Züge
        for move in board.valid_moves():
            eval = minimax_ab(board.drop_in_column(ai_player, move), depth - 1, False, ai_player, opponent, alpha, beta)
            max_eval = max(max_eval, eval)
            alpha = max(alpha, eval)
            if beta <= alpha:
                break
        return max_eval
    else:
        min_eval = float('inf')
        # Iteriere über alle gültigen Züge
        for move in board.valid_moves():
            eval = minimax_ab(board.drop_in_column(opponent, move), depth - 1, True, ai_player, opponent, alpha, beta)
            min_eval = min(min_eval, eval)
            beta = min(beta, eval)
            if beta <= alpha:
                break
        return min_eval

def heuristic(board: BoardType, ai_player) -> int:
    # Schnellere Heuristik zur Bewertung des Spielfelds
    def count_patterns(player, length):
        count = 0
        for row in range(GRID_ROWS):
            for col in range(GRID_COLUMNS):
                for dx, dy in [(1,0),(0,1),(1,1),(1,-1)]:
                    try:
                        if all(
                            0 <= row+dx*i < GRID_ROWS and
                            0 <= col+dy*i < GRID_COLUMNS and
                            board.grid[row+dx*i][col+dy*i] == player
                            for i in range(length)
                        ):
                            # Schauen ob es eine Lücke gibt, die den Sieg verhindern könnte
                            before = (row-dx, col-dy)
                            after = (row+dx*length, col+dy*length)
                            if (not (0 <= before[0] < GRID_ROWS and 0 <= before[1] < GRID_COLUMNS) or board.grid[before[0]][before[1]] != player) and \
                               (not (0 <= after[0] < GRID_ROWS and 0 <= after[1] < GRID_COLUMNS) or board.grid[after[0]][after[1]] != player):
                                count += 1
                    except IndexError:
                        continue
        return count

    opponent = None
    # Finde den Gegner, der nicht der AI-Spieler ist
    for row in board.grid:
        for cell in row:
            if cell is not None and cell != ai_player:
                opponent = cell
                break
        if opponent:
            break
    
    # Zähle die Muster für den AI-Spieler und den Gegner
    ai_3 = count_patterns(ai_player, 3)
    ai_2 = count_patterns(ai_player, 2)
    opp_3 = count_patterns(opponent, 3) if opponent else 0
    opp_2 = count_patterns(opponent, 2) if opponent else 0

    return 100*ai_3 + 10*ai_2 - 120*opp_3 - 15*opp_2

### Spielen

Nun könnt ihr euren Algorithmus testen - und gegen diesen Vier gewinnt spielen. Führt die folgende Code-Zelle aus um das Spiel zu starten. Natürlich dürft ihr die Code-Zelle auch anpassen um z.B. weitere Spieler hinzuzufügen oder die Spieler auszutauschen.

<details>
  <summary>Spieler erstellen und austauschen</summary>

  - **KI-Spieler**: Erstelle mit `Player.ai(name="Name", move=ai_next_move)`:
    ```python
    AI_PLAYER_1 = Player.ai(name="AI 1", move=ai_next_move)
    ```

    Die Funktion `ai_next_move` kann natürlich auch durch eine andere Funktion ersetzt werden, sie muss lediglich die korrekte Signatur, wie durch `ai_next_move` vorgegeben, haben.

  - **Menschlicher Spieler**: Erstelle mit `Player.human(name="Name")`:
    ```python
    HUMAN_PLAYER_1 = Player.human(name="Human 1")
    ```
  - **Spieler austauschen**: Ändere `player0` und `player1` in `GameEngine`:
    ```python
    game = GameEngine(board=Board(), player0=HUMAN_PLAYER_1, player1=AI_PLAYER_1)
    ```

</details>

<details>
  <summary>Spielfeld austauschen</summary>

Standardmäßig startet das Spiel mit einem leeren Spielfeld der Größe `GRID_ROWS x GRID_COLUMNS`. Falls ihr gezielt bestimmte Spielsituationen testen möchtet, könnt ihr mit dem vorausgefüllten `Board` `EXAMPLE_BOARD` starten, tauscht hierzu einfach in der nächsten Zelle den Wert für `board=` aus.

_Natürlich dürft ihr das `EXAMPLE_BOARD` auch ändern oder weitere Beispiele bauen. Um den Suchraum zu verkleinern könnt ihr auch ein kleineres Spielfeld übergeben._

</details>

<br>

<div class="alert-warning" style="padding: 0.5rem">
Das Spiel funktioniert nur, wenn ihr die Aufgabe 02.1.1 korrekt bearbeitet habt. Solltet ihr daher eine Fehlermeldung erhalten, prüft ob im Stacktrace irgendwo auf euren Code verwiesen wird!
</div>


In [48]:
AI_PLAYER_1 = Player.ai(name="AI 1", move=ai_next_move)
AI_PLAYER_2 = Player.ai(name="AI 2", move=ai_next_move)

HUMAN_PLAYER_1 = Player.human(name="Human 1")
HUMAN_PLAYER_2 = Player.human(name="Human 2")

EMPTY_BOARD = Board()
EXAMPLE_BOARD = Board(grid=[
    [None,        None,           None,           None, None, None, None], 
    [None,        None,           None,           None, None, None, None], 
    [None,        None,           None,           None, None, None, None], 
    [None,        None,           HUMAN_PLAYER_1, None, None, None, None], 
    [None,        AI_PLAYER_1,    HUMAN_PLAYER_1, None, None, None, None],
    [AI_PLAYER_1, HUMAN_PLAYER_1, AI_PLAYER_1,    None, None, None, None],
])

In [None]:
# You are allowed to change the values for "board", "player0" and "player1" so you can challenge algorithms against each other or to play with your friends!
connect4 = Connect4GameEngine(
    board=EMPTY_BOARD, 
    player0=HUMAN_PLAYER_1,
    player1=AI_PLAYER_1
)

connect4.start()

Output()

Output()


#### **(02.1.3, optional)** 4-Gewinnt Turnier

*Für bis zu <mark>10 zusätzliche</mark> Punkte*

<details>
<summary>Hinweis zu den Zusatzpunkten</summary>
Ihr könnt bis zu 10 zusätzliche Punkte erhalten, wenn ihr am Turnier teilnehmt. Die Zusatzpunkte werden basierend auf der Leistung eurer KI im Turnier vergeben.

Die Punkte werden zu eurer Gesamtpunktzahl der Abgaben hinzugefügt, jedoch kann das Maximum von 10 Bonuspunkten für die Prüfung nicht überschritten werden. Das bedeutet: Wenn ihr bereits alle 100 Punkte aus den Abgaben gesammelt habt, ändert sich nichts. Wenn ihr jedoch z. B. nur 80 Punkte gesammelt habt, könnt ihr bis zu 9 Bonuspunkte für die Prüfung erhalten.

</details>

Das Turnier findet am **17. Juni 2025** während der Übung statt. Um teilzunehmen, müsst ihr im folgenden Markdown-Abschnitt einen Teamnamen eintragen. (Der Teamname dient der Anonymität und stellt sicher, dass ihr teilnehmen möchtet.)

Die Punktevergabe richtet sich nach der Leistung eurer KI im Turnier. Je höher eure Gewinnrate, desto mehr Punkte erhaltet ihr. Die Formel zur Berechnung der Punkte lautet:

```python
Points_i = round(10 * (W_i / W_max))
```

wobei `W_i` das Gewinnverhältnis eures KI-Agenten ist und `W_max` das beste Gewinnverhältnis aller KI-Agenten im Turnier.


## Aufgabe 2 - Bedingungserfüllungsprobleme (CSP) am Beispiel "Hashiwokakero"

_Für insgesamt <mark>15</mark> Punkte_

<div class="alert-warning" style="padding: 0.5rem">

Diese Aufgabe wird in der separaten Datei `assignment_2_task_2_german.ipynb` bearbeitet.

</div>

Diese Aufgabe implementiert einen **Constraint Satisfaction Problem (CSP) Solver** für das [Hashiwokakero Puzzel-Spiel](https://de.wikipedia.org/wiki/Hashiwokakero). Ihre Aufgabe ist es, die CSP-Solver Implementierung vervollständigen.

Ihr könnt das Spiel selbst hier ausprobieren: https://de.hashi.info/.

## CSP Formulierung:
* **Variables (X)**: Potentielle Brücken zwischen benachbarten Inseln
* **Domains (D)**: Anzahl Brücken (0, 1, oder 2) zwischen Inselpaaren
* **Constraints (C)**:
  - Jede Insel muss exakt die durch ihre Zahl angegebene Anzahl Brücken haben
  - Brücken können sich nicht kreuzen
  - Brücken können nur horizontal oder vertikal verlaufen
  - Alle Inseln müssen verbunden sein um einen einzigen Graphen zu bilden

