In [None]:
%%HTML
<style>
.container { width:100% }
</style>

# Implementierung der Spiellogik

Im Folgenden ist das Spiel Othello implementiert. Ausgangspunkt für diese Implementierung ist das Python Gui für Othello von Kevan Nguyen, welches unter <https://github.com/kevannguyen/Othello> verfügbar ist.

## Importieren der externen Abhängigkeiten

Die Implementation stützt sich für bessere Performanz auf die Python-Bibliothek `numpy` welche unter anderem homogene Felder und Matrizen implementiert.

In [None]:
import numpy

## Globale Konstanten

`BOARD_SIZE` gibt die Anzahl an Zeilen und Spalten des quadratischen Spielfelds an.

Die Konstanten `BLACK`, `WHITE` und `NONE` werden auf die Zahlenwerte -1 , 1 und 0 abgebildet und werden für mehrere Zwecke genutzt:
- zur Repräsentation des Spielbretts
- zur Identifikation eines Spielers
- zur Berechnung der Heuristiken.

In [None]:
BOARD_SIZE = 8

BLACK = -1  # MINIMIZING PLAYER
WHITE = 1  # MAXIMIZING PLAYER
NONE = 0

## Game State

Die Klasse GameState repäsentiert den Spielzustand. Dieser besteht aus dem Spielfeld `board`, welches durch einen Numpy Array repräsentiert wird, sowie dem Spieler `turn`, der am Zug ist.
Zusätzlich werden weitere Informationen im Spielzustand gespeichert welche zur Verbesserung der Performanz genutzt werden.
Diese sind die im aktuellen Spielzustand möglichen Züge, welche in der Variable `possible_moves` gespeichert werden. Außerdem in der Variable `frontier` die Menge der freien Felder, die horizontal, vertikal oder diagonal an einen Stein angrenzen. Beim Ermitteln der möglichen Züge kann dadurch die Performanz gesteigert werden, da nur diese Menge und nicht das gesamte Spielfeld überprüft werden muss.
Weiterhin die Anzahl an Spielsteinen auf dem Spielfeld in der Variable `num_pieces`. In der Variable `game_over`, ob der Zustand ein Endzustand ist. Und zuletzt in der Variable `last_move` die Koordinaten des letzten Spielzugs. Diese Variablen werden im Laufe des Spielverlaufs immer aktuell gehalten. Die Funktion `__lt__` ist implementiert, damit `GameState`-Objekte vergleichbar sind. Das ist nötig, da später Tupel, die z.B. eine Priorität und einen `GameState` enthalten, sortierbar sind. Allerdings ist es nicht wichtig, wie die GameStates sortiert werden.

In [None]:
class GameState:
    def __init__(self):
        self.board = numpy.zeros((BOARD_SIZE, BOARD_SIZE), dtype=numpy.int8)
        self.board[3, 3] = WHITE
        self.board[3, 4] = BLACK
        self.board[4, 3] = BLACK
        self.board[4, 4] = WHITE
        self.turn = BLACK
        self.possible_moves = [(2, 3), (3, 2), (4, 5), (5, 4)]
        self.frontier = {(2, 2), (2, 3), (2, 4), (2, 5),
                         (3, 2), (3, 5), (4, 2), (4, 5),
                         (5, 2), (5, 3), (5, 4), (5, 5)}
        self.num_pieces = 4
        self.game_over = False
        self.last_move = None

    def __lt__(self, other):
        return True

Die Liste `directions` enthält alle horizontalen, vertikalen und diagonalen Richtungen auf dem Spielfeld als Paar von Versätzen in Reihen- und Spaltenrichtung.

In [None]:
directions = [(-1,-1),(0,-1),(1,-1),(-1,0),(1,0),(-1,1),(0,1),(1,1)]

Erhält die Funktion `make_move` ein ungültigen Spielzug, so wird eine `InvalidMoveException` ausgelöst.

In [None]:
class InvalidMoveException(Exception):
    pass

Die Funktion `make_move` führt im Spielzustand `state`, falls möglich, einen Zug auf die Koordinaten `row` und `col` aus.

Dazu werden zunächst alle gegnerischen Steine umgedreht, die durch den Zug eingesperrt wurden. Wenn mindestens ein Stein umgedreht wurde, wird `disks_flipped` auf `True`gesetzt. Wenn das nicht der Fall war, handelt es sich nicht um einen gültigen Zug und es wird eine Exception geworfen. Sonst wird der neue Stein gesetzt und im Zustand die Frontier, der aktuelle Spieler, ob das Spiel vorbei ist und die möglichen Züge des nächsten Spielers aktualisiert.

In [None]:
def make_move(state, pos):
    if pos not in state.frontier:
        print(pos, "not in Frontier")
        raise InvalidMoveException
    disks_flipped = False
    
    (row, col) = pos
    board = state.board.tolist()
    for (row_dir, col_dir) in directions:
        if can_flip_in_dir(board, row, col, row_dir, col_dir, state.turn):
            disks_flipped = True
            flip_in_dir(state, row, col, row_dir, col_dir, state.turn)

    if disks_flipped:
        state.num_pieces += 1
        state.board[pos] = state.turn
        state.last_move = pos
        update_frontier(state, row, col)
        state.turn = -state.turn
        state.possible_moves = get_possible_moves(state, state.turn)
        if len(state.possible_moves) == 0:
            state.turn = -state.turn
            state.possible_moves = get_possible_moves(state, state.turn)
            if len(state.possible_moves) == 0:
                state.game_over = True
                return state
    else:
        raise InvalidMoveException()
    return state

Die Funktion `can_flip_in_dir` überprüft für ein Spielfeld `board` und den Spieler `player`, ob beim Setzen eines Steins auf die Position `(row, col)` in die durch `(rowdelta, coldelta)` gegebene Richtung Steine umgedreht werden können. `board` ist ein Spielfeld als Python-Liste, da der Zugriff deutlich schneller ist, als auf eine numpy array.

In [None]:
def can_flip_in_dir(board, row, col, rowdelta, coldelta, player):
    current_row = row + rowdelta
    current_col = col + coldelta
    if not (0 <= current_row < 8 and 0 <= current_col < 8):
        return False
    if not board[current_row][current_col] == -player:
        return False
    current_row += rowdelta
    current_col += coldelta
    
    while True:
        if not (0 <= current_row < 8 and 0 <= current_col < 8):
            return False
        if board[current_row][current_col] == NONE:
            return False           
        if board[current_row][current_col] == player:
            return True
    
        current_row += rowdelta
        current_col += coldelta

Die Funktion `is_move_valid` überprüft für ein gegebenes Spielfeld `board`, ob ein Zug auf die angegebenen Koordinaten `row` und `col` für den Spieler `player` möglich ist. Das Ergebnis wird als Wahrheitswert zurückgegeben. `board` ist hier ebenfalls eine Python-Liste, da der Zugriff auf Elemente schneller ist, als in einem numpy array.

In [None]:
def is_move_valid(board, row, col, player):
    for rowdelta, coldelta in directions:
        if can_flip_in_dir(board, row, col, rowdelta, coldelta, player):
            return True
    return False

`get_winner` bestimmt für einen Endzustand den Gewinner des Spiels. Gewinnt Weiß, so wird der Wert 1 zurückgegeben. Gewinnt Schwarz, wird der Wert -1 zurückgegeben. Bei einem Unentschieden wird der Wert 0 zurückgegeben.

In [None]:
def get_winner(state):
    black_disks = count_disks(state, BLACK)
    white_disks = count_disks(state, WHITE)
    if black_disks > white_disks:
        return BLACK
    if white_disks > black_disks:
        return WHITE
    else:
        return NONE

Die Funktion `get_possible_moves` bestimmt für einen Spielzustand `state` und den Spieler `player` die möglichen Züge, die der Spieler machen kann. Die Züge werden als Liste von Koordinaten zurückgegeben.

In [None]:
def get_possible_moves(state, player):
    board = state.board.tolist()
    possible_moves = []
    for (row, col) in state.frontier:
        if is_move_valid(board, row, col, player):
            possible_moves.append((row, col))
    return possible_moves

Diese Funktion dreht im Spielzustand `state`, ausgehend von dem durch `row` und `col` gegebenen Feld, die für den Spieler `player` generischen Steine in die durch `rowdelta` und `coldelta` gegebene Richtung um.

In [None]:
def flip_in_dir(state, row, col, rowdelta, coldelta, player):
    current_row = row + rowdelta
    current_col = col + coldelta
    
    while state.board[current_row, current_col] == -player:
        state.board[(current_row, current_col)] = player
        current_row += rowdelta
        current_col += coldelta

`update_frontier` wird nach jedem Zug aufgerufen um die Menge Frontier zu aktualisieren. Die durch `row` und `col` Gegebene Koordinate wird entfernt, während die Koordinaten von leeren umliegenden Feldern hinzugefügt werden.

In [None]:
def update_frontier(state, row, col):
    for current_row in range(row-1, row+2):
        if not 0 <= current_row < 8:
            continue
        for current_col in range(col-1, col+2):
            if not 0 <= current_col < 8:
                continue
            if state.board[current_row, current_col] == NONE:
                state.frontier.add((current_row, current_col))
    state.frontier.remove((row, col))

Die Funktion `count_disks` zählt die Steine, die der Spieler `player` im Spielzustand `state` auf dem Spielfeld hat.

In [None]:
def count_disks(state, player):
    return numpy.count_nonzero(state.board == player)

`get_player_string` konvertiert die ID des Spielers `player` in dessen Name. Ist `player == NONE` so wird 'Nobody' zurückgegeben.

In [None]:
def get_player_string(player):
    return {BLACK: 'Black', WHITE: 'White', NONE: 'Nobody'}[player]

`make_state` erzeugt einen Spielzustand aus dem Spielfeld `board` und dem zu ziehenden Spieler `turn`. Diese Funktion wird zu Testzwecken genutzt.

In [None]:
def make_state(board, turn):
    state = GameState()
    state.board = board
    state.turn = turn
    state.frontier = set()
    for row in range(8):
        for col in range(8):
            for current_row in range(row-1, row+2):
                if not 0 <= current_row < 8:
                    continue
                for current_col in range(col-1, col+2):
                    if not 0 <= current_col < 8:
                        continue
                    if state.board[current_row, current_col] == NONE:
                        state.frontier.add((current_row, current_col))
            
    state.possible_moves = get_possible_moves(state, turn)
    state.game_over = False
    if len(state.possible_moves) == 0:
        if len(get_possible_moves(state, -turn)) == 0:
            state.game_over = True
    state.num_pieces = count_disks(state, WHITE) + count_disks(state, BLACK)
    state.last_move = None
    return state