# Raport z zadania dwuosobowe gry deterministyczne
### Aleksander Szymczyk
### Import bibliotek

In [1]:
import sys
sys.path.append("two-player-games")
from experiment import experiment, Option
from tabulate import tabulate

## Decyzje projektowe
### Implementacja alpha-beta
- Algorytm alpha-beta przegląda drzewo gry poprzez skopiowanie bieżącego stanu gry i wykonywanie dozwolonych ruchów na tej kopii. 
- W trakcie przeglądania drzewa wyniki równe najlepszemu dodawane są do listy wyników. Po przeglądnięciu wszystkich ścieżek algorytm losuje ruch spośród tych dostępnych na liście wyników. 
- W węzłach terminalnych, w których rozgrywka się zakończyła, zwracana jest -inf jeśli wygrał min, inf jeśli wygrał max lub 0 jeśli zremisowano. 
- W węzłach kończących przeszukiwanie z powodu głębokości = 0 zwracany jest wynik funkcji heurystycznej.
### Heurystyka
Heurystyka do gry Connect Four polega na przeglądaniu każdego rzędu, kolumny, przekątnych. Algorytm przechodzi wzdłuż np. rzędu, sprawdzając, ile pól zajętych przez graczy jest na czterech kolejnych polach. Jeśli w jednej czwórce są pola zajęte przez różnych graczy, przeglądanie tej czwórki jest przerywane, a jej wynikiem jest 0 (nie jest możliwa wygrywająca kombinacja dla nikogo). Jeśli w jednej czwórce pól są pola zajęte przez tylko jednego z graczy oraz pola puste to do wyniku dodawane lub odejmowane (w zależności czy to gracz min czy max) są punkty, zależne od liczby zajętych pól (jedno - najmniej, dwa - więcej, trzy - najwięcej). Punkty z czwórek wzdłuż wszystkich osi są sumowane i zwracane jako wynik heurystyki.
# Eksperymenty

## Rezultaty rozgrywki w przypadku losowych ruchów obydwu graczy

In [2]:
random_results = experiment(Option.RAND_VS_RAND.value, 1000)
print(tabulate(random_results, headers="keys", tablefmt="fancy_grid"))

╒═══════════════════╤═════════════════╤═════════════════╤═════════╕
│   Number of games │   Player 1 wins │   Player 2 wins │   Draws │
╞═══════════════════╪═════════════════╪═════════════════╪═════════╡
│              1000 │             579 │             420 │       1 │
╘═══════════════════╧═════════════════╧═════════════════╧═════════╛


Jak widać kolejność ruchów w przypadku graczy losowych ma niewielki wpływ na wynik. Zawodnik rozpoczynający rozgrywkę ma delikatną przewagę.
# Cel eksperymentów
Aby sprawdzić jakość działania algorytmu alpha-beta zostanie on przetestowany na 100 rozgrywkach dla trzech wariantów graczy:
- gracz algorytm vs gracz losowy
- gracz losowy vs gracz algorytm
- gracz algorytm vs gracz algorytm

Oraz dla trzech różnych głębokości przeszukiwania:
- głębokość 2
- głębokość 3
- głębokość 4
## Testy dla rozgrywki algorytm alphabeta (player 1) vs gracz losowy

In [3]:
results = experiment(Option.ALGO_VS_RAND.value, 100, [2, 3, 4])
print(tabulate(results, headers="keys", tablefmt="fancy_grid"))

╒═══════════════════╤═════════════════╤═════════════════╤═════════╤══════════╕
│   Number of games │   Player 1 wins │   Player 2 wins │   Draws │   Depths │
╞═══════════════════╪═════════════════╪═════════════════╪═════════╪══════════╡
│               100 │             100 │               0 │       0 │        2 │
├───────────────────┼─────────────────┼─────────────────┼─────────┼──────────┤
│               100 │             100 │               0 │       0 │        3 │
├───────────────────┼─────────────────┼─────────────────┼─────────┼──────────┤
│               100 │             100 │               0 │       0 │        4 │
╘═══════════════════╧═════════════════╧═════════════════╧═════════╧══════════╛


## Testy dla rozgrywki gracz losowy vs alogrytm alphabeta (player 2)

In [4]:
results = experiment(Option.RAND_VS_ALGO, 100, [2, 3, 4])
print(tabulate(results, headers="keys", tablefmt="fancy_grid"))

╒═══════════════════╤═════════════════╤═════════════════╤═════════╤══════════╕
│   Number of games │   Player 1 wins │   Player 2 wins │   Draws │   Depths │
╞═══════════════════╪═════════════════╪═════════════════╪═════════╪══════════╡
│               100 │               0 │             100 │       0 │        2 │
├───────────────────┼─────────────────┼─────────────────┼─────────┼──────────┤
│               100 │               1 │              99 │       0 │        3 │
├───────────────────┼─────────────────┼─────────────────┼─────────┼──────────┤
│               100 │               0 │             100 │       0 │        4 │
╘═══════════════════╧═════════════════╧═════════════════╧═════════╧══════════╛


## Test dla rozgrywki algorytm vs algorytm (dla wszystkich kombinacji głębokości)

In [9]:
results = experiment(Option.ALGO_VS_ALGO, 100, [2, 3, 4])
print(tabulate(results, headers="keys", tablefmt="fancy_grid"))

╒═══════════════════╤═════════════════╤═════════════════╤═════════╤═══════════════════╤═══════════════════╕
│   Number of games │   Player 1 wins │   Player 2 wins │   Draws │   Depths player 1 │   Depths player 2 │
╞═══════════════════╪═════════════════╪═════════════════╪═════════╪═══════════════════╪═══════════════════╡
│               100 │              62 │              38 │       0 │                 2 │                 2 │
├───────────────────┼─────────────────┼─────────────────┼─────────┼───────────────────┼───────────────────┤
│               100 │              47 │              48 │       5 │                 2 │                 3 │
├───────────────────┼─────────────────┼─────────────────┼─────────┼───────────────────┼───────────────────┤
│               100 │              49 │              45 │       6 │                 2 │                 4 │
├───────────────────┼─────────────────┼─────────────────┼─────────┼───────────────────┼───────────────────┤
│               100 │       

# Wyniki
### Algo vs rand
- Algorytm alpha-beta wygrywa z graczem grającym losowe ruchy niemal za każdym razem, niezależnie od głębokości przeszukiwania.
- W rozgrywkach algorytm vs gracz losowy kolejność nie ma wpływu na wygraną.
### Algo vs algo
- Rozgrywki bardzo rzadko kończą się remisem.
- Przy graczu pierwszym o stałej głębokości przeszukiwania zwiększanie głębokości przeszukiwania drugiego gracza powoduje zmniejszenie liczby wygranych tego pierwszego.
- Przy równej głębokości przeszukiwania przewagę osiąga gracz zaczynający rozgrywkę. Przewaga ta zmniejsza się jednak wraz ze wzrostem głębokości przeszukiwania.
- W rozgrywkach algorytmu o głębokośći 3 z algorytmem o głebokości 2 ten pierwszy wygrał za każdym razem. 
- Najwięcej remisów osiągnięto w rozgrywkach gdzie drugim graczem był algorytm o głębokości 4.
# Wnioski
- Większa głębokość przeszukiwania nie zawsze wiązała się z większą liczbą wygranych.
- Kolejność ma duży wpływ na wygraną algorytmu. Najprawdopodobniej jest to spowodowane tym, że gracz rozpoczynający przejmuje inicjatywę i "atakuje", a jego przeciwnik zajmuje się głównie unieszkodliwianiem tych ataków.
- Na szansę wygranej algorytmu wpływa przewaga pierwszego ruchu, głębokość przeszukiwania przeciwnika oraz własna głębokość przeszukiwania.

