# Artificial Intelligence 24/25 Assignment - Adversarial search strategies and Decision Trees

### `ConnectFourState`

  * Representa o estado do tabuleiro (6×7) e o jogador ativo (`1`=X, `-1`=O).
  * Métodos:

    * `__init__(board=None, player=1)`: inicializa tabuleiro vazio ou a partir de cópia.
    * `clone()`: devolve cópia profunda do estado.
    * `get_legal_moves()`: lista colunas disponíveis.
    * `play_move(col)`: coloca peça na coluna, alterna jogador.
    * `check_win()`: devolve `1`/`-1` se há vitória, `0` se empate, ou `None` se jogo em curso.
* `print_board(state)`: imprime o tabuleiro em consola.

### Modos de jogo

1. PvP (jogador vs. jogador)
2. PvC MCTS (jogador vs. computador com MCTS)
3. C-ID3 vs C-MCTS (computador usando ID3 vs. computador usando MCTS)

In [None]:
import random
import time
from copy import deepcopy

import pandas as pd
import numpy as np

from DeciTree import buildTree, classifyExample

# Estado do jogo Connect-Four
class ConnectFourState:
    ROWS = 6
    COLS = 7

    def __init__(self, board=None, player=1):
        # 0 = vazio, 1 = X, -1 = O
        self.board = deepcopy(board) if board is not None else [[0]*self.COLS for _ in range(self.ROWS)]
        self.player = player

    def clone(self):
        return ConnectFourState(self.board, self.player)

    def get_legal_moves(self):
        return [c for c in range(self.COLS) if self.board[0][c] == 0]

    def play_move(self, col):
        '''Executa jogada na coluna indicada; retorna True se válida.'''
        for r in range(self.ROWS-1, -1, -1):
            if self.board[r][col] == 0:
                self.board[r][col] = self.player
                self.player *= -1
                return True
        return False

    def check_win(self):
        '''Deteta vitória (1/-1), empate (0) ou None se não terminado.'''
        directions = [(0,1),(1,0),(1,1),(1,-1)]
        for r in range(self.ROWS):
            for c in range(self.COLS):
                p = self.board[r][c]
                if p == 0:
                    continue
                for dr, dc in directions:
                    cnt, rr, cc = 0, r, c
                    for _ in range(4):
                        if 0 <= rr < self.ROWS and 0 <= cc < self.COLS and self.board[rr][cc] == p:
                            cnt += 1; rr += dr; cc += dc
                        else:
                            break
                    if cnt == 4:
                        return p
        if not self.get_legal_moves():
            return 0
        return None

# Impressão do tabuleiro
def print_board(state):
    print('\n  ' + ' '.join(str(c) for c in range(state.COLS)))
    for row in state.board:
        print(' |' + ' '.join('X' if v==1 else 'O' if v==-1 else '.' for v in row) + '|')
    print()

# Flatten do estado para classificação
def state_to_series(state, feature_columns):
    vec = []
    for row in state.board:
        vec.extend(row)
    vec.append(state.player)
    return pd.Series(vec, index=feature_columns)


### Modos de jogo

1. PvP (jogador vs. jogador)
2. PvC MCTS (jogador vs. computador com MCTS)
3. C-ID3 vs C-MCTS (computador usando ID3 vs. computador usando MCTS)

In [None]:
# Loop principal
def play_game():
    print("=== Connect-Four com MCTS e ID3 ===")
    print("Modo: 1) PvP  2) PvC MCTS  3) C-ID3 vs C-MCTS")
    mode = input("Escolha: ").strip()
    while mode not in ('1','2','3'):
        mode = input("Escolha: ").strip()

    # para modo 3, treinamos a árvore sem discretizar
    if mode == '3':
        print("\nTreinando árvore de decisão (ID3)...")
        df = pd.read_csv("connect4_dataset.csv")
        # não discretizar com quartis para manter labels inteiros
        feature_columns = df.columns[:-1]
        X = df[feature_columns]
        y = df.iloc[:, -1]
        max_depth = int(np.log2(len(df)) + 1)
        training_data = pd.concat([X, y], axis=1)
        decision_tree = buildTree(training_data, max_depth)
        print("Árvore treinada!\n")

    state = ConnectFourState()
    print_board(state)

    while True:
        if mode == '1' or (mode == '2' and state.player == 1):
            # humano
            col = int(input(f"Jogador {'1 (X)' if state.player==1 else '2 (O)'}, escolha coluna {state.get_legal_moves()}: "))

        elif mode == '2' and state.player == -1:
            # PvC MCTS
            print("Computador (MCTS) a pensar...")
            start = time.time()
            col = pure_monte_carlo_choice(state, playouts=1000)
            print(f"Tempo de cálculo: {time.time() - start:.2f}s")

        else:
            # modo 3
            if state.player == 1:
                print("Computador (ID3) a pensar...")
                example = state_to_series(state, feature_columns)
                # classifyExample retorna já inteiro
                col = int(classifyExample(example, decision_tree))
            else:
                print("Computador (MCTS) a pensar...")
                start = time.time()
                col = pure_monte_carlo_choice(state, playouts=1000)
                print(f"Tempo de cálculo: {time.time() - start:.2f}s")

        state.play_move(col)
        print_board(state)
        res = state.check_win()
        if res is not None:
            if res == 0:
                print("Empate!")
            else:
                w = '1 (X)' if res == 1 else '2 (O)'
                print(f"Vitória do jogador {w}!")
            break

### Monte Carlo Tree Search (MCTS)

* Estratégia adversarial que simula jogadas aleatórias para avaliar movimentos.
* Utiliza `pure_monte_carlo_choice(state, playouts)` e para cada jogada possível:

    * Executa `playouts` simulações aleatórias até fim.
    * Contabiliza vitórias do jogador atual.
    * Escolhe coluna com maior taxa de sucesso.


In [None]:
def pure_monte_carlo_choice(state, playouts=1000):
    best_move, best_wins = None, -1
    for mv in state.get_legal_moves():
        wins = 0
        for _ in range(playouts):
            sim = state.clone()
            sim.play_move(mv)
            while sim.check_win() is None:
                sim.play_move(random.choice(sim.get_legal_moves()))
            if sim.check_win() == state.player:
                wins += 1
        if wins > best_wins:
            best_wins, best_move = wins, mv
    return best_move


### Dataset Connect Four

* Objectivo: gerar pares `(estado, melhor_jogada)` para treinar ID3.
* Estratégia:

  1. Começar de tabuleiro vazio.
  2. Avançar um número aleatório de jogadas (até 20).
  3. Se não terminal, usar MCTS para escolher melhor jogada.
  4. Guardar estado "flatten" + jogador ativo + label (coluna escolhida).


In [None]:
import csv
from tqdm import tqdm

def generate_connect_four_dataset(num_samples, playouts, filename):
    header = [f"cell_{i}" for i in range(6*7)] + ["player","move"]
    with open(filename, 'w', newline='') as f:
        writer = csv.writer(f)
        writer.writerow(header)
        for _ in tqdm(range(num_samples)):
            state = ConnectFourState()
            # avança jogadas
            for _ in range(random.randint(0,20)):
                moves = state.get_legal_moves()
                if not moves or state.check_win() is not None: break
                state.play_move(random.choice(moves))
            if state.check_win() is not None: continue
            best_move = pure_monte_carlo_choice(state, playouts)
            features = state_to_feature_vector(state)
            writer.writerow(features + [best_move])


### Classe DeciTree (ID3)

Esta classe implementa o algoritmo ID3 para construir árvores de decisão sem usar bibliotecas externas de machine learning. 

Componentes principais:

- Node: estrutura de nó da árvore.  
  - `attribute`: atributo usado para divisão no nó.  
  - `value`: valor de corte ou categoria do atributo.  
  - `results`: classe alvo se for nó folha.  
  - `branches`: dict com ramos `"true_branch"` e `"false_branch"`.  
  - `counter`: número de exemplos neste nó.  

- entropy(data): calcula a entropia da coluna alvo (última coluna).  
- splitData(data, attribute, value): divide o DataFrame em dois ramos conforme valor.  
- buildTree(data, max_depth, depth=0):  
  1. Verifica condição de parada (nó puro ou profundidade máxima).  
  2. Para cada atributo e cada valor possível:  
     - Divide os dados e calcula ganho de informação.  
     - Seleciona divisão com maior ganho.  
  3. Cria recursivamente sub-árvores ou retorna nó folha.  

- classifyExample(example, tree): percorre a árvore dado um exemplo (`Series`) e retorna a classe.  
- quartis(df): discretiza colunas contínuas em 4 intervalos usando `pd.qcut`.  


In [None]:
import pandas as pd
import numpy as np

class Node:
    def __init__(self, attribute=None, value=None, results=None, branches=None, counter=None):
        self.attribute = attribute
        self.value = value
        self.results = results
        self.branches = branches if branches is not None else {}
        self.counter = counter

def entropy(data):
    total = len(data)
    if total == 0:
        return 0
    counts = data.iloc[:, -1].value_counts()
    ent = 0
    for cnt in counts:
        p = cnt / total
        ent -= p * np.log2(p)
    return ent

def splitData(data, attribute, value):
    true_branch = data[data[attribute] == value]
    false_branch = data[data[attribute] != value]
    return {"true_branch": true_branch, "false_branch": false_branch}

def buildTree(data, max_depth, depth=0):
    counter = len(data)
    if counter == 0:
        return Node(results=None, counter=0)
    if len(data.iloc[:, -1].unique()) == 1 or depth == max_depth:
        return Node(results=data.iloc[:, -1].mode()[0], counter=counter)

    current_entropy = entropy(data)
    best_gain = 0
    best_sets = None
    best_criteria = None

    for attribute in data.columns[:-1]:
        for val in data[attribute].unique():
            sets = splitData(data, attribute, val)
            t = len(sets["true_branch"]) / counter
            gain = current_entropy \
                   - t * entropy(sets["true_branch"]) \
                   - (1 - t) * entropy(sets["false_branch"])
            if gain > best_gain \
               and len(sets["true_branch"]) > 0 \
               and len(sets["false_branch"]) > 0:
                best_gain = gain
                best_sets = sets
                best_criteria = (attribute, val)

    if best_gain > 0:
        tb = buildTree(best_sets["true_branch"], max_depth, depth + 1)
        fb = buildTree(best_sets["false_branch"], max_depth, depth + 1)
        return Node(
            attribute=best_criteria[0],
            value=best_criteria[1],
            branches={"true_branch": tb, "false_branch": fb},
            counter=counter
        )
    else:
        return Node(results=data.iloc[:, -1].mode()[0], counter=counter)

def classifyExample(example, tree):
    if tree.results is not None:
        return tree.results
    branch = tree.branches["true_branch"] \
        if example[tree.attribute] == tree.value \
        else tree.branches["false_branch"]
    return classifyExample(example, branch)

def quartis(df):
    for col in df.columns[:-1]:
        if pd.api.types.is_numeric_dtype(df[col]):
            try:
                df[col] = pd.qcut(df[col], q=4, duplicates="drop")
            except:
                pass
    return df

### DeciTree no dataset Iris

1. Carregar dados: `iris.csv` (atributos: sepal/petal length/width, classe).
2. Discretizar: usar `quartis(df)` para converter valores contínuos.
3. Definir `max_depth`: `int(log2(n_exemplos))+1`.
4. Treinar: `decision_tree = buildTree(df, max_depth)`.
5. Avaliar:

   * Separar treino/teste (ex.: 70%/30%).
   * `classifyExample` em `X_test` e medir `accuracy_score`.


In [None]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from DeciTree import quartis, buildTree, classifyExample

# 1. Carregar e discretizar
df = pd.read_csv("iris.csv")
df = quartis(df)

# 2. Dividir treino/teste
X = df.iloc[:, :-1]
y = df.iloc[:, -1]
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42
)
train_df = pd.concat([X_train, y_train], axis=1)

# 3. Definir profundidade máxima
max_depth = int(np.log2(len(train_df))) + 1

# 4. Treinar a árvore
tree = buildTree(train_df, max_depth)

# 5. Avaliar a árvore
y_pred = [classifyExample(row, tree) for _, row in X_test.iterrows()]
print("Acurácia:", accuracy_score(y_test, y_pred))


### 7. Modo de jogo MCTS vs ID3

* **Carregar o dataset** `connect4_dataset.csv` gerado pelo MCTS.  
* **Selecionar colunas de características** (todas menos `"move"`) e copiar para `train_df`.

In [None]:
import pandas as pd
import numpy as np
from DeciTree import buildTree, classifyExample
from connect4 import state_to_series, pure_monte_carlo_choice

# 1. Carregar e preparar dados
df = pd.read_csv("connect4_dataset.csv")
feature_cols = df.columns[:-1]
train_df = df.copy()

# 2. Definir profundidade e treinar ID3
max_depth = int(np.log2(len(train_df))) + 1
decision_tree = buildTree(train_df, max_depth)

# 3. No loop de jogo (modo '3'):
if state.player == 1:
    # ID3 como X
    example = state_to_series(state, feature_cols)
    col = int(classifyExample(example, decision_tree))
else:
    # MCTS como O
    col = pure_monte_carlo_choice(state, playouts=1000)
