# Parâmetro número de filhos por nó

In [None]:
#mc_tester_nodes_per_child
from board import *
from montecarlo_nodes_per_child import *
import time

def run_monte_carlo_matches(num_games=100):
    '''Avalia em 100 jogos as diferenças de comportamento do MonteCarlo quando mudamos certos parâmetros'''
    ai1 = MonteCarlo_Player(max_children_to_explore=None)   # escolher o numero de filhos a serem explorados (None=7, 5 ou 3)
    ai2 = MonteCarlo_Player(max_children_to_explore=5)      # escolher o numero de filhos a serem explorados (None=7, 5 ou 3)
    results = {PLAYER1: 0, PLAYER2: 0, 0: 0}  # 0 é empate

    for game_idx in range(num_games):
        board = Board()
        current_player = PLAYER1

        while not board.is_game_over():

            if current_player == PLAYER1:
                move = ai1.make_move(board)
            else:
                move = ai2.make_move(board)

            if move == -1:
                break  # sem jogadas possíveis

            board.drop_piece(move)
            current_player = PLAYER2 if current_player == PLAYER1 else PLAYER1

        winner = board.winner if board.winner is not None else 0
        results[winner] += 1

    print(f"Vitórias Jogador 1 (Vermelho): {results[PLAYER1]}")
    print(f"Vitórias Jogador 2 (Amarelo): {results[PLAYER2]}")
    print(f"Empates: {results[0]}")

if __name__ == "__main__":
    run_monte_carlo_matches(num_games=100)

## Testes estatísticos por cada 100 jogos

### Teste 1
- **Jogador 1 (7)**: 49 vitórias  
- **Jogador 2 (7)**: 51 vitórias  
- **Empates**: 0

### Teste 2
- **Jogador 1 (7)**: 99 vitórias  
- **Jogador 2 (3)**: 1 vitórias  
- **Empates**: 0

### Teste 3
- **Jogador 1 (3)**: 2 vitórias  
- **Jogador 2 (7)**: 98 vitórias  
- **Empates**: 0

### Teste 4
- **Jogador 1 (7)**: 84 vitórias  
- **Jogador 2 (5)**: 16 vitórias  
- **Empates**: 0

### Teste 5
- **Jogador 1 (5)**: 16 vitórias  
- **Jogador 2 (7)**: 84 vitórias  
- **Empates**: 0

### Teste 6
- **Jogador 1 (5)**: 96 vitórias  
- **Jogador 2 (3)**: 4 vitórias  
- **Empates**: 0

### Teste 7
- **Jogador 1 (3)**: 12 vitórias  
- **Jogador 2 (5)**: 88 vitórias  
- **Empates**: 0





## Conclusões

Limitar o número de filhos que o MCTS pode explorar a partir de cada nó (para valores como 3 ou 5) consistentemente levou a um desempenho bastante inferior em comparação com a abordagem que considera todas as jogadas legais (representada por max_children_to_explore = None ou 7). O jogador com acesso a um maior leque de opções iniciais em cada nó tem tendência a vencer mais partidas.


A principal desvantagem de restringir o fator de ramificação é o risco inerente de "podar" ou nunca considerar uma jogada que seria ótima ou crucial. Se as opções iniciais forem mal selecionadas (especialmente usando uma seleção aleatória como na nossa implementação deste limite), a qualidade geral da busca é comprometida.


O Quatro em Linha tem um fator de ramificação máximo de 7, que já é relativamente pequeno para o MCTS com um número razoável de simulações. A poda neste contexto parece ser mais prejudicial do que benéfica, pois o algoritmo já consegue explorar adequadamente todas as 7 opções sem se "perder" excessivamente em largura.


Portanto, para a configuração final do nosso agente MCTS, revelou ser extremamente mais eficaz a opção de não impor um limite ao número de filhos explorados por nó, permitindo que o algoritmo utilize o seu processo de seleção UCB1 sobre todas as jogadas possíveis.
