# Colab — Treinamento de Agente
Breve notebook para configurar Colab, instalar dependências, treinar o agente e salvar checkpoints no Google Drive.


In [1]:
<VSCode.Cell language="markdown">
## 1) Instalar dependências
Use as células abaixo para instalar dependências Python necessárias no Colab. Primeiro edite `requirements-colab.txt` se desejar.
</VSCode.Cell>

<VSCode.Cell language="python">
# Atualizar pip e instalar dependências do arquivo
!python -m pip install --upgrade pip
!pip install -r requirements-colab.txt
</VSCode.Cell>

<VSCode.Cell language="markdown">
### (Opcional) Instalar PyTorch com suporte CUDA (se usar GPU no Colab)
Se desejar GPU, comente a linha anterior e execute a célula abaixo ajustando o índice do PyTorch conforme a versão CUDA do runtime do Colab.
</VSCode.Cell>

<VSCode.Cell language="python">
# Exemplo: instalar PyTorch com CUDA 11.8 (ajuste conforme runtime do Colab)
# !pip install --index-url https://download.pytorch.org/whl/cu118 torch torchvision torchaudio --upgrade
print("Verifique sua versão do CUDA no Colab e escolha o wheel apropriado se necessário.")
</VSCode.Cell>

<VSCode.Cell language="markdown">
## 2) Montar Google Drive e criar pastas
</VSCode.Cell>

<VSCode.Cell language="python">
from google.colab import drive
drive.mount('/content/drive')

# Criar pasta para salvar runs
import os
run_dir = '/content/drive/MyDrive/agent_runs'
os.makedirs(run_dir, exist_ok=True)
print('Runs will be saved to', run_dir)
</VSCode.Cell>

<VSCode.Cell language="markdown">
## 3) Clonar repositório (opcional) e definir diretório de trabalho
Se já subiu os arquivos manualmente, apenas ajuste `WORKDIR`.
</VSCode.Cell>

<VSCode.Cell language="python">
# Clone repo if needed (uncomment to run)
# !git clone https://github.com/devolopbomfim/Xadrez_AI_Final.git
# %cd Xadrez_AI_Final

import os
WORKDIR = '/content/Xadrez_AI_Final'
if os.path.exists(WORKDIR):
    %cd {WORKDIR}
else:
    print('Repo not found in', WORKDIR, '- upload or clone it.')
</VSCode.Cell>

<VSCode.Cell language="markdown">
## 4) Checar GPU e ambiente
</VSCode.Cell>

<VSCode.Cell language="python">
# GPU check
!nvidia-smi || echo 'No GPU detected'
import torch
print('torch:', torch.__version__)
print('cuda available:', torch.cuda.is_available())
</VSCode.Cell>

<VSCode.Cell language="markdown">
## 5) Configuração de hiperparâmetros (arquivo YAML)
É gravado em `colab_train_config.yaml` e pode ser editado antes de rodar.
</VSCode.Cell>

<VSCode.Cell language="python">
# Exemplo de config YAML
cfg = '''
learning_rate: 0.001
batch_size: 128
gamma: 0.99
env_name: local_chess
total_timesteps: 100000
seed: 42
checkpoint_interval: 500
device: cuda
iters_per_epoch: 100
'''
with open('colab_train_config.yaml', 'w') as f:
    f.write(cfg)
print('Wrote colab_train_config.yaml')
</VSCode.Cell>

<VSCode.Cell language="markdown">
## 6) Exemplo: Gerar self-play + treinar (run_iteration)
Use a célula abaixo para executar um ciclo completo de self-play → treino → avaliação.
</VSCode.Cell>

<VSCode.Cell language="python">
# Ajuste os parâmetros conforme necessário
AGENT_DIR = 'models/AgentA'
!python3 training/run_iteration.py {AGENT_DIR} --iteration 0 --num-selfplay 5 --selfplay-sims 50 --trainer-iters 200 --batch-size 128
</VSCode.Cell>

<VSCode.Cell language="markdown">
## 7) Salvar/Carregar checkpoints no Drive
Exemplo de como copiar checkpoints para o Drive.
</VSCode.Cell>

<VSCode.Cell language="python">
import shutil, glob
ckpt_src = 'models/AgentA/checkpoints'
ckpt_dst = '/content/drive/MyDrive/agent_runs/AgentA_checkpoints'
os.makedirs(ckpt_dst, exist_ok=True)
for f in glob.glob(os.path.join(ckpt_src, '*.pt')):
    shutil.copy(f, ckpt_dst)
print('Copied checkpoints to', ckpt_dst)
</VSCode.Cell>

<VSCode.Cell language="markdown">
## 8) TensorBoard (visualizar no Colab)
</VSCode.Cell>

<VSCode.Cell language="python">
# Iniciar tensorboard apontando para pastas de logs
# %load_ext tensorboard
# %tensorboard --logdir models/AgentA/logs --host 0.0.0.0 --port 6006
print('Use TensorBoard cell if logs are available')
</VSCode.Cell>

<VSCode.Cell language="markdown">
## 9) Avaliação e renderização de episódios
</VSCode.Cell>

<VSCode.Cell language="python">
# Rodar um episódio de avaliação rápido (exemplo)
from core.board.board import Board
from training.mcts import MCTS

# Código de avaliação simples (exemplo minimal)
print('Run evaluation using provided scripts (see training/run_iteration.py)')
</VSCode.Cell>

<VSCode.Cell language="markdown">
## 10) Script reutilizável (run_train.sh)
</VSCode.Cell>

<VSCode.Cell language="bash">
# Exemplo de script run_train.sh
# mkdir -p runs && python3 training/run_iteration.py models/AgentA --iteration 0 --num-selfplay 10 --trainer-iters 500
</VSCode.Cell>

<VSCode.Cell language="markdown">
## 11) Smoke tests rápidos
Use asserts para garantir que forward pass e um passo de treino rodam.
</VSCode.Cell>

<VSCode.Cell language="python">
# Smoke test: instanciar modelo e fazer forward
import torch
from training.model import make_model
m = make_model(device='cpu')
import numpy as np
x = np.random.randn(1, 13, 8, 8).astype('float32')
t = torch.tensor(x)
pi, v = m(t)
assert pi is not None and v is not None
print('Smoke test passed')
</VSCode.Cell>


SyntaxError: invalid character '→' (U+2192) (210801660.py, line 93)