## 1Ô∏è‚É£ Verificar GPU e CUDA

In [None]:
import torch
import subprocess

print("="*70)
print("VERIFICA√á√ÉO DE GPU")
print("="*70)

# Check CUDA
print(f"\n‚úì PyTorch: {torch.__version__}")
print(f"‚úì CUDA dispon√≠vel: {torch.cuda.is_available()}")

if torch.cuda.is_available():
    print(f"‚úì GPU: {torch.cuda.get_device_name(0)}")
    print(f"‚úì CUDA vers√£o: {torch.version.cuda}")
    print(f"‚úì cuDNN: {torch.backends.cudnn.version()}")
    
    props = torch.cuda.get_device_properties(0)
    print(f"‚úì Mem√≥ria GPU: {props.total_memory / 1e9:.1f} GB")
    
    # nvidia-smi
    print("\n--- nvidia-smi ---")
    subprocess.run(['nvidia-smi'])
else:
    print("\n‚ö†Ô∏è  AVISO: GPU n√£o detectada!")
    print("   V√° em Runtime > Change runtime type e selecione GPU")

print("\n" + "="*70)

In [None]:
import os
import subprocess

# Check if already cloned
REPO_PATH = '/content/Xadrez_AI_Final'

if os.path.exists(REPO_PATH):
    print(f"‚úì Reposit√≥rio j√° existe em {REPO_PATH}")
    os.chdir(REPO_PATH)
else:
    print(f"Clonando reposit√≥rio...")
    os.chdir('/content')
    subprocess.run([
        'git', 'clone', 
        'https://github.com/devolopbomfim/Xadrez_AI_Final.git'
    ])
    os.chdir(REPO_PATH)

print(f"\n‚úì Diret√≥rio de trabalho: {os.getcwd()}")
print(f"\nArquivos principais:")
for item in ['training/', 'models/', 'core/', 'engine/']:
    if os.path.exists(item):
        print(f"  ‚úì {item}")

## 4Ô∏è‚É£ Configurar Paths e Verificar Ambiente

In [None]:
import sys
import os

# Add to path
sys.path.insert(0, '/content/Xadrez_AI_Final')

# Criar diret√≥rios se necess√°rio
os.makedirs('models/Agente02/checkpoints', exist_ok=True)

print("‚úì Path configurado")
print(f"‚úì Diret√≥rio de trabalho: {os.getcwd()}")

# Test imports
try:
    from training.run_heavy import run_heavy
    print("‚úì Import training.run_heavy OK")
except Exception as e:
    print(f"‚úó Erro ao importar: {e}")

## 5Ô∏è‚É£ Configurar Vari√°veis de Treinamento

In [None]:
# Configura√ß√£o do Agente02 (intermedi√°rio)
CONFIG = {
    'agent_name': 'Agente02',
    'num_selfplay': 256,           # Quantidade de jogos
    'selfplay_sims': 512,          # Simula√ß√µes MCTS por movimento
    'trainer_iters': 2000,         # Itera√ß√µes de treinamento
    'batch_size': 256,             # Tamanho do batch (otimizado para GPU)
    'model_channels': 160,         # Canais da rede neural
    'model_blocks': 16,            # Blocos residuais
    'use_reward_shaping': True,    # Usar recompensas incrementais
    'use_gpu': True,               # Usar GPU
}

print("="*70)
print("CONFIGURA√á√ÉO DE TREINAMENTO")
print("="*70)
print(f"\nAgente: {CONFIG['agent_name']}")
print(f"\nPar√¢metros de Self-Play:")
print(f"  ‚Ä¢ Games: {CONFIG['num_selfplay']}")
print(f"  ‚Ä¢ MCTS simulations/move: {CONFIG['selfplay_sims']}")
print(f"\nPar√¢metros de Treinamento:")
print(f"  ‚Ä¢ Training iterations: {CONFIG['trainer_iters']}")
print(f"  ‚Ä¢ Batch size: {CONFIG['batch_size']}")
print(f"\nArquitetura:")
print(f"  ‚Ä¢ Channels: {CONFIG['model_channels']}")
print(f"  ‚Ä¢ Blocks: {CONFIG['model_blocks']}")
print(f"\nOp√ß√µes:")
print(f"  ‚Ä¢ Reward shaping: {CONFIG['use_reward_shaping']}")
print(f"  ‚Ä¢ GPU: {CONFIG['use_gpu']}")
print(f"\nEstimativa de tempo: ~12-18 horas com GPU T4")
print("="*70)

## 6Ô∏è‚É£ Executar Treinamento (PRINCIPAL)

In [None]:
import torch
import os
from datetime import datetime

# Import training function
from training.run_heavy import run_heavy

print("="*80)
print(f"INICIANDO TREINAMENTO - {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")
print("="*80)
print()

# Verificar GPU
device = 'cuda' if torch.cuda.is_available() else 'cpu'
print(f"Dispositivo: {device.upper()}")
if device == 'cuda':
    print(f"GPU: {torch.cuda.get_device_name(0)}")
    print(f"Mem√≥ria: {torch.cuda.get_device_properties(0).total_memory / 1e9:.1f} GB")
print()

# Executar treinamento
try:
    result = run_heavy(
        num_selfplay=CONFIG['num_selfplay'],
        selfplay_sims=CONFIG['selfplay_sims'],
        trainer_iters=CONFIG['trainer_iters'],
        batch_size=CONFIG['batch_size'],
        model_kwargs={
            'channels': CONFIG['model_channels'],
            'blocks': CONFIG['model_blocks'],
            'action_size': 20480
        },
        agent_dir='models/Agente02',
        preferred_device=device,
        use_reward_shaping=CONFIG['use_reward_shaping']
    )
    
    print("\n" + "="*80)
    if result == 0:
        print("‚úì‚úì‚úì TREINAMENTO CONCLU√çDO COM SUCESSO!")
    else:
        print(f"‚úó‚úó‚úó Treinamento falhou com c√≥digo: {result}")
    print("="*80)
    
except Exception as e:
    print(f"\n‚úó Erro durante treinamento: {e}")
    import traceback
    traceback.print_exc()

## 7Ô∏è‚É£ Verificar Resultados

In [None]:
import os

print("="*70)
print("RESULTADOS DO TREINAMENTO")
print("="*70)

checkpoint_dir = 'models/Agente02/checkpoints'

if os.path.exists(checkpoint_dir):
    files = os.listdir(checkpoint_dir)
    print(f"\nArquivos em {checkpoint_dir}:")
    
    for fname in sorted(files):
        fpath = os.path.join(checkpoint_dir, fname)
        size_mb = os.path.getsize(fpath) / (1024**2)
        print(f"  ‚úì {fname}: {size_mb:.1f} MB")
    
    # Informa√ß√µes importantes
    print("\n‚úì Checkpoints salvos com sucesso!")
    print("\nPr√≥ximos passos:")
    print("  1. Fazer download dos modelos")
    print("  2. Copiar para ambiente local")
    print("  3. Testar performance")
else:
    print(f"\n‚úó Diret√≥rio {checkpoint_dir} n√£o encontrado")

## 8Ô∏è‚É£ Download dos Modelos (Para Local)

In [None]:
import os
from google.colab import files

print("Preparando arquivos para download...\n")

checkpoint_dir = 'models/Agente02/checkpoints'

if os.path.exists(checkpoint_dir):
    # List files
    files_to_download = [
        os.path.join(checkpoint_dir, f) 
        for f in os.listdir(checkpoint_dir)
    ]
    
    print(f"Arquivos dispon√≠veis para download:")
    for f in files_to_download:
        size_mb = os.path.getsize(f) / (1024**2)
        print(f"  ‚Ä¢ {f} ({size_mb:.1f} MB)")
    
    print("\n‚è≥ Para fazer download, execute:")
    print("\nfrom google.colab import files")
    print("files.download('models/Agente02/checkpoints/latest.pt')")
    print("files.download('models/Agente02/checkpoints/replay.pt')")
else:
    print(f"‚úó Diret√≥rio {checkpoint_dir} n√£o existe")

## 9Ô∏è‚É£ Limpeza de Mem√≥ria

In [None]:
import torch
import gc

print("Limpando mem√≥ria...")

# Clear GPU cache
if torch.cuda.is_available():
    torch.cuda.empty_cache()
    print("‚úì GPU cache limpo")

# Garbage collection
gc.collect()
print("‚úì Garbage collection executado")

print("\n‚úì Limpeza conclu√≠da!")

## ‚ÑπÔ∏è Informa√ß√µes Importantes

### üìä Configura√ß√£o do Agente02:
- **Games**: 256 (4x mais que Agente01)
- **MCTS Simulations**: 512 por movimento (4x mais)
- **Training Iterations**: 2000
- **Batch Size**: 256 (otimizado para GPU)
- **Modelo**: 160 channels, 16 blocos residuais
- **Reward Shaping**: ‚úì Ativo (30% step + 70% final)

### ‚è±Ô∏è Tempo de Execu√ß√£o:
- **GPU T4**: ~12-18 horas
- **GPU P100**: ~6-8 horas
- **GPU V100**: ~3-4 horas

### üíæ Arquivos Gerados:
- `latest.pt` (~24 MB) - Modelo treinado
- `replay.pt` (~500-600 MB) - Buffer de replay com games

### üîó Links √öteis:
- [Reposit√≥rio](https://github.com/devolopbomfim/Xadrez_AI_Final)
- [PyTorch Docs](https://pytorch.org/docs/stable/index.html)
- [Google Colab Docs](https://colab.research.google.com/)

### ‚ùì Troubleshooting:
- **GPU n√£o detectada**: V√° em `Runtime > Change runtime type > GPU`
- **Falta de mem√≥ria**: Reduza `batch_size` de 256 para 128
- **Timeout**: O Colab pode desconectar, mas o treinamento continua (esconda o notebook)
- **Conex√£o perdida**: Reconecte e verifique os checkpoints salvos