# Entra√Ænement du Neural Network pour Smart Chess sur Google Colab

Ce notebook permet d'entra√Æner le r√©seau de neurones pour l'√©valuation d'√©checs en utilisant les ressources GPU de Google Colab.

**Chemin du projet sur Drive:** `MyDrive/smart_chess_drive/smart-chess`

## Instructions
1. Aller dans **Runtime > Change runtime type > GPU** (T4 ou mieux)
2. Ex√©cuter les cellules dans l'ordre
3. Les mod√®les seront sauvegard√©s automatiquement sur votre Drive

## 1. V√©rification GPU

In [None]:
# V√©rifier la disponibilit√© du GPU
!nvidia-smi

## 2. Montage Google Drive

In [None]:
# Monter Google Drive
from google.colab import drive
drive.mount('/content/drive')

## 3. Configuration du chemin du projet

In [None]:
# D√©finir le chemin vers le projet sur votre Drive
import os
import sys

PROJECT_PATH = '/content/drive/MyDrive/smart_chess_drive/smart-chess'
os.chdir(PROJECT_PATH)
sys.path.insert(0, PROJECT_PATH)

print(f"R√©pertoire de travail: {os.getcwd()}")
print(f"\nContenu du r√©pertoire:")
for item in sorted(os.listdir('.')):
    print(f"  - {item}")

## 4. Installation des d√©pendances

In [None]:
# Installer les packages n√©cessaires
!pip install -q torch torchvision torchaudio
!pip install -q numpy matplotlib tqdm

print("‚úì Installation termin√©e")

## 5. V√©rification de l'environnement PyTorch

In [None]:
import torch
import numpy as np

print("=" * 60)
print("CONFIGURATION SYST√àME")
print("=" * 60)
print(f"PyTorch version: {torch.__version__}")
print(f"NumPy version: {np.__version__}")
print(f"\nCUDA disponible: {torch.cuda.is_available()}")

if torch.cuda.is_available():
    print(f"CUDA version: {torch.version.cuda}")
    print(f"Nom du GPU: {torch.cuda.get_device_name(0)}")
    props = torch.cuda.get_device_properties(0)
    print(f"M√©moire GPU totale: {props.total_memory / 1e9:.2f} GB")
    print(f"Compute Capability: {props.major}.{props.minor}")
else:
    print("‚ö†Ô∏è ATTENTION: GPU non disponible, l'entra√Ænement sera tr√®s lent!")
    print("   Allez dans Runtime > Change runtime type > GPU")

print("=" * 60)

## 6. Import des modules du projet

In [None]:
# Importer les modules n√©cessaires depuis le projet
try:
    from ai.NN.train_torch import (
        train_model,
        generate_training_data,
        ChessDataset,
        ChessNet
    )
    from ai.Chess_v2 import Chess
    print("‚úì Modules import√©s avec succ√®s!")
except ImportError as e:
    print(f"‚ùå Erreur d'import: {e}")
    print("\nV√©rifiez que vous √™tes dans le bon r√©pertoire et que tous les fichiers sont pr√©sents.")
    raise

## 7. Configuration de l'entra√Ænement

In [None]:
# Param√®tres d'entra√Ænement
CONFIG = {
    # G√©n√©ration de donn√©es
    'num_games': 10000,          # Nombre de parties √† g√©n√©rer pour l'entra√Ænement
    
    # Hyperparam√®tres
    'batch_size': 256,           # Taille du batch (augmenter si GPU puissant)
    'epochs': 50,                # Nombre d'√©poques d'entra√Ænement
    'learning_rate': 0.001,      # Taux d'apprentissage
    
    # Configuration syst√®me
    'device': 'cuda' if torch.cuda.is_available() else 'cpu',
    'num_workers': 2,            # Workers pour le DataLoader
    
    # Sauvegarde
    'checkpoint_path': 'ai/chess_model_checkpoint.pt',
    'save_interval': 5,          # Sauvegarder tous les N √©poques
}

print("=" * 60)
print("CONFIGURATION DE L'ENTRA√éNEMENT")
print("=" * 60)
for key, value in CONFIG.items():
    print(f"{key:20s}: {value}")
print("=" * 60)

if CONFIG['device'] == 'cpu':
    print("\n‚ö†Ô∏è ATTENTION: Entra√Ænement sur CPU d√©tect√©!")
    print("   R√©duisez num_games et epochs pour un test rapide.")

## 8. G√©n√©ration des donn√©es d'entra√Ænement

Cette √©tape g√©n√®re des parties d'√©checs al√©atoires et calcule les √©valuations de position.
**Attention:** Cela peut prendre 15-30 minutes selon le nombre de parties.

In [None]:
from tqdm import tqdm
import time

print(f"G√©n√©ration de {CONFIG['num_games']} parties...")
print("Cette op√©ration peut prendre du temps, soyez patient!\n")

start_time = time.time()

# G√©n√©rer les donn√©es
X_train, y_train = generate_training_data(CONFIG['num_games'])

elapsed_time = time.time() - start_time

print("\n" + "=" * 60)
print("DONN√âES G√âN√âR√âES")
print("=" * 60)
print(f"Forme de X_train: {X_train.shape}")
print(f"Forme de y_train: {y_train.shape}")
print(f"Nombre total de positions: {len(X_train):,}")
print(f"Temps √©coul√©: {elapsed_time:.1f}s ({elapsed_time/60:.1f} min)")
print(f"Positions/seconde: {len(X_train)/elapsed_time:.1f}")
print("=" * 60)

# Statistiques sur les donn√©es
print(f"\nStatistiques sur les √©valuations:")
print(f"  Min: {y_train.min():.4f}")
print(f"  Max: {y_train.max():.4f}")
print(f"  Moyenne: {y_train.mean():.4f}")
print(f"  √âcart-type: {y_train.std():.4f}")

## 9. Cr√©ation du dataset et du dataloader

In [None]:
from torch.utils.data import DataLoader

# Cr√©er le dataset
dataset = ChessDataset(X_train, y_train)

# Cr√©er le dataloader
train_loader = DataLoader(
    dataset,
    batch_size=CONFIG['batch_size'],
    shuffle=True,
    num_workers=CONFIG['num_workers'],
    pin_memory=True if CONFIG['device'] == 'cuda' else False
)

print("=" * 60)
print("DATALOADER CONFIGUR√â")
print("=" * 60)
print(f"Taille du dataset: {len(dataset):,} √©chantillons")
print(f"Nombre de batches: {len(train_loader):,}")
print(f"Taille du batch: {CONFIG['batch_size']}")
print(f"Derni√®re batch: {len(dataset) % CONFIG['batch_size']} √©chantillons")
print("=" * 60)

## 10. Cr√©ation du mod√®le

In [None]:
# Cr√©er le mod√®le et le d√©placer sur le device appropri√©
model = ChessNet().to(CONFIG['device'])

# Afficher l'architecture
print("=" * 60)
print("ARCHITECTURE DU MOD√àLE")
print("=" * 60)
print(model)
print("=" * 60)

# Compter les param√®tres
total_params = sum(p.numel() for p in model.parameters())
trainable_params = sum(p.numel() for p in model.parameters() if p.requires_grad)

print(f"\nNombre total de param√®tres: {total_params:,}")
print(f"Param√®tres entra√Ænables: {trainable_params:,}")
print(f"Device: {CONFIG['device']}")

# Estimer la taille m√©moire du mod√®le
param_size_mb = total_params * 4 / (1024 ** 2)  # 4 bytes par float32
print(f"Taille estim√©e du mod√®le: {param_size_mb:.2f} MB")

## 11. Entra√Ænement du mod√®le

Cette √©tape lance l'entra√Ænement complet. Les checkpoints sont sauvegard√©s automatiquement sur votre Drive.

In [None]:
print("=" * 60)
print("D√âBUT DE L'ENTRA√éNEMENT")
print("=" * 60)
print(f"Device: {CONFIG['device']}")
print(f"√âpoques: {CONFIG['epochs']}")
print(f"Batch size: {CONFIG['batch_size']}")
print(f"Learning rate: {CONFIG['learning_rate']}")
print("=" * 60 + "\n")

start_time = time.time()

# Entra√Æner le mod√®le
history = train_model(
    model=model,
    train_loader=train_loader,
    epochs=CONFIG['epochs'],
    learning_rate=CONFIG['learning_rate'],
    device=CONFIG['device'],
    checkpoint_path=CONFIG['checkpoint_path'],
    save_interval=CONFIG['save_interval']
)

training_time = time.time() - start_time

print("\n" + "=" * 60)
print("ENTRA√éNEMENT TERMIN√â!")
print("=" * 60)
print(f"Temps total: {training_time:.1f}s ({training_time/60:.1f} min)")
print(f"Temps par √©poque: {training_time/CONFIG['epochs']:.1f}s")
print("=" * 60)

## 12. Visualisation des r√©sultats

In [None]:
import matplotlib.pyplot as plt

# Configurer le style des graphiques
plt.style.use('seaborn-v0_8-darkgrid')
fig, axes = plt.subplots(1, 2, figsize=(15, 5))

# Graphique 1: Loss
axes[0].plot(history['loss'], linewidth=2, color='#2E86AB', label='Training Loss')
axes[0].set_xlabel('√âpoque', fontsize=12)
axes[0].set_ylabel('Loss (MSE)', fontsize=12)
axes[0].set_title('√âvolution de la perte pendant l\'entra√Ænement', fontsize=14, fontweight='bold')
axes[0].legend(fontsize=10)
axes[0].grid(True, alpha=0.3)

# Afficher les valeurs min/max
min_loss = min(history['loss'])
max_loss = max(history['loss'])
axes[0].axhline(y=min_loss, color='green', linestyle='--', alpha=0.5, label=f'Min: {min_loss:.6f}')
axes[0].legend(fontsize=10)

# Graphique 2: MAE (si disponible)
if 'mae' in history:
    axes[1].plot(history['mae'], linewidth=2, color='#F77F00', label='MAE')
    axes[1].set_xlabel('√âpoque', fontsize=12)
    axes[1].set_ylabel('MAE', fontsize=12)
    axes[1].set_title('Erreur absolue moyenne', fontsize=14, fontweight='bold')
    axes[1].legend(fontsize=10)
    axes[1].grid(True, alpha=0.3)
    
    min_mae = min(history['mae'])
    axes[1].axhline(y=min_mae, color='green', linestyle='--', alpha=0.5, label=f'Min: {min_mae:.6f}')
    axes[1].legend(fontsize=10)
else:
    axes[1].text(0.5, 0.5, 'MAE non disponible', 
                ha='center', va='center', fontsize=14, transform=axes[1].transAxes)
    axes[1].set_xticks([])
    axes[1].set_yticks([])

plt.tight_layout()
plt.savefig('training_history.png', dpi=150, bbox_inches='tight')
plt.show()

# Afficher les statistiques finales
print("\n" + "=" * 60)
print("STATISTIQUES FINALES")
print("=" * 60)
print(f"Perte finale: {history['loss'][-1]:.6f}")
print(f"Perte minimale: {min_loss:.6f} (√©poque {history['loss'].index(min_loss) + 1})")
if 'mae' in history:
    print(f"MAE final: {history['mae'][-1]:.6f}")
    print(f"MAE minimal: {min_mae:.6f} (√©poque {history['mae'].index(min_mae) + 1})")
print("=" * 60)

## 13. Sauvegarde du mod√®le final

In [None]:
import datetime

# Timestamp pour identifier cette sauvegarde
timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")

# Sauvegarder le mod√®le complet avec l'historique
final_model_path = f'ai/chess_model_final_{timestamp}.pt'
torch.save({
    'epoch': CONFIG['epochs'],
    'model_state_dict': model.state_dict(),
    'config': CONFIG,
    'history': history,
    'timestamp': timestamp,
}, final_model_path)

print("=" * 60)
print("SAUVEGARDE DES MOD√àLES")
print("=" * 60)
print(f"‚úì Mod√®le final: {final_model_path}")

# Sauvegarder aussi au format .npz pour compatibilit√© avec l'ancien code
weights_path = 'ai/NN/chess_nn_weights.npz'
weights = {name: param.cpu().detach().numpy() for name, param in model.named_parameters()}
np.savez(weights_path, **weights)
print(f"‚úì Poids .npz: {weights_path}")

# Copier aussi le checkpoint dans NN/
import shutil
checkpoint_backup = f'ai/NN/chess_model_checkpoint_{timestamp}.pt'
if os.path.exists(CONFIG['checkpoint_path']):
    shutil.copy(CONFIG['checkpoint_path'], checkpoint_backup)
    print(f"‚úì Checkpoint backup: {checkpoint_backup}")

print("=" * 60)
print("\n‚úÖ Tous les fichiers sont sauvegard√©s sur votre Google Drive!")
print(f"   Chemin: {PROJECT_PATH}")

## 14. Test du mod√®le sur des positions al√©atoires

In [None]:
# Passer le mod√®le en mode √©valuation
model.eval()

# Tester sur quelques positions al√©atoires
num_tests = 10
test_indices = np.random.choice(len(X_train), num_tests, replace=False)

print("=" * 60)
print(f"TEST SUR {num_tests} POSITIONS AL√âATOIRES")
print("=" * 60)

errors = []

with torch.no_grad():
    for i, idx in enumerate(test_indices, 1):
        x = torch.FloatTensor(X_train[idx:idx+1]).to(CONFIG['device'])
        y_true = y_train[idx]
        y_pred = model(x).cpu().numpy()[0, 0]
        error = abs(y_true - y_pred)
        errors.append(error)
        
        print(f"\nPosition {i}:")
        print(f"  √âvaluation r√©elle:  {y_true:+8.4f}")
        print(f"  Pr√©diction mod√®le:  {y_pred:+8.4f}")
        print(f"  Erreur absolue:     {error:8.4f}")
        
        # Indicateur visuel de la qualit√©
        if error < 0.1:
            print(f"  Qualit√©: ‚úÖ Excellente")
        elif error < 0.3:
            print(f"  Qualit√©: ‚úì Bonne")
        elif error < 0.5:
            print(f"  Qualit√©: ‚ö† Moyenne")
        else:
            print(f"  Qualit√©: ‚ùå Faible")

print("\n" + "=" * 60)
print("STATISTIQUES DES TESTS")
print("=" * 60)
print(f"Erreur moyenne: {np.mean(errors):.4f}")
print(f"Erreur m√©diane: {np.median(errors):.4f}")
print(f"Erreur min:     {np.min(errors):.4f}")
print(f"Erreur max:     {np.max(errors):.4f}")
print(f"√âcart-type:     {np.std(errors):.4f}")
print("=" * 60)

## 15. R√©sum√© et fichiers g√©n√©r√©s

In [None]:
print("\n" + "="*60)
print("üìä R√âSUM√â DE L'ENTRA√éNEMENT")
print("="*60)
print(f"\nüìç Projet: {PROJECT_PATH}")
print(f"\n‚öôÔ∏è Configuration:")
print(f"   ‚Ä¢ Parties g√©n√©r√©es: {CONFIG['num_games']:,}")
print(f"   ‚Ä¢ Positions d'entra√Ænement: {len(X_train):,}")
print(f"   ‚Ä¢ √âpoques: {CONFIG['epochs']}")
print(f"   ‚Ä¢ Batch size: {CONFIG['batch_size']}")
print(f"   ‚Ä¢ Learning rate: {CONFIG['learning_rate']}")
print(f"   ‚Ä¢ Device: {CONFIG['device']}")

print(f"\nüìà R√©sultats:")
print(f"   ‚Ä¢ Perte finale: {history['loss'][-1]:.6f}")
print(f"   ‚Ä¢ Perte minimale: {min(history['loss']):.6f}")
if 'mae' in history:
    print(f"   ‚Ä¢ MAE final: {history['mae'][-1]:.6f}")

print(f"\nüíæ Fichiers sauvegard√©s sur Drive:")
files_to_check = [
    final_model_path,
    CONFIG['checkpoint_path'],
    weights_path,
    'training_history.png'
]

for filepath in files_to_check:
    if os.path.exists(filepath):
        size = os.path.getsize(filepath) / (1024 * 1024)  # Convertir en MB
        print(f"   ‚úì {filepath} ({size:.2f} MB)")
    else:
        print(f"   ‚úó {filepath} (non trouv√©)")

print("\n" + "="*60)
print("‚úÖ ENTRA√éNEMENT TERMIN√â AVEC SUCC√àS!")
print("="*60)
print("\nTous les fichiers sont automatiquement synchronis√©s avec votre Google Drive.")
print("Vous pouvez fermer ce notebook en toute s√©curit√©.\n")

In [None]:
# Localiser le dataset sur Google Drive et pr√©parer le dossier de checkpoints
import os
from glob import glob

# Chemin attendu du dossier contenant le dataset (donn√© par l'utilisateur)
DATASET_DIR = '/content/drive/MyDrive/smart_chess_drive/chessData'

# Chercher un fichier .csv dans DATASET_DIR
DATASET_CSV = None
if os.path.exists(DATASET_DIR):
    csvs = glob(os.path.join(DATASET_DIR, '*.csv'))
    if len(csvs) > 0:
        DATASET_CSV = csvs[0]
        print(f'‚úÖ Dataset CSV trouv√©: {DATASET_CSV}')
    else:
        print(f'‚ùå Aucun fichier .csv trouv√© dans {DATASET_DIR}. Placez votre fichier chessData.csv dans ce dossier.')
else:
    print(f'‚ùå Dossier dataset introuvable: {DATASET_DIR}. V√©rifiez le chemin sur votre Drive.')

# Cr√©er un dossier de checkpoints dans le repo sur Drive (persistant)
CKPT_DIR = '/content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints'
os.makedirs(CKPT_DIR, exist_ok=True)
print('Dossier de checkpoints (cr√©√© si manquant):', CKPT_DIR)

# Exposer variables utiles
print('\nVariables expos√©es:')
print(' DATASET_CSV =', DATASET_CSV)
print(' CKPT_DIR =', CKPT_DIR)


In [None]:
# Configurer et lancer le script d'entra√Ænement `ai.NN.train_torch` en adaptant les chemins pour Colab/Drive
import os
import importlib

if DATASET_CSV is None:
    raise FileNotFoundError(f"Dataset non trouv√© dans: {DATASET_DIR}")

# Importer le module d'entra√Ænement
import ai.NN.train_torch as trainer

# Rediriger les chemins dataset et checkpoints vers Drive
trainer.DATASET_PATH = DATASET_CSV
trainer.CHECKPOINT_FILE = os.path.join(CKPT_DIR, os.path.basename(trainer.CHECKPOINT_FILE))
trainer.WEIGHTS_FILE = os.path.join(CKPT_DIR, os.path.basename(trainer.WEIGHTS_FILE))

# Optionnel: r√©duire pour test rapide (d√©commentez si besoin)
# trainer.EPOCHS = 2
# trainer.MAX_SAMPLES = 5000

print('Configuration trainer:')
print(' DATASET_PATH=', trainer.DATASET_PATH)
print(' CHECKPOINT_FILE=', trainer.CHECKPOINT_FILE)
print(' WEIGHTS_FILE=', trainer.WEIGHTS_FILE)
print(' EPOCHS=', trainer.EPOCHS)
print(' MAX_SAMPLES=', trainer.MAX_SAMPLES)

# Lancer l'entra√Ænement
trainer.main()
