# Entraînement du Neural Network pour Smart Chess sur Google Colab

Ce notebook permet d'entraîner le réseau de neurones pour l'évaluation d'échecs en utilisant les ressources GPU de Google Colab.

**Chemin du projet sur Drive:** `MyDrive/smart_chess_drive/smart-chess`

## Instructions
1. Aller dans **Runtime > Change runtime type > GPU** (T4 ou mieux)
2. Exécuter les cellules dans l'ordre
3. Les modèles seront sauvegardés automatiquement sur votre Drive

## 1. Vérification GPU

In [None]:
# Vérifier la disponibilité du GPU
!nvidia-smi

Mon Oct 27 13:17:19 2025       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.54.15              Driver Version: 550.54.15      CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|   0  Tesla T4                       Off |   00000000:00:04.0 Off |                    0 |
| N/A   49C    P8             10W /   70W |       0MiB /  15360MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+
                                                

## 2. Montage Google Drive

In [None]:
# Monter Google Drive
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


## 3. Configuration du chemin du projet

In [None]:
# Définir le chemin vers le projet sur votre Drive
import os
import sys

PROJECT_PATH = '/content/drive/MyDrive/smart_chess_drive/smart-chess'
os.chdir(PROJECT_PATH)
sys.path.insert(0, PROJECT_PATH)

print(f"Répertoire de travail: {os.getcwd()}")
print(f"\nContenu du répertoire:")
for item in sorted(os.listdir('.')):
    print(f"  - {item}")

Répertoire de travail: /content/drive/MyDrive/smart_chess_drive/smart-chess

Contenu du répertoire:
  - .git
  - .gitignore
  - README.md
  - ai
  - docs
  - prototypes


## 4. Installation des dépendances

In [None]:
# Installer les packages nécessaires
!pip install -q torch torchvision torchaudio
!pip install -q numpy matplotlib tqdm

print("✓ Installation terminée")

✓ Installation terminée


## 5. Vérification de l'environnement PyTorch

In [None]:
import torch
import numpy as np

print("=" * 60)
print("CONFIGURATION SYSTÈME")
print("=" * 60)
print(f"PyTorch version: {torch.__version__}")
print(f"NumPy version: {np.__version__}")
print(f"\nCUDA disponible: {torch.cuda.is_available()}")

if torch.cuda.is_available():
    print(f"CUDA version: {torch.version.cuda}")
    print(f"Nom du GPU: {torch.cuda.get_device_name(0)}")
    props = torch.cuda.get_device_properties(0)
    print(f"Mémoire GPU totale: {props.total_memory / 1e9:.2f} GB")
    print(f"Compute Capability: {props.major}.{props.minor}")
else:
    print("⚠️ ATTENTION: GPU non disponible, l'entraînement sera très lent!")
    print("   Allez dans Runtime > Change runtime type > GPU")

print("=" * 60)

CONFIGURATION SYSTÈME
PyTorch version: 2.8.0+cu126
NumPy version: 2.0.2

CUDA disponible: True
CUDA version: 12.6
Nom du GPU: Tesla T4
Mémoire GPU totale: 15.83 GB
Compute Capability: 7.5


## 6. Import des modules du projet

In [18]:
# Importer les modules nécessaires depuis le projet (robuste à l'emplacement du repo sur Drive)
import os
import sys
import importlib

# Assurez-vous que PROJECT_PATH est défini et ajoutez également le dossier `ai` au PYTHONPATH
PROJECT_PATH = '/content/drive/MyDrive/smart_chess_drive/smart-chess'
AI_SUBDIR = os.path.join(PROJECT_PATH, 'ai')

# Vérifier les chemins alternatifs (si l'utilisateur a copié le repo dans /content)
ALT_PATH = '/content/smart-chess'

# Choisir un chemin existant
if not os.path.isdir(PROJECT_PATH) and os.path.isdir(ALT_PATH):
    PROJECT_PATH = ALT_PATH

if not os.path.isdir(PROJECT_PATH):
    raise FileNotFoundError(f"Répertoire projet introuvable: {PROJECT_PATH}. Montez Drive et vérifiez le chemin.")

# Ajouter au sys.path si nécessaire
if PROJECT_PATH not in sys.path:
    sys.path.insert(0, PROJECT_PATH)
if AI_SUBDIR not in sys.path and os.path.isdir(AI_SUBDIR):
    sys.path.insert(0, AI_SUBDIR)

# Se placer dans le répertoire projet
os.chdir(PROJECT_PATH)

print('Répertoire de travail:', os.getcwd())
print('\nQuelques fichiers à la racine du projet:')
print(sorted(os.listdir(PROJECT_PATH))[:50])
print('\nContenu du dossier ai/:')
print(sorted(os.listdir(AI_SUBDIR))[:100])

# Diagnostic d'import direct pour le module Chess
try:
    import Chess
    print('\n✅ Import direct `Chess` OK (module trouvé via sys.path)')
except Exception as e:
    print('\n❌ Import direct `Chess` a échoué:', e)
    print('Vérifiez que `ai/Chess.py` existe et que le dossier ai/ est dans sys.path')

# Maintenant importer le module d'entraînement (trainer)
try:
    import ai.NN.train_torch as trainer
    import ai.NN.torch_nn_evaluator as torch_eval
    from ai.Chess_v2 import Chess
    print('\n✓ Modules importés avec succès!')
except Exception as e:
    print('\n❌ Erreur d\'import lors de l\'import du trainer:', e)
    raise


Répertoire de travail: /content/drive/MyDrive/smart_chess_drive/smart-chess

Quelques fichiers à la racine du projet:
['.git', '.gitignore', 'README.md', 'ai', 'docs', 'prototypes']

Contenu du dossier ai/:
['AI_reduction', 'Chess.py', 'ChessInteractifv2.py', 'Chess_v2.py', 'NN', 'Null_move_AI', 'Old_AI', 'Player.py', 'Profile', 'Tests.py', '__init__.py', '__pycache__', 'alphabeta.py', 'alphabeta_engine.py', 'alphabeta_engine_v2.py', 'analyze_reduction_overhead.py', 'base_engine.py', 'check_dataset_stats.py', 'check_gpu.py', 'check_performance.py', 'chess_model_checkpoint.pt', 'debug_conversion.py', 'engine_match.py', 'evaluator.py', 'example_move_reduction.py', 'fast_evaluator.py', 'journal-experiments.md', 'optimized_chess.py', 'profile_report_1760344602.txt', 'test_depth_6_performance.py', 'test_depth_6_quick.py', 'test_depth_effectiveness.py', 'test_engines_v2.py', 'test_evaluator_performance.py', 'test_generalization.py', 'test_move_reduction.py', 'test_null_move.py', 'test_null_m

## 7. Configuration de l'entraînement

In [None]:
# Paramètres d'entraînement
CONFIG = {
    # Génération de données
    'num_games': 10000,          # Nombre de parties à générer pour l'entraînement

    # Hyperparamètres
    'batch_size': 256,           # Taille du batch (augmenter si GPU puissant)
    'epochs': 50,                # Nombre d'époques d'entraînement
    'learning_rate': 0.001,      # Taux d'apprentissage

    # Configuration système
    'device': 'cuda' if torch.cuda.is_available() else 'cpu',
    'num_workers': 2,            # Workers pour le DataLoader

    # Sauvegarde
    'checkpoint_path': 'ai/chess_model_checkpoint.pt',
    'save_interval': 5,          # Sauvegarder tous les N époques
}

print("=" * 60)
print("CONFIGURATION DE L'ENTRAÎNEMENT")
print("=" * 60)
for key, value in CONFIG.items():
    print(f"{key:20s}: {value}")
print("=" * 60)

if CONFIG['device'] == 'cpu':
    print("\n⚠️ ATTENTION: Entraînement sur CPU détecté!")
    print("   Réduisez num_games et epochs pour un test rapide.")

CONFIGURATION DE L'ENTRAÎNEMENT
num_games           : 10000
batch_size          : 256
epochs              : 50
learning_rate       : 0.001
device              : cuda
num_workers         : 2
checkpoint_path     : ai/chess_model_checkpoint.pt
save_interval       : 5


## 8. Génération des données d'entraînement

Cette étape génère des parties d'échecs aléatoires et calcule les évaluations de position.
**Attention:** Cela peut prendre 15-30 minutes selon le nombre de parties.

In [22]:
from tqdm import tqdm
import time

print("Chargement du dataset (depuis chessData)...")

# Préférer la variable DATASET_CSV (définie après le montage Drive) sinon utiliser la valeur par défaut du module trainer
dataset_path = globals().get('DATASET_CSV') # Use the DATASET_CSV variable directly

if dataset_path is None:
    raise FileNotFoundError('Aucun chemin de dataset défini. Montez Drive et placez le fichier CSV dans MyDrive/smart_chess_drive/chessData')

start_time = time.time()

# Utiliser la fonction de chargement du script d'entraînement pour assurer le même prétraitement
fens, evaluations = trainer.load_data(dataset_path) # Pass the dataset_path explicitly

# Variables attendues plus bas dans le notebook
X_train = fens
y_train = evaluations

elapsed_time = time.time() - start_time

print("\n" + "=" * 60)
print("DONNÉES CHARGÉES")
print("=" * 60)
print(f"Nombre total de positions: {len(X_train):,}")
print(f"Temps écoulé: {elapsed_time:.1f}s ({elapsed_time/60:.1f} min)")
print("=" * 60)

# Statistiques sur les évaluations
print(f"\nStatistiques sur les évaluations:")
print(f"  Min: {y_train.min():.4f}")
print(f"  Max: {y_train.max():.4f}")
print(f"  Moyenne: {y_train.mean():.4f}")
print(f"  Écart-type: {y_train.std():.4f}")

Chargement du dataset (depuis chessData)...
📂 Chargement du dataset depuis /content/drive/MyDrive/smart_chess_drive/chessData.csv...
🧹 Nettoyage : 190154 lignes corrompues supprimées.
✅ 12,767,881 positions valides chargées.

DONNÉES CHARGÉES
Nombre total de positions: 12,767,881
Temps écoulé: 23.8s (0.4 min)

Statistiques sur les évaluations:
  Min: -15.3120
  Max: 15.3190
  Moyenne: 0.0455
  Écart-type: 0.8139


In [23]:
import inspect
import ai.NN.train_torch as trainer

try:
    # Get the source code of the load_data function
    source_code = inspect.getsource(trainer.load_data)
    print("Source code of trainer.load_data:")
    print("=" * 60)
    print(source_code)
    print("=" * 60)
except TypeError:
    print("Could not get source code for trainer.load_data. It might not be a function defined in the file.")
except FileNotFoundError:
    print("Could not find the train_torch.py file.")
except Exception as e:
    print(f"An error occurred while trying to get source code: {e}")

Source code of trainer.load_data:
def load_data(filepath: str):
    """Charge le dataset FEN,Evaluation et le nettoie."""
    print(f"📂 Chargement du dataset depuis {filepath}...")
    
    df = pd.read_csv(
        filepath, 
        names=['FEN', 'Evaluation'], 
        skiprows=1,
        comment='#'
    )
    
    initial_count = len(df)
    df.dropna(inplace=True)
    cleaned_count = len(df)
    
    if initial_count > cleaned_count:
        print(f"🧹 Nettoyage : {initial_count - cleaned_count} lignes corrompues supprimées.")
    
    fens = df['FEN'].values
    EVAL_SCALE_FACTOR = 1000.0
    evaluations = (df['Evaluation'].astype(int).values) / EVAL_SCALE_FACTOR
    
    print(f"✅ {len(fens):,} positions valides chargées.")
    return fens, evaluations



In [24]:
import os

file_path = os.path.join(PROJECT_PATH, 'ai/NN/train_torch.py')

# Read the content of the file
with open(file_path, 'r') as f:
    content = f.read()

# Assuming the load_data function signature is currently load_data():
# We need to find the function definition and modify it to accept dataset_path
# This is a simple string replacement and might need adjustment based on the actual code
old_def = 'def load_data():'
new_def = 'def load_data(dataset_path):'
old_data_loading_line = "df = pd.read_csv('C:\\\\Users\\\\gauti\\\\OneDrive\\\\Documents\\\\UE commande\\\\chessData.csv')" # This is a guess, may need adjustment
new_data_loading_line = "df = pd.read_csv(dataset_path)"


if old_def in content and old_data_loading_line in content:
    content = content.replace(old_def, new_def)
    content = content.replace(old_data_loading_line, new_data_loading_line)
    # Write the modified content back to the file
    with open(file_path, 'w') as f:
        f.write(content)
    print(f"Successfully modified {file_path} to accept and use dataset_path in load_data function.")
elif old_def in content:
     print(f"Found function definition '{old_def}', but could not find the specific data loading line '{old_data_loading_line}' to replace.")
     print("Please inspect the `load_data` function in `ai/NN/train_torch.py` and manually update the file path to use the `dataset_path` argument.")
else:
    print(f"Could not find the function definition '{old_def}' in {file_path}. Please inspect the file manually.")

Could not find the function definition 'def load_data():' in /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/NN/train_torch.py. Please inspect the file manually.


## 9. Création du dataset et du dataloader

In [25]:
from torch.utils.data import DataLoader
from ai.NN.train_torch import ChessDataset # Import ChessDataset

# Créer le dataset
dataset = ChessDataset(X_train, y_train)

# Créer le dataloader
train_loader = DataLoader(
    dataset,
    batch_size=CONFIG['batch_size'],
    shuffle=True,
    num_workers=CONFIG['num_workers'],
    pin_memory=True if CONFIG['device'] == 'cuda' else False
)

print("=" * 60)
print("DATALOADER CONFIGURÉ")
print("=" * 60)
print(f"Taille du dataset: {len(dataset):,} échantillons")
print(f"Nombre de batches: {len(train_loader):,}")
print(f"Taille du batch: {CONFIG['batch_size']}")
print(f"Dernière batch: {len(dataset) % CONFIG['batch_size']} échantillons")
print("=" * 60)

DATALOADER CONFIGURÉ
Taille du dataset: 12,767,881 échantillons
Nombre de batches: 49,875
Taille du batch: 256
Dernière batch: 137 échantillons


## 10. Création du modèle

In [30]:
# Créer le modèle et le déplacer sur le device approprié
from ai.NN.torch_nn_evaluator import TorchNNEvaluator # Import TorchNNEvaluator from torch_nn_evaluator

model = TorchNNEvaluator().to(CONFIG['device'])

# Afficher l'architecture
print("=" * 60)
print("ARCHITECTURE DU MODÈLE")
print("=" * 60)
print(model)
print("=" * 60)

# Compter les paramètres
total_params = sum(p.numel() for p in model.parameters())
trainable_params = sum(p.numel() for p in model.parameters() if p.requires_grad)

print(f"\nNombre total de paramètres: {total_params:,}")
print(f"Paramètres entraînables: {trainable_params:,}")
print(f"Device: {CONFIG['device']}")

# Estimer la taille mémoire du modèle
param_size_mb = total_params * 4 / (1024 ** 2)  # 4 bytes par float32
print(f"Taille estimée du modèle: {param_size_mb:.2f} MB")

ARCHITECTURE DU MODÈLE
TorchNNEvaluator(
  (l1): Linear(in_features=768, out_features=256, bias=True)
  (l2): Linear(in_features=256, out_features=256, bias=True)
  (l3): Linear(in_features=256, out_features=1, bias=True)
  (dropout1): Dropout(p=0.3, inplace=False)
  (dropout2): Dropout(p=0.3, inplace=False)
  (leaky_relu): LeakyReLU(negative_slope=0.01)
)

Nombre total de paramètres: 262,913
Paramètres entraînables: 262,913
Device: cuda
Taille estimée du modèle: 1.00 MB


In [29]:
import os

file_path = os.path.join(PROJECT_PATH, 'ai/NN/torch_nn_evaluator.py')

try:
    with open(file_path, 'r') as f:
        content = f.read()
    print(f"Content of {file_path}:")
    print("=" * 60)
    print(content)
    print("=" * 60)
except FileNotFoundError:
    print(f"Error: File not found at {file_path}")
except Exception as e:
    print(f"An error occurred while reading the file: {e}")

Content of /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/NN/torch_nn_evaluator.py:
import numpy as np
import torch
import torch.nn as nn
from Chess import Chess


class TorchNNEvaluator(nn.Module):
    """PyTorch implementation équivalente du `NeuralNetworkEvaluator` en NumPy.

    - architecture: Linear(input -> hidden) -> LeakyReLU -> Dropout -> Linear(hidden -> hidden) -> LeakyReLU -> Dropout -> Linear(hidden -> out)
    - fournit des helpers pour charger/sauver au format .npz (compatibilité avec l'ancien code NumPy)
    - fournit des helpers pour checkpoint/restore PyTorch (optimizer.state_dict)
    - Support GPU automatique
    """

    def __init__(self, input_size=768, hidden_size=256, output_size=1, dropout=0.3, leaky_alpha=0.01):
        super().__init__()
        self.l1 = nn.Linear(input_size, hidden_size)
        self.l2 = nn.Linear(hidden_size, hidden_size)
        self.l3 = nn.Linear(hidden_size, output_size)
        self.dropout1 = nn.Dropout(p=dropout)
       

## 11. Entraînement du modèle

Cette étape lance l'entraînement complet. Les checkpoints sont sauvegardés automatiquement sur votre Drive.

In [35]:
# This cell is no longer needed as trainer.main() handles the training loop.
# The training will be started by running cell 9887d4b8.
# You can keep this cell as a placeholder or delete it if you prefer.
# The training history will be available after trainer.main() completes if the script returns it or saves it.

print("The training process is handled by calling trainer.main() in cell 9887d4b8.")
print("Please run cell 9887d4b8 to start the training.")

# Keep the history variable assignment as a placeholder if the script returns it
# history = None # Or whatever trainer.main() might return

The training process is handled by calling trainer.main() in cell 9887d4b8.
Please run cell 9887d4b8 to start the training.


In [36]:
import os

file_path = os.path.join(PROJECT_PATH, 'ai/NN/train_torch.py')

try:
    with open(file_path, 'r') as f:
        content = f.read()

    # Remove the verbose=True argument from ReduceLROnPlateau
    old_scheduler_init = "patience=LR_PATIENCE, verbose=True"
    new_scheduler_init = "patience=LR_PATIENCE" # Remove verbose argument

    if old_scheduler_init in content:
        content = content.replace(old_scheduler_init, new_scheduler_init)
        # Write the modified content back to the file
        with open(file_path, 'w') as f:
            f.write(content)
        print(f"Successfully removed 'verbose=True' from ReduceLROnPlateau in {file_path}.")
    else:
        print(f"'verbose=True' not found in ReduceLROnPlateau initialization in {file_path}. No changes made.")

except FileNotFoundError:
    print(f"Error: File not found at {file_path}")
except Exception as e:
    print(f"An error occurred while trying to modify the file: {e}")

Successfully removed 'verbose=True' from ReduceLROnPlateau in /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/NN/train_torch.py.


In [33]:
# @title
import os

file_path = os.path.join(PROJECT_PATH, 'ai/NN/train_torch.py')

try:
    with open(file_path, 'r') as f:
        content = f.read()
    print(f"Content of {file_path}:")
    print("=" * 60)
    print(content)
    print("=" * 60)
except FileNotFoundError:
    print(f"Error: File not found at {file_path}")
except Exception as e:
    print(f"An error occurred while reading the file: {e}")

Content of /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/NN/train_torch.py:
"""
Script d'entraînement PyTorch optimisé pour GPU
Compatible avec Google Colab et machines locales avec GPU
"""
import numpy as np
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
from tqdm import tqdm
import os

from Chess import Chess
from ai.NN.torch_nn_evaluator import TorchNNEvaluator, save_weights_npz, load_from_npz, torch_save_checkpoint, torch_load_checkpoint

# --- CONFIGURATION DE L'ENTRAÎNEMENT ---
DATASET_PATH = "C:\\Users\\gauti\\OneDrive\\Documents\\UE commande\\chessData.csv"  # Adapté pour Colab (fichier à la racine)
WEIGHTS_FILE = "chess_nn_weights.npz"
CHECKPOINT_FILE = "chess_model_checkpoint.pt"

# Architecture
HIDDEN_SIZE = 256
DROPOUT = 0.3
LEAKY_ALPHA = 0.01

# Hyperparamètres
LEARNING_RATE = 0.001
WEIGHT_DECAY = 1e-4  # L2 regularization (AdamW)
EPOCHS = 20
BATCH_SIZE = 128  # Plus grand pour G

## 12. Visualisation des résultats

In [None]:
import matplotlib.pyplot as plt

# Configurer le style des graphiques
plt.style.use('seaborn-v0_8-darkgrid')
fig, axes = plt.subplots(1, 2, figsize=(15, 5))

# Graphique 1: Loss
axes[0].plot(history['loss'], linewidth=2, color='#2E86AB', label='Training Loss')
axes[0].set_xlabel('Époque', fontsize=12)
axes[0].set_ylabel('Loss (MSE)', fontsize=12)
axes[0].set_title('Évolution de la perte pendant l\'entraînement', fontsize=14, fontweight='bold')
axes[0].legend(fontsize=10)
axes[0].grid(True, alpha=0.3)

# Afficher les valeurs min/max
min_loss = min(history['loss'])
max_loss = max(history['loss'])
axes[0].axhline(y=min_loss, color='green', linestyle='--', alpha=0.5, label=f'Min: {min_loss:.6f}')
axes[0].legend(fontsize=10)

# Graphique 2: MAE (si disponible)
if 'mae' in history:
    axes[1].plot(history['mae'], linewidth=2, color='#F77F00', label='MAE')
    axes[1].set_xlabel('Époque', fontsize=12)
    axes[1].set_ylabel('MAE', fontsize=12)
    axes[1].set_title('Erreur absolue moyenne', fontsize=14, fontweight='bold')
    axes[1].legend(fontsize=10)
    axes[1].grid(True, alpha=0.3)

    min_mae = min(history['mae'])
    axes[1].axhline(y=min_mae, color='green', linestyle='--', alpha=0.5, label=f'Min: {min_mae:.6f}')
    axes[1].legend(fontsize=10)
else:
    axes[1].text(0.5, 0.5, 'MAE non disponible',
                ha='center', va='center', fontsize=14, transform=axes[1].transAxes)
    axes[1].set_xticks([])
    axes[1].set_yticks([])

plt.tight_layout()
plt.savefig('training_history.png', dpi=150, bbox_inches='tight')
plt.show()

# Afficher les statistiques finales
print("\n" + "=" * 60)
print("STATISTIQUES FINALES")
print("=" * 60)
print(f"Perte finale: {history['loss'][-1]:.6f}")
print(f"Perte minimale: {min_loss:.6f} (époque {history['loss'].index(min_loss) + 1})")
if 'mae' in history:
    print(f"MAE final: {history['mae'][-1]:.6f}")
    print(f"MAE minimal: {min_mae:.6f} (époque {history['mae'].index(min_mae) + 1})")
print("=" * 60)

## 13. Sauvegarde du modèle final

In [None]:
import datetime

# Timestamp pour identifier cette sauvegarde
timestamp = datetime.datetime.now().strftime("%Y%m%d_%H%M%S")

# Sauvegarder le modèle complet avec l'historique
final_model_path = f'ai/chess_model_final_{timestamp}.pt'
torch.save({
    'epoch': CONFIG['epochs'],
    'model_state_dict': model.state_dict(),
    'config': CONFIG,
    'history': history,
    'timestamp': timestamp,
}, final_model_path)

print("=" * 60)
print("SAUVEGARDE DES MODÈLES")
print("=" * 60)
print(f"✓ Modèle final: {final_model_path}")

# Sauvegarder aussi au format .npz pour compatibilité avec l'ancien code
weights_path = 'ai/NN/chess_nn_weights.npz'
weights = {name: param.cpu().detach().numpy() for name, param in model.named_parameters()}
np.savez(weights_path, **weights)
print(f"✓ Poids .npz: {weights_path}")

# Copier aussi le checkpoint dans NN/
import shutil
checkpoint_backup = f'ai/NN/chess_model_checkpoint_{timestamp}.pt'
if os.path.exists(CONFIG['checkpoint_path']):
    shutil.copy(CONFIG['checkpoint_path'], checkpoint_backup)
    print(f"✓ Checkpoint backup: {checkpoint_backup}")

print("=" * 60)
print("\n✅ Tous les fichiers sont sauvegardés sur votre Google Drive!")
print(f"   Chemin: {PROJECT_PATH}")

## 14. Test du modèle sur des positions aléatoires

In [None]:
# Passer le modèle en mode évaluation
model.eval()

# Tester sur quelques positions aléatoires
num_tests = 10
test_indices = np.random.choice(len(X_train), num_tests, replace=False)

print("=" * 60)
print(f"TEST SUR {num_tests} POSITIONS ALÉATOIRES")
print("=" * 60)

errors = []

with torch.no_grad():
    for i, idx in enumerate(test_indices, 1):
        x = torch.FloatTensor(X_train[idx:idx+1]).to(CONFIG['device'])
        y_true = y_train[idx]
        y_pred = model(x).cpu().numpy()[0, 0]
        error = abs(y_true - y_pred)
        errors.append(error)

        print(f"\nPosition {i}:")
        print(f"  Évaluation réelle:  {y_true:+8.4f}")
        print(f"  Prédiction modèle:  {y_pred:+8.4f}")
        print(f"  Erreur absolue:     {error:8.4f}")

        # Indicateur visuel de la qualité
        if error < 0.1:
            print(f"  Qualité: ✅ Excellente")
        elif error < 0.3:
            print(f"  Qualité: ✓ Bonne")
        elif error < 0.5:
            print(f"  Qualité: ⚠ Moyenne")
        else:
            print(f"  Qualité: ❌ Faible")

print("\n" + "=" * 60)
print("STATISTIQUES DES TESTS")
print("=" * 60)
print(f"Erreur moyenne: {np.mean(errors):.4f}")
print(f"Erreur médiane: {np.median(errors):.4f}")
print(f"Erreur min:     {np.min(errors):.4f}")
print(f"Erreur max:     {np.max(errors):.4f}")
print(f"Écart-type:     {np.std(errors):.4f}")
print("=" * 60)

## 15. Résumé et fichiers générés

In [None]:
print("\n" + "="*60)
print("📊 RÉSUMÉ DE L'ENTRAÎNEMENT")
print("="*60)
print(f"\n📍 Projet: {PROJECT_PATH}")
print(f"\n⚙️ Configuration:")
print(f"   • Parties générées: {CONFIG['num_games']:,}")
print(f"   • Positions d'entraînement: {len(X_train):,}")
print(f"   • Époques: {CONFIG['epochs']}")
print(f"   • Batch size: {CONFIG['batch_size']}")
print(f"   • Learning rate: {CONFIG['learning_rate']}")
print(f"   • Device: {CONFIG['device']}")

print(f"\n📈 Résultats:")
print(f"   • Perte finale: {history['loss'][-1]:.6f}")
print(f"   • Perte minimale: {min(history['loss']):.6f}")
if 'mae' in history:
    print(f"   • MAE final: {history['mae'][-1]:.6f}")

print(f"\n💾 Fichiers sauvegardés sur Drive:")
files_to_check = [
    final_model_path,
    CONFIG['checkpoint_path'],
    weights_path,
    'training_history.png'
]

for filepath in files_to_check:
    if os.path.exists(filepath):
        size = os.path.getsize(filepath) / (1024 * 1024)  # Convertir en MB
        print(f"   ✓ {filepath} ({size:.2f} MB)")
    else:
        print(f"   ✗ {filepath} (non trouvé)")

print("\n" + "="*60)
print("✅ ENTRAÎNEMENT TERMINÉ AVEC SUCCÈS!")
print("="*60)
print("\nTous les fichiers sont automatiquement synchronisés avec votre Google Drive.")
print("Vous pouvez fermer ce notebook en toute sécurité.\n")

In [21]:
# Localiser le dataset sur Google Drive et préparer le dossier de checkpoints
import os
from glob import glob

# Chemin attendu du dossier contenant le dataset (donné par l'user)
# Updated based on user's feedback that the file is directly in smart_chess_drive
DATASET_DIR = '/content/drive/MyDrive/smart_chess_drive/'

# Chercher un fichier .csv dans DATASET_DIR
DATASET_CSV = None
if os.path.exists(DATASET_DIR):
    csvs = glob(os.path.join(DATASET_DIR, '*.csv'))
    if len(csvs) > 0:
        # Assuming there's only one relevant CSV in that dir, pick the first one
        DATASET_CSV = csvs[0]
        print(f'✅ Dataset CSV trouvé: {DATASET_CSV}')
    else:
        print(f'❌ Aucun fichier .csv trouvé dans {DATASET_DIR}. Placez votre fichier chessData.csv dans ce dossier.')
else:
    print(f'❌ Dossier dataset introuvable: {DATASET_DIR}. Vérifiez le chemin sur votre Drive.')

# Créer un dossier de checkpoints dans le repo sur Drive (persistant)
CKPT_DIR = '/content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints'
os.makedirs(CKPT_DIR, exist_ok=True)
print('Dossier de checkpoints (créé si manquant):', CKPT_DIR)

# Exposer variables utiles
print('\nVariables exposées:')
print(' DATASET_CSV =', DATASET_CSV)
print(' CKPT_DIR =', CKPT_DIR)

✅ Dataset CSV trouvé: /content/drive/MyDrive/smart_chess_drive/chessData.csv
Dossier de checkpoints (créé si manquant): /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints

Variables exposées:
 DATASET_CSV = /content/drive/MyDrive/smart_chess_drive/chessData.csv
 CKPT_DIR = /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints


In [None]:
# Configurer et lancer le script d'entraînement `ai.NN.train_torch` en adaptant les chemins pour Colab/Drive
import os
import importlib

if DATASET_CSV is None:
    raise FileNotFoundError(f"Dataset non trouvé dans: {DATASET_DIR}")

# Importer le module d'entraînement
import ai.NN.train_torch as trainer

# Reload the module to pick up recent changes
importlib.reload(trainer)


# Rediriger les chemins dataset et checkpoints vers Drive
trainer.DATASET_PATH = DATASET_CSV
trainer.CHECKPOINT_FILE = os.path.join(CKPT_DIR, os.path.basename(trainer.CHECKPOINT_FILE))
trainer.WEIGHTS_FILE = os.path.join(CKPT_DIR, os.path.basename(trainer.WEIGHTS_FILE))

# Optionally set other CONFIG parameters from the notebook if needed
# trainer.EPOCHS = CONFIG['epochs']
# trainer.BATCH_SIZE = CONFIG['batch_size']
# trainer.LEARNING_RATE = CONFIG['learning_rate']
# trainer.DEVICE = CONFIG['device']
# trainer.MAX_SAMPLES = CONFIG['num_games'] # Assuming num_games in CONFIG is similar to MAX_SAMPLES

# Optionnel: réduire pour test rapide (décommentez si besoin)
# trainer.EPOCHS = 2
# trainer.MAX_SAMPLES = 5000

print('Configuration trainer:')
print(' DATASET_PATH=', trainer.DATASET_PATH)
print(' CHECKPOINT_FILE=', trainer.CHECKPOINT_FILE)
print(' WEIGHTS_FILE=', trainer.WEIGHTS_FILE)
print(' EPOCHS=', trainer.EPOCHS)
print(' MAX_SAMPLES=', trainer.MAX_SAMPLES)


# Lancer l'entraînement
trainer.main()

🖥️  Device: cuda
🚀 GPU: Tesla T4
💾 GPU Memory: 15.83 GB
Configuration trainer:
 DATASET_PATH= /content/drive/MyDrive/smart_chess_drive/chessData.csv
 CHECKPOINT_FILE= /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_model_checkpoint.pt
 WEIGHTS_FILE= /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_nn_weights.npz
 EPOCHS= 20
 MAX_SAMPLES= 500000
📂 Chargement du dataset depuis /content/drive/MyDrive/smart_chess_drive/chessData.csv...
🧹 Nettoyage : 190154 lignes corrompues supprimées.
✅ 12,767,881 positions valides chargées.

📊 Dataset complet: 12,767,881 positions
🆕 Création d'un nouveau réseau...

Configuration:
  Dataset complet: 12,767,881 positions
  Échantillon/epoch: 500,000 positions
  Architecture: 768 → 256 → 256 → 1
  Dropout: 0.3
  LeakyReLU alpha: 0.01
  Learning rate: 0.001 (AdamW, weight decay: 0.0001)
  LR Warmup: True (0.0001 → 0.001)
  LR Scheduler: True (patience: 2)
  Batch size: 128
  Epochs: 20
  Device: cuda


[Epoc

Epoch 1/20:   0%|          | 10/3907 [00:01<05:52, 11.05it/s, loss=0.8637]


[DEBUG batch 0] targets mean=0.1219 std=1.0175; preds mean=0.0330 std=0.0197; RMSE=1.0226; corr=-0.0520


Epoch 1/20: 100%|██████████| 3907/3907 [00:42<00:00, 92.85it/s, loss=0.7508]



🔍 Évaluation epoch 1...

EPOCH 1/20 - Évaluation sur 5,000 positions
  RMSE:        0.7361  (baseline: 0.8272)
  MAE:         0.3011
  Amélioration: +11.0% vs baseline
  Corrélation: 0.4572
  Std preds:   0.3802  (cible: 0.8272)
  Mean preds:  0.0679  (cible: 0.0439)
  →  Apprentissage en cours

💾 Nouveau meilleur RMSE: 0.7361 - Sauvegarde...
Checkpoint PyTorch sauvegardé dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_model_checkpoint.pt
Poids sauvegardés (npz) dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_nn_weights.npz

[Epoch 2] 🎲 Échantillonnage: 500,000 positions sur 12,767,881
🔥 Warmup epoch 2/3: LR = 0.000700


Epoch 2/20: 100%|██████████| 3907/3907 [00:41<00:00, 93.43it/s, loss=0.7174]



🔍 Évaluation epoch 2...

EPOCH 2/20 - Évaluation sur 5,000 positions
  RMSE:        0.6632  (baseline: 0.7421)
  MAE:         0.2794
  Amélioration: +10.6% vs baseline
  Corrélation: 0.4557
  Std preds:   0.3790  (cible: 0.7421)
  Mean preds:  0.0032  (cible: 0.0466)
  →  Apprentissage en cours

💾 Nouveau meilleur RMSE: 0.6632 - Sauvegarde...
Checkpoint PyTorch sauvegardé dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_model_checkpoint.pt
Poids sauvegardés (npz) dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_nn_weights.npz

[Epoch 3] 🎲 Échantillonnage: 500,000 positions sur 12,767,881
🔥 Warmup epoch 3/3: LR = 0.001000


Epoch 3/20: 100%|██████████| 3907/3907 [00:41<00:00, 95.03it/s, loss=0.7113]



🔍 Évaluation epoch 3...

EPOCH 3/20 - Évaluation sur 5,000 positions
  RMSE:        0.6985  (baseline: 0.8209)
  MAE:         0.2809
  Amélioration: +14.9% vs baseline
  Corrélation: 0.5380
  Std preds:   0.3521  (cible: 0.8209)
  Mean preds:  0.0112  (cible: 0.0441)
  →  Apprentissage en cours


[Epoch 4] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 4/20: 100%|██████████| 3907/3907 [00:41<00:00, 94.42it/s, loss=0.6964]



🔍 Évaluation epoch 4...

EPOCH 4/20 - Évaluation sur 5,000 positions
  RMSE:        0.6412  (baseline: 0.7321)
  MAE:         0.2753
  Amélioration: +12.4% vs baseline
  Corrélation: 0.4867
  Std preds:   0.3773  (cible: 0.7321)
  Mean preds:  0.0774  (cible: 0.0358)
  →  Apprentissage en cours

💾 Nouveau meilleur RMSE: 0.6412 - Sauvegarde...
Checkpoint PyTorch sauvegardé dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_model_checkpoint.pt
Poids sauvegardés (npz) dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_nn_weights.npz

[Epoch 5] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 5/20: 100%|██████████| 3907/3907 [00:41<00:00, 95.02it/s, loss=0.6904]



🔍 Évaluation epoch 5...

EPOCH 5/20 - Évaluation sur 5,000 positions
  RMSE:        0.6604  (baseline: 0.7852)
  MAE:         0.2656
  Amélioration: +15.9% vs baseline
  Corrélation: 0.5508
  Std preds:   0.3511  (cible: 0.7852)
  Mean preds:  0.0436  (cible: 0.0511)
  →  Apprentissage en cours


[Epoch 6] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 6/20: 100%|██████████| 3907/3907 [00:41<00:00, 94.75it/s, loss=0.6880]



🔍 Évaluation epoch 6...

EPOCH 6/20 - Évaluation sur 5,000 positions
  RMSE:        0.6780  (baseline: 0.8147)
  MAE:         0.2650
  Amélioration: +16.8% vs baseline
  Corrélation: 0.5602
  Std preds:   0.4098  (cible: 0.8147)
  Mean preds:  0.0101  (cible: 0.0563)
  →  Apprentissage en cours


[Epoch 7] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 7/20: 100%|██████████| 3907/3907 [00:41<00:00, 94.71it/s, loss=0.6810]



🔍 Évaluation epoch 7...

EPOCH 7/20 - Évaluation sur 5,000 positions
  RMSE:        0.6952  (baseline: 0.8424)
  MAE:         0.2917
  Amélioration: +17.5% vs baseline
  Corrélation: 0.5675
  Std preds:   0.4515  (cible: 0.8424)
  Mean preds:  0.0750  (cible: 0.0359)
  →  Apprentissage en cours


[Epoch 8] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 8/20: 100%|██████████| 3907/3907 [00:41<00:00, 93.37it/s, loss=0.6647]



🔍 Évaluation epoch 8...

EPOCH 8/20 - Évaluation sur 5,000 positions
  RMSE:        0.6579  (baseline: 0.8487)
  MAE:         0.2670
  Amélioration: +22.5% vs baseline
  Corrélation: 0.6417
  Std preds:   0.4546  (cible: 0.8487)
  Mean preds:  0.0248  (cible: 0.0573)
  →  Apprentissage en cours


[Epoch 9] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 9/20: 100%|██████████| 3907/3907 [00:41<00:00, 94.75it/s, loss=0.6582]



🔍 Évaluation epoch 9...

EPOCH 9/20 - Évaluation sur 5,000 positions
  RMSE:        0.7049  (baseline: 0.8894)
  MAE:         0.2850
  Amélioration: +20.7% vs baseline
  Corrélation: 0.6203
  Std preds:   0.4526  (cible: 0.8894)
  Mean preds:  0.0479  (cible: 0.0275)
  →  Apprentissage en cours


[Epoch 10] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 10/20: 100%|██████████| 3907/3907 [00:41<00:00, 94.54it/s, loss=0.6547]



🔍 Évaluation epoch 10...

EPOCH 10/20 - Évaluation sur 5,000 positions
  RMSE:        0.6081  (baseline: 0.7996)
  MAE:         0.2502
  Amélioration: +23.9% vs baseline
  Corrélation: 0.6500
  Std preds:   0.4957  (cible: 0.7996)
  Mean preds:  0.0382  (cible: 0.0317)
  →  Apprentissage en cours

💾 Nouveau meilleur RMSE: 0.6081 - Sauvegarde...
Checkpoint PyTorch sauvegardé dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_model_checkpoint.pt
Poids sauvegardés (npz) dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_nn_weights.npz

[Epoch 11] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 11/20: 100%|██████████| 3907/3907 [00:41<00:00, 94.27it/s, loss=0.6524]



🔍 Évaluation epoch 11...

EPOCH 11/20 - Évaluation sur 5,000 positions
  RMSE:        0.5861  (baseline: 0.7644)
  MAE:         0.2503
  Amélioration: +23.3% vs baseline
  Corrélation: 0.6428
  Std preds:   0.4730  (cible: 0.7644)
  Mean preds:  0.0315  (cible: 0.0482)
  →  Apprentissage en cours

💾 Nouveau meilleur RMSE: 0.5861 - Sauvegarde...
Checkpoint PyTorch sauvegardé dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_model_checkpoint.pt
Poids sauvegardés (npz) dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_nn_weights.npz

[Epoch 12] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 12/20: 100%|██████████| 3907/3907 [00:41<00:00, 94.74it/s, loss=0.6556]



🔍 Évaluation epoch 12...

EPOCH 12/20 - Évaluation sur 5,000 positions
  RMSE:        0.6185  (baseline: 0.7926)
  MAE:         0.2592
  Amélioration: +22.0% vs baseline
  Corrélation: 0.6306
  Std preds:   0.4348  (cible: 0.7926)
  Mean preds:  0.0477  (cible: 0.0509)
  →  Apprentissage en cours


[Epoch 13] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 13/20: 100%|██████████| 3907/3907 [00:41<00:00, 93.99it/s, loss=0.6507]



🔍 Évaluation epoch 13...

EPOCH 13/20 - Évaluation sur 5,000 positions
  RMSE:        0.6738  (baseline: 0.8656)
  MAE:         0.2726
  Amélioration: +22.2% vs baseline
  Corrélation: 0.6304
  Std preds:   0.4989  (cible: 0.8656)
  Mean preds:  0.0542  (cible: 0.0354)
  →  Apprentissage en cours


[Epoch 14] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 14/20: 100%|██████████| 3907/3907 [00:41<00:00, 93.97it/s, loss=0.6464]



🔍 Évaluation epoch 14...

EPOCH 14/20 - Évaluation sur 5,000 positions
  RMSE:        0.5737  (baseline: 0.7574)
  MAE:         0.2491
  Amélioration: +24.3% vs baseline
  Corrélation: 0.6564
  Std preds:   0.4484  (cible: 0.7574)
  Mean preds:  0.0630  (cible: 0.0481)
  →  Apprentissage en cours

💾 Nouveau meilleur RMSE: 0.5737 - Sauvegarde...
Checkpoint PyTorch sauvegardé dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_model_checkpoint.pt
Poids sauvegardés (npz) dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_nn_weights.npz

[Epoch 15] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 15/20: 100%|██████████| 3907/3907 [00:41<00:00, 94.12it/s, loss=0.6474]



🔍 Évaluation epoch 15...

EPOCH 15/20 - Évaluation sur 5,000 positions
  RMSE:        0.6533  (baseline: 0.8367)
  MAE:         0.2682
  Amélioration: +21.9% vs baseline
  Corrélation: 0.6275
  Std preds:   0.4759  (cible: 0.8367)
  Mean preds:  0.0536  (cible: 0.0529)
  →  Apprentissage en cours


[Epoch 16] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 16/20: 100%|██████████| 3907/3907 [00:41<00:00, 93.61it/s, loss=0.6394]



🔍 Évaluation epoch 16...

EPOCH 16/20 - Évaluation sur 5,000 positions
  RMSE:        0.5655  (baseline: 0.7429)
  MAE:         0.2473
  Amélioration: +23.9% vs baseline
  Corrélation: 0.6523
  Std preds:   0.4327  (cible: 0.7429)
  Mean preds:  0.0428  (cible: 0.0362)
  →  Apprentissage en cours

💾 Nouveau meilleur RMSE: 0.5655 - Sauvegarde...
Checkpoint PyTorch sauvegardé dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_model_checkpoint.pt
Poids sauvegardés (npz) dans /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/checkpoints/chess_nn_weights.npz

[Epoch 17] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 17/20: 100%|██████████| 3907/3907 [00:41<00:00, 93.95it/s, loss=0.6485]



🔍 Évaluation epoch 17...

EPOCH 17/20 - Évaluation sur 5,000 positions
  RMSE:        0.6056  (baseline: 0.8039)
  MAE:         0.2586
  Amélioration: +24.7% vs baseline
  Corrélation: 0.6635
  Std preds:   0.4633  (cible: 0.8039)
  Mean preds:  0.0448  (cible: 0.0557)
  →  Apprentissage en cours


[Epoch 18] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 18/20: 100%|██████████| 3907/3907 [00:41<00:00, 93.36it/s, loss=0.6445]



🔍 Évaluation epoch 18...

EPOCH 18/20 - Évaluation sur 5,000 positions
  RMSE:        0.6239  (baseline: 0.7956)
  MAE:         0.2563
  Amélioration: +21.6% vs baseline
  Corrélation: 0.6237
  Std preds:   0.4457  (cible: 0.7956)
  Mean preds:  0.0490  (cible: 0.0515)
  →  Apprentissage en cours


[Epoch 19] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 19/20: 100%|██████████| 3907/3907 [00:42<00:00, 92.89it/s, loss=0.6401]



🔍 Évaluation epoch 19...

EPOCH 19/20 - Évaluation sur 5,000 positions
  RMSE:        0.6288  (baseline: 0.8655)
  MAE:         0.2590
  Amélioration: +27.3% vs baseline
  Corrélation: 0.6983
  Std preds:   0.4966  (cible: 0.8655)
  Mean preds:  0.0456  (cible: 0.0492)
  →  Apprentissage en cours


[Epoch 20] 🎲 Échantillonnage: 500,000 positions sur 12,767,881


Epoch 20/20:  56%|█████▌    | 2188/3907 [00:25<00:20, 82.10it/s, loss=0.6322]

In [38]:
import os

file_path = os.path.join(PROJECT_PATH, 'ai/NN/train_torch.py')

try:
    with open(file_path, 'r') as f:
        content = f.read()
    print(f"Content of {file_path}:")
    print("=" * 60)
    print(content)
    print("=" * 60)
except FileNotFoundError:
    print(f"Error: File not found at {file_path}")
except Exception as e:
    print(f"An error occurred while reading the file: {e}")

Content of /content/drive/MyDrive/smart_chess_drive/smart-chess/ai/NN/train_torch.py:
"""
Script d'entraînement PyTorch optimisé pour GPU
Compatible avec Google Colab et machines locales avec GPU
"""
import numpy as np
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import Dataset, DataLoader
from tqdm import tqdm
import os

from Chess import Chess
from ai.NN.torch_nn_evaluator import TorchNNEvaluator, save_weights_npz, load_from_npz, torch_save_checkpoint, torch_load_checkpoint

# --- CONFIGURATION DE L'ENTRAÎNEMENT ---
DATASET_PATH = "C:\\Users\\gauti\\OneDrive\\Documents\\UE commande\\chessData.csv"  # Adapté pour Colab (fichier à la racine)
WEIGHTS_FILE = "chess_nn_weights.npz"
CHECKPOINT_FILE = "chess_model_checkpoint.pt"

# Architecture
HIDDEN_SIZE = 256
DROPOUT = 0.3
LEAKY_ALPHA = 0.01

# Hyperparamètres
LEARNING_RATE = 0.001
WEIGHT_DECAY = 1e-4  # L2 regularization (AdamW)
EPOCHS = 20
BATCH_SIZE = 128  # Plus grand pour G