In [None]:
import os
import json
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
from torchvision import datasets, transforms
import onnxruntime as ort
import numpy as np
import traceback
from sklearn.model_selection import train_test_split
from torch.utils.data import TensorDataset, DataLoader



# Je cr√©e une classe qui repr√©sente mon mod√®le
# Elle h√©rite de nn.Module qui sert a pytorch pour fonctionn√©
class CNNModel(nn.Module):
    def __init__(self):
        # J'appelle le constructeur de base
        super(CNNModel, self).__init__()
        #je pr√©pare les images
        # √ßa va me permettre d'analyser les images d'apr√®s ce que j'ai pu comprendre et voir c'est ce que l'on appel une "vision"
        self.conv_layers = nn.Sequential(
            # l'image qui va √™tre pass√©e sera lu par un filtre qui sert √† regarder les formes et les motifs
            # le 1 l'image en noir et blanc, 32 le nombre de filtres, kernel_size=3 la taille du filtre, padding=1 pour garder la taille de l'image
            # 28x28 -> 28x28
            nn.Conv2d(1, 32, kernel_size=3, padding=1),  
            # Relu va gard√© les valeurs positives et mettre √† z√©ro les n√©gatives
            nn.ReLU(),
            # permet de r√©duire la taille de l'image par 2 du coup 14x14 il devrait ne garder que les pixels les plus importants 
            nn.MaxPool2d(2),                             
            # Cette partie va continuer  de filtr√© cette fois-ci avec 64 filtres
            #32 analyse diff√©rentes qui va regarder l'image sous diff√©rentes formes
            # pour 64 c'est le m√™me principe que pour 32
            nn.Conv2d(32, 64, kernel_size=3, padding=1), 
            # va de nouveau garder les valeurs positives
            nn.ReLU(),
            # Dropout spatial pour les convolutions explication de celui-ci : https://pytorch.org/docs/stable/generated/torch.nn.Dropout2d.html
            # je le trouve int√©ressent car il permet de supprimer des canaux entiers temporairement  et √ßa permet au r√©seau de neurones de ne pas s'appuyer sur 
            #un seul filtre. du coup certains de 32 canaux seront mis √† z√©ro al√©atoirement je pense que ce n'est pas pertinent pour l'excercice mais c'est int√©ressant
            nn.Dropout2d(0.25),  
            # va de nouveau r√©duire la taille de l'image par 2 pour ne garder que l essentiel
            nn.MaxPool2d(2)                             
        )

        # la deuxi√®me partie et celle qui va transformer les donn√©es filtr√©es en une forme que le mod√®le peut utiliser pour faire des pr√©dictions
        self.fc_layers = nn.Sequential(
            # va permettre de mettre les donn√©es en une seule ligne pour pouvoir les calculer
            nn.Flatten(),
            # va faire un calcul pour r√©duire les donn√©es √† 128 valeurs
            nn.Linear(64 * 7 * 7, 128),
            # va de nouveau garder les valeurs positives
            nn.ReLU(),
            # va aider √† √©viter le sur-apprentissage en mettant √† z√©ro 50% des valeurs al√©atoirement
            nn.Dropout(0.5), 
            # va faire un autre calcul pour r√©duire les donn√©es √† 10 valeurs (une pour chaque chiffre de 0 √† 9)
            nn.Linear(128, 10)
        )
       # Cette fonction dit comment les donn√©es passent √† travers le mod√®le
    def forward(self, x):
        # va pemettre de passer l'image et de lire le contenu
        x = self.conv_layers(x)
        # c'est la partie re√ßoit les donn√©es filtr√©es et les transforme en une forme que le mod√®le peut utiliser pour faire des pr√©dictions
        x = self.fc_layers(x)
        # retourne les probabilit√©s  
        return x

# je pr√©pare les images en les transformant en nombres 
transform = transforms.Compose([
    #transforme l'image
    transforms.ToTensor(),
    # ajuste des images pour les rendre plus faciles √† traiter
    transforms.Normalize((0.1307,), (0.3081,))  
])

# Je charge les donn√©es MNIST
train_loader = torch.utils.data.DataLoader(
    datasets.MNIST('.', train=True, download=True, transform=transform),
    #peermet de regarder 64 images √† la fois et shuffle=True pour m√©langer les images 
    batch_size=64, shuffle=True
)

# Je charge les donn√©es de test MNIST
# batch_size=256 pour regarder 256 images √† la fois et shuffle=False pour ne pas m√©langer les images
test_loader = torch.utils.data.DataLoader(
    datasets.MNIST('.', train=False, download=True, transform=transform),
    batch_size=256, shuffle=False
)

# je cr√©e le mod√®le
model = CNNModel()
#permet de calculer les erreurs
criterion = nn.CrossEntropyLoss()
# permet de mettre √† jour les param√®tres du mod√®le pour am√©liorer les pr√©dictions
# optim.Adam est un algorithme d'optimisation qui ajuste les param√®tres du mod√®le pour am√©liorer les pr√©dictions
# lr=0.001 est le taux d'apprentissage, qui d√©termine √† quelle vitesse le mod√®le apprend
optimizer = optim.Adam(model.parameters(), lr=0.001)

# Entra√Ænement
# Je vais entra√Æner le mod√®le pendant 5 fois
for epoch in range(5):
    # Je mets le mod√®le en mode entra√Ænement
    # √ßa permet de dire au mod√®le qu'il va apprendre et qu'il doit mettre √† jour
    model.train()
    ## √ßa garde une trace des erreurs pendant l'entra√Ænement
    running_loss = 0
    #r√©cup√®re les images et les valeurs
    for images, labels in train_loader:
        # remet les gradients √† z√©ro pour √©viter de les additionner
        optimizer.zero_grad()
        # passe les images dans le mod√®le pour obtenir les pr√©dictions
        outputs = model(images)
        #comparaison des valeurs
        loss = criterion(outputs, labels)
        # permet de dire les erreurs au mod√®le pour qu'il puisse apprendre
        loss.backward()
        # ajuste les param√©tres du mod√®le en fonction des erreurs
        # √ßa permet de mettre √† jour les param√®tres du mod√®le pour am√©liorer les pr√©dictions
        optimizer.step()
        #ajoute l'erreur au total
        running_loss += loss.item()
        # sa affiche l erreur moyenne  plsu elle diminue plus le mod√©le apprend
    print(f"√âpoque {epoch+1} termin√©e. Perte moyenne = {running_loss/len(train_loader):.4f}")

# permet de passer a la pr√©diction donc ce n'est plus de l'entrainement je vais pouvoir me rendre si l'entrainement a √©t√© efficace
model.eval()
correct = 0
total = 0

with torch.no_grad():
    for images, labels in test_loader:
        #fait des pr√©dictions sur les images 
        outputs = model(images)
        # ne garde que la valeur la plus proche de la pr√©diction
        predicted = torch.argmax(outputs, 1)
        # c'est le nombre total d'images
        total += labels.size(0)
        # le nombre de pr√©dictions correctes
        correct += (predicted == labels).sum().item()
        #affiche le taux de r√©ussite
print(f"Pr√©cision sur les donn√©es de test : {100 * correct / total:.2f}%")

# exportation vers ONNX
# je cr√©e une entr√©e factice pour le mod√®le
# √ßa permet de simuler une image pour l'exportation
dummy_input = torch.randn(1, 1, 28, 28)
# je sp√©cifie le nom du fichier ONNX
onnx_file = "web/mnist_model_cnn.onnx"
# J'exporte le mod√®le vers le format ONNX
# √ßa permet de sauvegarder le mod√®le pour l'utiliser dans d'autres applications
torch.onnx.export(model, dummy_input, onnx_file,
                  input_names=['input'], output_names=['output'],
                  dynamic_axes={'input': {0: 'batch'}, 'output': {0: 'batch'}})
print(f"Mod√®le CNN export√© en ONNX dans '{onnx_file}'")

# Test ONNX
# Je charge le mod√®le ONNX
# √ßa permet de charger le mod√®le ONNX pour faire des pr√©dictions
ort_session = ort.InferenceSession(onnx_file)
# Je prends une image de test pour faire une pr√©diction
test_image = next(iter(test_loader))[0][0].unsqueeze(0).numpy()
# √ßa permet de pr√©parer l'image pour la pr√©diction , float32 pour que les valeurs soient en virgule flottante
inputs = {"input": test_image.astype(np.float32)}
# Je fais une pr√©diction avec le mod√®le ONNX
outputs = ort_session.run(None, inputs)
# Je prends la valeur la plus proche de la pr√©diction
# √ßa permet de savoir quel chiffre le mod√®le pense que c'est
prediction = np.argmax(outputs[0])
# Affichage de la pr√©diction
print("Test ONNX : pr√©diction =", prediction)


# PROJET 2 : RNN NLP            

#J'ai ajout√© cette classe pour stopper l'entrainement si le mod√®le ne s'am√©liore pas
# car je me suis rendu compte pendant les tests qu'en le laissant continuer a force √ßa ne ressemble plus a rien
class EarlyStopping:
    # patience est le nombre d'√©poques sans am√©lioration avant d'arr√™ter
    # min_delta est la diff√©rence minimale entre la meilleure perte et la perte actuelle pour consid√©rer qu'il y a une am√©lioration
    def __init__(self, patience=5, min_delta=0):
        # Initialisation des param√®tres
        self.patience = patience
        self.min_delta = min_delta
        # Compteur compte combien de fois la performance ne s‚Äôest pas am√©lior√©e.
        self.counter = 0
        self.best_loss = None
        self.early_stop = False

    # Cette m√©thode est appel√©e √† chaque √©poque pour v√©rifier si l'entra√Ænement doit s'arr√™ter
    def __call__(self, val_loss):
        # Si c'est la premi√®re √©poque, on initialise la meilleure perte
        if self.best_loss is None:
            self.best_loss = val_loss
        # Si la perte ne s‚Äôam√©liore pas suffisamment, on augmente le compteur.
        elif val_loss > self.best_loss - self.min_delta:
            self.counter += 1
           # Si le compteur d√©passe la patience, on active l'arr√™t anticip√©.
            if self.counter >= self.patience:
                self.early_stop = True
        else:
            # Si la perte s‚Äôam√©liore, on la met √† jour et on r√©initialise le compteur.
            self.best_loss = val_loss
            self.counter = 0

# --- Pr√©traitement corpus le fichier qui contient une quantit√© de phrase pour entrain√© le mod√®le---
#va ouvrir le fichier texte, lire tout le contenu, et le mettre en minuscules.
with open("web/corpus.txt", "r", encoding="utf-8") as f:
    raw_text = f.read().lower()

#Supprime tous les caract√®res non utiles (comme les chiffres ou symboles bizarres).
corpus = re.sub(r"[^a-z√†√¢√ß√©√®√™√´√Æ√Ø√¥√ª√π√º√ø.,;!?'\-\n\r ]", "", raw_text)
#Liste les caract√®res uniques et cr√©e 2 dictionnaires pour convertir caract√®res et indices.
chars = sorted(list(set(corpus)))
# permet de convertir les caract√®res en indices et vice versa
char2idx = {ch: idx for idx, ch in enumerate(chars)}
# idx2char permet de convertir les indices en caract√®res
idx2char = {idx: ch for ch, idx in char2idx.items()}
# la taille du vocabulaire
vocab_size = len(chars)

print(f"Corpus nettoy√© : {len(corpus)} caract√®res")
print(f"Taille du vocabulaire : {vocab_size} caract√®res")

# --- S√©quences ---
# permet de cr√©e des s√©quences d'entr√©e et de sortie pour l'entra√Ænement
# la longueur d‚Äôune s√©quence d‚Äôentr√©e = 10. 
seq_length = 10
# je cr√©e des listes pour stocker les s√©quences d'entr√©e et de sortie
input_seqs, target_seqs = [], []

# je parcours le corpus pour cr√©er les s√©quences d'entr√©e et de sortie
for i in range(len(corpus) - seq_length):
    # prend une s√©quence de 10 caract√®res comme entr√©e et le caract√®re suivant comme cible
    input_seq = corpus[i:i + seq_length]
    target_char = corpus[i + seq_length]
    # convertit les caract√®res en nombre
    # pour chaque caract√®re de la s√©quence d'entr√©e, je le convertis en nombre
    input_seqs.append([char2idx[ch] for ch in input_seq])
    target_seqs.append(char2idx[target_char])

# je convertis les s√©quences en tenseurs py torch
X = torch.tensor(input_seqs)
y = torch.tensor(target_seqs)

# Split train/val
# je divise les donn√©es en ensembles d'entra√Ænement et de validation
# pour que le mod√®le puisse apprendre sur une partie des donn√©es et valider sur une autre
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.1, random_state=42)

# --- DataLoaders ---
# le batch_size est le nombre d'exemples trait√©s en m√™me temps
batch_size = 64
# TensorDataset permet de combiner les entr√©es et les cibles en un seul ensemble de donn√©es
train_dataset = TensorDataset(X_train, y_train)
# DataLoader permet de charger les donn√©es par lots
# shuffle=True permet de m√©langer les donn√©es √† chaque √©poque pour √©viter l'overfitting
train_loader = DataLoader(train_dataset, batch_size=batch_size, shuffle=True)

val_dataset = TensorDataset(X_val, y_val)
val_loader = DataLoader(val_dataset, batch_size=batch_size)

#Mod√®le RNN 
# Je cr√©e une classe pour le mod√®le RNN
# qui h√©rite de nn.Module, la classe de base pour tous les mod√®les pyTorch
class CharRNN(nn.Module):
    # Le constructeur initialise les couches du mod√®le
    # vocab_size est la taille du vocabulaire, embedding_dim est la dimension des embeddings,
    # hidden_dim est la dimension des √©tats cach√©s, dropout est le taux de dropout
    def __init__(self, vocab_size, embedding_dim, hidden_dim, dropout=0.3):
        super(CharRNN, self).__init__()
        # Initialisation des param√®tres du mod√®le
        self.hidden_dim = hidden_dim
        # nn.Embedding permet de transformer les indices des caract√®res en vecteurs num√©riques
        self.embedding = nn.Embedding(vocab_size, embedding_dim)
        # nn.Dropout permet de r√©duire le sur-apprentissage en mettant √† z√©ro al√©atoirement certaines valeurs
        self.dropout = nn.Dropout(dropout)
        # nn.LSTM est une couche LSTM qui permet de traiter les s√©quences
        # embedding_dim est la dimension des embeddings, hidden_dim est la dimension des √©tats cach√©s batch_first=True permet de traiter les s√©quences par lot
        self.rnn = nn.LSTM(embedding_dim, hidden_dim, batch_first=True)
        # nn.Linear est une couche lin√©aire qui permet de transformer les √©tats cach√©s en pr√©dictions
        self.fc = nn.Linear(hidden_dim, vocab_size)

    # La m√©thode forward d√©finit comment les donn√©es passent √† travers le mod√®le
    # x est la s√©quence d'entr√©e, h est l'√©tat cach√© (optionnel)
    # si h est None, j' initialise l'√©tat cach√© √† z√©ro
    def forward(self, x, h=None):
        x = self.embedding(x)
        x = self.dropout(x)
        if h is None:
            out, h = self.rnn(x)
        else:
            out, h = self.rnn(x, h)
        # out est la sortie de la couche RNN, h est l'√©tat cach√© final
        # j applique le dropout pour r√©duire le sur-apprentissage
        out = self.dropout(out)
        # je prends la derni√®re sortie de la s√©quence pour la pr√©diction
        # out[:, -1, :] prend la derni√®re sortie de chaque s√©quence dans le lot
        out_fc = self.fc(out[:, -1, :])
        # retourne la sortie finale et l'√©tat cach√©
        return out_fc, h  

#Hyperparams
# Je d√©finis les hyperparam√®tres du mod√®le
#embedding_dim est la dimension des embeddings, hidden_dim est la dimension des √©tats cach√©s,
# num_epochs est le nombre d'√©poques pour l'entra√Ænement
embedding_dim = 64
hidden_dim = 512
num_epochs = 60

# Je cr√©e une instance du mod√®le RNN
model = CharRNN(vocab_size, embedding_dim, hidden_dim)
#la fonction de perte pour compare la pr√©diction au bon caract√®re.
criterion = nn.CrossEntropyLoss()
# optim.Adam est un algorithme d'optimisation qui ajuste les param√®tres du mod√®le pour am√©liorer les pr√©dictions
# lr=0.001 est le taux d'apprentissage ici j 'ai essay√© avec diff√©rentes valeurs, qui d√©termine √† quelle vitesse le mod√®le apprend
# weight_decay=1e-4 est une p√©nalit√© pour √©viter le sur-apprentissage
optimizer = optim.Adam(model.parameters(), lr=0.001, weight_decay=1e-4)
# je cr√©e un planificateur de taux d'apprentissage pour r√©duire le taux d'apprentissage si la perte de validation ne s'am√©liore pas
scheduler = optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', factor=0.5, patience=3)
# J'instancie la classe EarlyStopping pour arr√™ter l'entra√Ænement si la perte de validation ne s'am√©liore pas
# patience=5 signifie que l'entra√Ænement s'arr√™tera si la perte de validation n'a pas d am√©lioration pendant 5 √©poques
early_stopping = EarlyStopping(patience=5)


#Entra√Ænement
# je cr√©e une boucle d'entra√Ænement pour entra√Æner le mod√®le
# pour chaque √©poque, je mets le mod√®le en mode entra√Ænement, je calcule la perte
for epoch in range(num_epochs):
    # Je mets le mod√®le en mode entra√Ænement
    model.train()
    train_loss_total = 0

    # Je parcours le DataLoader d'entra√Ænement pour obtenir les lots de donn√©es
    # xb est le lot d'entr√©es, yb est le lot de cibles
    for xb, yb in train_loader:
        output, _ = model(xb)
        loss = criterion(output, yb)

        # Je remets les gradients √† z√©ro, calcule la perte, et mets √† jour les param√®tres du mod√®le
        # √ßa permet de ne pas additionner les gradients des lots pr√©c√©dents
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()
        # J'additionne la perte totale pour l'entra√Ænement
        # loss.item() retourne la valeur de la perte pour le lot actuel
        train_loss_total += loss.item() * xb.size(0)
    train_loss = train_loss_total / len(train_dataset)

    # je mets le mode √©valuation.
    model.eval()
    val_loss_total = 0
    # Je parcours le DataLoader de validation pour obtenir les lots de donn√©es
    # avec torch.no_grad() pour ne pas calculer les gradients pendant la validation
    with torch.no_grad():
        for xb, yb in val_loader:
            val_output, _ = model(xb)
            val_loss_total += criterion(val_output, yb).item() * xb.size(0)
    val_loss = val_loss_total / len(val_dataset)

    print(f"[RNN] √âpoque {epoch+1}/{num_epochs} - Perte train : {train_loss:.4f} - Val : {val_loss:.4f}")

    # j'ajuste le learning rate et on v√©rifie si on doit arr√™ter.
    scheduler.step(val_loss)
    early_stopping(val_loss)
    if early_stopping.early_stop:
        print("Early stopping d√©clench√©.")
        break

#Export ONNX
onnx_file = "web/rnn_text_gen.onnx"
os.makedirs(os.path.dirname(onnx_file), exist_ok=True)

model.eval()
model.cpu()

# Je cr√©e une entr√©e factice pour l'exportation
# √ßa permet de simuler une s√©quence d'entr√©e pour l'exportation
dummy_input = torch.randint(0, vocab_size, (1, seq_length)).long()
# Je cr√©e des √©tats cach√©s initiaux pour l'exportation
# h0 et c0 sont les √©tats cach√©s initiaux pour la couche LSTM
h0 = torch.zeros(1, 1, hidden_dim)
c0 = torch.zeros(1, 1, hidden_dim)

try:
    #convertit le mod√®le en format ONNX pour √™tre utilis√© ailleurs comme un navigateur.
    torch.onnx.export(
        model,
        (dummy_input, (h0, c0)),
        onnx_file,
        input_names=["input", "h0", "c0"],
        output_names=["output", "hn", "cn"],
        dynamic_axes={"input": {0: "batch"}, "output": {0: "batch"}},
        opset_version=11
    )
    print(f"Mod√®le RNN export√© en ONNX vers '{onnx_file}'")
except Exception as e:
    print("√âchec de l‚Äôexport ONNX :", e)

print("üìÅ Fichier ONNX g√©n√©r√© ?", os.path.exists(onnx_file))

# Test rapide ONNX
#Fait 5 pr√©dictions al√©atoires avec le mod√®le ONNX, et j'affiche le caract√®re pr√©dit.
try:
    ort_session = ort.InferenceSession(onnx_file)
    print("Test de 5 pr√©dictions ONNX al√©atoires :")
    for _ in range(5):
        test_input = torch.randint(0, vocab_size, (1, seq_length)).long().numpy()
        ort_inputs = {"input": test_input}
        ort_output = ort_session.run(None, ort_inputs)
        predicted_idx = np.argmax(ort_output[0])
        predicted_char = idx2char.get(int(predicted_idx), "?")
        input_str = ''.join([idx2char[i] for i in test_input[0]])
        print(f"Input: '{input_str}' ‚ûú Pred: '{predicted_char}'")
except Exception as e:
    print("Erreur ONNX :", e)

# Sauvegarde vocab
#enregistre les dictionnaires char2idx et idx2char dans un fichier JSON.
vocab_path = "web/vocab.json"
with open(vocab_path, "w", encoding="utf-8") as f:
    json.dump({
        "char2idx": char2idx,
        "idx2char": {str(k): v for k, v in idx2char.items()}
    }, f, ensure_ascii=False)
print(f"Vocabulaire sauvegard√© dans {vocab_path}")

# G√©n√©ration de texte
# Prend une probabilit√© et choisit un caract√®re au hasard, influenc√© par la temp√©rature.
def sample_from_probs(probs, temperature=1.0, top_k=None):
    probs = probs / temperature
    # Exponentiation pour obtenir des probabilit√©s
    probs = torch.exp(probs)
    # Si top_k est sp√©cifi√©, on ne garde que les k meilleures probabilit√©s
    if top_k is not None:
        top_k = min(top_k, probs.size(0))  
        top_k_probs, top_k_indices = torch.topk(probs, top_k)
        top_k_probs = top_k_probs / torch.sum(top_k_probs)
        next_idx = torch.multinomial(top_k_probs, 1).item()
        return top_k_indices[next_idx].item()
    else:
        probs = probs / torch.sum(probs)
        next_idx = torch.multinomial(probs, 1).item()
        return next_idx

#Utilise le mod√®le PyTorch pour g√©n√©rer du texte √† partir d‚Äôun d√©but.
#Cette fonction prend un texte de d√©part, le convertit en indices, et g√©n√®re du texte caract√®re par caract√®re.
def generate_text(model, start_text, char2idx, idx2char, seq_length=10, max_length=100, temperature=0.7, top_k=10):
    model.eval()
    # Commence par le texte de d√©part
    generated = start_text
    # Convertit le texte de d√©part en indices, en s'assurant qu'il a la bonne longueur
    # rjust permet de compl√©ter le texte de d√©part avec des espaces pour atteindre la longueur requise
    input_seq = [char2idx.get(ch, 0) for ch in start_text[-seq_length:].rjust(seq_length)]
    # Convertit la s√©quence d'entr√©e en tenseur PyTorch
    # unsqueeze(0) ajoute une dimension pour le batch size
    input_seq = torch.tensor(input_seq).unsqueeze(0)  

    # Initialise l'√©tat cach√© √† None pour la premi√®re g√©n√©ration
    # h est l'√©tat cach√© de la couche LSTM, il sera mis √† jour
    h = None  

    # Boucle pour g√©n√©rer du texte caract√®re par caract√®re
    with torch.no_grad():
        for _ in range(max_length):
            output, h = model(input_seq, h)  
            probs = F.log_softmax(output, dim=1).squeeze() 
            next_idx = sample_from_probs(probs, temperature, top_k=top_k)
            next_char = idx2char.get(next_idx, '?')
            generated += next_char

            input_seq = torch.cat([input_seq[:, 1:], torch.tensor([[next_idx]])], dim=1)

    return generated


# G√©n√©ration de texte avec ONNX
# Cette fonction utilise le mod√®le ONNX pour g√©n√©rer du texte √† partir d‚Äôun d√©but.
## Elle prend un texte de d√©part, le convertit en indices, et g√©n√®re du texte caract√®re par caract√®re.
# Elle utilise onnxruntime pour ex√©cuter le mod√®le ONNX.
def generate_text_onnx(ort_session, start_text, char2idx, idx2char, seq_length=10, max_length=100, temperature=1.0):
    #je commence le texte g√©n√©r√© avec le texte de d√©part start_text. C‚Äôest la base sur laquelle le mod√®le va continuer √† √©crire.
    generated = start_text
    # je convertis les derniers caract√®res de start_text juste la fin, selon seq_length en nombres √† l‚Äôaide du dictionnaire char2idx.
    input_seq = [char2idx.get(ch, 0) for ch in start_text[-seq_length:].rjust(seq_length)]
    # Je transforme cette s√©quence d'indices en un tableau NumPy pour l'entr√©e du mod√®le ONNX.
    # reshape(1, -1) permet de s'assurer que la s√©quence a la bonne forme pour le mod√®le.
    # astype(np.int64) convertit les indices en entiers 64 bits,
    input_seq = np.array(input_seq).reshape(1, -1).astype(np.int64)

    # Initialise les √©tats cach√©s √† z√©ro pour la premi√®re g√©n√©ration
    # h0 et c0 sont les √©tats cach√©s initiaux pour la couche LSTM
    h0 = np.zeros((1, 1, hidden_dim), dtype=np.float32)
    c0 = np.zeros((1, 1, hidden_dim), dtype=np.float32)

    # Boucle pour g√©n√©rer du texte caract√®re par caract√®re
    for _ in range(max_length):
        #la s√©quence actuelle est pass√©e au mod√®le ONNX pour obtenir les probabilit√©s de sortie.
        # ort_inputs est un dictionnaire qui contient les entr√©es du mod√®le ONNX.
        ort_inputs = {"input": input_seq, "h0": h0, "c0": c0}
        # Ex√©cute le mod√®le ONNX pour obtenir les sorties
        # ort_output contient les sorties du mod√®le ONNX, qui sont les probabilit√©s de chaque caract√®re.
        # Il contient aussi les nouveaux √©tats cach√©s h0 et c0 pour la prochaine it√©ration.
        # ort_session.run None, ort_inputs ex√©cute le mod√®le ONNX avec les entr√©es fournies.
        # None signifie que je veux toutes les sorties du mod√®le.
        ort_output = ort_session.run(None, ort_inputs)
        #je r√©cup√®re la probabilit√© pr√©dite pour le prochain caract√®re.
        output_probs = ort_output[0][0]
        h0, c0 = ort_output[1], ort_output[2] 

        # Je convertis les probabilit√©s de sortie en un tenseur PyTorch pour appliquer softmax.
        # torch.tensor transforme la liste de probabilit√©s en un tenseur PyTorch.
        probs = torch.tensor(output_probs)
        probs = F.softmax(probs, dim=0)
        # Je sample un indice de caract√®re √† partir des probabilit√©s, influenc√© par la temp√©rature.
        # sample_from_probs est une fonction qui prend les probabilit√©s et la temp√©rature pour choisir un caract√®re.
        next_idx = sample_from_probs(probs, temperature)
        #permet de coinvertir l'index du caract√®re choisi next_idx en lettre avec le dictionnaire idx2char.
        next_char = idx2char.get(next_idx, '?')
        generated += next_char
        input_seq = np.concatenate([input_seq[:, 1:], np.array([[next_idx]])], axis=1)

    return generated


# Exemples de g√©n√©ration
if __name__ == "__main__":
    # C‚Äôest le d√©but du texte √† partir duquel on va g√©n√©rer la suite.
    start_text = "bonjour je"
    # je vais tester plusieurs temp√©ratures pour la g√©n√©ration Temp√©rature basse ex : 0.5 rend le mod√®le plus pr√©visible, moins cr√©atif.
    #temp√©rature haute ex : 1.2 rend le mod√®le plus al√©atoire, parfois plus original mais aussi plus instable.
    temperatures = [0.5, 0.8, 1.2]

    # J'affiche les r√©sultats de la g√©n√©ration de texte pour chaque temp√©rature
    for temp in temperatures:
        print(f"\n--- üîÆ Temp√©rature : {temp} ---")
        print("PyTorch :", generate_text(model, start_text, char2idx, idx2char, seq_length, max_length=100, temperature=temp))
        try:
            print("ONNX :", generate_text_onnx(ort_session, start_text, char2idx, idx2char, seq_length, max_length=100, temperature=temp))
        except Exception as e:
            print("Erreur g√©n√©ration ONNX :", e)

√âpoque 1 termin√©e. Perte moyenne = 0.2358
√âpoque 2 termin√©e. Perte moyenne = 0.0926
√âpoque 3 termin√©e. Perte moyenne = 0.0739
√âpoque 4 termin√©e. Perte moyenne = 0.0628
√âpoque 5 termin√©e. Perte moyenne = 0.0530
Pr√©cision sur les donn√©es de test : 99.21%
Mod√®le CNN export√© en ONNX dans 'web/mnist_model_cnn.onnx'
Test ONNX : pr√©diction = 7
üßπ Corpus nettoy√© : 2953 caract√®res
üî† Taille du vocabulaire : 38 caract√®res
[RNN] √âpoque 1/60 - Perte train : 2.9408 - Val : 2.5990
[RNN] √âpoque 2/60 - Perte train : 2.4612 - Val : 2.3831
[RNN] √âpoque 3/60 - Perte train : 2.2691 - Val : 2.3313
[RNN] √âpoque 4/60 - Perte train : 2.1486 - Val : 2.2221
[RNN] √âpoque 5/60 - Perte train : 2.0316 - Val : 2.1899
[RNN] √âpoque 6/60 - Perte train : 1.9317 - Val : 2.1808
[RNN] √âpoque 7/60 - Perte train : 1.8519 - Val : 2.1307
[RNN] √âpoque 8/60 - Perte train : 1.7485 - Val : 2.1019
[RNN] √âpoque 9/60 - Perte train : 1.6602 - Val : 2.1071
[RNN] √âpoque 10/60 - Perte train : 1.5259 - Val 