<a href="https://colab.research.google.com/github/jf-godbout/jf-godbout.github.io/blob/master/GPT2_JFG.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Installation des dépendances requises
# Google Colab fournit une version gratuite qui inclut un accès aux GPU (unités de traitement graphique).
# Avant d'exécuter ce code, assurez-vous que l'accélérateur matériel est bien défini sur GPU
# (Allez dans "Runtime" > change run time type, puis sélectionnez T4 GPU).

!pip install -U transformers torch

# Importation des bibliothèques nécessaires
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer

# Vérification de la disponibilité du GPU
# Colab Free propose généralement un GPU NVIDIA T4
# Si un GPU est disponible, le script l'utilisera automatiquement

device = "cuda" if torch.cuda.is_available() else "cpu"
print(f"Dispositif utilisé : {device}")

# Chargement du modèle GPT-2 et du tokenizer
# GPT-2 est un modèle de langage génératif développé par OpenAI
# Ici, nous utilisons la version de base pour minimiser la charge sur le GPU

model_name = "gpt2"
model = AutoModelForCausalLM.from_pretrained(model_name, torch_dtype=torch.float16 if device == "cuda" else torch.float32).to(device)
tokenizer = AutoTokenizer.from_pretrained(model_name)

# Définition d'une invite (phrase de départ pour la génération de texte)
prompt = "GPT-2 est un modèle développé par OpenAI."

# Encodage du texte d'entrée pour que le modèle puisse le traiter
# "return_tensors='pt'" signifie que nous utilisons le format tensoriel de PyTorch

model_inputs = tokenizer(prompt, return_tensors="pt").to(device)

# Génération de texte
# "max_new_tokens" définit le nombre maximal de nouveaux mots générés
# "temperature" contrôle le niveau de créativité (plus élevé = plus aléatoire)
# "do_sample=True" permet d'activer l'échantillonnage pour diversifier la sortie
# "top_p" est une technique de "nucleus sampling" qui sélectionne les mots les plus probables

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=150,  # Longueur de sortie
    temperature=0.7,  # Niveau de créativité
    do_sample=True,
    top_p=0.9,  # Filtrage des mots improbables
    pad_token_id=tokenizer.eos_token_id  # Évite les avertissements sur les tokens de fin
)

# Décodage et affichage du texte généré
output_text = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(output_text)

# Explication finale :
# 1. Nous avons installé les bibliothèques nécessaires
# 2. Vérifié la présence d'un GPU et défini le dispositif d'exécution
# 3. Chargé un modèle GPT-2 pré-entraîné
# 4. Encodé un texte d'entrée sous forme de tenseurs PyTorch
# 5. Généré un texte en ajustant plusieurs paramètres (longueur, créativité, sélection des mots)
# 6. Décodé et affiché le texte généré

# Ce code est prêt à être utilisé par les étudiants sur Google Colab avec un compte gratuit !


Collecting transformers
  Downloading transformers-4.48.3-py3-none-any.whl.metadata (44 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/44.4 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m44.4/44.4 kB[0m [31m3.3 MB/s[0m eta [36m0:00:00[0m
Collecting torch
  Downloading torch-2.6.0-cp311-cp311-manylinux1_x86_64.whl.metadata (28 kB)
Collecting nvidia-cuda-nvrtc-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_nvrtc_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_runtime_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12==12.4.127 (from torch)
  Downloading nvidia_cuda_cupti_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu12==9.1.0.70 (from torch)
  Downloading nvidia_cudnn_cu12-9.1.0.70-py3-none-manylinux