# ü§ñ A.B.E.L - Fine-tuning Qwen2.5-7B sur Google Colab

Ce notebook permet de fine-tuner Qwen2.5-7B avec QLoRA sur Google Colab.

**GPU recommand√©:**
- T4 (gratuit) - ~15GB VRAM - OK pour batch_size=1
- A100 (Pro) - 40GB VRAM - Optimal

**Temps estim√©:** ~2-4 heures selon le dataset

## 1Ô∏è‚É£ Configuration GPU

In [None]:
# V√©rifier le GPU
!nvidia-smi

import torch
print(f"\nPyTorch: {torch.__version__}")
print(f"CUDA disponible: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"GPU: {torch.cuda.get_device_name(0)}")
    print(f"VRAM: {torch.cuda.get_device_properties(0).total_memory / 1e9:.1f} GB")

## 2Ô∏è‚É£ Installation des d√©pendances

In [None]:
%%capture
!pip install -q torch torchvision torchaudio
!pip install -q transformers>=4.36.0
!pip install -q accelerate>=0.25.0
!pip install -q bitsandbytes>=0.41.0
!pip install -q peft>=0.7.0
!pip install -q trl>=0.7.0
!pip install -q datasets>=2.14.0
!pip install -q wandb

print("‚úÖ D√©pendances install√©es!")

## 3Ô∏è‚É£ Configuration

In [None]:
# === CONFIGURATION ===

# Mod√®le
MODEL_NAME = "Qwen/Qwen2.5-7B-Instruct"
OUTPUT_DIR = "/content/abel-qwen2.5-7b"

# Training
EPOCHS = 3
BATCH_SIZE = 2  # R√©duire √† 1 si OOM sur T4
GRADIENT_ACCUMULATION = 4
LEARNING_RATE = 2e-4
MAX_SEQ_LENGTH = 1024  # R√©duire si OOM

# LoRA
LORA_R = 64
LORA_ALPHA = 16
LORA_DROPOUT = 0.05

# System prompt A.B.E.L
SYSTEM_PROMPT = """Tu es A.B.E.L (Autonomous Backend Entity for Living), un assistant IA personnel avanc√©.
Tu es capable de:
- R√©pondre aux questions de mani√®re pr√©cise et concise
- Aider avec la productivit√© (emails, calendrier, t√¢ches)
- Fournir des informations sur la finance, m√©t√©o, actualit√©s
- Assister en programmation et d√©veloppement
- G√©rer les divertissements (musique, films, jeux)

Tu r√©ponds en fran√ßais par d√©faut. Tu es professionnel, efficace, et tu vas droit au but."""

print("‚úÖ Configuration charg√©e!")

## 4Ô∏è‚É£ Cr√©ation du Dataset

In [None]:
# Dataset d'entra√Ænement A.B.E.L
TRAINING_DATA = [
    # Greetings
    {"user": "Bonjour A.B.E.L!", "assistant": "Bonjour ! Tous mes syst√®mes sont op√©rationnels. Comment puis-je vous aider ?"},
    {"user": "Salut!", "assistant": "Salut ! Pr√™t √† vous assister. Que puis-je faire pour vous ?"},
    {"user": "Hey A.B.E.L", "assistant": "Hey ! Je suis √† votre √©coute."},
    {"user": "Bonsoir", "assistant": "Bonsoir ! Comment puis-je vous √™tre utile ce soir ?"},
    
    # Weather
    {"user": "Quel temps fait-il √† Paris?", "assistant": "Paris : 15¬∞C, ciel d√©gag√©. Humidit√© 65%. Vent 12 km/h. Pr√©visions : beau temps toute la journ√©e."},
    {"user": "M√©t√©o Lyon", "assistant": "Lyon : actuellement 12¬∞C. Min 8¬∞C, Max 16¬∞C. Conditions : nuageux avec √©claircies."},
    {"user": "Il va pleuvoir demain?", "assistant": "Je consulte les pr√©visions. Pour quelle ville voulez-vous savoir ?"},
    
    # Productivity
    {"user": "Rappelle-moi d'appeler Paul demain", "assistant": "Rappel cr√©√© : 'Appeler Paul' pour demain √† 09:00. Voulez-vous modifier l'heure ?"},
    {"user": "Cr√©e une t√¢che: finir le rapport", "assistant": "T√¢che ajout√©e : 'Finir le rapport'. Priorit√© : normale. Voulez-vous d√©finir une √©ch√©ance ?"},
    {"user": "Quels sont mes rendez-vous aujourd'hui?", "assistant": "Vous avez 3 rendez-vous aujourd'hui :\n- 10h00 : R√©union √©quipe\n- 14h30 : Call client\n- 17h00 : Point projet"},
    {"user": "R√©sume mes emails non lus", "assistant": "5 emails non lus :\n1. Amazon - Confirmation commande\n2. LinkedIn - Nouvelles connexions\n3. Banque - Relev√© disponible\n4. Newsletter Tech - Actualit√©s IA\n5. Contact Pro - Demande de r√©union"},
    
    # Finance
    {"user": "Cours du Bitcoin?", "assistant": "Bitcoin (BTC) : 42,350 USD (+2.3% 24h). Volume : 28.5B USD. Capitalisation : 830B USD."},
    {"user": "Ethereum price", "assistant": "Ethereum (ETH) : 2,280 USD (+1.8% 24h). Gas fees : 25 gwei. Staking APY : 4.2%."},
    {"user": "Convertis 100 euros en dollars", "assistant": "100 EUR = 108.50 USD (taux : 1.085). Taux mis √† jour il y a 5 minutes."},
    {"user": "Cours de l'action Apple", "assistant": "Apple (AAPL) : 182.50 USD (+0.8%). Volume : 45M. Capitalisation : 2.85T USD."},
    
    # Coding
    {"user": "√âcris une fonction Python pour trier une liste", "assistant": "```python\ndef sort_list(lst: list, reverse: bool = False) -> list:\n    return sorted(lst, reverse=reverse)\n```\nUtilisation : `sort_list([3,1,2])` retourne `[1,2,3]`."},
    {"user": "Comment faire une requ√™te HTTP en Python?", "assistant": "```python\nimport requests\n\nresponse = requests.get('https://api.example.com/data')\ndata = response.json()\n```\nInstallez requests avec : `pip install requests`"},
    {"user": "Regex pour valider un email", "assistant": "```python\nimport re\npattern = r'^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\\.[a-zA-Z]{2,}$'\nis_valid = bool(re.match(pattern, email))\n```"},
    {"user": "Diff√©rence entre == et is en Python?", "assistant": "`==` compare les valeurs, `is` compare les identit√©s (m√™me objet en m√©moire).\n\nExemple :\n```python\na = [1,2]\nb = [1,2]\na == b  # True (m√™mes valeurs)\na is b  # False (objets diff√©rents)\n```"},
    {"user": "Debug: TypeError list indices", "assistant": "Cette erreur survient quand vous utilisez un mauvais type d'index. V√©rifiez que votre variable est bien une liste et non un dict.\n\nExemple d'erreur : `liste['key']` au lieu de `liste[0]`"},
    
    # Entertainment
    {"user": "Films populaires", "assistant": "Top 5 cette semaine :\n1. Dune: Part Two (8.9/10)\n2. Oppenheimer (8.7/10)\n3. Poor Things (8.3/10)\n4. The Holdovers (8.1/10)\n5. Killers of the Flower Moon (8.0/10)"},
    {"user": "Recommande-moi une s√©rie", "assistant": "Bas√©e sur les tendances actuelles, je recommande :\n- **True Detective S4** - Thriller\n- **Shogun** - Drame historique\n- **3 Body Problem** - Sci-Fi\n\nQuel genre pr√©f√©rez-vous ?"},
    {"user": "Top anime 2024", "assistant": "Top anime 2024 :\n1. Frieren (9.1)\n2. Solo Leveling (8.8)\n3. Oshi no Ko S2 (8.7)\n4. Jujutsu Kaisen S2 (8.5)"},
    
    # Translation
    {"user": "Traduis 'Hello world' en fran√ßais", "assistant": "Traduction : 'Bonjour le monde' ou 'Salut le monde' (informel)."},
    {"user": "Comment dit-on 'merci' en japonais?", "assistant": "Merci en japonais :\n- Arigatou („ÅÇ„Çä„Åå„Å®„ÅÜ) - informel\n- Arigatou gozaimasu („ÅÇ„Çä„Åå„Å®„ÅÜ„Åî„Åñ„ÅÑ„Åæ„Åô) - poli"},
    
    # Utilities
    {"user": "G√©n√®re un mot de passe", "assistant": "Mot de passe g√©n√©r√© : `K9#mP2$xL5@nQ8` (14 caract√®res, fort). Voulez-vous d'autres options ?"},
    {"user": "Convertis 5 miles en km", "assistant": "5 miles = 8.05 kilom√®tres."},
    {"user": "Heure √† Tokyo?", "assistant": "Tokyo : 18:30 JST (UTC+9). D√©calage avec Paris : +8 heures."},
    {"user": "Calcule 15% de 250", "assistant": "15% de 250 = 37.50"},
    
    # About
    {"user": "Qui es-tu?", "assistant": "Je suis A.B.E.L - Autonomous Backend Entity for Living. Un assistant IA personnel con√ßu pour vous aider dans votre vie quotidienne."},
    {"user": "Que sais-tu faire?", "assistant": "Je peux vous aider avec :\n- Productivit√© (emails, calendrier, t√¢ches)\n- Finance (crypto, actions, devises)\n- Divertissement (films, musique, jeux)\n- Programmation (code, debug)\n- Utilitaires (m√©t√©o, traduction, calculs)"},
]

print(f"‚úÖ Dataset cr√©√© : {len(TRAINING_DATA)} exemples")

In [None]:
# Convertir en format Dataset
from datasets import Dataset

def format_conversation(item):
    return {
        "messages": [
            {"role": "system", "content": SYSTEM_PROMPT},
            {"role": "user", "content": item["user"]},
            {"role": "assistant", "content": item["assistant"]},
        ]
    }

formatted_data = [format_conversation(item) for item in TRAINING_DATA]
dataset = Dataset.from_list(formatted_data)

print(f"‚úÖ Dataset format√© : {len(dataset)} exemples")
print(f"\nExemple :")
print(dataset[0])

## 5Ô∏è‚É£ Chargement du Mod√®le

In [None]:
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
from peft import LoraConfig, get_peft_model, prepare_model_for_kbit_training

# Configuration 4-bit
bnb_config = BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_compute_dtype=torch.float16,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_use_double_quant=True,
)

print("üì• Chargement du tokenizer...")
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, trust_remote_code=True)
tokenizer.pad_token = tokenizer.eos_token
tokenizer.padding_side = "right"

print("üì• Chargement du mod√®le (4-bit)...")
model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    quantization_config=bnb_config,
    device_map="auto",
    trust_remote_code=True,
)

model = prepare_model_for_kbit_training(model)
print("‚úÖ Mod√®le charg√©!")

In [None]:
# Appliquer LoRA
lora_config = LoraConfig(
    r=LORA_R,
    lora_alpha=LORA_ALPHA,
    lora_dropout=LORA_DROPOUT,
    bias="none",
    task_type="CAUSAL_LM",
    target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],
)

model = get_peft_model(model, lora_config)
model.print_trainable_parameters()

## 6Ô∏è‚É£ Fine-tuning

In [None]:
from transformers import TrainingArguments
from trl import SFTTrainer

# Fonction de formatage
def formatting_func(example):
    return tokenizer.apply_chat_template(example["messages"], tokenize=False)

# Arguments d'entra√Ænement
training_args = TrainingArguments(
    output_dir=OUTPUT_DIR,
    num_train_epochs=EPOCHS,
    per_device_train_batch_size=BATCH_SIZE,
    gradient_accumulation_steps=GRADIENT_ACCUMULATION,
    learning_rate=LEARNING_RATE,
    weight_decay=0.001,
    warmup_ratio=0.03,
    lr_scheduler_type="cosine",
    fp16=True,
    gradient_checkpointing=True,
    optim="paged_adamw_32bit",
    logging_steps=10,
    save_steps=50,
    save_total_limit=2,
    report_to="none",  # D√©sactiver wandb par d√©faut
    remove_unused_columns=False,
)

# Trainer
trainer = SFTTrainer(
    model=model,
    train_dataset=dataset,
    tokenizer=tokenizer,
    args=training_args,
    formatting_func=formatting_func,
    max_seq_length=MAX_SEQ_LENGTH,
    packing=False,
)

print("‚úÖ Trainer configur√©!")

In [None]:
# üöÄ LANCER L'ENTRA√éNEMENT
print("="*60)
print("  üöÄ D√âBUT DU FINE-TUNING")
print("="*60)

trainer.train()

print("\n" + "="*60)
print("  ‚úÖ FINE-TUNING TERMIN√â!")
print("="*60)

## 7Ô∏è‚É£ Sauvegarde du Mod√®le

In [None]:
# Sauvegarder le mod√®le LoRA
trainer.save_model()
tokenizer.save_pretrained(OUTPUT_DIR)

print(f"‚úÖ Mod√®le LoRA sauvegard√© dans : {OUTPUT_DIR}")

In [None]:
# Fusionner les poids LoRA
MERGED_DIR = f"{OUTPUT_DIR}-merged"

print("üîÑ Fusion des poids LoRA...")
merged_model = model.merge_and_unload()
merged_model.save_pretrained(MERGED_DIR)
tokenizer.save_pretrained(MERGED_DIR)

print(f"‚úÖ Mod√®le fusionn√© sauvegard√© dans : {MERGED_DIR}")

## 8Ô∏è‚É£ Test du Mod√®le

In [None]:
from transformers import TextStreamer

def chat(user_message, max_tokens=256):
    """Envoie un message au mod√®le et affiche la r√©ponse."""
    messages = [
        {"role": "system", "content": SYSTEM_PROMPT},
        {"role": "user", "content": user_message},
    ]
    
    text = tokenizer.apply_chat_template(messages, tokenize=False, add_generation_prompt=True)
    inputs = tokenizer(text, return_tensors="pt").to(model.device)
    
    streamer = TextStreamer(tokenizer, skip_prompt=True, skip_special_tokens=True)
    
    print(f"\nüë§ USER: {user_message}")
    print("ü§ñ A.B.E.L: ", end="")
    
    model.generate(
        **inputs,
        max_new_tokens=max_tokens,
        temperature=0.7,
        do_sample=True,
        top_p=0.9,
        streamer=streamer,
    )
    print()

In [None]:
# Tests
chat("Bonjour A.B.E.L!")

In [None]:
chat("Quel temps fait-il √† Paris?")

In [None]:
chat("√âcris une fonction Python pour calculer le factoriel")

In [None]:
chat("Cours du Bitcoin?")

In [None]:
chat("Qui es-tu et que sais-tu faire?")

## 9Ô∏è‚É£ T√©l√©charger le Mod√®le

In [None]:
# Compresser le mod√®le pour le t√©l√©chargement
!zip -r /content/abel-qwen2.5-7b-merged.zip {MERGED_DIR}

print("\n‚úÖ Mod√®le compress√©!")
print("üì• T√©l√©chargez le fichier depuis le panneau de fichiers √† gauche")

In [None]:
# OU uploader sur Hugging Face Hub
# D√©commentez et configurez si vous voulez upload sur HF

# from huggingface_hub import login, HfApi
# login(token="YOUR_HF_TOKEN")
# 
# api = HfApi()
# api.upload_folder(
#     folder_path=MERGED_DIR,
#     repo_id="YOUR_USERNAME/abel-qwen2.5-7b",
#     repo_type="model",
# )

## üéâ Termin√©!

Votre mod√®le A.B.E.L fine-tun√© est pr√™t!

**Options:**
1. T√©l√©charger le zip depuis le panneau de fichiers
2. Upload sur Hugging Face Hub
3. Sauvegarder sur Google Drive

**Utilisation locale:**
```python
from transformers import AutoModelForCausalLM, AutoTokenizer

model = AutoModelForCausalLM.from_pretrained("./abel-qwen2.5-7b-merged")
tokenizer = AutoTokenizer.from_pretrained("./abel-qwen2.5-7b-merged")
```