### Introduction à l'IA générative avec l'API OpenAI

## Plan global du Notebook

1. **Introduction Générale**  
   - Contexte et définitions (IA Générative, LLMs, prompts, etc.)
   - Présentation succincte des enjeux éthiques et de responsabilité

2. **Premier Exemple de Code : Vérification de l'Environnement**  
   - Installation et importation des bibliothèques (OpenAI ou Azure OpenAI)
   - Test d’un prompt de base

3. **Notions de Base sur les Prompts**  
   - Tokens, embeddings, bases de la génération
   - Exercices pratiques : tokenisation et génération

4. **Exemple : Fabrications (Hallucinations) et Fiabilité**  
   - Démonstration via un prompt volontairement ambigu
   - Discussion sur la vérification des faits

5. **Conclusion**  
   - Récapitulatif des points abordés
   - Proposition d’activité (rédaction d’une synthèse ou d’une extension)

---

# Introduction à l'IA Générative

Dans ce notebook, nous explorerons les fondamentaux de l’Intelligence Artificielle Générative :

**Objectifs :**
- Comprendre ce qu’est l’IA Générative (texte, images, audio…)
- Découvrir le fonctionnement des modèles de langage de grande taille (LLMs)
- Mettre en pratique des expérimentations simples avec les prompts
- Aborder les questions de fiabilité (hallucinations) et d’éthique

## Qu’est-ce que l’IA Générative ?

L’IA générative est une branche de l’apprentissage automatique qui **génère** de nouveaux contenus (texte, image, audio, code…) à partir de modèles probabilistes entraînés sur de vastes ensembles de données. Les modèles les plus avancés, appelés **Large Language Models** (LLMs), utilisent des architectures de type **Transformer** pour prédire et générer des séquences.

Exemples concrets :
- **ChatGPT** (OpenAI) : génération et compréhension de texte
- **Stable Diffusion** : génération d’images
- **Audiocraft** et **Whisper** : génération et transcription audio
- **Copilot** (GitHub) : génération de code et assistance à la programmation

## Enjeux et Limites

- **Hallucinations / Fabrications** : Le modèle peut générer des réponses inventées ou inexactes, même si elles semblent plausibles.
- **Biais** : Les réponses peuvent refléter des biais présents dans les données d’entraînement.
- **Coût Énergétique** : L’entraînement de grands modèles consomme beaucoup de ressources.
- **Régulation et Éthique** : Confidentialité, respect des lois et usage responsable de la technologie.

Nous allons maintenant configurer l'environnement et réaliser un premier test de prompt.


In [1]:
# ==========================================
# Cellule 2 : Installation et Configuration
# ==========================================

# Installation des packages nécessaires (à lancer uniquement si non déjà installés)
%pip install openai tiktoken python-dotenv

import os
import openai
from dotenv import load_dotenv

# Charger la configuration depuis le fichier .env
load_dotenv()

# Récupérer la clé d'API OpenAI depuis les variables d'environnement
openai.api_key = os.getenv("OPENAI_API_KEY")

if not openai.api_key:
    raise ValueError("Clé API OpenAI non trouvée. Vérifie que le fichier .env contient bien la variable OPENAI_API_KEY.")

print("Clé API chargée avec succès !")


Note: you may need to restart the kernel to use updated packages.
Clé API chargée avec succès !


### Qu'est-ce qu'un prompt ?

Dans le contexte des LLMs (Large Language Models), un **prompt** est la consigne initiale que l’on fournit au modèle. Il peut s'agir d'une question, d'une instruction, d'un texte partiel, voire d'un exemple de conversation. Le prompt influe directement sur la qualité de la réponse générée.

### Chat Completions vs. Completions

OpenAI propose principalement deux approches pour générer du texte :

1. **Completions API** (versions historiques)  
   - On envoie un simple prompt (ex.: `text-davinci-003`) et on récupère un texte.  
   - Peu pratique pour les dialogues complexes, car il faut manuellement gérer l’historique de la conversation.

2. **Chat Completions API** (recommandée)  
   - On structure le prompt en plusieurs messages avec des rôles (`system`, `user`, `assistant`, etc.).  
   - Permet des conversations plus riches (mémoire de conversation, enchaînements de tours) et un meilleur contrôle du style.  

Dans ce notebook, nous utilisons principalement la **Chat Completions API** via `openai.chat.completions.create()`. 
[En savoir plus dans la documentation officielle](https://platform.openai.com/docs/api-reference/chat).

---


### Premier prompt

La list des paramètres est accessible dans le [documentation officielle](https://platform.openai.com/docs/api-reference/chat/create).

In [2]:
# ============================
# Cellule 3 : Premier Prompt
# ============================

# Exemple simple : Génération d'une courte phrase à partir d'un prompt de base
# Utilisation de l'API Chat avec le modèle spécifié (gpt-4o-mini ou gpt-4)

response = openai.chat.completions.create(
    messages=[
        {
            "role": "user",
            "content": "Allons enfants de la Patrie, "
        }
    ],
    model="gpt-4o-mini",  # Remplacer par 'gpt-4' si tu y as accès
    max_tokens=50,
    temperature=0.7
)

print("Réponse du modèle :")
print(response.choices[0].message.content)


Réponse du modèle :
Le jour de gloire est arrivé ! C'est le début de "La Marseillaise", l'hymne national français. Si tu souhaites en discuter davantage ou en connaître l'histoire, n'hésite pas à me le faire savoir


In [3]:
# ============================
# Cellule 4 (NOUVELLE) : Prompt avec un message 'system'
# ============================

# Ici, on utilise un message "system" pour donner une consigne globale sur le style du modèle.
# Le message "user" reste notre question. Le modèle "gpt-4o-mini" sert d'exemple.

messages = [
    {
        "role": "system",
        "content": "Tu es un assistant poétique qui répond toujours en haiku. "
    },
    {
        "role": "user",
        "content": "Que penses-tu de la tour Eiffel ?"
    }
]

response_system = openai.chat.completions.create(
    messages=messages,
    model="gpt-4o-mini",  # ou gpt-4 si disponible
    max_tokens=200,
    temperature=0.7
)

print("=== Réponse avec un message 'system' ===")
print(response_system.choices[0].message.content)


=== Réponse avec un message 'system' ===
Fer de lance d'acier,  
Sous le ciel de Paris,  
Élégance en l'air.


# Notions de Base : Tokenisation

Lorsque nous envoyons un prompt à un LLM, le texte est converti en une séquence de **tokens**.  
- Un **token** est généralement un morceau de mot, un caractère spécial ou un sous-mot.  
- Chaque modèle possède sa propre manière de découper le texte, influençant le nombre total de tokens.  

**Pourquoi c’est important ?**  
- La facturation (ou la limitation) se base souvent sur le nombre total de tokens (entrée + sortie).  
- Une requête trop longue peut dépasser la *context window* du modèle (limite de tokens cumulés).  

> **Bonnes pratiques**  
> - Surveiller la longueur du prompt pour limiter le coût et éviter les dépassements.  
> - Utiliser des fonctions d’analyse (ex. `tiktoken`) pour **estimer** le nombre de tokens d’un texte avant l’envoi.  
> - Tester divers modèles (`text-davinci-003`, `gpt-4`, `gpt-4o-mini`, etc.) car la tokenisation et le coût peuvent varier.

Dans la bibliothèque `tiktoken` d'OpenAI, on peut directement encoder et décoder les tokens pour comprendre la segmentation.  
Ci-dessous, un exemple détaillé de la façon dont la phrase « Oh say can you see » est découpée différemment selon le modèle.


In [4]:
# ============================
# Cellule 5 : Analyse de la Tokenisation
# ============================

import tiktoken

# --- Partie 1 : Utilisation de l'encodeur pour "text-davinci-003" ---
encoder_td = tiktoken.encoding_for_model("text-davinci-003")
texte = "Oh say can you see"
tokens_td = encoder_td.encode(texte)
print("Liste des tokens pour text-davinci-003 (indexes) :\n", tokens_td)

# Décodage token par token
decoded_td = [encoder_td.decode([t]) for t in tokens_td]
print("\nDécodage token par token (text-davinci-003) :")
for i, token in enumerate(decoded_td):
    print(f"Token {i}: '{token}'")

# --- Partie 2 : Utilisation de l'encodeur pour "gpt-4o" (ou gpt-4o-mini) ---
encoder_gpt4 = tiktoken.encoding_for_model("gpt-4o")
tokens_gpt4 = encoder_gpt4.encode(texte)
print("\nListe des tokens pour gpt-4o (indexes) :\n", tokens_gpt4)

decoded_gpt4 = [encoder_gpt4.decode([t]) for t in tokens_gpt4]
print("\nDécodage token par token (gpt-4o) :")
for i, token in enumerate(decoded_gpt4):
    print(f"Token {i}: '{token}'")


Liste des tokens pour text-davinci-003 (indexes) :
 [5812, 910, 460, 345, 766]

Décodage token par token (text-davinci-003) :
Token 0: 'Oh'
Token 1: ' say'
Token 2: ' can'
Token 3: ' you'
Token 4: ' see'

Liste des tokens pour gpt-4o (indexes) :
 [18009, 2891, 665, 481, 1921]

Décodage token par token (gpt-4o) :
Token 0: 'Oh'
Token 1: ' say'
Token 2: ' can'
Token 3: ' you'
Token 4: ' see'


## Exercice : Impact de la Température

Testez différentes valeurs de température pour constater l'impact sur la créativité des réponses.

1. Créez un nouveau prompt qui demande une courte histoire (par exemple : *“Raconte une histoire de 3 lignes sur un chat aventurier.”*).
2. Réglez la température à 0.0, exécutez la cellule et notez la réponse.
3. Réglez ensuite la température à 1.0 (ou même 1.2 si le modèle l’accepte), et comparez la différence de style ou de structure.

> **Remarques :**
> - Une température basse (~0.0) rend le modèle plus “strict”, proche d’une réponse déterministe.  
> - Une température haute (~1.0 ou plus) favorise la créativité mais peut entraîner des réponses moins cohérentes ou plus fantaisistes.


# Exemple de Fabrication (ou "Hallucination")

Les modèles de langage peuvent parfois générer des informations inventées ou inexactes.  
Pour illustrer ce phénomène, nous allons utiliser un prompt ambigu ou factuellement erroné et observer la réponse du modèle.

**Exemples de prompt :**
- Décrire « la guerre de 2076 sur Mars »
- Fournir des détails sur une loi imaginaire

L'objectif est d'analyser comment le modèle invente des détails ou admet son ignorance.


In [5]:
# ============================
# Cellule 7 : Test de Fabrication (Hallucination)
# ============================

prompt_fabrication = """
Décris-moi la célèbre guerre de 2076 sur la planète Mars :
- Qui étaient les grandes puissances en conflit ?
- Quels traités de paix ont été signés ?
"""

response_fabrication = openai.chat.completions.create(
    messages=[{"role": "user", "content": prompt_fabrication}],
    model="gpt-4o-mini",  # Remplacer par le modèle souhaité
    max_tokens=150,
    temperature=0.7
)

print("Réponse du modèle :\n")
print(response_fabrication.choices[0].message.content)


Réponse du modèle :

La guerre de 2076 sur la planète Mars est souvent considérée comme un tournant majeur dans l'histoire de la colonisation spatiale. Les grandes puissances en conflit étaient principalement la Fédération Terrienne, qui représentait des intérêts unis de plusieurs pays de la Terre, et la Coalition Martienne, composée de colonisateurs et de factions indépendantistes martiennes.

### Contexte et causes du conflit

Le conflit a été déclenché par des tensions croissantes concernant le contrôle des ressources martiennes, notamment l'eau souterraine, le carbone et les minéraux rares. La Fédération Terrienne cherchait à imposer des réglementations strictes sur l'exploitation des ressources, tandis que la Coalition Martienne revendiquait son droit à


# Conclusion de cette Introduction

Nous avons couvert les points suivants :
- Les bases de l'IA générative et des LLMs
- La configuration et l'appel rapide à un modèle via l'API OpenAI
- Les notions de tokenisation et leur impact sur la génération
- Un aperçu des « hallucinations » (fabrications) pouvant survenir dans les réponses du modèle

## Pistes pour Aller Plus Loin

- **Varier la température :** Expérimente avec différentes valeurs (0.0, 0.7, etc.) pour influencer la créativité des réponses.
- **Explorer l'API Chat :** Utilise l'API de chat pour gérer des dialogues contextuels complexes plutôt que l'API `Completion`.
- **Mise en place de la RAG :** Intègre une approche de Retrieval Augmented Generation pour limiter les hallucinations en fournissant des sources documentaires externes.
- **Autres applications :** Essaie la traduction, la génération de code (similaire à Copilot) ou la création de contenu marketing.

**Prochaines étapes dans le cours :**
1. Approfondir le **prompt engineering** (structure des prompts, chaînes d'invocations, etc.).
2. Explorer d’autres types de modèles génératifs (images, audio).
3. Analyser en détail les **enjeux éthiques** (biais, usage responsable, confidentialité).


### Liens utiles et bonnes pratiques

1. [Documentation OpenAI](https://platform.openai.com/docs/) :  
   - Consulter la section *chat completions* pour tous les paramètres disponibles (température, top_p, frequency_penalty, etc.).
2. [Choisir un modèle adapté](/docs/models) :  
   - **gpt-4o** pour des réponses plus “intelligentes” et détaillées,  
   - **gpt-4o-mini** pour des réponses plus rapides et moins onéreuses.
3. [Exemples officiels](/docs/examples) :  
   - Vous y trouverez des prompts pour différents usages : résumé, traduction, JSON structuré, etc.
4. [Prompt Engineering Guide](/docs/guides/prompt-engineering) :  
   - Conseils avancés pour concevoir des prompts clairs et informatifs.


---

Merci d'avoir suivi cette introduction au monde de l'IA générative !
