# Exercice : Construisez et Améliorez un Chatbot Simple

L'objectif de cet exercice est de comprendre comment utiliser un modèle de langage pré-entraîné avec Hugging Face et de personnaliser ses réponses.

## Étape 1 : Comprendre le code de base

Voici le code de base pour créer un chatbot simple en utilisant le modèle `DialoGPT` de Hugging Face.

In [None]:

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch

# Charger le modèle et le tokenizer
model_name = "microsoft/DialoGPT-small"  # Modèle léger
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(model_name)

# Fonction de conversation
def chat_with_bot(input_text, chat_history_ids=None):
    new_input_ids = tokenizer.encode(input_text + tokenizer.eos_token, return_tensors="pt")
    bot_input_ids = torch.cat([chat_history_ids, new_input_ids], dim=-1) if chat_history_ids is not None else new_input_ids
    chat_history_ids = model.generate(bot_input_ids, max_length=1000, pad_token_id=tokenizer.eos_token_id)
    response = tokenizer.decode(chat_history_ids[:, bot_input_ids.shape[-1]:][0], skip_special_tokens=True)
    return response, chat_history_ids

# Boucle interactive
print("Chatbot prêt. Tapez 'exit' pour quitter.")
chat_history = None

while True:
    user_input = input("Vous: ")
    if user_input.lower() == "exit":
        print("Chatbot: Au revoir!")
        break
    response, chat_history = chat_with_bot(user_input, chat_history)
    print(f"Chatbot: {response}")


The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


tokenizer_config.json:   0%|          | 0.00/614 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.04M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

config.json:   0%|          | 0.00/641 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/351M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/124 [00:00<?, ?B/s]

Chatbot prêt. Tapez 'exit' pour quitter.


The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


Chatbot: Hi


## Étape 2 : Questions (répondez dans des cellules texte sur le notebook)


1. **Identification du code :**
   - Que fait la fonction `chat_with_bot()` ? Décrivez son rôle dans le chatbot
   - Pourquoi utilisons-nous `torch.cat` dans ce script ?

2. **Test initial :**
   - Exécutez le code et testez le chatbot. Essayez plusieurs entrées pour observer ses réponses  
   - Notez ses points faibles
    

## Étape 3 : Améliorations à implémenter


Proposez des tâches d'amélioration pour rendre le chatbot plus utile :

1. **Limiter la longueur de l'historique :**
   - Modifiez le code pour ne conserver que les 3 derniers échanges dans l'historique. (Indice : Utilisez une liste pour gérer les messages.)
   
2. **Personnalisation des réponses :**
   - Ajoutez une condition pour que le chatbot réponde de manière différente à des phrases spécifiques. Exemple :
     ```python
     if "ton nom" in user_input.lower():
         print("Chatbot: Mon nom est ChatbotGPT!")
         continue
     ```

3. **Changer le modèle :**
   - Remplacez `microsoft/DialoGPT-small` par `microsoft/DialoGPT-medium` ou un autre modèle
   - Observez les différences dans les réponses

4. **Ajout de métriques :**
   - Comptez le nombre de messages échangés entre l'utilisateur et le chatbot
   - Affichez ce nombre lorsque l'utilisateur tape "statistiques"
    

## Étape 4 : Défi avancé


1. **Sauvegarder la conversation :**
   - Modifiez le script pour enregistrer toutes les conversations dans un fichier texte.
   - Exemple :
     ```python
     with open("conversation_log.txt", "a") as log_file:
         log_file.write(f"Vous: {user_input}\nChatbot: {response}\n")
     ```

2. **Créer une interface utilisateur simple :**
   - Utilisez `tkinter` ou une bibliothèque comme `streamlit` pour créer une interface graphique où l'utilisateur peut interagir avec le chatbot.
    

## Étape 5 : Prise de hauteur



*   Élément de liste
*   Élément de liste


1. Quels sont les avantages d'utiliser un modèle pré-entraîné ?
2. Quels seraient les défis pour personnaliser ce modèle pour un cas spécifique (par exemple, chatbot pour support technique) ?
    