# **Fine-tuning**

Le fine-tuning permet d'entraîner un large modèle de langue tels que GPT3.5 sur des données spécifiques.


Le réglage fin améliore l'apprentissage en quelques étapes en s'entraînant sur beaucoup plus d'exemples que ne peut en contenir l'invite, vous permettant d'obtenir de meilleurs résultats sur un grand nombre de tâches. Une fois qu'un modèle a été affiné, vous n'aurez plus besoin de fournir autant d'exemples dans l'invite. Cela permet de réduire les coûts et de permettre des requêtes à faible latence.

Le réglage fin vous permet de tirer le meilleur parti des modèles disponibles via l'API en fournissant :

1. Des résultats de meilleure qualité que les invites
2. Capacité à s'entraîner sur plus d'exemples que ne peut en contenir une invite
3. Économies de jetons grâce à des invites plus courtes
4. Demandes de latence réduites


<img src='https://images.openai.com/blob/d8d965fd-e54c-4c9b-9d7d-b5d9910d38b2/gpt-3-5-turbo-fine-tuning-and-api-updates.png?trim=0,0,0,0&width=3200'>



**Les modèles supportés par le fine-tuning**

Un réglage fin est actuellement disponible pour les modèles suivants :

- `gpt-3.5-turbo-0613`(recommandé)
- `babbage-002`
- `davinci-002`


**Tarification**

Les coûts de réglage fin sont répartis en deux catégories : le coût de formation initial et le coût d'utilisation :

- Formation : 0,008 $ / 1 000 tokens

- Entrée d'utilisation : 0,012 $ / 1 000 tokens

- Sortie d'utilisation : 0,016 $ / 1 000 tokens

Par exemple, un gpt-3.5-turbotravail de mise au point avec un fichier de formation de 100 000 jetons formés pendant 3 époques aurait un coût attendu de 2,40 $.



**Cas d'utilisation courants**

Quelques cas d'utilisation courants dans lesquels un réglage fin peut améliorer les résultats :

- Définir le style, le ton, le format ou d'autres aspects qualitatifs
- Améliorer la fiabilité pour produire le résultat souhaité
- Correction des échecs de suivi d'invites complexes
- Gérer de nombreux cas extrêmes de manière spécifique
- Exécuter une nouvelle compétence ou une nouvelle tâche difficile à articuler dans une invite

Une manière générale d'envisager ces cas consiste à considérer qu'il est plus facile de « montrer, pas de dire ». Dans les sections à venir, nous explorerons comment configurer les données pour un réglage fin et divers exemples dans lesquels le réglage fin améliore les performances par rapport au modèle de base.

**Méthodologie**

Le réglage fin améliore l'apprentissage en quelques étapes en s'entraînant sur beaucoup plus d'exemples que ne peut en contenir l'invite, vous permettant d'obtenir de meilleurs résultats sur un grand nombre de tâches. Une fois qu'un modèle a été affiné, vous n'aurez plus besoin de fournir autant d'exemples dans l'invite. Cela permet de réduire les coûts et de permettre des requêtes à faible latence.

À un niveau élevé, le réglage fin implique les étapes suivantes :

1. Préparer et télécharger les données d'entraînement
2. Former un nouveau modèle affiné
3. Utilisez votre modèle affiné


### **1. Préparer et télécharger les données d'entraînement**

Le réglage fin nécessite un fichier de formation au format JSONL. Chaque ligne du fichier doit contenir un objet JSON avec les clés/valeurs suivantes :

- Pour les modèles `ChatCompletion` gt3.5-turbo-0613 :

```{
    "message":[
        {
            "role":"system",
            "content":"contenu du message"
        },
        {
            "role":"user",
            "content":"contenu du message"
        },
        {
            "role":"assistant",
            "content":"contenu du message"
        }
    ]
}
```

- Pour les modèles `TextGeneration` :
```
{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
```

`**Attention**` : **Chaque message doit être placé sur une ligne dans le fichier JSONL. Les messages peuvent être de n'importe quelle longueur.**

**Au moins 10 messages sont nécessaires** pour entraîner un modèle. Pour obtenir de meilleurs résultats, nous recommandons d'utiliser au moins 100 messages. Pour les modèles de génération de texte, nous recommandons d'utiliser au moins 1000 messages.

Le réglage fin est disponible à partir de la version 0.28.0 de l'[API d'OpenAI](https://platform.openai.com/docs/guides/fine-tuning).

In [1]:
!pip install openai==0.28.0

Collecting openai==0.28.0
  Using cached openai-0.28.0-py3-none-any.whl (76 kB)
Installing collected packages: openai
  Attempting uninstall: openai
    Found existing installation: openai 0.27.0
    Uninstalling openai-0.27.0:
      Successfully uninstalled openai-0.27.0
Successfully installed openai-0.28.0



[notice] A new release of pip available: 22.3 -> 23.2.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [None]:
# Structure des données pour l'entrainement d'un modèle ChatCompletion
# Moèle concerné : gpt-3.5-turbo-0613 :

{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What is fine-tuning in machine learning?"}, {"role": "assistant", "content": "Fine-tuning in machine learning involves training a pre-existing model on a specific task or dataset to make it more accurate or suitable for that task. It's like giving the model specialized knowledge."}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Why is fine-tuning important for AI models?"}, {"role": "assistant", "content": "Fine-tuning is crucial because it allows AI models to adapt to specific applications or domains, improving their performance and making them more useful in real-world scenarios."}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Can you explain the steps involved in fine-tuning a language model?"}, {"role": "assistant", "content": "Certainly! Fine-tuning typically includes preparing training data, training the model on that data, and then using the fine-tuned model for your specific tasks. It's a process of specialization."}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What models can be fine-tuned for language tasks?"}, {"role": "assistant", "content": "Currently, you can fine-tune models like gpt-3.5-turbo-0613, babbage-002, and davinci-002. These models can be adapted to various language-related tasks."}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "When should I consider using fine-tuning for AI models?"}, {"role": "assistant", "content": "You should consider fine-tuning when you need to tailor a model for specific tasks or improve its performance on certain applications. It's a powerful tool for customization."}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "How can fine-tuning benefit natural language processing (NLP) tasks?"}, {"role": "assistant", "content": "Fine-tuning can make NLP models more accurate and contextually aware for tasks like text generation, translation, sentiment analysis, and more. It's all about making the model 'smarter' in a particular domain."}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What is the role of training data in fine-tuning?"}, {"role": "assistant", "content": "Training data is essential for fine-tuning as it helps the model learn from examples. You need a diverse set of conversations or text that reflects the scenarios you want the model to handle."}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "How many training examples should I provide for fine-tuning?"}, {"role": "assistant", "content": "You should provide at least 10 training examples, but for optimal results, it's often recommended to have between 50 and 100 examples. The right number depends on your specific use case."}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What are the token limits for fine-tuning examples?"}, {"role": "assistant", "content": "Each fine-tuning example is limited to 4096 tokens. Make sure the total token count in the messages' content is under 4,000 to fit within this limit."}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "How can I estimate the costs of fine-tuning?"}, {"role": "assistant", "content": "You can estimate the costs by using this formula: base cost per 1,000 tokens * number of tokens in the input file * number of training epochs. This will give you an idea of the expected cost for your fine-tuning job."}]}


# Structure des données pour l'entrainement d'un modèle Completion
# Moèle concerné : babbage-002 et davinci-002

{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
{"prompt": "<prompt text>", "completion": "<ideal generated text>"}
{"prompt": "<prompt text>", "completion": "<ideal generated text>"}

### **2. Former un nouveau modèle affiné**

Une fois les instructions de formation préparées et placées dans un fichier `data.jsonl`, vous pouvez commencer à former votre modèle affiné en préparant les données d'entrainement puis en lançant la formation.

In [3]:
import os
import openai


# Préparation des données pour l'entrainement d'un modèle ChatCompletion
openai.api_key = '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'
response = openai.File.create(
  file=open("./data.jsonl", "rb"),
  purpose='fine-tune'
)
response

<File file id=file-b5Sn25QzdzTrkOFEhnokhRbw at 0x1eaa49ea870> JSON: {
  "object": "file",
  "id": "file-b5Sn25QzdzTrkOFEhnokhRbw",
  "purpose": "fine-tune",
  "filename": "file",
  "bytes": 4085,
  "created_at": 1695369195,
  "status": "uploaded",
  "status_details": null
}

In [4]:
# Entrainement du modèle ChatCompletion sur les serveurs d'OpenAI
response_train_model = openai.FineTuningJob.create(
    training_file=response['id'],
    model="gpt-3.5-turbo",
    )

response_train_model

<FineTuningJob fine_tuning.job id=ftjob-IOXUBhVarK7t6EDPNVyIRina at 0x1eaa49eac30> JSON: {
  "object": "fine_tuning.job",
  "id": "ftjob-IOXUBhVarK7t6EDPNVyIRina",
  "model": "gpt-3.5-turbo-0613",
  "created_at": 1695369202,
  "finished_at": null,
  "fine_tuned_model": null,
  "organization_id": "org-7z5FszmIViA0Ipk6dzVjcojw",
  "result_files": [],
  "status": "validating_files",
  "validation_file": null,
  "training_file": "file-b5Sn25QzdzTrkOFEhnokhRbw",
  "hyperparameters": {
    "n_epochs": "auto"
  },
  "trained_tokens": null,
  "error": null
}

In [5]:
openai.FineTuningJob.list()

<OpenAIObject list at 0x1eaa49eae10> JSON: {
  "object": "list",
  "data": [
    {
      "object": "fine_tuning.job",
      "id": "ftjob-IOXUBhVarK7t6EDPNVyIRina",
      "model": "gpt-3.5-turbo-0613",
      "created_at": 1695369202,
      "finished_at": null,
      "fine_tuned_model": null,
      "organization_id": "org-7z5FszmIViA0Ipk6dzVjcojw",
      "result_files": [],
      "status": "validating_files",
      "validation_file": null,
      "training_file": "file-b5Sn25QzdzTrkOFEhnokhRbw",
      "hyperparameters": {
        "n_epochs": "auto"
      },
      "trained_tokens": null,
      "error": null
    },
    {
      "object": "fine_tuning.job",
      "id": "ftjob-gH7nMA3Ycw0SUP35wRcfxDaT",
      "model": "gpt-3.5-turbo-0613",
      "created_at": 1695367207,
      "finished_at": 1695367532,
      "fine_tuned_model": "ft:gpt-3.5-turbo-0613:dawan::81UpZvUs",
      "organization_id": "org-7z5FszmIViA0Ipk6dzVjcojw",
      "result_files": [
        "file-9rOSyUxbhoxp5bOZeueVECfm"
     

### **3. Utilisez votre modèle affiné**

Une fois que votre modèle est formé, vous pouvez l'utiliser pour générer des résultats en utilisant l'API comme vous le feriez avec n'importe quel autre modèle. Il est possible de visualiser la courbe d'apprentissage de votre modèle dans le tableau de bord de votre compte :
https://platform.openai.com/finetune



In [6]:
[model['id'] for model in openai.Model().list()["data"]]

['curie-search-query',
 'babbage-search-document',
 'text-search-babbage-doc-001',
 'babbage',
 'text-babbage-001',
 'text-similarity-davinci-001',
 'davinci',
 'davinci-similarity',
 'code-davinci-edit-001',
 'curie-similarity',
 'code-search-babbage-code-001',
 'curie-instruct-beta',
 'text-search-ada-doc-001',
 'davinci-instruct-beta',
 'text-search-davinci-doc-001',
 'text-curie-001',
 'davinci-search-query',
 'text-similarity-curie-001',
 'text-davinci-001',
 'text-search-davinci-query-001',
 'text-davinci-003',
 'ada-search-document',
 'ada-code-search-code',
 'babbage-002',
 'whisper-1',
 'gpt-4-0613',
 'gpt-4',
 'davinci-002',
 'davinci-search-document',
 'curie-search-document',
 'babbage-code-search-text',
 'babbage-code-search-code',
 'babbage-search-query',
 'text-search-ada-query-001',
 'code-search-ada-text-001',
 'gpt-3.5-turbo-instruct-0914',
 'gpt-3.5-turbo-instruct',
 'gpt-3.5-turbo-0613',
 'ada-search-query',
 'ada-code-search-text',
 'text-search-curie-query-001',
 

In [7]:
# Utilisation du modèle fine-tuné
reponse = openai.ChatCompletion.create(
    model='ft:gpt-3.5-turbo-0613:dawan::81DNLWeI',
    messages=[
        {"role": "system","content": "Marv is a factual chatbot that is also sarcastic."},
        {"role": "user",
         "content":"What is fine-tuning in machine learning?"},
    ],
)

reponse['choices'][0]['message']["content"]

"Fine-tuning in machine learning involves training a pre-existing model on a specific task or dataset to make it more accurate or suitable for that task. It's like giving the model specialized knowledge."

___

# Exercice



1. A L'aide de ChatGPT, créez un fichier de données d'entrainement au format JSONL contenant au moins 10 messages puis placez le dans un fichier `data.jsonl` Entrainez ensuite un modèle de chatbot sur un domaine de votre choix.
**Astuce** : Copiez le contenu de votre choix (exemple : une page internet) puis demandez à GhatGPT de générer le fichier de données d'entrainement au format JSONL.

2. Créez une méthode `openai_chat_finetune()` qui prend en paramètre le nom du fichier de données d'entrainement et retourne le nom du modèle entrainé.

### **Exemple de prompt à envoyer à ChatGPT**

```

A partir du document suivant crée-moi un fichier jsonl contentant des exemples d'échange entre un chatbot et un utilisateur qui sera utilisé pour le fine-tuning d'un model gpt3 pour répondre aux questions de développeurs qui souhaite comprendre comment fonctionne le finetuning. Le jsonl aura la forme suivante :

{"messages": [{"role": "system", "content": "definir le rol system"}, {"role": "user", "content": "question type posé par un utilisateur"}, {"role": "assistant", "content": "Réponse de l'assistant"}]}


Le modèle du fichier json doit avoir cette forme :
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What's the capital of France?"}, {"role": "assistant", "content": "Paris, as if everyone doesn't know that already."}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Who wrote 'Romeo and Juliet'?"}, {"role": "assistant", "content": "Oh, just some guy named William Shakespeare. Ever heard of him?"}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "How far is the Moon from Earth?"}, {"role": "assistant", "content": "Around 384,400 kilometers. Give or take a few, like that really matters."}]}


Propose moi à nouveau 20 exemples d'intéraction entre un assistant et un utilisateur au sujet du finetuning en respectant le modèle donné.

Voici la documentation à partir de laquelle tu dois créer les exemples : à compléter

```


In [11]:
from functions import TextProcessor

text_processor = TextProcessor()
trained_model_name = text_processor.openai_chat_finetune("./data.jsonl")

if trained_model_name:
    print(f"Modèle entraîné avec succès : {trained_model_name}")
else:
    print("L'entraînement a échoué.")

  from .autonotebook import tqdm as notebook_tqdm


InvalidRequestError: invalid training_file: ./data.jsonl