# Affinage par LUDWIG

Maintenant, pour être honnête, nous n'avons pas réellement besoin de suivre toutes ces étapes à partir de zéro pour affiner un modèle de nos jours. Nous pouvons utiliser des frameworks tels que LUDWIG.

![LUDWIG framework](../images/Ludwig.png)
Cette section explique comment effectuer le fine-tuning d'un modèle de langage en utilisant Ludwig, un outil puissant qui simplifie le cycle de vie de l'apprentissage automatique. Le processus implique l'utilisation d'une configuration de modèle spécifique et d'un ensemble de données pour adapter un modèle pré-entraîné à une tâche spécialisée.

## Configuration

Avant de commencer, assurez-vous que Ludwig est installé et configuré dans votre environnement. Vous devrez également configurer le token du Hugging Face Hub pour accéder aux modèles pré-entraînés. Ceci est réalisé en définissant la variable d'environnement HUGGING_FACE_HUB_TOKEN avec votre clé API Hugging Face :

Ludwig nécessite une configuration YAML qui décrit les paramètres du modèle et de l'entraînement. Les éléments clés de cette configuration incluent :

## Dataset

Le dataset qu'on a utilisé dans cet exemple c'est Alpaca, c'est une ressource unique destinée à l'entraînement et au fine-tuning des modèles de langue pour mieux suivre **les instructions**.

![DATASET Alpaca](../images/alpaca.png)

## Entraînement

Pour entraîner le modèle, chargez la configuration et spécifiez l'ensemble de données. La classe LudwigModel est utilisée avec la méthode train :

## Sauvegarde du Modèle

Après l'entraînement, sauvegardez le modèle pour une utilisation ou un déploiement ultérieurs :

In [None]:
pip install ludwig ludwig[llm] peft

In [None]:
import os
os.environ["HUGGING_FACE_HUB_TOKEN"] = os.getenv('HUGGINGFACE_API_KEY')

In [None]:
model_type: llm
base_model: mistralai/Mistral-7B-v0.1
quantization:
    bits: 4
adapter:
    type: lora
prompt:
    template: |
        ### Instruction :
        {instruction}
        ### Entrée :
        {input}
        ### Réponse :
input_features:
    - name: prompt
      type: text
output_features:
    - name: output
      type: text
trainer:
    type: finetune

In [None]:
from ludwig.api import LudwigModel
import yaml
import logging

# Placeholder for actual YAML configuration string
config_str = '...'
config = yaml.safe_load(config_str)
model = LudwigModel(config=config, logging_level=logging.INFO)
results = model.train(dataset="ludwig://alpaca")

In [None]:
model.save("results")

In [None]:
# Placeholder for actual command to upload model to Hugging Face
# This is a mock command and won't execute as is.
# python -m ludwig.upload hf_hub --repo_id "your_repo_id" --model_path "path_to_your_model"