# Fine-Tuning de Mistral-7B

## Introduction

Veuillez utiliser ce notebook après que le notebook mistral_utilisation ait terminé son exécution avec succès.

Dans ce notebook, nous allons effectuer le fine-tuning de Mistral-7B (https://huggingface.co/mistralai/Mistral-7B-v0.3) à partir de l'API Transformers d'Hugging Face (utilisant LoRa). Les étapes suivantes seront suivies :

1. Installation des packages.
2. Importation des bibliothèques nécessaires.
3. Récupération des données.
4. Prétraitement des données.
5. Récupération du modèle sur le disque.
6. Entraînement du modèle à partir des données.
7. Utilisation du modèle entraîné sur un cas.

## Installation des packages

In [None]:
#! pip install transformers[sentencepiece] trl accelerate torch bitsandbytes peft datasets -qU

In [None]:
import os

## Importation des bibliothèques nécessaires

In [None]:
# Pour télécharger les données
from datasets import load_dataset

# Pour récupérer Mistral-7B, le tokenizer associé et ...
from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig

# Pour utiliser PyTorch
import torch

## Récupération des données

In [None]:
instruct_tune_dataset = load_dataset("mosaicml/instruct-v3")

In [None]:
print(instruct_tune_dataset)

## Prétraitement des données

In [None]:
instruct_tune_dataset = instruct_tune_dataset.filter(lambda x: x["source"] == "dolly_hhrlhf")

In [None]:
print(instruct_tune_dataset)

In [None]:
instruct_tune_dataset["train"] = instruct_tune_dataset["train"].select(range(5_000)) # TODO : Rajouter la méthode shuffle

In [None]:
instruct_tune_dataset["test"] = instruct_tune_dataset["test"].select(range(200)) # TODO : Rajouter la méthode shuffle

In [None]:
print(instruct_tune_dataset)

In [None]:
# Exemple d'une donnée (ici une donnée d'entraînement)
print(instruct_tune_dataset["train"][0])

In [None]:
# Exemple de prompt d'une donnée originale
print(instruct_tune_dataset["train"][0]['prompt'])

In [None]:
# Exemple de response d'une donnée originale
print(instruct_tune_dataset["train"][0]['response'])

In [None]:
# Exemple de source d'une donnée originale
print(instruct_tune_dataset["train"][0]['source'])

In [None]:
def create_prompt(sample):
    """
    Modifie la donnée d'entrée pour correspondre au format attendu par Mistral-7B et à la tâche en question.

    Paramètres:
    sample (dict): La donnée d'entrée.

    Retours:
    str: La modification sous le bon format attendu par Mistral-7B et à la tâche en question.

    Exemple:
    >>> print(create_prompt({'prompt': "Can I find information about SALOME platform ?", 'response': ""}))
    
    <s>### Instruction:
    Use the provided input to create a response to the prompt question.
    
    ### Input:
    Can I find information about SALOME platform ?
    
    ### Response:
    </s>
    """
    
    bos_token = "<s>"
    original_system_message = "Below is an instruction that describes a task. Write a response that appropriately completes the request."
    system_message = "Use the provided input to create a response to the prompt question."
    response = sample["response"].replace(original_system_message, "").replace("\n\n### Instruction\n", "").replace("\n### Response\n", "").strip()
    input = sample["prompt"]
    eos_token = "</s>"
    
    full_prompt = ""
    full_prompt += bos_token
    full_prompt += "### Instruction:"
    full_prompt += "\n" + system_message
    full_prompt += "\n\n### Input:"
    full_prompt += "\n" + input
    full_prompt += "\n\n### Response:"
    full_prompt += "\n" + response
    full_prompt += eos_token
    
    return full_prompt

In [None]:
# Affichage de la doc de la fonction create_prompt
print(create_prompt.__doc__)

In [None]:
# Exemple d'utilisation de la fonction create_prompt
print(create_prompt({'prompt': "Can I find information about SALOME platform ?", 'response': ""}))

In [None]:
# Exemple de la donnée finale, i.e. après passage dans la fonction create_prompt
print(create_prompt(instruct_tune_dataset["train"][0]))

## Récupération du modèle Mistral-7B

Dans cette section, on télécharge/récupère le modèle de base Mistral-7B, se trouvant sur le disque, et le tokenizer associé.

In [None]:
# TODO: À étudier
nf4_config = BitsAndBytesConfig(
   load_in_4bit=True,
   bnb_4bit_quant_type="nf4",
   bnb_4bit_use_double_quant=True,
   bnb_4bit_compute_dtype=torch.float
)

In [None]:
# Spécification du répertoire de sauvegarde du modèle
save_directory_model = "../models/mistral7b_not_fine-tune"

# Spécification du répertoire de sauvegarde du tokenizer
save_directory_tokenizer = "../models/mistral7b_tokenizer_not_fine-tune"

In [None]:
# Chargement du modèle sauvegardé
model = AutoModelForCausalLM.from_pretrained(
    save_directory_model,
    device_map='auto',
    quantization_config=nf4_config,
    use_cache=False,
)

In [None]:
# Récupération du tokenizer associé
#tokenizer = AutoTokenizer.from_pretrained("mistralai/Mistral-7B-v0.3")
tokenizer = AutoTokenizer.from_pretrained(save_directory_tokenizer)

# Problème: ValueError: Cannot instantiate this tokenizer from a slow version. If it's based on sentencepiece, make sure you have sentencepiece installed.
# Solution: pip install transformers[sentencepiece]

In [None]:
# TODO: À étudier
tokenizer.pad_token = tokenizer.eos_token
tokenizer.padding_side = "right"

## Fine-tuning du modèle

In [None]:
from peft import AutoPeftModelForCausalLM, LoraConfig, get_peft_model, prepare_model_for_kbit_training

peft_config = LoraConfig(
    lora_alpha=16,
    lora_dropout=0.1,
    r=64,
    bias="none",
    task_type="CAUSAL_LM"
)

In [None]:
model = prepare_model_for_kbit_training(model)
model = get_peft_model(model, peft_config)

In [None]:
from transformers import TrainingArguments

args = TrainingArguments(
    output_dir = "mistral_instruct_generation",
    #num_train_epochs=5,00:02.0
    max_steps =5, # comment out this line if you want to train in epochs
    per_device_train_batch_size = 2,
    warmup_steps = 0,
    logging_steps=1,
    #save_strategy="epoch",
    eval_strategy="epoch",
    eval_steps=2, # comment out this line if you want to evaluate at the end of each epoch
    learning_rate=2e-4,
    bf16=True,
    per_gpu_train_batch_size=1,
    lr_scheduler_type='constant',
)

In [None]:
from trl import SFTTrainer

max_seq_length = 128

trainer = SFTTrainer(
  model=model,
  peft_config=peft_config,
  max_seq_length=max_seq_length,
  tokenizer=tokenizer,
  packing=True,
  formatting_func=create_prompt,
  args=args,
  train_dataset=instruct_tune_dataset["train"],
  eval_dataset=instruct_tune_dataset["test"]
)

In [None]:
trainer.train()

## Prédiction à partir du modèle

In [None]:
def generate_response(prompt, model):
  encoded_input = tokenizer(prompt,  return_tensors="pt", add_special_tokens=True)
  model_inputs = encoded_input.to('cuda')

  generated_ids = model.generate(**model_inputs, max_new_tokens=1000, do_sample=True, pad_token_id=tokenizer.eos_token_id)

  decoded_output = tokenizer.batch_decode(generated_ids)

  return decoded_output[0].replace(prompt, "")

Exemple d'utilisation de la fonction `generate_response` :

In [None]:
# Prompt
#prompt = "<s>### Instruction:\nUse the provided input to create an instruction that could have been used to generate the response with an LLM.\n\n### Input:\nI think it depends a little on the individual, but there are a number of steps you’ll need to take.  First, you’ll need to get a college education.  This might include a four-year undergraduate degree and a four-year doctorate program.  You’ll also need to complete a residency program.  Once you have your education, you’ll need to be licensed.  And finally, you’ll need to establish a practice.\n\n### Response:"
#prompt = create_prompt()
prompt = "<s>### Instruction:\nUse the provided input to create a response.\n\n### Input:\nCan I find information about SALOME platform ?\n\n### Response:</s>"
print(prompt)

In [None]:
# Réponse prédite par le modèle
print(generate_response(prompt, model))

## Sauvegarde du modèle sur le disque

In [None]:
# Spécification du répertoire de sauvegarde
save_directory = "../models/mistral7b_fine-tune"

# Sauvegarde du modèle fine-tuné
model.save_pretrained(save_directory)