<a href="https://colab.research.google.com/github/GeraudBourdin/llm-scripts/blob/main/1_finetuning_mistral_7b_using_autotrain.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Fine-tuning Mistral 7b with AutoTrain

**Mise en place**

Un GPU est necessaire pour le fintune de Llama ou Mistral:

- Aller dans `Runtime` (En haut à droite de Colab).
- Selectionner `Change Runtime Type`.
- Choisir un environnement de type `T4 GPU` (ou supérieur).
- Aller dans le menu latéral gauche de la page Collab.
- Ajouter un env: HF_TOKEN et mettez-y votre token "write" d'accès à hugging face.
- Ajoutez DATASET_REPO le nom de votre dépot huggingface (doit être de type dataset)
- Ajouter DATASET_FILE le nom du fichier situé dans votre dépot (DATASET_REPO/monfichier.csv)

### Step 1: installation des dépendances

In [2]:
!pip install pandas autotrain-advanced -q

In [None]:
!autotrain setup --update-torch

In [None]:
!pip install huggingface_hub ipywidgets

## Step 2: Connection à votre dépot huggingface pour uploader le model
### Connection Hugging Face
Pour vous assurer que le modèle peut être téléchargé et être utilisé pour l'inférence, il est nécessaire de se connecter au hub Hugging Face.
- Lancez la commande suivant et renseignez votre `token`. Votre token doit avoir la permission en écriture.

In [5]:
from huggingface_hub import notebook_login
notebook_login()

VBox(children=(HTML(value='<center> <img\nsrc=https://huggingface.co/front/assets/huggingface_logo-noborder.sv…

## Step 3: Récupération de votre dataset


In [6]:
# @title dépot du dataset

# Importation des bibliothèques
from huggingface_hub import hf_hub_download
import ipywidgets as widgets
from IPython.display import display
import shutil
import os
from google.colab import userdata



# Création de widgets pour la saisie de l'utilisateur
repo_input = widgets.Text(
    value=userdata.get('DATASET_REPO'),
    placeholder='Entrez le nom du dépôt',
    description='Dépôt:',
    disabled=False
)

file_input = widgets.Text(
    value=userdata.get('DATASET_FILE'),
    placeholder='Entrez le nom du fichier',
    description='Fichier:',
    disabled=False
)

button = widgets.Button(description="Télécharger")

# Fonction à exécuter lors du clic sur le bouton
def on_button_clicked(b):
    repo_id = repo_input.value
    filename = file_input.value
    file_path = hf_hub_download(repo_id=repo_id, filename=filename, repo_type="dataset", local_dir_use_symlinks=False, local_dir='./')
    print(f"Le fichier a été téléchargé à l'emplacement : {file_path}")
    # Déplacer et renommer le fichier
    new_file_path = 'train.csv'
    # Si le chemin est un lien symbolique -> chemin réel du fichier
    if os.path.islink(file_path):
        real_path = os.readlink(file_path)
    else:
        real_path = file_path
    print(f" {real_path}")
    shutil.move(real_path, new_file_path)
    print(f"Le fichier a été déplacé à l'emplacement : {new_file_path}")

button.on_click(on_button_clicked)

# Affichage des widgets
display(repo_input, file_input, button)


Text(value='Bourdin/dataset', description='Dépôt:', placeholder='Entrez le nom du dépôt')

Text(value='train_hyundai.csv', description='Fichier:', placeholder='Entrez le nom du fichier')

Button(description='Télécharger', style=ButtonStyle())

train_hyundai.csv:   0%|          | 0.00/56.1k [00:00<?, ?B/s]

Le fichier a été téléchargé à l'emplacement : ./train_hyundai.csv
 ./train_hyundai.csv
Le fichier a été déplacé à l'emplacement : train.csv


In [14]:
%ls -la train.csv
!head -n 5 train.csv


-rw-r--r-- 1 root root 56103 Jan 23 15:25 train.csv
instruction,input,output,text
"Je veux une liste des voitures les plus puissantes disponibles.",,"Les modèles de voitures les plus puissantes disponibles incluent l'Audi RS6 Avant, la Porsche 911, et la Tesla Model S.","Below is an instruction that describes a task. Write a response that appropriately completes the request.### Instruction:
Je veux une liste des voitures les plus puissantes disponibles.
### Response:
Les modèles de voitures les plus puissantes disponibles incluent l&#039;Audi RS6 Avant, la Porsche 911, et la Tesla Model S."


In [None]:
## exemple a ne pas utiliser.
!git clone https://github.com/joshbickett/finetune-llama-2.git
%cd finetune-llama-2
%mv train.csv ../train.csv
%cd ..

In [15]:
import pandas as pd
df = pd.read_csv("train.csv")
df

Unnamed: 0,instruction,input,output,text
0,Je veux une liste des voitures les plus puissa...,,Les modèles de voitures les plus puissantes di...,Below is an instruction that describes a task....
1,Quelles sont les voitures les plus classes en ...,,"Pour une voiture de classe, je vous recommande...",Below is an instruction that describes a task....
2,"Je cherche une voiture familiale, quelles sont...",,Les voitures familiales dans notre inventaire ...,Below is an instruction that describes a task....
3,Montre-moi des voitures écologiques.,,Nos véhicules écologiques comprennent la Nissa...,Below is an instruction that describes a task....
4,"Je veux une voiture sportive, que pouvez-vous ...",,Nous avons des voitures sportives telles que l...,Below is an instruction that describes a task....
...,...,...,...,...
56,Je cherche un crossover polyvalent pour les ac...,,Les crossovers tels que le Peugeot 3008 combin...,Below is an instruction that describes a task....
57,Quels véhicules viennent avec les meilleures g...,,Les véhicules Kia sont réputés pour leurs gara...,Below is an instruction that describes a task....
58,Quelle voiture recommandez-vous pour un conduc...,,"Pour les conducteurs seniors, je suggère des v...",Below is an instruction that describes a task....
59,"Je recherche une voiture économique, quels cho...",,Les options économiques comprennent la Renault...,Below is an instruction that describes a task....


No charts were generated by quickchart


In [9]:
df['text'][15]

'Below is an instruction that describes a task. Write a response that appropriately completes the request.### Instruction:\nQuelles voitures allient puissance et design attrayant ?\n### Response:\nSi vous recherchez puissance et design, les modèles suivants devraient vous intéresser : l&#039;Alfa Romeo Giulia Quadrifoglio avec son style italien et ses performances élevées, la Porsche Panamera qui combine luxe et puissance, l&#039;Audi S5 Sportback connue pour son design sportif et son moteur puissant, la Tesla Model S qui offre une esthétique moderne avec une accélération impressionnante, et la BMW Serie 8 qui est le symbole de l&#039;élégance sportive.'

## Step 4: AutoTrain command

#### Descriptif des arguments

- `!autotrain` : **!** Commande exécutée dans des environnements comme un carnet Jupyter ou colab pour exécuter directement des commandes shell. `autotrain` est l'utilitaire d'entraînement automatique de hugging face.

- `llm` : Une sous-commande ou un argument spécifiant le type de tâche.

- `--train` : Initie le processus d'entraînement.

- `--project-name` : Définit le nom du projet. Par exemple 'Test-finetunning'

- `--model abhishek/llama-2-7b-hf-small-shards` : Spécifie le modèle original hébergé sur Hugging Face nommé "llama-2-7b-hf-small-shards" sous l'utilisateur "abhishek". Shard signifie qu'il s'agit d'un modele allégé. Le modèle de reference nécécite plus de puissance et donc un GPU avec plus de mémoire. On se limite a un model qui passe sur le gpu gratuit pour l'éxemple.

- `--data_path .` : Le chemin vers l'ensemble de données pour l'entraînement. Le "." fait référence au répertoire courant. Le fichier `train.csv` doit être situé dans ce répertoire.

- `--use_int4` : Utilisation de la quantification INT4 pour réduire la taille du modèle et accélérer les temps d'inférence au prix de certaines précisions.

- `--lr 2e-4` : Définit le taux d'apprentissage pour l'entraînement à 0,0002.

- `--train-batch-size 1` : Définit la taille de lot pour l'entraînement à 12.

- `--epochs 3` : Le processus d'entraînement itérera sur l'ensemble de données 3 fois.

### Steps needed before running
Go to the `!autotrain` code cell below and update it by following the steps below:

1. After `--project_name` replace `*enter-a-project-name*` with the name that you'd like to call the project
2. After `--repo_id` replace `*username*/*repository*`. Replace `*username*` with your Hugging Face username and `*repository*` with the repository name you'd like it to be created under. You don't need to create this repository before hand, it will automatically be created and uploaded once the training is completed.
3. Confirm that `train.csv` is in the root directory in the Colab. The `--data_path .` flag will make it so that AutoTrain looks for your data there.
4. Make sure to add the LoRA Target Modules to be trained `--target-modules q_proj, v_proj`
5. Once you've made these changes you're all set, run the command below!

In [46]:
!autotrain llm --help

usage: autotrain <command> [<args>] llm [-h] [--text_column TEXT_COLUMN]
                                        [--rejected_text_column REJECTED_TEXT_COLUMN]
                                        [--prompt-text-column PROMPT_TEXT_COLUMN]
                                        [--model-ref MODEL_REF] [--warmup_ratio WARMUP_RATIO]
                                        [--optimizer OPTIMIZER] [--scheduler SCHEDULER]
                                        [--weight_decay WEIGHT_DECAY]
                                        [--max_grad_norm MAX_GRAD_NORM] [--add_eos_token]
                                        [--block_size BLOCK_SIZE] [--peft] [--lora_r LORA_R]
                                        [--lora_alpha LORA_ALPHA] [--lora_dropout LORA_DROPOUT]
                                        [--logging_steps LOGGING_STEPS]
                                        [--evaluation_strategy EVALUATION_STRATEGY]
                                        [--save_total_limit SAVE_TOTAL_L

In [47]:
!autotrain llm --train \
--project-name test \
--model abhishek/llama-2-7b-hf-small-shards \
--data-path .  \
--use-peft  \
--quantization int4  \
--lr 2e-4  \
--train-batch-size 12  \
--epochs 3  \
--trainer sft  \
--target-modules q_proj,v_proj  \
--push-to-hub  \
--peft \
--lora-r 64 \
--lora-alpha 16 \
--lora-dropout 0.1 \
--repo-id Bourdin/test \
--token hf_XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

> [1mINFO    Running LLM[0m
> [1mINFO    Params: Namespace(version=False, text_column='text', rejected_text_column='rejected', prompt_text_column='prompt', model_ref=None, warmup_ratio=0.1, optimizer='adamw_torch', scheduler='linear', weight_decay=0.0, max_grad_norm=1.0, add_eos_token=False, block_size=-1, peft=True, lora_r=64, lora_alpha=16, lora_dropout=0.1, logging_steps=-1, evaluation_strategy='epoch', save_total_limit=1, save_strategy='epoch', auto_find_batch_size=False, mixed_precision=None, quantization='int4', model_max_length=1024, trainer='sft', target_modules='q_proj,v_proj', merge_adapter=False, use_flash_attention_2=False, dpo_beta=0.1, apply_chat_template=False, padding=None, train=True, deploy=False, inference=False, username=None, backend='local-cli', token='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', repo_id='Bourdin/test', push_to_hub=True, model='abhishek/llama-2-7b-hf-small-shards', project_name='test', seed=42, epochs=3, gradient_accumulation=1, disable_gradient_che

## Step 5: Completed 🎉
After the command above is completed your Model will be uploaded to Hugging Face.

#### Learn more about AutoTrain (optional)
If you want to learn more about what command-line flags are available

## Step 6: Inference Engine

In [None]:
!autotrain llm -h

In [None]:
!pip install -q peft  accelerate bitsandbytes safetensors

In [None]:
import torch
from peft import PeftModel
from transformers import AutoModelForCausalLM, AutoTokenizer
import transformers
adapters_name = "ashishpatel26/mistral-7b-mj-finetuned"
model_name = "bn22/Mistral-7B-Instruct-v0.1-sharded" #"mistralai/Mistral-7B-Instruct-v0.1"


device = "cuda" # the device to load the model onto

In [None]:
bnb_config = transformers.BitsAndBytesConfig(
    load_in_4bit=True,
    bnb_4bit_use_double_quant=True,
    bnb_4bit_quant_type="nf4",
    bnb_4bit_compute_dtype=torch.bfloat16
)

In [None]:
model = AutoModelForCausalLM.from_pretrained(
    model_name,
    load_in_4bit=True,
    torch_dtype=torch.bfloat16,
    quantization_config=bnb_config,
    device_map='auto'
)

Loading checkpoint shards:   0%|          | 0/11 [00:00<?, ?it/s]

## Step 7: Peft Model Loading with upload model

In [None]:
model = PeftModel.from_pretrained(model, adapters_name)

In [None]:
tokenizer = AutoTokenizer.from_pretrained(model_name)
tokenizer.bos_token_id = 1

stop_token_ids = [0]

print(f"Successfully loaded the model {model_name} into memory")

Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.


Successfully loaded the model bn22/Mistral-7B-Instruct-v0.1-sharded into memory


In [None]:
text = "[INST] generate a midjourney prompt for A person walks in the rain [/INST]"

encoded = tokenizer(text, return_tensors="pt", add_special_tokens=False)
model_input = encoded
model.to(device)
generated_ids = model.generate(**model_input, max_new_tokens=200, do_sample=True)
decoded = tokenizer.batch_decode(generated_ids)
print(decoded[0])

Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


[INST] generate a midjourney prompt for A person walks in the rain [/INST] "As you wander through the pouring rain, you can't help but wonder what the world would be like if things were different. What if the rain was a symbol of the turmoil in your life, and the sunshine promised a brighter future? What if you suddenly found yourself lost in a small town where time stood still, and the people were trapped in a time loop? As you struggle to find your way back to reality, you discover a mysterious stranger who seems to hold the key to unlocking the secrets of the town and your own past."</s>
