In [1]:
!pip install -U git+https://github.com/lvwerra/trl.git
!pip install -q -U datasets bitsandbytes einops wandb torch
!pip install -U git+https://github.com/huggingface/huggingface_hub
# peft es una libreria para calcular la eficiencia de la aceleración de un modelo
#!pio install -U tokenizers==0.13.3
!pip install -U transformers
!pip install -U git+https://github.com/huggingface/peft.git
# transformers es una libreria para entrenar y usar modelos de NLP
#!pip install -U git+https://github.com/huggingface/transformers

# sentencepiece es una libreria para tokenizar texto en subpalabras
!pip install -U seaborn
# accelerate es una libreria de huggingface para acelerar el entrenamiento de modelos de NLP en GPU y TPU
!pip install -U accelerate
!pip install -U evaluate
!pip install -U bitsandbytes

Collecting git+https://github.com/lvwerra/trl.git
  Cloning https://github.com/lvwerra/trl.git to /tmp/pip-req-build-bqhz3214
  Running command git clone --filter=blob:none --quiet https://github.com/lvwerra/trl.git /tmp/pip-req-build-bqhz3214
  Resolved https://github.com/lvwerra/trl.git to commit 249d3e3259015c551e90e157fa227816c27951ad
  Installing build dependencies ... [?25ldone
[?25h  Getting requirements to build wheel ... [?25ldone
[?25h  Preparing metadata (pyproject.toml) ... [?25ldone
[?25hCollecting tyro>=0.5.7
  Downloading tyro-0.5.9-py3-none-any.whl (93 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m93.8/93.8 kB[0m [31m18.0 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting accelerate
  Downloading accelerate-0.23.0-py3-none-any.whl (258 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m258.1/258.1 kB[0m [31m55.7 MB/s[0m eta [36m0:00:00[0m
Collecting shtab>=1.5.6
  Downloading shtab-1.6.4-py3-none-any.whl (13 kB)
Collecting d

In [1]:
import transformers # transformers es de hugingface
from transformers import LlamaTokenizer, LlamaForCausalLM, AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig # LlamaTokenizer y LlamaForCausalLM son clases de transformers
import os # os es una libreria para interactuar con el sistema operativo
import sys # sys es una libreria para interactuar con el sistema operativo
import wandb
from peft import ( # peft es de hugingface
    LoraConfig, # LoraConfig es una clase de peft que contiene la configuración de Lora, Lora es un modelo de NLP que usa transformers y llama como tokenizer
    get_peft_model, # get_peft_model es una función de peft que obtiene el modelo de Lora
    get_peft_model_state_dict, # get_peft_model_state_dict es una función de peft que obtiene el estado del modelo de Lora
    prepare_model_for_kbit_training, # prepare_model_for_int8_training es una función de peft que prepara el modelo de Lora para el entrenamiento de int8
    PeftModel
)
from trl import SFTTrainer, DataCollatorForCompletionOnlyLM
import torch # torch es una libreria para entrenar y usar modelos de NLP
import datasets  # datasets es una libreria para cargar y procesar conjuntos de datos de NLP
import pandas as pd # pandas es una libreria para análisis de datos
from huggingface_hub import login # huggingface_hub es de hugingface
import matplotlib.pyplot as plt # matplotlib es una libreria para visualización de datos
import pandas as pd # pandas es una libreria para análisis de datos
import wandb

In [2]:
access_token = "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"
login(token=access_token)

Token will not been saved to git credential helper. Pass `add_to_git_credential=True` if you want to set the git credential as well.
Token is valid (permission: write).
Your token has been saved to /root/.cache/huggingface/token
Login successful


In [3]:
parameters="7b-chat"
BASE_MODEL = f"meta-llama/Llama-2-{parameters}-hf" # modelo base de llama de 7B de parámetros
# if there is a pretrained model, load it the model is Models_of_Llama/Llama_base
myModel= "BrunoGR/EmotionalBot_LLaMA2"

In [4]:
model = AutoModelForCausalLM.from_pretrained(
    BASE_MODEL,
    torch_dtype=torch.float16,
    #quantization_config=bnb_config,
    #load_in_8bit=True,
    device_map="auto"
)
model.tie_weights()

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

In [5]:
model.config.use_cache = False
model.config.pretraining_tp = 1

In [6]:
tokenizer =   LlamaTokenizer.from_pretrained(BASE_MODEL)
tokenizer.pad_token = tokenizer.eos_token

In [7]:
data= datasets.load_dataset("BrunoGR/emotional_response_spanish_dataset", cache_dir="datasets")

In [8]:
LoRA_TARGET_MODULES = [ # Esta lista especifica los módulos del modelo de lenguaje original que se adaptarán mediante la técnica LoRA
    "q_proj", # q_proj es la proyección de consulta
    "v_proj", # v_proj es la proyección de valor
]

LoRA_DROPOUT= 0.05
config = LoraConfig( # se configura el modelo de llama
    r=256, # indica el número de factores o dimensiones principales utilizados en la descomposición de las matrices de peso del modelo de lenguaje original.
    lora_alpha=256,
    target_modules=LoRA_TARGET_MODULES,
    lora_dropout=LoRA_DROPOUT,
    bias="none",
    task_type="CAUSAL_LM",
)
#pftmdl = get_peft_model(model, config) # se obtiene el modelo de llama
#pftmdl.print_trainable_parameters() # se muestran los parámetros entrenables del modelo

In [9]:
BATCH_SIZE = 3 # tamaño del batch, es decir, cuantos textos se procesan a la vez
MICRO_BATCH_SIZE = 1# tamaño del micro batch, es decir, cuantos textos se procesan a la vez en la GPU
GRADIENT_ACCUMULATION_STEPS = BATCH_SIZE // MICRO_BATCH_SIZE # pasos de acumulación de gradientes
training_arguments = transformers.TrainingArguments( # se configuran los argumentos de entrenamiento
    per_device_train_batch_size=MICRO_BATCH_SIZE, # tamaño del micro batch
    gradient_accumulation_steps=GRADIENT_ACCUMULATION_STEPS, # pasos de acumulación de gradientes
    warmup_steps=200, # pasos de calentamiento del entrenamiento
    num_train_epochs = 5, # epocas de entrenamiento que son 300
    learning_rate=3e-5, # tasa de aprendizaje
    adam_beta1=0.8, # betas de adam, se usa el mismo del paper de llama
    adam_beta2=0.95, # se usa el mismo del paper de llama
    adam_epsilon=1e-8, # se usa el mismo del paper de llama
    weight_decay=0.1,
    fp16=True, # se usa la precisión de 16 bits
    logging_steps=10, # pasos de logging
    optim="adamw_torch", # optimizador adamw, se usa el de torch
    evaluation_strategy="steps", # estrategia de evaluación
    save_strategy="steps", # estrategia de guardado
    eval_steps=900, # cada 50 pasos se evalúa el modelo
    save_steps=900, # cada 50 pasos se guarda el modelo
    output_dir="checkpoint4b108", # directorio de salida
    save_total_limit=6, # límite de guardado3
    load_best_model_at_end=True, #se guarda el mejor modelo al final
    report_to="wandb", # se reporta a tensorboard
    seed=1,
    lr_scheduler_type = "cosine",# tal y como dice en el paper de llama
    max_grad_norm = 1.0, # tal y como dice en el paper de llama
)

In [10]:
os.environ['WANDB_API_KEY'] = '4568bca12d8724d7cd88b0902226349c1d621364'

In [11]:
wandb.init(project="Emo_withLLaMA2", name="emo_FineTune_r128_a256_2AB108")

[34m[1mwandb[0m: Currently logged in as: [33mbruno-gil[0m ([33memo_com[0m). Use [1m`wandb login --relogin`[0m to force relogin


In [12]:
response_template_with_context = "\n### response:"
instruction_template="instruction:"
response_template_ids = tokenizer.encode(response_template_with_context, add_special_tokens=False)[2:]  # Now we have it like in the dataset texts: `[2277, 29937, 4007, 22137, 29901]`
print(response_template_ids)
collator = DataCollatorForCompletionOnlyLM(response_template_ids,instruction_template, tokenizer=tokenizer)

[2277, 29937, 2933, 29901]


In [13]:
trainer = SFTTrainer(
    model=model,
    data_collator= collator,
    train_dataset=data['train'],
    eval_dataset =data['validation'],
    peft_config=config,
    dataset_text_field="Prompt_en",
    max_seq_length=822,
    tokenizer=tokenizer,
    args=training_arguments,
)

In [None]:
trainer.train(resume_from_checkpoint=False) # se entrena el modelo

Step,Training Loss,Validation Loss
900,0.9255,0.939491
1800,0.8569,0.906506
2700,0.8044,0.890115
3600,0.8039,0.881392
4500,0.7788,0.878598
5400,0.7983,0.868307
6300,0.725,0.863679
7200,0.6279,0.883404
8100,0.6763,0.879158
9000,0.6575,0.876469


In [None]:
trainer.save_model("newAdapter_128r2lr3e") # se guarda el modelo

In [None]:
model= PeftModel.from_pretrained(model,"newAdapter")

In [None]:
model.push_to_hub("EmotionalBot_LLaMA2_Adapter")

In [None]:
final=model.merge_and_unload()

In [None]:
final.push_to_hub("EmotionalBot_LLaMA2")