In [1]:
!pip install -U git+https://github.com/lvwerra/trl.git
!pip install -q -U datasets bitsandbytes einops wandb torch
!pip install -U git+https://github.com/huggingface/huggingface_hub
# peft es una libreria para calcular la eficiencia de la aceleración de un modelo
#!pio install -U tokenizers==0.13.3
!pip install -U transformers
!pip install -U git+https://github.com/huggingface/peft.git
# transformers es una libreria para entrenar y usar modelos de NLP
#!pip install -U git+https://github.com/huggingface/transformers

# sentencepiece es una libreria para tokenizar texto en subpalabras
!pip install -U seaborn
# accelerate es una libreria de huggingface para acelerar el entrenamiento de modelos de NLP en GPU y TPU
!pip install -U accelerate
!pip install -U evaluate
!pip install -U bitsandbytes

Collecting git+https://github.com/lvwerra/trl.git
  Cloning https://github.com/lvwerra/trl.git to /tmp/pip-req-build-y9zf5snn
  Running command git clone --filter=blob:none --quiet https://github.com/lvwerra/trl.git /tmp/pip-req-build-y9zf5snn
  Resolved https://github.com/lvwerra/trl.git to commit 9f6326e65ad308370d120b0998d621eb57124076
  Installing build dependencies ... [?25ldone
[?25h  Getting requirements to build wheel ... [?25ldone
[?25h  Preparing metadata (pyproject.toml) ... [?25ldone
[0mCollecting git+https://github.com/huggingface/huggingface_hub
  Cloning https://github.com/huggingface/huggingface_hub to /tmp/pip-req-build-by40wp9j
  Running command git clone --filter=blob:none --quiet https://github.com/huggingface/huggingface_hub /tmp/pip-req-build-by40wp9j
  Resolved https://github.com/huggingface/huggingface_hub to commit 18e7cf3ee63e65e6303f81d2721ca3655e2b4c94
  Installing build dependencies ... [?25ldone
[?25h  Getting requirements to build wheel ... [?25l

In [1]:
import transformers # transformers es de hugingface
from transformers import (
    TrainingArguments, 
    EarlyStoppingCallback, 
    IntervalStrategy, 
    LlamaTokenizer, 
    LlamaForCausalLM, 
    AutoModelForCausalLM, 
    AutoTokenizer, 
    BitsAndBytesConfig # LlamaTokenizer y LlamaForCausalLM son clases de transformers
)
import os # os es una libreria para interactuar con el sistema operativo
import sys # sys es una libreria para interactuar con el sistema operativo
import wandb
from peft import ( # peft es de hugingface
    LoraConfig, # LoraConfig es una clase de peft que contiene la configuración de Lora, Lora es un modelo de NLP que usa transformers y llama como tokenizer
    get_peft_model, # get_peft_model es una función de peft que obtiene el modelo de Lora
    get_peft_model_state_dict, # get_peft_model_state_dict es una función de peft que obtiene el estado del modelo de Lora
    prepare_model_for_kbit_training, # prepare_model_for_int8_training es una función de peft que prepara el modelo de Lora para el entrenamiento de int8
    PeftModel
)
from trl import SFTTrainer, DataCollatorForCompletionOnlyLM
import torch # torch es una libreria para entrenar y usar modelos de NLP
import datasets  # datasets es una libreria para cargar y procesar conjuntos de datos de NLP
import pandas as pd # pandas es una libreria para análisis de datos
from huggingface_hub import login # huggingface_hub es de hugingface
import pandas as pd # pandas es una libreria para análisis de datos
import wandb

In [2]:
access_token = "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"
login(token=access_token)

Token will not been saved to git credential helper. Pass `add_to_git_credential=True` if you want to set the git credential as well.
Token is valid (permission: write).
Your token has been saved to /root/.cache/huggingface/token
Login successful


In [3]:
parameters="7b-chat"
BASE_MODEL = f"meta-llama/Llama-2-{parameters}-hf" # modelo base de llama de 7B de parámetros
# if there is a pretrained model, load it the model is Models_of_Llama/Llama_base
myModel= "BrunoGR/EmotionalBot_LLaMA2"
model = AutoModelForCausalLM.from_pretrained(
    myModel,
    torch_dtype=torch.float16,
    #quantization_config=bnb_config,
    #load_in_8bit=True,
    device_map="auto"
)
model.tie_weights()
model.config.use_cache = False
model.config.pretraining_tp = 1
tokenizer =   LlamaTokenizer.from_pretrained(BASE_MODEL)
tokenizer.pad_token = tokenizer.eos_token

Loading checkpoint shards:   0%|          | 0/2 [00:00<?, ?it/s]

In [4]:
data= datasets.load_dataset("BrunoGR/emotional_response_spanish_dataset", cache_dir="datasets")
aux = pd.DataFrame(data['train'])
data['train']= datasets.Dataset.from_pandas(aux.sample(frac = 1))
data['train']=data['train'].remove_columns('__index_level_0__')

In [5]:
LoRA_TARGET_MODULES = [ # Esta lista especifica los módulos del modelo de lenguaje original que se adaptarán mediante la técnica LoRA
    "q_proj", # q_proj es la proyección de consulta
    "v_proj", # v_proj es la proyección de valor
]

LoRA_DROPOUT= 0.001
config = LoraConfig( # se configura el modelo de llama
    r=64, # indica el número de factores o dimensiones principales utilizados en la descomposición de las matrices de peso del modelo de lenguaje original.
    lora_alpha=64,
    target_modules=LoRA_TARGET_MODULES,
    lora_dropout=LoRA_DROPOUT,
    bias="none",
    task_type="CAUSAL_LM",
)
#pftmdl = get_peft_model(model, config) # se obtiene el modelo de llama
#pftmdl.print_trainable_parameters() # se muestran los parámetros entrenables del modelo

In [7]:
BATCH_SIZE = 9 # tamaño del batch, es decir, cuantos textos se procesan a la vez
MICRO_BATCH_SIZE = 3# tamaño del micro batch, es decir, cuantos textos se procesan a la vez en la GPU
GRADIENT_ACCUMULATION_STEPS = BATCH_SIZE // MICRO_BATCH_SIZE # pasos de acumulación de gradientes
training_arguments = transformers.TrainingArguments( # se configuran los argumentos de entrenamiento
    per_device_train_batch_size=MICRO_BATCH_SIZE, # tamaño del micro batch
    gradient_accumulation_steps=GRADIENT_ACCUMULATION_STEPS, # pasos de acumulación de gradientes
    warmup_steps=300, # pasos de calentamiento del entrenamiento
    num_train_epochs = 3, # epocas de entrenamiento que son 300
    learning_rate=5e-6, # tasa de aprendizaje
    adam_beta1=0.5, # betas de adam, se usa el mismo del paper de llama
    adam_beta2=0.5, # se usa el mismo del paper de llama
    adam_epsilon=2e-8, # se usa el mismo del paper de llama
    weight_decay=0.09,
    fp16=True, # se usa la precisión de 16 bits
    logging_steps=10, # pasos de logging
    optim="adamw_torch", # optimizador adamw, se usa el de torch
    evaluation_strategy="steps", # estrategia de evaluación
    save_strategy="steps", # estrategia de guardado
    eval_steps=300, # cada 50 pasos se evalúa el modelo
    save_steps=300, # cada 50 pasos se guarda el modelo
    output_dir="checkpoint-2nd-bs3n1_r64LA64_1", # directorio de salida
    save_total_limit=6, # límite de guardado3
    load_best_model_at_end=True, #se guarda el mejor modelo al final
    report_to="wandb", # se reporta a tensorboard
    seed=1,
    lr_scheduler_type = "cosine",# tal y como dice en el paper de llama
    max_grad_norm = 1.0, # tal y como dice en el paper de llama
)

In [8]:
os.environ['WANDB_API_KEY'] = '4568bca12d8724d7cd88b0902226349c1d621364'

In [9]:
wandb.init(project="Emo_withLLaMA2", name="emo_FineTune-2nd-bs3n1_r64LA64_2")

[34m[1mwandb[0m: Currently logged in as: [33mbruno-gil[0m ([33memo_com[0m). Use [1m`wandb login --relogin`[0m to force relogin


In [10]:
response_template_with_context = "\n### response:"
instruction_template="instruction:"
response_template_ids = tokenizer.encode(response_template_with_context, add_special_tokens=False)[2:]  # Now we have it like in the dataset texts: `[2277, 29937, 4007, 22137, 29901]`
print(response_template_ids)
collator = DataCollatorForCompletionOnlyLM(response_template_ids,instruction_template, tokenizer=tokenizer)

[2277, 29937, 2933, 29901]


In [11]:
trainer = SFTTrainer(
    model=model,
    data_collator= collator,
    train_dataset=data['train'],
    eval_dataset =data['validation'],
    peft_config=config,
    dataset_text_field="Prompt_en",
    max_seq_length=823,
    tokenizer=tokenizer,
    args=training_arguments,
    callbacks = [EarlyStoppingCallback(early_stopping_patience=2)]
)

Map:   0%|          | 0/9900 [00:00<?, ? examples/s]

In [12]:
trainer.train(resume_from_checkpoint=False) # se entrena el modelo

Step,Training Loss,Validation Loss
300,0.7299,0.867383
600,0.7463,0.867877
900,0.7241,0.867881


TrainOutput(global_step=900, training_loss=0.7182766368654039, metrics={'train_runtime': 640.5263, 'train_samples_per_second': 46.368, 'train_steps_per_second': 5.152, 'total_flos': 8.0131426725077e+16, 'train_loss': 0.7182766368654039, 'epoch': 0.82})

In [None]:
trainer.save_model("newAdapter-2nd-bs3n1_r64LA64") # se guarda el modelo
model.push_to_hub("EmotionalBot_LLaMA2_Adapter_2nd-bs3n1_r64LA64")

pytorch_model-00001-of-00002.bin:   0%|          | 0.00/9.99G [00:00<?, ?B/s]

Upload 2 LFS files:   0%|          | 0/2 [00:00<?, ?it/s]

pytorch_model-00002-of-00002.bin:   0%|          | 0.00/3.62G [00:00<?, ?B/s]

In [25]:
model= PeftModel.from_pretrained(model,"newAdapter")
final=model.merge_and_unload()

In [28]:
#final.push_to_hub("EmotionalBot_LLaMA2")

pytorch_model-00001-of-00002.bin:   0%|          | 0.00/9.98G [00:00<?, ?B/s]

Upload 2 LFS files:   0%|          | 0/2 [00:00<?, ?it/s]

pytorch_model-00002-of-00002.bin:   0%|          | 0.00/3.50G [00:00<?, ?B/s]

CommitInfo(commit_url='https://huggingface.co/BrunoGR/EmotionalBot_LLaMA2/commit/da2d66fe1d045398167ca7f6f2cc31e48435be0a', commit_message='Upload LlamaForCausalLM', commit_description='', oid='da2d66fe1d045398167ca7f6f2cc31e48435be0a', pr_url=None, pr_revision=None, pr_num=None)