# Imports

In [1]:
import torch
import torch.nn as nn
import bitsandbytes as bnb
from datasets import load_dataset, Dataset
from transformers import (AutoTokenizer,
                          AutoConfig,
                          AutoModelForCausalLM,
                          BitsAndBytesConfig,
                          TrainingArguments)
import transformers
from peft import prepare_model_for_kbit_training, LoraConfig, get_peft_model
import pandas as pd
from trl import SFTTrainer
from peft.tuners.lora import LoraLayer


Welcome to bitsandbytes. For bug reports, please run

python -m bitsandbytes

 and submit this information together with your error trace to: https://github.com/TimDettmers/bitsandbytes/issues
bin /home/matheusalb/anaconda3/envs/llm/lib/python3.11/site-packages/bitsandbytes/libbitsandbytes_cuda117.so
CUDA SETUP: CUDA runtime path found: /home/matheusalb/anaconda3/envs/llm/lib/libcudart.so.11.0
CUDA SETUP: Highest compute capability among GPUs detected: 8.6
CUDA SETUP: Detected CUDA version 117
CUDA SETUP: Loading binary /home/matheusalb/anaconda3/envs/llm/lib/python3.11/site-packages/bitsandbytes/libbitsandbytes_cuda117.so...


  from .autonotebook import tqdm as notebook_tqdm


-----

# Funções

## Carregamento modelo

In [2]:
def create_and_prepare_model(model_name):
    compute_dtype = getattr(torch, "float16")
    
    bnb_config = BitsAndBytesConfig(
        load_in_4bit=True,
        bnb_4bit_quant_type="nf4",
        bnb_4bit_compute_dtype=compute_dtype,
        bnb_4bit_use_double_quant=True,
    )

    model = AutoModelForCausalLM.from_pretrained(
        model_name,
        quantization_config=bnb_config,
        device_map={"": 0},
        trust_remote_code=True,
    )
    
    peft_config = LoraConfig(
        lora_alpha=16,
        lora_dropout=0.1,
        r=64,
        bias="none",
        task_type="CAUSAL_LM",
        target_modules=[
            "query_key_value",
            "dense",
            "dense_h_to_4h",
            "dense_4h_to_h",
        ],
    )
    
    tokenizer = AutoTokenizer.from_pretrained(
        model_name,
        trust_remote_code=True
    )
    tokenizer.pad_token = tokenizer.eos_token
    
    return model, peft_config, tokenizer


## Cria dataset

In [3]:
def get_dataset(path):
    messages = {}
    messages['IDComentario'] = []
    messages['text'] = [] 
    
    # prompt da versão 1 com falcon instruct, 100 steps
    # gen_text = lambda x: f"### Human: Você é um especialista em responder comentários negativos de um cliente a um restaurante. \
    #             Sua tarefa é responder respeitosamente um comentário negativo de um cliente ao seu restaurante. \
    #             Dado o comentário do cliente entre <>, escreva em Português um comentário de resposta de forma respeitosa, \
    #             empática e não genérica, convencendo o cliente que medidas serão tomadas para resolver o seu problema e \
    #             que ele poderá voltar a fazer pedidos no restaurante. \
    #             Certifique-se de usar detalhes específicos do comentário do cliente.\n \
    #             <{x['comentario']}>\n\
    #             ### Reply: {x['resposta']}"
    gen_text = lambda x: f'''
Escreva, em Português, um comentário de resposta a ao seguinte comentário de um cliente ao seu restaurante: {x['comentario']}\n
###
{x['resposta']} 
'''               
    df_train = pd.read_csv(path)
    for i, linha in df_train.iterrows():
        text = gen_text(linha)
        messages['IDComentario'].append(linha['IDComentario'])
        messages['text'].append(text)
    

    return Dataset.from_dict(messages)

-----

# Execução

In [4]:
model_name = 'tiiuae/falcon-7b-instruct'
path_dataframe = './data/comentarios-respostas-sample.csv'
    
training_arguments = TrainingArguments(
    output_dir="./results/test_falcon_instruct_novoprompt",
    per_device_train_batch_size=2,
    gradient_accumulation_steps=4,
    optim="paged_adamw_32bit",
    save_steps=10,
    logging_steps=10,
    learning_rate=2e-4,
    fp16=True,
    max_grad_norm=0.3,
    max_steps=100, #10000,
    warmup_ratio=0.03,
    group_by_length=True,
    lr_scheduler_type="constant",
)
model, peft_config, tokenizer = create_and_prepare_model(model_name)
# se não fizer isso vai disparar warning, ativar para inferência 
model.config.use_cache = False

import time
# print('sleeping')
# time.sleep(5)
data = get_dataset(path_dataframe)
# Supervised finetunning é popularmente conhecido como instruction finetuning
trainer = SFTTrainer(
    model=model,
    train_dataset=data,
    peft_config=peft_config,
    dataset_text_field="text",
    max_seq_length=512,
    tokenizer=tokenizer,
    args=training_arguments,
    packing=False,
)


Loading checkpoint shards: 100%|██████████| 2/2 [00:22<00:00, 11.22s/it]
                                                   

In [5]:
# import os
# os.environ['WANDB_NOTEBOOK_NAME'] = 'TESTE_2'
trainer.train()

Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.


[34m[1mwandb[0m: Currently logged in as: [33mmatheusalb[0m. Use [1m`wandb login --relogin`[0m to force relogin


  0%|          | 0/100 [00:00<?, ?it/s]You're using a PreTrainedTokenizerFast tokenizer. Please note that with a fast tokenizer, using the `__call__` method is faster than using a method to encode the text followed by a call to the `pad` method to get a padded encoding.
 10%|█         | 10/100 [00:38<05:19,  3.55s/it]

{'loss': 0.9714, 'learning_rate': 0.0002, 'epoch': 6.67}


 20%|██        | 20/100 [01:20<04:47,  3.59s/it]

{'loss': 0.3967, 'learning_rate': 0.0002, 'epoch': 13.33}


 30%|███       | 30/100 [02:03<04:24,  3.77s/it]

{'loss': 0.0489, 'learning_rate': 0.0002, 'epoch': 20.0}


 40%|████      | 40/100 [02:46<03:38,  3.64s/it]

{'loss': 0.0059, 'learning_rate': 0.0002, 'epoch': 26.67}


 50%|█████     | 50/100 [03:29<03:00,  3.60s/it]

{'loss': 0.003, 'learning_rate': 0.0002, 'epoch': 33.33}


 60%|██████    | 60/100 [04:11<02:26,  3.65s/it]

{'loss': 0.0024, 'learning_rate': 0.0002, 'epoch': 40.0}


 70%|███████   | 70/100 [04:52<01:43,  3.47s/it]

{'loss': 0.0023, 'learning_rate': 0.0002, 'epoch': 46.67}


 80%|████████  | 80/100 [05:34<01:08,  3.42s/it]

{'loss': 0.0024, 'learning_rate': 0.0002, 'epoch': 53.33}


 90%|█████████ | 90/100 [06:15<00:36,  3.63s/it]

{'loss': 0.0022, 'learning_rate': 0.0002, 'epoch': 60.0}


100%|██████████| 100/100 [06:56<00:00,  3.28s/it]

{'loss': 0.0021, 'learning_rate': 0.0002, 'epoch': 66.67}


100%|██████████| 100/100 [07:02<00:00,  4.22s/it]

{'train_runtime': 426.734, 'train_samples_per_second': 1.875, 'train_steps_per_second': 0.234, 'train_loss': 0.1437367026694119, 'epoch': 66.67}





TrainOutput(global_step=100, training_loss=0.1437367026694119, metrics={'train_runtime': 426.734, 'train_samples_per_second': 1.875, 'train_steps_per_second': 0.234, 'train_loss': 0.1437367026694119, 'epoch': 66.67})