# 1. Configuração Gdrive e Instalação de Bibliotecas Necessárias

In [None]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [None]:
!pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git" # Unsloth - biblioteca otimizada para treinar modelos de linguagem grandes (LLMs) de forma mais rápida e eficiente
!pip install triton # triton - compilador da NVIDIA que otimiza operações de deep learning, acelerando o treino de modelos LLM.
!pip install --no-deps xformers "trl<0.9.0" peft accelerate bitsandbytes # Fine-tuning com LoRA, quantização e otimização de modelos
!pip install transformers datasets # Biblioteca da Hugging Face para carregar e treinar modelos como LLaMA, GPT e outros.

Collecting unsloth@ git+https://github.com/unslothai/unsloth.git (from unsloth[colab-new]@ git+https://github.com/unslothai/unsloth.git)
  Cloning https://github.com/unslothai/unsloth.git to /tmp/pip-install-n94b57ia/unsloth_e3660101cfc74ffeaa61fbedc6abb8b8
  Running command git clone --filter=blob:none --quiet https://github.com/unslothai/unsloth.git /tmp/pip-install-n94b57ia/unsloth_e3660101cfc74ffeaa61fbedc6abb8b8
  Resolved https://github.com/unslothai/unsloth.git to commit 2b5d81d75281c02480927cf3ca0dea7c8e98d484
  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone


In [None]:
!pip install --upgrade --force-reinstall torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 # Biblioteca principal do PyTorch para deep learning
import torch
from unsloth import FastLanguageModel, is_bfloat16_supported # Método otimizado para carregar e treinar modelos LLMs de forma eficiente com Unsloth.

Looking in indexes: https://download.pytorch.org/whl/cu118
Collecting torch
  Using cached https://download.pytorch.org/whl/cu118/torch-2.6.0%2Bcu118-cp311-cp311-linux_x86_64.whl.metadata (27 kB)
Collecting torchvision
  Using cached https://download.pytorch.org/whl/cu118/torchvision-0.21.0%2Bcu118-cp311-cp311-linux_x86_64.whl.metadata (6.1 kB)
Collecting torchaudio
  Using cached https://download.pytorch.org/whl/cu118/torchaudio-2.6.0%2Bcu118-cp311-cp311-linux_x86_64.whl.metadata (6.6 kB)
Collecting filelock (from torch)
  Using cached https://download.pytorch.org/whl/filelock-3.13.1-py3-none-any.whl.metadata (2.8 kB)
Collecting typing-extensions>=4.10.0 (from torch)
  Using cached https://download.pytorch.org/whl/typing_extensions-4.12.2-py3-none-any.whl.metadata (3.0 kB)
Collecting networkx (from torch)
  Using cached https://download.pytorch.org/whl/networkx-3.3-py3-none-any.whl.metadata (5.1 kB)
Collecting jinja2 (from torch)
  Using cached https://download.pytorch.org/whl/Jinja2-

🦥 Unsloth: Will patch your computer to enable 2x faster free finetuning.
🦥 Unsloth Zoo will now patch everything to make training faster!


# 2. Importação de Bibliotecas Essenciais

**Resumo:**

> Importando bibliotecas essenciais para processamento de dados e fine-tuning de um modelo de linguagem (LLM)

In [None]:
import json # Permite carregar e manipular arquivos JSON, que geralmente contêm dados estruturados.
import pandas as pd # Pandas é uma biblioteca para manipulação e análise de dados tabulares
from datasets import load_dataset #Permite carregar conjuntos de dados da Hugging Face ou arquivos locais.
from trl import SFTTrainer # classe usada para treinamento supervisionado de LLMs
from transformers import TrainingArguments # define parâmetros do treinamento
from transformers import pipeline # Fornece uma interface simples para usar modelos treinados

# 3. Configurações Gerais

**Resumo**
> Define configurações para carregar e treinar um modelo de linguagem (LLM)

In [None]:
max_seq_length = 512 # Define o comprimento máximo de sequência que o modelo pode processar
dtype = None # significa que o tipo será definido automaticamente com base na configuração do hardware
load_in_4bit = True # Ativa a quantização em 4 bits, reduzindo o uso de memória do modelo

# 4. Lista de Modelos Compatíveis com Unsloth e Quantização em 4 bits

**Resumo**
> Define uma lista de modelos de linguagem compatíveis com Unsloth.

> Inclui Mistral, LLaMA-3, Phi-3 e Gemma, otimizados para 4-bit (uso reduzido de VRAM).

> Pode ser usada para escolher dinamicamente um modelo para inferência ou fine-tuning

In [None]:
# define uma lista de modelos de linguagem compatíveis com Unsloth e quantização em 4 bits
fourbit_models = [
    "unsloth/mistral-7b-v0.3-bnb-4bit",
    "unsloth/mistral-7b-instruct-v0.3-bnb-4bit",
    "unsloth/llama-3-8b-bnb-4bit",
    "unsloth/llama-3-8b-Instruct-bnb-4bit",
    "unsloth/llama-3-70b-bnb-4bit",
    "unsloth/Meta-Llama-3.1-70B",
    "unsloth/Phi-3-mini-4k-instruct",
    "unsloth/Phi-3-medium-4k-instruct",
    "unsloth/mistral-7b-bnb-4bit",
    "unsloth/gemma-7b-bnb-4bit",
]

# 5. Função para Formatar o Dataset

**Resumo:**

> Essa função prepara os dados para serem utilizados em um modelo de linguagem, garantindo que eles estejam no formato adequado para tarefas de geração de texto, como a criação de descrições de produtos.

> Ela estrutura os dados de forma que o modelo possa entender claramente o que é uma instrução, o que é a entrada (título) e o que é a saída esperada (descrição).

In [None]:
def format_dataset_into_model_input(data):
    # Inicializando as listas para armazenar os dados
    instructions = []
    inputs = []
    outputs = []

    # Extraindo o título e a descrição
    for example in data:
        title = example['title']
        content = example['content']
        instruction = "Generate a persuasive product description that highlights key features, benefits, and unique selling points in an engaging and clear manner."

        instructions.append(instruction)
        inputs.append(title)
        outputs.append(content)

    # Criando o dicionário com os dados formatados
    formatted_data = {
        "instruction": instructions,
        "input": inputs,
        "output": outputs
    }

### Salvando os Dados Formatados em um Arquivo JSON

In [None]:
formatted_json_path = "/content/drive/MyDrive/FIAP/amazon_file_formatted.json"
with open(formatted_json_path, 'w') as output_file:
    json.dump(formatted_data, output_file, indent=4)

print(f"Dataset formatado salvo em: {formatted_json_path}")

return formatted_json_path

### Carregamento do Dataset Original

In [None]:
DATA_PATH = '/content/drive/MyDrive/FIAP/trn.json' # Caminho contendo o dataset original
dataset = load_dataset("json", data_files=DATA_PATH) # Usa a função load_dataset() da biblioteca Hugging Face Datasets para carregar os dados do arquivo JSON.
OUTPUT_PATH_DATASET = format_dataset_into_model_input(dataset['train'] if 'train' in dataset else dataset) # Verifica se o dataset tem uma divisão "train", formata os dados para fine-tuning e salva os dados formatados em um novo arquivo JSON.

Dataset formatado salvo em: /content/drive/MyDrive/FIAP/amazon_file_formatted.json


# 6. Carregando e Preparando o Modelo Pré-treinado

**Resumo**
> Carrega o modelo Mistral 7B quantizado em 4 bits para otimizar desempenho e memória.

> Utiliza a biblioteca Unsloth, que melhora a eficiência do modelo na GPU.

> Retorna o modelo e o tokenizer, permitindo inferência ou treinamento.







In [None]:
model, tokenizer = FastLanguageModel.from_pretrained(
    model_name = "unsloth/mistral-7b-v0.3-bnb-4bit",
    max_seq_length = max_seq_length,
    dtype = dtype,
    load_in_4bit = load_in_4bit
)

==((====))==  Unsloth 2025.3.9: Fast Mistral patching. Transformers: 4.48.3.
   \\   /|    Tesla T4. Num GPUs = 1. Max memory: 14.741 GB. Platform: Linux.
O^O/ \_/ \    Torch: 2.6.0+cu118. CUDA: 7.5. CUDA Toolkit: 11.8. Triton: 3.2.0
\        /    Bfloat16 = FALSE. FA [Xformers = 0.0.29.post3. FA2 = False]
 "-____-"     Free license: http://github.com/unslothai/unsloth
Unsloth: Fast downloading is enabled - ignore downloading bars which are red colored!


# 7. Preparando o Modelo para Inferência

**Resumo**


> A inferência serve para gerar resultados a partir de um modelo treinado, como respostas, predições ou textos baseados em um prompt de entrada.

> A função for_inference(model) prepara o modelo para esse processo, garantindo que ele seja executado da forma mais eficiente possível.

> Isso é especialmente útil em aplicações de chatbots, assistentes virtuais, geração de conteúdo e análise de texto em tempo real.

In [None]:
# Preparando o Modelo para inferência, otimizando a sua performance para fazer previsões
FastLanguageModel.for_inference(model)

MistralForCausalLM(
  (model): MistralModel(
    (embed_tokens): Embedding(32768, 4096, padding_idx=770)
    (layers): ModuleList(
      (0-31): 32 x MistralDecoderLayer(
        (self_attn): MistralAttention(
          (q_proj): Linear4bit(in_features=4096, out_features=4096, bias=False)
          (k_proj): Linear4bit(in_features=4096, out_features=1024, bias=False)
          (v_proj): Linear4bit(in_features=4096, out_features=1024, bias=False)
          (o_proj): Linear4bit(in_features=4096, out_features=4096, bias=False)
          (rotary_emb): LlamaRotaryEmbedding()
        )
        (mlp): MistralMLP(
          (gate_proj): Linear4bit(in_features=4096, out_features=14336, bias=False)
          (up_proj): Linear4bit(in_features=4096, out_features=14336, bias=False)
          (down_proj): Linear4bit(in_features=14336, out_features=4096, bias=False)
          (act_fn): SiLU()
        )
        (input_layernorm): MistralRMSNorm((4096,), eps=1e-05)
        (post_attention_layernorm): M

# 8. Função para Gerar Descrição de Produtos

**Resumo**

> Criação de um prompt de entrada específico para gerar descrições.

> Tokenização e movimento para GPU para otimizar a execução.

> Geração de texto e decodificação da resposta para obter uma descrição legível.

In [None]:
def generate_description(title):
    input_text = f"Generate a persuasive product description that highlights key features, benefits, and unique selling points in an engaging and clear manner.\nTítulo: {title}\nDescrição:"
    inputs = tokenizer(input_text, return_tensors="pt").to("cuda")
    outputs = model.generate(**inputs, max_new_tokens=128)
    description = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return description

# 9. Exemplo de Uso do Modelo

**Resumo:**

> O código passa o título de um produto ("Paulo Coelho: Confessions of a Pilgrim") para a função generate_description(), que gera uma descrição persuasiva e detalhada do produto.

> O título e a descrição gerada são então impressos no console.

In [None]:
title = "Paulo Coelho: Confessions of a Pilgrim"
description = generate_description(title)
print(f"Título: {title}\nDescrição: {description}")

Título: Paulo Coelho: Confessions of a Pilgrim
Descrição: Generate a persuasive product description that highlights key features, benefits, and unique selling points in an engaging and clear manner.
Título: Paulo Coelho: Confessions of a Pilgrim
Descrição: Paulo Coelho: Confessions of a Pilgrim is a captivating memoir that chronicles the author's journey on the Camino de Santiago, a pilgrimage route in Spain. The book is a testament to the power of self-discovery and the transformative nature of travel.

In this memoir, Paulo Coelho recounts his experiences on the Camino de Santiago, a pilgrimage route in Spain that has been traveled by millions of people over the centuries. The book is a testament to the power of self-discovery and the transformative nature of travel.


In [None]:
title = "Paulo Coelho: A Warrior's Life: The Authorized Biography"
description = generate_description(title)
print(f"Título: {title}\nDescrição: {description}")

Título: Paulo Coelho: A Warrior's Life: The Authorized Biography
Descrição: Generate a persuasive product description that highlights key features, benefits, and unique selling points in an engaging and clear manner.
Título: Paulo Coelho: A Warrior's Life: The Authorized Biography
Descrição: Paulo Coelho is one of the most influential and beloved authors of our time. His books have been translated into over 80 languages and have sold over 100 million copies worldwide. His work has been adapted into films, plays, and musicals, and his influence can be seen in the work of many other writers and artists.

In this authorized biography, we get a glimpse into the life of Paulo Coelho, from his early years in Brazil to his rise to fame as a bestselling author. We learn about his struggles and triumphs, his passions and his inspirations. We see how


# 10. Aplicando a Técnica LoRA

**Resumo:**


> Este código aplica ajustes finos (fine-tuning) no modelo de linguagem usando a técnica LoRA.

> Ele ajusta de forma eficiente módulos específicos do modelo relacionados à atenção, sem a necessidade de treinar o modelo inteiro.

> Os parâmetros configurados visam otimizar a capacidade de ajuste (com r e lora_alpha), evitar overfitting (com lora_dropout), e permitir um treinamento mais eficiente (com gradient_checkpointing).

> Esses ajustes finos permitem adaptar o modelo para tarefas específicas, utilizando menos recursos computacionais e evitando o treinamento completo do modelo.

In [None]:
# Ajustes finos do LoRA
model = FastLanguageModel.get_peft_model(
    model,
    r=32,  # Aumentado para melhorar a capacidade de ajuste
    target_modules=["q_proj", "k_proj", "v_proj", "o_proj", "gate_proj", "up_proj", "down_proj"],
    lora_alpha=32,  # Aumentado para ajustar melhor os parâmetros
    lora_dropout=0.1,  # Introduzido dropout para evitar overfitting
    bias="none", # Não utiliza viés durante o ajuste
    use_gradient_checkpointing="unsloth",
    random_state=3407, # Estado aleatório para reprodutibilidade
    use_rslora=False, # Não usa RSLora (uma variante do LoRA)
    loftq_config=None, # Configuração específica de loftq não usada
)

Unsloth: Dropout = 0 is supported for fast patching. You are using dropout = 0.1.
Unsloth will patch all other layers, except LoRA matrices, causing a performance hit.
Unsloth 2025.3.9 patched 32 layers with 0 QKV layers, 0 O layers and 0 MLP layers.


# 11. Preparando o Prompt para Descrição de Produtos

**Resumo:**

> O código define um template de prompt estruturado para gerar descrições de produtos. Ele inclui uma instrução sobre o que o modelo deve fazer, um título do produto e um campo para a descrição gerada.

> A variável EOS_TOKEN armazena o token de fim de sequência do modelo, utilizado para finalizar a geração de texto.

> Esse tipo de template ajuda a garantir que o modelo entenda o contexto e a tarefa a ser realizada de maneira mais clara e estruturada.

In [None]:
# Prompt para a descrição dos Produtos
new_prompt = """Here is a task description, along with a title that offers more context. Please write a response that effectively completes the description.

### Instrução:
{}

### Título:
{}

### Descrição:
{}"""

EOS_TOKEN = tokenizer.eos_token

In [None]:
# Função para formatar o Prompt
def formatting_prompts_func(data):
    instructions = data["instruction"]
    inputs = data["input"]
    outputs = data["output"]

    texts = []

    for instruction, input_text, output in zip(instructions, inputs, outputs):
        text = new_prompt.format(instruction, input_text, output) + EOS_TOKEN
        texts.append(text)

    return {"text": texts}

**Resumo:**

> A função **formatting_prompts_func** formata os dados extraídos de data e os organiza em prompts estruturados que podem ser utilizados para treinar ou gerar respostas com um modelo de linguagem.




In [None]:
# Carregando e Formatando o Dataset
dataset = load_dataset("json", data_files=OUTPUT_PATH_DATASET)

print(dataset)
print(dataset['train'].column_names)

Generating train split: 0 examples [00:00, ? examples/s]

DatasetDict({
    train: Dataset({
        features: ['instruction', 'input', 'output'],
        num_rows: 2248619
    })
})
['instruction', 'input', 'output']


**Resumo:**

> O código carrega um dataset de um arquivo JSON localizado em OUTPUT_PATH_DATASET.

> Em seguida, ele imprime o dataset carregado (mostrando suas divisões e informações) e os nomes das colunas da parte train desse dataset. Isso ajuda a verificar a estrutura dos dados e as colunas presentes no conjunto de treinamento.

In [None]:
# Verificar uma amostra
print(dataset['train'][0])  # Verifique uma amostra do dataset

{'instruction': 'Generate a persuasive product description that highlights key features, benefits, and unique selling points in an engaging and clear manner.', 'input': 'Girls Ballet Tutu Neon Pink', 'output': 'High quality 3 layer ballet tutu. 12 inches in length'}


In [None]:
# Formatando os dados
formatted_dataset = dataset['train'].map(formatting_prompts_func, batched=True)

Map:   0%|          | 0/2248619 [00:00<?, ? examples/s]

In [None]:
# dataset resultante após a aplicação da função de formatação
formatted_dataset

Dataset({
    features: ['instruction', 'input', 'output', 'text'],
    num_rows: 2248619
})

In [None]:
dataset['train'][0]

{'instruction': 'Generate a persuasive product description that highlights key features, benefits, and unique selling points in an engaging and clear manner.',
 'input': 'Girls Ballet Tutu Neon Pink',
 'output': 'High quality 3 layer ballet tutu. 12 inches in length'}

# 12. Treinamento do Modelo

In [None]:
trainer = SFTTrainer(
    model=model,
    tokenizer=tokenizer,
    train_dataset=formatted_dataset,
    dataset_text_field="text",
    max_seq_length=max_seq_length,
    dataset_num_proc=2,
    packing=False,
    args=TrainingArguments(
        per_device_train_batch_size=2,
        gradient_accumulation_steps=4,
        warmup_steps=100,  # Aumento dos warmup steps para melhorar a estabilidade do treinamento
        max_steps=60,  # Aumento no número de passos de treinamento
        learning_rate=1e-4,  # Taxa de aprendizado ajustada para um ajuste mais refinado
        fp16=not is_bfloat16_supported(),
        bf16=is_bfloat16_supported(),
        logging_steps=10,  # Log mais frequente para monitorar o treinamento
        optim="adamw_8bit",
        weight_decay=0.01,
        lr_scheduler_type="linear",
        seed=3407,
        output_dir="outputs",
    ),
)

Map (num_proc=2):   0%|          | 0/2248619 [00:00<?, ? examples/s]

In [None]:
# Iniciando o processo de treinamento do modelo
trainer_stats = trainer.train()

==((====))==  Unsloth - 2x faster free finetuning | Num GPUs used = 1
   \\   /|    Num examples = 2,248,619 | Num Epochs = 1 | Total steps = 60
O^O/ \_/ \    Batch size per device = 2 | Gradient accumulation steps = 4
\        /    Data Parallel GPUs = 1 | Total batch size (2 x 4 x 1) = 8
 "-____-"     Trainable parameters = 83,886,080/3,842,248,704 (2.18% trained)
[34m[1mwandb[0m: Using wandb-core as the SDK backend.  Please refer to https://wandb.me/wandb-core for more information.
[34m[1mwandb[0m: Currently logged in as: [33mbrunogamarj[0m ([33mbrunogamarj-yduqs[0m) to [32mhttps://api.wandb.ai[0m. Use [1m`wandb login --relogin`[0m to force relogin


Unsloth: Will smartly offload gradients to save VRAM!


Step,Training Loss
10,2.3721
20,1.9206
30,1.4088
40,1.3354
50,1.401
60,1.2872


### Salvando o Modelo Ajustado

In [None]:
# Salvar o modelo ajustado (GDRIVE)
model.save_pretrained("/content/drive/MyDrive/FIAP/lora_model")
tokenizer.save_pretrained("/content/drive/MyDrive/FIAP/lora_model")

('/content/drive/MyDrive/FIAP/lora_model/tokenizer_config.json',
 '/content/drive/MyDrive/FIAP/lora_model/special_tokens_map.json',
 '/content/drive/MyDrive/FIAP/lora_model/tokenizer.model',
 '/content/drive/MyDrive/FIAP/lora_model/added_tokens.json',
 '/content/drive/MyDrive/FIAP/lora_model/tokenizer.json')

### Carregando o Modelo Salvo

In [None]:
model_path = "/content/drive/MyDrive/FIAP/lora_model" # Caminho para o modelo salvo
model, tokenizer = FastLanguageModel.from_pretrained(model_path) # Carregar o modelo e o tokenizer
FastLanguageModel.for_inference(model) # Preparar o modelo para inferência

==((====))==  Unsloth 2025.3.9: Fast Mistral patching. Transformers: 4.48.3.
   \\   /|    Tesla T4. Num GPUs = 1. Max memory: 14.741 GB. Platform: Linux.
O^O/ \_/ \    Torch: 2.6.0+cu118. CUDA: 7.5. CUDA Toolkit: 11.8. Triton: 3.2.0
\        /    Bfloat16 = FALSE. FA [Xformers = 0.0.29.post3. FA2 = False]
 "-____-"     Free license: http://github.com/unslothai/unsloth
Unsloth: Fast downloading is enabled - ignore downloading bars which are red colored!


Unsloth: Will load /content/drive/MyDrive/FIAP/lora_model as a legacy tokenizer.


PeftModelForCausalLM(
  (base_model): LoraModel(
    (model): MistralForCausalLM(
      (model): MistralModel(
        (embed_tokens): Embedding(32768, 4096, padding_idx=770)
        (layers): ModuleList(
          (0-31): 32 x MistralDecoderLayer(
            (self_attn): MistralAttention(
              (q_proj): lora.Linear4bit(
                (base_layer): Linear4bit(in_features=4096, out_features=4096, bias=False)
                (lora_dropout): ModuleDict(
                  (default): Dropout(p=0.1, inplace=False)
                )
                (lora_A): ModuleDict(
                  (default): Linear(in_features=4096, out_features=32, bias=False)
                )
                (lora_B): ModuleDict(
                  (default): Linear(in_features=32, out_features=4096, bias=False)
                )
                (lora_embedding_A): ParameterDict()
                (lora_embedding_B): ParameterDict()
                (lora_magnitude_vector): ModuleDict()
              )
    

# Executando o Modelo

In [None]:
# Verificando a resposta
title = "Paulo Coelho: Confessions of a Pilgrim"
description = generate_description(title)
print(f"Título: {title}\nDescrição: {description}")

Título: Paulo Coelho: Confessions of a Pilgrim
Descrição: Generate a persuasive product description that highlights key features, benefits, and unique selling points in an engaging and clear manner.
Título: Paulo Coelho: Confessions of a Pilgrim
Descrição: Paulo Coelho is one of the most widely read and best-loved authors in the world. His books, including The Alchemist, have sold more than 100 million copies worldwide. The Brazilian-born author has been a member of the Brazilian Academy of Letters since 2002, and in 2007 he was appointed a UNESCO Goodwill Ambassador. He is the recipient of numerous international honors, including the Chevalier of the Order of Arts and Letters of the French Republic, the Legion of Honor of the Italian Republic, and the Hans Christian


In [None]:
# Verificando a resposta
title = "Paulo Coelho: A Warrior's Life: The Authorized Biography"
description = generate_description(title)
print(f"Título: {title}\nDescrição: {description}")

Título: Paulo Coelho: A Warrior's Life: The Authorized Biography
Descrição: Generate a persuasive product description that highlights key features, benefits, and unique selling points in an engaging and clear manner.
Título: Paulo Coelho: A Warrior's Life: The Authorized Biography
Descrição: Paulo Coelho is one of the most widely read and best-loved authors in the world. His books, including The Alchemist, have sold more than 100 million copies and have been translated into 80 languages. His work is known for its wisdom and spirituality, as well as its best-selling appeal. In this authorized biography, Coelho's life is told in his own words, with never-before-seen photographs and exclusive interviews with his family, friends, and colleagues.

## Product Description

Paulo Coelho is one of the most widely read and
