In [None]:
!pip install transformers datasets accelerate peft bitsandbytes torch

In [None]:
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TrainingArguments, Trainer
from datasets import Dataset
from peft import get_peft_model, LoraConfig, TaskType

In [None]:
# Nome do modelo
MODEL_NAME = "tiiuae/falcon-7b"

In [None]:
# Carregar o tokenizador
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME) 

In [None]:
tokenizer.pad_token = tokenizer.eos_token # Usar o token de EOS para padding

In [None]:

# Carregar o modelo com quantiza√ß√£o para economizar mem√≥ria
model = AutoModelForCausalLM.from_pretrained(
    MODEL_NAME,
    torch_dtype=torch.float16,  # Usa menos VRAM
    device_map="auto"  # Distribui automaticamente entre CPU e GPU
)

In [None]:
# Dados de treino
data = [
    {"input": "O que √© Golang?", "output": "Golang, ou Go, √© uma linguagem de programa√ß√£o criada pelo Google em 2007, focada em desempenho, concorr√™ncia e simplicidade."},
    {"input": "Quais s√£o as principais caracter√≠sticas do Golang?", "output": "Golang √© conhecido por sua sintaxe simples, garbage collection eficiente, suporte nativo √† concorr√™ncia e compila√ß√£o r√°pida."},
    {"input": "O que s√£o goroutines em Golang?", "output": "Goroutines s√£o fun√ß√µes ou m√©todos executados de forma concorrente em Go, sendo mais leves que threads do sistema operacional."},
    {"input": "Como criar uma goroutine em Go?", "output": "Basta usar a palavra-chave 'go' antes de chamar uma fun√ß√£o, como em 'go minhaFuncao()'."},
    {"input": "O que √© um canal (channel) em Golang?", "output": "Canais s√£o estruturas de comunica√ß√£o entre goroutines, permitindo a troca segura de dados concorrentes."},
    {"input": "Qual √© a diferen√ßa entre um buffer e um canal sem buffer em Golang?", "output": "Canais sem buffer bloqueiam o envio at√© que haja um receptor, enquanto canais com buffer armazenam mensagens at√© o limite do buffer."},
    {"input": "Como declarar uma vari√°vel em Golang?", "output": "Use 'var nome tipo' ou ':=' para infer√™ncia de tipo, como 'var idade int' ou 'idade := 25'."},
    {"input": "Golang √© uma linguagem compilada ou interpretada?", "output": "Golang √© uma linguagem compilada, gerando bin√°rios execut√°veis sem necessidade de uma m√°quina virtual."},
    {"input": "O que s√£o interfaces em Golang?", "output": "Interfaces definem um conjunto de m√©todos que um tipo deve implementar, permitindo polimorfismo sem heran√ßa."},
    {"input": "Como funciona o gerenciamento de mem√≥ria em Golang?", "output": "Go possui um garbage collector que gerencia automaticamente a aloca√ß√£o e desaloca√ß√£o de mem√≥ria."},
    {"input": "O que √© um struct em Golang?", "output": "Structs s√£o tipos compostos que agrupam m√∫ltiplos campos de dados, semelhantes a classes, mas sem heran√ßa."},
    {"input": "Como definir um struct em Go?", "output": "Use a palavra-chave 'type' seguida do nome e dos campos, como 'type Pessoa struct { Nome string; Idade int }'."},
    {"input": "Go suporta orienta√ß√£o a objetos?", "output": "Go n√£o possui classes nem heran√ßa, mas suporta composi√ß√£o via structs e interfaces."},
    {"input": "Como tratar erros em Golang?", "output": "Go usa a abordagem expl√≠cita de erros, retornando valores 'error' em fun√ß√µes e verificando com 'if err != nil'."},
    {"input": "Como declarar e utilizar um array em Go?", "output": "Arrays s√£o declarados com 'var a [5]int' e t√™m tamanho fixo, sendo acessados via √≠ndices."},
    {"input": "O que s√£o slices em Golang?", "output": "Slices s√£o abstra√ß√µes flex√≠veis sobre arrays, permitindo redimensionamento din√¢mico e melhor gerenciamento de mem√≥ria."},
    {"input": "Qual a diferen√ßa entre array e slice em Go?", "output": "Arrays t√™m tamanho fixo, enquanto slices s√£o refer√™ncias a arrays e podem crescer dinamicamente."},
    {"input": "Como inicializar um map em Go?", "output": "Use 'make(map[string]int)' ou 'map[string]int{'chave': 10}' para criar um dicion√°rio de chave-valor."},
    {"input": "Go tem suporte para exce√ß√µes?", "output": "Go n√£o possui exce√ß√µes como Java ou Python, mas usa 'panic' e 'recover' para capturar falhas cr√≠ticas."},
    {"input": "Como funciona defer em Go?", "output": "O 'defer' adia a execu√ß√£o de uma fun√ß√£o at√© o final do escopo atual, √∫til para liberar recursos como arquivos."},
    {"input": "O que √© o pacote fmt em Go?", "output": "O pacote 'fmt' fornece fun√ß√µes para formata√ß√£o e impress√£o de strings, como 'fmt.Println()'."},
    {"input": "O que √© reflection em Golang?", "output": "Reflection permite inspecionar e modificar tipos e valores em tempo de execu√ß√£o, usando o pacote 'reflect'."},
    {"input": "O que √© um ponteiro em Go?", "output": "Ponteiros armazenam endere√ßos de mem√≥ria, permitindo modificar valores sem c√≥pia."},
    {"input": "Como criar um ponteiro em Go?", "output": "Use '&' para obter o endere√ßo de uma vari√°vel e '*' para acessar o valor, como 'var p *int = &x'."},
    {"input": "Go possui gen√©ricos?", "output": "Desde a vers√£o Go 1.18, a linguagem suporta gen√©ricos, permitindo fun√ß√µes e estruturas de dados flex√≠veis sem perda de tipo."},
    {"input": "Como instalar pacotes externos em Go?", "output": "Use 'go get' seguido da URL do pacote, como 'go get github.com/gorilla/mux'."},
    {"input": "Como definir uma constante em Go?", "output": "Use a palavra-chave 'const', como em 'const Pi = 3.14'."},
    {"input": "Como criar um servidor HTTP em Go?", "output": "Use o pacote 'net/http' e a fun√ß√£o 'http.ListenAndServe()' para criar um servidor web simples."},
    {"input": "Quais s√£o os comandos b√°sicos do Go Modules?", "output": "'go mod init' cria um m√≥dulo, 'go mod tidy' limpa depend√™ncias e 'go list -m all' lista os pacotes instalados."}
]


In [None]:
# Converter para Dataset Hugging Face
dataset = Dataset.from_list(data)

In [None]:
# Tokenizar e criar labels
def tokenize_function(examples):
    prompt = "Pergunta: " + examples["input"] + "\nResposta: " + examples["output"]

    # Tokenizar entrada e sa√≠da juntas
    tokens = tokenizer(prompt, truncation=True, padding="max_length", max_length=512)

    # Criar labels: r√≥tulos s√£o os mesmos input_ids, mas ignoramos o padding (-100)
    tokens["labels"] = tokens["input_ids"].copy()
    tokens["labels"] = [
        -100 if token == tokenizer.pad_token_id else token for token in tokens["labels"]
    ]

    return tokens


In [None]:
# Tokenizar o dataset
dataset = dataset.map(tokenize_function) 

In [None]:
# Configurar LoRA
lora_config = LoraConfig(
    r=8,  # Define o tamanho das matrizes auxiliares LoRA
    lora_alpha=32,  # Define a escala do ajuste LoRA
    lora_dropout=0.05,  # Adiciona dropout para evitar overfitting
    bias="none", # Remove o bias para economizar mem√≥ria
    task_type=TaskType.CAUSAL_LM  # Define o modelo como um "causal language model"
)

In [None]:
# Aplicar LoRA ao Falcon 7B
model = get_peft_model(model, lora_config)

In [None]:
# Exibir os par√¢metros trein√°veis do modelo
model.print_trainable_parameters()

In [None]:
# Configurar os hiperpar√¢metros do treinamento
training_args = TrainingArguments(
    output_dir="./falcon-7b-lora-finetuned",  # Onde salvar o modelo treinado
    per_device_train_batch_size=2,  # Usa batch pequeno para economizar VRAM
    gradient_accumulation_steps=4,  # Simula batch maior sem estourar a VRAM
    num_train_epochs=3,  # N√∫mero de √©pocas de treinamento
    learning_rate=2e-5,  # Taxa de aprendizado otimizada para LoRA (0.00002)
    logging_dir="./logs",  # Diret√≥rio de logs para an√°lise
    logging_steps=10,  # Salvar logs a cada 10 steps
    save_strategy="epoch",  # Salvar checkpoints no final de cada √©poca
    fp16=True,  # Usa FP16 para reduzir o consumo de VRAM
    push_to_hub=False,  # Se quiser salvar no Hugging Face, mude para True
    report_to="none"  # üöÄ Isso desativa o W&B corretamente!
)

In [None]:
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=dataset
)

# Iniciar o treinamento
trainer.train()

In [None]:
# Salvar modelo treinado
model.save_pretrained("./falcon-7b-lora-finetuned") # Salva o modelo
tokenizer.save_pretrained("./falcon-7b-lora-finetuned") # Salva o tokenizador

In [None]:
input_text = "O que √© Golang?"
input_ids = tokenizer(input_text, return_tensors="pt").input_ids.to("cuda") # Tokenizar e mover para GPU

In [None]:
# Gerar resposta com o modelo treinado
output = model.generate(
    input_ids, # Entrada
    attention_mask=input_ids.ne(tokenizer.pad_token_id), # Ignorar padding
    max_length=50, # Tamanho m√°ximo da resposta
    temperature=0.5, # Controla a aleatoriedade da resposta
    top_p=0.9, # Controla a diversidade da resposta
    repetition_penalty=1.2,  # Penaliza palavras repetidas
    do_sample=True # Habilita a amostragem
)

generated_text = tokenizer.decode(output[0], skip_special_tokens=True) # Decodifica e remove tokens especiais

print("\nüîπ Resposta Gerada:\n", generated_text)