# Fine-Tuning, RAG e Prompt Engineering

Este notebook traz exemplos práticos dos conceitos apresentados na aula.

## 🧠 Fine-Tuning com Transformers (Exemplo Simplificado)

In [None]:
!pip install transformers datasets -q
from transformers import AutoModelForCausalLM, AutoTokenizer, Trainer, TrainingArguments
from datasets import load_dataset

# Carregar modelo e tokenizer
model = AutoModelForCausalLM.from_pretrained("distilgpt2")
tokenizer = AutoTokenizer.from_pretrained("distilgpt2")

# Dataset de exemplo
dataset = load_dataset("codeparrot/github-jupyter-text", split="train[:1%]")
def tokenize(example):
    return tokenizer(example['content'], truncation=True, padding='max_length', max_length=128)
tokenized_dataset = dataset.map(tokenize)

# Argumentos de treino
args = TrainingArguments(output_dir="./results", per_device_train_batch_size=2, num_train_epochs=1)

# Treinador
trainer = Trainer(model=model, args=args, train_dataset=tokenized_dataset)
# trainer.train()  # Descomente para executar o treino

## 🔍 RAG (Retrieval-Augmented Generation) com FAISS e LangChain

In [None]:
!pip install langchain faiss-cpu sentence-transformers -q
from langchain.vectorstores import FAISS
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.text_splitter import CharacterTextSplitter
from langchain.chains import RetrievalQA
from langchain.llms import OpenAI

# Dados simulados
textos = ["Python é uma linguagem de programação popular.", "Pandas é uma biblioteca de análise de dados."]
splitter = CharacterTextSplitter(chunk_size=100, chunk_overlap=0)
docs = splitter.create_documents(textos)

embeddings = HuggingFaceEmbeddings()
db = FAISS.from_documents(docs, embeddings)

# Modelo simulado (substitua por um modelo real se necessário)
# llm = OpenAI()  # Requer chave da OpenAI
# qa = RetrievalQA.from_chain_type(llm=llm, retriever=db.as_retriever())
# print(qa.run("O que é Pandas?"))

## ✍️ Prompt Engineering

In [None]:
# Prompt simples
prompt_simples = "Explique o que é HTML."

# Prompt melhorado
prompt_melhorado = (
    "Você é um professor de web design. Explique o que é HTML para um aluno iniciante, "
    "usando analogias simples, como construção civil."
)
print("Prompt Simples:\n", prompt_simples)
print("\nPrompt Melhorado:\n", prompt_melhorado)