# üöÄ **Setup Inicial - Curso de Fine Tuning**

## **Preparando o Terreno para Treinar IAs**

---

### **T√°, mas o que √© este setup?**

Imagine que voc√™ vai cozinhar um prato especial. Antes de come√ßar, voc√™ precisa:
- ‚úÖ Ter todos os ingredientes
- ‚úÖ Preparar a cozinha
- ‚úÖ Verificar se o fog√£o funciona
- ‚úÖ Ter as ferramentas certas

**Fine Tuning √© a mesma coisa!** Precisamos preparar o "ambiente de cozinha" antes de come√ßar a "cozinhar" nossos modelos.

**Por que este setup √© importante?**

Fine Tuning √© como treinar um atleta de alto n√≠vel. Voc√™ precisa de:
- **GPU** (como uma academia de ponta)
- **Bibliotecas certas** (como equipamentos de qualidade)
- **Configura√ß√µes adequadas** (como um plano de treino)

---

**üñºÔ∏è Sugest√£o de imagem**: Cozinheiro preparando ingredientes e ferramentas

### **Setup Inicial - Preparando o Terreno**

## **1. Verificando se estamos no Colab**

Primeiro, vamos garantir que estamos no ambiente certo:

In [None]:
# Verificando se estamos no Google Colab
try:
    import google.colab
    print("‚úÖ Estamos no Google Colab!")
    IN_COLAB = True
except ImportError:
    print("‚ö†Ô∏è  N√£o estamos no Google Colab. Algumas funcionalidades podem n√£o funcionar.")
    IN_COLAB = False

## **2. Instalando as Depend√™ncias**

Agora vamos instalar todas as bibliotecas que precisamos:

In [None]:
# Instalando as depend√™ncias principais
print("üîß Instalando depend√™ncias...")

!pip install torch>=2.0.0 transformers>=4.30.0 datasets>=2.12.0
!pip install accelerate>=0.20.0 peft>=0.4.0 bitsandbytes>=0.41.0 trl>=0.7.0
!pip install langchain>=0.1.0 langchain-community>=0.0.10 langchain-core>=0.1.0
!pip install huggingface_hub>=0.19.0 python-dotenv>=1.0.0
!pip install numpy>=1.24.0 pandas>=2.0.0 matplotlib>=3.7.0 seaborn>=0.12.0
!pip install scikit-learn>=1.3.0 gradio>=3.40.0 wandb>=0.15.0

print("‚úÖ Depend√™ncias instaladas com sucesso!")

## **3. Configurando GPU (se dispon√≠vel)**

Fine Tuning √© como correr uma maratona - voc√™ precisa de energia (GPU) para n√£o ficar exausto:

In [None]:
# Verificando e configurando GPU
import torch

print("üîç Verificando disponibilidade de GPU...")

if torch.cuda.is_available():
    print(f"‚úÖ GPU dispon√≠vel: {torch.cuda.get_device_name(0)}")
    print(f"   Mem√≥ria total: {torch.cuda.get_device_properties(0).total_memory / 1e9:.1f} GB")
    print(f"   Mem√≥ria livre: {torch.cuda.memory_allocated(0) / 1e9:.1f} GB")
    DEVICE = "cuda"
else:
    print("‚ö†Ô∏è  GPU n√£o dispon√≠vel. Vamos usar CPU (ser√° mais lento, mas funciona!)")
    DEVICE = "cpu"

print(f"üéØ Dispositivo selecionado: {DEVICE}")

## **4. Configurando Hugging Face**

Vamos configurar o acesso ao Hugging Face (nossa "biblioteca de modelos"):

In [None]:
# Configurando Hugging Face
import os
from dotenv import load_dotenv

# Carregando vari√°veis de ambiente
load_dotenv()

# Verificando token do Hugging Face
hf_token = os.getenv("HUGGINGFACEHUB_API_TOKEN")

if hf_token:
    print("‚úÖ Token do Hugging Face configurado!")
else:
    print("‚ö†Ô∏è  Token do Hugging Face n√£o encontrado.")
    print("üí° Para obter um token gratuito:")
    print("   1. Acesse: https://huggingface.co/settings/tokens")
    print("   2. Crie um novo token")
    print("   3. Adicione como vari√°vel de ambiente HUGGINGFACEHUB_API_TOKEN")
    print("\nüîß Por enquanto, vamos continuar sem o token (algumas funcionalidades ser√£o limitadas)")

## **5. Testando as Importa√ß√µes**

Vamos verificar se tudo est√° funcionando:

In [None]:
# Testando importa√ß√µes principais
print("üß™ Testando importa√ß√µes...")

try:
    import transformers
    print(f"‚úÖ Transformers: {transformers.__version__}")
except ImportError as e:
    print(f"‚ùå Erro ao importar transformers: {e}")

try:
    import torch
    print(f"‚úÖ PyTorch: {torch.__version__}")
except ImportError as e:
    print(f"‚ùå Erro ao importar torch: {e}")

try:
    import datasets
    print(f"‚úÖ Datasets: {datasets.__version__}")
except ImportError as e:
    print(f"‚ùå Erro ao importar datasets: {e}")

try:
    import peft
    print(f"‚úÖ PEFT: {peft.__version__}")
except ImportError as e:
    print(f"‚ùå Erro ao importar PEFT: {e}")

try:
    import accelerate
    print(f"‚úÖ Accelerate: {accelerate.__version__}")
except ImportError as e:
    print(f"‚ùå Erro ao importar accelerate: {e}")

print("\nüéâ Setup conclu√≠do com sucesso!")

## **6. Fun√ß√£o Helper para LLMs**

Vamos criar uma fun√ß√£o que nos ajuda a escolher o melhor LLM dispon√≠vel:

In [None]:
def get_llm_colab():
    """
    Retorna o melhor LLM dispon√≠vel no Colab
    
    √â como escolher o melhor funcion√°rio dispon√≠vel para a tarefa!
    """
    
    # Tentativa 1: OpenAI (se tiver API key)
    try:
        from langchain_openai import ChatOpenAI
        api_key = os.getenv("OPENAI_API_KEY")
        if api_key:
            print("ü§ñ Usando OpenAI GPT-3.5-turbo")
            return ChatOpenAI(
                model="gpt-3.5-turbo",
                temperature=0.7,
                api_key=api_key
            )
    except Exception as e:
        print(f"‚ö†Ô∏è  OpenAI n√£o dispon√≠vel: {e}")
    
    # Tentativa 2: Hugging Face (gratuito)
    try:
        from langchain_community.llms import HuggingFaceHub
        token = os.getenv("HUGGINGFACEHUB_API_TOKEN")
        if token:
            print("ü§ñ Usando Hugging Face (gratuito)")
            return HuggingFaceHub(
                repo_id="google/flan-t5-base",
                model_kwargs={"temperature": 0.7, "max_length": 512}
            )
    except Exception as e:
        print(f"‚ö†Ô∏è  Hugging Face n√£o dispon√≠vel: {e}")
    
    # Fallback: Modelo local simples
    print("ü§ñ Usando modelo local simples")
    return None

# Testando a fun√ß√£o
print("üß™ Testando fun√ß√£o de LLM...")
llm = get_llm_colab()
if llm:
    print("‚úÖ LLM configurado com sucesso!")
else:
    print("‚ö†Ô∏è  LLM n√£o configurado. Vamos usar modelos locais no curso.")

## **7. Criando Estrutura de Pastas**

Vamos organizar nosso "espa√ßo de trabalho":

In [None]:
# Criando estrutura de pastas
import os

pastas = ["datasets", "models", "checkpoints", "logs"]

for pasta in pastas:
    if not os.path.exists(pasta):
        os.makedirs(pasta)
        print(f"üìÅ Criada pasta: {pasta}")
    else:
        print(f"üìÅ Pasta j√° existe: {pasta}")

print("\nüèóÔ∏è  Estrutura de pastas criada!")

## **8. Teste Final - Hello World do Fine Tuning**

Vamos fazer um teste r√°pido para garantir que tudo est√° funcionando:

In [None]:
# Teste final - Carregando um modelo pequeno
print("üß™ Teste final - Carregando modelo...")

try:
    from transformers import AutoTokenizer, AutoModelForCausalLM
    
    # Carregando um modelo pequeno para teste
    model_name = "microsoft/DialoGPT-small"
    
    print(f"üì• Baixando modelo: {model_name}")
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModelForCausalLM.from_pretrained(model_name)
    
    print("‚úÖ Modelo carregado com sucesso!")
    print(f"   Par√¢metros: {model.num_parameters():,}")
    
    # Teste simples
    input_text = "Ol√°, como voc√™ est√°?"
    inputs = tokenizer(input_text, return_tensors="pt")
    
    print(f"‚úÖ Tokeniza√ß√£o funcionando!")
    print(f"   Input: {input_text}")
    print(f"   Tokens: {inputs['input_ids'].shape}")
    
except Exception as e:
    print(f"‚ùå Erro no teste final: {e}")
    print("üí° N√£o se preocupe, vamos resolver isso nos pr√≥ximos m√≥dulos!")

## **üéâ Setup Conclu√≠do!**

### **O que fizemos:**

‚úÖ **Verificamos o ambiente** (Colab + GPU)  
‚úÖ **Instalamos todas as depend√™ncias**  
‚úÖ **Configuramos Hugging Face**  
‚úÖ **Testamos as importa√ß√µes**  
‚úÖ **Criamos estrutura de pastas**  
‚úÖ **Fizemos teste final**

### **Pr√≥ximos Passos:**

üöÄ **M√≥dulo 1**: Entendendo Fine Tuning  
üöÄ **M√≥dulo 2**: Preparando Dados  
üöÄ **M√≥dulo 3**: Escolhendo Modelos  
üöÄ **M√≥dulo 4**: Treinando  
üöÄ **M√≥dulo 5**: Avaliando  
üöÄ **M√≥dulo 6**: Deploy

---

**üí° Dica do Instrutor**: Se algo deu errado, n√£o se preocupe! Fine Tuning √© como cozinhar - √†s vezes a primeira tentativa n√£o sai perfeita, mas com pr√°tica voc√™ vira um chef! üòÑ

**üöÄ Pr√≥ximo m√≥dulo**: Vamos entender o que √© Fine Tuning e por que voc√™ precisa saber!