In [None]:
!pip install timm --upgrade
!pip install accelerate
!pip install git+https://github.com/huggingface/transformers.git
# add more to make demo
!pip install gradio

In [2]:
import warnings
warnings.filterwarnings('ignore')

# 🔧 Resolução do Erro de Autenticação do Kaggle

## ❌ Problema
O erro `KaggleApiHTTPError: 403 Client Error` indica que você não tem permissão para acessar o modelo Gemma 3N do Kaggle. Isso pode acontecer por dois motivos principais:

1. **Credenciais não configuradas**: Você não configurou suas credenciais de API do Kaggle
2. **Termos não aceitos**: Você não aceitou os termos de uso do modelo Gemma 3N

## ✅ Solução

### Passo 1: Configurar Credenciais do Kaggle
Execute as células abaixo para verificar e configurar suas credenciais.

### Passo 2: Aceitar Termos do Modelo
Acesse [https://www.kaggle.com/models/google/gemma-3n](https://www.kaggle.com/models/google/gemma-3n) e clique em **"Accept"** para aceitar os termos de uso.

### Passo 3: Executar Download
Após completar os passos acima, execute a célula de download do modelo.

---

In [None]:
!pip install kagglehub
!pip install kaggle

In [None]:
# Configurar autenticação do Kaggle usando arquivo existente
import os
import json
import shutil
from pathlib import Path

# Caminhos corrigidos para Windows
current_dir = Path(r'c:\Users\fbg67\Desktop\bufala')  # Diretório atual do projeto
kaggle_json_source = current_dir / 'kaggle.json'
kaggle_dir = Path.home() / '.kaggle'
kaggle_json_dest = kaggle_dir / 'kaggle.json'

print(f"Arquivo de credenciais origem: {kaggle_json_source}")
print(f"Diretório destino: {kaggle_dir}")
print(f"Arquivo destino: {kaggle_json_dest}")

# Verificar se o arquivo de origem existe
if kaggle_json_source.exists():
    print("✓ Arquivo kaggle.json encontrado no diretório do projeto")
    
    # Ler e verificar credenciais
    with open(kaggle_json_source, 'r') as f:
        creds = json.load(f)
        if 'username' in creds and 'key' in creds:
            print(f"✓ Credenciais válidas encontradas para usuário: {creds['username']}")
        else:
            print("✗ Credenciais inválidas no kaggle.json")
            raise ValueError("Credenciais inválidas")
    
    # Criar diretório .kaggle se não existir
    kaggle_dir.mkdir(exist_ok=True)
    print(f"✓ Diretório {kaggle_dir} criado/verificado")
    
    # Copiar arquivo para o local correto
    shutil.copy2(kaggle_json_source, kaggle_json_dest)
    print(f"✓ Arquivo copiado para {kaggle_json_dest}")
    
    # Definir permissões corretas (600)
    os.chmod(kaggle_json_dest, 0o600)
    print("✓ Permissões configuradas para 600")
    
    # Verificar permissões
    import stat
    current_permissions = oct(os.stat(kaggle_json_dest).st_mode)[-3:]
    print(f"✓ Permissões atuais: {current_permissions}")
    
    print("\n🎉 Credenciais do Kaggle configuradas com sucesso!")
    
else:
    print("✗ Arquivo kaggle.json não encontrado no diretório do projeto")
    print(f"✗ Procurado em: {kaggle_json_source}")
    print("\n💡 SOLUÇÕES:")
    print("1. Coloque o arquivo kaggle.json no diretório do projeto")
    print("2. Ou configure manualmente usando a célula abaixo")
    print("3. Ou baixe suas credenciais do Kaggle:")
    print("   - Vá para: https://www.kaggle.com/settings/account")
    print("   - Clique em 'Create New API Token'")
    print("   - Coloque o arquivo baixado no diretório do projeto")

In [7]:
# Verificar se o arquivo kaggle.json existe no diretório atual
import os
from pathlib import Path

current_dir = Path(r'c:\Users\fbg67\Desktop\bufala')
kaggle_json_path = current_dir / 'kaggle.json'

print(f"🔍 Verificando arquivo kaggle.json em: {kaggle_json_path}")

if kaggle_json_path.exists():
    print("✅ Arquivo kaggle.json encontrado!")
    # Verificar conteúdo
    try:
        with open(kaggle_json_path, 'r') as f:
            import json
            creds = json.load(f)
            if 'username' in creds and 'key' in creds:
                print(f"✅ Credenciais válidas para usuário: {creds['username']}")
            else:
                print("❌ Formato de credenciais inválido")
    except Exception as e:
        print(f"❌ Erro ao ler arquivo: {e}")
else:
    print("❌ Arquivo kaggle.json NÃO encontrado")
    print("\n📋 INSTRUÇÕES para obter o arquivo kaggle.json:")
    print("1. Vá para: https://www.kaggle.com/settings/account")
    print("2. Role para baixo até 'API'")
    print("3. Clique em 'Create New API Token'")
    print("4. Um arquivo kaggle.json será baixado")
    print("5. Mova o arquivo para este diretório:")
    print(f"   {current_dir}")
    print("\n🔄 Após colocar o arquivo, execute esta célula novamente")

🔍 Verificando arquivo kaggle.json em: c:\Users\fbg67\Desktop\bufala\kaggle.json
✅ Arquivo kaggle.json encontrado!
✅ Credenciais válidas para usuário: filipebuba


In [8]:
# OPÇÃO: Criar arquivo kaggle.json manualmente (se você não conseguiu baixar)
import json
from pathlib import Path

def create_kaggle_json_manually():
    """
    Cria o arquivo kaggle.json manualmente com suas credenciais
    """
    print("🔧 CRIANDO ARQUIVO KAGGLE.JSON MANUALMENTE")
    print("=" * 50)
    
    # Solicitar credenciais
    print("Para obter suas credenciais do Kaggle:")
    print("1. Vá para: https://www.kaggle.com/settings/account")
    print("2. Na seção 'API', clique em 'Create New API Token'")
    print("3. Se o download não funcionar, você pode ver as credenciais na página")
    print("\nInsira suas credenciais abaixo:")
    
    username = input("Username do Kaggle: ").strip()
    api_key = input("API Key do Kaggle: ").strip()
    
    if not username or not api_key:
        print("❌ Username e API Key são obrigatórios!")
        return False
    
    # Criar o arquivo
    current_dir = Path(r'c:\Users\fbg67\Desktop\bufala')
    kaggle_json_path = current_dir / 'kaggle.json'
    
    credentials = {
        "username": username,
        "key": api_key
    }
    
    try:
        with open(kaggle_json_path, 'w') as f:
            json.dump(credentials, f, indent=2)
        
        print(f"✅ Arquivo kaggle.json criado em: {kaggle_json_path}")
        print("✅ Agora você pode executar a célula de configuração acima!")
        return True
        
    except Exception as e:
        print(f"❌ Erro ao criar arquivo: {e}")
        return False

# Descomente a linha abaixo para executar a criação manual:
# create_kaggle_json_manually()

In [9]:
# Configuração automática das credenciais do Kaggle
import os
import json
from pathlib import Path
import getpass

def setup_kaggle_credentials():
    """
    Configura as credenciais do Kaggle interativamente
    """
    kaggle_dir = Path.home() / '.kaggle'
    kaggle_json = kaggle_dir / 'kaggle.json'
    
    if kaggle_json.exists():
        print("✓ Credenciais do Kaggle já existem")
        return True
    
    print("Configurando credenciais do Kaggle...")
    print("\nPara obter suas credenciais:")
    print("1. Vá para: https://www.kaggle.com/settings/account")
    print("2. Clique em 'Create New API Token'")
    print("3. Um arquivo kaggle.json será baixado")
    print("4. Insira as informações abaixo (encontradas no arquivo kaggle.json)")
    
    # Solicitar credenciais
    username = input("\nInsira seu username do Kaggle: ").strip()
    if not username:
        print("Username não pode ser vazio")
        return False
        
    api_key = getpass.getpass("Insira sua API key do Kaggle: ").strip()
    if not api_key:
        print("API key não pode ser vazia")
        return False
    
    # Criar diretório se não existir
    kaggle_dir.mkdir(exist_ok=True)
    
    # Criar arquivo de credenciais
    credentials = {
        "username": username,
        "key": api_key
    }
    
    with open(kaggle_json, 'w') as f:
        json.dump(credentials, f, indent=2)
    
    # Definir permissões corretas
    os.chmod(kaggle_json, 0o600)
    
    print(f"✓ Credenciais salvas em: {kaggle_json}")
    return True

# Comentário: Execute esta célula apenas se você quiser configurar as credenciais interativamente
# setup_kaggle_credentials()

In [10]:
# Método alternativo: Configurar credenciais via comandos do terminal
print("INSTRUÇÕES PARA CONFIGURAR CREDENCIAIS DO KAGGLE:")
print("=" * 50)
print()
print("Execute os seguintes comandos no terminal:")
print()
print("1. Crie o diretório .kaggle (se não existir):")
print("   mkdir -p ~/.kaggle")
print()
print("2. Baixe suas credenciais do Kaggle:")
print("   - Vá para: https://www.kaggle.com/settings/account")
print("   - Clique em 'Create New API Token'")
print("   - Mova o arquivo baixado: mv ~/Downloads/kaggle.json ~/.kaggle/")
print()
print("3. Configure as permissões:")
print("   chmod 600 ~/.kaggle/kaggle.json")
print()
print("4. OU crie manualmente o arquivo kaggle.json com o conteúdo:")
print("   {")
print('     "username": "SEU_USERNAME",')
print('     "key": "SUA_API_KEY"')
print("   }")
print()
print("5. Após configurar, execute a próxima célula para testar a autenticação")
print()
print("IMPORTANTE: Você também precisa aceitar os termos do modelo Gemma 3N em:")
print("https://www.kaggle.com/models/google/gemma-3n")

INSTRUÇÕES PARA CONFIGURAR CREDENCIAIS DO KAGGLE:

Execute os seguintes comandos no terminal:

1. Crie o diretório .kaggle (se não existir):
   mkdir -p ~/.kaggle

2. Baixe suas credenciais do Kaggle:
   - Vá para: https://www.kaggle.com/settings/account
   - Clique em 'Create New API Token'
   - Mova o arquivo baixado: mv ~/Downloads/kaggle.json ~/.kaggle/

3. Configure as permissões:
   chmod 600 ~/.kaggle/kaggle.json

4. OU crie manualmente o arquivo kaggle.json com o conteúdo:
   {
     "username": "SEU_USERNAME",
     "key": "SUA_API_KEY"
   }

5. Após configurar, execute a próxima célula para testar a autenticação

IMPORTANTE: Você também precisa aceitar os termos do modelo Gemma 3N em:
https://www.kaggle.com/models/google/gemma-3n


In [11]:
# Testar autenticação do Kaggle
try:
    import kagglehub
    
    # Tentar listar alguns modelos para testar a autenticação
    print("Testando autenticação do Kaggle...")
    
    # Verificar se conseguimos acessar a API
    from kaggle.api.kaggle_api_extended import KaggleApi
    api = KaggleApi()
    api.authenticate()
    
    print("✓ Autenticação do Kaggle bem-sucedida!")
    
    # Verificar se o modelo Gemma 3N está disponível
    print("\nVerificando disponibilidade do modelo Gemma 3N...")
    
except Exception as e:
    print(f"✗ Erro na autenticação: {e}")
    print("\nPossíveis soluções:")
    print("1. Verifique se suas credenciais do Kaggle estão corretas")
    print("2. Verifique se você aceitou os termos do modelo Gemma 3N no Kaggle")
    print("3. Vá para: https://www.kaggle.com/models/google/gemma-3n")
    print("4. Clique em 'Accept' para aceitar os termos de uso")

Testando autenticação do Kaggle...
✓ Autenticação do Kaggle bem-sucedida!

Verificando disponibilidade do modelo Gemma 3N...


## 🚨 PASSO IMPORTANTE: Aceitar Termos do Modelo Gemma 3N

✅ **Suas credenciais do Kaggle estão configuradas e funcionando!**

🔗 **Agora você DEVE aceitar os termos de uso do modelo:**

1. Vá para: **https://www.kaggle.com/models/google/gemma-3n**
2. Clique no botão **"Accept"** (Aceitar)
3. Confirme que aceita os termos de uso

⚠️ **IMPORTANTE**: O download falhará com erro 403 se você não aceitar os termos primeiro.

💡 **Dica**: Mantenha a página aberta para verificar se o aceite foi processado.

---

Após aceitar os termos, execute a célula abaixo para baixar o modelo:

In [None]:
%%time
import kagglehub
import os

def download_gemma_model():
    """
    Tenta baixar um modelo Gemma com diferentes abordagens e fallbacks
    """
    
    models_to_try = [
        ("google/gemma-3n/transformers/gemma-3n-e2b-it", "Gemma 3N (2B, Instruction-tuned)"),
        ("google/gemma/transformers/gemma-2b-it", "Gemma 2B (Instruction-tuned)"),
        ("google/gemma/transformers/gemma-7b-it", "Gemma 7B (Instruction-tuned)"),
    ]
    
    for model_handle, model_name in models_to_try:
        try:
            print(f"Tentando baixar {model_name}...")
            GEMMA_PATH = kagglehub.model_download(model_handle)
            print(f"✓ {model_name} baixado com sucesso em: {GEMMA_PATH}")
            return GEMMA_PATH, model_name
        except Exception as e:
            print(f"✗ Erro ao baixar {model_name}: {e}")
            continue
    
    # Se todos os downloads falharam, usar modelo do Hugging Face
    print("\n⚠️  Todos os downloads do Kaggle falharam.")
    print("Usando modelo diretamente do Hugging Face...")
    
    # Modelos alternativos do HF que não requerem autenticação especial
    hf_models = [
        ("google/gemma-2b-it", "Gemma 2B Instruction-tuned"),
        ("microsoft/DialoGPT-medium", "DialoGPT Medium (alternativa)"),
        ("distilgpt2", "DistilGPT-2 (modelo menor)")
    ]
    
    for hf_model, hf_name in hf_models:
        try:
            print(f"Tentando modelo HF: {hf_name}")
            # Testar se o modelo está acessível
            from transformers import AutoTokenizer
            tokenizer_test = AutoTokenizer.from_pretrained(hf_model)
            print(f"✓ {hf_name} acessível no Hugging Face")
            return hf_model, hf_name
        except Exception as e:
            print(f"✗ {hf_name} não acessível: {e}")
            continue
    
    raise Exception("Nenhum modelo pôde ser carregado. Verifique sua conexão e credenciais.")

# Executar download
try:
    GEMMA_PATH, MODEL_NAME = download_gemma_model()
    print(f"\n🎉 Sucesso! Modelo selecionado: {MODEL_NAME}")
    print(f"📁 Caminho/ID: {GEMMA_PATH}")
    
    # Verificar se é um caminho local ou ID do HF
    if os.path.exists(str(GEMMA_PATH)):
        print(f"📍 Tipo: Arquivo local baixado do Kaggle")
    else:
        print(f"🌐 Tipo: Modelo do Hugging Face Hub")
        
except Exception as e:
    print(f"❌ Falha completa: {e}")
    print("\n🔧 Próximos passos:")
    print("1. Configure suas credenciais do Kaggle (células acima)")
    print("2. Aceite os termos do modelo em https://www.kaggle.com/models/google/gemma-3n")
    print("3. Verifique sua conexão com a internet")

Tentando baixar Gemma 3N (2B, Instruction-tuned)...
Downloading from https://www.kaggle.com/api/v1/models/google/gemma-3n/transformers/gemma-3n-e2b-it/2/download...


100%|██████████| 16.0G/16.0G [27:16<00:00, 10.5MB/s]  


Extracting files...


In [None]:
%%time
import transformers
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, GenerationConfig

def load_model(model_path):
    """
    Carrega o modelo e tokenizer com diferentes configurações
    """
    try:
        print(f"Carregando modelo de: {model_path}")
        
        # Tentar carregar o tokenizer
        tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
        print("✓ Tokenizer carregado com sucesso")
        
        # Verificar se CUDA está disponível
        device = "cuda" if torch.cuda.is_available() else "cpu"
        print(f"Usando dispositivo: {device}")
        
        # Tentar carregar o modelo com diferentes configurações
        if device == "cuda":
            try:
                # Tentar com torch_dtype=torch.bfloat16 para economizar memória
                model = AutoModelForCausalLM.from_pretrained(
                    model_path, 
                    trust_remote_code=True,
                    torch_dtype=torch.bfloat16,
                    device_map="auto"
                )
                print("✓ Modelo carregado com bfloat16 e device_map=auto")
            except Exception as e:
                print(f"Tentativa com bfloat16 falhou: {e}")
                # Fallback para float16
                model = AutoModelForCausalLM.from_pretrained(
                    model_path, 
                    trust_remote_code=True,
                    torch_dtype=torch.float16
                ).to(device)
                print("✓ Modelo carregado com float16")
        else:
            # CPU
            model = AutoModelForCausalLM.from_pretrained(
                model_path, 
                trust_remote_code=True
            )
            print("✓ Modelo carregado na CPU")
        
        return tokenizer, model
        
    except Exception as e:
        print(f"✗ Erro ao carregar modelo: {e}")
        raise

# Carregar modelo e tokenizer
tokenizer, model = load_model(GEMMA_PATH)

# Teste básico
prompt = "What is the capital of Guiné-Bissau?"
print(f"\nTestando com prompt: {prompt}")

inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
generation_config = GenerationConfig(max_new_tokens=150, do_sample=True, temperature=0.7)

with torch.no_grad():
    outputs = model.generate(**inputs, generation_config=generation_config)
    result = tokenizer.decode(outputs[0], skip_special_tokens=True)

print("✓ Teste de geração concluído")

Carregando modelo de: C:\Users\fbg67\.cache\kagglehub\models\google\gemma-3n\transformers\gemma-3n-e2b-it\1
✓ Tokenizer carregado com sucesso
Usando dispositivo: cpu
✓ Tokenizer carregado com sucesso
Usando dispositivo: cpu


Loading checkpoint shards:   0%|          | 0/3 [00:00<?, ?it/s]

✓ Modelo carregado na CPU

Testando com prompt: What is the capital of France?


`generation_config` default values have been modified to match model-specific defaults: {'cache_implementation': 'hybrid', 'top_k': 64, 'top_p': 0.95, 'pad_token_id': 0, 'bos_token_id': 2, 'eos_token_id': [1, 106]}. If this is not desired, please set these values explicitly.


✓ Teste de geração concluído
CPU times: total: 1min 42s
Wall time: 1min 7s


In [12]:
print(result)

What is the capital of France?

Paris


In [13]:
%%time
def gemma_query(input_text):
    """
    Função para fazer queries ao modelo Gemma
    """
    try:
        # Verificar se o input não está vazio
        if not input_text.strip():
            return "Por favor, digite uma pergunta."
        
        # Preparar input
        inputs = tokenizer(input_text, return_tensors="pt").to(model.device)
        
        # Gerar resposta
        with torch.no_grad():
            outputs = model.generate(
                **inputs, 
                max_new_tokens=100,
                do_sample=True,
                temperature=0.7,
                top_p=0.9,
                pad_token_id=tokenizer.eos_token_id
            )
        
        # Decodificar resposta
        response = tokenizer.decode(outputs[0], skip_special_tokens=True)
        
        # Remover o prompt original da resposta
        if input_text in response:
            response = response.replace(input_text, "").strip()
        
        return response
        
    except Exception as e:
        return f"Erro ao processar query: {str(e)}"

# Testar a função
test_query = "Explain photosynthesis in simple terms."
test_result = gemma_query(test_query)
print(f"Teste da função gemma_query:")
print(f"Input: {test_query}")
print(f"Output: {test_result}")

Teste da função gemma_query:
Input: Explain photosynthesis in simple terms.
Output: Imagine plants are like tiny food factories! 

They take in:

* **Sunlight:** Like the power source for the factory.
* **Water:**  Like an ingredient.
* **Carbon Dioxide (from the air):**  Another ingredient.

Inside their leaves, plants have special green stuff called **chlorophyll**. Chlorophyll captures the sunlight. 

Then, using the sunlight's energy, the plant turns the water and carbon dioxide into:

* **Sugar
CPU times: total: 5min 31s
Wall time: 55.9 s


In [14]:
%%time
import gradio as gr

# Define the interface
demo = gr.Interface(
    fn=gemma_query,
    inputs=gr.Textbox(label="Enter your query"),
    outputs=gr.Textbox(label="Gemma 3n Response"),
    title="Gemma 3n: [Your Project Name]",
    description="Powered by Gemma 3n – A private, offline-first, multimodal AI model.",
    examples=[["Tell me about climate change."], ["Explain photosynthesis in simple terms."]],
    theme="default"
)

# Launch the interface
demo.launch()

* Running on local URL:  http://127.0.0.1:7860
* To create a public link, set `share=True` in `launch()`.
* To create a public link, set `share=True` in `launch()`.


CPU times: total: 4.23 s
Wall time: 6.18 s




In [15]:
# 🔍 VERIFICAR SE O MODELO GEMMA-3N JÁ FOI BAIXADO
import os
from pathlib import Path
import json

def check_existing_gemma_models():
    """
    Verifica se já existe algum modelo Gemma baixado no sistema
    """
    print("🔍 VERIFICANDO MODELOS GEMMA JÁ BAIXADOS")
    print("=" * 50)
    
    # Locais comuns onde modelos podem estar armazenados
    possible_locations = [
        # Cache do Kaggle
        Path.home() / ".cache" / "kagglehub",
        
        # Cache do Hugging Face
        Path.home() / ".cache" / "huggingface",
        
        # Diretório atual do projeto
        Path(r'c:\Users\fbg67\Desktop\bufala') / "models",
        
        # Outros locais comuns
        Path(r'c:\Users\fbg67\.cache\kagglehub'),
        Path(r'c:\Users\fbg67\.cache\huggingface'),
        
        # Verificar se há variáveis de ambiente
        Path(os.environ.get('TRANSFORMERS_CACHE', '')),
        Path(os.environ.get('KAGGLE_CACHE_DIR', '')),
    ]
    
    found_models = []
    
    for location in possible_locations:
        if location and location.exists():
            print(f"\n📁 Verificando: {location}")
            
            try:
                # Procurar por modelos Gemma
                for root, dirs, files in os.walk(location):
                    root_path = Path(root)
                    
                    # Verificar se contém "gemma" no nome do diretório
                    if any("gemma" in part.lower() for part in root_path.parts):
                        print(f"  🎯 Encontrado: {root_path}")
                        
                        # Verificar conteúdo
                        model_files = list(root_path.glob("*.bin")) + list(root_path.glob("*.safetensors")) + list(root_path.glob("config.json"))
                        if model_files:
                            found_models.append({
                                'path': root_path,
                                'files': [f.name for f in model_files[:5]],  # Primeiros 5 arquivos
                                'total_files': len(list(root_path.iterdir()))
                            })
                            print(f"    📄 Arquivos encontrados: {len(list(root_path.iterdir()))} arquivos")
                            print(f"    📋 Exemplos: {', '.join([f.name for f in model_files[:3]])}")
                        
            except (PermissionError, OSError) as e:
                print(f"  ⚠️ Sem permissão para acessar: {e}")
        else:
            if location:
                print(f"❌ Não existe: {location}")
    
    return found_models

def check_specific_gemma_paths():
    """
    Verifica caminhos específicos conhecidos do Gemma
    """
    print("\n🎯 VERIFICANDO CAMINHOS ESPECÍFICOS DO GEMMA")
    print("=" * 50)
    
    # Caminhos específicos baseados nos downloads anteriores
    specific_paths = [
        # Do log do backend que vimos antes
        Path(r"C:\Users\fbg67\.cache\kagglehub\models\google\gemma-3n\TfLite\gemma-3n-e2b-it-int4\1"),
        
        # Possíveis caminhos do transformers
        Path(r"C:\Users\fbg67\.cache\kagglehub\models\google\gemma-3n\transformers"),
        Path(r"C:\Users\fbg67\.cache\kagglehub\models\google\gemma"),
        
        # Cache do Hugging Face
        Path.home() / ".cache" / "huggingface" / "hub" / "models--google--gemma-2b-it",
        Path.home() / ".cache" / "huggingface" / "hub" / "models--google--gemma-3n-e2b-it",
    ]
    
    found_specific = []
    
    for path in specific_paths:
        if path.exists():
            print(f"✅ ENCONTRADO: {path}")
            
            # Listar conteúdo
            contents = list(path.iterdir())
            print(f"   📂 Conteúdo ({len(contents)} itens):")
            for item in contents[:10]:  # Primeiros 10 itens
                print(f"     📄 {item.name}")
            
            if len(contents) > 10:
                print(f"     ... e mais {len(contents) - 10} itens")
                
            found_specific.append(path)
        else:
            print(f"❌ Não encontrado: {path}")
    
    return found_specific

# Executar verificações
print("🚀 INICIANDO VERIFICAÇÃO DE MODELOS GEMMA...")
found_models = check_existing_gemma_models()
found_specific = check_specific_gemma_paths()

print(f"\n📊 RESUMO:")
print(f"📦 Modelos encontrados (busca geral): {len(found_models)}")
print(f"🎯 Caminhos específicos encontrados: {len(found_specific)}")

if found_models or found_specific:
    print(f"\n✅ MODELOS GEMMA ENCONTRADOS NO SISTEMA!")
    print("💡 Você pode usar um destes modelos em vez de baixar novamente.")
    
    # Mostrar o melhor candidato
    if found_specific:
        best_path = found_specific[0]
        print(f"\n🎯 MELHOR CANDIDATO: {best_path}")
        print("💡 Você pode usar este caminho para carregar o modelo diretamente!")
    elif found_models:
        best_model = found_models[0]
        print(f"\n🎯 MELHOR CANDIDATO: {best_model['path']}")
        print("💡 Você pode usar este caminho para carregar o modelo diretamente!")
else:
    print(f"\n❌ NENHUM MODELO GEMMA ENCONTRADO")
    print("📥 Será necessário baixar o modelo usando as células acima.")

🚀 INICIANDO VERIFICAÇÃO DE MODELOS GEMMA...
🔍 VERIFICANDO MODELOS GEMMA JÁ BAIXADOS

📁 Verificando: C:\Users\fbg67\.cache\kagglehub
  🎯 Encontrado: C:\Users\fbg67\.cache\kagglehub\models\google\gemma-3n
  🎯 Encontrado: C:\Users\fbg67\.cache\kagglehub\models\google\gemma-3n\TfLite
  🎯 Encontrado: C:\Users\fbg67\.cache\kagglehub\models\google\gemma-3n\TfLite\gemma-3n-e2b-it-int4
  🎯 Encontrado: C:\Users\fbg67\.cache\kagglehub\models\google\gemma-3n\TfLite\gemma-3n-e2b-it-int4\1
  🎯 Encontrado: C:\Users\fbg67\.cache\kagglehub\models\google\gemma-3n\transformers
  🎯 Encontrado: C:\Users\fbg67\.cache\kagglehub\models\google\gemma-3n\transformers\gemma-3n-e2b-it
  🎯 Encontrado: C:\Users\fbg67\.cache\kagglehub\models\google\gemma-3n\transformers\gemma-3n-e2b-it\1
    📄 Arquivos encontrados: 14 arquivos
    📋 Exemplos: model-00001-of-00003.safetensors, model-00002-of-00003.safetensors, model-00003-of-00003.safetensors

📁 Verificando: C:\Users\fbg67\.cache\huggingface

📁 Verificando: c:\Users\f

In [None]:
# 🚀 TENTAR CARREGAR MODELO GEMMA EXISTENTE
from pathlib import Path
import os

def try_load_existing_gemma():
    """
    Tenta carregar um modelo Gemma já existente no sistema
    """
    print("🚀 TENTANDO CARREGAR MODELO GEMMA EXISTENTE")
    print("=" * 50)
    
    # Caminhos conhecidos onde o modelo pode estar (baseado nos logs anteriores)
    known_paths = [
        # Do log do backend - sabemos que este existe
        r"C:\Users\fbg67\.cache\kagglehub\models\google\gemma-3n\TfLite\gemma-3n-e2b-it-int4\1",
        
        # Possíveis locais de transformers
        r"C:\Users\fbg67\.cache\kagglehub\models\google\gemma-3n\transformers\gemma-3n-e2b-it",
        r"C:\Users\fbg67\.cache\kagglehub\models\google\gemma\transformers\gemma-2b-it",
        
        # Diretório do usuário
        os.path.expanduser("~/.cache/kagglehub/models/google/gemma-3n"),
        os.path.expanduser("~/.cache/huggingface/hub/models--google--gemma-2b-it"),
    ]
    
    # Tentar cada caminho
    for path_str in known_paths:
        path = Path(path_str)
        if path.exists():
            print(f"✅ Encontrado: {path}")
            
            # Verificar se é um modelo TfLite ou Transformers
            files = list(path.rglob("*"))
            
            # Procurar por arquivos específicos
            has_task_file = any(".task" in f.name for f in files)
            has_config_json = any("config.json" in f.name for f in files)
            has_model_files = any(f.suffix in ['.bin', '.safetensors'] for f in files)
            
            print(f"   📄 Arquivos .task: {'✅' if has_task_file else '❌'}")
            print(f"   📄 config.json: {'✅' if has_config_json else '❌'}")  
            print(f"   📄 Arquivos de modelo: {'✅' if has_model_files else '❌'}")
            
            if has_task_file:
                print(f"   🎯 MODELO TfLite/MediaPipe detectado!")
                return path, "tflite"
            elif has_config_json and has_model_files:
                print(f"   🎯 MODELO TRANSFORMERS detectado!")
                return path, "transformers"
            else:
                print(f"   ⚠️ Tipo de modelo não identificado")
        else:
            print(f"❌ Não existe: {path}")
    
    print("\n❌ Nenhum modelo compatível encontrado")
    return None, None

def load_found_model(model_path, model_type):
    """
    Carrega o modelo encontrado
    """
    if model_type == "transformers":
        try:
            from transformers import AutoTokenizer, AutoModelForCausalLM
            print(f"🔧 Carregando modelo Transformers de: {model_path}")
            
            tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
            model = AutoModelForCausalLM.from_pretrained(model_path, trust_remote_code=True)
            
            print("✅ Modelo Transformers carregado com sucesso!")
            return tokenizer, model, str(model_path)
            
        except Exception as e:
            print(f"❌ Erro ao carregar modelo Transformers: {e}")
            return None, None, None
    
    elif model_type == "tflite":
        print(f"🔧 Modelo TfLite encontrado em: {model_path}")
        print("⚠️ Modelos TfLite requerem configuração especial")
        print("💡 Recomendação: Use a função de download para obter versão Transformers")
        return None, None, str(model_path)
    
    return None, None, None

# Executar busca e tentativa de carregamento
print("🔍 Procurando modelos Gemma existentes...")
model_path, model_type = try_load_existing_gemma()

if model_path and model_type:
    print(f"\n🎉 MODELO ENCONTRADO!")
    print(f"📁 Caminho: {model_path}")
    print(f"🏷️ Tipo: {model_type}")
    
    if model_type == "transformers":
        print("\n🚀 Tentando carregar modelo...")
        tokenizer, model, GEMMA_PATH = load_found_model(model_path, model_type)
        
        if tokenizer and model:
            print("✅ MODELO CARREGADO COM SUCESSO!")
            print("🎯 Você pode pular a célula de download e ir direto para os testes!")
            
            # Definir variáveis globais para uso nas próximas células
            MODEL_NAME = f"Gemma (carregado de {model_path.name})"
        else:
            print("❌ Falha ao carregar. Use a célula de download.")
    else:
        print("💡 Modelo TfLite encontrado, mas recomendamos baixar versão Transformers")
        print("🔄 Execute as células de download para obter versão compatível")
else:
    print("\n📥 Nenhum modelo encontrado. Execute as células de download.")

In [1]:
# 🚀 ANÁLISE DE PERFORMANCE - Por que o Gemma-3n está lento no backend?

def analyze_performance_issues():
    """
    Analisa e corrige problemas de performance do Gemma-3n
    """
    print("🔍 ANÁLISE DE PERFORMANCE DO GEMMA-3N")
    print("=" * 55)
    
    print("\n🐌 PROBLEMAS IDENTIFICADOS NO BACKEND ATUAL:")
    print("1. ❌ Max_length muito alto (512) - causando demora")
    print("2. ❌ Temperature alta (0.7) - mais diversidade = mais tempo")
    print("3. ❌ Top_p alto (0.9) - muitas opções de tokens")
    print("4. ❌ Do_sample=True - sampling é mais lento que greedy")
    print("5. ❌ Prompt muito longo com contexto desnecessário")
    print("6. ❌ Dispositivo pode estar em CPU em vez de GPU")
    
    print("\n⚡ OTIMIZAÇÕES DO NOTEBOOK (RÁPIDAS):")
    print("1. ✅ Max_new_tokens=100-150 (mais rápido)")
    print("2. ✅ Temperature=0.3-0.5 (menos diversidade, mais velocidade)")
    print("3. ✅ Top_p=0.8 (menos opções = mais rápido)")
    print("4. ✅ Prompt conciso e direto")
    print("5. ✅ Verificação adequada de dispositivo")
    print("6. ✅ Torch.no_grad() para economia de memória")
    
    print("\n🎯 CONFIGURAÇÃO OTIMIZADA RECOMENDADA:")
    optimized_config = {
        "max_new_tokens": 100,        # Em vez de max_length=512
        "temperature": 0.3,           # Em vez de 0.7
        "top_p": 0.8,                # Em vez de 0.9
        "do_sample": True,           # Mantido, mas com menos randomness
        "num_beams": 1,              # Sem beam search para velocidade
        "early_stopping": True,       # Para parar cedo quando apropriado
        "pad_token_id": "auto",      # Evitar warnings
        "eos_token_id": "auto"       # Parada adequada
    }
    
    for key, value in optimized_config.items():
        print(f"   {key}: {value}")
    
    return optimized_config

def demonstrate_fast_generation():
    """
    Demonstra geração rápida vs lenta para comparação
    """
    print("\n🏃‍♂️ DEMONSTRAÇÃO: CONFIGURAÇÃO RÁPIDA VS LENTA")
    print("=" * 55)
    
    # Configurações para comparar
    configs = {
        "🐌 LENTA (atual backend)": {
            "max_new_tokens": 512,
            "temperature": 0.7,
            "top_p": 0.9,
            "do_sample": True
        },
        "⚡ RÁPIDA (otimizada)": {
            "max_new_tokens": 50,
            "temperature": 0.3,
            "top_p": 0.8,
            "do_sample": True
        },
        "🚀 ULTRA RÁPIDA (greedy)": {
            "max_new_tokens": 30,
            "temperature": 0.1,
            "do_sample": False  # Greedy decoding
        }
    }
    
    for config_name, config in configs.items():
        print(f"\n{config_name}:")
        for param, value in config.items():
            print(f"   {param}: {value}")
    
    print("\n💡 RECOMENDAÇÃO PARA BACKEND BU FALA:")
    print("   Use configuração RÁPIDA para respostas médicas")
    print("   Use ULTRA RÁPIDA para emergências")
    print("   Reserve LENTA apenas para conteúdo educativo extenso")

def create_optimized_backend_config():
    """
    Cria arquivo de configuração otimizado para o backend
    """
    print("\n🔧 CRIANDO CONFIGURAÇÃO OTIMIZADA PARA BACKEND")
    print("=" * 55)
    
    optimized_backend_config = {
        "model_name": "google/gemma-3-2b-it",
        "display_name": "Bu Fala Gemma-3n (Otimizado)",
        "max_new_tokens": 100,     # ⚡ Reduzido de 512
        "temperature": 0.3,        # ⚡ Reduzido de 0.7  
        "top_p": 0.8,             # ⚡ Reduzido de 0.9
        "do_sample": True,
        "num_beams": 1,           # ⚡ Sem beam search
        "early_stopping": True,    # ⚡ Parada antecipada
        "offline_mode": True,
        "local_model_path": None,
        "torch_dtype": "float16",  # ⚡ Economia de memória
        "device_map": "auto"       # ⚡ GPU automática
    }
    
    # Salvar no diretório do projeto
    import json
    from pathlib import Path
    
    config_file = Path(r'c:\Users\fbg67\Desktop\bufala\gemma3_config_optimized.json')
    
    with open(config_file, 'w') as f:
        json.dump(optimized_backend_config, f, indent=4)
    
    print(f"✅ Configuração otimizada salva em: {config_file}")
    print("\n📋 PARA APLICAR A OTIMIZAÇÃO:")
    print("1. Pare o backend atual")
    print("2. Renomeie gemma3_config.json para gemma3_config_backup.json") 
    print("3. Renomeie gemma3_config_optimized.json para gemma3_config.json")
    print("4. Reinicie o backend")
    print("5. Teste uma consulta médica - deve ser 5-10x mais rápida!")
    
    return optimized_backend_config

# Executar análise
print("🚀 INICIANDO ANÁLISE DE PERFORMANCE...")
optimized_config = analyze_performance_issues()
demonstrate_fast_generation()
backend_config = create_optimized_backend_config()

print(f"\n🎉 ANÁLISE COMPLETA!")
print("💡 Com essas otimizações, o Gemma-3n deve responder em 10-30 segundos")
print("   em vez de 2-3 minutos como está acontecendo atualmente.")

🚀 INICIANDO ANÁLISE DE PERFORMANCE...
🔍 ANÁLISE DE PERFORMANCE DO GEMMA-3N

🐌 PROBLEMAS IDENTIFICADOS NO BACKEND ATUAL:
1. ❌ Max_length muito alto (512) - causando demora
2. ❌ Temperature alta (0.7) - mais diversidade = mais tempo
3. ❌ Top_p alto (0.9) - muitas opções de tokens
4. ❌ Do_sample=True - sampling é mais lento que greedy
5. ❌ Prompt muito longo com contexto desnecessário
6. ❌ Dispositivo pode estar em CPU em vez de GPU

⚡ OTIMIZAÇÕES DO NOTEBOOK (RÁPIDAS):
1. ✅ Max_new_tokens=100-150 (mais rápido)
2. ✅ Temperature=0.3-0.5 (menos diversidade, mais velocidade)
3. ✅ Top_p=0.8 (menos opções = mais rápido)
4. ✅ Prompt conciso e direto
5. ✅ Verificação adequada de dispositivo
6. ✅ Torch.no_grad() para economia de memória

🎯 CONFIGURAÇÃO OTIMIZADA RECOMENDADA:
   max_new_tokens: 100
   temperature: 0.3
   top_p: 0.8
   do_sample: True
   num_beams: 1
   early_stopping: True
   pad_token_id: auto
   eos_token_id: auto

🏃‍♂️ DEMONSTRAÇÃO: CONFIGURAÇÃO RÁPIDA VS LENTA

🐌 LENTA (atual 