# üîß Soluci√≥n de Errores Comunes - Fine-tuning

## Meta Day Uruguay 2025 - M√≥dulo 4: Troubleshooting

Este notebook contiene soluciones para los errores m√°s comunes al hacer fine-tuning con Unsloth y QLoRA.

### üö® Errores cubiertos:
1. **TypeError: Descriptors cannot be created directly** (protobuf)
2. **CUDA out of memory**
3. **ImportError: No module named 'unsloth'**
4. **RuntimeError: Expected all tensors to be on the same device**
5. **Problemas de versiones de dependencias**
6. **Errores de tokenizaci√≥n**

## üî¥ Error 1: TypeError - Descriptors cannot be created directly

**Error completo:**
```
TypeError: Descriptors cannot be created directly.
If this call came from a _pb2.py file, your generated code is out of date and must be regenerated with protoc >= 3.19.0.
```

**Causa:** Incompatibilidad entre versiones de protobuf

**Soluci√≥n:**

In [None]:
# üîß SOLUCI√ìN COMPLETA PARA ERROR DE PROTOBUF

# M√©todo 1: Variable de entorno (m√°s r√°pido pero menos eficiente)
import os
os.environ["PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION"] = "python"
print("‚úÖ Variable de entorno configurada")

# M√©todo 2: Downgrade de protobuf (recomendado)
print("üîÑ Instalando versi√≥n compatible de protobuf...")
%pip install --upgrade "protobuf<=3.20.3" --quiet

# Verificar versi√≥n
import protobuf
print(f"üì¶ Protobuf version: {protobuf.__version__}")

# Reiniciar runtime si es necesario
print("‚ö†Ô∏è Si el error persiste, reinicia el runtime: Runtime > Restart Runtime")

## üî¥ Error 2: CUDA out of memory

**Error:** `RuntimeError: CUDA out of memory`

**Soluciones:**

In [None]:
# üîß SOLUCIONES PARA MEMORIA GPU INSUFICIENTE

import torch
import gc

def clear_gpu_memory():
    """Limpiar memoria GPU"""
    if torch.cuda.is_available():
        torch.cuda.empty_cache()
        gc.collect()
        print("üßπ Memoria GPU limpiada")
    else:
        print("‚ÑπÔ∏è No hay GPU disponible")

def check_gpu_memory():
    """Verificar uso de memoria GPU"""
    if torch.cuda.is_available():
        total = torch.cuda.get_device_properties(0).total_memory / 1024**3
        allocated = torch.cuda.memory_allocated(0) / 1024**3
        cached = torch.cuda.memory_reserved(0) / 1024**3
        free = total - cached
        
        print(f"üìä Memoria GPU:")
        print(f"   Total: {total:.1f} GB")
        print(f"   Asignada: {allocated:.1f} GB")
        print(f"   En cach√©: {cached:.1f} GB")
        print(f"   Libre: {free:.1f} GB")
        
        if free < 2.0:
            print("‚ö†Ô∏è Poca memoria libre - considera reducir batch_size")
    else:
        print("‚ÑπÔ∏è No hay GPU disponible")

# Ejecutar diagn√≥stico
clear_gpu_memory()
check_gpu_memory()

print("\nüí° Soluciones si tienes poco memoria:")
print("1. Reducir max_seq_length (ej: 1024 en lugar de 2048)")
print("2. Reducir per_device_train_batch_size (ej: 2 en lugar de 8)")
print("3. Aumentar gradient_accumulation_steps para compensar")
print("4. Usar modelo m√°s peque√±o (7B en lugar de 8B)")
print("5. Activar gradient_checkpointing")

## üî¥ Error 3: ImportError - No module named 'unsloth'

**Soluci√≥n de instalaci√≥n paso a paso:**

In [None]:
# üîß INSTALACI√ìN PASO A PASO DE UNSLOTH

print("üîÑ Instalando Unsloth y dependencias...")

# Paso 1: Limpiar instalaciones previas
%pip uninstall -y unsloth unsloth-zoo --quiet

# Paso 2: Instalar dependencias base
%pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 --quiet
%pip install transformers datasets accelerate peft --quiet

# Paso 3: Instalar bitsandbytes
%pip install bitsandbytes --quiet

# Paso 4: Instalar Unsloth
# Para Colab:
%pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git" --quiet

# Para otros entornos, usar:
# %pip install unsloth --quiet

# Paso 5: Verificar instalaci√≥n
try:
    from unsloth import FastLanguageModel
    print("‚úÖ Unsloth instalado correctamente")
except ImportError as e:
    print(f"‚ùå Error al importar Unsloth: {e}")
    print("üí° Intenta reiniciar el runtime y ejecutar de nuevo")

## üî¥ Error 4: Expected all tensors to be on the same device

**Soluci√≥n:**

In [None]:
# üîß SOLUCI√ìN PARA ERRORES DE DISPOSITIVO

import torch

def check_device_setup():
    """Verificar configuraci√≥n de dispositivos"""
    print("üîç Verificando configuraci√≥n de dispositivos...")
    
    # Verificar CUDA
    cuda_available = torch.cuda.is_available()
    print(f"CUDA disponible: {cuda_available}")
    
    if cuda_available:
        device_count = torch.cuda.device_count()
        current_device = torch.cuda.current_device()
        device_name = torch.cuda.get_device_name(current_device)
        
        print(f"Dispositivos GPU: {device_count}")
        print(f"GPU actual: {current_device} ({device_name})")
        
        # Configurar dispositivo por defecto
        torch.cuda.set_device(0)
        print("‚úÖ Dispositivo GPU configurado")
    else:
        print("‚ö†Ô∏è Usando CPU - el entrenamiento ser√° m√°s lento")

def fix_model_device(model, tokenizer):
    """Asegurar que modelo y tokenizer est√©n en el dispositivo correcto"""
    device = "cuda" if torch.cuda.is_available() else "cpu"
    
    # Mover modelo al dispositivo
    if hasattr(model, 'to'):
        model = model.to(device)
        print(f"‚úÖ Modelo movido a {device}")
    
    # Configurar tokenizer
    if hasattr(tokenizer, 'pad_token') and tokenizer.pad_token is None:
        tokenizer.pad_token = tokenizer.eos_token
        print("‚úÖ Pad token configurado")
    
    return model, tokenizer

# Ejecutar verificaci√≥n
check_device_setup()

print("\nüí° Si el error persiste:")
print("1. Reinicia el runtime")
print("2. Aseg√∫rate de usar FastLanguageModel.from_pretrained()")
print("3. No mezcles operaciones CPU/GPU manualmente")

## üî¥ Error 5: Conflictos de Versiones

**Instalaci√≥n limpia con versiones compatibles:**

In [None]:
# üîß INSTALACI√ìN LIMPIA CON VERSIONES COMPATIBLES

print("üßπ Limpiando instalaciones previas...")

# Desinstalar paquetes problem√°ticos
packages_to_remove = [
    "unsloth", "unsloth-zoo", "xformers", "trl", 
    "transformers", "accelerate", "peft", "bitsandbytes"
]

for package in packages_to_remove:
    %pip uninstall -y {package} --quiet

print("üì¶ Instalando versiones compatibles...")

# Instalar versiones espec√≠ficas compatibles
compatible_packages = {
    "protobuf": "<=3.20.3",
    "transformers": ">=4.36.0",
    "accelerate": ">=0.21.0",
    "peft": ">=0.4.0",
    "bitsandbytes": ">=0.41.0",
    "trl": "<0.9.0",
    "xformers": "<0.0.27"
}

for package, version in compatible_packages.items():
    print(f"Installing {package}{version}...")
    %pip install "{package}{version}" --quiet

# Instalar Unsloth al final
print("Installing Unsloth...")
%pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git" --quiet

print("\n‚úÖ Instalaci√≥n limpia completada")
print("‚ö†Ô∏è IMPORTANTE: Reinicia el runtime antes de continuar")
print("   Runtime > Restart Runtime")

## üî¥ Error 6: Errores de Tokenizaci√≥n

**Problemas comunes con tokens y chat templates:**

In [None]:
# üîß SOLUCI√ìN PARA ERRORES DE TOKENIZACI√ìN

def fix_tokenizer_issues(tokenizer):
    """Solucionar problemas comunes de tokenizaci√≥n"""
    print("üîß Configurando tokenizer...")
    
    # Configurar pad token si no existe
    if tokenizer.pad_token is None:
        tokenizer.pad_token = tokenizer.eos_token
        print("‚úÖ Pad token configurado")
    
    # Configurar padding side
    tokenizer.padding_side = "right"
    print("‚úÖ Padding side configurado")
    
    # Verificar tokens especiales
    special_tokens = {
        "bos_token": tokenizer.bos_token,
        "eos_token": tokenizer.eos_token,
        "pad_token": tokenizer.pad_token,
        "unk_token": tokenizer.unk_token
    }
    
    print("üìã Tokens especiales:")
    for name, token in special_tokens.items():
        print(f"   {name}: {token}")
    
    return tokenizer

def test_chat_template(tokenizer):
    """Probar chat template"""
    print("üß™ Probando chat template...")
    
    # Mensaje de prueba
    messages = [
        {"from": "human", "value": "Hola, ¬øc√≥mo est√°s?"},
        {"from": "gpt", "value": "¬°Hola! Estoy bien, gracias por preguntar."}
    ]
    
    try:
        # Aplicar template
        formatted = tokenizer.apply_chat_template(
            messages, 
            tokenize=False, 
            add_generation_prompt=False
        )
        print("‚úÖ Chat template funcionando")
        print("üìù Ejemplo formateado:")
        print(formatted[:200] + "...")
        
    except Exception as e:
        print(f"‚ùå Error en chat template: {e}")
        print("üí° Soluci√≥n: Configurar template manualmente")

# Ejemplo de uso (descomenta cuando tengas un tokenizer)
# tokenizer = fix_tokenizer_issues(tokenizer)
# test_chat_template(tokenizer)

print("üí° Ejecuta estas funciones despu√©s de cargar tu tokenizer")

## ‚ö° Soluciones R√°pidas

### Comandos de emergencia:

In [None]:
# üö® COMANDOS DE EMERGENCIA

def emergency_reset():
    """Reset completo del entorno"""
    print("üö® RESET DE EMERGENCIA")
    
    # Limpiar memoria
    import gc
    import torch
    
    if torch.cuda.is_available():
        torch.cuda.empty_cache()
    gc.collect()
    
    # Variables de entorno
    import os
    os.environ["PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION"] = "python"
    os.environ["TOKENIZERS_PARALLELISM"] = "false"
    
    print("‚úÖ Reset completado")
    print("‚ö†Ô∏è Reinicia el runtime si los problemas persisten")

def check_environment():
    """Verificar entorno completo"""
    print("üîç DIAGN√ìSTICO COMPLETO")
    print("=" * 40)
    
    # Python version
    import sys
    print(f"Python: {sys.version}")
    
    # PyTorch
    try:
        import torch
        print(f"PyTorch: {torch.__version__}")
        print(f"CUDA: {torch.cuda.is_available()} ({torch.version.cuda if torch.cuda.is_available() else 'N/A'})")
    except ImportError:
        print("‚ùå PyTorch no instalado")
    
    # Transformers
    try:
        import transformers
        print(f"Transformers: {transformers.__version__}")
    except ImportError:
        print("‚ùå Transformers no instalado")
    
    # Unsloth
    try:
        import unsloth
        print(f"Unsloth: ‚úÖ Instalado")
    except ImportError:
        print("‚ùå Unsloth no instalado")
    
    # Protobuf
    try:
        import google.protobuf
        print(f"Protobuf: {google.protobuf.__version__}")
    except ImportError:
        print("‚ùå Protobuf no instalado")
    
    print("=" * 40)

# Ejecutar diagn√≥stico
check_environment()
emergency_reset()

## üõ°Ô∏è Prevenci√≥n de Errores

### Mejores pr√°cticas para evitar problemas:

In [None]:
# üõ°Ô∏è MEJORES PR√ÅCTICAS

def setup_best_practices():
    """Configuraci√≥n preventiva"""
    print("üõ°Ô∏è Configurando mejores pr√°cticas...")
    
    import os
    import warnings
    
    # Variables de entorno preventivas
    env_vars = {
        "PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION": "python",
        "TOKENIZERS_PARALLELISM": "false",
        "CUDA_LAUNCH_BLOCKING": "1",  # Para debugging CUDA
        "PYTHONWARNINGS": "ignore",   # Reducir warnings
    }
    
    for key, value in env_vars.items():
        os.environ[key] = value
        print(f"‚úÖ {key} = {value}")
    
    # Suprimir warnings comunes
    warnings.filterwarnings("ignore", category=UserWarning)
    warnings.filterwarnings("ignore", category=FutureWarning)
    
    print("\nüìã CHECKLIST ANTES DE ENTRENAR:")
    checklist = [
        "‚úÖ Protobuf <= 3.20.3 instalado",
        "‚úÖ Variables de entorno configuradas",
        "‚úÖ GPU memory < 80% de uso",
        "‚úÖ Batch size apropiado para tu GPU",
        "‚úÖ Dataset cargado correctamente",
        "‚úÖ Chat template configurado",
        "‚úÖ Modelo y tokenizer en mismo dispositivo"
    ]
    
    for item in checklist:
        print(f"   {item}")
    
    print("\nüí° TIPS ADICIONALES:")
    tips = [
        "Siempre reinicia runtime despu√©s de instalar paquetes",
        "Usa versiones espec√≠ficas en lugar de 'latest'",
        "Guarda checkpoints frecuentemente",
        "Monitorea uso de memoria durante entrenamiento",
        "Prueba con datasets peque√±os primero"
    ]
    
    for tip in tips:
        print(f"   üí° {tip}")

# Ejecutar configuraci√≥n
setup_best_practices()

## üéØ Resumen de Soluciones

### üîß Orden recomendado para solucionar problemas:

1. **Ejecutar emergency_reset()** - Limpia memoria y configura variables
2. **Instalar protobuf <= 3.20.3** - Soluciona el error m√°s com√∫n
3. **Reinstalar Unsloth** - Con versiones compatibles
4. **Reiniciar runtime** - Aplicar cambios
5. **Verificar GPU memory** - Ajustar batch_size si es necesario
6. **Probar con dataset peque√±o** - Validar configuraci√≥n

### üìû Si nada funciona:
- Usa Google Colab Pro para m√°s memoria
- Prueba con CPU (m√°s lento pero funcional)
- Considera usar modelos m√°s peque√±os
- Revisa la documentaci√≥n oficial de Unsloth

### üÜò Recursos de ayuda:
- [Unsloth GitHub Issues](https://github.com/unslothai/unsloth/issues)
- [Hugging Face Forum](https://discuss.huggingface.co/)
- [PyTorch Troubleshooting](https://pytorch.org/docs/stable/notes/faq.html)

---
**Meta Day Uruguay 2025** - M√≥dulo 4: Troubleshooting üá∫üáæ