# ü¶ô Usar Modelo Fine-tuneado con Ollama

## Meta Day Uruguay 2025 - Conexi√≥n M√≥dulo 4 ‚Üí M√≥dulo 5

Este notebook muestra c√≥mo usar el modelo que fine-tuneaste en el notebook anterior con **Ollama** para crear un sistema de chat local.

### Prerrequisitos:
1. Haber completado el fine-tuning con Unsloth
2. Tener los archivos GGUF exportados
3. Ollama instalado localmente

### Lo que aprender√°s:
- Importar tu modelo fine-tuneado a Ollama
- Crear un Modelfile personalizado
- Configurar par√°metros de inferencia
- Probar el modelo en un chat interactivo

## üîß Configuraci√≥n Inicial

### Verificar instalaci√≥n de Ollama

In [None]:
import subprocess
import os
import json
from pathlib import Path

def run_command(command):
    """Ejecuta un comando y retorna el resultado"""
    try:
        result = subprocess.run(command, shell=True, capture_output=True, text=True)
        return result.stdout.strip(), result.stderr.strip(), result.returncode
    except Exception as e:
        return "", str(e), 1

# Verificar si Ollama est√° instalado
stdout, stderr, code = run_command("ollama --version")
if code == 0:
    print(f"‚úÖ Ollama instalado: {stdout}")
else:
    print("‚ùå Ollama no est√° instalado")
    print("üì• Descarga desde: https://ollama.ai")
    print("üí° O instala con: curl -fsSL https://ollama.ai/install.sh | sh")

## üìù Crear Modelfile Personalizado

Un Modelfile define c√≥mo Ollama debe cargar y configurar tu modelo:

In [None]:
# Configuraci√≥n del modelo
model_name = "llama3.1-metaday-finetune"
gguf_path = "./gguf_model/model-q4_k_m.gguf"  # Ajusta la ruta seg√∫n tu exportaci√≥n

# Crear Modelfile
modelfile_content = f"""# Modelo Llama 3.1 Fine-tuneado - Meta Day Uruguay 2025
FROM {gguf_path}

# Template de chat (ChatML)
TEMPLATE """<|im_start|>system
{{ .System }}<|im_end|>
<|im_start|>user
{{ .Prompt }}<|im_end|>
<|im_start|>assistant
"""

# Par√°metros de inferencia optimizados
PARAMETER temperature 0.7
PARAMETER top_p 0.9
PARAMETER top_k 40
PARAMETER repeat_penalty 1.1
PARAMETER num_ctx 2048

# Mensaje del sistema
SYSTEM """Eres un asistente de IA √∫til y conocedor, entrenado durante el Meta Day Uruguay 2025. 
Respondes de manera clara, precisa y educativa. Siempre intentas ser √∫til y proporcionar 
informaci√≥n valiosa al usuario."""
"""

# Guardar Modelfile
with open("Modelfile", "w", encoding="utf-8") as f:
    f.write(modelfile_content)

print("‚úÖ Modelfile creado")
print("üìÑ Contenido:")
print("=" * 50)
print(modelfile_content)
print("=" * 50)

## üì¶ Importar Modelo a Ollama

In [None]:
# Verificar que el archivo GGUF existe
if os.path.exists(gguf_path):
    print(f"‚úÖ Archivo GGUF encontrado: {gguf_path}")
    
    # Crear el modelo en Ollama
    print(f"üì¶ Importando modelo '{model_name}' a Ollama...")
    stdout, stderr, code = run_command(f"ollama create {model_name} -f Modelfile")
    
    if code == 0:
        print("üéâ ¬°Modelo importado exitosamente!")
        print(f"üìù Salida: {stdout}")
    else:
        print(f"‚ùå Error al importar: {stderr}")
else:
    print(f"‚ùå Archivo GGUF no encontrado: {gguf_path}")
    print("üí° Aseg√∫rate de haber ejecutado la exportaci√≥n GGUF en el notebook anterior")
    print("üí° O ajusta la variable 'gguf_path' con la ruta correcta")

## üìã Verificar Modelos Disponibles

In [None]:
# Listar modelos en Ollama
print("üìã Modelos disponibles en Ollama:")
stdout, stderr, code = run_command("ollama list")

if code == 0:
    print(stdout)
    
    # Verificar si nuestro modelo est√° en la lista
    if model_name in stdout:
        print(f"\n‚úÖ Tu modelo '{model_name}' est√° listo para usar")
    else:
        print(f"\n‚ö†Ô∏è Modelo '{model_name}' no encontrado en la lista")
else:
    print(f"‚ùå Error al listar modelos: {stderr}")

## üß™ Probar el Modelo

In [None]:
def chat_with_model(prompt, model=model_name):
    """Funci√≥n para chatear con el modelo"""
    print(f"ü§ñ Pregunta: {prompt}")
    print(f"üí≠ Respuesta de {model}:")
    print("-" * 50)
    
    # Ejecutar ollama run
    command = f'ollama run {model} "{prompt}"'
    stdout, stderr, code = run_command(command)
    
    if code == 0:
        print(stdout)
    else:
        print(f"‚ùå Error: {stderr}")
    
    print("=" * 50)

# Pruebas del modelo
test_prompts = [
    "¬øQu√© aprendiste durante tu fine-tuning en el Meta Day Uruguay 2025?",
    "Explica qu√© es LoRA en t√©rminos simples",
    "¬øCu√°les son las ventajas de usar Unsloth para fine-tuning?",
    "¬øEs 9.11 mayor que 9.9? Explica tu razonamiento."
]

print("üß™ Probando el modelo fine-tuneado...\n")

for i, prompt in enumerate(test_prompts, 1):
    print(f"\nüîç Prueba {i}/{len(test_prompts)}")
    chat_with_model(prompt)

print("\n‚úÖ Todas las pruebas completadas")

## üí¨ Chat Interactivo (Opcional)

Para un chat m√°s interactivo, puedes usar la terminal:

In [None]:
print("üí¨ Para iniciar un chat interactivo, ejecuta en tu terminal:")
print(f"   ollama run {model_name}")
print("\nüîß Comandos √∫tiles:")
print(f"   ollama show {model_name}           # Ver informaci√≥n del modelo")
print(f"   ollama rm {model_name}             # Eliminar el modelo")
print(f"   ollama pull llama3.1               # Descargar modelo base")
print(f"   ollama list                        # Listar todos los modelos")

print("\nüåê Tambi√©n puedes usar la API REST de Ollama:")
print("   curl http://localhost:11434/api/generate -d '{")
print(f'     "model": "{model_name}",")
print('     "prompt": "Tu pregunta aqu√≠"')
print("   }'")

## üîå Ejemplo de API REST

In [None]:
import requests
import json

def chat_via_api(prompt, model=model_name):
    """Usar la API REST de Ollama"""
    url = "http://localhost:11434/api/generate"
    data = {
        "model": model,
        "prompt": prompt,
        "stream": False
    }
    
    try:
        response = requests.post(url, json=data, timeout=30)
        if response.status_code == 200:
            result = response.json()
            return result.get("response", "Sin respuesta")
        else:
            return f"Error HTTP: {response.status_code}"
    except requests.exceptions.RequestException as e:
        return f"Error de conexi√≥n: {e}"

# Probar API (solo si Ollama est√° ejecut√°ndose)
print("üîå Probando API REST de Ollama...")
test_prompt = "Hola, ¬øc√≥mo est√°s?"
response = chat_via_api(test_prompt)
print(f"Pregunta: {test_prompt}")
print(f"Respuesta: {response}")

## üéØ Resumen y Pr√≥ximos Pasos

### ‚úÖ Lo que hemos logrado:
- Importado tu modelo fine-tuneado a Ollama
- Configurado un Modelfile personalizado con ChatML template
- Probado el modelo con diferentes preguntas
- Aprendido a usar la API REST de Ollama

### üöÄ Conexi√≥n con M√≥dulo 5 (RAG):
Ahora puedes usar este modelo fine-tuneado en el **M√≥dulo 5** para:
- Crear un sistema RAG personalizado
- Combinar tu conocimiento fine-tuneado con documentos externos
- Construir un chatbot especializado para tu dominio

### üí° Ideas para expandir:
1. **Integrar con LangChain**: Usar tu modelo en pipelines RAG
2. **Crear una interfaz web**: Usar Streamlit o Gradio
3. **Optimizar par√°metros**: Ajustar temperature, top_p seg√∫n tu uso
4. **Monitorear rendimiento**: Comparar con modelo base
5. **Escalar**: Probar con modelos m√°s grandes (70B)

### üìö Recursos √∫tiles:
- [Ollama Documentation](https://github.com/ollama/ollama) - Documentaci√≥n oficial
- [Modelfile Reference](https://github.com/ollama/ollama/blob/main/docs/modelfile.md) - Referencia completa
- [Ollama API](https://github.com/ollama/ollama/blob/main/docs/api.md) - Documentaci√≥n de API

---
**Meta Day Uruguay 2025** - Puente M√≥dulo 4 ‚Üí M√≥dulo 5 üá∫üáæ