<a href="https://colab.research.google.com/github/CamiloVga/Curso-IA-Aplicada/blob/main/LLMs_con_Ollama_en_Colab.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# LLMs con Ollama en Google Colab

Por [Camilo Vega](https://www.linkedin.com/in/camilo-vega-169084b1/), Consultor en IA

Este script permite ejecutar modelos de lenguaje usando Ollama en Colab de forma gratuita.

## Estructura del script

1. **Instalación**: Configura Ollama y descarga el modelo (ejecutar una vez)
2. **Funciones**: Define métodos para interactuar con el modelo
3. **Inferencia**: Sección para hacer consultas (ejecutable independientemente)

## Uso rápido

```python
# Hacer una consulta básica
preguntar("¿Qué es el aprendizaje profundo?")

# Ajustar parámetros
preguntar("Escribe un poema corto", temp=0.9, tokens=200)
```

Parámetros principales:
- **temp**: Controla creatividad (0-1)
- **tokens**: Limita longitud de respuesta



In [1]:
"""
Script para instalar Ollama, descargar un modelo y mostrar solo la respuesta limpia
La inferencia se encuentra al final para facilitar nuevas consultas
"""

############# PARTE 1: CONFIGURACIÓN E INSTALACIÓN #############

# Modelo a utilizar (cambiar esto para usar un modelo diferente)
modelo = "llama2:7b"

# 1. Instalar Ollama en Colab (solo es necesario ejecutar una vez)
print("Instalando Ollama...")
!curl -fsSL https://ollama.com/install.sh | sh

# 2. Iniciar el servidor de Ollama en segundo plano
print("\nIniciando servidor Ollama...")
!pkill ollama || true
!nohup /usr/local/bin/ollama serve > ollama_output.log 2>&1 &

# 3. Esperar a que el servidor de Ollama inicie completamente
import time
print("Esperando a que el servidor Ollama esté listo...")
time.sleep(15)

# 4. Verificar que el servidor esté respondiendo
print("\nVerificando que el servidor Ollama esté respondiendo...")
!curl -s http://localhost:11434/api/tags || echo "El servidor Ollama no está respondiendo"

# 5. Descargar el modelo especificado
print(f"\nDescargando modelo {modelo} desde Ollama...")
!ollama pull {modelo}
print(f"Modelo {modelo} descargado correctamente.")

############# PARTE 2: FUNCIONES DE INFERENCIA #############

# Función para obtener la respuesta del modelo con hiperparámetros
def generar_respuesta(prompt, modelo=modelo, temperatura=0.7, max_tokens=2048):
    """
    Genera una respuesta del modelo y muestra solo el texto de la respuesta.

    Args:
        prompt: El texto de entrada para el modelo
        modelo: El nombre del modelo a usar
        temperatura: Valor entre 0 y 1 que controla la creatividad/aleatoriedad (0=determinista, 1=creativo)
        max_tokens: Número máximo de tokens en la respuesta

    Returns:
        La respuesta del modelo sin JSON
    """
    import subprocess
    import json

    print(f"\nConsultando a {modelo}...\n")
    print(f"Prompt: {prompt}")
    print(f"Temperatura: {temperatura}, Max tokens: {max_tokens}\n")

    # Usamos curl para hacer la petición y procesamos el resultado
    comando = f"""
    curl -s http://localhost:11434/api/generate -d '{{
      "model": "{modelo}",
      "prompt": "{prompt}",
      "stream": false,
      "temperature": {temperatura},
      "num_predict": {max_tokens}
    }}'
    """

    resultado = subprocess.check_output(comando, shell=True)
    respuesta_json = json.loads(resultado)

    # Extraemos solo el texto de la respuesta
    respuesta_texto = respuesta_json.get('response', 'No se obtuvo respuesta')

    print("Respuesta:")
    print("-" * 80)
    print(respuesta_texto)
    print("-" * 80)

    return respuesta_texto

# Función simplificada para hacer preguntas rápidas
def preguntar(nuevo_prompt, temp=0.7, tokens=2048):
    """
    Función sencilla para hacer una nueva pregunta

    Args:
        nuevo_prompt: La pregunta o instrucción para el modelo
        temp: Temperatura (0-1)
        tokens: Longitud máxima de la respuesta
    """
    return generar_respuesta(nuevo_prompt, modelo, temp, tokens)



Instalando Ollama...
>>> Installing ollama to /usr/local
>>> Downloading Linux amd64 bundle
######################################################################## 100.0%
>>> Creating ollama user...
>>> Adding ollama user to video group...
>>> Adding current user to ollama group...
>>> Creating ollama systemd service...
>>> The Ollama API is now available at 127.0.0.1:11434.
>>> Install complete. Run "ollama" from the command line.

Iniciando servidor Ollama...
Esperando a que el servidor Ollama esté listo...

Verificando que el servidor Ollama esté respondiendo...
{"models":[]}
Descargando modelo llama2:7b desde Ollama...
[?2026h[?25l[1Gpulling manifest ⠋ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠙ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠸ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠸ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠼ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠦ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠦ [K[?2

In [2]:
############# PARTE 3: INFERENCIA #############


# Configura tu prompt aquí
prompt = "Explícame qué es el Deep Learning en términos simples."

# Parámetros para controlar la respuesta
temperatura = 0.7    # 0.0 = determinista, 1.0 = creativo
max_tokens = 2048    # Longitud máxima de la respuesta

# Ejecutar la inferencia
respuesta = generar_respuesta(prompt, modelo, temperatura, max_tokens)




Consultando a llama2:7b...

Prompt: Explícame qué es el Deep Learning en términos simples.
Temperatura: 0.7, Max tokens: 2048

Respuesta:
--------------------------------------------------------------------------------

¡Claro! Deep learning (aprendizaje profundo) es una rama del aprendizaje automático que utiliza redes neuronales artificiales para analizar y procesar grandes cantidades de datos. En términos simples, el deep learning es un tipo de algoritmo de aprendizaje automático que utiliza capas de neuronas interconectadas para aprender a extraer características y patrones de datos complejos.

Imagina que tienes una caja llena de juguetes de diferentes colores y formas. Si intentas organizar los juguetes en función de su color o forma, es posible que te encuentres con algunos problemas: los juguetes pueden tener múltiples características, como coloración y forma, y puede ser difícil separarlos en diferentes categorías.

Este es el problema que se enfrenta el deep learning. En lug