# Conectar con LLMs locales y remotos

**Curso: Inteligencia Artificial Generativa – Conexión con Modelos de Lenguaje**


In [1]:
!pip install openai dotenv gradio




[notice] A new release of pip available: 22.3.1 -> 25.2
[notice] To update, run: python.exe -m pip install --upgrade pip


In [2]:
from dotenv import load_dotenv
load_dotenv(override=True)

True

In [3]:
import os
open_router_api_key = os.getenv('OPEN_ROUTER_API_KEY')
gemini_api_key = os.getenv('GEMINI_API_KEY')
groq_api_key = os.getenv('GROQ_API_KEY')

# OpenRouterAI

In [4]:
from openai import OpenAI


open_router_ai = OpenAI(
  base_url="https://openrouter.ai/api/v1",
  api_key=open_router_api_key,
)
completion = open_router_ai.chat.completions.create(
  extra_headers={
    "HTTP-Referer": "MI PAGINA o APP",
    "X-Title": "ANDY CODE",
  },
  model="anthropic/claude-sonnet-4.5",
  messages=[
    {
      "role": "user",
      "content": "Que es AI"
    }
  ]
)
print(completion.choices[0].message.content)

# ¿Qué es la AI (Inteligencia Artificial)?

La **Inteligencia Artificial (AI o IA)** es una rama de la informática que busca crear sistemas capaces de realizar tareas que normalmente requieren inteligencia humana.

## Capacidades principales:

- **Aprendizaje**: Mejorar con la experiencia
- **Razonamiento**: Resolver problemas y tomar decisiones
- **Percepción**: Reconocer patrones, imágenes, voz
- **Comprensión del lenguaje**: Entender y generar texto
- **Adaptación**: Ajustarse a nuevas situaciones

## Ejemplos cotidianos:

- Asistentes virtuales (Siri, Alexa, Google Assistant)
- Recomendaciones en Netflix o Spotify
- Reconocimiento facial en smartphones
- Traducción automática
- Vehículos autónomos
- Chatbots como yo

## Tipos principales:

1. **IA débil o estrecha**: Diseñada para tareas específicas (la que existe actualmente)
2. **IA general**: Hipotética IA con capacidades humanas completas (aún no existe)

La AI moderna funciona principalmente mediante **machine learning** (apre

# Google AI

In [5]:
gemini = OpenAI(api_key=gemini_api_key, base_url="https://generativelanguage.googleapis.com/v1beta/openai/")
model_name = "gemini-2.5-flash"

response = gemini.chat.completions.create(model=model_name, messages=[
    {
      "role": "user",
      "content": "Que es AI"
    }
  ])
answer = response.choices[0].message.content
answer

'**AI** son las siglas de **Inteligencia Artificial** (del inglés Artificial Intelligence).\n\nEn su esencia, la AI se refiere a la capacidad de las máquinas para **simular la inteligencia humana**. Esto significa que las computadoras o sistemas pueden realizar tareas que normalmente requieren pensamiento, aprendizaje, resolución de problemas y toma de decisiones por parte de un ser humano.\n\n**¿Qué busca la AI?**\n\nEl objetivo principal de la AI es crear sistemas que puedan:\n\n1.  **Aprender:** Adquirir conocimientos y habilidades a partir de datos y experiencia, sin ser programados explícitamente para cada situación. (Aquí es donde entra el Machine Learning).\n2.  **Razonar:** Utilizar la lógica para llegar a conclusiones a partir de la información disponible.\n3.  **Resolver problemas:** Identificar y encontrar soluciones a desafíos específicos.\n4.  **Percepción:** Interpretar información del entorno a través de sensores (como cámaras o micrófonos), similar a cómo los humanos us

# Ollama


In [6]:
ollama = OpenAI(base_url='http://localhost:11434/v1', api_key='ollama')
model_name = "llama3"

response = ollama.chat.completions.create(model=model_name, messages=[
    {
      "role": "user",
      "content": "Que es AI"
    }
  ])
answer = response.choices[0].message.content
answer

'La pregunta definitiva en el siglo XXI!\n\nAI (Inteligencia Artificial) se refiere al desarrollo de sistemas y programas que pueden imitar habilidades humanas, como el pensamiento, la toma de decisiones o la percepción. Estos sistemas utilizan algoritmos informáticos y datos para simular inteligencia, aprendizaje y adaptación.\n\nLa IA se basa en various disciplines, incluyendo:\n\n1. **Informática**: La creación de programas que pueden procesar información, hacer cálculos y tomar decisiones.\n2. **Psicología**: El estudio del comportamiento humano y la motivación para crear sistemas que pueden imitar la forma en que los seres humanos piensan y se comportan.\n3. **Economía**: La comprensión de cómo las instituciones y los mercados funcionan y cómo los sistemas puede influir en ellos.\n4. **Biología**: El estudio del cerebro humano y como funciona para crear sistemas que pueden imitar la forma en que el cerebro humano procesa información.\n\nLa IA se ha dividido en diferentes áreas, in

# Grog

In [7]:
groq_api_key = os.getenv('GROQ_API_KEY')
grog_ai = OpenAI(api_key=groq_api_key, base_url="https://api.groq.com/openai/v1")
model_name = "llama-3.3-70b-versatile"

response = grog_ai.chat.completions.create(model=model_name, messages=[
    {
      "role": "user",
      "content": "Que es AI"
    }
  ])
answer = response.choices[0].message.content
answer


'**Introducción a la Inteligencia Artificial (IA)**\n\nLa Inteligencia Artificial (IA), también conocida como Artificial Intelligence (AI) en inglés, se refiere a la creación de sistemas informáticos capaces de realizar tareas que normalmente requieren inteligencia humana, como la comprensión del lenguaje, el aprendizaje, la resolución de problemas y la toma de decisiones.\n\n**Orígenes y evolución**\n\nLa IA tiene sus raíces en la década de 1950, cuando los investigadores comenzaron a explorar la posibilidad de crear máquinas que pudieran pensar y aprender como los seres humanos. Desde entonces, la IA ha evolucionado significativamente, con avances en áreas como la informática, la estadística y la ingeniería.\n\n**Tipos de IA**\n\nExisten varios tipos de IA, que se pueden clasificar en:\n\n1. **IA débil**: se enfoca en la resolución de problemas específicos y no tiene la capacidad de razonar o aprender de manera general.\n2. **IA fuerte**: se enfoca en la creación de sistemas que pued

https://colab.research.google.com/drive/1N0DnlJvVPVAammqPi6XRksbQ67qUgLWD#scrollTo=VF9EZrr_nZ4F

In [8]:
ollama = OpenAI(base_url='http://localhost:11434/v1', api_key='ollama')
model_name = "llama3"

def chat(message, history):
    try:
        messages = [
            {"role": "system", "content": "Eres un asistente de IA que responde preguntas y ayuda con tareas."}
        ]

        for msg in history:
            if msg["role"] == "user":
                messages.append({"role": "user", "content": msg["content"]})
            elif msg["role"] == "assistant":
                messages.append({"role": "assistant", "content": msg["content"]})

        messages.append({"role": "user", "content": message})

        resp = ollama.chat.completions.create(
            model=model_name,
            messages=messages,
        )
        return resp.choices[0].message.content
    except Exception as e:
        print(f"Error: {e}")
        return f"Error: {e}"



In [9]:
import gradio as gr

clients = {
    "Llama3 (Ollama)": OpenAI(base_url="http://localhost:11434/v1", api_key="ollama"),
    "OpenRouter": OpenAI(base_url="https://openrouter.ai/api/v1", api_key=open_router_api_key),
    "Gemini": OpenAI(base_url="https://generativelanguage.googleapis.com/v1beta/openai/", api_key=gemini_api_key),
    "Groq": OpenAI(base_url="https://api.groq.com/openai/v1", api_key=groq_api_key),
}

default_models = {
    "Llama3 (Ollama)": "llama3",
    "OpenRouter": "anthropic/claude-sonnet-4.5",
    "Gemini": "gemini-2.5-flash",
    "Groq": "llama-3.3-70b-versatile",
}

# --- Función principal de chat ---
def chat(message, history, selected_model):
    # Convertir historial de Gradio a formato OpenAI
    messages = []
    for human, bot in history:
        messages.append({"role": "user", "content": human})
        messages.append({"role": "assistant", "content": bot})
    messages.append({"role": "user", "content": message})

    # Cliente y modelo según selección
    client = clients[selected_model]
    model_name = default_models[selected_model]

    # Llamada al modelo
    response = client.chat.completions.create(
        model=model_name,
        messages=messages
    )
    return response.choices[0].message.content

# --- Interfaz con selector ---
with gr.Blocks() as demo:
    gr.Markdown("### 🤖 Chat Multi-Modelo (Ollama, Gemini, Groq, OpenRouter)")

    model_choice = gr.Dropdown(
        choices=list(clients.keys()),
        value="Llama3 (Ollama)",
        label="Selecciona el modelo"
    )

    chat_ui = gr.ChatInterface(
        fn=chat,
        additional_inputs=[model_choice],
        title="Chat MLOps",
    )

demo.launch()

  from .autonotebook import tqdm as notebook_tqdm
  self.chatbot = Chatbot(


* Running on local URL:  http://127.0.0.1:7861
* To create a public link, set `share=True` in `launch()`.




In [10]:
# ===============================================
# Switchable LLM App con Gradio
# ===============================================
import time

# --- Configura tus claves (pon tus tokens aquí) ---
OPENROUTER_API_KEY = open_router_api_key
GEMINI_API_KEY = gemini_api_key
GROQ_API_KEY = groq_api_key

# --- Configuración de proveedores ---
providers = {
    "Ollama": {
        "client": OpenAI(base_url="http://localhost:11434/v1", api_key="ollama"),
        "models": ["llama3"]
    },
    "OpenRouter": {
        "client": OpenAI(base_url="https://openrouter.ai/api/v1", api_key=OPENROUTER_API_KEY),
        "models": ["anthropic/claude-sonnet-4.5", "mistralai/mixtral-8x7b"]
    },
    "Gemini": {
        "client": OpenAI(base_url="https://generativelanguage.googleapis.com/v1beta/openai/", api_key=GEMINI_API_KEY),
        "models": ["gemini-2.5-flash", "gemini-2.5-pro"]
    },
    "Groq": {
        "client": OpenAI(base_url="https://api.groq.com/openai/v1", api_key=GROQ_API_KEY),
        "models": ["llama-3.3-70b-versatile", "mixtral-8x7b"]
    },
}

# --- Función principal ---
def process_text(provider, task, model, input_text,archivo):
    if archivo is not None:
        try:
            with open(archivo.name, "r", encoding="utf-8") as f:
                input_text = f.read()
        except Exception as e:
            return f"❌ Error leyendo el archivo: {e}", None, None, None
    
    if not input_text.strip():
        return "⚠️ Ingresa un texto para procesar.", None, None, None

    client = providers[provider]["client"]

    prompt = ""
    # Prompt según tarea
    if task == "Traducción EN→ES":
        prompt = f"Traduce el siguiente texto del inglés al español:\n\n{input_text}"
    elif task == "Resumen":
        prompt = f"Resume el siguiente texto de manera breve y clara:\n\n{input_text}"
    elif task == "Análisis de sentimiento":
        prompt = (
            f"Analiza el sentimiento del siguiente texto. "
            f"Responde si es positivo, negativo o neutral, y explica brevemente:\n\n{input_text}"
        )
    else:
        return "❌ Tarea no reconocida.", None, None, None

    try:
        start_time = time.time()

        response = client.chat.completions.create(
            model=model,
            messages=[{"role": "user", "content": prompt}]
        )

        output_text = response.choices[0].message.content.strip()
        elapsed = round(time.time() - start_time, 2)

        return (
            output_text,
            f"{elapsed} s",
            len(input_text.split()),
            len(output_text.split())
        )

    except Exception as e:
        return f"❌ Error: {str(e)}", None, None, None


# --- Interfaz Gradio ---
with gr.Blocks(title="Switchable LLM App") as demo:
    gr.Markdown("# 🤖 Switchable LLM App con Gradio")
    gr.Markdown("Selecciona el **proveedor**, el **modelo** y la **tarea** que deseas ejecutar.")

    with gr.Row():
        provider = gr.Dropdown(label="Proveedor", choices=list(providers.keys()), value="Ollama")
        task = gr.Dropdown(
            label="Tarea",
            choices=["Traducción EN→ES", "Resumen", "Análisis de sentimiento"],
            value="Traducción EN→ES"
        )


    model = gr.Dropdown(label="Modelo", choices=providers["Ollama"]["models"], value="llama3")

    # Actualiza modelos según el proveedor seleccionado
    def update_models(selected_provider):
        return gr.update(choices=providers[selected_provider]["models"], value=providers[selected_provider]["models"][0])

    provider.change(update_models, inputs=provider, outputs=model)

    input_text = gr.Textbox(lines=8, label="Texto de entrada")
    archivo_input = gr.File(label="Sube un archivo .txt (opcional)", file_types=[".txt"])
    output_text = gr.Textbox(lines=8, label="Resultado", interactive=False)

    with gr.Row():
        time_box = gr.Textbox(label="⏱️ Tiempo de inferencia", interactive=False)
        in_len = gr.Textbox(label="🔤 Palabras input", interactive=False)
        out_len = gr.Textbox(label="💬 Palabras output", interactive=False)

    run_button = gr.Button("🚀 Procesar")

    run_button.click(
        fn=process_text,
        inputs=[provider, task, model, input_text, archivo_input],
        outputs=[output_text, time_box, in_len, out_len]
    )

demo.launch()


* Running on local URL:  http://127.0.0.1:7862
* To create a public link, set `share=True` in `launch()`.


