# Clase 3 – Desarrollo de aplicaciones interactivas con servicios web generativos

## **¿Por qué envolver a los modelos generativos en servicios web?**

Un **servicio web** es una forma de poner un modelo “detrás de una puerta” a la que cualquiera puede acceder usando internet o una red interna.
En lugar de que cada persona tenga que instalar y entender el modelo, el servicio web hace el trabajo difícil y solo entrega el resultado.

### **1. ¿Qué problema resuelve?**

* **Facilita el acceso:** cualquiera puede usar el modelo desde un navegador o aplicación sin instalar nada.
* **Centraliza la gestión:** si mejoras o corriges el modelo, solo actualizas el servicio, no a cada usuario.
* **Escala para muchos usuarios:** puedes atender a decenas, cientos o miles de peticiones al mismo tiempo.
* **Seguridad y control:** decides quién puede usarlo, cómo y con qué límites (por ejemplo, cuántas peticiones por minuto).

---

## **2. Casos de uso prácticos**

1. **Chatbots internos para empresas**

   * Ejemplo: un bot que responda preguntas sobre políticas de la empresa.
   * Beneficio: no hay que instalar nada en cada computador; todos acceden por una URL segura.

2. **Asistentes de redacción**

   * Ejemplo: una API que ayude a escribir correos o informes con estilo profesional.
   * Beneficio: se integra fácilmente en aplicaciones como Word o Gmail mediante un botón.

3. **Generación de imágenes para marketing**

   * Ejemplo: un servicio que crea banners o publicaciones automáticas para redes sociales.
   * Beneficio: el equipo de diseño no necesita aprender IA, solo sube texto y recibe la imagen.

4. **Análisis de datos o informes automáticos**

   * Ejemplo: un modelo que resume reportes o hace predicciones sobre ventas.
   * Beneficio: se ejecuta desde un panel web y no desde la computadora del analista.

---


## **1. Patrón: client → API → orquestador → proveedor de modelo**

![Diagrama explicativo](img/img1.png)


* **Client (cliente)** → es la aplicación que usa la IA.
  *Ejemplo:* Una app de chat en tu empresa.

* **API** → es la puerta de entrada. El cliente no habla directo con la IA, sino que envía peticiones a una API (como un “mesero” que lleva tu orden).

* **Orquestador** → es el “cerebro intermedio” que decide *qué modelo usar*, cómo procesar la petición y qué hacer si algo falla.
  *Ejemplo:* si la empresa usa varios modelos (uno barato para pruebas, otro potente para tareas críticas), el orquestador decide cuál usar.

* **Proveedor de modelo** → es quien tiene el modelo generativo: puede ser OpenAI (ChatGPT), HuggingFace o un servidor interno (on-prem).

**¿Por qué se hace así?**
Porque **no conviene conectar la app directo al modelo**:

* Mejor control de seguridad
* Mejor manejo de costos
* Más flexibilidad si cambias de proveedor

---

## **2. Contratos: qué significa eso**

Un *contrato* es como un **acuerdo escrito entre la API y quien la usa**. Incluye:

* **Esquemas** → cómo deben lucir las peticiones y respuestas (qué campos hay, qué datos se esperan).
* **Versionamiento (`/v1/...`)** → si la API cambia, no rompe lo que ya existe.
* **Idempotencia** → si mandas la misma orden dos veces, el resultado debe ser el mismo (para evitar cobros duplicados o errores).
* **Observabilidad** → poder monitorear qué está pasando (tiempos de respuesta, fallos).
* **FinOps** → controlar **cuánto cuesta cada petición**, para no llevarte sorpresas con la factura.

---

## **3. Riesgos y cómo mitigarlos**

Usar modelos generativos no es gratis ni 100% seguro. Algunos problemas típicos:

1. **Inyección de prompt** → alguien mete texto malicioso para engañar al modelo.
   *Solución:* filtrar y validar lo que entra.

2. **Fuga de datos** → la IA podría revelar datos sensibles.
   *Solución:* nunca enviar información privada sin protección.

3. **Overreliance** → confiar ciegamente en la IA y dejar de revisar su trabajo.
   *Solución:* siempre validar los resultados.

4. **DoS (Denial of Service)** → demasiadas peticiones a la API pueden tumbarla.
   *Solución:* poner límites de uso y balanceadores.

5. **Supply chain** → depender de software externo que podría ser vulnerable.
   *Solución:* auditar y actualizar dependencias.

6. **Output inseguro** → el modelo podría generar algo tóxico o peligroso.
   *Solución:* filtros de contenido y revisiones humanas.

---


## Construir **una API de generación de texto** siguiendo la estructura modular:


```
app/
├── api/    
│   └── app.py              # Servidor FastAPI principal
├── client/
│   └── index.html          # Cliente web
├── orchestrator/
│   └── orchestrator.py     # Lógica de negocio
├── provider/
│   └── provider_local.py   # Generador de texto local
└── requirements.txt        # Solo dependencias necesarias
```




## 1) ¿Qué es una **API REST**?

**Definición simple:**
Una API (Interfaz de Programación de Aplicaciones) es un conjunto de reglas que permite que dos programas se comuniquen. **REST** es un estilo para diseñar APIs que usa **HTTP** (el mismo protocolo de la web).

**Analogía para la clase:**
Piensa en un restaurante:

* El **cliente** (navegador o app) hace un pedido (request).
* El **mesero** (API) lleva la orden a la cocina y devuelve la comida (response).
* El **menu** son los recursos que puedes pedir (usuarios, productos, mensajes).

**Propiedades clave de REST:**

* **Stateless (sin estado):** cada petición contiene la información necesaria; el servidor no guarda estado entre peticiones.
* **Recursos identificables:** todo se modela como recursos (p. ej. `/products/123`).
* **Representaciones:** los recursos se devuelven en formatos como JSON.
* **Interfaz uniforme:** uso consistente de métodos HTTP (GET/POST/PUT/DELETE).
* **Caché, capa, código bajo demanda** (mencionar brevemente).

**Verbos (métodos - ejemplo):**

* `GET /products` → obtener lista de productos.
* `GET /products/1` → obtener producto id=1.
* `POST /products` → crear un producto.
* `PUT /products/1` → actualizar producto.
* `DELETE /products/1` → borrar producto.


---

## 2) ¿Qué es **FastAPI**?

FastAPI es un **framework moderno para construir APIs web** en Python. Su principal objetivo es que puedas desarrollar **servicios rápidos, seguros y fáciles de mantener** sin tener que escribir código complicado.

### Características principales:

1. **Rápido (de verdad)**

   * Su nombre no es casualidad: está construido sobre **Starlette** (para la parte web) y **Pydantic** (para la validación de datos).
   * Gracias a esto, aprovecha Python **asíncrono (async/await)**, logrando un rendimiento comparable a Node.js o Go.

2. **Simple y productivo**

   * Permite escribir menos código y lograr más.
   * La sintaxis es clara y directa: con solo unas líneas puedes crear endpoints funcionales.
   * Ideal tanto para proyectos pequeños como grandes aplicaciones empresariales.

3. **Validación automática de datos**

   * Al usar **Pydantic**, valida automáticamente que la información enviada por el cliente tenga el formato correcto (por ejemplo, que un email sea email o que un número no sea texto).

4. **Documentación automática**

   * Sin escribir nada adicional, FastAPI genera una **interfaz interactiva de documentación** en la ruta `/docs` usando **Swagger UI**.
   * También ofrece otra documentación alternativa en `/redoc`.
   * Esto facilita probar los endpoints desde el navegador sin necesidad de usar herramientas externas como Postman.

5. **Compatible con estándares modernos**

   * Sigue las especificaciones **OpenAPI** (antes Swagger), lo que hace fácil integrar tu API con otras aplicaciones y servicios.

---


## **2. Paso a paso del código**

### **requirements.txt**



In [None]:
fastapi
uvicorn
pydantic
python-multipart
httpx
markovify
openai
python-dotenv
google-generativeai

**Ejecutar la siguiente instrucción**

```
pip install -r requirements.txt
```

---

### **provider/provider_local.py**

Módulo que conecta con el modelo. Inicialmente usaremos un modelo *simulado* para que no dependas de credenciales. Luego puedes cambiarlo por OpenAI o HF real.



In [None]:
# provider/provider_local.py
import random
import re

async def generate_text_local(prompt: str) -> str:
    """
    Genera texto usando reglas locales y plantillas.
    """
    try:
        # Convertir prompt a minúsculas para análisis
        prompt_lower = prompt.lower()
        
        # Detectar el tipo de prompt
        if any(word in prompt_lower for word in ['historia', 'cuento', 'story', 'narrar']):
            return generate_story(prompt)
        elif any(word in prompt_lower for word in ['poema', 'poem', 'verso', 'rima']):
            return generate_poem(prompt)
        elif any(word in prompt_lower for word in ['explica', 'explain', 'qué es', 'what is']):
            return generate_explanation(prompt)
        elif any(word in prompt_lower for word in ['describe', 'describe', 'cómo es', 'how is']):
            return generate_description(prompt)
        else:
            return generate_general_response(prompt)
            
    except Exception as e:
        return f"Error al generar texto: {str(e)}"

def generate_story(prompt: str) -> str:
    """Genera una historia corta basada en el prompt."""
    stories = [
        f"Érase una vez, en un lugar muy especial, donde {prompt.lower()} se convirtió en el protagonista de una aventura increíble. La historia comenzó cuando...",
        f"En un mundo lleno de posibilidades, {prompt.lower()} marcó el inicio de algo extraordinario. Los personajes se encontraron y...",
        f"La magia de {prompt.lower()} se desplegó ante los ojos de todos. Era como si el universo entero conspirara para crear algo hermoso..."
    ]
    return random.choice(stories)

def generate_poem(prompt: str) -> str:
    """Genera un poema corto basado en el prompt."""
    poems = [
        f"En el silencio de la noche,\n{prompt.lower()} brilla con luz propia,\ncomo una estrella fugaz\nque ilumina el camino.",
        f"Entre versos y rimas,\n{prompt.lower()} se convierte en arte,\nun suspiro del alma\nque toca el corazón.",
        f"La poesía de {prompt.lower()}\nfluye como un río,\nlleno de emociones\nque nunca se agotan."
    ]
    return random.choice(poems)

def generate_explanation(prompt: str) -> str:
    """Genera una explicación basada en el prompt."""
    explanations = [
        f"{prompt} es un concepto fascinante que representa la creatividad y la innovación en su máxima expresión. Es algo que trasciende los límites convencionales.",
        f"Para entender {prompt}, debemos explorar sus múltiples dimensiones. Es como un diamante con muchas facetas, cada una revelando algo nuevo y sorprendente.",
        f"{prompt} es la manifestación de ideas que transforman la realidad. Es el puente entre lo que imaginamos y lo que podemos crear."
    ]
    return random.choice(explanations)

def generate_description(prompt: str) -> str:
    """Genera una descripción basada en el prompt."""
    descriptions = [
        f"{prompt} se presenta como una experiencia única y memorable. Sus características lo hacen especial y digno de ser recordado.",
        f"Al observar {prompt}, uno puede apreciar la belleza en los detalles. Es como un cuadro que revela nuevos matices con cada mirada.",
        f"{prompt} tiene una presencia que llena el espacio con su energía. Es imposible ignorarlo, y una vez que lo conoces, nunca lo olvidas."
    ]
    return random.choice(descriptions)

def generate_general_response(prompt: str) -> str:
    """Genera una respuesta general basada en el prompt."""
    responses = [
        f"El prompt '{prompt}' ha inspirado una respuesta creativa que combina imaginación y lógica. Es fascinante cómo las palabras pueden abrir puertas a nuevos mundos.",
        f"Cuando pienso en '{prompt}', mi mente se llena de posibilidades infinitas. Es como tener una llave que abre múltiples puertas de la creatividad.",
        f"'{prompt}' es más que solo palabras; es un portal a la imaginación. Cada vez que lo considero, descubro algo nuevo y emocionante."
    ]
    return random.choice(responses) 

### **orchestrator/orchestrator.py**

Aquí controlamos validaciones, límites y lógica antes de llamar al proveedor.



In [None]:
# orchestrator/orchestrator.py
from provider.provider_local import generate_text_local

MAX_PROMPT_LENGTH = 200  # Seguridad: limitar entrada

async def handle_generation(prompt: str) -> str:
    """
    Lógica de negocio para generar texto usando el generador local.
    """
    if len(prompt) == 0:
        raise ValueError("El prompt no puede estar vacío.")
    if len(prompt) > MAX_PROMPT_LENGTH:
        raise ValueError("El prompt excede el tamaño máximo permitido.")
    
    # Usar el generador local para texto creativo
    return await generate_text_local(prompt)


### **api/app.py**

El servidor FastAPI que expone el endpoint `/generate`.





In [None]:
# api/app.py
from fastapi import FastAPI, HTTPException
from fastapi.middleware.cors import CORSMiddleware
from pydantic import BaseModel
from orchestrator.orchestrator import handle_generation

app = FastAPI(title="API de generación de texto", version="1.0")

# Configurar CORS
app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],  # En producción, especifica los dominios permitidos
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"],
)

# Definir el esquema de entrada usando Pydantic
class PromptRequest(BaseModel):
    prompt: str

@app.get("/")
async def root():
    """
    Endpoint de prueba para verificar que el servidor funciona.
    """
    return {"message": "Servidor funcionando correctamente"}

@app.post("/generate")
async def generate(request: PromptRequest):
    """
    Endpoint para generar texto a partir de un prompt.
    """
    try:
        result = await handle_generation(request.prompt)
        return {"result": result}
    except ValueError as e:
        raise HTTPException(status_code=400, detail=str(e))
    except Exception:
        raise HTTPException(status_code=500, detail="Error interno del servidor")


Ejecutar servidor:

```bash
uvicorn api.app:app --reload
```

Visitar: [http://127.0.0.1:8000/docs](http://127.0.0.1:8000/docs)

---


### **client/index.html**

Un cliente sencillo que llama a la API usando `httpx`.



In [None]:
<!DOCTYPE html>
<html lang="es">
  <head>
    <meta charset="UTF-8" />
    <title>Cliente Web</title>
    <style>
      body {
        font-family: Arial, sans-serif;
        margin: 40px;
        background-color: #f9f9f9;
      }
      .container {
        max-width: 400px;
        margin: auto;
        padding: 20px;
        background: white;
        border-radius: 10px;
        box-shadow: 0 0 10px rgba(0, 0, 0, 0.1);
      }
      input,
      button {
        width: 100%;
        padding: 10px;
        margin: 10px 0;
        font-size: 1rem;
      }
      #respuesta {
        margin-top: 20px;
        padding: 10px;
        background: #eef;
        border-radius: 5px;
        min-height: 50px;
      }
    </style>
  </head>
  <body>
    <div class="container">
      <h2>Enviar prompt al servidor</h2>
      <input type="text" id="prompt" placeholder="Escribe un prompt..." />
      <button onclick="enviarPrompt()">Enviar</button>
      <div id="respuesta">La respuesta aparecerá aquí...</div>
    </div>

    <script>
      async function enviarPrompt() {
        const prompt = document.getElementById("prompt").value;
        const respuestaDiv = document.getElementById("respuesta");
        respuestaDiv.innerHTML = "Enviando...";

        try {
          const response = await fetch("http://127.0.0.1:8000/generate", {
            method: "POST",
            headers: { "Content-Type": "application/json" },
            body: JSON.stringify({ prompt }),
          });
          const data = await response.json();
          respuestaDiv.innerHTML = data.result || JSON.stringify(data);
        } catch (error) {
          respuestaDiv.innerHTML = "Error al conectar con el servidor.";
          console.error(error);
        }
      }
    </script>
  </body>
</html>


Ejecutar:

```bash
python client/main.py
```

---


### **Proyecto de API de generación de texto** incorporando elementos de IA.



```
app/
├── api/    
│   └── app.py              # Servidor FastAPI principal
├── client/
│   └── index.html          # Cliente web
├── orchestrator/
│   └── orchestrator.py     # Lógica de negocio
├── provider/
│   └── provider_local.py   # Generador de texto local
└── requirements.txt        # Solo dependencias necesarias
```

#### **Paso 1:** Obtener una API key Gratuita

1. Ir al https://aistudio.google.com/app/apikey

2. Crear una cuenta o inicia sesión

3. Crear una nueva API key

4. IMPORTANTE: Guarda esta key en un lugar seguro


#### **Paso 2:** Crear el archivo .env para las claves

Ahora creamos el archivo donde guardarás tu API key:


```
app/.env
```


In [None]:
GEMINI_API_KEY=AIzaSyBV5W0ay18d-W0yvSAkLaFvUESklBGmqng
OPENAI_MODEL=gpt-3.5-turbo
MAX_PROMPT_LENGTH=200
MAX_TOKENS=150

#### **Paso 3:** Crear un archivo de configuración para las claves

Primero, vamos a crear un archivo para manejar las configuraciones de manera segura:

```
app/config.py
```


In [None]:
# config.py
import os
from dotenv import load_dotenv

# Cargar variables de entorno desde archivo .env
load_dotenv()

# Configuración de Gemini
GEMINI_API_KEY = os.getenv("GEMINI_API_KEY")

# Configuración de la aplicación
MAX_PROMPT_LENGTH = int(os.getenv("MAX_PROMPT_LENGTH", "200"))
MAX_TOKENS = int(os.getenv("MAX_TOKENS", "150"))

# Verificar que la API key esté configurada
if not GEMINI_API_KEY:
    print("ADVERTENCIA: GEMINI_API_KEY no está configurada")
    print("Crea un archivo .env con tu API key de Gemini")


#### **Paso 4:** Crear el nuevo proveedor 

```
app/provider/provider_gemini.py
```

In [None]:
# provider/provider_gemini.py
import google.generativeai as genai
from config import GEMINI_API_KEY, MAX_TOKENS

# Configurar Gemini
genai.configure(api_key=GEMINI_API_KEY)

async def generate_text_gemini(prompt: str) -> str:
    """
    Genera texto usando la API de Google Gemini.
    """
    try:
        # Verificar que la API key esté configurada
        if not GEMINI_API_KEY:
            return "Error: API key de Gemini no configurada. Revisa tu archivo .env"
        
        # Configurar el modelo Gemini - Usando un modelo más básico
        model = genai.GenerativeModel('gemini-1.5-flash')
        
        # Crear el prompt para Gemini
        full_prompt = f"""
        Eres un asistente creativo que genera texto en español. 
        Responde de manera creativa, amigable y útil.
        
        Prompt del usuario: {prompt}
        
        Genera una respuesta creativa y útil:
        """
        
        # Generar texto con Gemini
        response = model.generate_content(full_prompt)
        
        # Extraer y retornar la respuesta
        if response.text:
            return response.text.strip()
        else:
            return f"Respuesta generada para: {prompt}"
        
    except Exception as e:
        return f"Error al generar texto: {str(e)}"


#### **Paso 5:** Actualizar requirements.txt


```
app/requirements.txt
```


In [None]:
fastapi
uvicorn
pydantic
python-multipart
httpx
markovify
openai
python-dotenv
google-generativeai

**Ejecutar la siguiente instrucción**

```
pip install -r requirements.txt
```

---

#### **Paso 6:** Actualizar el orquestador

Ahora modificamos el orquestador para usar el nuevo provider de GENINI:

```
app/orchestrator/orchestrator.py
```

In [None]:
# orchestrator/orchestrator.py
from provider.provider_gemini import generate_text_gemini
from config import MAX_PROMPT_LENGTH

async def handle_generation(prompt: str) -> str:
    """
    Lógica de negocio para generar texto usando Google Gemini.
    """
    if len(prompt) == 0:
        raise ValueError("El prompt no puede estar vacío.")
    if len(prompt) > MAX_PROMPT_LENGTH:
        raise ValueError("El prompt excede el tamaño máximo permitido.")
    
    # Usar Gemini para generar texto creativo
    return await generate_text_gemini(prompt)


#### **Paso 8:** Crear un archivo .gitignore

Es importante que no subas tu API key a Git:

```
app/.gitignore
```


In [None]:
# Archivos de configuración con claves
.env
.env.local
.env.production


Ejecutar servidor:

```bash
uvicorn api.app:app --reload
```

Visitar: [http://127.0.0.1:8000/docs](http://127.0.0.1:8000/docs)

---


# Ahora, vamos a mejorar *el proyecto de API de generación de texto* incorporando **elementos de IA**. Vamos a **modificar los archivos que ya tienes**:

`provider/provider.py`

`orchestrator/orchestrator.py`

`api/app.py`

`client/main.py` para añadir:


* Integración opcional con **OpenAI** (si hay clave),
* **Fallback local** ligero con **Markovify** (funciona sin clave y sin descargar modelos pesados),
* Streaming simulado,
* Plantilla (prompt engineering) y pre/post-procesado,
* Ejemplos y corpus de demostración,
* Instrucciones claras dónde pegar cada fragmento de código y cómo ejecutar.
---


## librerías mínimas
pip install fastapi uvicorn httpx pydantic

## librerías opcionales para IA (fallback local y OpenAI)
pip install markovify     # generador local liviano
pip install openai        # si usarás OpenAI (opcional)
```

> Nota: `markovify` es una librería pequeña que genera texto a partir de un corpus —ideal para demo si nadie tiene clave OpenAI o hay problemas de cuota. `openai` es opcional y requiere clave.

---


## 1) Qué se va a añadir y dónde 

* `provider/provider.py` → **sustituir/extender**: intentar usar OpenAI si existe clave; si no, usar Markovify; exponer funciones `generate_text(...)` y `stream_text(...)`.
* `orchestrator/orchestrator.py` → **sustituir/editar**: añadir `prepare_prompt()` (plantilla) y `postprocess_text()` (limpieza).
* `api/app.py` → **editar**: usar `orchestrator.prepare_prompt` y `provider.generate_text` / streaming; exponer `POST /generate` (compatible con body JSON).
* `client/main.py` → **editar**: añadir ejemplo con header X-API-Key y ejemplo `stream=True`.

---

## 2) Código: provider/provider.py (reemplazarprovider/provider.py)



In [None]:
# provider/provider.py
import os
import asyncio
from typing import AsyncIterator

# Intentaremos usar OpenAI si está configurado, si no, usaremos markovify como fallback.
OPENAI_KEY = os.getenv("OPENAI_API_KEY", "")  # si no existe, queda vacío

# Lazy imports: evitamos fallos si openai/markovify no están instalados
openai = None
markov_model = None

if OPENAI_KEY:
    try:
        import openai as _openai
        openai = _openai
        openai.api_key = OPENAI_KEY
    except Exception as e:
        openai = None

# Cargar corpus para markovify si existe
try:
    import markovify
    CORPUS_PATH = os.path.join(os.path.dirname(__file__), "corpus.txt")
    if os.path.exists(CORPUS_PATH):
        with open(CORPUS_PATH, "r", encoding="utf-8") as f:
            text = f.read()
            if text.strip():
                markov_model = markovify.Text(text)
except Exception:
    markov_model = None


# ---- Generación (OpenAI sync wrapped to async) ----
def _openai_generate_sync(prompt: str, max_tokens: int, temperature: float) -> str:
    # Usamos Completion (estandar) para compatibilidad; cambiar engine/model si se desea.
    resp = openai.Completion.create(
        engine="text-davinci-003",
        prompt=prompt,
        max_tokens=max_tokens,
        temperature=temperature,
        n=1,
        stop=None,
    )
    text = resp.choices[0].text
    return text.strip()

async def openai_generate(prompt: str, max_tokens: int, temperature: float) -> str:
    # Ejecutar la llamada de OpenAI en hilo (porque la SDK es sincrona)
    return await asyncio.to_thread(_openai_generate_sync, prompt, max_tokens, temperature)


# ---- Markov fallback (local, muy simple) ----
def markov_generate_sync(prompt: str, max_tokens: int, temperature: float) -> str:
    # Si hay modelo Markov, generamos una o más frases; si no, devolvemos un eco o mock
    if markov_model:
        # El prompt no se utiliza directamente por markovify, así que preparamos respuesta basada en corpús
        sentence = markov_model.make_sentence(tries=100)
        if sentence:
            return f"{prompt}\n\n{sentence}"
    # fallback sencillo:
    return f"[LOCAL MOCK] {prompt}"

async def markov_generate(prompt: str, max_tokens: int, temperature: float) -> str:
    return await asyncio.to_thread(markov_generate_sync, prompt, max_tokens, temperature)


# ---- API pública: generate_text (escoge OpenAI si disponible, sino Markov/fallback) ----
async def generate_text(prompt: str, max_tokens: int = 150, temperature: float = 0.7) -> str:
    """
    Genera texto. Si OPENAI_KEY está presente y la librería cargó correctamente, usa OpenAI.
    En caso contrario, usa Markovify (si corpus disponible) o un mock simple.
    """
    if openai:
        try:
            return await openai_generate(prompt, max_tokens, temperature)
        except Exception:
            # si falla OpenAI por cualquier motivo, caemos al fallback local
            return await markov_generate(prompt, max_tokens, temperature)
    else:
        return await markov_generate(prompt, max_tokens, temperature)


# ---- Streaming simulado: devuelve AsyncIterator[bytes] ----
async def stream_text(prompt: str, max_tokens: int = 150, temperature: float = 0.7) -> AsyncIterator[bytes]:
    """
    Genera texto y lo devuelve en fragmentos (bytes) para simular streaming token a token.
    - Si se usa OpenAI con streaming real, podrías adaptar aquí.
    - Para clase, simulamos cortando el texto en fragmentos.
    """
    text = await generate_text(prompt, max_tokens=max_tokens, temperature=temperature)
    chunk_size = 40
    for i in range(0, len(text), chunk_size):
        await asyncio.sleep(0.03)  # simula latencia/tokens
        yield text[i : i + chunk_size].encode("utf-8")
    # señal de final (opcional)
    await asyncio.sleep(0.01)
    yield b"[DONE]"


**Nota:** Existe diferencia entre *OpenAI (modelo neuronal)* y *Markov (modelo estadístico)*. Este pipeline usa OpenAI si esta disponible (KEY), sino, hace usop de fallback sin necesidad de descargar modelos pesados.

---


## 3) Código: orchestrator/orchestrator.py (reemplaza o pega)



In [None]:
# orchestrator/orchestrator.py
import re

# --------------------------------------------------
# Prompt engineering simple: pre y post procesamiento
# --------------------------------------------------

def prepare_prompt(user_prompt: str) -> str:
    """
    Añade contexto y formato de sistema básico (plantilla).
    Mostrar esto en clase como 'prompt template'.
    """
    base_instructions = (
        "Eres un asistente conciso y educativo. Responde en lenguaje claro y breve.\n"
        "Si el usuario pide listas, devuelve bullets. Si pide código, usa bloques de código."
    )
    # Sanitizar entrada: elimina saltos duplicados y espacios innecesarios
    p = user_prompt.strip()
    p = re.sub(r"\s{2,}", " ", p)
    # Construye prompt final
    final = f"{base_instructions}\n\nUsuario: {p}\n\nRespuesta:"
    return final


def postprocess_text(text: str) -> str:
    """
    Limpia la salida (por ejemplo, recortar espacios, eliminar tokens especiales).
    Explicar que en producción se harían validaciones más estrictas y filtros de seguridad.
    """
    t = text.strip()
    # elimina posibles tokens [DONE] si aparecen
    t = t.replace("[DONE]", "").strip()
    return t


**Nota:** Investigar qué es *prompt engineering*? (plantilla + instrucciones de sistema). Ayuda a obtener respuestas mejores y más seguras.

---


## 4) Código: api/app.py (edita el endpoint `/generate`)

Sustituir o adaptar `api/app.py` para que use `orchestrator` y `provider`.



In [None]:
# api/app.py
import os
import time
from typing import Optional
from fastapi import FastAPI, HTTPException, Header, Depends, Request
from fastapi.responses import JSONResponse, StreamingResponse
from pydantic import BaseModel, Field

from orchestrator import orchestrator
from provider import provider

# Config simple (puedes usar variables de entorno)
API_KEY = os.getenv("SERVICE_API_KEY", "changeme")

app = FastAPI(title="API Generador de Texto (IA demo)")

class TextRequest(BaseModel):
    prompt: str = Field(..., min_length=1)
    max_tokens: int = Field(150, ge=1, le=1024)
    temperature: float = Field(0.7, ge=0.0, le=1.0)
    stream: bool = Field(False)

# simple auth header
def require_api_key(x_api_key: Optional[str] = Header(None)):
    if x_api_key != API_KEY:
        raise HTTPException(status_code=401, detail="Invalid API Key")
    return x_api_key

@app.post("/generate")
async def generate_endpoint(body: TextRequest, api_key: str = Depends(require_api_key), req: Request = None):
    """
    Flujo:
    1) preparar prompt (orchestrator)
    2) llamar provider (OpenAI o fallback local)
    3) postprocess y devolver (o streaming)
    """
    prompt = orchestrator.prepare_prompt(body.prompt)

    # pequeño logging
    client_ip = req.client.host if req.client else "unknown"
    print(f"[REQUEST] from {client_ip} prompt_len={len(body.prompt)} stream={body.stream}")

    # streaming
    if body.stream:
        async def streamer():
            async for chunk in provider.stream_text(prompt, max_tokens=body.max_tokens, temperature=body.temperature):
                yield chunk
        return StreamingResponse(streamer(), media_type="text/plain; charset=utf-8")
    # no streaming
    raw = await provider.generate_text(prompt, max_tokens=body.max_tokens, temperature=body.temperature)
    text = orchestrator.postprocess_text(raw)
    return JSONResponse({"id": "demo_gen_1", "text": text})


---

## 5) Código: client/index.html



In [None]:
<!DOCTYPE html>
<html lang="es">
<head>
    <meta charset="UTF-8">
    <title>Cliente API de generación de texto</title>
</head>
<body>
    <h1>Consumir API de generación de texto</h1>
    <textarea id="prompt" rows="4" cols="50" placeholder="Escribe tu prompt aquí..."></textarea><br><br>
    <button onclick="sendRequest()">Enviar Prompt</button>

    <h2>Respuesta:</h2>
    <pre id="response"></pre>

    <script>
        const API_URL = "http://127.0.0.1:8000/generate";
        const API_KEY = "changeme";  // mejor usar variable de entorno si es producción

        async function sendRequest() {
            const promptText = document.getElementById("prompt").value;

            const payload = { prompt: promptText, stream: false };
            const headers = {
                "Content-Type": "application/json",
                "X-API-Key": API_KEY
            };

            try {
                const resp = await fetch(API_URL, {
                    method: "POST",
                    headers: headers,
                    body: JSON.stringify(payload)
                });

                if (!resp.ok) {
                    document.getElementById("response").textContent = 
                        "Error: " + resp.status + " " + resp.statusText;
                    return;
                }

                const data = await resp.json();
                document.getElementById("response").textContent = JSON.stringify(data, null, 2);
            } catch (err) {
                document.getElementById("response").textContent = "Error de conexión: " + err;
            }
        }
    </script>
</body>
</html>


## 6) Archivo auxiliar: provider/corpus.txt

Para que markovify funcione, crea un archivo ligero con textos de demostración. Crea `provider/corpus.txt` con algo así (pegar literal):

```
La inteligencia artificial está transformando la forma en que trabajamos. En este texto de ejemplo mostramos oraciones sobre IA.
La IA permite automatizar tareas repetitivas, generar contenido y ayudar en la toma de decisiones.
Los modelos generativos pueden producir textos en varios estilos: técnicos, persuasivos o científicos.
Este corpus es solo para demo. En un entorno real, utilice datos relevantes y limpios.
```

**Dónde ponerlo:** `provider/corpus.txt`



## 7) Ejecutar la app (instrucciones paso a paso en clase)


```bash
uvicorn api.app:app --reload --port 8000
```
