# SOLUCIONES - SESI√ìN 4: Testing e Integraci√≥n con IA Generativa

**Estructura por ejercicio:**
1. C√≥digo resuelto con comentarios inline
2. Explicaci√≥n pedag√≥gica del "por qu√©"
3. Errores comunes y c√≥mo evitarlos

**Nota:** Ejecuta las celdas en orden para que funcionen correctamente.

In [None]:
# Instalaci√≥n de dependencias
!pip install fastapi==0.115.0 uvicorn[standard]==0.32.0 pytest==8.0.0 httpx==0.27.0 openai==1.12.0 python-dotenv==1.0.0 -q
print("‚úÖ Dependencias instaladas")

In [None]:
# Imports necesarios
from fastapi import FastAPI, Depends, HTTPException, status
from fastapi.testclient import TestClient
from pydantic import BaseModel
from typing import Annotated, Optional
import asyncio
import time
from collections import defaultdict
from datetime import datetime, timedelta
import logging

logging.basicConfig(level=logging.INFO)
logger = logging.getLogger(__name__)

print("‚úÖ Imports listos")

---

# üß™ BLOQUE 1: TESTING (Ejercicios 1-5)

## EJERCICIO 1: Test de endpoint GET b√°sico

**Objetivo:** Testear un endpoint GET que retorna informaci√≥n de un producto.

In [None]:
# API simple con endpoint de producto
app_ej1 = FastAPI()

@app_ej1.get("/productos/{producto_id}")
def obtener_producto(producto_id: int):
    if producto_id == 1:
        return {"id": 1, "nombre": "Laptop", "precio": 999.99}
    elif producto_id == 2:
        return {"id": 2, "nombre": "Mouse", "precio": 25.50}
    else:
        raise HTTPException(status_code=404, detail="Producto no encontrado")

# SOLUCI√ìN: Crear TestClient
# TestClient simula un navegador/cliente HTTP sin levantar un servidor real
client = TestClient(app_ej1)

# SOLUCI√ìN: Hacer GET request
response = client.get("/productos/1")

# SOLUCI√ìN: Verificaciones con assert
assert response.status_code == 200, "El status code deber√≠a ser 200 OK"

data = response.json()  # Convierte la respuesta JSON a diccionario Python
assert "nombre" in data, "La respuesta debe contener la clave 'nombre'"
assert data["nombre"] == "Laptop", "El nombre del producto deber√≠a ser 'Laptop'"

print("‚úÖ Ejercicio 1 completado")
print(f"Respuesta obtenida: {data}")

### üìö EXPLICACI√ìN PEDAG√ìGICA

**¬øQu√© es TestClient?**
- Es una clase de FastAPI que simula requests HTTP sin levantar un servidor real
- Internamente usa `httpx` (cliente HTTP as√≠ncrono)
- Ventajas: tests r√°pidos (milisegundos), sin puertos ni procesos externos

**Patr√≥n de testing (AAA):**
1. **Arrange** (Preparar): Crear cliente, definir datos de entrada
2. **Act** (Actuar): Ejecutar la acci√≥n (GET request)
3. **Assert** (Verificar): Comprobar resultados con asserts

**Status codes comunes:**
- 200 OK: Request exitoso (GET, PUT, PATCH)
- 201 Created: Recurso creado exitosamente (POST)
- 400 Bad Request: Error de validaci√≥n
- 401 Unauthorized: Falta autenticaci√≥n
- 404 Not Found: Recurso no existe
- 422 Unprocessable Entity: Error de validaci√≥n Pydantic

**Errores comunes:**
- ‚ùå Olvidar `TestClient(app)` ‚Üí `NameError: client not defined`
- ‚ùå No llamar a `.json()` ‚Üí Intentar acceder a string como diccionario
- ‚ùå Comparar con `==` en vez de usar `in` para verificar claves ‚Üí KeyError si la clave no existe

---

## EJERCICIO 2: Test de POST con validaci√≥n Pydantic

**Objetivo:** Testear un endpoint POST que crea productos, verificando validaci√≥n Pydantic.

In [None]:
app_ej2 = FastAPI()

class ProductoCrear(BaseModel):
    nombre: str  # Campo obligatorio
    precio: float  # Campo obligatorio
    stock: int = 0  # Campo opcional con valor por defecto

@app_ej2.post("/productos", status_code=201)
def crear_producto(producto: ProductoCrear):
    return {"mensaje": "Producto creado", "producto": producto.dict()}

client_ej2 = TestClient(app_ej2)

# SOLUCI√ìN Test 1: POST exitoso con datos completos
response_exitoso = client_ej2.post("/productos", json={
    "nombre": "Teclado",
    "precio": 49.99,
    "stock": 10
})

assert response_exitoso.status_code == 201, "POST exitoso debe retornar 201 Created"
print(f"‚úÖ Test 1 pas√≥: {response_exitoso.json()}")

# SOLUCI√ìN Test 2: POST sin campo obligatorio (nombre)
response_error = client_ej2.post("/productos", json={
    "precio": 29.99
    # Falta 'nombre' que es obligatorio
})

assert response_error.status_code == 422, "Falta de campo obligatorio debe retornar 422"
print(f"‚úÖ Test 2 pas√≥: Error capturado correctamente")

# SOLUCI√ìN Test 3: Verificar estructura del error 422
error_detail = response_error.json()["detail"]

# Pydantic retorna una lista de errores en detail
assert len(error_detail) > 0, "Debe haber al menos un error"

# Cada error tiene: type, loc (ubicaci√≥n), msg
assert error_detail[0]["type"] == "missing", "El tipo de error debe ser 'missing'"
assert "nombre" in str(error_detail[0]["loc"]), "El error debe mencionar el campo 'nombre'"

print("‚úÖ Ejercicio 2 completado")
print(f"Estructura de error: {error_detail[0]}")

### üìö EXPLICACI√ìN PEDAG√ìGICA

**¬øPor qu√© 422 y no 400?**
- FastAPI usa el est√°ndar HTTP para APIs REST
- **400 Bad Request:** Error gen√©rico del cliente
- **422 Unprocessable Entity:** La sintaxis es correcta, pero los datos no cumplen las reglas de validaci√≥n
- Pydantic siempre retorna 422 cuando los datos no coinciden con el modelo

**Estructura del error 422:**
```json
{
  "detail": [
    {
      "type": "missing",
      "loc": ["body", "nombre"],
      "msg": "Field required"
    }
  ]
}
```

**Ventajas de Pydantic:**
- Validaci√≥n autom√°tica de tipos (str, int, float, etc.)
- Mensajes de error claros y estructurados
- Conversi√≥n autom√°tica de tipos cuando es posible
- Valores por defecto (`stock: int = 0`)

**Errores comunes:**
- ‚ùå Usar `response.text` en vez de `response.json()` ‚Üí Intentar indexar un string
- ‚ùå No verificar `len(error_detail) > 0` antes de acceder a `error_detail[0]` ‚Üí IndexError
- ‚ùå Asumir que 422 es un "error" del c√≥digo ‚Üí Es el comportamiento esperado de validaci√≥n

---

## EJERCICIO 3: Fixture de cliente de testing

**Objetivo:** Crear una funci√≥n que act√∫e como fixture, retornando un cliente configurado.

In [None]:
# SOLUCI√ìN: Funci√≥n fixture completa
def get_client_fixture():
    """Fixture que retorna un TestClient configurado
    
    Esta funci√≥n encapsula la creaci√≥n de la app y sus endpoints,
    permitiendo reutilizar la misma configuraci√≥n en m√∫ltiples tests.
    """
    app = FastAPI()
    
    @app.get("/salud")
    def endpoint_salud():
        # Endpoint simple para health checks
        return {"status": "ok"}
    
    @app.get("/usuarios")
    def listar_usuarios():
        # Retorna una lista de usuarios fake
        return [
            {"id": 1, "nombre": "Ana"},
            {"id": 2, "nombre": "Juan"}
        ]
    
    # Retornar el cliente configurado
    return TestClient(app)

# SOLUCI√ìN Test 1: Usar fixture para testear /salud
def test_salud():
    """Test del endpoint de health check"""
    client = get_client_fixture()  # Obtener cliente desde fixture
    response = client.get("/salud")
    
    assert response.status_code == 200, "Health check debe retornar 200"
    assert response.json() == {"status": "ok"}, "El JSON debe ser exactamente {status: ok}"
    
    print("‚úÖ test_salud pas√≥")

# SOLUCI√ìN Test 2: Usar fixture para testear /usuarios
def test_listar_usuarios():
    """Test del endpoint que lista usuarios"""
    client = get_client_fixture()  # Reutilizar la misma fixture
    response = client.get("/usuarios")
    
    assert response.status_code == 200, "Debe retornar 200"
    
    usuarios = response.json()
    assert len(usuarios) == 2, "Debe haber exactamente 2 usuarios"
    assert usuarios[0]["nombre"] == "Ana", "El primer usuario debe ser Ana"
    
    print("‚úÖ test_listar_usuarios pas√≥")

# Ejecutar tests
test_salud()
test_listar_usuarios()
print("‚úÖ Ejercicio 3 completado")

### üìö EXPLICACI√ìN PEDAG√ìGICA

**¬øQu√© es una fixture?**
- Es una funci√≥n que prepara el entorno necesario para los tests
- En pytest real, se usa el decorador `@pytest.fixture`
- Aqu√≠ simulamos el concepto con una funci√≥n normal

**Ventajas de usar fixtures:**
1. **DRY (Don't Repeat Yourself):** No duplicar c√≥digo de setup
2. **Aislamiento:** Cada test obtiene una instancia fresca
3. **Mantenibilidad:** Un cambio en la fixture afecta todos los tests
4. **Claridad:** Los tests se centran en la l√≥gica, no en el setup

**Patr√≥n de fixture con pytest real:**
```python
@pytest.fixture
def client():
    app = FastAPI()
    # ... configurar endpoints ...
    return TestClient(app)

def test_algo(client):  # pytest inyecta autom√°ticamente
    response = client.get("/salud")
    assert response.status_code == 200
```

**Scope de fixtures en pytest:**
- `function` (default): Nueva instancia por cada test
- `module`: Una instancia compartida por todos los tests del m√≥dulo
- `session`: Una instancia para toda la sesi√≥n de tests

**Errores comunes:**
- ‚ùå No retornar el TestClient desde la fixture ‚Üí `NoneType` error
- ‚ùå Modificar estado global dentro de la fixture ‚Üí Tests no son independientes
- ‚ùå Fixtures muy complejas ‚Üí Mejor dividir en fixtures m√°s peque√±as

---

## EJERCICIO 4: Mockear dependencia de autenticaci√≥n

**Objetivo:** Mockear una dependencia de autenticaci√≥n para testear un endpoint protegido.

In [None]:
app_ej4 = FastAPI()

class Usuario(BaseModel):
    username: str
    email: str

# Dependencia real (simula validar JWT)
def get_current_user() -> Usuario:
    """En producci√≥n: decodifica JWT, valida, busca en BD...
    
    Por ahora, simplemente lanza 401 para simular que no hay autenticaci√≥n.
    """
    raise HTTPException(status_code=401, detail="No autenticado")

# Annotated type para inyecci√≥n de dependencias
CurrentUser = Annotated[Usuario, Depends(get_current_user)]

@app_ej4.get("/mi-perfil")
def obtener_perfil(usuario: CurrentUser):
    """Endpoint protegido que requiere autenticaci√≥n"""
    return {"username": usuario.username, "email": usuario.email}

# SOLUCI√ìN: Funci√≥n mock que retorna un usuario fake
def mock_get_current_user() -> Usuario:
    """Mock que bypasea la autenticaci√≥n real
    
    En tests, no queremos validar JWTs reales.
    Este mock simplemente retorna un usuario predefinido.
    """
    return Usuario(username="testuser", email="test@example.com")

client_ej4 = TestClient(app_ej4)

# SOLUCI√ìN Test 1: Sin mock, el endpoint debe retornar 401
response_sin_mock = client_ej4.get("/mi-perfil")
assert response_sin_mock.status_code == 401, "Sin autenticaci√≥n debe retornar 401"
print("‚úÖ Test 1 pas√≥: Endpoint protegido rechaza acceso sin auth")

# SOLUCI√ìN Test 2: Con mock, el endpoint debe retornar 200
# Reemplazar la dependencia real con el mock
app_ej4.dependency_overrides[get_current_user] = mock_get_current_user

response_con_mock = client_ej4.get("/mi-perfil")
assert response_con_mock.status_code == 200, "Con mock debe retornar 200"

data = response_con_mock.json()
assert data["username"] == "testuser", "Debe retornar el usuario mockeado"
assert data["email"] == "test@example.com", "Debe retornar el email mockeado"

print("‚úÖ Test 2 pas√≥: Mock de autenticaci√≥n funciona correctamente")
print(f"Usuario obtenido: {data}")

# IMPORTANTE: Limpiar el override para no afectar otros tests
app_ej4.dependency_overrides = {}

print("‚úÖ Ejercicio 4 completado")

### üìö EXPLICACI√ìN PEDAG√ìGICA

**¬øPor qu√© mockear dependencias?**
- En producci√≥n, `get_current_user()` har√≠a operaciones lentas/complejas:
  - Decodificar JWT (criptograf√≠a)
  - Validar firma y expiraci√≥n
  - Consultar base de datos
  - Verificar permisos
- En tests, queremos:
  - Velocidad (milisegundos, no segundos)
  - Aislamiento (sin BD externa)
  - Control (probar con usuarios espec√≠ficos)

**¬øC√≥mo funciona `dependency_overrides`?**
```python
app.dependency_overrides[funcion_real] = funcion_mock
```
- FastAPI internamente reemplaza todas las llamadas a `funcion_real` por `funcion_mock`
- Solo afecta al objeto `app` espec√≠fico
- Es un diccionario: `{dependencia_original: dependencia_reemplazo}`

**Patr√≥n completo de mock:**
1. Definir funci√≥n mock con la misma firma de retorno
2. Establecer override ANTES del request
3. Hacer el request con TestClient
4. Limpiar override DESPU√âS del test (`app.dependency_overrides = {}`)

**Casos de uso comunes:**
- Mock de autenticaci√≥n (este ejercicio)
- Mock de base de datos (retornar datos fake)
- Mock de APIs externas (simular responses)
- Mock de servicios lentos (emails, pagos, etc.)

**Errores comunes:**
- ‚ùå No limpiar `dependency_overrides` ‚Üí Afecta otros tests
- ‚ùå Firma incorrecta del mock ‚Üí TypeError en runtime
- ‚ùå Mockear en el lugar equivocado ‚Üí Override no se aplica
- ‚ùå No usar `Depends()` en el endpoint ‚Üí La dependencia no se inyecta

---

## EJERCICIO 5: Test de flujo completo (Login + Endpoint protegido)

**Objetivo:** Testear un sistema con login y endpoint protegido, usando el token obtenido.

In [None]:
app_ej5 = FastAPI()

# Base de datos fake
USUARIOS_DB = {
    "admin": {
        "username": "admin",
        "password": "secret123",
        "email": "admin@example.com"
    }
}

class LoginRequest(BaseModel):
    username: str
    password: str

@app_ej5.post("/login")
def login(request: LoginRequest):
    """Endpoint de autenticaci√≥n que valida credenciales"""
    user = USUARIOS_DB.get(request.username)
    
    # Validar que el usuario existe y la contrase√±a es correcta
    if not user or user["password"] != request.password:
        raise HTTPException(status_code=401, detail="Credenciales inv√°lidas")
    
    # En producci√≥n: generar JWT real con pyjwt
    # Aqu√≠: token fake para simplificar
    token = f"fake_token_for_{request.username}"
    return {"access_token": token, "token_type": "bearer"}

@app_ej5.get("/datos-privados")
def datos_privados(token: str = None):
    """Endpoint protegido que requiere token v√°lido"""
    # Validaci√≥n simple del token (en producci√≥n: decodificar JWT)
    if not token or not token.startswith("fake_token_for_"):
        raise HTTPException(status_code=401, detail="Token inv√°lido")
    
    # Extraer username del token
    username = token.replace("fake_token_for_", "")
    return {"mensaje": f"Datos privados para {username}"}

client_ej5 = TestClient(app_ej5)

# SOLUCI√ìN: Test del flujo completo
print("=== PASO 1: Login con credenciales correctas ===")
response_login = client_ej5.post("/login", json={
    "username": "admin",
    "password": "secret123"
})

assert response_login.status_code == 200, "Login exitoso debe retornar 200"
print(f"‚úÖ Login exitoso: {response_login.json()}")

# Extraer el token de la respuesta
token = response_login.json()["access_token"]
assert token.startswith("fake_token_for_"), "Token debe tener el formato correcto"
print(f"Token obtenido: {token}")

print("\n=== PASO 2: Acceder a endpoint protegido CON token ===")
response_protegido = client_ej5.get(f"/datos-privados?token={token}")

assert response_protegido.status_code == 200, "Con token v√°lido debe retornar 200"
data = response_protegido.json()
assert "admin" in data["mensaje"], "El mensaje debe mencionar al usuario 'admin'"
print(f"‚úÖ Acceso permitido: {data}")

print("\n=== PASO 3: Intentar acceder SIN token ===")
response_sin_token = client_ej5.get("/datos-privados")

assert response_sin_token.status_code == 401, "Sin token debe retornar 401"
print(f"‚úÖ Acceso denegado (como esperado): {response_sin_token.json()}")

print("\n‚úÖ Ejercicio 5 completado: Flujo de autenticaci√≥n funciona correctamente")

### üìö EXPLICACI√ìN PEDAG√ìGICA

**Flujo de autenticaci√≥n t√≠pico:**
```
1. Cliente env√≠a credenciales ‚Üí POST /login
2. Servidor valida y retorna token ‚Üí {access_token: "..."}
3. Cliente guarda token (localStorage, cookie, etc.)
4. Cliente usa token en requests posteriores ‚Üí Authorization: Bearer ...
5. Servidor valida token en cada request
```

**¬øPor qu√© tokens en vez de username/password cada vez?**
- **Seguridad:** No enviar contrase√±a en cada request
- **Performance:** Validar token es m√°s r√°pido que validar contrase√±a
- **Stateless:** El servidor no necesita mantener sesiones
- **Expiraci√≥n:** Los tokens pueden caducar autom√°ticamente
- **Revocaci√≥n:** Puedes invalidar tokens espec√≠ficos

**Diferencias entre token fake y JWT real:**

| Aspecto | Token Fake | JWT Real |
|---------|-----------|----------|
| Formato | String simple | Base64 con 3 partes (header.payload.signature) |
| Seguridad | ‚ö†Ô∏è No seguro | ‚úÖ Firma criptogr√°fica |
| Contenido | Solo identificador | Claims (user_id, roles, exp, etc.) |
| Validaci√≥n | Simple string check | Verificar firma + expiraci√≥n |
| Uso | Solo tests | Producci√≥n |

**Ejemplo de JWT real:**
```python
import jwt
from datetime import datetime, timedelta

payload = {
    "sub": "admin",
    "exp": datetime.utcnow() + timedelta(hours=1)
}
token = jwt.encode(payload, "secret_key", algorithm="HS256")
# token = "eyJ0eXAiOi..."
```

**Patr√≥n de testing de flujos:**
1. Dividir el flujo en pasos claros
2. Hacer asserts despu√©s de cada paso
3. Usar las respuestas de pasos anteriores en pasos siguientes
4. Testear tanto el "happy path" como casos de error

**Errores comunes:**
- ‚ùå No extraer el token correctamente ‚Üí KeyError o None
- ‚ùå Olvidar f-string en el query param ‚Üí `/datos-privados?token=token` (literal)
- ‚ùå No testear el caso sin token ‚Üí C√≥digo vulnerable a acceso no autorizado

---

# ü§ñ BLOQUE 2: INTEGRACI√ìN CON IA GENERATIVA (Ejercicios 6-10)

## EJERCICIO 6: Llamada b√°sica a API de IA (completion)

**Objetivo:** Completar una funci√≥n que simula una llamada a OpenAI.

In [None]:
# Mock de respuesta de OpenAI (para tests sin API key real)
class MockChoice:
    """Simula la estructura de una opci√≥n de respuesta de OpenAI"""
    def __init__(self, content):
        # OpenAI retorna: response.choices[0].message.content
        self.message = type('obj', (object,), {'content': content})

class MockResponse:
    """Simula la estructura completa de una respuesta de OpenAI"""
    def __init__(self, content, tokens_used):
        self.choices = [MockChoice(content)]
        
        # Simula la estructura de usage
        self.usage = type('obj', (object,), {
            'prompt_tokens': 10,  # Tokens del prompt
            'completion_tokens': tokens_used,  # Tokens de la respuesta
            'total_tokens': 10 + tokens_used  # Total
        })

# SOLUCI√ìN: Funci√≥n completa con async
async def llamar_ia(prompt: str, max_tokens: int = 100):
    """Simula llamada a OpenAI (as√≠ncrona)
    
    En producci√≥n, esto ser√≠a algo como:
    response = await openai.ChatCompletion.create(
        model="gpt-3.5-turbo",
        messages=[...],
        max_tokens=max_tokens
    )
    """
    
    # Estructura de mensajes (system + user)
    messages = [
        {"role": "system", "content": "Eres un asistente √∫til"},
        {"role": "user", "content": prompt}
    ]
    
    # Simulaci√≥n de latencia de red (100ms)
    await asyncio.sleep(0.1)
    
    # Simulaci√≥n de respuesta
    respuesta_texto = f"Respuesta simulada a: '{prompt}'"
    
    # Retornar mock con estructura de OpenAI
    return MockResponse(respuesta_texto, tokens_used=20)

# SOLUCI√ìN: Test de la funci√≥n
response = await llamar_ia("¬øQu√© es FastAPI?")

# Verificar estructura de la respuesta
contenido = response.choices[0].message.content
assert "FastAPI" in contenido, "La respuesta debe mencionar 'FastAPI'"
print(f"‚úÖ Respuesta obtenida: {contenido}")

# Verificar tokens
assert response.usage.total_tokens == 30, "Total debe ser 10 (prompt) + 20 (completion)"
print(f"‚úÖ Tokens: prompt={response.usage.prompt_tokens}, completion={response.usage.completion_tokens}, total={response.usage.total_tokens}")

print("‚úÖ Ejercicio 6 completado")

### üìö EXPLICACI√ìN PEDAG√ìGICA

**Estructura de una llamada a OpenAI:**
```python
from openai import AsyncOpenAI

client = AsyncOpenAI(api_key="sk-...")

response = await client.chat.completions.create(
    model="gpt-3.5-turbo",
    messages=[
        {"role": "system", "content": "Eres un asistente"},
        {"role": "user", "content": "Hola"}
    ],
    max_tokens=100,
    temperature=0.7
)

texto = response.choices[0].message.content
```

**Roles de mensajes:**
- **system:** Instrucciones globales que definen el comportamiento del asistente
- **user:** Mensajes del usuario (t√∫)
- **assistant:** Mensajes previos del asistente (para mantener contexto)

**Par√°metros importantes:**
- `model`: Qu√© modelo usar (gpt-4, gpt-3.5-turbo, claude-3-opus, etc.)
- `max_tokens`: L√≠mite de tokens en la respuesta
- `temperature` (0-2): Creatividad (0=determinista, 2=muy creativo)
- `top_p` (0-1): Alternativa a temperature

**¬øQu√© son los tokens?**
- Fragmentos de texto que el modelo procesa
- 1 token ‚âà 0.75 palabras en ingl√©s
- Ejemplos:
  - "Hola" = 1 token
  - "FastAPI" = 2 tokens (Fast + API)
  - "¬øQu√© es esto?" = 5 tokens

**¬øPor qu√© async?**
- Las llamadas a APIs externas son operaciones de I/O (red)
- `async/await` permite que el servidor atienda otros requests mientras espera la respuesta
- Sin async: Un request que tarda 3s bloquea el servidor
- Con async: El servidor puede atender 100+ requests en esos 3s

**Errores comunes:**
- ‚ùå No usar `await` ‚Üí Recibir coroutine en vez de resultado
- ‚ùå Olvidar `async def` ‚Üí `SyntaxError: 'await' outside async function`
- ‚ùå Acceder a √≠ndices incorrectos ‚Üí `response.choices[0]` es un array
- ‚ùå No manejar casos donde `choices` est√° vac√≠o ‚Üí IndexError

---

## EJERCICIO 7: Endpoint POST /completar con prompt

**Objetivo:** Crear un endpoint que recibe un prompt y retorna la respuesta de la IA.

‚ö†Ô∏è **Nota:** Este ejercicio usa la funci√≥n `llamar_ia()` del Ejercicio 6.

In [None]:
app_ej7 = FastAPI()

# SOLUCI√ìN: Modelos Pydantic
class CompletionRequest(BaseModel):
    """Request que el usuario env√≠a al endpoint"""
    prompt: str  # El texto que quiere enviar a la IA
    max_tokens: int = 100  # L√≠mite de tokens (default: 100)

class CompletionResponse(BaseModel):
    """Response que el endpoint retorna al usuario"""
    respuesta: str  # El texto generado por la IA
    tokens_usados: int  # Cu√°ntos tokens consumi√≥

# SOLUCI√ìN: Endpoint completo
@app_ej7.post("/completar", response_model=CompletionResponse)
async def completar(request: CompletionRequest):
    """Endpoint que expone la funcionalidad de IA
    
    Args:
        request: Prompt y par√°metros de la llamada
    
    Returns:
        CompletionResponse con la respuesta y tokens usados
    """
    # Llamar a la funci√≥n de IA (recuerda usar await)
    response = await llamar_ia(request.prompt, request.max_tokens)
    
    # Extraer datos relevantes de la respuesta
    texto = response.choices[0].message.content
    tokens = response.usage.total_tokens
    
    # Retornar como CompletionResponse
    return CompletionResponse(
        respuesta=texto,
        tokens_usados=tokens
    )

client_ej7 = TestClient(app_ej7)

# SOLUCI√ìN: Test del endpoint
response = client_ej7.post("/completar", json={
    "prompt": "Explica Python",
    "max_tokens": 50
})

assert response.status_code == 200, "Request v√°lido debe retornar 200"
print(f"‚úÖ Status code: {response.status_code}")

data = response.json()
assert "respuesta" in data, "La respuesta debe tener la clave 'respuesta'"
assert "tokens_usados" in data, "La respuesta debe tener la clave 'tokens_usados'"
print(f"‚úÖ Estructura correcta: {list(data.keys())}")

assert data["tokens_usados"] == 30, "Tokens debe ser 30 (10 prompt + 20 completion)"
print(f"‚úÖ Tokens: {data['tokens_usados']}")

print(f"\nüìù Respuesta de la IA: {data['respuesta']}")
print("‚úÖ Ejercicio 7 completado")

### üìö EXPLICACI√ìN PEDAG√ìGICA

**¬øPor qu√© usar Pydantic para request y response?**
- **Validaci√≥n autom√°tica:** FastAPI valida que el JSON enviado coincida con CompletionRequest
- **Documentaci√≥n:** Los modelos se muestran autom√°ticamente en Swagger UI
- **Serializaci√≥n:** Pydantic convierte objetos Python a JSON y viceversa
- **Type hints:** Los IDEs dan autocompletado y detectan errores

**Flujo completo de un request POST:**
```
1. Cliente env√≠a JSON:
   POST /completar
   {"prompt": "Hola", "max_tokens": 50}

2. FastAPI valida con Pydantic:
   ‚úì prompt es str? S√≠
   ‚úì max_tokens es int? S√≠
   ‚Üí Crea objeto CompletionRequest

3. Endpoint llama a IA:
   response = await llamar_ia(...)

4. Endpoint crea respuesta:
   return CompletionResponse(...)

5. FastAPI serializa a JSON:
   {"respuesta": "...", "tokens_usados": 30}

6. Cliente recibe JSON
```

**Ventajas de `response_model`:**
```python
@app.post("/completar", response_model=CompletionResponse)
```
- FastAPI valida que tu funci√≥n retorna el tipo correcto
- Filtra campos extra (solo retorna los definidos en CompletionResponse)
- Genera JSON Schema autom√°tico para la documentaci√≥n

**Patr√≥n de dise√±o: Request/Response Objects**
```
Cliente ‚Üí [Request Object] ‚Üí Endpoint ‚Üí [Business Logic] ‚Üí [Response Object] ‚Üí Cliente
```
- Separa la l√≥gica de validaci√≥n de la l√≥gica de negocio
- Los objetos son reutilizables (ej: en otros endpoints)
- Cambios en el modelo no afectan la l√≥gica interna

**Errores comunes:**
- ‚ùå Olvidar `await` ‚Üí `TypeError: object dict can't be used in 'await' expression`
- ‚ùå No usar `response_model` ‚Üí FastAPI retorna cualquier estructura
- ‚ùå Retornar dict en vez de objeto Pydantic ‚Üí Funciona pero pierde validaci√≥n

---

## EJERCICIO 8: Control de max_tokens

**Objetivo:** A√±adir validaci√≥n de max_tokens a un endpoint.

In [None]:
app_ej8 = FastAPI()

class IARequest(BaseModel):
    prompt: str
    max_tokens: int = 100

# SOLUCI√ìN: Endpoint con validaci√≥n de max_tokens
@app_ej8.post("/completar-seguro")
async def completar_seguro(request: IARequest):
    """Endpoint con l√≠mite de tokens para evitar costes excesivos
    
    En producci√≥n, esto protege contra:
    - Usuarios maliciosos que piden 10,000 tokens
    - Bugs en el frontend que env√≠an valores incorrectos
    - Costes inesperados en la factura de OpenAI
    """
    
    # VALIDACI√ìN: max_tokens debe ser <= 500
    if request.max_tokens > 500:
        raise HTTPException(
            status_code=400,
            detail="max_tokens excede l√≠mite de 500"
        )
    
    # Si pasa la validaci√≥n, proceder normalmente
    response = await llamar_ia(request.prompt, request.max_tokens)
    
    # Retornar respuesta
    return {
        "respuesta": response.choices[0].message.content,
        "tokens_usados": response.usage.total_tokens
    }

client_ej8 = TestClient(app_ej8)

# SOLUCI√ìN Test 1: max_tokens dentro del l√≠mite (100)
print("=== Test 1: Request v√°lido (max_tokens=100) ===")
response_ok = client_ej8.post("/completar-seguro", json={
    "prompt": "Test",
    "max_tokens": 100
})

assert response_ok.status_code == 200, "Request v√°lido debe retornar 200"
print(f"‚úÖ Status: {response_ok.status_code}")
print(f"‚úÖ Respuesta: {response_ok.json()}")

# SOLUCI√ìN Test 2: max_tokens excede el l√≠mite (1000)
print("\n=== Test 2: Request inv√°lido (max_tokens=1000) ===")
response_error = client_ej8.post("/completar-seguro", json={
    "prompt": "Test",
    "max_tokens": 1000
})

assert response_error.status_code == 400, "Request con max_tokens > 500 debe retornar 400"
print(f"‚úÖ Status: {response_error.status_code}")

error_detail = response_error.json()["detail"]
assert "excede l√≠mite" in error_detail, "El mensaje debe mencionar 'excede l√≠mite'"
print(f"‚úÖ Mensaje de error: {error_detail}")

print("\n‚úÖ Ejercicio 8 completado")

### üìö EXPLICACI√ìN PEDAG√ìGICA

**¬øPor qu√© limitar max_tokens?**
- **Costes:** GPT-4 puede costar $0.06 por 1K tokens
  - 500 tokens = $0.03
  - 10,000 tokens = $0.60
  - 1,000 requests de 10K tokens = $600
- **Performance:** Respuestas m√°s largas tardan m√°s
- **UX:** Respuestas de 10K tokens son dif√≠ciles de leer
- **Seguridad:** Previene ataques de denegaci√≥n de servicio (DoS)

**¬øValidaci√≥n en Pydantic vs en el endpoint?**

**Opci√≥n 1: Validaci√≥n en Pydantic**
```python
from pydantic import Field

class IARequest(BaseModel):
    max_tokens: int = Field(le=500)  # le = less or equal
```
- ‚úÖ M√°s limpio (validaci√≥n declarativa)
- ‚úÖ Pydantic genera error 422 autom√°ticamente
- ‚ùå Mensaje de error gen√©rico

**Opci√≥n 2: Validaci√≥n en el endpoint (la que usamos)**
```python
if request.max_tokens > 500:
    raise HTTPException(400, "max_tokens excede l√≠mite")
```
- ‚úÖ Mensaje de error personalizado
- ‚úÖ L√≥gica de validaci√≥n compleja (ej: l√≠mites por tier de usuario)
- ‚úÖ Control del status code (400 vs 422)
- ‚ùå M√°s c√≥digo en el endpoint

**Cu√°ndo usar cada opci√≥n:**
- Pydantic Field: Validaciones simples de tipos/rangos
- Endpoint: Validaciones de negocio complejas

**Patr√≥n de validaci√≥n en capas:**
```
Request ‚Üí [Validaci√≥n Pydantic] ‚Üí [Validaci√≥n de negocio] ‚Üí [L√≥gica del endpoint]
              (tipos, formato)      (l√≠mites, permisos)        (procesamiento)
```

**Errores comunes:**
- ‚ùå Usar status 422 en vez de 400 ‚Üí 422 es para errores de Pydantic, 400 para errores de negocio
- ‚ùå No testear el caso l√≠mite exacto (500) ‚Üí Falla cuando max_tokens=500
- ‚ùå Validar despu√©s de llamar a la IA ‚Üí Ya gastaste tokens innecesariamente

---

## EJERCICIO 9: Manejo de errores y timeouts

**Objetivo:** Implementar llamada a IA con reintentos autom√°ticos.

In [None]:
# Contador de intentos (para simular fallos)
intentos_realizados = 0

def llamar_ia_inestable(prompt: str):
    """Simula API inestable que falla 2 veces antes de funcionar
    
    Esto simula errores reales como:
    - 500 Internal Server Error
    - 503 Service Unavailable
    - TimeoutError
    - ConnectionError
    """
    global intentos_realizados
    intentos_realizados += 1
    
    # Fallar los primeros 2 intentos
    if intentos_realizados < 3:
        raise Exception(f"Error temporal de API (intento {intentos_realizados})")
    
    # El tercer intento funciona
    return MockResponse(f"Respuesta a: {prompt}", tokens_used=15)

# SOLUCI√ìN: Funci√≥n con retry logic completa
async def llamar_ia_con_retry(prompt: str, max_intentos: int = 3):
    """Llama a IA con reintentos y backoff exponencial
    
    Backoff exponencial: 2^0=1s, 2^1=2s, 2^2=4s, 2^3=8s...
    Esto evita sobrecargar la API cuando est√° teniendo problemas.
    
    Args:
        prompt: Texto a enviar a la IA
        max_intentos: N√∫mero m√°ximo de reintentos
    
    Returns:
        MockResponse si tiene √©xito
    
    Raises:
        HTTPException 503 si fallan todos los intentos
    """
    
    for intento in range(max_intentos):
        try:
            # Intentar llamar a la API
            response = llamar_ia_inestable(prompt)
            
            # Si llegamos aqu√≠, la llamada fue exitosa
            print(f"‚úÖ √âxito en intento {intento + 1}")
            return response
        
        except Exception as e:
            # Calcular tiempo de espera con backoff exponencial
            espera = 2 ** intento  # 1s, 2s, 4s, 8s...
            
            print(f"‚ùå Intento {intento + 1} fall√≥: {e}")
            
            # Si NO es el √∫ltimo intento, esperar y reintentar
            if intento < max_intentos - 1:
                print(f"‚è≥ Esperando {espera}s antes de reintentar...")
                await asyncio.sleep(espera)
            else:
                # Si ES el √∫ltimo intento, lanzar error final
                print(f"üí• Fallaron todos los {max_intentos} intentos")
                raise HTTPException(
                    status_code=503,
                    detail="Servicio de IA no disponible tras m√∫ltiples intentos"
                )

# SOLUCI√ìN: Test de la funci√≥n
print("=== Iniciando test de retry logic ===")
intentos_realizados = 0  # Resetear contador

response = await llamar_ia_con_retry("Test retry")

# Verificaciones
assert intentos_realizados == 3, "Debe haber hecho exactamente 3 intentos"
print(f"\n‚úÖ N√∫mero de intentos correcto: {intentos_realizados}")

assert "Test retry" in response.choices[0].message.content, "La respuesta debe contener el prompt"
print(f"‚úÖ Respuesta correcta: {response.choices[0].message.content}")

print("\n‚úÖ Ejercicio 9 completado")

### üìö EXPLICACI√ìN PEDAG√ìGICA

**¬øPor qu√© usar retry logic?**
- Las APIs externas pueden fallar temporalmente por:
  - Sobrecarga de servidores (muchos requests simult√°neos)
  - Problemas de red (latencia, p√©rdida de paquetes)
  - Mantenimiento o deploys
  - Rate limiting (excediste el l√≠mite de requests)
- El retry autom√°tico mejora la **resiliencia** del sistema

**¬øQu√© es backoff exponencial?**
- **Problema:** Si 1000 clientes reintentan inmediatamente, colapsan a√∫n m√°s el servidor
- **Soluci√≥n:** Esperar m√°s tiempo entre cada reintento

**Comparaci√≥n de estrategias:**

| Estrategia | Intento 1 | Intento 2 | Intento 3 | Total tiempo |
|------------|-----------|-----------|-----------|---------------|
| Sin espera | 0s | 0s | 0s | 0s |
| Espera fija (1s) | 0s | 1s | 2s | 3s |
| Exponencial (2^n) | 0s | 1s | 3s | 4s |
| Exponencial (2^n) 5 intentos | 0s | 1s | 3s, 7s, 15s | 31s |

**Patr√≥n completo de retry con todas las mejores pr√°cticas:**
```python
MAX_INTENTOS = 3
BACKOFF_BASE = 2
JITTER = 0.1  # Aleatorizaci√≥n para evitar "thundering herd"

for intento in range(MAX_INTENTOS):
    try:
        return await llamar_api()
    except TemporaryError as e:
        if intento == MAX_INTENTOS - 1:
            raise FinalError("Fallaron todos los intentos")
        
        # Backoff exponencial con jitter
        espera = (BACKOFF_BASE ** intento) * (1 + random.uniform(-JITTER, JITTER))
        await asyncio.sleep(espera)
```

**¬øCu√°ndo NO usar retry?**
- Errores 4xx (excepto 429 Too Many Requests)
  - 400 Bad Request ‚Üí El request est√° mal, reintentar no ayuda
  - 401 Unauthorized ‚Üí Falta autenticaci√≥n, reintentar no ayuda
  - 404 Not Found ‚Üí El recurso no existe, reintentar no ayuda
- Operaciones no idempotentes sin control
  - POST que crea recursos ‚Üí Podr√≠as crear duplicados
  - Pagos ‚Üí Podr√≠as cobrar m√∫ltiples veces

**Status codes y retry:**
- ‚úÖ Reintentar: 500, 502, 503, 504, 429
- ‚ùå No reintentar: 400, 401, 403, 404, 422

**Errores comunes:**
- ‚ùå Reintentar inmediatamente ‚Üí Colapsar el servidor
- ‚ùå Reintentar infinitamente ‚Üí El sistema nunca falla, solo se queda colgado
- ‚ùå No usar backoff exponencial ‚Üí Todos reintentan a la vez ("thundering herd")
- ‚ùå Reintentar errores 4xx ‚Üí Desperdiciar recursos en requests que nunca funcionar√°n

---

## EJERCICIO 10: Sistema completo - Auth + IA + Rate limiting + Logging

**Objetivo:** Construir un endpoint de IA con todas las protecciones y mejores pr√°cticas.

In [None]:
app_ej10 = FastAPI()

# Rate limiting store (en producci√≥n: usar Redis)
rate_limit_store = defaultdict(list)

# ‚úÖ FUNCI√ìN YA IMPLEMENTADA
def estimar_coste(prompt_tokens: int, completion_tokens: int) -> float:
    """Calcula coste en USD (GPT-3.5-turbo: $0.50 input, $1.50 output por 1M tokens)"""
    coste_input = (prompt_tokens * 0.50) / 1_000_000
    coste_output = (completion_tokens * 1.50) / 1_000_000
    return coste_input + coste_output

# SOLUCI√ìN: check_rate_limit completa
def check_rate_limit(user_id: str, max_requests: int = 3) -> bool:
    """Verifica si el usuario excedi√≥ el l√≠mite (ventana de 1 minuto)
    
    Esta funci√≥n implementa una ventana deslizante:
    - Solo cuenta requests de los √∫ltimos 60 segundos
    - Los requests m√°s antiguos se descartan autom√°ticamente
    
    Args:
        user_id: Identificador del usuario
        max_requests: N√∫mero m√°ximo de requests por minuto
    
    Returns:
        True si el usuario puede hacer el request, False si excedi√≥ el l√≠mite
    """
    now = datetime.now()
    window_start = now - timedelta(minutes=1)
    
    # Filtrar solo los requests DENTRO de la ventana temporal
    recent_requests = [
        req for req in rate_limit_store[user_id]
        if req > window_start
    ]
    
    # Actualizar el store con solo los requests recientes
    # (Esto descarta autom√°ticamente requests antiguos)
    rate_limit_store[user_id] = recent_requests
    
    # Verificar si excedi√≥ el l√≠mite
    if len(recent_requests) >= max_requests:
        return False
    
    # Si no excedi√≥, registrar el request actual y permitir
    rate_limit_store[user_id].append(now)
    return True

# Dependencia mockeada de auth
def mock_get_user():
    return {"user_id": "testuser", "username": "Test User"}

# SOLUCI√ìN: Endpoint completo con todas las mejores pr√°cticas
@app_ej10.post("/ia/completar")
async def completar_ia(
    request: IARequest,
    user=Depends(mock_get_user)
):
    """Endpoint de producci√≥n con auth, rate limit, IA, y logging
    
    Este endpoint integra todas las mejores pr√°cticas:
    1. Autenticaci√≥n (Depends)
    2. Rate limiting (3 req/min por usuario)
    3. Validaci√≥n de par√°metros (max_tokens <= 500)
    4. Logging estructurado (request + response)
    5. Llamada a IA con retry (del Ejercicio 9)
    6. C√°lculo de costes
    7. M√©tricas de performance (duraci√≥n)
    """
    start_time = time.time()
    user_id = user["user_id"]
    
    # 1. VERIFICAR RATE LIMIT
    if not check_rate_limit(user_id, max_requests=3):
        logger.warning(f"[RATE LIMIT] user={user_id} excedi√≥ l√≠mite")
        raise HTTPException(
            status_code=429,
            detail="Rate limit excedido. Intenta en 1 minuto."
        )
    
    # 2. VALIDAR MAX_TOKENS
    if request.max_tokens > 500:
        raise HTTPException(
            status_code=400,
            detail="max_tokens excede l√≠mite de 500"
        )
    
    # 3. LOG DEL REQUEST
    logger.info(
        f"[IA REQUEST] user={user_id} "
        f"prompt_len={len(request.prompt)} "
        f"max_tokens={request.max_tokens}"
    )
    
    # 4. LLAMAR A IA (con await)
    response = await llamar_ia(request.prompt, request.max_tokens)
    
    # 5. CALCULAR M√âTRICAS
    tokens_used = response.usage.total_tokens
    coste = estimar_coste(
        response.usage.prompt_tokens,
        response.usage.completion_tokens
    )
    duracion_ms = int((time.time() - start_time) * 1000)
    
    # 6. LOG DEL RESPONSE
    logger.info(
        f"[IA RESPONSE] user={user_id} "
        f"tokens={tokens_used} "
        f"coste=${coste:.6f} "
        f"duracion={duracion_ms}ms"
    )
    
    # 7. RETORNAR RESPUESTA CON M√âTRICAS
    return {
        "respuesta": response.choices[0].message.content,
        "tokens_usados": tokens_used,
        "coste_estimado": coste,
        "duracion_ms": duracion_ms
    }

print("‚úÖ Endpoint completo definido")

In [None]:
# SOLUCI√ìN: Tests del sistema completo
client_ej10 = TestClient(app_ej10)
rate_limit_store.clear()  # Limpiar para tests frescos

print("=== Test 1: Request normal exitoso ===")
response1 = client_ej10.post("/ia/completar", json={
    "prompt": "Test 1",
    "max_tokens": 50
})

assert response1.status_code == 200, "Request v√°lido debe retornar 200"
data1 = response1.json()
assert "respuesta" in data1, "Debe tener clave 'respuesta'"
assert "tokens_usados" in data1, "Debe tener clave 'tokens_usados'"
assert "coste_estimado" in data1, "Debe tener clave 'coste_estimado'"
assert "duracion_ms" in data1, "Debe tener clave 'duracion_ms'"
print(f"‚úÖ Test 1 pas√≥. M√©tricas: {data1}")

print("\n=== Test 2: Exceder max_tokens ===")
response2 = client_ej10.post("/ia/completar", json={
    "prompt": "Test 2",
    "max_tokens": 1000
})

assert response2.status_code == 400, "max_tokens > 500 debe retornar 400"
print(f"‚úÖ Test 2 pas√≥. Error: {response2.json()['detail']}")

print("\n=== Test 3: Exceder rate limit (hacer 4 requests) ===")
# Ya hicimos 1 request en Test 1, necesitamos 3 m√°s para llegar al l√≠mite
for i in range(4):
    response = client_ej10.post("/ia/completar", json={
        "prompt": f"Test {i+3}",
        "max_tokens": 50
    })
    
    # Primeros 2 requests despu√©s del Test 1 = 3 requests totales (dentro del l√≠mite)
    if i < 2:
        assert response.status_code == 200, f"Request {i+2}/3 debe funcionar"
        print(f"‚úÖ Request {i+2}/3: 200 OK")
    else:
        # Request 4+ debe fallar (rate limit excedido)
        assert response.status_code == 429, f"Request {i+2} debe retornar 429"
        print(f"‚úÖ Request {i+2}: 429 Rate Limit (esperado)")

print("\n‚úÖ Ejercicio 10 completado")
print("üéâ ¬°Felicitaciones! Has completado todos los ejercicios de Testing e IA")

### üìö EXPLICACI√ìN PEDAG√ìGICA FINAL

**¬øPor qu√© este endpoint es "production-ready"?**

**1. Autenticaci√≥n (Depends)**
- Cada request est√° asociado a un usuario
- Permite auditor√≠a y control de acceso
- En producci√≥n: validar JWT real

**2. Rate Limiting**
- Previene abuso (usuarios maliciosos)
- Protege contra bugs del frontend (loops infinitos)
- Distribuye recursos equitativamente
- En producci√≥n: usar Redis para compartir estado entre servidores

**3. Validaci√≥n de negocio**
- L√≠mites de tokens previenen costes excesivos
- Verificaci√≥n antes de llamar a la API (ahorro de dinero)
- Mensajes de error claros para debugging

**4. Logging estructurado**
- **Request logs:** Auditor√≠a de qui√©n usa el sistema
- **Response logs:** M√©tricas de costes y performance
- **Error logs:** Debugging cuando algo falla
- En producci√≥n: enviar a ELK Stack, Datadog, etc.

**5. M√©tricas de negocio**
- **Tokens:** Para facturaci√≥n y optimizaci√≥n
- **Coste:** Tracking de gastos por usuario/feature
- **Duraci√≥n:** Detectar bottlenecks de performance

**Arquitectura completa de un sistema de IA:**
```
Cliente ‚Üí [Load Balancer] ‚Üí [API Gateway]
                               ‚Üì
                    [Auth Middleware]
                               ‚Üì
                    [Rate Limiter (Redis)]
                               ‚Üì
                    [Business Logic]
                               ‚Üì
                    [LLM API (OpenAI)]
                               ‚Üì
                    [Logging (ELK)]
                               ‚Üì
                    [M√©tricas (Datadog)]
```

**Mejoras adicionales para producci√≥n:**
1. **Cach√© de respuestas:** Si el mismo prompt se repite, retornar desde cach√©
2. **Circuit breaker:** Si OpenAI falla mucho, dejar de intentar temporalmente
3. **Fallback models:** Si GPT-4 falla, usar GPT-3.5-turbo
4. **Request queuing:** Encolar requests en RabbitMQ para procesamiento as√≠ncrono
5. **A/B testing:** Probar diferentes prompts con % de usuarios
6. **Feature flags:** Activar/desactivar features sin redeploy

**Comparaci√≥n: Endpoint simple vs Endpoint de producci√≥n**

| Aspecto | Simple | Producci√≥n |
|---------|--------|------------|
| Auth | ‚ùå | ‚úÖ Depends |
| Rate limit | ‚ùå | ‚úÖ 3 req/min |
| Validaci√≥n | ‚ùå | ‚úÖ max_tokens |
| Logging | ‚ùå | ‚úÖ Estructurado |
| M√©tricas | ‚ùå | ‚úÖ Tokens/coste/duraci√≥n |
| Retry | ‚ùå | ‚úÖ Backoff exponencial |
| Errores | ‚ùå | ‚úÖ HTTP codes correctos |
| Tests | ‚ùå | ‚úÖ Happy path + errores |

**Lecciones clave de este ejercicio:**
1. **Dise√±ar para fallos:** Asumir que todo puede fallar
2. **Observabilidad:** Si no lo puedes medir, no lo puedes mejorar
3. **Defensa en profundidad:** M√∫ltiples capas de validaci√≥n
4. **Costes importan:** Cada token cuesta dinero real
5. **UX es clave:** Mensajes de error claros ayudan al debugging

---

## üéì RESUMEN DE CONCEPTOS APRENDIDOS

### Testing
- TestClient para tests r√°pidos sin servidor
- Fixtures para reutilizar setup
- Mocking con dependency_overrides
- Flujos completos de autenticaci√≥n

### IA Generativa
- Estructura de llamadas (system/user messages)
- Control de tokens y costes
- Rate limiting con ventanas temporales
- Retry logic con backoff exponencial
- Logging estructurado

### Patrones de producci√≥n
- Validaci√≥n en capas (Pydantic + negocio)
- Manejo robusto de errores
- M√©tricas de negocio
- Resiliencia y recuperaci√≥n

**¬°Felicitaciones por completar todos los ejercicios! üéâ**