# üöÄ RAG OpenAI V4 - Integraci√≥n con FastAPI

## De Notebook a API REST Profesional

En esta versi√≥n V4, llevamos nuestro agente RAG al siguiente nivel integr√°ndolo con **FastAPI**, lo que nos permite:

### ‚ú® Novedades en V4:

1. **API REST Profesional**: Endpoints HTTP para consumir el agente desde cualquier aplicaci√≥n
2. **M√∫ltiples Sesiones**: Gesti√≥n de conversaciones independientes por usuario
3. **Persistencia de Historial**: Mantenimiento del contexto entre peticiones
4. **Integraci√≥n Web**: Consumo desde aplicaciones HTML/JavaScript
5. **Estad√≠sticas en Tiempo Real**: Monitoreo del uso del sistema
6. **Dashboard CRM**: An√°lisis de clientes y oportunidades de venta
7. **Escalabilidad**: Base para despliegue en producci√≥n

---

## üì¶ Instalaci√≥n de Dependencias

Para ejecutar la API necesitamos instalar las siguientes librer√≠as:

- **FastAPI**: Framework web moderno y r√°pido para construir APIs
- **Uvicorn**: Servidor ASGI de alto rendimiento para ejecutar FastAPI
- **Requests**: Para hacer peticiones HTTP desde Python
- **Python-multipart**: Para manejar formularios y archivos en FastAPI

Adem√°s, aseg√∫rate de tener instaladas las dependencias de las versiones anteriores:
- `openai`
- `langchain`
- `langchain-openai`
- `chromadb`
- `python-dotenv`

In [None]:
# Instalaci√≥n de dependencias nuevas para V4
!pip install fastapi uvicorn[standard] requests python-multipart

# Si a√∫n no tienes las dependencias anteriores:
# !pip install openai langchain langchain-openai chromadb python-dotenv

## üåê ¬øQu√© es una API REST?

Una **API REST** (Representational State Transfer) es una interfaz que permite la comunicaci√≥n entre aplicaciones a trav√©s de HTTP. En lugar de ejecutar nuestro agente RAG directamente en un notebook, lo exponemos como un servicio web que puede ser consumido por:

- üåê Aplicaciones web (HTML/JavaScript)
- üì± Aplicaciones m√≥viles
- üêç Scripts de Python
- üîó Otros servicios y microservicios

### Ventajas de usar FastAPI:

1. **Alto rendimiento**: Una de las frameworks m√°s r√°pidas de Python
2. **Validaci√≥n autom√°tica**: Verifica tipos de datos autom√°ticamente
3. **Documentaci√≥n autom√°tica**: Genera Swagger UI y ReDoc
4. **Async/Await**: Soporte nativo para operaciones as√≠ncronas
5. **Type hints**: Usa anotaciones de tipo de Python

---

## üöÄ Ejecutar la API

Para iniciar el servidor FastAPI, ejecuta el siguiente comando en tu terminal (NO en el notebook):

```bash
uvicorn api_rag:app --reload --host 0.0.0.0 --port 8000
```

### Par√°metros explicados:

- **`api_rag:app`**: M√≥dulo `api_rag.py` y la instancia `app` de FastAPI
- **`--reload`**: Reinicia autom√°ticamente al detectar cambios en el c√≥digo (solo para desarrollo)
- **`--host 0.0.0.0`**: Permite conexiones desde cualquier IP (no solo localhost)
- **`--port 8000`**: Puerto donde escuchar√° el servidor

### URLs importantes:

- **API**: http://localhost:8000
- **Documentaci√≥n Swagger**: http://localhost:8000/docs
- **Documentaci√≥n ReDoc**: http://localhost:8000/redoc

‚ö†Ô∏è **Nota**: Aseg√∫rate de tener el archivo `api_rag.py` en el mismo directorio y de haber configurado tu archivo `.env` con la `OPENAI_API_KEY`.

In [None]:
# Este c√≥digo muestra el comando, pero debes ejecutarlo en una terminal externa
# NO ejecutes servidores web directamente en Jupyter Notebooks en producci√≥n

print("Para iniciar la API, ejecuta en tu terminal:")
print("")
print("uvicorn api_rag:app --reload --host 0.0.0.0 --port 8000")
print("")
print("Luego visita: http://localhost:8000/docs")

## üîå Endpoints Disponibles

Nuestra API expone los siguientes endpoints:

### 1. **POST /chat** - Enviar mensaje al agente
Env√≠a un mensaje al agente RAG y recibe una respuesta.

**Body**:
```json
{
  "message": "¬øCu√°les son los productos disponibles?",
  "session_id": "user_123"
}
```

**Respuesta**:
```json
{
  "response": "Tenemos los siguientes productos...",
  "session_id": "user_123"
}
```

---

### 2. **DELETE /chat/history/{session_id}** - Limpiar historial
Elimina el historial de conversaci√≥n de una sesi√≥n espec√≠fica.

**Respuesta**:
```json
{
  "message": "Historial eliminado exitosamente",
  "session_id": "user_123"
}
```

---

### 3. **POST /chat/new** - Nueva sesi√≥n
Crea una nueva sesi√≥n de chat limpia.

**Body**:
```json
{
  "message": "Hola, necesito informaci√≥n"
}
```

**Respuesta**:
```json
{
  "response": "¬°Hola! ¬øEn qu√© puedo ayudarte?",
  "session_id": "nuevo_id_generado"
}
```

---

### 4. **GET /stats** - Estad√≠sticas del sistema
Obtiene estad√≠sticas de uso del sistema.

**Respuesta**:
```json
{
  "total_sessions": 5,
  "total_messages": 42,
  "active_sessions": 3
}
```

---

### 5. **GET /dashboard** - Dashboard CRM
An√°lisis de clientes y oportunidades de venta basado en las conversaciones.

**Respuesta**:
```json
{
  "total_clients": 5,
  "hot_leads": 2,
  "cold_leads": 1,
  "revenue_potential": "$50,000"
}
```

---

## üí¨ Ejemplo 1: Enviar Mensaje al Agente

Vamos a interactuar con la API usando la librer√≠a `requests` de Python.

In [None]:
import requests
import json

# URL base de la API
BASE_URL = "http://localhost:8000"

# Endpoint para chat
url = f"{BASE_URL}/chat"

# Datos a enviar
payload = {
    "message": "¬øQu√© productos tienen disponibles?",
    "session_id": "test_session_001"
}

# Realizar la petici√≥n POST
response = requests.post(url, json=payload)

# Verificar si la petici√≥n fue exitosa
if response.status_code == 200:
    data = response.json()
    print("Respuesta del agente:")
    print("=" * 50)
    print(data["response"])
    print("=" * 50)
    print(f"Session ID: {data['session_id']}")
else:
    print(f"Error: {response.status_code}")
    print(response.text)

### üí° Enviar un mensaje de seguimiento

El agente mantiene el contexto de la conversaci√≥n usando el `session_id`.

In [None]:
# Segundo mensaje en la misma sesi√≥n
payload_2 = {
    "message": "¬øCu√°l me recomiendas para una startup?",
    "session_id": "test_session_001"  # Mismo session_id para mantener contexto
}

response_2 = requests.post(url, json=payload_2)

if response_2.status_code == 200:
    data = response_2.json()
    print("Respuesta del agente:")
    print("=" * 50)
    print(data["response"])
    print("=" * 50)
else:
    print(f"Error: {response_2.status_code}")

## üóëÔ∏è Ejemplo 2: Borrar Historial de Conversaci√≥n

Podemos limpiar el historial de una sesi√≥n espec√≠fica.

In [None]:
# Borrar historial de la sesi√≥n
session_id = "test_session_001"
delete_url = f"{BASE_URL}/chat/history/{session_id}"

response = requests.delete(delete_url)

if response.status_code == 200:
    data = response.json()
    print("‚úÖ", data["message"])
    print(f"Session ID: {data['session_id']}")
else:
    print(f"Error: {response.status_code}")
    print(response.text)

## üÜï Ejemplo 3: Crear Nueva Sesi√≥n

Podemos crear una nueva sesi√≥n sin especificar un `session_id`, y la API generar√° uno autom√°ticamente.

In [None]:
# Crear nueva sesi√≥n (sin session_id)
new_session_url = f"{BASE_URL}/chat/new"

payload_new = {
    "message": "Hola, soy un nuevo cliente interesado en sus servicios"
}

response = requests.post(new_session_url, json=payload_new)

if response.status_code == 200:
    data = response.json()
    print("Respuesta del agente:")
    print("=" * 50)
    print(data["response"])
    print("=" * 50)
    print(f"\nüÜî Nuevo Session ID generado: {data['session_id']}")
    print("\nüí° Guarda este session_id para continuar la conversaci√≥n")
    
    # Guardar el session_id para usarlo despu√©s
    nuevo_session_id = data['session_id']
else:
    print(f"Error: {response.status_code}")

## üìä Ejemplo 4: Obtener Estad√≠sticas del Sistema

Podemos consultar las estad√≠sticas de uso de nuestra API.

In [None]:
# Obtener estad√≠sticas
stats_url = f"{BASE_URL}/stats"

response = requests.get(stats_url)

if response.status_code == 200:
    stats = response.json()
    print("üìä Estad√≠sticas del Sistema")
    print("=" * 50)
    print(f"Total de sesiones: {stats['total_sessions']}")
    print(f"Total de mensajes: {stats['total_messages']}")
    print(f"Sesiones activas: {stats['active_sessions']}")
    print("=" * 50)
else:
    print(f"Error: {response.status_code}")

## üìà Ejemplo 5: Dashboard CRM

El dashboard nos permite analizar las conversaciones y detectar oportunidades de venta.

In [None]:
# Obtener dashboard CRM
dashboard_url = f"{BASE_URL}/dashboard"

response = requests.get(dashboard_url)

if response.status_code == 200:
    dashboard = response.json()
    print("üìà Dashboard CRM")
    print("=" * 50)
    print(f"Total de clientes: {dashboard.get('total_clients', 0)}")
    print(f"Leads calientes: {dashboard.get('hot_leads', 0)}")
    print(f"Leads fr√≠os: {dashboard.get('cold_leads', 0)}")
    print(f"Potencial de ingresos: {dashboard.get('revenue_potential', 'N/A')}")
    print("=" * 50)
    
    # Mostrar detalles de leads calientes si existen
    if 'hot_lead_details' in dashboard:
        print("\nüî• Detalles de Leads Calientes:")
        for lead in dashboard['hot_lead_details']:
            print(f"  - {lead}")
else:
    print(f"Error: {response.status_code}")

## üåê Consumir la API desde HTML/JavaScript

Una de las ventajas principales de tener una API REST es que podemos consumirla desde aplicaciones web. Aqu√≠ hay un ejemplo b√°sico de c√≥mo hacerlo:

### Ejemplo con Fetch API (JavaScript):

```html
<!DOCTYPE html>
<html>
<head>
    <title>Chat con RAG Agent</title>
</head>
<body>
    <div id="chat-container">
        <div id="messages"></div>
        <input type="text" id="user-input" placeholder="Escribe tu mensaje...">
        <button onclick="sendMessage()">Enviar</button>
    </div>

    <script>
        const sessionId = 'web_user_' + Date.now();
        
        async function sendMessage() {
            const input = document.getElementById('user-input');
            const message = input.value;
            
            // Mostrar mensaje del usuario
            addMessage('Usuario: ' + message);
            input.value = '';
            
            // Enviar a la API
            const response = await fetch('http://localhost:8000/chat', {
                method: 'POST',
                headers: {
                    'Content-Type': 'application/json'
                },
                body: JSON.stringify({
                    message: message,
                    session_id: sessionId
                })
            });
            
            const data = await response.json();
            addMessage('Agente: ' + data.response);
        }
        
        function addMessage(text) {
            const messagesDiv = document.getElementById('messages');
            const messageP = document.createElement('p');
            messageP.textContent = text;
            messagesDiv.appendChild(messageP);
        }
    </script>
</body>
</html>
```

### Consideraciones importantes:

1. **CORS**: FastAPI debe estar configurado para aceptar peticiones desde el navegador
2. **Session Management**: Cada usuario debe tener su propio `session_id`
3. **Error Handling**: Implementar manejo de errores para mejorar la experiencia
4. **Loading States**: Mostrar indicadores de carga mientras se espera la respuesta

---

## ‚ö° Ventajas de V4 vs V3

| Caracter√≠stica | V3 (Notebook) | V4 (FastAPI) |
|----------------|---------------|---------------|
| **Acceso** | Solo local en notebook | Desde cualquier aplicaci√≥n v√≠a HTTP |
| **M√∫ltiples usuarios** | ‚ùå | ‚úÖ Sesiones independientes |
| **Integraci√≥n web** | ‚ùå | ‚úÖ HTML/JavaScript |
| **Escalabilidad** | Limitada | Alta (con despliegue adecuado) |
| **Persistencia** | Manual | Autom√°tica por sesi√≥n |
| **Documentaci√≥n** | Manual | Autom√°tica (Swagger/ReDoc) |
| **Estad√≠sticas** | ‚ùå | ‚úÖ Dashboard en tiempo real |
| **Producci√≥n** | No recomendado | Listo para deploy |
| **Testing** | Complejo | F√°cil con requests |
| **Monitoreo** | ‚ùå | ‚úÖ Logs y m√©tricas |

### üéØ Casos de uso ideales para V4:

1. **Chatbots web**: Integrar en sitios web corporativos
2. **Aplicaciones m√≥viles**: Backend para apps iOS/Android
3. **Microservicios**: Parte de una arquitectura m√°s grande
4. **CRM integrado**: An√°lisis de conversaciones con clientes
5. **Soporte al cliente**: Sistema de tickets automatizado
6. **E-commerce**: Asistente de ventas inteligente

---

## üöÄ Pr√≥ximos Pasos

### Para mejorar a√∫n m√°s tu API RAG:

1. **Autenticaci√≥n y Autorizaci√≥n**:
   - Implementar JWT (JSON Web Tokens)
   - OAuth2 para login social
   - Rate limiting para prevenir abuso

2. **Base de Datos**:
   - PostgreSQL para persistencia de sesiones
   - Redis para cach√© de respuestas
   - MongoDB para logs de conversaciones

3. **Monitoreo y Logging**:
   - Prometheus + Grafana para m√©tricas
   - ELK Stack para logs centralizados
   - Sentry para tracking de errores

4. **Despliegue en Producci√≥n**:
   - Docker y Docker Compose
   - Kubernetes para orquestaci√≥n
   - AWS/GCP/Azure para hosting
   - CI/CD con GitHub Actions

5. **Mejoras de Rendimiento**:
   - Caching de embeddings
   - Async/Await optimizado
   - Load balancing
   - CDN para assets est√°ticos

6. **Testing**:
   - Unit tests con pytest
   - Integration tests
   - Load testing con Locust
   - Test coverage > 80%

7. **Features Avanzadas**:
   - WebSockets para chat en tiempo real
   - Streaming de respuestas
   - Multi-tenancy (m√∫ltiples empresas)
   - A/B testing de prompts

---

## üìö Recursos Adicionales

- [Documentaci√≥n de FastAPI](https://fastapi.tiangolo.com/)
- [Tutorial de Uvicorn](https://www.uvicorn.org/)
- [Gu√≠a de Deployment](https://fastapi.tiangolo.com/deployment/)
- [Best Practices para APIs](https://github.com/microsoft/api-guidelines)

---

### ¬°Felicitaciones! üéâ

Has aprendido a transformar un agente RAG de notebook a una API REST profesional lista para producci√≥n.

**¬øPreguntas? ¬øComentarios?**

Contin√∫a experimentando y mejorando tu implementaci√≥n. El siguiente paso es desplegar esto en la nube y escalarlo para usuarios reales.