# Bloque 4 ¬∑ De RAG a Chatbot: La Capa de Presentaci√≥n

En los bloques anteriores exploramos los componentes fundamentales de RAG: comprendimos el flujo completo, simulamos la b√∫squeda vectorial, aprendimos a invocar knowledge bases en Bedrock y utilizamos la API de RAG para generar respuestas con LLM. Este bloque se enfoca en c√≥mo integrar toda esa infraestructura en una interfaz conversacional que permita a los usuarios interactuar de forma natural con el sistema RAG.

## La necesidad de una interfaz conversacional

Una vez que tenemos un sistema RAG funcional capaz de recuperar informaci√≥n relevante y generar respuestas coherentes, el siguiente paso natural es exponerlo a trav√©s de una interfaz que permita a los usuarios interactuar de manera intuitiva. Un chatbot conversacional es la forma m√°s natural de presentar un sistema RAG porque:

- **Interacci√≥n natural**: Los usuarios pueden hacer preguntas en lenguaje natural, similar a c√≥mo interactuar√≠an con un experto humano
- **Feedback inmediato**: Las respuestas se generan en tiempo real, permitiendo una conversaci√≥n fluida
- **Transparencia**: Puede mostrar las fuentes y citas que respaldan cada respuesta, generando confianza
- **Escalabilidad**: Un solo chatbot puede atender m√∫ltiples usuarios simult√°neamente

## ¬øQu√© es Chainlit?

Chainlit es un framework de Python dise√±ado espec√≠ficamente para construir interfaces conversacionales con modelos de IA. Su filosof√≠a se basa en:

- **Simplicidad**: Permite crear chatbots web funcionales con m√≠nima configuraci√≥n, sin necesidad de construir un front-end desde cero
- **Orientaci√≥n a flujos conversacionales**: Facilita el manejo del estado de la conversaci√≥n, la presentaci√≥n de componentes ricos (citas, tablas, visualizaciones) y el registro de interacciones
- **Productividad**: Permite iterar r√°pidamente sobre la experiencia del usuario mientras se sigue afinando el backend RAG
- **Integraci√≥n sencilla**: Utiliza decoradores simples (`@cl.on_chat_start`, `@cl.on_message`) para definir el comportamiento del chatbot

En nuestra arquitectura, Chainlit ocupa la **capa de presentaci√≥n**: recibe la pregunta del usuario, invoca nuestras funciones Python (que a su vez llaman a Bedrock), y presenta la respuesta final junto con las citas correspondientes de manera visual y accesible.

## Arquitectura del flujo completo

El flujo de un chatbot RAG con Chainlit sigue una arquitectura en capas bien definida:

### 1. Capa de presentaci√≥n (Chainlit)
- **Recepci√≥n de mensajes**: El usuario escribe una pregunta en la interfaz web
- **Gesti√≥n de sesi√≥n**: Chainlit mantiene el contexto de la conversaci√≥n
- **Renderizado de respuestas**: Presenta el texto generado y las citas de forma visual

### 2. Capa de orquestaci√≥n (Python)
- **Procesamiento de entrada**: Recibe la pregunta del usuario desde Chainlit
- **Invocaci√≥n de RAG**: Llama a las funciones que implementan el flujo RAG (recuperaci√≥n + generaci√≥n)
- **Procesamiento de salida**: Extrae el texto generado y las citas de la respuesta de Bedrock
- **Formateo**: Prepara la informaci√≥n para su presentaci√≥n en Chainlit

### 3. Capa de servicios (AWS Bedrock)
- **Recuperaci√≥n**: Busca fragmentos relevantes en la knowledge base usando b√∫squeda vectorial
- **Generaci√≥n**: El LLM sintetiza una respuesta basada en los fragmentos recuperados
- **Trazabilidad**: Devuelve citas que vinculan cada parte de la respuesta con sus fuentes

### Flujo de datos

```
Usuario ‚Üí Chainlit ‚Üí Funci√≥n Python ‚Üí Bedrock API ‚Üí Knowledge Base
                                                          ‚Üì
Usuario ‚Üê Chainlit ‚Üê Funci√≥n Python ‚Üê Respuesta + Citas ‚Üê
```

Este dise√±o desacopla las responsabilidades: la l√≥gica RAG permanece independiente de la interfaz, lo que facilita experimentar con diferentes frameworks de UI, cambiar modelos, o agregar nuevas funcionalidades sin reescribir todo el sistema.

## Componentes clave de un chatbot RAG

Para construir un chatbot que integre RAG, necesitamos combinar varios componentes:

### Funciones de RAG (del Bloque 3)
- **`generar_con_prompt()`**: Encapsula la l√≥gica de invocaci√≥n a `retrieve_and_generate` de Bedrock
- **`mostrar_generacion_simple()`**: Versi√≥n adaptada que extrae texto y citas para presentaci√≥n en UI
- **`DEFAULT_PROMPT_TEMPLATE`**: Template que gu√≠a al LLM sobre c√≥mo usar el contexto recuperado

### Handlers de Chainlit
- **`@cl.on_chat_start`**: Se ejecuta cuando un usuario inicia una sesi√≥n. Ideal para:
  - Inicializar recursos (clientes de AWS, cargar configuraci√≥n)
  - Mostrar mensaje de bienvenida
  - Establecer el contexto inicial de la conversaci√≥n

- **`@cl.on_message`**: Se ejecuta por cada mensaje del usuario. Debe:
  - Extraer la pregunta del mensaje
  - Invocar la funci√≥n RAG con los par√°metros apropiados
  - Procesar la respuesta y extraer texto y citas
  - Enviar la respuesta formateada de vuelta al usuario

### Configuraci√≥n y variables
- **Variables de entorno**: Para mantener configuraci√≥n flexible (knowledge base ID, modelo ARN, regi√≥n AWS)
- **Credenciales AWS**: Autenticaci√≥n para acceder a Bedrock (pueden venir de variables de entorno, archivos de credenciales, o roles IAM)

## Flujo de ejecuci√≥n del chatbot

Cuando un usuario interact√∫a con el chatbot, se ejecuta el siguiente flujo:

### Inicio de sesi√≥n (`on_chat_start`)
1. Chainlit detecta que un usuario abre el chat
2. Se ejecuta la funci√≥n decorada con `@cl.on_chat_start`
3. Se inicializan recursos (si es necesario) y se env√≠a mensaje de bienvenida
4. El usuario ve la interfaz lista para recibir preguntas

### Procesamiento de mensajes (`on_message`)
1. **Recepci√≥n**: El usuario escribe una pregunta y Chainlit captura el mensaje
2. **Indicador de carga**: Se muestra un mensaje temporal "Procesando..." para dar feedback inmediato
3. **Invocaci√≥n RAG**: Se llama a `generar_con_prompt()` con la pregunta del usuario
4. **Procesamiento en Bedrock**:
   - La pregunta se convierte en embedding
   - Se buscan fragmentos similares en la knowledge base
   - El LLM genera una respuesta usando esos fragmentos
   - Se devuelven citas que vinculan la respuesta con las fuentes
5. **Extracci√≥n**: `mostrar_generacion_simple()` procesa la respuesta y separa texto de citas
6. **Presentaci√≥n**: Se env√≠an dos mensajes:
   - La respuesta principal del asistente
   - Las fuentes consultadas (si existen)

### Manejo de errores
Es importante incluir manejo de excepciones para:
- Errores de conexi√≥n con AWS
- Timeouts en la API
- Respuestas vac√≠as o inv√°lidas
- Problemas de autenticaci√≥n

Esto garantiza que el usuario siempre reciba feedback, incluso cuando algo falla.

## Resumen: Arquitectura completa de extremo a extremo

Hemos recorrido todo el flujo de un sistema RAG completo:

### Capas del sistema

1. **Capa de datos** (Bloque 1)
   - Documentos fuente almacenados en S3
   - Knowledge base con embeddings vectoriales
   - Metadatos para trazabilidad

2. **Capa de recuperaci√≥n** (Bloque 2)
   - B√∫squeda vectorial sem√°ntica
   - Ranking por similitud
   - Extracci√≥n de fragmentos relevantes

3. **Capa de generaci√≥n** (Bloque 3)
   - LLM que sintetiza respuestas
   - Prompt engineering para guiar el comportamiento
   - Generaci√≥n de citas y trazabilidad

4. **Capa de presentaci√≥n** (Bloque 4)
   - Interfaz conversacional con Chainlit
   - Visualizaci√≥n de respuestas y fuentes
   - Gesti√≥n de sesiones y estado

### Principios de dise√±o

- **Desacoplamiento**: Cada capa es independiente y puede evolucionar por separado
- **Reutilizaci√≥n**: Las funciones de RAG pueden usarse en m√∫ltiples contextos (notebooks, APIs, chatbots)
- **Trazabilidad**: Siempre sabemos qu√© fuentes respaldan cada respuesta
- **Flexibilidad**: F√°cil cambiar modelos, prompts, o interfaces sin reescribir todo

Este patr√≥n arquitect√≥nico permite construir sistemas RAG robustos, escalables y mantenibles que pueden adaptarse a diferentes necesidades y evolucionar con el tiempo.

## Actividad Pr√°ctica

En esta secci√≥n vamos a trabajar paso a paso para construir un chatbot RAG completo con Chainlit. Vamos a partir de una versi√≥n m√≠nima funcional y la vamos a ir mejorando hasta llegar a una implementaci√≥n m√°s completa.

### Estructura de los ejercicios

Los ejercicios est√°n dise√±ados en orden de complejidad creciente. Cada ejercicio agrega funcionalidad sobre el anterior, permitiendo que entiendas cada componente antes de avanzar al siguiente nivel.

**Archivo de referencia:**
- `chatbot/chatbot_chainlit.py`: Versi√≥n m√≠nima funcional (punto de partida)

---

### Ejercicio 1: Configurar entorno y ejecutar el bot b√°sico

**Objetivo:** Configurar el entorno de desarrollo y ejecutar la versi√≥n m√≠nima del chatbot.

**Pasos:**

1. **Cre√° un entorno virtual:**
   ```bash
   python -m venv taller-rag
   ```

2. **Activ√° el entorno virtual:**
   - En Windows: `taller-rag\Scripts\activate`
   - En Linux/Mac: `source taller-rag/bin/activate`

3. **Instal√° dependencias desde `requirements.txt`:**
   ```bash
   pip install -r chatbot/requirements.txt
   ```

4. **Revis√° el c√≥digo base:**
   abr√≠ `chatbot/chatbot_chainlit.py` y familiarizate con su estructura:
   - Configuraci√≥n de AWS
   - Funci√≥n `generar_con_prompt()`
   - Handlers de Chainlit (`on_chat_start`, `on_message`)

5. **Configurar credenciales AWS:**
   Por ahora, vamos a hardcodear las credenciales directamente en el c√≥digo (en el ejercicio final las refactorizamos). Edit√° `chatbot/chatbot_chainlit.py` y reemplaz√° los valores de `os.getenv()` con tus credenciales reales:
   ```python
   # TODO: Reemplazar los valores de os.getenv() con tus credenciales reales
   # Por ahora hardcodeamos las credenciales (en "Pasos a seguir" las refactorizamos)
   session = boto3.Session(
       aws_access_key_id="TU_ACCESS_KEY_ID",  # Reemplaz√° con tu access key ID
       aws_secret_access_key="TU_SECRET_ACCESS_KEY",  # Reemplaz√° con tu secret access key
       aws_session_token="TU_SESSION_TOKEN"  # Reemplaz√° con tu session token (si us√°s credenciales temporales)
   )
   
   # Tambi√©n pod√©s verificar que las constantes est√©n configuradas:
   # AWS_REGION = "us-west-2"  # o la regi√≥n que corresponda
   # KNOWLEDGE_BASE_ID = "TU_KB_ID"  # Tu Knowledge Base ID
   # MODEL_ARN = "us.deepseek.r1-v1:0"  # El modelo que quer√©s usar
   ```
   
   **üí° Pista:** si no ten√©s credenciales AWS, pod√©s obtenerlas desde la consola de AWS o usando el comando `aws configure` si ten√©s AWS CLI instalado.

6. **Ejecut√° el chatbot:**
   ```bash
   chainlit run chatbot/chatbot_chainlit.py -w
   ```

7. **Prob√° el chatbot:**
   - abr√≠ el navegador en la URL que Chainlit muestra (t√≠picamente `http://localhost:8000`)
   - hac√© algunas preguntas sobre RAG y verific√° que el bot responda correctamente

**‚úÖ Criterio de √©xito:** El chatbot se ejecuta sin errores y responde preguntas b√°sicas.

---

### Ejercicio 2: Extraer y mostrar citas b√°sicas

**Objetivo:** extraer informaci√≥n de citas de la respuesta de Bedrock y mostrarlas al usuario.

**Tareas:**

1. **Cre√° la funci√≥n `extraer_citas_completas()`:** esta funci√≥n tiene que procesar el campo `citations` de la respuesta de Bedrock y extraer:
   - El texto citado (span)
   - Las referencias (fuentes) que respaldan cada cita
   - Las URIs de las fuentes

2. **Modific√° `on_message` para mostrar citas:** despu√©s de mostrar la respuesta principal, mostr√° las fuentes consultadas.

3. **Formato b√°sico de citas:** por ahora, mostr√° las citas como una lista simple de URIs o texto plano. En el siguiente ejercicio vamos a mejorar la visualizaci√≥n.

**üí° Pista:** revis√° la estructura de la respuesta de `retrieve_and_generate` en el Bloque 3 para entender c√≥mo est√°n organizadas las citas.

**‚úÖ Criterio de √©xito:** El chatbot muestra las fuentes que respaldan cada respuesta.

---

### Ejercicio 3: Agregar logging b√°sico

**Objetivo:** implementar logging para facilitar el debugging y monitoreo del chatbot.

**Tareas:**

1. **Configur√° logging al inicio del archivo:**
   ```python
   import logging
   
   logging.basicConfig(
       level=logging.INFO,
       format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
       handlers=[
           logging.FileHandler('chatbot.log', encoding='utf-8'),
           logging.StreamHandler()
       ]
   )
   logger = logging.getLogger(__name__)
   ```

2. **Agreg√° logs en puntos clave:**
   - al iniciar sesi√≥n (`on_chat_start`)
   - al recibir una pregunta (`on_message`)
   - antes y despu√©s de llamar a Bedrock (`generar_con_prompt`)
   - al procesar errores

3. **Prob√° y revis√° los logs:** ejecut√° el chatbot y verific√° que los logs se escriban correctamente en `chatbot.log` y en la consola.

**‚úÖ Criterio de √©xito:** Los logs capturan informaci√≥n relevante sobre el flujo de ejecuci√≥n y errores.

---

### Ejercicio 4: Integrar componente JSX para citas interactivas

**Objetivo:** integrar el componente JSX existente en el chatbot para mostrar citas de forma elegante e interactiva.

#### ¬øQu√© es JSX?

JSX (JavaScript XML) es una extensi√≥n de sintaxis de JavaScript que permite escribir c√≥digo que se parece a HTML dentro de JavaScript. En el contexto de Chainlit, los componentes JSX permiten crear elementos visuales personalizados para la interfaz del chatbot usando React.

Un componente JSX es b√°sicamente una funci√≥n que recibe datos (llamados "props") y retorna elementos visuales. Por ejemplo, el componente `Citations.jsx` que ya existe en `chatbot/public/elements/Citations.jsx` recibe una lista de citas y las muestra en un formato interactivo con acordeones desplegables.

**Tareas:**

1. **Revis√° el componente existente:** el archivo `chatbot/public/elements/Citations.jsx` ya contiene un componente React que muestra las citas de forma interactiva. Abr√≠ el archivo y familiarizate con su estructura para entender qu√© datos espera recibir.

2. **Integr√° el componente en Python:** modific√° tu funci√≥n `on_message` para usar `cl.CustomElement` y pasar las citas al componente JSX:
   ```python
   # Despu√©s de extraer las citas con extraer_citas_completas()
   if citas_completas:
       citations_element = cl.CustomElement(
           name="Citations",
           props={"citations": citas_completas}
       )
       await cl.Message(
           content="",
           elements=[citations_element],
           author="Asistente RAG"
       ).send()
   ```

3. **Verific√° el formato de datos:** asegurate de que `citas_completas` tenga el formato correcto que espera el componente JSX. Cada cita debe tener:
   - `citation_index`: n√∫mero de la cita
   - `texto_citado`: el texto que est√° siendo citado
   - `span_start` y `span_end`: posiciones del span
   - `referencias`: lista de referencias con `source` y `content`

4. **Prob√° la visualizaci√≥n:** ejecut√° el chatbot y verific√° que las citas se muestren correctamente en formato colapsable y que se puedan expandir para ver detalles.

**üí° Pista:** el componente JSX espera recibir las citas en el mismo formato que retorna `extraer_citas_completas()`, as√≠ que solo necesit√°s pasarle directamente el resultado de esa funci√≥n.

**‚úÖ Criterio de √©xito:** Las citas se muestran en un formato visual interactivo y profesional usando el componente JSX.

---

## Pasos a seguir

Una vez completados los ejercicios anteriores, te recomendamos implementar estas mejoras adicionales para hacer tu chatbot m√°s robusto y profesional:

### Variables de entorno

**Objetivo:** mejorar la seguridad y flexibilidad del c√≥digo usando variables de entorno en lugar de credenciales hardcodeadas.

**Pasos:**

1. **Identific√° los valores hardcodeados:**
   - Credenciales AWS (access key, secret key, session token)
   - Knowledge Base ID
   - Model ARN
   - AWS Region

2. **Refactoriz√° para usar `os.getenv()`:** agreg√° c√≥digo para leer las variables de entorno en lugar de valores hardcodeados:
   ```python
   AWS_ACCESS_KEY_ID = os.getenv("AWS_ACCESS_KEY_ID")
   AWS_SECRET_ACCESS_KEY = os.getenv("AWS_SECRET_ACCESS_KEY")
   AWS_SESSION_TOKEN = os.getenv("AWS_SESSION_TOKEN")
   KNOWLEDGE_BASE_ID = os.getenv("BEDROCK_KB_ID")
   MODEL_ARN = os.getenv("BEDROCK_MODEL_ARN")
   AWS_REGION = os.getenv("AWS_REGION", "us-west-2")
   ```

3. **Cre√° un archivo `.env` de ejemplo:** document√° qu√© variables de entorno son necesarias.

4. **Actualiz√° la documentaci√≥n:** agreg√° instrucciones sobre c√≥mo configurar las variables de entorno.

### Manejo de errores

**Objetivo:** agregar manejo de errores m√°s espec√≠fico y mensajes informativos para el usuario.

**Pasos:**

1. **Identific√° tipos de errores comunes:**
   - Errores de autenticaci√≥n AWS
   - Errores de conexi√≥n/timeout
   - Errores de la API de Bedrock
   - Respuestas vac√≠as o inv√°lidas

2. **Modific√° `on_message` para manejar errores espec√≠ficos:**
   ```python
   @cl.on_message
   async def on_message(message: cl.Message):
       try:
           respuesta = generar_con_prompt(message.content)
           texto = respuesta.get("output", {}).get("text", "<Sin respuesta>")
           
           if not texto or texto == "<Sin respuesta>":
               await cl.Message(content="‚ùå No se pudo generar una respuesta v√°lida.", author="Sistema").send()
               return
               
           await cl.Message(content=texto, author="Asistente RAG").send()
       except cliente.exceptions.ClientError as e:
           # Manejar errores espec√≠ficos de AWS
           await cl.Message(content=f"‚ùå Error de AWS: {str(e)}", author="Sistema").send()
       except Exception as e:
           # Manejar otros errores
           await cl.Message(content=f"‚ùå Error: {str(e)}", author="Sistema").send()
   ```

3. **Agreg√° validaci√≥n de respuesta vac√≠a:** verific√° que la respuesta contenga texto antes de enviarla al usuario.