# Bloque 0 · Visión general del proyecto RAG

En este bloque presentaremos el panorama completo del proyecto que construiremos a lo largo del taller: un flujo Retrieval-Augmented Generation (RAG) que utilizará Amazon Bedrock para la generación y Chainlit como interfaz de chatbot, alimentado por documentos propios.

## Preparación del entorno

Ejecuta la siguiente celda una sola vez al iniciar el taller para instalar las dependencias comunes. Esto garantiza que los notebooks posteriores tengan disponibles las librerías necesarias para trabajar con gráficos, NumPy y los SDK de AWS.

In [None]:
import sys
import subprocess
from pathlib import Path

requirements_path = Path("..") / "requirements.txt"
if not requirements_path.exists():
    raise FileNotFoundError(f"No se encontró {requirements_path}. Verifica la ruta antes de continuar.")

subprocess.check_call([sys.executable, "-m", "pip", "install", "-r", str(requirements_path)])

## ¿Qué problema resuelve un sistema RAG?

- **Actualización constante**: permite inyectar conocimiento reciente o privado sin reentrenar un modelo grande.
- **Control de fuentes**: las respuestas se fundamentan en documentos verificados, lo que mejora la confiabilidad.
- **Personalización**: adapta la generación del modelo a la terminología y contexto de una organización.

Sin RAG, un modelo de lenguaje puede alucinar, sufrir sesgos por entrenamiento y desconocer información interna crítica.

## Alternativas y enfoques relacionados

- **Fine-tuning de modelos**: útil cuando se dispone de datos etiquetados y se necesita ajustar el comportamiento del modelo; es más costoso y lento de iterar.
- **Prompt engineering puro**: mejora puntual de instrucciones, pero no garantiza acceso a conocimiento específico ni escalabilidad.
- **Bases de conocimiento tradicionales**: FAQ o buscadores basados en palabras clave; rápidos, pero con menor comprensión semántica.
- **Sistemas híbridos**: combinan rankers clásicos (BM25) con embeddings para equilibrar precisión y diversidad.

En el taller adoptaremos RAG porque ofrece un equilibrio práctico entre velocidad de iteración, personalización y capacidad de explicar la procedencia de la información.

## Diagrama del flujo que construiremos

El siguiente diagrama ilustra los componentes principales y cómo se conectan. Utilizamos `graphviz` para asegurar compatibilidad con Google Colab:


In [None]:
import sys
import importlib
import subprocess

def ensure_package(package):
    try:
        return importlib.import_module(package)
    except ModuleNotFoundError:
        subprocess.run([sys.executable, "-m", "pip", "install", package], check=True)
        return importlib.import_module(package)

graphviz = ensure_package("graphviz")
from graphviz import Digraph

diagrama = Digraph(
    name="FlujoRAG",
    graph_attr={"rankdir": "LR", "splines": "spline", "fontname": "Helvetica"},
    node_attr={"shape": "rectangle", "style": "rounded,filled", "fillcolor": "#E1F5FE"},
)

diagrama.node("docs", "Documentos corporativos\n(PDF, markdown, wikis)", fillcolor="#FFE0B2")
diagrama.node("ingesta", "Ingesta y preprocesamiento", fillcolor="#FFF9C4")
diagrama.node("chunk", "Chunking + Embeddings\n(Embeddings Bedrock)", fillcolor="#DCEDC8")
diagrama.node("vector", "Vector Store\n(Búsqueda por similitud)", fillcolor="#C8E6C9")
diagrama.node("retriever", "Retriever", fillcolor="#B3E5FC")
diagrama.node("bedrock", "LLM en Amazon Bedrock", fillcolor="#D1C4E9")
diagrama.node("chainlit", "Chatbot Chainlit", fillcolor="#F8BBD0")
diagrama.node("usuario", "Usuario final", fillcolor="#FFCDD2")

diagrama.edges([
    ("docs", "ingesta"),
    ("ingesta", "chunk"),
    ("chunk", "vector"),
    ("usuario", "chainlit"),
    ("chainlit", "retriever"),
    ("retriever", "vector"),
    ("retriever", "bedrock"),
    ("bedrock", "chainlit"),
])

display(diagrama)


## Recorrido propuesto para el taller

1. **Bloque 0**: visión general y objetivos (esta notebook).
2. **Bloque 1**: fundamentos de RAG y simulación de búsqueda vectorial.
3. **Bloques siguientes**: ingestión de documentos reales, construcción del índice vectorial, integración con Amazon Bedrock y creación del chatbot en Chainlit.

Al finalizar, contarás con una arquitectura reproducible para responder preguntas internas de forma controlada y explicable.