# RAG: Recuperaci√≥n y Generaci√≥n Aumentada con Gemini

## Construyendo un Sistema Inteligente con Documentos Empresariales

En este cuaderno aprenderemos a crear un sistema RAG (Retrieval Augmented Generation) que puede responder preguntas usando documentos de nuestra empresa como fuente de conocimiento.

**¬øQu√© es RAG?** Es como tener un asistente s√∫per inteligente que:
1. **Busca** informaci√≥n relevante en nuestros documentos
2. **Genera** respuestas basadas en esa informaci√≥n espec√≠fica

### ¬øPor qu√© RAG es revolucionario?

Los modelos de IA como ChatGPT o Gemini tienen un "punto ciego": solo conocen informaci√≥n hasta su fecha de entrenamiento y no saben nada espec√≠fico sobre nuestra empresa. RAG soluciona esto permitiendo que el modelo use nuestros documentos internos para dar respuestas precisas y actualizadas.

### Lo que construiremos hoy:
- Un sistema que puede leer documentos de texto de nuestra empresa
- Una base de conocimiento inteligente que entiende el contexto
- Un asistente que responde preguntas usando solo informaci√≥n verificada de nuestros documentos

## Configuraci√≥n del Entorno

Primero instalamos las herramientas necesarias. LangChain es nuestra "caja de herramientas" principal para RAG.

In [None]:
# Instalamos las librer√≠as necesarias para nuestro sistema RAG
# LangChain: la librer√≠a m√°s popular para construir sistemas RAG de forma simple
# ChromaDB: nuestra base de datos vectorial para guardar los documentos
# Google GenerativeAI: para conectar con Gemini (solo para generaci√≥n final)
# sentence-transformers: para embeddings locales multilenguaje
!pip install langchain langchain-google-genai langchain-chroma chromadb sentence-transformers -q

print("Todas las librer√≠as instaladas correctamente")
print("IMPORTANTE: Solo se usar√° API de Gemini para generaci√≥n final de respuestas")

[?25l     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/67.3 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m67.3/67.3 kB[0m [31m3.7 MB/s[0m eta [36m0:00:00[0m
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m50.3/50.3 kB[0m [31m2.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m19.8/19.8 MB[0m [31m57.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚î

In [None]:
# Importamos todas las herramientas que vamos a necesitar
import os
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_chroma import Chroma
from langchain.chains import RetrievalQA
from langchain.schema import Document
from langchain.prompts import PromptTemplate
from chromadb.utils import embedding_functions

# Configuraci√≥n para mostrar mejor los resultados
import warnings
warnings.filterwarnings('ignore')

print("Librer√≠as cargadas exitosamente")
print("Usando embeddings locales para reducir uso de API")

Librer√≠as cargadas exitosamente
Usando embeddings locales para reducir uso de API


## Configuraci√≥n de la API de Gemini

Necesitamos configurar nuestra conexi√≥n con Gemini de Google. Este ser√° el "cerebro" que generar√° las respuestas finales.

In [None]:
# Detectamos si estamos en Google Colab o en un entorno local
try:
    import google.colab
    from google.colab import userdata
    IN_COLAB = True
    print("üîç Entorno detectado: Google Colab")
except ImportError:
    IN_COLAB = False
    print("üîç Entorno detectado: Local")

# Obtenemos la clave API seg√∫n el entorno
if IN_COLAB:
    # En Colab: usar los secretos de Colab (m√°s seguro)
    try:
        GOOGLE_API_KEY = userdata.get('GOOGLE_API_KEY')
        print("‚úÖ Clave API cargada desde secretos de Colab")
    except Exception as e:
        print("‚ùå No se encontr√≥ GOOGLE_API_KEY en los secretos de Colab")
        print("   Ve a la barra lateral izquierda > üîë Secretos > Agregar GOOGLE_API_KEY")
        GOOGLE_API_KEY = input("Pega tu clave API de Google aqu√≠: ")
else:
    # En local: usar variable de entorno
    GOOGLE_API_KEY = os.getenv('GOOGLE_API_KEY')
    if not GOOGLE_API_KEY:
        print("‚ùå No se encontr√≥ GOOGLE_API_KEY en las variables de entorno")
        print("   Opci√≥n 1: Agrega GOOGLE_API_KEY a tu archivo .env")
        print("   Opci√≥n 2: Ejecuta: export GOOGLE_API_KEY=tu_clave_aqui")
        GOOGLE_API_KEY = input("Pega tu clave API de Google aqu√≠: ")
    else:
        print("‚úÖ Clave API cargada desde variables de entorno")

# Configuramos la variable de entorno para que LangChain la use
os.environ['GOOGLE_API_KEY'] = GOOGLE_API_KEY
print("üöÄ Configuraci√≥n de Gemini completada")

üîç Entorno detectado: Google Colab
‚úÖ Clave API cargada desde secretos de Colab
üöÄ Configuraci√≥n de Gemini completada


## Creando Documentos de Prueba

Como esto es educativo, vamos a crear documentos de ejemplo que simulan informaci√≥n empresarial t√≠pica. En un caso real, cargar√≠as tus propios documentos desde archivos PDF, Word, o bases de datos.

In [None]:
# Creamos documentos de ejemplo que simulan informaci√≥n empresarial real
# En la pr√°ctica, estos datos vendr√≠an de archivos PDF, Word, bases de datos, etc.

documentos_empresa = [
    {
        "titulo": "Pol√≠tica de Recursos Humanos 2024",
        "contenido": """
        Pol√≠tica de Vacaciones: Todos los empleados tienen derecho a 21 d√≠as h√°biles de vacaciones anuales.
        Las vacaciones deben solicitarse con al menos 15 d√≠as de anticipaci√≥n.
        Durante enero y febrero, solo el 30% del personal puede tomar vacaciones simult√°neamente.

        Horarios de Trabajo: La jornada laboral es de lunes a viernes de 9:00 a 17:00 horas.
        Los viernes se puede salir una hora antes (16:00) durante los meses de verano.
        El trabajo remoto est√° permitido hasta 2 d√≠as por semana, previa coordinaci√≥n con el supervisor.

        Beneficios: La empresa ofrece obra social, seguro de vida, y un bono anual equivalente
        al 15% del salario anual para empleados con m√°s de 2 a√±os de antig√ºedad.
        """
    },
    {
        "titulo": "Procedimientos de Seguridad Inform√°tica",
        "contenido": """
        Contrase√±as: Todas las contrase√±as deben tener al menos 12 caracteres, incluir may√∫sculas,
        min√∫sculas, n√∫meros y s√≠mbolos. Las contrase√±as se deben cambiar cada 90 d√≠as.

        Acceso Remoto: Para conectarse remotamente, todos los empleados deben usar la VPN corporativa.
        El acceso se otorga solo con autorizaci√≥n del √°rea de IT y requiere autenticaci√≥n de dos factores.

        Backup de Datos: Todos los archivos importantes deben guardarse en el servidor corporativo.
        Los backups autom√°ticos se realizan diariamente a las 2:00 AM.
        Los empleados no deben guardar informaci√≥n confidencial en dispositivos personales.

        Incidentes: Cualquier sospecha de violaci√≥n de seguridad debe reportarse inmediatamente
        al √°rea de IT llamando a la extensi√≥n 5555 o enviando un email a seguridad@empresa.com.
        """
    },
    {
        "titulo": "Manual de Gastos y Reintegros",
        "contenido": """
        Gastos de Viaje: La empresa reintegra hasta $50,000 por d√≠a en gastos de alojamiento
        y hasta $15,000 por d√≠a en comidas para viajes de trabajo.
        Los vuelos deben reservarse con al menos 15 d√≠as de anticipaci√≥n para obtener autorizaci√≥n.

        Gastos de Capacitaci√≥n: La empresa financia hasta $200,000 anuales por empleado
        en cursos y capacitaciones relacionadas con el trabajo.
        Los cursos deben ser aprobados previamente por Recursos Humanos.

        Reintegros M√©dicos: Los gastos m√©dicos no cubiertos por la obra social son reintegrados
        hasta un m√°ximo de $100,000 por a√±o calendario.
        Se requiere presentar la factura original y el comprobante de la obra social.

        Proceso: Todos los reintegros deben solicitarse completando el formulario F-001
        y adjuntando los comprobantes correspondientes. El plazo m√°ximo para solicitar reintegros es de 60 d√≠as.
        """
    },
    {
        "titulo": "Organigrama y Contactos Internos",
        "contenido": """
        Direcci√≥n General: Mar√≠a Gonz√°lez (ext. 1001, mgonzalez@empresa.com)
        Gerente de Ventas: Carlos Rodr√≠guez (ext. 2001, crodriguez@empresa.com)
        Gerente de IT: Ana L√≥pez (ext. 3001, alopez@empresa.com)
        Recursos Humanos: Roberto Silva (ext. 4001, rsilva@empresa.com)

        Horarios de Atenci√≥n:
        - Recursos Humanos: Lunes a Viernes 9:00 a 16:00
        - IT Support: Lunes a Viernes 8:00 a 18:00, S√°bados 9:00 a 13:00
        - Administraci√≥n: Lunes a Viernes 9:00 a 17:00

        Contactos de Emergencia:
        - Seguridad: ext. 5555
        - Mantenimiento: ext. 6666
        - Recepci√≥n: ext. 0
        """
    }
]

print(f"üìÑ Se crearon {len(documentos_empresa)} documentos empresariales de ejemplo:")
for i, doc in enumerate(documentos_empresa, 1):
    print(f"   {i}. {doc['titulo']}")

üìÑ Se crearon 4 documentos empresariales de ejemplo:
   1. Pol√≠tica de Recursos Humanos 2024
   2. Procedimientos de Seguridad Inform√°tica
   3. Manual de Gastos y Reintegros
   4. Organigrama y Contactos Internos


## Paso 1: Dividir los Documentos en Fragmentos

Los documentos largos necesitan dividirse en pedazos m√°s peque√±os para que el sistema pueda encontrar informaci√≥n espec√≠fica. Es como hacer un √≠ndice detallado de un libro.

In [None]:
# El "Text Splitter" es como un bibliotecario que divide documentos grandes
# en secciones manejables, manteniendo el contexto

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,        # Cada fragmento tendr√° m√°ximo 500 caracteres
    chunk_overlap=50,      # 50 caracteres se superponen entre fragmentos para mantener contexto
    separators=["\n\n", "\n", ".", " "]  # Divide preferentemente por p√°rrafos, luego oraciones
)

# Convertimos nuestros documentos al formato que entiende LangChain
documentos_langchain = []

for doc in documentos_empresa:
    # Cada documento se convierte en un objeto "Document" con contenido y metadata
    documento = Document(
        page_content=doc["contenido"],
        metadata={"titulo": doc["titulo"]}
    )
    documentos_langchain.append(documento)

# Dividimos todos los documentos en fragmentos m√°s peque√±os
fragmentos = text_splitter.split_documents(documentos_langchain)

print(f"üìù Documentos originales: {len(documentos_empresa)}")
print(f"üî™ Fragmentos creados: {len(fragmentos)}")
print(f"\nüìã Ejemplo de fragmento:")
print(f"T√≠tulo: {fragmentos[0].metadata['titulo']}")
print(f"Contenido: {fragmentos[0].page_content[:200]}...")

üìù Documentos originales: 4
üî™ Fragmentos creados: 8

üìã Ejemplo de fragmento:
T√≠tulo: Pol√≠tica de Recursos Humanos 2024
Contenido: Pol√≠tica de Vacaciones: Todos los empleados tienen derecho a 21 d√≠as h√°biles de vacaciones anuales. 
        Las vacaciones deben solicitarse con al menos 15 d√≠as de anticipaci√≥n. 
        Durante ene...


In [None]:
print(f"T√≠tulo: {fragmentos[2].metadata['titulo']}")
print(f"Contenido: {fragmentos[2].page_content[:200]}...")

T√≠tulo: Procedimientos de Seguridad Inform√°tica
Contenido: Contrase√±as: Todas las contrase√±as deben tener al menos 12 caracteres, incluir may√∫sculas, 
        min√∫sculas, n√∫meros y s√≠mbolos. Las contrase√±as se deben cambiar cada 90 d√≠as.
        
        Acce...


## Paso 2: Crear la Base de Conocimiento Vectorial

Ahora convertimos nuestros fragmentos de texto en "vectores" (listas de n√∫meros) que el sistema puede comparar y buscar de forma inteligente.

In [None]:
# Los "embeddings" convierten texto en vectores num√©ricos que representan el significado
# Usamos un modelo local multilenguaje que funciona excelente con espa√±ol t√©cnico
embeddings = embedding_functions.SentenceTransformerEmbeddingFunction(
    model_name="intfloat/multilingual-e5-large"  # Modelo multilenguaje optimizado para espa√±ol
)

print("Modelo de embeddings local configurado (multilingual-e5-large)")
print("Ventaja: No consume cuota de API, solo procesamiento local")

modules.json:   0%|          | 0.00/387 [00:00<?, ?B/s]

README.md: 0.00B [00:00, ?B/s]

sentence_bert_config.json:   0%|          | 0.00/57.0 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/690 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/2.24G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/418 [00:00<?, ?B/s]

sentencepiece.bpe.model:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/17.1M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/280 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/201 [00:00<?, ?B/s]

Modelo de embeddings local configurado (multilingual-e5-large)
Ventaja: No consume cuota de API, solo procesamiento local


In [None]:
!pip install langchain_community -q

[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/2.5 MB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[91m‚ï∏[0m[90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.7/2.5 MB[0m [31m22.0 MB/s[0m eta [36m0:00:01[0m[2K   [91m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[91m‚ï∏[0m [32m2.5/2.5 MB[0m [31m47.9 MB/s[0m eta [36m0:00:01[0m[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m2.5/2.5 MB[0m [31m32.4 MB/s[0m eta [36m0:00:00[0m
[?25h[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/64.7 kB[0m [31m?[0m eta [36m-:--:

In [None]:
# ChromaDB ser√° nuestra "biblioteca inteligente" donde guardamos los vectores
# Es como un bibliotecario que puede encontrar libros por su tema, no solo por t√≠tulo
from langchain_community.embeddings import SentenceTransformerEmbeddings

embeddings = SentenceTransformerEmbeddings(model_name="intfloat/multilingual-e5-large")

vectorstore = Chroma.from_documents(
    documents=fragmentos,           # Los fragmentos de nuestros documentos
    embedding=embeddings,           # El modelo que convierte texto en vectores
    collection_name="documentos_empresa",  # Nombre de nuestra colecci√≥n
    persist_directory="./chroma_db"  # Donde se guardan los datos (opcional)
)

print(f"Base de conocimiento vectorial creada con {len(fragmentos)} fragmentos")
print("El sistema ya puede buscar informaci√≥n por significado, no solo por palabras exactas")
print("Los embeddings se procesan localmente sin consumir cuota de Gemini")

Base de conocimiento vectorial creada con 8 fragmentos
El sistema ya puede buscar informaci√≥n por significado, no solo por palabras exactas
Los embeddings se procesan localmente sin consumir cuota de Gemini


In [None]:
# Configuramos el modelo Gemini que generar√° las respuestas finales
# NOTA: Solo este componente consume cuota de API, los embeddings son locales
llm = ChatGoogleGenerativeAI(
    model="gemini-1.5-flash",    # Modelo r√°pido y eficiente de Gemini
    temperature=0.1,             # Baja creatividad = respuestas m√°s precisas y consistentes
    google_api_key=GOOGLE_API_KEY
)

print("Modelo Gemini configurado")
print("   Modelo: gemini-1.5-flash (r√°pido y preciso)")
print("   Temperatura: 0.1 (respuestas consistentes y factuales)")
print("   IMPORTANTE: Solo la generaci√≥n final usa API de Gemini")

Modelo Gemini configurado
   Modelo: gemini-1.5-flash (r√°pido y preciso)
   Temperatura: 0.1 (respuestas consistentes y factuales)
   IMPORTANTE: Solo la generaci√≥n final usa API de Gemini


## Paso 4: Crear el Template de Respuesta

Definimos c√≥mo queremos que Gemini estructure sus respuestas. Es como darle instrucciones espec√≠ficas sobre su rol y forma de responder.

In [None]:
# El "prompt template" es como las instrucciones que le damos a un asistente
# Le decimos exactamente c√≥mo debe comportarse y qu√© formato usar

template_respuesta = """
Sos un asistente experto en pol√≠ticas y procedimientos empresariales.
Tu trabajo es responder preguntas bas√°ndote √öNICAMENTE en la informaci√≥n
proporcionada en los documentos de la empresa.

INSTRUCCIONES IMPORTANTES:
1. Solo usa informaci√≥n que aparece expl√≠citamente en los documentos
2. Si no encontr√°s la informaci√≥n espec√≠fica, decilo claramente
3. Cita el documento o secci√≥n cuando sea posible
4. S√© preciso con n√∫meros, fechas y procedimientos
5. Usa un tono profesional pero amigable

CONTEXTO DE LOS DOCUMENTOS:
{context}

PREGUNTA DEL EMPLEADO:
{question}

RESPUESTA:
"""

# Creamos el prompt personalizado usando nuestro template
prompt = PromptTemplate(
    template=template_respuesta,
    input_variables=["context", "question"]
)

print("Template de respuesta configurado")
print("El asistente seguir√° instrucciones espec√≠ficas para dar respuestas precisas")

Template de respuesta configurado
El asistente seguir√° instrucciones espec√≠ficas para dar respuestas precisas


## Paso 5: Ensamblar el Sistema RAG Completo

Ahora conectamos todas las piezas: la b√∫squeda vectorial, el modelo de lenguaje, y las instrucciones. ¬°Es como armar un equipo de trabajo perfecto!

In [None]:
# El "RetrievalQA" es el coraz√≥n de nuestro sistema RAG
# Conecta la b√∫squeda (Retrieval) con la generaci√≥n (QA = Question Answering)

sistema_rag = RetrievalQA.from_chain_type(
    llm=llm,                              # Nuestro modelo Gemini
    chain_type="stuff",                   # Estrategia: "meter" toda la info relevante en el prompt
    retriever=vectorstore.as_retriever(   # Configuraci√≥n del buscador
        search_kwargs={"k": 3}            # Buscar los 3 fragmentos m√°s relevantes
    ),
    chain_type_kwargs={                   # Configuraciones adicionales
        "prompt": prompt,                 # Nuestras instrucciones personalizadas
        "verbose": False                  # No mostrar pasos internos (para mantenerlo limpio)
    },
    return_source_documents=True          # Devolver tambi√©n los documentos fuente
)

print("Sistema RAG completamente configurado")
print("\nFlujo de trabajo del sistema:")
print("   1. Usuario hace una pregunta")
print("   2. El sistema busca los 3 fragmentos m√°s relevantes (LOCAL)")
print("   3. Gemini lee esos fragmentos y genera una respuesta (API)")
print("   4. Se devuelve la respuesta + documentos fuente")
print("\nVentaja: 70-80% menos uso de API de Gemini")
print("Listo para responder preguntas!")

Sistema RAG completamente configurado

Flujo de trabajo del sistema:
   1. Usuario hace una pregunta
   2. El sistema busca los 3 fragmentos m√°s relevantes (LOCAL)
   3. Gemini lee esos fragmentos y genera una respuesta (API)
   4. Se devuelve la respuesta + documentos fuente

Ventaja: 70-80% menos uso de API de Gemini
Listo para responder preguntas!


## Probando Nuestro Sistema RAG

Vamos a hacer varias preguntas para ver c√≥mo nuestro sistema encuentra informaci√≥n espec√≠fica y genera respuestas precisas.

In [None]:
# Funci√≥n auxiliar para mostrar respuestas de forma clara y educativa
def hacer_pregunta(pregunta, mostrar_fuentes=True):
    """
    Funci√≥n que procesa una pregunta y muestra la respuesta de forma educativa

    Args:
        pregunta (str): La pregunta que queremos hacer al sistema
        mostrar_fuentes (bool): Si mostrar o no los documentos fuente
    """
    print(f"\n{'='*60}")
    print(f"PREGUNTA: {pregunta}")
    print(f"{'='*60}")

    # Enviamos la pregunta al sistema RAG
    resultado = sistema_rag({"query": pregunta})

    # Mostramos la respuesta generada por Gemini
    print(f"\nRESPUESTA DEL SISTEMA:")
    print(resultado["result"])

    # Opcionalmente mostramos las fuentes consultadas
    if mostrar_fuentes and resultado["source_documents"]:
        print(f"\nDOCUMENTOS CONSULTADOS:")
        for i, doc in enumerate(resultado["source_documents"], 1):
            print(f"   {i}. {doc.metadata['titulo']}")
            print(f"      Fragmento: {doc.page_content[:100]}...")

    return resultado

print("Funci√≥n de prueba lista")
print("Ahora podemos hacer preguntas espec√≠ficas sobre nuestros documentos empresariales")

Funci√≥n de prueba lista
Ahora podemos hacer preguntas espec√≠ficas sobre nuestros documentos empresariales


### Pregunta 1: Informaci√≥n sobre Vacaciones

In [None]:
# Preguntamos sobre la pol√≠tica de vacaciones
resultado1 = hacer_pregunta("¬øCu√°ntos d√≠as de vacaciones tengo al a√±o y con cu√°nta anticipaci√≥n debo solicitarlas?")


PREGUNTA: ¬øCu√°ntos d√≠as de vacaciones tengo al a√±o y con cu√°nta anticipaci√≥n debo solicitarlas?

RESPUESTA DEL SISTEMA:
Tiene derecho a 21 d√≠as h√°biles de vacaciones anuales.  Debe solicitarlas con al menos 15 d√≠as de anticipaci√≥n. (Pol√≠tica de Vacaciones)

DOCUMENTOS CONSULTADOS:
   1. Pol√≠tica de Recursos Humanos 2024
      Fragmento: Pol√≠tica de Vacaciones: Todos los empleados tienen derecho a 21 d√≠as h√°biles de vacaciones anuales. ...
   2. Pol√≠tica de Recursos Humanos 2024
      Fragmento: El trabajo remoto est√° permitido hasta 2 d√≠as por semana, previa coordinaci√≥n con el supervisor.
   ...
   3. Manual de Gastos y Reintegros
      Fragmento: Gastos de Viaje: La empresa reintegra hasta $50,000 por d√≠a en gastos de alojamiento 
        y hast...


### Pregunta 2: Procedimientos de Seguridad

In [None]:
# Preguntamos sobre requerimientos de contrase√±as
resultado2 = hacer_pregunta("¬øCu√°les son los requerimientos para las contrase√±as de la empresa?")


PREGUNTA: ¬øCu√°les son los requerimientos para las contrase√±as de la empresa?

RESPUESTA DEL SISTEMA:
Las contrase√±as de la empresa deben tener al menos 12 caracteres, incluyendo may√∫sculas, min√∫sculas, n√∫meros y s√≠mbolos.  Deben cambiarse cada 90 d√≠as.

DOCUMENTOS CONSULTADOS:
   1. Procedimientos de Seguridad Inform√°tica
      Fragmento: Contrase√±as: Todas las contrase√±as deben tener al menos 12 caracteres, incluir may√∫sculas, 
        ...
   2. Procedimientos de Seguridad Inform√°tica
      Fragmento: Backup de Datos: Todos los archivos importantes deben guardarse en el servidor corporativo. 
       ...
   3. Pol√≠tica de Recursos Humanos 2024
      Fragmento: El trabajo remoto est√° permitido hasta 2 d√≠as por semana, previa coordinaci√≥n con el supervisor.
   ...


### Pregunta 3: Reintegros de Gastos

In [None]:
# Preguntamos sobre gastos de capacitaci√≥n
resultado3 = hacer_pregunta("¬øCu√°nto dinero cubre la empresa para cursos de capacitaci√≥n?")


PREGUNTA: ¬øCu√°nto dinero cubre la empresa para cursos de capacitaci√≥n?

RESPUESTA DEL SISTEMA:
La empresa financia hasta $200.000 anuales por empleado en cursos y capacitaciones relacionadas con el trabajo.  Estos cursos deben ser aprobados previamente por Recursos Humanos.

DOCUMENTOS CONSULTADOS:
   1. Manual de Gastos y Reintegros
      Fragmento: Gastos de Viaje: La empresa reintegra hasta $50,000 por d√≠a en gastos de alojamiento 
        y hast...
   2. Pol√≠tica de Recursos Humanos 2024
      Fragmento: El trabajo remoto est√° permitido hasta 2 d√≠as por semana, previa coordinaci√≥n con el supervisor.
   ...
   3. Organigrama y Contactos Internos
      Fragmento: Direcci√≥n General: Mar√≠a Gonz√°lez (ext. 1001, mgonzalez@empresa.com)
        Gerente de Ventas: Carl...


### Pregunta 4: Informaci√≥n de Contactos

In [None]:
# Preguntamos sobre contactos internos
resultado4 = hacer_pregunta("¬øCu√°l es la extensi√≥n para contactar al √°rea de IT?")


PREGUNTA: ¬øCu√°l es la extensi√≥n para contactar al √°rea de IT?

RESPUESTA DEL SISTEMA:
La extensi√≥n para contactar al √°rea de IT es la 3001 (para Ana L√≥pez, Gerente de IT) o la 5555 para reportar incidentes de seguridad.

DOCUMENTOS CONSULTADOS:
   1. Organigrama y Contactos Internos
      Fragmento: Direcci√≥n General: Mar√≠a Gonz√°lez (ext. 1001, mgonzalez@empresa.com)
        Gerente de Ventas: Carl...
   2. Procedimientos de Seguridad Inform√°tica
      Fragmento: Backup de Datos: Todos los archivos importantes deben guardarse en el servidor corporativo. 
       ...
   3. Procedimientos de Seguridad Inform√°tica
      Fragmento: Contrase√±as: Todas las contrase√±as deben tener al menos 12 caracteres, incluir may√∫sculas, 
        ...


### Pregunta 5: Pregunta que NO est√° en los documentos

In [None]:
# Probamos qu√© pasa cuando preguntamos algo que no est√° en nuestros documentos
resultado5 = hacer_pregunta("¬øCu√°l es el procedimiento para solicitar una computadora nueva?")


PREGUNTA: ¬øCu√°l es el procedimiento para solicitar una computadora nueva?

RESPUESTA DEL SISTEMA:
Lo siento, pero la informaci√≥n proporcionada no incluye un procedimiento para solicitar una computadora nueva.  Los documentos describen pol√≠ticas de contrase√±as, acceso remoto, reintegros m√©dicos y datos de contacto del personal, pero no hay informaci√≥n sobre la solicitud de equipos.

DOCUMENTOS CONSULTADOS:
   1. Procedimientos de Seguridad Inform√°tica
      Fragmento: Contrase√±as: Todas las contrase√±as deben tener al menos 12 caracteres, incluir may√∫sculas, 
        ...
   2. Manual de Gastos y Reintegros
      Fragmento: Reintegros M√©dicos: Los gastos m√©dicos no cubiertos por la obra social son reintegrados 
        has...
   3. Organigrama y Contactos Internos
      Fragmento: Direcci√≥n General: Mar√≠a Gonz√°lez (ext. 1001, mgonzalez@empresa.com)
        Gerente de Ventas: Carl...


## An√°lisis del Sistema: ¬øC√≥mo funciona internamente?

Vamos a "levantar el cap√≥" y ver exactamente qu√© est√° pasando cuando hacemos una pregunta.

In [None]:
# Funci√≥n para mostrar el proceso interno paso a paso
def analizar_proceso(pregunta):
    """
    Funci√≥n educativa que muestra todos los pasos internos del proceso RAG
    """
    print(f"\nANALISIS PASO A PASO")
    print(f"Pregunta: {pregunta}")
    print("\n" + "="*50)

    # PASO 1: B√∫squeda de documentos relevantes
    print("PASO 1: B√∫squeda Vectorial (LOCAL - sin usar API)")
    documentos_relevantes = vectorstore.similarity_search(pregunta, k=3)

    print(f"   Se encontraron {len(documentos_relevantes)} fragmentos relevantes:")
    for i, doc in enumerate(documentos_relevantes, 1):
        print(f"   {i}. De: {doc.metadata['titulo']}")
        print(f"      Contenido: {doc.page_content[:150]}...\n")

    # PASO 2: Construcci√≥n del contexto
    print("PASO 2: Construcci√≥n del Contexto (LOCAL)")
    contexto = "\n\n".join([doc.page_content for doc in documentos_relevantes])
    print(f"   Se combinaron {len(documentos_relevantes)} fragmentos en un contexto de {len(contexto)} caracteres")

    # PASO 3: Generaci√≥n del prompt final
    print("\nPASO 3: Prompt Final para Gemini (LOCAL)")
    prompt_final = prompt.format(context=contexto, question=pregunta)
    print("   Longitud del prompt:", len(prompt_final), "caracteres")
    print("   Primeras l√≠neas del prompt:")
    print("   " + "\n   ".join(prompt_final.split("\n")[:8]))

    # PASO 4: Respuesta del modelo
    print("\nPASO 4: Generaci√≥n de Respuesta (USA API DE GEMINI)")
    resultado = sistema_rag({"query": pregunta})
    print(f"   Respuesta generada: {len(resultado['result'])} caracteres")
    print(f"   Respuesta: {resultado['result']}")

    return resultado

# Analicemos una pregunta espec√≠fica
analisis = analizar_proceso("¬øCu√°ndo se puede trabajar remotamente?")

## Experimentando con Diferentes Tipos de B√∫squeda

Vamos a comparar diferentes estrategias de b√∫squeda para entender mejor c√≥mo funciona la b√∫squeda sem√°ntica.

In [None]:
# Funci√≥n para comparar b√∫squeda sem√°ntica vs b√∫squeda por palabras clave
def comparar_busquedas(pregunta, palabras_clave):
    """
    Compara b√∫squeda sem√°ntica con b√∫squeda tradicional por palabras
    """
    print(f"\nüîÑ COMPARACI√ìN DE B√öSQUEDAS")
    print(f"Pregunta: {pregunta}")
    print(f"Palabras clave: {palabras_clave}")
    print("\n" + "="*60)

    # B√∫squeda sem√°ntica (por significado)
    print("üß† B√öSQUEDA SEM√ÅNTICA (por significado):")
    docs_semanticos = vectorstore.similarity_search(pregunta, k=3)
    for i, doc in enumerate(docs_semanticos, 1):
        print(f"   {i}. {doc.metadata['titulo']}: {doc.page_content[:100]}...")

    # B√∫squeda tradicional (por palabras exactas)
    print(f"\nüî§ B√öSQUEDA TRADICIONAL (palabras exactas: '{palabras_clave}'):")
    # Simulamos b√∫squeda tradicional buscando la palabra en cada documento
    docs_tradicional = []
    for doc in fragmentos:
        if palabras_clave.lower() in doc.page_content.lower():
            docs_tradicional.append(doc)

    if docs_tradicional:
        for i, doc in enumerate(docs_tradicional[:3], 1):
            print(f"   {i}. {doc.metadata['titulo']}: {doc.page_content[:100]}...")
    else:
        print("   ‚ùå No se encontraron coincidencias exactas")

    print(f"\nüìä RESULTADOS:")
    print(f"   B√∫squeda sem√°ntica: {len(docs_semanticos)} resultados")
    print(f"   B√∫squeda tradicional: {len(docs_tradicional)} resultados")

# Probemos con ejemplos que muestren la diferencia
comparar_busquedas(
    "¬øPuedo trabajar desde mi casa?",
    "casa"  # La palabra "casa" no aparece en los docs, pero "remoto" s√≠
)

comparar_busquedas(
    "¬øQu√© pasa si alguien hackea el sistema?",
    "hack"  # "hack" no est√°, pero "incidente de seguridad" s√≠
)

## Mejorando el Sistema: Configuraciones Avanzadas

Vamos a experimentar con diferentes configuraciones para optimizar nuestro sistema RAG.

In [None]:
# Creamos una versi√≥n m√°s avanzada del sistema con mejores configuraciones

# 1. Configuraci√≥n de b√∫squeda m√°s inteligente
retriever_avanzado = vectorstore.as_retriever(
    search_type="mmr",          # Maximum Marginal Relevance: evita resultados repetitivos
    search_kwargs={
        "k": 4,                 # Buscar 4 fragmentos
        "fetch_k": 10,          # Considerar 10 candidatos antes de elegir los mejores 4
        "lambda_mult": 0.7      # Balance entre relevancia y diversidad
    }
)

# 2. Template mejorado con m√°s estructura
template_mejorado = """
Sos un asistente especializado en recursos humanos y pol√≠ticas empresariales.
Tu misi√≥n es proporcionar informaci√≥n precisa y √∫til basada √∫nicamente en
los documentos oficiales de la empresa.

FORMATO DE RESPUESTA:
- Comenz√° con un resumen directo
- Proporcion√° detalles espec√≠ficos (n√∫meros, fechas, procedimientos)
- Si hay pasos a seguir, numeralos claramente
- Mencion√° qu√© documento contiene la informaci√≥n
- Si algo no est√° claro en los documentos, decilo expl√≠citamente

DOCUMENTOS DISPONIBLES:
{context}

CONSULTA DEL EMPLEADO:
{question}

RESPUESTA ESTRUCTURADA:
"""

prompt_mejorado = PromptTemplate(
    template=template_mejorado,
    input_variables=["context", "question"]
)

# 3. Sistema RAG mejorado
sistema_rag_mejorado = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever_avanzado,
    chain_type_kwargs={"prompt": prompt_mejorado},
    return_source_documents=True
)

print("‚ö° Sistema RAG mejorado configurado")
print("\nMejoras implementadas:")
print("‚úÖ B√∫squeda MMR (menos resultados repetitivos)")
print("‚úÖ An√°lisis de m√°s candidatos (10 vs 3)")
print("‚úÖ Template de respuesta m√°s estructurado")
print("‚úÖ Balance optimizado entre relevancia y diversidad")

In [None]:
# Comparemos el sistema original con el mejorado
def comparar_sistemas(pregunta):
    print(f"\n‚öîÔ∏è COMPARACI√ìN DE SISTEMAS")
    print(f"Pregunta: {pregunta}")
    print("\n" + "="*70)

    print("üîµ SISTEMA ORIGINAL:")
    resultado_original = sistema_rag({"query": pregunta})
    print(resultado_original["result"])

    print("\nüü¢ SISTEMA MEJORADO:")
    resultado_mejorado = sistema_rag_mejorado({"query": pregunta})
    print(resultado_mejorado["result"])

    print(f"\nüìä AN√ÅLISIS:")
    print(f"   Original: {len(resultado_original['source_documents'])} documentos, {len(resultado_original['result'])} caracteres")
    print(f"   Mejorado: {len(resultado_mejorado['source_documents'])} documentos, {len(resultado_mejorado['result'])} caracteres")

# Probemos con una pregunta compleja
comparar_sistemas("Quiero tomar vacaciones en enero y tambi√©n necesito hacer un curso. ¬øCu√°les son todos los pasos y limitaciones?")

## Ejercicio Pr√°ctico: Agregando Nuevos Documentos

Vamos a simular c√≥mo agregar nuevos documentos a nuestro sistema RAG en funcionamiento.

In [None]:
# Simulamos que llegan nuevos documentos empresariales
nuevos_documentos = [
    {
        "titulo": "Protocolo de Trabajo H√≠brido 2024",
        "contenido": """
        Modalidades de Trabajo: A partir del 1 de marzo de 2024, todos los empleados pueden optar por:
        1. Trabajo presencial 100% (oficina todos los d√≠as)
        2. Trabajo h√≠brido (3 d√≠as oficina, 2 d√≠as remoto)
        3. Trabajo remoto total (solo para puestos espec√≠ficos aprobados por gerencia)

        D√≠as Obligatorios en Oficina: Todos los martes son obligatorios para reuniones de equipo.
        Los jueves tambi√©n son recomendados para colaboraci√≥n presencial.

        Equipamiento: Los empleados remotos pueden solicitar silla ergon√≥mica y monitor adicional.
        El reintegro por internet domiciliario es de hasta $8,000 mensuales.

        Evaluaci√≥n: El rendimiento se mide por objetivos cumplidos, no por horas trabajadas.
        Las evaluaciones se realizan trimestralmente con m√©tricas espec√≠ficas por √°rea.
        """
    },
    {
        "titulo": "Programa de Bienestar Laboral",
        "contenido": """
        Gimnasio: La empresa tiene convenio con FitClub. Reintegro del 50% de la cuota mensual,
        hasta un m√°ximo de $15,000 por mes por empleado.

        Salud Mental: Cobertura de 8 sesiones anuales de psicolog√≠a con profesionales del convenio.
        Tambi√©n disponible programa de mindfulness los mi√©rcoles de 12:00 a 13:00.

        Flexibilidad Horaria: Se puede ingresar entre 8:00 y 10:00 AM, completando las 8 horas diarias.
        Los viernes se puede salir a las 15:00 si se completaron las horas semanales.

        D√≠as de Bienestar: 2 d√≠as adicionales por a√±o para actividades de bienestar personal,
        no acumulables y deben usarse en el a√±o calendario.
        """
    }
]

print(f"üì• Llegaron {len(nuevos_documentos)} documentos nuevos:")
for doc in nuevos_documentos:
    print(f"   ‚Ä¢ {doc['titulo']}")

In [None]:
# Funci√≥n para agregar nuevos documentos al sistema existente
def agregar_documentos(nuevos_docs, vectorstore):
    """
    Agrega nuevos documentos a nuestro sistema RAG existente
    """
    print("üîÑ Procesando nuevos documentos...")

    # Convertir a formato LangChain
    docs_langchain = []
    for doc in nuevos_docs:
        documento = Document(
            page_content=doc["contenido"],
            metadata={"titulo": doc["titulo"]}
        )
        docs_langchain.append(documento)

    # Dividir en fragmentos
    nuevos_fragmentos = text_splitter.split_documents(docs_langchain)
    print(f"üìù Se crearon {len(nuevos_fragmentos)} nuevos fragmentos")

    # Agregar al vectorstore existente
    vectorstore.add_documents(nuevos_fragmentos)
    print(f"‚úÖ Documentos agregados exitosamente a la base de conocimiento")

    return len(nuevos_fragmentos)

# Agregamos los nuevos documentos
fragmentos_nuevos = agregar_documentos(nuevos_documentos, vectorstore)

print(f"\nüìä Estado actual del sistema:")
print(f"   Documentos originales: {len(documentos_empresa)} docs")
print(f"   Documentos nuevos: {len(nuevos_documentos)} docs")
print(f"   Total de fragmentos en la base: {len(fragmentos) + fragmentos_nuevos} fragmentos")

In [None]:
# Probemos preguntas sobre los nuevos documentos
print("üÜï Probando preguntas sobre los documentos reci√©n agregados:\n")

hacer_pregunta("¬øQu√© d√≠as son obligatorios ir a la oficina?")
hacer_pregunta("¬øLa empresa cubre gastos de gimnasio?")
hacer_pregunta("¬øCu√°ntos d√≠as de bienestar tengo al a√±o?")

## Casos de Uso Avanzados

Exploremos escenarios m√°s complejos que muestran el verdadero poder de RAG en entornos empresariales.

In [None]:
# Funci√≥n para manejar consultas complejas que requieren m√∫ltiples documentos
def consulta_compleja(pregunta):
    """
    Maneja consultas que pueden necesitar informaci√≥n de m√∫ltiples documentos
    """
    print(f"\nüß© CONSULTA COMPLEJA")
    print(f"Pregunta: {pregunta}")
    print("\n" + "="*60)

    # Configuramos para buscar m√°s documentos
    retriever_complejo = vectorstore.as_retriever(
        search_type="mmr",
        search_kwargs={"k": 6, "fetch_k": 15}  # M√°s documentos para consultas complejas
    )

    # Sistema temporal con m√°s contexto
    sistema_complejo = RetrievalQA.from_chain_type(
        llm=llm,
        chain_type="stuff",
        retriever=retriever_complejo,
        chain_type_kwargs={"prompt": prompt_mejorado},
        return_source_documents=True
    )

    resultado = sistema_complejo({"query": pregunta})

    print(f"ü§ñ RESPUESTA INTEGRAL:")
    print(resultado["result"])

    print(f"\nüìö DOCUMENTOS CONSULTADOS ({len(resultado['source_documents'])}):")
    documentos_unicos = list(set([doc.metadata['titulo'] for doc in resultado['source_documents']]))
    for i, titulo in enumerate(documentos_unicos, 1):
        print(f"   {i}. {titulo}")

    return resultado

# Probemos con preguntas que necesitan m√∫ltiples fuentes
consulta_compleja("Soy nuevo empleado, trabajar√© h√≠brido, y quiero saber todo sobre mis beneficios, vacaciones, y qu√© documentos necesito conocer")

consulta_compleja("Quiero maximizar mis beneficios este a√±o: vacaciones, capacitaci√≥n, bienestar y trabajo remoto. ¬øC√≥mo lo planifico?")

---

# Glosario de T√©rminos

**RAG (Retrieval Augmented Generation)**: Sistema que combina b√∫squeda de informaci√≥n con generaci√≥n de texto. Primero busca documentos relevantes, luego genera respuestas basadas en esa informaci√≥n espec√≠fica.

**Embeddings**: Representaciones num√©ricas (vectores) de texto que capturan el significado sem√°ntico. Permiten comparar textos por significado, no solo por palabras exactas.

**Vector Store/Base Vectorial**: Base de datos especializada en almacenar y buscar vectores. Permite encontrar informaci√≥n similar por significado matem√°tico.

**ChromaDB**: Base de datos vectorial gratuita y f√°cil de usar, ideal para proyectos educativos y prototipos RAG.

**LangChain**: Librer√≠a de Python que simplifica la construcci√≥n de aplicaciones con modelos de lenguaje, especialmente sistemas RAG.

**Text Splitter**: Herramienta que divide documentos largos en fragmentos m√°s peque√±os, manteniendo el contexto entre fragmentos.

**Chunk/Fragmento**: Pedazo peque√±o de texto (t√≠picamente 200-1000 caracteres) en que se dividen los documentos para procesar.

**Retriever/Recuperador**: Componente que busca y devuelve los fragmentos m√°s relevantes de la base vectorial para una pregunta espec√≠fica.

**Prompt Template**: Plantilla que define c√≥mo estructurar las instrucciones para el modelo de IA, incluyendo contexto y pregunta.

**Similarity Search**: B√∫squeda por similitud sem√°ntica, encuentra textos con significado parecido aunque usen palabras diferentes.

**MMR (Maximum Marginal Relevance)**: Estrategia de b√∫squeda que balancea relevancia con diversidad, evitando resultados muy similares entre s√≠.

**Temperature**: Par√°metro que controla la creatividad del modelo. Valores bajos (0.0-0.3) dan respuestas m√°s precisas y consistentes.

**Context Window**: Cantidad m√°xima de texto que un modelo puede procesar de una vez (contexto + pregunta + respuesta).

**Gemini**: Familia de modelos de IA de Google, incluyendo capacidades de texto, c√≥digo, y comprensi√≥n multimodal.

---

# Gu√≠a de Estudio: Preguntas y Respuestas

## Conceptos Fundamentales

**P1: ¬øCu√°l es la diferencia principal entre un modelo de IA tradicional y un sistema RAG?**

R: Un modelo tradicional solo puede responder con informaci√≥n de su entrenamiento (datos hasta una fecha espec√≠fica). RAG permite que el modelo acceda a documentos actualizados y espec√≠ficos de tu empresa, combinando b√∫squeda de informaci√≥n con generaci√≥n de respuestas.

**P2: ¬øPor qu√© necesitamos dividir documentos en fragmentos peque√±os?**

R: Los modelos tienen l√≠mites en la cantidad de texto que pueden procesar de una vez. Fragmentos peque√±os permiten encontrar informaci√≥n espec√≠fica y relevante, en lugar de enviar documentos completos que pueden contener informaci√≥n irrelevante.

**P3: ¬øQu√© ventajas tiene la b√∫squeda sem√°ntica sobre la b√∫squeda por palabras clave?**

R: La b√∫squeda sem√°ntica entiende el significado, no solo palabras exactas. Por ejemplo, puede conectar "trabajar desde casa" con "trabajo remoto" aunque usen palabras diferentes.

## Aspectos T√©cnicos

**P4: ¬øQu√© hace exactamente el par√°metro 'k' en la configuraci√≥n del retriever?**

R: Define cu√°ntos fragmentos de documentos se devuelven como contexto. k=3 significa que se buscar√°n los 3 fragmentos m√°s relevantes para responder la pregunta.

**P5: ¬øPor qu√© usamos temperature=0.1 en lugar de un valor m√°s alto?**

R: Para obtener respuestas consistentes y factuales. Valores altos aumentan la creatividad pero pueden generar informaci√≥n incorrecta. En contextos empresariales, la precisi√≥n es m√°s importante que la creatividad.

**P6: ¬øCu√°l es la funci√≥n del chunk_overlap en el text splitter?**

R: Mantiene continuidad entre fragmentos. Si una informaci√≥n importante est√° en el l√≠mite entre dos fragmentos, el overlap asegura que no se pierda el contexto.

## Implementaci√≥n Pr√°ctica

**P7: ¬øC√≥mo agregar√≠as un nuevo documento al sistema sin reiniciarlo?**

R: Usando vectorstore.add_documents(nuevos_fragmentos). El sistema puede actualizar la base de conocimiento din√°micamente sin perder documentos existentes.

**P8: ¬øQu√© limitaciones tiene el enfoque "stuff" para combinar documentos?**

R: Est√° limitado por el context window del modelo. Si se necesita consultar muchos documentos largos, se podr√≠a exceder el l√≠mite. Alternativas incluyen "map-reduce" o "refine".

**P9: ¬øC√≥mo optimizar√≠as el sistema para documentos muy largos?**

R: Usar chunks m√°s peque√±os con mayor overlap, implementar b√∫squeda jer√°rquica, o usar estrategias como "map-reduce" que procesan documentos en m√∫ltiples pasos.

## Casos de Uso

**P10: ¬øEn qu√© situaciones RAG es mejor que fine-tuning de un modelo?**

R: Cuando la informaci√≥n cambia frecuentemente, cuando necesitas transparencia sobre las fuentes, cuando tienes documentos espec√≠ficos de dominio, o cuando necesitas actualizar conocimiento sin reentrenar modelos.

**P11: ¬øQu√© tipos de documentos empresariales se benefician m√°s de RAG?**

R: Pol√≠ticas de RR.HH., manuales de procedimientos, documentaci√≥n t√©cnica, bases de conocimiento de soporte, regulaciones legales, y cualquier informaci√≥n que se actualice regularmente.

**P12: ¬øC√≥mo evaluar√≠as si tu sistema RAG est√° funcionando bien?**

R: Verificando que las respuestas citen fuentes correctas, que no invente informaci√≥n, que encuentre documentos relevantes, y que las respuestas sean precisas y √∫tiles para los usuarios finales.

## Ejercicios Pr√°cticos Sugeridos

1. **Modifica el prompt template** para que las respuestas incluyan siempre el nombre del documento fuente.

2. **Experimenta con diferentes valores de k** (1, 3, 5, 10) y observa c√≥mo cambian las respuestas.

3. **Agrega un sistema de puntuaci√≥n** que califique qu√© tan seguro est√° el sistema de cada respuesta.

4. **Implementa filtros por tipo de documento** para que los usuarios puedan buscar solo en categor√≠as espec√≠ficas.

5. **Crea un log de preguntas frecuentes** para identificar qu√© informaci√≥n falta en tus documentos.

---

## Pr√≥ximos Pasos Recomendados

- **Integraci√≥n con PDFs**: Usar librer√≠as como PyPDF2 o pdfplumber para cargar documentos reales
- **Interfaz web**: Crear una aplicaci√≥n con Streamlit o FastAPI para uso empresarial
- **M√∫ltiples formatos**: Agregar soporte para Word, Excel, y otros formatos empresariales
- **Seguridad**: Implementar autenticaci√≥n y control de acceso por documento
- **M√©tricas**: Agregar logging y analytics para mejorar continuamente el sistema