# M√≥dulo 3: Context Engineering
## Uso de Herramientas y Fuentes Externas para Mejorar Capacidades de IA

**Duraci√≥n estimada**: 1 hora  
**Nivel**: Avanzado  
**Objetivo**: Implementar context engineering con herramientas externas y RAG

---

## üìö Contenido del M√≥dulo

Este notebook cubre:
1. **Pr√°ctica 3.1**: RAG b√°sico con documentos
2. **Pr√°ctica 3.2**: RAG avanzado con m√∫ltiples fuentes
3. **Pr√°ctica 3.3**: Sistema completo de context engineering

---

## üéØ Objetivos de Aprendizaje

Al finalizar este m√≥dulo ser√°s capaz de:
- Implementar sistemas RAG (Retrieval-Augmented Generation) b√°sicos
- Usar embeddings y b√∫squeda sem√°ntica para encontrar informaci√≥n relevante
- Integrar m√∫ltiples fuentes de contexto (documentos, bases de datos, APIs)
- Construir sistemas completos de context engineering para producci√≥n
- Optimizar sistemas RAG para mejor rendimiento

---

## ‚öôÔ∏è Configuraci√≥n Inicial

Antes de comenzar, aseg√∫rate de tener:
- Python 3.8+ instalado
- Cuenta de OpenAI con API key
- Librer√≠as necesarias instaladas

**Instalaci√≥n en Windows:**
```bash
pip install openai python-dotenv sentence-transformers chromadb langchain
```

**Nota**: La instalaci√≥n de `sentence-transformers` puede tardar varios minutos la primera vez.

In [None]:
# Instalaci√≥n de dependencias (ejecutar solo si es necesario)
# !pip install openai python-dotenv sentence-transformers chromadb langchain

# Importar librer√≠as necesarias
import os
import json
from openai import OpenAI
from dotenv import load_dotenv
from typing import List, Dict, Any, Tuple
import hashlib

# Cargar variables de entorno
load_dotenv()

# Inicializar cliente de OpenAI
client = OpenAI(api_key=os.getenv('OPENAI_API_KEY'))

# Verificar configuraci√≥n
if not client.api_key:
    print("‚ö†Ô∏è ADVERTENCIA: No se encontr√≥ OPENAI_API_KEY. Config√∫rala en un archivo .env")
else:
    print("‚úÖ Cliente de OpenAI configurado correctamente")

# Intentar importar librer√≠as opcionales
try:
    from sentence_transformers import SentenceTransformer
    import chromadb
    from chromadb.config import Settings
    EMBEDDINGS_AVAILABLE = True
    print("‚úÖ Librer√≠as de embeddings disponibles")
except ImportError:
    EMBEDDINGS_AVAILABLE = False
    print("‚ö†Ô∏è Algunas librer√≠as no est√°n disponibles. Algunas funciones pueden no funcionar.")
    print("   Instala con: pip install sentence-transformers chromadb")

---

# Pr√°ctica 3.1: RAG B√°sico con Documentos

## üéØ Objetivo
Implementar un sistema RAG (Retrieval-Augmented Generation) simple que permita hacer preguntas sobre documentos usando embeddings y b√∫squeda sem√°ntica.

## üìñ Contexto y Teor√≠a

### ¬øQu√© es RAG?

**RAG (Retrieval-Augmented Generation)** es una t√©cnica que:
1. **Retrieval (Recuperaci√≥n)**: Busca informaci√≥n relevante en una base de conocimiento
2. **Augmentation (Aumento)**: A√±ade esa informaci√≥n al prompt
3. **Generation (Generaci√≥n)**: El modelo genera respuestas usando el contexto recuperado

### ¬øPor qu√© usar RAG?

- ‚úÖ **Informaci√≥n actualizada**: Acceso a datos que el modelo no tiene en su entrenamiento
- ‚úÖ **Fuentes verificables**: Puedes citar de d√≥nde viene la informaci√≥n
- ‚úÖ **Menor alucinaci√≥n**: El modelo tiene contexto real para responder
- ‚úÖ **Especializaci√≥n**: Puedes usar conocimiento espec√≠fico del dominio

### Arquitectura RAG B√°sica

```
1. Documentos ‚Üí Chunking (dividir en fragmentos)
2. Chunks ‚Üí Embeddings (convertir a vectores)
3. Almacenar en Vector Store
4. Query ‚Üí Embedding de la pregunta
5. B√∫squeda sem√°ntica ‚Üí Encontrar chunks relevantes
6. Chunks + Pregunta ‚Üí Prompt al modelo
7. Respuesta generada
```

### Casos de Uso
- Q&A sobre documentaci√≥n t√©cnica
- Asistentes con conocimiento corporativo
- B√∫squeda en c√≥digo legacy
- Sistemas de ayuda contextual

## üîç Ejercicio Guiado: Sistema RAG B√°sico

Vamos a crear un sistema RAG simple paso a paso.

In [None]:
# EJEMPLO: Sistema RAG b√°sico usando OpenAI Embeddings

# Documentos de ejemplo (en producci√≥n vendr√≠an de archivos, bases de datos, etc.)
documentos = [
    "Python es un lenguaje de programaci√≥n de alto nivel, interpretado y de prop√≥sito general. Fue creado por Guido van Rossum y se lanz√≥ por primera vez en 1991.",
    "OpenAI es una empresa de investigaci√≥n en inteligencia artificial fundada en 2015. Es conocida por desarrollar modelos como GPT-3, GPT-4 y DALL-E.",
    "Los embeddings son representaciones vectoriales de texto que capturan el significado sem√°ntico. Permiten comparar textos por similitud en lugar de coincidencia exacta.",
    "RAG (Retrieval-Augmented Generation) combina b√∫squeda de informaci√≥n con generaci√≥n de texto. Primero busca informaci√≥n relevante, luego la usa para generar respuestas.",
    "Jupyter Notebook es un entorno interactivo que permite combinar c√≥digo, texto y visualizaciones. Es muy popular en ciencia de datos y an√°lisis exploratorio."
]

def crear_embeddings(textos: List[str]) -> List[List[float]]:
    """
    Crea embeddings usando OpenAI
    """
    response = client.embeddings.create(
        model="text-embedding-3-small",  # Modelo econ√≥mico y eficiente
        input=textos
    )
    return [item.embedding for item in response.data]

def calcular_similitud_coseno(vec1: List[float], vec2: List[float]) -> float:
    """
    Calcula similitud coseno entre dos vectores
    """
    import math
    
    dot_product = sum(a * b for a, b in zip(vec1, vec2))
    magnitude1 = math.sqrt(sum(a * a for a in vec1))
    magnitude2 = math.sqrt(sum(a * a for a in vec2))
    
    if magnitude1 == 0 or magnitude2 == 0:
        return 0.0
    
    return dot_product / (magnitude1 * magnitude2)

def buscar_documentos_relevantes(pregunta: str, documentos: List[str], top_k: int = 2) -> List[Tuple[str, float]]:
    """
    Busca los documentos m√°s relevantes para una pregunta
    """
    # Crear embedding de la pregunta
    embedding_pregunta = crear_embeddings([pregunta])[0]
    
    # Crear embeddings de todos los documentos
    embeddings_docs = crear_embeddings(documentos)
    
    # Calcular similitud con cada documento
    similitudes = []
    for doc, emb in zip(documentos, embeddings_docs):
        similitud = calcular_similitud_coseno(embedding_pregunta, emb)
        similitudes.append((doc, similitud))
    
    # Ordenar por similitud y retornar top_k
    similitudes.sort(key=lambda x: x[1], reverse=True)
    return similitudes[:top_k]

def sistema_rag_basico(pregunta: str, documentos: List[str]) -> str:
    """
    Sistema RAG b√°sico completo
    """
    print(f"‚ùì Pregunta: {pregunta}\n")
    
    # Paso 1: Buscar documentos relevantes
    print("üîç Buscando documentos relevantes...")
    documentos_relevantes = buscar_documentos_relevantes(pregunta, documentos, top_k=2)
    
    print(f"‚úÖ Encontrados {len(documentos_relevantes)} documentos relevantes:")
    for i, (doc, sim) in enumerate(documentos_relevantes, 1):
        print(f"   {i}. Similitud: {sim:.3f} - {doc[:60]}...")
    
    # Paso 2: Construir contexto
    contexto = "\n\n".join([doc for doc, _ in documentos_relevantes])
    
    # Paso 3: Generar respuesta usando el contexto
    print("\nü§ñ Generando respuesta...")
    prompt = f"""
Bas√°ndote en la siguiente informaci√≥n, responde la pregunta.
Si la informaci√≥n no es suficiente, di que no tienes suficiente informaci√≥n.

Informaci√≥n:
{contexto}

Pregunta: {pregunta}

Responde de manera clara y concisa:
"""
    
    response = client.chat.completions.create(
        model="gpt-3.5-turbo",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.3
    )
    
    respuesta = response.choices[0].message.content
    return respuesta

# Probar el sistema RAG
print("=" * 60)
print("SISTEMA RAG B√ÅSICO")
print("=" * 60 + "\n")

preguntas = [
    "¬øQu√© es Python?",
    "¬øQu√© es RAG y c√≥mo funciona?",
    "¬øQui√©n cre√≥ Python y cu√°ndo?"
]

for pregunta in preguntas:
    respuesta = sistema_rag_basico(pregunta, documentos)
    print(f"\nüí¨ Respuesta: {respuesta}\n")
    print("-" * 60 + "\n")

In [None]:
# ESPACIO PARA TU C√ìDIGO
def chunk_documento(documento: str, tamano_chunk: int = 200) -> List[Dict[str, Any]]:
    """
    Divide un documento en chunks de tama√±o aproximado
    Retorna lista de chunks con metadatos
    """
    # TODO: Implementa el chunking
    # - Divide el documento en palabras
    # - Agrupa en chunks de ~tamano_chunk palabras
    # - Incluye metadatos (√≠ndice, documento original)
    pass

def sistema_rag_mejorado(pregunta: str, documentos: List[str]) -> str:
    """
    Sistema RAG mejorado con chunking
    """
    # TODO: Implementa el sistema mejorado
    # 1. Chunkear todos los documentos
    # 2. Crear embeddings de los chunks
    # 3. Buscar chunks relevantes
    # 4. Generar respuesta con referencias
    pass

# Documentos de prueba (m√°s largos)
documentos_largos = [
    """
    Python es un lenguaje de programaci√≥n de alto nivel, interpretado y de prop√≥sito general. 
    Fue creado por Guido van Rossum y se lanz√≥ por primera vez en 1991. Python tiene una filosof√≠a 
    de dise√±o que enfatiza la legibilidad del c√≥digo, notablemente mediante el uso de espacios en 
    blanco significativos. Sus construcciones de lenguaje y su enfoque orientado a objetos tienen 
    como objetivo ayudar a los programadores a escribir c√≥digo claro y l√≥gico para proyectos 
    peque√±os y grandes. Python es din√°micamente tipado y recolecta basura. Soporta m√∫ltiples 
    paradigmas de programaci√≥n, incluyendo programaci√≥n estructurada, orientada a objetos y funcional.
    """,
    # Agrega m√°s documentos largos aqu√≠
]

# Prueba el sistema
# respuesta = sistema_rag_mejorado("¬øCu√°les son las caracter√≠sticas principales de Python?", documentos_largos)
# print(respuesta)

## üî• Ejercicio de Desaf√≠o 3.1 (Opcional)

Crea un sistema RAG que:
- Use ChromaDB o FAISS para almacenamiento vectorial persistente
- Implemente re-ranking de resultados (usar m√∫ltiples estrategias de b√∫squeda)
- Incluya filtrado por metadatos (fecha, categor√≠a, etc.)
- Genere respuestas con citas numeradas a los documentos fuente

**Desaf√≠o extra**: Implementa un sistema de actualizaci√≥n incremental (agregar nuevos documentos sin re-indexar todo).

---

# Pr√°ctica 3.2: RAG Avanzado con M√∫ltiples Fuentes

## üéØ Objetivo
Integrar m√∫ltiples fuentes de contexto (documentos, bases de datos, APIs) en un sistema RAG avanzado.

## üìñ Contexto y Teor√≠a

### ¬øPor qu√© M√∫ltiples Fuentes?

En sistemas reales, la informaci√≥n puede venir de:
- **Documentos**: PDFs, Markdown, texto plano
- **Bases de datos**: SQL, NoSQL, datos estructurados
- **APIs**: Servicios externos, datos en tiempo real
- **C√≥digo**: Repositorios, documentaci√≥n t√©cnica

### Arquitectura Multi-Fuente

```
Fuente 1 (Docs) ‚Üí Embeddings ‚Üí Vector Store
Fuente 2 (DB)   ‚Üí Query SQL   ‚Üí Resultados
Fuente 3 (API)  ‚Üí HTTP Request ‚Üí Datos JSON
                    ‚Üì
            Agregador de Contexto
                    ‚Üì
            Prompt con Todo el Contexto
                    ‚Üì
            Respuesta Final
```

### Estrategias de Agregaci√≥n

1. **Fusi√≥n temprana**: Combinar antes de buscar
2. **Fusi√≥n tard√≠a**: Buscar en cada fuente, luego combinar resultados
3. **H√≠brida**: Combinar b√∫squeda sem√°ntica + b√∫squeda estructurada

### Casos de Uso
- Sistemas de consulta corporativa
- Asistentes con acceso a m√∫ltiples sistemas
- An√°lisis de datos multi-fuente
- Sistemas de recomendaci√≥n

## üîç Ejercicio Guiado: Sistema RAG Multi-Fuente

Vamos a crear un sistema que combine documentos, base de datos simulada y API simulada.

In [None]:
# EJEMPLO: Sistema RAG con m√∫ltiples fuentes

# Fuente 1: Documentos (ya implementado)
documentos = [
    "Python es un lenguaje de programaci√≥n vers√°til usado en ciencia de datos, web development y automatizaci√≥n.",
    "OpenAI proporciona APIs para integraci√≥n de IA en aplicaciones mediante modelos como GPT-4.",
    "Los embeddings permiten b√∫squeda sem√°ntica encontrando textos similares en significado."
]

# Fuente 2: Base de datos simulada
base_datos_usuarios = {
    "usuarios": [
        {"id": 1, "nombre": "Juan", "rol": "desarrollador", "proyecto": "API Backend"},
        {"id": 2, "nombre": "Mar√≠a", "rol": "data scientist", "proyecto": "ML Models"},
        {"id": 3, "nombre": "Carlos", "rol": "devops", "proyecto": "Infrastructure"}
    ],
    "proyectos": [
        {"id": 1, "nombre": "API Backend", "tecnologia": "Python, FastAPI", "estado": "activo"},
        {"id": 2, "nombre": "ML Models", "tecnologia": "Python, TensorFlow", "estado": "activo"},
        {"id": 3, "nombre": "Infrastructure", "tecnologia": "Docker, Kubernetes", "estado": "planning"}
    ]
}

def consultar_base_datos(query: str) -> str:
    """
    Simula consulta a base de datos basada en palabras clave
    """
    query_lower = query.lower()
    resultados = []
    
    # B√∫squeda simple por palabras clave
    if "usuario" in query_lower or "persona" in query_lower:
        for usuario in base_datos_usuarios["usuarios"]:
            if any(palabra in str(usuario).lower() for palabra in query_lower.split()):
                resultados.append(f"Usuario: {usuario['nombre']}, Rol: {usuario['rol']}, Proyecto: {usuario['proyecto']}")
    
    if "proyecto" in query_lower:
        for proyecto in base_datos_usuarios["proyectos"]:
            if any(palabra in str(proyecto).lower() for palabra in query_lower.split()):
                resultados.append(f"Proyecto: {proyecto['nombre']}, Tecnolog√≠a: {proyecto['tecnologia']}, Estado: {proyecto['estado']}")
    
    return "\n".join(resultados) if resultados else "No se encontraron resultados en la base de datos."

# Fuente 3: API simulada
def consultar_api(tema: str) -> str:
    """
    Simula consulta a API externa
    """
    # Simulaci√≥n de datos de API
    datos_api = {
        "python": "Python 3.11 es la versi√≥n m√°s reciente con mejoras en rendimiento y nuevas caracter√≠sticas.",
        "openai": "OpenAI API est√° disponible 24/7 con rate limits seg√∫n el plan de suscripci√≥n.",
        "rag": "RAG es una t√©cnica que combina recuperaci√≥n de informaci√≥n con generaci√≥n de texto."
    }
    
    for clave, valor in datos_api.items():
        if clave in tema.lower():
            return f"Datos de API: {valor}"
    
    return "No hay informaci√≥n disponible en la API para este tema."

def sistema_rag_multifuente(pregunta: str) -> str:
    """
    Sistema RAG que combina m√∫ltiples fuentes
    """
    print(f"‚ùì Pregunta: {pregunta}\n")
    
    contexto_completo = []
    fuentes_usadas = []
    
    # Fuente 1: B√∫squeda en documentos (RAG sem√°ntico)
    print("üîç Buscando en documentos...")
    documentos_relevantes = buscar_documentos_relevantes(pregunta, documentos, top_k=2)
    if documentos_relevantes:
        contexto_docs = "\n".join([doc for doc, _ in documentos_relevantes])
        contexto_completo.append(f"DOCUMENTOS:\n{contexto_docs}")
        fuentes_usadas.append("documentos")
        print(f"‚úÖ Encontrados {len(documentos_relevantes)} documentos relevantes")
    
    # Fuente 2: Consulta a base de datos
    print("\nüíæ Consultando base de datos...")
    resultado_db = consultar_base_datos(pregunta)
    if resultado_db and "No se encontraron" not in resultado_db:
        contexto_completo.append(f"BASE DE DATOS:\n{resultado_db}")
        fuentes_usadas.append("base de datos")
        print("‚úÖ Datos encontrados en base de datos")
    
    # Fuente 3: Consulta a API
    print("\nüåê Consultando API externa...")
    resultado_api = consultar_api(pregunta)
    if resultado_api and "No hay informaci√≥n" not in resultado_api:
        contexto_completo.append(f"API EXTERNA:\n{resultado_api}")
        fuentes_usadas.append("API")
        print("‚úÖ Datos obtenidos de API")
    
    # Combinar todo el contexto
    contexto_final = "\n\n".join(contexto_completo)
    
    if not contexto_final:
        return "No se encontr√≥ informaci√≥n relevante en ninguna fuente disponible."
    
    # Generar respuesta
    print(f"\nü§ñ Generando respuesta usando {len(fuentes_usadas)} fuente(s)...")
    prompt = f"""
Bas√°ndote en la siguiente informaci√≥n de m√∫ltiples fuentes, responde la pregunta de manera completa.

Informaci√≥n disponible:
{contexto_final}

Pregunta: {pregunta}

Responde de manera clara, citando de qu√© fuente viene cada parte de la informaci√≥n cuando sea relevante.
"""
    
    response = client.chat.completions.create(
        model="gpt-3.5-turbo",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.3
    )
    
    return response.choices[0].message.content

# Probar el sistema multi-fuente
print("=" * 60)
print("SISTEMA RAG MULTI-FUENTE")
print("=" * 60 + "\n")

preguntas = [
    "¬øQu√© es Python y qui√©n lo usa en la empresa?",
    "¬øQu√© proyectos est√°n activos y qu√© tecnolog√≠as usan?",
    "¬øC√≥mo funciona RAG seg√∫n la documentaci√≥n y la API?"
]

for pregunta in preguntas:
    respuesta = sistema_rag_multifuente(pregunta)
    print(f"\nüí¨ Respuesta:\n{respuesta}\n")
    print("=" * 60 + "\n")

In [None]:
# ESPACIO PARA TU C√ìDIGO

# C√≥digo fuente simulado
codigo_fuente = {
    "calculadora.py": """
def suma(a, b):
    return a + b

def multiplicar(a, b):
    return a * b
""",
    "utils.py": """
def procesar_datos(datos):
    resultados = []
    for item in datos:
        resultados.append(item * 2)
    return resultados
"""
}

# TODO: Implementa las funciones de b√∫squeda
def buscar_en_codigo(pregunta: str) -> str:
    """Busca funciones/clases relevantes en el c√≥digo"""
    # Tu implementaci√≥n aqu√≠
    pass

def calcular_metricas_codigo(archivo: str, codigo: str) -> Dict[str, Any]:
    """Calcula m√©tricas de c√≥digo"""
    # Tu implementaci√≥n aqu√≠
    pass

def sistema_rag_codigo_docs(pregunta: str) -> str:
    """
    Sistema RAG que integra c√≥digo, documentaci√≥n y m√©tricas
    """
    # TODO: Implementa el sistema completo
    # 1. Analizar la pregunta para determinar qu√© fuentes usar
    # 2. Buscar en cada fuente relevante
    # 3. Agregar resultados
    # 4. Generar respuesta consolidada
    pass

# Prueba el sistema
# preguntas_test = [
#     "¬øC√≥mo funciona la funci√≥n suma?",
#     "¬øCu√°l es la complejidad del c√≥digo en calculadora.py?",
#     "¬øQu√© funciones hay disponibles para procesar datos?"
# ]
# 
# for pregunta in preguntas_test:
#     print(sistema_rag_codigo_docs(pregunta))

## üî• Ejercicio de Desaf√≠o 3.2 (Opcional)

Crea un sistema RAG que:
- Use un router inteligente que decida qu√© fuente consultar primero
- Implemente b√∫squeda h√≠brida (sem√°ntica + keyword)
- Incluya sistema de scoring para rankear resultados de m√∫ltiples fuentes
- Genere respuestas con confianza score basado en calidad de las fuentes

**Desaf√≠o extra**: Implementa un sistema de feedback que aprenda qu√© fuentes son m√°s √∫tiles para cada tipo de pregunta.

---

# Pr√°ctica 3.3: Sistema Completo de Context Engineering

## üéØ Objetivo
Construir una soluci√≥n end-to-end de context engineering con RAG, validaci√≥n, optimizaci√≥n y caracter√≠sticas de producci√≥n.

## üìñ Contexto y Teor√≠a

### Componentes de un Sistema Completo

1. **Ingesti√≥n de datos**: Cargar y procesar m√∫ltiples tipos de documentos
2. **Chunking inteligente**: Dividir documentos preservando contexto
3. **Embeddings y almacenamiento**: Vector store persistente
4. **B√∫squeda avanzada**: M√∫ltiples estrategias de retrieval
5. **Generaci√≥n con contexto**: Prompt engineering optimizado
6. **Validaci√≥n y calidad**: Verificar respuestas
7. **Monitoreo**: Tracking de uso y performance

### Optimizaciones Importantes

- **Chunking estrat√©gico**: Tama√±o √≥ptimo seg√∫n tipo de documento
- **Re-ranking**: Mejorar resultados de b√∫squeda inicial
- **Cach√©**: Evitar rec√°lculos costosos
- **Filtrado**: Usar metadatos para refinar b√∫squedas
- **Hybrid search**: Combinar b√∫squeda sem√°ntica y keyword

### Casos de Uso
- Asistentes corporativos con conocimiento interno
- Sistemas de Q&A sobre documentaci√≥n t√©cnica
- Agentes con memoria persistente
- Sistemas de recomendaci√≥n basados en contenido

## üîç Ejercicio Guiado: Sistema Completo de Context Engineering

Vamos a construir un sistema completo con todas las caracter√≠sticas.

In [None]:
# EJEMPLO: Sistema completo de context engineering

class SistemaContextEngineering:
    """
    Sistema completo de context engineering con todas las caracter√≠sticas
    """
    
    def __init__(self):
        self.documentos = []
        self.embeddings_cache = {}  # Cach√© de embeddings
        self.queries_cache = {}     # Cach√© de queries
        
    def agregar_documento(self, documento: str, metadatos: Dict = None):
        """Agrega un documento al sistema"""
        doc_id = hashlib.md5(documento.encode()).hexdigest()[:8]
        self.documentos.append({
            "id": doc_id,
            "texto": documento,
            "metadatos": metadatos or {}
        })
        return doc_id
    
    def chunk_inteligente(self, texto: str, tamano: int = 200, overlap: int = 50) -> List[Dict]:
        """
        Chunking inteligente con overlap para preservar contexto
        """
        palabras = texto.split()
        chunks = []
        
        for i in range(0, len(palabras), tamano - overlap):
            chunk_palabras = palabras[i:i + tamano]
            chunk_texto = " ".join(chunk_palabras)
            
            chunks.append({
                "texto": chunk_texto,
                "inicio": i,
                "fin": min(i + tamano, len(palabras))
            })
        
        return chunks
    
    def obtener_embedding(self, texto: str, usar_cache: bool = True) -> List[float]:
        """Obtiene embedding con cach√©"""
        if usar_cache:
            texto_hash = hashlib.md5(texto.encode()).hexdigest()
            if texto_hash in self.embeddings_cache:
                return self.embeddings_cache[texto_hash]
        
        response = client.embeddings.create(
            model="text-embedding-3-small",
            input=[texto]
        )
        embedding = response.data[0].embedding
        
        if usar_cache:
            self.embeddings_cache[texto_hash] = embedding
        
        return embedding
    
    def buscar_relevantes(self, pregunta: str, top_k: int = 3, usar_reranking: bool = True) -> List[Dict]:
        """
        B√∫squeda avanzada con re-ranking opcional
        """
        # B√∫squeda inicial
        embedding_pregunta = self.obtener_embedding(pregunta)
        resultados = []
        
        for doc in self.documentos:
            # Chunkear si es necesario
            if len(doc["texto"].split()) > 300:
                chunks = self.chunk_inteligente(doc["texto"])
                for chunk in chunks:
                    embedding_chunk = self.obtener_embedding(chunk["texto"])
                    similitud = calcular_similitud_coseno(embedding_pregunta, embedding_chunk)
                    resultados.append({
                        "texto": chunk["texto"],
                        "similitud": similitud,
                        "metadatos": doc["metadatos"],
                        "doc_id": doc["id"]
                    })
            else:
                embedding_doc = self.obtener_embedding(doc["texto"])
                similitud = calcular_similitud_coseno(embedding_pregunta, embedding_doc)
                resultados.append({
                    "texto": doc["texto"],
                    "similitud": similitud,
                    "metadatos": doc["metadatos"],
                    "doc_id": doc["id"]
                })
        
        # Ordenar por similitud
        resultados.sort(key=lambda x: x["similitud"], reverse=True)
        
        # Re-ranking simple: boost si hay palabras clave en com√∫n
        if usar_reranking:
            palabras_pregunta = set(pregunta.lower().split())
            for resultado in resultados[:top_k * 2]:  # Considerar m√°s para re-ranking
                palabras_texto = set(resultado["texto"].lower().split())
                palabras_comunes = len(palabras_pregunta & palabras_texto)
                resultado["similitud"] += palabras_comunes * 0.05  # Boost peque√±o
        
        # Re-ordenar despu√©s de re-ranking
        if usar_reranking:
            resultados.sort(key=lambda x: x["similitud"], reverse=True)
        
        return resultados[:top_k]
    
    def generar_respuesta(self, pregunta: str, contexto: List[Dict], validar: bool = True) -> Dict[str, Any]:
        """
        Genera respuesta con validaci√≥n
        """
        # Construir contexto formateado
        contexto_texto = "\n\n".join([
            f"[Fuente {i+1}] {r['texto']}" 
            for i, r in enumerate(contexto)
        ])
        
        prompt = f"""
Eres un asistente experto que responde preguntas bas√°ndote en el contexto proporcionado.

Contexto:
{contexto_texto}

Pregunta: {pregunta}

Instrucciones:
- Responde de manera clara y precisa
- Si la informaci√≥n no est√° en el contexto, di claramente que no tienes esa informaci√≥n
- Cita las fuentes cuando sea relevante
- S√© conciso pero completo

Respuesta:
"""
        
        response = client.chat.completions.create(
            model="gpt-3.5-turbo",
            messages=[{"role": "user", "content": prompt}],
            temperature=0.3
        )
        
        respuesta = response.choices[0].message.content
        
        resultado = {
            "respuesta": respuesta,
            "fuentes": [r["doc_id"] for r in contexto],
            "similitudes": [r["similitud"] for r in contexto]
        }
        
        # Validaci√≥n simple: verificar que la respuesta no es demasiado gen√©rica
        if validar:
            palabras_respuesta = set(respuesta.lower().split())
            palabras_pregunta = set(pregunta.lower().split())
            overlap = len(palabras_respuesta & palabras_pregunta)
            
            if overlap < 2 and len(respuesta) < 50:
                resultado["advertencia"] = "La respuesta puede ser demasiado gen√©rica"
        
        return resultado
    
    def consultar(self, pregunta: str, top_k: int = 3) -> Dict[str, Any]:
        """
        M√©todo principal para consultar el sistema
        """
        print(f"‚ùì Pregunta: {pregunta}\n")
        
        # Buscar documentos relevantes
        print("üîç Buscando informaci√≥n relevante...")
        contexto = self.buscar_relevantes(pregunta, top_k=top_k)
        
        if not contexto:
            return {
                "respuesta": "No se encontr√≥ informaci√≥n relevante para responder esta pregunta.",
                "fuentes": [],
                "similitudes": []
            }
        
        print(f"‚úÖ Encontrados {len(contexto)} fragmentos relevantes")
        for i, r in enumerate(contexto, 1):
            print(f"   {i}. Similitud: {r['similitud']:.3f} - {r['texto'][:60]}...")
        
        # Generar respuesta
        print("\nü§ñ Generando respuesta...")
        resultado = self.generar_respuesta(pregunta, contexto)
        
        return resultado

# Crear y probar el sistema
print("=" * 60)
print("SISTEMA COMPLETO DE CONTEXT ENGINEERING")
print("=" * 60 + "\n")

sistema = SistemaContextEngineering()

# Agregar documentos
sistema.agregar_documento(
    "Python es un lenguaje de programaci√≥n de alto nivel muy popular en ciencia de datos y desarrollo web.",
    {"categoria": "programacion", "fecha": "2024"}
)
sistema.agregar_documento(
    "OpenAI desarrolla modelos de lenguaje como GPT-4 que pueden generar texto, c√≥digo y responder preguntas.",
    {"categoria": "ia", "fecha": "2024"}
)
sistema.agregar_documento(
    "RAG combina recuperaci√≥n de informaci√≥n con generaci√≥n de texto para crear sistemas de IA m√°s precisos y actualizados.",
    {"categoria": "ia", "fecha": "2024"}
)

# Consultas de prueba
preguntas = [
    "¬øQu√© es Python y para qu√© se usa?",
    "¬øC√≥mo funciona RAG?",
    "¬øQu√© modelos desarrolla OpenAI?"
]

for pregunta in preguntas:
    resultado = sistema.consultar(pregunta)
    print(f"\nüí¨ Respuesta:\n{resultado['respuesta']}\n")
    print(f"üìö Fuentes usadas: {resultado['fuentes']}")
    if 'advertencia' in resultado:
        print(f"‚ö†Ô∏è {resultado['advertencia']}")
    print("=" * 60 + "\n")

In [None]:
# ESPACIO PARA TU C√ìDIGO
class SistemaContextEngineeringAvanzado(SistemaContextEngineering):
    """
    Extensi√≥n del sistema con caracter√≠sticas de producci√≥n
    """
    
    def __init__(self):
        super().__init__()
        # TODO: Agrega atributos para m√©tricas, feedback, logs
        self.metricas = {
            "total_consultas": 0,
            "tiempo_promedio": 0,
            "consultas_exitosas": 0
        }
        self.feedback = []
        self.logs = []
    
    def consultar_con_filtros(self, pregunta: str, filtros: Dict = None, top_k: int = 3) -> Dict[str, Any]:
        """
        Consulta con filtros de metadatos
        """
        # TODO: Implementa filtrado por metadatos
        # - Filtrar documentos seg√∫n metadatos antes de buscar
        # - Aplicar filtros en la b√∫squeda
        pass
    
    def registrar_feedback(self, consulta_id: str, util: bool, comentario: str = ""):
        """
        Registra feedback del usuario
        """
        # TODO: Implementa sistema de feedback
        pass
    
    def obtener_metricas(self) -> Dict[str, Any]:
        """
        Retorna m√©tricas del sistema
        """
        # TODO: Calcula y retorna m√©tricas
        pass
    
    def exportar_logs(self, archivo: str = "logs_consultas.json"):
        """
        Exporta logs a archivo JSON
        """
        # TODO: Implementa exportaci√≥n de logs
        pass

# Prueba el sistema avanzado
# sistema_avanzado = SistemaContextEngineeringAvanzado()
# resultado = sistema_avanzado.consultar("¬øQu√© es Python?")
# sistema_avanzado.registrar_feedback("consulta_1", True, "Muy √∫til")
# print(sistema_avanzado.obtener_metricas())

## üî• Ejercicio de Desaf√≠o 3.3 (Opcional)

Crea un sistema de context engineering de nivel empresarial que incluya:

1. **Ingesti√≥n autom√°tica**: Cargar documentos desde m√∫ltiples fuentes (S3, Google Drive, APIs)
2. **Pipeline de procesamiento**: Limpieza, normalizaci√≥n, enriquecimiento autom√°tico
3. **Versionado de documentos**: Trackear cambios en documentos y re-indexar cuando sea necesario
4. **Sistema de permisos**: Control de acceso a diferentes documentos seg√∫n usuario
5. **Dashboard de analytics**: Visualizaci√≥n de uso, popularidad de documentos, calidad de respuestas

**Desaf√≠o extra**: Implementa un sistema de aprendizaje que mejore autom√°ticamente los prompts bas√°ndose en feedback hist√≥rico.

---

# üìù Reflexi√≥n y Mejores Pr√°cticas

## ‚úÖ ¬øQu√© Aprendimos?

### 1. RAG B√°sico
- **Embeddings**: Representaciones vectoriales capturan significado sem√°ntico
- **B√∫squeda sem√°ntica**: Encontrar informaci√≥n por significado, no solo palabras clave
- **Chunking**: Dividir documentos grandes preservando contexto
- **Contexto en prompts**: A√±adir informaci√≥n relevante mejora respuestas

### 2. RAG Avanzado
- **M√∫ltiples fuentes**: Combinar diferentes tipos de datos
- **Agregaci√≥n inteligente**: Decidir qu√© fuentes usar seg√∫n la pregunta
- **Filtrado**: Usar metadatos para refinar b√∫squedas
- **Re-ranking**: Mejorar resultados iniciales

### 3. Sistemas Completos
- **Cach√©**: Optimizar costos y latencia
- **Validaci√≥n**: Verificar calidad de respuestas
- **M√©tricas**: Monitorear performance del sistema
- **Feedback loops**: Mejorar continuamente

## ‚ö†Ô∏è Errores Comunes a Evitar

1. **Chunks demasiado peque√±os o grandes**
   - ‚ùå Chunks de 50 palabras (pierden contexto)
   - ‚úÖ Chunks de 200-500 palabras con overlap

2. **Sin validaci√≥n de respuestas**
   - ‚ùå Confiar ciegamente en lo que genera el modelo
   - ‚úÖ Validar que la respuesta es relevante y precisa

3. **Ignorar metadatos**
   - ‚ùå Buscar en todos los documentos siempre
   - ‚úÖ Usar filtros para reducir b√∫squeda

4. **Sin cach√© de embeddings**
   - ‚ùå Recalcular embeddings cada vez
   - ‚úÖ Cach√©ar embeddings de documentos est√°ticos

5. **Prompts no optimizados**
   - ‚ùå Prompt gen√©rico para todas las preguntas
   - ‚úÖ Adaptar prompt seg√∫n tipo de pregunta y contexto

## üöÄ Tips para Producci√≥n

1. **Chunking estrat√©gico**: 
   - Documentos t√©cnicos: 300-500 palabras
   - Conversaciones: Por turno completo
   - C√≥digo: Por funci√≥n/clase

2. **Optimizaci√≥n de embeddings**:
   - Usar modelos m√°s peque√±os para documentos
   - Modelos m√°s grandes solo para queries cr√≠ticas
   - Batch processing para m√∫ltiples documentos

3. **B√∫squeda h√≠brida**:
   - Combinar b√∫squeda sem√°ntica + keyword
   - Re-ranking con m√∫ltiples se√±ales
   - Filtrado por metadatos antes de b√∫squeda

4. **Monitoreo**:
   - Trackear latencia de cada componente
   - Monitorear calidad de respuestas (feedback)
   - Alertas para degradaci√≥n de performance

5. **Escalabilidad**:
   - Usar vector stores especializados (Pinecone, Weaviate)
   - Implementar sharding para grandes vol√∫menes
   - Cach√© distribuido para alta concurrencia

6. **Seguridad**:
   - Validar inputs de usuario
   - Sanitizar documentos antes de indexar
   - Control de acceso a documentos sensibles

## üìö Recursos Adicionales

- [LangChain RAG Tutorial](https://python.langchain.com/docs/use_cases/question_answering/)
- [Pinecone Vector Database](https://www.pinecone.io/learn/)
- [OpenAI Embeddings Guide](https://platform.openai.com/docs/guides/embeddings)
- [RAG Best Practices](https://www.pinecone.io/learn/retrieval-augmented-generation/)

---

## üéì Conclusi√≥n del Curso

¬°Felicitaciones por completar los 3 m√≥dulos del curso! üéâ

Has aprendido:
- ‚úÖ Fundamentos de prompt engineering
- ‚úÖ T√©cnicas avanzadas para sistemas
- ‚úÖ Context engineering y RAG

**Pr√≥ximos pasos sugeridos**:
1. Implementa un proyecto real usando estas t√©cnicas
2. Experimenta con diferentes modelos y configuraciones
3. √önete a comunidades de prompt engineering
4. Mantente actualizado con las √∫ltimas t√©cnicas

¬°√âxito en tus proyectos con IA! üöÄ