# 🎯 PROYECTO FINAL: Tu Sistema RAG Completo
## Build From Scratch - 45 minutos

---

### 🏆 El Desafío Final

Es hora de demostrar todo lo aprendido. Construirás tu PROPIO sistema RAG para un caso de uso real.

### 📋 METODOLOGÍA: BUILD FROM SCRATCH

```
Autonomía: 90%
Supervisión: 10%

Tu trabajo:
1. Elegir tu caso de uso
2. Diseñar la arquitectura
3. Implementar end-to-end
4. Presentar en 5 minutos
```

**ESTE ES TU MOMENTO** de brillar.

## 🎨 ELIGE TU PROYECTO [15:00-15:05]

### Opción A: Customer Support Bot
- **Datos**: FAQs + tickets históricos
- **Objetivo**: Responder queries de soporte
- **Bonus**: Escalación automática

### Opción B: Technical Documentation Assistant  
- **Datos**: Docs técnicos + code samples
- **Objetivo**: Ayudar a developers
- **Bonus**: Generación de código

### Opción C: Business Intelligence RAG
- **Datos**: Reports + KPIs + dashboards
- **Objetivo**: Insights de negocio
- **Bonus**: Visualizaciones

### Opción D: Tu Propia Idea
- **Datos**: Los que tengas
- **Objetivo**: Tu caso real
- **Bonus**: Creatividad

## 📐 TEMPLATE BASE [15:05-15:10]

Usa este template como punto de partida y PERSONALÍZALO:

In [None]:
# TU PROYECTO FINAL - PERSONALIZA TODO

import os
import sys
from pathlib import Path
sys.path.append(str(Path.cwd().parent / 'src'))

# Importa lo que necesites de módulos anteriores
from shared_config import RAGMasterConfig, MetricsTracker

print("🚀 PROYECTO FINAL: [TU TÍTULO AQUÍ]")
print("=" * 60)
print(f"Caso de uso: [DESCRIBE TU CASO]")
print(f"Datos: [TUS FUENTES DE DATOS]")
print(f"Objetivo: [QUÉ RESOLVERÁS]")
print("=" * 60)

In [None]:
# Importar clase base con funcionalidad
from module_2_optimized import Module2_OptimizedRAG
import time

class MyCustomRAG(Module2_OptimizedRAG):
    """
    TU SISTEMA RAG PERSONALIZADO
    
    ✅ VENTAJA: Heredas toda la funcionalidad de Módulo 2:
       - Chunking con overlap
       - Cache básico
       - Embeddings
       - Query básico
    
    💪 TU TRABAJO: Personalizar y extender para tu caso de uso
    """
    
    def __init__(self, project_name="Mi Proyecto RAG", config=None):
        """
        Inicializa TU sistema
        """
        # Llamar al constructor padre (te da funcionalidad base)
        super().__init__()
        
        self.name = project_name
        self.version = "1.0.0"
        
        # Tu configuración específica
        self.custom_config = config or self.get_default_config()
        
        # TODO: Inicializar tus componentes adicionales
        self.setup_custom_components()
        
        print(f"✅ {self.name} v{self.version} inicializado")
        print(f"   Heredando de: Module2_OptimizedRAG")
    
    def get_default_config(self):
        """
        Tu configuración personalizada
        """
        return {
            # TODO: Personaliza según tu caso
            "domain": "general",  # support, technical, business, etc.
            "language": "es",
            "tone": "professional",  # casual, formal, technical
            "max_context_docs": 5,
            "enable_special_features": True,
            # Añade tus parámetros específicos aquí
        }
    
    def setup_custom_components(self):
        """
        Configura tus componentes adicionales
        """
        print("🔧 Configurando componentes personalizados...")
        
        # TODO: Inicializar lo que necesites
        # Ejemplos:
        # - Sistema de categorización
        # - Caché especializado
        # - Validadores específicos de dominio
        # - Integraciones externas
        
        self.custom_cache = {}
        self.query_history = []
        
        print("   ✅ Componentes personalizados listos")
    
    def load_custom_data(self, source, data_type="pdf"):
        """
        Carga TUS datos específicos
        
        Args:
            source: Path o URL de tus datos
            data_type: Tipo de datos (pdf, json, csv, api, etc.)
        """
        print(f"📥 Cargando datos desde {source}...")
        
        if data_type == "pdf":
            # Usar método heredado del padre
            text = self.load_document(source)
            chunks = self.create_chunks(text)
            self.index_chunks(chunks)
            print(f"   ✅ {len(chunks)} chunks indexados desde PDF")
            return chunks
        
        elif data_type == "json":
            # TODO: Implementar carga de JSON
            import json
            # with open(source) as f:
            #     data = json.load(f)
            print("   ⚠️  TODO: Implementar carga de JSON")
            pass
        
        elif data_type == "csv":
            # TODO: Implementar carga de CSV
            import pandas as pd
            # df = pd.read_csv(source)
            print("   ⚠️  TODO: Implementar carga de CSV")
            pass
        
        elif data_type == "api":
            # TODO: Implementar carga desde API
            import requests
            # response = requests.get(source)
            print("   ⚠️  TODO: Implementar carga desde API")
            pass
        
        else:
            raise ValueError(f"Tipo de dato no soportado: {data_type}")
    
    def custom_query(self, question: str, **kwargs):
        """
        Tu query personalizado - extiende el query base
        
        Args:
            question: Pregunta del usuario
            **kwargs: Parámetros adicionales
        """
        print(f"\n💬 Query personalizado: {question}")
        
        # 1. Pre-procesamiento específico de tu dominio
        processed_question = self.preprocess_question(question)
        
        # 2. Usar query base del padre (ya implementado)
        base_result = self.query(processed_question)
        
        # 3. Post-procesamiento personalizado
        enhanced_result = self.postprocess_answer(
            base_result,
            question,
            kwargs
        )
        
        # 4. Guardar en historial
        self.query_history.append({
            "question": question,
            "answer": enhanced_result.get("response", ""),
            "timestamp": time.time()
        })
        
        return enhanced_result
    
    def preprocess_question(self, question: str) -> str:
        """
        Pre-procesamiento específico de tu dominio
        """
        # TODO: Implementar tu pre-procesamiento
        # Ejemplos:
        # - Detectar intención
        # - Expandir abreviaturas
        # - Corregir ortografía
        # - Traducir si es necesario
        
        return question  # Por ahora sin cambios
    
    def postprocess_answer(self, base_result: dict, original_question: str, params: dict) -> dict:
        """
        Post-procesamiento de la respuesta
        """
        # TODO: Implementar tu post-procesamiento
        # Ejemplos:
        # - Añadir contexto adicional
        # - Formatear respuesta según dominio
        # - Añadir recomendaciones
        # - Calcular confidence score
        
        enhanced = base_result.copy()
        
        # Ejemplo: Añadir metadata personalizada
        enhanced["metadata"] = {
            "domain": self.custom_config["domain"],
            "tone": self.custom_config["tone"],
            "queries_count": len(self.query_history),
        }
        
        return enhanced
    
    def add_special_feature(self, feature_name: str, feature_func):
        """
        Añade features especiales dinámicamente
        
        Ejemplo de uso:
            def mi_feature(query, result):
                # Tu lógica
                return modified_result
            
            my_rag.add_special_feature("escalation", mi_feature)
        """
        if not hasattr(self, 'special_features'):
            self.special_features = {}
        
        self.special_features[feature_name] = feature_func
        print(f"✨ Feature '{feature_name}' añadido")
    
    def get_stats(self):
        """
        Estadísticas de uso de tu sistema
        """
        return {
            "name": self.name,
            "version": self.version,
            "total_queries": len(self.query_history),
            "config": self.custom_config,
            "special_features": list(getattr(self, 'special_features', {}).keys())
        }

# ============= EJEMPLO DE USO =============

# Instanciar tu sistema personalizado
my_rag = MyCustomRAG(
    project_name="Mi Sistema RAG Personalizado",
    config={
        "domain": "support",  # Cambia según tu caso
        "language": "es",
        "tone": "professional"
    }
)

# Ver estadísticas
print("\n📊 Estadísticas del sistema:")
import json
print(json.dumps(my_rag.get_stats(), indent=2))

print("\n🎯 Tu sistema RAG está listo para personalizar!")
print("💡 SIGUIENTES PASOS:")
print("   1. Carga tus datos con my_rag.load_custom_data()")
print("   2. Personaliza los métodos según tu dominio")
print("   3. Añade features especiales si necesitas")
print("   4. Prueba con my_rag.custom_query()")


## 🛠️ IMPLEMENTACIÓN [15:10-15:35]

### Usa las siguientes secciones según tu proyecto:

In [None]:
# SECCIÓN 1: CARGA DE DATOS
# Adapta según tus fuentes de datos

def load_my_data():
    """
    Carga TUS datos específicos
    """
    # Ejemplo para CSVs
    import pandas as pd
    # df = pd.read_csv("mis_datos.csv")
    
    # Ejemplo para JSONs
    import json
    # with open("mis_datos.json") as f:
    #     data = json.load(f)
    
    # Ejemplo para APIs
    import requests
    # response = requests.get("https://api.ejemplo.com/data")
    
    # TODO: Implementa tu carga
    pass

# Cargar datos
# data = load_my_data()
print("✅ Datos cargados")

In [None]:
# SECCIÓN 2: PROCESAMIENTO ESPECÍFICO
# Adapta según tu dominio

def process_for_my_domain(data):
    """
    Procesamiento específico para tu caso
    """
    # Ejemplo para soporte
    if "support" in my_rag.name.lower():
        # Extraer tickets, categorizar, priorizar
        pass
    
    # Ejemplo para docs técnicos
    elif "technical" in my_rag.name.lower():
        # Parsear código, extraer APIs, versiones
        pass
    
    # Ejemplo para business
    elif "business" in my_rag.name.lower():
        # Extraer KPIs, tendencias, insights
        pass
    
    # TODO: Tu procesamiento
    pass

# Procesar
# processed_data = process_for_my_domain(data)
print("✅ Datos procesados para tu dominio")

In [None]:
# SECCIÓN 3: FEATURES ESPECIALES
# Añade lo que hace único a tu sistema

class SpecialFeatures:
    """
    Features únicas de tu sistema
    """
    
    @staticmethod
    def auto_escalation(query, confidence):
        """
        Ejemplo: Escalación automática para support
        """
        if confidence < 0.7:
            return "Escalando a agente humano..."
        return None
    
    @staticmethod
    def code_generation(context):
        """
        Ejemplo: Generación de código para docs técnicos
        """
        # TODO: Implementar
        pass
    
    @staticmethod
    def visualization(data):
        """
        Ejemplo: Visualización para business intelligence
        """
        # TODO: Crear gráficos
        pass

# Integrar features especiales en tu RAG
my_rag.special_features = SpecialFeatures()
print("✅ Features especiales añadidas")

In [None]:
# SECCIÓN 4: TESTING DE TU SISTEMA
# Prueba con queries reales de tu dominio

print("🧪 TESTING TU SISTEMA")
print("=" * 50)

# OPCIÓN 1: Si tienes datos cargados, prueba queries reales
# Ejemplo: Cargar datos primero
try:
    # Descomenta y adapta según tu caso:
    # my_rag.load_custom_data("../data/company_handbook.pdf", data_type="pdf")
    
    test_queries = [
        # TODO: Personaliza estas queries según tu proyecto
        "¿Cuál es la información principal del documento?",
        "¿Qué datos importantes contiene?",
        "Resume el contenido en 3 puntos"
    ]
    
    for query in test_queries:
        try:
            print(f"\n{'='*50}")
            print(f"Q: {query}")
            print("-"*50)
            
            result = my_rag.custom_query(query)
            
            print(f"A: {result.get('response', 'N/A')[:200]}...")
            print(f"Metadata: {result.get('metadata', {})}")
            
        except Exception as e:
            print(f"❌ Error: {str(e)[:100]}")
            print("💡 HINT: Asegúrate de haber cargado datos primero")
            print("   Usa: my_rag.load_custom_data('path/to/data')")

except Exception as e:
    print(f"\n⚠️  Para probar el sistema necesitas:")
    print("   1. Cargar datos: my_rag.load_custom_data('path')")
    print("   2. O implementar MockRAG para demos sin datos")
    print(f"\n   Error: {str(e)[:100]}")

print("\n" + "="*50)
print("💡 EJEMPLOS DE QUERIES POR DOMINIO:")
print("-"*50)
print("\n🎧 Support Bot:")
print("   - ¿Cómo reseteo mi contraseña?")
print("   - ¿Cuál es el tiempo de respuesta SLA?")
print("   - ¿Cómo escalo un ticket urgente?")

print("\n📚 Technical Docs:")
print("   - ¿Cómo configuro el endpoint /api/users?")
print("   - ¿Qué parámetros acepta la función authenticate()?")
print("   - Dame un ejemplo de uso de la clase Database")

print("\n📊 Business Intelligence:")
print("   - ¿Cuáles fueron las ventas del Q1?")
print("   - ¿Qué productos tienen mejor margen?")
print("   - Analiza la tendencia de ingresos")

print("\n✨ Personaliza tus queries según TU caso de uso!")


## 📊 MÉTRICAS Y EVALUACIÓN [15:35-15:40]

In [None]:
# Evalúa tu sistema
def evaluate_my_system():
    """
    Evaluación personalizada para tu caso
    """
    metrics = {
        "accuracy": 0,  # TODO: Medir precisión
        "latency": 0,   # TODO: Medir latencia
        "cost": 0,      # TODO: Estimar costo
        "user_satisfaction": 0,  # TODO: Si aplica
        "coverage": 0,  # TODO: % de queries que puede responder
    }
    
    # TODO: Implementar evaluación específica
    # - Para support: tiempo de resolución
    # - Para docs: precisión técnica
    # - Para business: insights accionables
    
    return metrics

# Evaluar
metrics = evaluate_my_system()

print("📊 MÉTRICAS DE TU SISTEMA")
print("=" * 50)
for metric, value in metrics.items():
    print(f"{metric}: {value}")

## 🎤 PRESENTACIÓN [15:40-15:45]

### Prepara tu presentación de 5 minutos:

In [None]:
# SLIDE 1: TÍTULO Y PROBLEMA
print("="*60)
print("🎯 PROYECTO: [TU TÍTULO]")
print("="*60)
print("\n📌 PROBLEMA:")
print("[Describe el problema que resuelves]")
print("\n💡 SOLUCIÓN:")
print("[Tu approach único]")
print("="*60)

In [None]:
# SLIDE 2: ARQUITECTURA
print("\n🏗️ ARQUITECTURA")
print("=" * 50)
print("""
Datos → [Tu procesamiento] → [Tu chunking] 
   ↓
Vector DB ← [Tus embeddings]
   ↓
Retrieval → [Tu ranking] → [Tu generación]
   ↓
Respuesta + [Tus features especiales]
""")

In [None]:
# SLIDE 3: DEMO EN VIVO
print("\n🎬 DEMO EN VIVO")
print("=" * 50)

# Ejecuta una query impresionante
demo_query = "[Tu mejor query de demo]"
result = my_rag.query(demo_query)

print(f"\n❓ Query: {demo_query}")
print(f"\n💬 Respuesta:")
print(result['answer'])
print("\n✨ [Destaca lo especial de tu respuesta]")

In [None]:
# SLIDE 4: RESULTADOS Y MÉTRICAS
print("\n📊 RESULTADOS")
print("=" * 50)
print("""
✅ Accuracy: [X]%
✅ Latencia: [X]ms  
✅ Costo: $[X] por query
✅ [Tu métrica especial]: [X]

🎯 IMPACTO:
- [Impacto 1: tiempo/dinero ahorrado]
- [Impacto 2: mejora en proceso]
- [Impacto 3: valor añadido]
""")

In [None]:
# SLIDE 5: PRÓXIMOS PASOS
print("\n🚀 PRÓXIMOS PASOS")
print("=" * 50)
print("""
📅 Semana 1:
- [ ] [Acción 1]
- [ ] [Acción 2]

📅 Mes 1:
- [ ] [Objetivo 1]
- [ ] [Objetivo 2]

🎯 Visión:
[Dónde ves este sistema en 6 meses]
""")

## 🏆 CIERRE Y CELEBRACIÓN [15:45-16:00]

### ¡FELICITACIONES! Has completado:

✅ **Módulo 1**: Construiste RAG desde cero (typing along)
✅ **Módulo 2**: Optimizaste con técnicas avanzadas (fill in the blanks)
✅ **Módulo 3**: Integraste frameworks profesionales (choose your path)  
✅ **Módulo 4**: Lo hiciste production-ready (refactor & deploy)
✅ **Proyecto Final**: Creaste TU propio sistema (build from scratch)

### 📈 Tu Journey:
```
Latencia: 2000ms → 1000ms → 800ms → 50ms → TU SISTEMA
Costo: $0.06 → $0.03 → $0.02 → $0.002 → TU OPTIMIZACIÓN
Autonomía: 0% → 30% → 50% → 70% → 90% ¡LOGRADO!
```

### 🎓 Certificado:
**¡Eres oficialmente un RAG Master!**

### 🤝 Comunidad:
- Slack: #rag-masters-2025
- GitHub: [repo-comunidad]
- Meetup mensual: Primer jueves de cada mes

### 💬 Mensaje Final:
> "No construiste solo un sistema RAG. Construiste la capacidad de resolver problemas reales con IA. El límite ahora es tu imaginación."

---

**🚀 ¡Ahora ve y transforma tu organización con RAG!**