# Sistema RAG para Generación de Ejercicios - Demo

Este notebook demuestra el uso completo del sistema RAG para generar ejercicios académicos basados en materiales del ITBA.

## Materias Soportadas (MVP)
- **Probabilidad y estadística**: Ejercicios matemáticos y simbólicos
- **Sistemas de Inteligencia Artificial (SIA)**: Ejercicios teóricos y conceptuales

## Características del Sistema
- Carga flexible de documentos (PDF, TXT, TEX)
- Fragmentación inteligente con metadata académica
- Embeddings con LangChain y ChromaDB
- Base de datos vectorial con persistencia
- Búsqueda semántica con filtros
- Generación de ejercicios con OpenAI

## Tipos de Ejercicios Soportados
- **multiple_choice**: Preguntas de opción múltiple
- **desarrollo**: Preguntas de desarrollo teórico
- **practico**: Problemas prácticos con cálculos
- **teorico**: Preguntas conceptuales teóricas


## 1. Configuración Inicial


In [None]:
# Instalar dependencias si es necesario
# !pip install -r ../requirements.txt


In [None]:
import os
import sys
import logging
from pathlib import Path

# Agregar el directorio src al path
sys.path.append('../src')

# Configurar logging
logging.basicConfig(
    level=logging.INFO,
    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s'
)

print("Configuración inicial completada")


## 2. Configuración de Variables de Entorno


In [None]:
# Cargar variables de entorno desde archivo .env
from dotenv import load_dotenv

# Cargar archivo .env (crear uno basado en env.example)
load_dotenv('../env.example')

# Verificar variables críticas
required_vars = ['OPENAI_API_KEY']
missing_vars = []

for var in required_vars:
    if not os.getenv(var):
        missing_vars.append(var)

if missing_vars:
    print(f"⚠️ Variables faltantes: {missing_vars}")
    print("Por favor, configura estas variables en tu archivo .env")
else:
    print("✅ Variables de entorno configuradas correctamente")


## 3. Inicialización del Pipeline RAG


In [None]:
from rag_pipeline import create_rag_pipeline

# Crear pipeline RAG
print("Inicializando pipeline RAG...")
rag_pipeline = create_rag_pipeline(
    collection_name="itba_demo_collection",
    persist_directory="../data/processed/chroma_db",
    embedding_model="all-MiniLM-L6-v2",  # Modelo por defecto
    reset_collection=True  # Para el demo, empezamos limpio
)

print("✅ Pipeline RAG inicializado correctamente")


In [None]:
# Mostrar información del sistema
system_info = rag_pipeline.get_system_info()
print("Información del Sistema:")
print("=" * 50)

for component, info in system_info.items():
    print(f"\n{component.upper()}:")
    for key, value in info.items():
        print(f"  {key}: {value}")


## 4. Cargar Materiales Académicos


In [None]:
# Cargar materiales de Probabilidad y estadística
print("Cargando materiales de Probabilidad y estadística...")
result = rag_pipeline.load_materials(
    directory_path="../docs/Probabilidad y estadística",
    use_academic_metadata=True
)

print(f"✅ Documentos cargados: {result['documents_loaded']}")
print(f"✅ Chunks creados: {result['chunks_created']}")
print(f"✅ Tiempo total: {result['total_time']:.2f}s")
