# Asistente Legal Colombiano con LangChain + LLM

**Proyecto:** Sistema de consulta inteligente de leyes y documentos normativos colombianos

**Autores:** [Agregar nombres del equipo aqu√≠]

**Fecha:** Octubre 2025

---

## Objetivo del Proyecto

Desarrollar un asistente conversacional que permita consultar la Constituci√≥n Pol√≠tica de Colombia y otros documentos legales mediante:
- **B√∫squeda sem√°ntica** con RAG (Retrieval-Augmented Generation)
- **Procesamiento de lenguaje natural** con LLMs
- **Agentes inteligentes** que razonan y seleccionan herramientas
- **Interfaz interactiva** con Jupyter widgets

---

## Componentes Implementados

[x] **a) Mensajes y plantillas** - PromptTemplates con variables din√°micas  
[x] **b) Parsers estructurados** - Validaci√≥n de salidas con JSON schema  
[x] **c) Loaders** - Carga desde archivos locales, PDFs y URLs  
[x] **d) Vector DB + RAG** - Embeddings y b√∫squeda sem√°ntica  
[x] **e) Memoria conversacional** - Contexto multi-turno con LangChain  
[x] **f) Agentes ReAct** - Razonamiento y selecci√≥n de herramientas  
[x] **g) Transformaci√≥n de documentos** - Splitters y preprocesamiento  

---

## Demo R√°pida

**Flujo de uso:**
1. Cargar documentos legales (PDF/TXT)
2. Indexar con embeddings en vector database
3. Hacer preguntas en lenguaje natural
4. Obtener respuestas con referencias a art√≠culos espec√≠ficos

**Instrucciones:** Ejecuta las celdas en orden secuencial (‚¨áÔ∏è)

In [1]:
##!uv add "langchain[openai]" dotenv ipywidgets chromadb faiss-cpu PyPDF2

## installar dependencias con pip
#%pip install -q "langchain[openai]" python-dotenv ipywidgets chromadb faiss-cpu PyPDF2
#!pip install groq langchain-groq


In [18]:
# Imports y configuraci√≥n inicial
from langchain_core.prompts import PromptTemplate
from dotenv import load_dotenv
import os

# Load environment variables
load_dotenv()

# Import the LLM provider module
from llm_providers import get_llm_client, LLMProviderFactory

# Get LLM provider from environment (default: groq)
provider = os.getenv('LLM_PROVIDER', 'groq').lower()
print(f"Available providers: {LLMProviderFactory.get_available_providers()}")
print(f"Using provider: {provider}")

# Initialize LLM client based on provider
llm = get_llm_client(provider)
print(f"LLM client initialized successfully!")

# Prompt template mejorado para asistente legal colombiano
prompt = PromptTemplate(
    input_variables=["question"],
    template="""Eres un asistente legal especializado en derecho colombiano. Responde SIEMPRE en espa√±ol de forma CONCISA y PROFESIONAL.

INSTRUCCIONES ESPEC√çFICAS:
- S√© breve pero completo
- Usa terminolog√≠a jur√≠dica precisa
- Cita art√≠culos constitucionales cuando aplique
- Si no sabes algo, adm√≠telo claramente
- Mant√©n un tono formal y objetivo

Pregunta: {question}

Respuesta:"""
)


Available providers: ['openai', 'openrouter', 'ollama', 'groq']
Using provider: openrouter
LLM client initialized successfully!


In [2]:
# Loaders: widget FileUpload y helpers para parsear archivos subidos y leer `data/`
import ipywidgets as widgets
from IPython.display import display
import os
from io import BytesIO

# Widget para subir archivos
uploader = widgets.FileUpload(accept='.txt,.md,.pdf', multiple=True)
display(widgets.VBox([widgets.Label("Sube archivos legales (.pdf, .txt, .md)"), uploader]))

# Output para previsualizaci√≥n
output = widgets.Output()
display(output)


def parse_uploaded_files(uploader_widget):
    """Devuelve una lista de dicts {'filename', 'text'} extra√≠dos de los archivos subidos."""
    docs = []
    # La estructura de uploader.value depende del frontend; manejar ambos casos
    items = getattr(uploader_widget, 'value', {}) or {}
    # En algunos entornos items es lista, en otros dict
    try:
        iterator = items.items()
    except Exception:
        # intentamos tratar como lista
        iterator = [(f.get('name', f"file_{i}"), f) for i, f in enumerate(items)]

    for name, fileinfo in iterator:
        # fileinfo puede ser dict con 'content' o directamente bytes
        content = fileinfo.get('content') if isinstance(fileinfo, dict) else fileinfo
        text = ''
        if name.lower().endswith('.pdf'):
            try:
                from PyPDF2 import PdfReader
                reader = PdfReader(BytesIO(content))
                pages = [p.extract_text() or '' for p in reader.pages]
                text = '\n'.join(pages)
            except Exception as e:
                text = f"[ERROR] No se pudo leer PDF ({name}): {e}"
        else:
            try:
                if isinstance(content, bytes):
                    text = content.decode('utf-8')
                else:
                    text = str(content)
            except Exception as e:
                text = f"[ERROR] decodificando {name}: {e}"
        docs.append({'filename': name, 'text': text})
    return docs


def on_preview_clicked(b):
    with output:
        output.clear_output()
        docs = parse_uploaded_files(uploader)
        if not docs:
            print('No se han encontrado archivos subidos.')
            return
        for d in docs:
            print(f"--- {d['filename']} ---")
            print(d['text'][:1500])
            print('\n')

preview_btn = widgets.Button(description='Previsualizar archivos')
preview_btn.on_click(on_preview_clicked)
display(preview_btn)


def load_local_docs(data_dir='data'):
    """Lee archivos de `data/` y devuelve lista de dicts {'filename','text'}"""
    docs = []
    if not os.path.exists(data_dir):
        print(f"No existe la carpeta '{data_dir}'. Crea la carpeta y a√±ade documentos de ejemplo.")
        return docs
    for fn in sorted(os.listdir(data_dir)):
        path = os.path.join(data_dir, fn)
        if not os.path.isfile(path):
            continue
        text = ''
        if fn.lower().endswith('.pdf'):
            try:
                from PyPDF2 import PdfReader
                reader = PdfReader(path)
                pages = [p.extract_text() or '' for p in reader.pages]
                text = '\n'.join(pages)
            except Exception as e:
                text = f"[ERROR] leyendo PDF {fn}: {e}"
        else:
            try:
                with open(path, 'r', encoding='utf-8') as f:
                    text = f.read()
            except Exception as e:
                text = f"[ERROR] leyendo {fn}: {e}"
        docs.append({'filename': fn, 'text': text})
    return docs

# Ejemplo de uso: docs = load_local_docs('data')
# print(docs[0]['text'][:500]) if docs else print('No hay documentos en data/')


VBox(children=(Label(value='Sube archivos legales (.pdf, .txt, .md)'), FileUpload(value=(), accept='.txt,.md,.‚Ä¶

Output()

Button(description='Previsualizar archivos', style=ButtonStyle())

## Secci√≥n: Loaders (carga de documentos)

En esta secci√≥n implementaremos los loaders que permiten: (1) subir archivos locales mediante un widget, y (2) cargar archivos desde la carpeta `data/` del repositorio. M√°s adelante convertiremos estos textos en chunks y los indexaremos en una vector DB.

Instrucciones r√°pidas:
- Usa el widget para subir `.pdf`, `.txt` o `.md`.
- Pulsa "Previsualizar archivos" para ver el texto extra√≠do (o errores si falta una dependencia de PDF).

In [3]:
# Preprocesamiento: splitters y creaci√≥n de chunks
# Carga documentos desde `data/`, aplica un splitter y guarda los chunks en `DOCUMENT_CHUNKS`.
from collections import Counter

# Intentar importar el splitter de LangChain; si la API cambia, manejar el fallback
try:
    from langchain.text_splitter import RecursiveCharacterTextSplitter
except Exception:
    try:
        # versi√≥n alternativa
        from langchain.text_splitter import CharacterTextSplitter as RecursiveCharacterTextSplitter
    except Exception:
        RecursiveCharacterTextSplitter = None


def create_chunks(docs, chunk_size=1000, chunk_overlap=200):
    """Devuelve lista de dicts {'source','chunk_index','text'}"""
    if RecursiveCharacterTextSplitter is None:
        raise ImportError("No se encontr√≥ RecursiveCharacterTextSplitter. Instala langchain actualizado.")
    splitter = RecursiveCharacterTextSplitter(chunk_size=chunk_size, chunk_overlap=chunk_overlap)
    all_chunks = []
    for d in docs:
        text = d.get('text') or ''
        if not text.strip():
            # texto vac√≠o o error al leer
            continue
        texts = splitter.split_text(text)
        for i, t in enumerate(texts):
            all_chunks.append({'source': d.get('filename', 'unknown'), 'chunk_index': i, 'text': t})
    return all_chunks

# Cargar documentos locales desde data/
DOCUMENTS = load_local_docs('data')
print(f"Documentos cargados: {len(DOCUMENTS)}")

# Crear chunks
DOCUMENT_CHUNKS = create_chunks(DOCUMENTS, chunk_size=1000, chunk_overlap=200) if DOCUMENTS else []
print(f"Total chunks generados: {len(DOCUMENT_CHUNKS)}")

# Mostrar conteo por documento y un ejemplo
if DOCUMENT_CHUNKS:
    per_doc = Counter([c['source'] for c in DOCUMENT_CHUNKS])
    for doc, cnt in per_doc.items():
        print(f" - {doc}: {cnt} chunks")
    print('\nEjemplo (primer chunk, 500 chars):')
    print(DOCUMENT_CHUNKS[0]['text'][:500])
else:
    print('No hay chunks (documentos vac√≠os o problema al leer los archivos).')

# Ahora `DOCUMENTS` y `DOCUMENT_CHUNKS` est√°n listos para embeddings / indexado.


Documentos cargados: 1
Total chunks generados: 165
 - reglamento_academi_pregrado.pdf: 165 chunks

Ejemplo (primer chunk, 500 chars):
ACUERDO  No.186  
02 de  diciembre de 2005  
 
 
Por el cual  compila y actualiza   el Reglamento Acad√©mico Estudiantil de Pregrado.  
 
 
EL CONSEJO  SUPERIOR  DE LA UNIVERSIDAD  DE PAMPLONA,  EN USO DE  SUS 
ATRIBUCIONES  LEGALES,  en especial de las que le confiere el art √≠culo, y,  
Art√≠culo 23 Literales a) y d)  
 
CONSIDERANDO:  
 
 
1. Que es funci√≥n  del Consejo  Superior Universitario,  expedir  √≥ modificar  los 
Estatutos  y Regla mentos  de la Instituci√≥n,  previo  concepto  de las in


## Secci√≥n: Vector Database (Opcional)

Esta secci√≥n es **opcional**. Si deseas mejorar la b√∫squeda sem√°ntica, puedes crear un vector database (Chroma o FAISS) con embeddings.

**Ventajas de usar vectordb:**
- B√∫squeda sem√°ntica m√°s precisa (entiende el significado, no solo palabras clave)
- Mejor recuperaci√≥n de documentos relevantes
- Resultados m√°s coherentes

**Si no usas vectordb:**
- El sistema funcionar√° con b√∫squeda por palabras clave (fallback autom√°tico)
- Es m√°s r√°pido pero menos preciso sem√°nticamente

Ejecuta la siguiente celda si quieres configurar embeddings con OpenAI o alternativas gratuitas.

In [4]:
# ===== SECCI√ìN: Crear Vector Database con Embeddings =====
# Esta celda crea una base de datos vectorial para b√∫squeda sem√°ntica avanzada

from langchain_openai import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.schema import Document
import os

# Verificar que tenemos chunks disponibles
if not DOCUMENT_CHUNKS:
    print("‚ö†Ô∏è No hay chunks disponibles. Ejecuta primero la celda de preprocesamiento.")
    vectordb = None
else:
    print(f"üì¶ Preparando {len(DOCUMENT_CHUNKS)} chunks para indexaci√≥n...")
    
    # Convertir chunks a formato Document de LangChain
    documents = []
    for chunk in DOCUMENT_CHUNKS:
        doc = Document(
            page_content=chunk['text'],
            metadata={
                'source': chunk['source'],
                'chunk_index': chunk['chunk_index']
            }
        )
        documents.append(doc)
    
    # Intentar crear embeddings y vectordb
    try:
        print("üîÑ Creando embeddings (esto puede tardar 1-2 minutos)...")
        
        # Configurar embeddings seg√∫n el proveedor
        provider = os.getenv('LLM_PROVIDER', 'groq').lower()
        
        if provider in ['openai', 'groq', 'openrouter']:
            # Usar embeddings de OpenAI (compatible con OpenRouter y Groq tambi√©n)
            embeddings = OpenAIEmbeddings(
                openai_api_key=os.getenv('OPENAI_API_KEY', os.getenv('OPENROUTER_API_KEY'))
            )
        else:
            # Fallback a OpenAI est√°ndar
            embeddings = OpenAIEmbeddings()
        
        # Crear Chroma vectorstore con persistencia
        vectordb = Chroma.from_documents(
            documents=documents,
            embedding=embeddings,
            persist_directory="./chroma_db"
        )
        
        print(f"‚úÖ Vector database creado exitosamente!")
        print(f"   - Total documentos indexados: {len(documents)}")
        print(f"   - Directorio de persistencia: ./chroma_db")
        print(f"   - Embedding model: {embeddings.model}")
        
    except Exception as e:
        print(f"‚ùå Error al crear embeddings: {e}")
        print("   Se usar√° b√∫squeda por keywords como fallback")
        vectordb = None

# Verificar estado final
if vectordb is not None:
    print("\nüéâ Modo: B√öSQUEDA SEM√ÅNTICA (embeddings activos)")
else:
    print("\n‚ö†Ô∏è Modo: B√öSQUEDA POR KEYWORDS (fallback)")

üì¶ Preparando 165 chunks para indexaci√≥n...
üîÑ Creando embeddings (esto puede tardar 1-2 minutos)...
‚úÖ Vector database creado exitosamente!
   - Total documentos indexados: 165
   - Directorio de persistencia: ./chroma_db
   - Embedding model: text-embedding-ada-002

üéâ Modo: B√öSQUEDA SEM√ÅNTICA (embeddings activos)
‚úÖ Vector database creado exitosamente!
   - Total documentos indexados: 165
   - Directorio de persistencia: ./chroma_db
   - Embedding model: text-embedding-ada-002

üéâ Modo: B√öSQUEDA SEM√ÅNTICA (embeddings activos)


In [6]:
#%pip install -q --upgrade langchain-openai
#!uv add langchain-openai --upgrade
!uv add langchain-community

[2mResolved [1m157 packages[0m [2min 19ms[0m[0m
[2mAudited [1m140 packages[0m [2min 25ms[0m[0m


In [5]:
##SECCION 5 PARSES 
from langchain.output_parsers import StructuredOutputParser, ResponseSchema
from langchain.prompts import PromptTemplate

# Definir los campos esperados en la salida
response_schemas = [
    ResponseSchema(name="answer", description="Respuesta concisa, clara a la consulta legal o normativa en espa√±ol."),
    ResponseSchema(name="citations", description="Lista de citas con formato [doc:filename, chunk:index]."),
    ResponseSchema(name="follow_up", description="true/false indicando si el usuario deber√≠a hacer una pregunta de seguimiento."),
]

# Crear el parser estructurado
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)

# Instrucciones para el modelo
format_instructions = output_parser.get_format_instructions()

# Prompt template que exige formato
parser_prompt = PromptTemplate(
    template="""
Eres un asistente legal-normativo colombiano. Responde siempre en formato JSON.

Pregunta: {question}

{format_instructions}
""",
    input_variables=["question"],
    partial_variables={"format_instructions": format_instructions},
)

# Ejemplo de uso
question = "¬øCu√°les son los requisitos para graduarse en la universidad de pamplona?"

prompt_text = parser_prompt.format(question=question)
response = llm.invoke(prompt_text)

print("=== Respuesta cruda del LLM ===")
print(response.content)

try:
    parsed = output_parser.parse(response.content)
    print("\n=== Respuesta parseada (dict v√°lido) ===")
    print(parsed)
except Exception as e:
    print("\n[ERROR] No se pudo parsear la salida:", e)


=== Respuesta cruda del LLM ===
Los requisitos para graduarse en la Universidad de Pamplona, en su calidad de instituci√≥n de educaci√≥n superior en Colombia, est√°n principalmente definidos en su reglamentaci√≥n interna, espec√≠ficamente en el Reglamento Estudiantil (Acuerdo No. 035 de 2021 del Consejo Acad√©mico, y posteriores modificaciones). A continuaci√≥n, se detallan los requisitos generales:

```json
{
	"answer": "Los requisitos para optar por un t√≠tulo profesional en la Universidad de Pamplona (Unipamplona) generalmente incluyen:\n\n1. **Haber cursado y aprobado la totalidad del plan de estudios del programa acad√©mico:** Esto implica haber aprobado todas las asignaturas o cr√©ditos acad√©micos requeridos.\n2. **Haber cumplido con el requisito de suficiencia en una segunda lengua:** Demostrar el nivel de competencia requerido por la Universidad, usualmente mediante prueba o certificaci√≥n v√°lida, conforme al Marco Com√∫n Europeo de Referencia para las Lenguas (MCER).\n3. **H

In [6]:
from langchain.memory import ConversationBufferMemory
from langchain.chains import LLMChain
from langchain.prompts import PromptTemplate

# Definir un prompt que incluya historial de conversaci√≥n
memory_prompt = PromptTemplate(
    input_variables=["history", "question"],
    template="""
Eres un asistente legal-normativo colombiano.
Responde en espa√±ol de forma clara y breve.

Historial de conversaci√≥n:
{history}

Nueva pregunta:
{question}

Respuesta:
"""
)

# Inicializar la memoria
memory = ConversationBufferMemory(memory_key="history")

# Construir el chain con memoria
conversation_chain = LLMChain(
    llm=llm,
    prompt=memory_prompt,
    memory=memory,
)

# Ejemplo de interacci√≥n multi-turno
print("Turno 1:")
resp1 = conversation_chain.run("Soy un estudiante de Ingenieria de sistemas y me llamo Wilson")
print(resp1)

print("\nTurno 2 (con memoria):")
resp2 = conversation_chain.run("¬øComo me llamo y que estudio?")
print(resp2)



  memory = ConversationBufferMemory(memory_key="history")
  conversation_chain = LLMChain(
  resp1 = conversation_chain.run("Soy un estudiante de Ingenieria de sistemas y me llamo Wilson")


Turno 1:
Hola Wilson.

Turno 2 (con memoria):
Hola Wilson.

Turno 2 (con memoria):
Wilson, tu nombre, e Ingenier√≠a de Sistemas, tu estudio.
Wilson, tu nombre, e Ingenier√≠a de Sistemas, tu estudio.


In [7]:
from langchain.agents import initialize_agent, Tool, AgentType
from langchain_core.prompts import PromptTemplate

# Definici√≥n b√°sica de rag_answer para evitar NameError
import textwrap

def rag_answer(query: str, k: int = 3):
    """Funci√≥n b√°sica de RAG usando DOCUMENT_CHUNKS."""
    if 'DOCUMENT_CHUNKS' not in globals() or not DOCUMENT_CHUNKS:
        return {'answer': 'No hay documentos cargados para buscar.', 'citations': []}
    
    q = query.lower()
    scored = []
    for c in DOCUMENT_CHUNKS:
        text = c.get('text', '') or ''
        score = text.lower().count(q)  # heur√≠stica simple
        scored.append({'text': text, 'score': score, 'metadata': {'source': c.get('source'), 'chunk_index': c.get('chunk_index')}})
    scored = sorted(scored, key=lambda x: x['score'], reverse=True)[:k]
    
    if not scored:
        return {'answer': 'No se encontraron documentos relevantes.', 'citations': []}
    
    context = '\n'.join([s['text'][:500] for s in scored])
    prompt = f"Eres un asistente legal colombiano. Responde en espa√±ol basado en el contexto proporcionado.\n\nContexto:\n{context}\n\nPregunta: {query}\n\nRespuesta:"
    
    try:
        answer = llm.invoke(prompt).content
    except Exception as e:
        answer = f"Error al invocar LLM: {e}"
    
    return {'answer': answer, 'citations': []}

# --- Agente React B√°sico ---
def buscar_en_leyes_normativos(query: str) -> str:
    """Busca en la base de datos legal usando RAG."""
    res = rag_answer(query, k=3)
    return f"Respuesta (RAG): {res['answer']}"

tools = [
    Tool(
        name="BusquedaLegalRAG",
        func=buscar_en_leyes_normativos,
        description="Usa esta herramienta cuando la pregunta se relacione con leyes o documentos cargados."
    ),
    Tool(
        name="LLMGeneral",
        func=lambda q: llm.invoke(q).content,
        description="Usa esta herramienta cuando la pregunta NO sea legal o no requiera buscar documentos."
    )
]

# --- Inicializamos agente con tipo ReAct ---
agent = initialize_agent(
    tools=tools,
    llm=llm,
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True,   # muestra el razonamiento paso a paso
    max_iterations=3,
)

# --- Ejemplo de uso ---
print("Ejemplo 1: Pregunta legal (usa RAG)")
respuesta1 = agent.invoke({"input": "¬øQu√© promedio se necesita para graduarse en la Universidad de Pamplona?"})
print("Respuesta:", respuesta1.get("output", respuesta1))

print("\nEjemplo 2: Pregunta general (usa LLM)")
respuesta2 = agent.invoke({"input": "¬øQui√©n fue Gabriel Garc√≠a M√°rquez?"})
print("Respuesta:", respuesta2.get("output", respuesta2))

  agent = initialize_agent(


Ejemplo 1: Pregunta legal (usa RAG)


[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: La pregunta es sobre el promedio de notas necesario para graduarse en la Universidad de Pamplona. Esta es una pregunta de conocimiento general sobre una instituci√≥n acad√©mica espec√≠fica, no una pregunta legal. Por lo tanto, usar√© la herramienta `LLMGeneral`.
Action: LLMGeneral
Action Input: ¬øQu√© promedio se necesita para graduarse en la Universidad de Pamplona?[0m[32;1m[1;3mThought: La pregunta es sobre el promedio de notas necesario para graduarse en la Universidad de Pamplona. Esta es una pregunta de conocimiento general sobre una instituci√≥n acad√©mica espec√≠fica, no una pregunta legal. Por lo tanto, usar√© la herramienta `LLMGeneral`.
Action: LLMGeneral
Action Input: ¬øQu√© promedio se necesita para graduarse en la Universidad de Pamplona?[0m
Observation: [33;1m[1;3mEl promedio necesario para graduarse en la **Universidad de Pamplona (Unipamplona)** var√≠a princip

In [8]:
# ===== CELDA: Definir retrieve + rag_answer + re-crear agente ReAct =====
import textwrap

# 1) Comprobaciones b√°sicas
if 'llm' not in globals():
    raise NameError("No existe la variable 'llm'. Inicializa tu LLM (ChatGroq/ChatOpenAI) antes de ejecutar esta celda.")

# Asegurar que vectordb existe (aunque sea None)
if 'vectordb' not in globals():
    vectordb = None
    print("‚ö†Ô∏è vectordb no definido, se usar√° b√∫squeda por keywords")

try:
    has_vectordb = vectordb is not None
except:
    has_vectordb = False

has_chunks = ('DOCUMENT_CHUNKS' in globals() and bool(DOCUMENT_CHUNKS))

# 2) Funciones de recuperaci√≥n (vectordb o fallback por keywords)
def retrieve_by_keywords(query: str, k: int = 4):
    """Fallback simple: cuenta ocurrencias en DOCUMENT_CHUNKS."""
    if not has_chunks:
        return []
    q = query.lower()
    words = q.split()  # dividir en palabras para mejor b√∫squeda
    scored = []
    for c in DOCUMENT_CHUNKS:
        text = c.get('text','') or ''
        score = sum(text.lower().count(word) for word in words)  # suma de ocurrencias de cada palabra
        scored.append({'text': text, 'score': score, 'metadata': {'source': c.get('source'), 'chunk_index': c.get('chunk_index')}})
    scored = sorted(scored, key=lambda x: x['score'], reverse=True)
    return scored[:k]

def retrieve_from_vectordb(query: str, k: int = 4):
    """Intentar usar vectordb (Chroma/FAISS) si est√° disponible."""
    try:
        # preferimos similarity_search_with_relevance_scores si existe
        if hasattr(vectordb, "similarity_search_with_relevance_scores"):
            results = vectordb.similarity_search_with_relevance_scores(query, k=k)
            out = []
            for doc, score in results:
                text = getattr(doc, "page_content", None) or (doc.get('text') if isinstance(doc, dict) else str(doc))
                meta = getattr(doc, "metadata", None) or (doc if isinstance(doc, dict) else {})
                out.append({'text': text, 'score': float(score), 'metadata': meta})
            return out
        else:
            results = vectordb.similarity_search(query, k=k)
            out = []
            for r in results:
                text = getattr(r, "page_content", None) or (r.get('text') if isinstance(r, dict) else str(r))
                meta = getattr(r, "metadata", None) or (r if isinstance(r, dict) else {})
                out.append({'text': text, 'score': None, 'metadata': meta})
            return out
    except Exception as e:
        print("‚ö†Ô∏è Error buscando en vectordb:", e)
        print("Se usar√° fallback por keywords (DOCUMENT_CHUNKS).")
        return retrieve_by_keywords(query, k=k)

def retrieve(query: str, k: int = 4):
    return retrieve_from_vectordb(query, k) if has_vectordb else retrieve_by_keywords(query, k)

# 3) Wrapper LLM compatible con .invoke() y llamada directa
def llm_call(prompt: str, **kwargs) -> str:
    """Llama al LLM y devuelve texto; maneja distintos formatos de respuesta."""
    try:
        resp = llm.invoke(prompt, **kwargs)
        return getattr(resp, "content", None) or str(resp)
    except Exception:
        try:
            resp = llm(prompt, **kwargs)
            return getattr(resp, "content", None) or str(resp)
        except Exception as e:
            return f"[ERROR en LLM]: {e}"

# 4) rag_answer robusto: recupera, arma contexto y llama al LLM
def rag_answer(query: str, k: int = 4):
    docs = retrieve(query, k)
    if not docs:
        return {'answer': 'No se encontraron documentos relevantes.', 'citations': []}

    ctx_parts = []
    citations = []
    for d in docs:
        text = d.get('text') if isinstance(d, dict) else str(d)
        meta = d.get('metadata', {}) if isinstance(d, dict) else {}
        src = meta.get('source', meta.get('filename', 'unknown'))
        idx = meta.get('chunk_index')
        score = d.get('score')
        citations.append({'source': src, 'chunk_index': idx, 'score': score})
        snippet = textwrap.shorten(text, width=800, placeholder='...')
        ctx_parts.append(f"[{src}, chunk {idx}]\n{snippet}")

    context = "\n\n".join(ctx_parts)
    final_prompt = (
        "Eres un asistente legal especializado en derecho colombiano. Responde √öNICAMENTE en espa√±ol.\n\n"
        "INSTRUCCIONES JUR√çDICAS:\n"
        "- S√© CONCISO pero completo en explicaciones legales\n"
        "- Usa terminolog√≠a jur√≠dica precisa\n"
        "- Cita art√≠culos, leyes o normas espec√≠ficas cuando aparezcan en el contexto\n"
        "- Si el contexto no contiene informaci√≥n relevante, di: 'No encontr√© informaci√≥n espec√≠fica en los documentos consultados'\n"
        "- Mant√©n objetividad jur√≠dica y evita interpretaciones personales\n\n"
        f"Contexto de documentos legales:\n{context}\n\n"
        f"Pregunta jur√≠dica: {query}\n\n"
        "Respuesta jur√≠dica basada √∫nicamente en el contexto:"
    )

    answer_text = llm_call(final_prompt)
    return {'answer': answer_text, 'citations': citations}

# 5) Reconstruir agente ReAct usando herramientas simplificadas
from langchain.agents import initialize_agent, Tool, AgentType

def buscar_leyes_normativas_tool(q: str) -> str:
    """Herramienta para buscar en documentos legales."""
    try:
        r = rag_answer(q, k=3)
        answer = r.get('answer', 'No se obtuvo respuesta')
        citations = r.get('citations', [])
        
        # Formato de respuesta m√°s claro para el agente
        if citations and citations[0].get('source') != 'unknown':
            sources = ', '.join([f"{c.get('source')} (chunk {c.get('chunk_index')})" for c in citations[:2]])
            return f"{answer}\n\nFuentes consultadas: {sources}"
        return answer
    except Exception as e:
        return f"Error al buscar: {e}"

def llm_general_tool(q: str) -> str:
    """Herramienta para responder preguntas generales sin buscar en documentos."""
    try:
        prompt = f"""Eres un asistente legal especializado en derecho colombiano. Responde SIEMPRE en espa√±ol de forma CONCISA y PROFESIONAL.

INSTRUCCIONES PARA TEMAS LEGALES/NORMATIVOS:
- S√© breve pero preciso en explicaciones jur√≠dicas
- Usa terminolog√≠a jur√≠dica colombiana cuando aplique
- Mant√©n objetividad jur√≠dica
- Si es un tema legal espec√≠fico, sugiere consultar fuentes oficiales

Pregunta: {q}

Respuesta jur√≠dica:"""
        return llm_call(prompt)
    except Exception as e:
        return f"Error: {e}"

tools = [
    Tool(
        name="BusquedaLegalRAG",
        func=buscar_leyes_normativas_tool,
        description="Usa esta herramienta SOLO para preguntas sobre leyes, constituci√≥n, art√≠culos legales o documentos espec√≠ficos cargados. Devuelve informaci√≥n basada en los documentos indexados."
    ),
    Tool(
        name="RespuestaDirecta",
        func=llm_general_tool,
        description="Usa esta herramienta para conceptos generales, definiciones o preguntas que NO requieren buscar en documentos espec√≠ficos. Por ejemplo: definiciones generales, explicaciones de conceptos."
    )
]

# Configurar agente con l√≠mites m√°s razonables y mejor prompt
agent = initialize_agent(
    tools,
    llm,
    agent=AgentType.ZERO_SHOT_REACT_DESCRIPTION,
    verbose=True,
    max_iterations=5,  # Reducido para evitar bucles largos
    early_stopping_method="generate",  # Forzar respuesta si llega al l√≠mite
    handle_parsing_errors=True  # Manejar errores de parsing
)

In [11]:
# ===== CELDA: Inicializar vectordb (si no existe a√∫n) =====
# Esta celda asegura que vectordb existe como variable global
# Si tienes Chroma o FAISS configurado, puedes reemplazar None con tu vectordb

try:
    _ = vectordb
    print(f"‚úÖ vectordb ya existe: {type(vectordb)}")
except NameError:
    vectordb = None  # Inicializar como None si no existe
    print("‚ö†Ô∏è vectordb no estaba definido. Se inicializ√≥ como None.")
    print("   Se usar√° b√∫squeda por keywords en DOCUMENT_CHUNKS como fallback.")
    print("   Para usar embeddings, ejecuta una celda que cree vectordb (Chroma/FAISS) antes de esta.")

‚úÖ vectordb ya existe: <class 'langchain_community.vectorstores.chroma.Chroma'>


In [None]:
# ===== CELDA: Pruebas del agente ReAct =====

# Ejemplo 1: Pregunta sobre documentos espec√≠ficos (usa RAG)
print("=" * 60)
print("EJEMPLO 1: Pregunta sobre normativa (usa RAG)")
print("=" * 60)
try:
    resultado1 = agent.invoke({"input": "Resume brevemente las reglas para graduarse en la Universidad de Pamplona."})
    print("\n RESULTADO:")
    print("Respuesta:", resultado1.get("output", resultado1))
except Exception as e:
    print(f"\n ERROR: {e}")

print("\n" + "=" * 60)
print("EJEMPLO 2: Pregunta general (no requiere documentos)")
print("=" * 60)
try:
    resultado2 = agent.invoke({"input": "Explica brevemente qu√© es el habeas corpus en t√©rminos generales."})
    print("\n RESULTADO:")
    print("Respuesta:", resultado2.get("output", resultado2))
except Exception as e:
    print(f"\n ERROR: {e}")

# Puedes descomentar para m√°s pruebas:
# print("\n" + "=" * 60)
# print("EJEMPLO 3: Pregunta espec√≠fica de art√≠culos")
# print("=" * 60)
# resultado3 = agent.invoke({"input": "¬øQu√© art√≠culo de la Constituci√≥n trata sobre la libertad de expresi√≥n?"})

EJEMPLO 1: Pregunta sobre normativa (usa RAG)


[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: The user is asking for a brief summary of the graduation rules at the University of Pamplona. This is specific institutional information that is likely contained in a legal or regulatory document (e.g., a university statute or regulation). Therefore, I should use the legal search tool to find this information, as university regulations often function as internal legal documents.
Action: BusquedaLegalRAG
Action Input: reglas para graduarse en la Universidad de Pamplona[0m[32;1m[1;3mThought: The user is asking for a brief summary of the graduation rules at the University of Pamplona. This is specific institutional information that is likely contained in a legal or regulatory document (e.g., a university statute or regulation). Therefore, I should use the legal search tool to find this information, as university regulations often function as internal legal documents.
Acti

In [10]:
# Prueba r√°pida individual
print("Probando el agente con una pregunta simple...")
try:
    resultado = agent.invoke({"input": "¬øQu√© es el habeas corpus?"})
    print("\n" + "="*60)
    print("RESPUESTA FINAL:")
    print("="*60)
    print("Respuesta:", resultado.get("output", resultado))
except Exception as e:
    print(f"Error: {e}")
    import traceback
    traceback.print_exc()

Probando el agente con una pregunta simple...


[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: The user is asking for the definition of "habeas corpus", which is a general legal and constitutional concept. I should use the `RespuestaDirecta` tool.
Action: RespuestaDirecta
Action Input: ¬øQu√© es el habeas corpus?[0m[32;1m[1;3mThought: The user is asking for the definition of "habeas corpus", which is a general legal and constitutional concept. I should use the `RespuestaDirecta` tool.
Action: RespuestaDirecta
Action Input: ¬øQu√© es el habeas corpus?[0m
Observation: [33;1m[1;3mEl *habeas corpus* es un derecho fundamental y una acci√≥n constitucional que protege la libertad personal frente a detenciones arbitrarias o ilegales en Colombia.

Permite a toda persona privada de la libertad solicitar ante un juez que revise la legalidad de su aprehensi√≥n. El juez debe decidir sobre la solicitud en un t√©rmino de treinta y seis (36) horas.

**Fundamento Legal:** Art

## üéì Conclusiones y Consideraciones √âticas

### ‚úÖ Logros del Proyecto

Este proyecto implementa un **asistente legal inteligente** que combina m√∫ltiples tecnolog√≠as de IA:

1. **RAG (Retrieval-Augmented Generation)**: Respuestas basadas en documentos reales, no en alucinaciones del modelo
2. **Agentes ReAct**: Capacidad de razonamiento y selecci√≥n autom√°tica de herramientas
3. **Memoria conversacional**: Contexto persistente entre m√∫ltiples preguntas
4. **Interfaz intuitiva**: UI interactiva con Jupyter widgets

### üéØ Componentes Implementados

- ‚úÖ **Mensajes y plantillas** (PromptTemplate)
- ‚úÖ **Parsers estructurados** (StructuredOutputParser)
- ‚úÖ **Loaders** (local, PDF, URLs)
- ‚úÖ **Vector Database** (Chroma con embeddings)
- ‚úÖ **Memoria** (ConversationBufferMemory)
- ‚úÖ **Agentes ReAct** (razonamiento paso a paso)
- ‚úÖ **Transformaci√≥n** (splitters, sintetizadores)

### ‚ö†Ô∏è Limitaciones Importantes

#### 1. **Cobertura Legal**
- El sistema solo conoce los documentos que se le cargan
- No tiene acceso a jurisprudencia actualizada o fallos recientes
- La legislaci√≥n colombiana cambia constantemente

#### 2. **Precisi√≥n de las Respuestas**
- Los LLMs pueden cometer errores o interpretaciones incorrectas
- La calidad depende del contexto recuperado por RAG
- Puede haber "alucinaciones" si el LLM especula m√°s all√° de los documentos

#### 3. **Actualizaci√≥n de Datos**
- Los documentos deben actualizarse manualmente
- No hay sincronizaci√≥n autom√°tica con bases de datos oficiales

### ‚öñÔ∏è Consideraciones √âticas y Legales

#### **‚ö†Ô∏è NO ES UN SUSTITUTO DE ASESOR√çA LEGAL PROFESIONAL**

Este sistema es una **herramienta de consulta y apoyo**, NO un reemplazo de:
- Abogados certificados
- Consultores legales
- Notarios o entidades oficiales

#### **Responsabilidades del Usuario:**

1. **Verificaci√≥n obligatoria**: Toda informaci√≥n debe ser validada con fuentes oficiales
2. **Uso educativo**: Ideal para aprendizaje y consultas preliminares
3. **No para decisiones cr√≠ticas**: No basar decisiones legales importantes solo en este sistema
4. **Privacidad**: No ingresar informaci√≥n confidencial o sensible

#### **Sesgos y Limitaciones del IA:**

- Los modelos pueden tener sesgos inherentes de sus datos de entrenamiento
- Las respuestas reflejan el contenido de los documentos cargados
- La interpretaci√≥n legal requiere contexto humano y experiencia

### üîÆ Mejoras Futuras

1. **Integraci√≥n con APIs oficiales** del gobierno colombiano
2. **Actualizaci√≥n autom√°tica** de normativas
3. **An√°lisis de jurisprudencia** con casos reales
4. **Multimodalidad**: procesar im√°genes de documentos escaneados
5. **B√∫squeda jur√≠dica avanzada** con filtros por fecha, tipo de norma, etc.
6. **Comparaci√≥n de versiones** de leyes modificadas
7. **Generaci√≥n de documentos** legales b√°sicos

### üìö Referencias y Fuentes

- **Constituci√≥n Pol√≠tica de Colombia 1991**
- **Reglamentos acad√©micos** (seg√∫n documentos cargados)
- **LangChain Documentation**: https://python.langchain.com/
- **Groq API**: https://console.groq.com/
- **Chroma Vector Database**: https://www.trychroma.com/

### üë• Contribuciones

Este proyecto fue desarrollado como parte del curso de Sistemas Inteligentes.

**Equipo:** [Agregar nombres aqu√≠]

### üìÑ Licencia y Uso

Este c√≥digo es de uso educativo. Los documentos legales pertenecen a sus respectivos autores y est√°n sujetos a sus propias licencias.

---

## üôè Agradecimientos

Gracias por revisar este proyecto. Esperamos que sea √∫til como herramienta educativa y de aprendizaje sobre aplicaciones de IA en el √°mbito legal.

**Recuerda:** La tecnolog√≠a es una herramienta poderosa, pero la responsabilidad y √©tica en su uso son fundamentales.

---

<div style="background: #ffe6e6; border-left: 4px solid #ff0000; padding: 15px; margin: 20px 0;">
<strong>‚ö†Ô∏è DISCLAIMER LEGAL:</strong><br>
Este sistema NO proporciona asesor√≠a legal profesional. Para asuntos legales importantes, consulte siempre con un abogado certificado. El uso de este sistema es bajo su propia responsabilidad.
</div>

In [11]:
# ===== CELDA: Sintetizador de documentos =====
import ipywidgets as widgets
from IPython.display import display, HTML

def summarize_document(doc_text, max_length=2000):
    """Genera un resumen de un documento usando el LLM."""
    # Truncar si es muy largo
    text_to_summarize = doc_text[:max_length] if len(doc_text) > max_length else doc_text
    
    prompt = f"""Eres un asistente legal especializado en derecho colombiano. Genera un resumen ejecutivo CONCISO en espa√±ol.

INSTRUCCIONES PARA RESUMEN JUR√çDICO:
- S√© breve pero cubre todos los aspectos legales importantes
- Identifica claramente el tipo de norma jur√≠dica (ley, decreto, resoluci√≥n, etc.)
- Resume los art√≠culos o disposiciones m√°s relevantes
- Indica el alcance territorial y temporal de aplicabilidad
- Usa terminolog√≠a jur√≠dica precisa colombiana

Documento legal:
{text_to_summarize}

Resumen ejecutivo jur√≠dico:"""
    
    try:
        summary = llm_call(prompt)
        return summary
    except Exception as e:
        return f"[ERROR] No se pudo generar resumen: {e}"

def summarize_all_documents():
    """Genera res√∫menes de todos los documentos cargados."""
    if not DOCUMENTS:
        return "‚ö†Ô∏è No hay documentos cargados"
    
    summaries = []
    for i, doc in enumerate(DOCUMENTS, 1):
        doc_name = doc.get('filename', f'Documento {i}')
        doc_text = doc.get('text', '')
        
        if len(doc_text) < 100:
            summaries.append({
                'name': doc_name,
                'summary': '[Documento muy corto, sin resumen]',
                'length': len(doc_text)
            })
            continue
        
        print(f"üìù Generando resumen {i}/{len(DOCUMENTS)}: {doc_name}...")
        summary = summarize_document(doc_text, max_length=3000)
        
        summaries.append({
            'name': doc_name,
            'summary': summary,
            'length': len(doc_text)
        })
    
    return summaries

# Widget para generar res√∫menes
summarize_button = widgets.Button(
    description='üìã Generar Res√∫menes',
    button_style='success',
    tooltip='Genera res√∫menes de todos los documentos',
    layout=widgets.Layout(width='250px', height='40px')
)

summary_output = widgets.Output(layout=widgets.Layout(
    border='1px solid #ddd',
    padding='15px',
    max_height='600px',
    overflow='auto'
))

def on_summarize_clicked(b):
    with summary_output:
        clear_output()
        
        if not DOCUMENTS:
            display(HTML('<p style="color: orange;">‚ö†Ô∏è No hay documentos para resumir. Carga documentos primero.</p>'))
            return
        
        display(HTML(f'<h4>üîÑ Generando res√∫menes de {len(DOCUMENTS)} documentos...</h4>'))
        
        summaries = summarize_all_documents()
        
        clear_output()
        display(HTML('<h3>üìö Res√∫menes de Documentos</h3>'))
        
        for i, sum_data in enumerate(summaries, 1):
            html = f'''
            <div style="background: #f9f9f9; border-left: 4px solid #4CAF50; padding: 15px; margin: 15px 0;">
                <h4 style="margin-top: 0; color: #2c3e50;">
                    üìÑ Documento {i}: {sum_data['name']}
                </h4>
                <p style="color: #666; font-size: 0.9em;">
                    Tama√±o: {sum_data['length']:,} caracteres
                </p>
                <div style="background: white; padding: 10px; border-radius: 5px; margin-top: 10px;">
                    {sum_data['summary']}
                </div>
            </div>
            '''
            display(HTML(html))
        
        display(HTML(f'<p style="color: green; margin-top: 20px;">‚úÖ Se generaron {len(summaries)} res√∫menes exitosamente.</p>'))

summarize_button.on_click(on_summarize_clicked)

# Mostrar UI
display(widgets.VBox([
    widgets.HTML('<h3>üìù Generador de Res√∫menes Autom√°ticos</h3>'),
    widgets.HTML('<p>Esta herramienta genera res√∫menes ejecutivos de todos los documentos cargados usando el LLM.</p>'),
    summarize_button,
    summary_output
]))

print(f"‚úÖ Sintetizador listo. Documentos disponibles: {len(DOCUMENTS) if DOCUMENTS else 0}")

VBox(children=(HTML(value='<h3>üìù Generador de Res√∫menes Autom√°ticos</h3>'), HTML(value='<p>Esta herramienta ge‚Ä¶

‚úÖ Sintetizador listo. Documentos disponibles: 1


## üìù Sintetizador de Documentos

Esta secci√≥n permite generar res√∫menes autom√°ticos de los documentos cargados usando el LLM.

In [12]:
# ===== CELDA OPCIONAL: Loader desde URLs =====
import ipywidgets as widgets
from IPython.display import display
import requests
from bs4 import BeautifulSoup

# Widget para ingresar URLs
url_input = widgets.Text(
    value='',
    placeholder='https://ejemplo.com/documento-legal.html',
    description='URL:',
    layout=widgets.Layout(width='80%')
)

load_url_button = widgets.Button(
    description='üì• Cargar desde URL',
    button_style='info',
    layout=widgets.Layout(width='200px')
)

url_output = widgets.Output()

def load_from_url(url):
    """Carga contenido desde una URL y lo parsea."""
    try:
        print(f"üì° Descargando desde: {url}")
        response = requests.get(url, timeout=10)
        response.raise_for_status()
        
        # Detectar tipo de contenido
        content_type = response.headers.get('content-type', '').lower()
        
        if 'html' in content_type:
            # Parsear HTML
            soup = BeautifulSoup(response.content, 'html.parser')
            # Remover scripts y styles
            for script in soup(["script", "style"]):
                script.decompose()
            text = soup.get_text()
            # Limpiar espacios m√∫ltiples
            lines = (line.strip() for line in text.splitlines())
            text = '\n'.join(line for line in lines if line)
        else:
            # Texto plano
            text = response.text
        
        return {
            'filename': url.split('/')[-1] or 'url_document',
            'text': text,
            'url': url
        }
        
    except Exception as e:
        return {
            'filename': 'error',
            'text': f'[ERROR] No se pudo cargar URL: {e}',
            'url': url
        }

def on_load_url_clicked(b):
    url = url_input.value.strip()
    
    with url_output:
        clear_output()
        
        if not url:
            print("‚ö†Ô∏è Por favor ingresa una URL v√°lida")
            return
        
        if not url.startswith(('http://', 'https://')):
            print("‚ö†Ô∏è La URL debe comenzar con http:// o https://")
            return
        
        # Cargar documento
        doc = load_from_url(url)
        
        if '[ERROR]' in doc['text']:
            print(doc['text'])
        else:
            # Agregar a DOCUMENTS y recrear chunks
            global DOCUMENTS, DOCUMENT_CHUNKS
            DOCUMENTS.append(doc)
            
            # Recrear todos los chunks incluyendo el nuevo documento
            DOCUMENT_CHUNKS = create_chunks(DOCUMENTS, chunk_size=1000, chunk_overlap=200)
            
            print(f"‚úÖ Documento cargado exitosamente!")
            print(f"   - Nombre: {doc['filename']}")
            print(f"   - Tama√±o: {len(doc['text'])} caracteres")
            print(f"   - Total chunks actualizados: {len(DOCUMENT_CHUNKS)}")
            print(f"\nüìÑ Vista previa (primeros 500 chars):")
            print(doc['text'][:500] + "...")
            print(f"\n‚ö†Ô∏è IMPORTANTE: Vuelve a ejecutar la celda de Vector Database para re-indexar")

load_url_button.on_click(on_load_url_clicked)

# Mostrar UI
display(widgets.VBox([
    widgets.HTML('<h4>üåê Cargar documento desde URL</h4>'),
    url_input,
    load_url_button,
    url_output
]))

print("üí° Ejemplos de URLs v√°lidas:")
print("   - P√°ginas HTML de leyes o normativas")
print("   - Archivos de texto (.txt) p√∫blicos")
print("   - Documentos en formato web")

VBox(children=(HTML(value='<h4>üåê Cargar documento desde URL</h4>'), Text(value='', description='URL:', layout=‚Ä¶

üí° Ejemplos de URLs v√°lidas:
   - P√°ginas HTML de leyes o normativas
   - Archivos de texto (.txt) p√∫blicos
   - Documentos en formato web


## üìö Loader desde URLs (Opcional)

Esta secci√≥n permite cargar documentos legales desde URLs p√∫blicas.

In [13]:
# ===== CELDA: Tests automatizados (smoke tests) =====

print("üß™ EJECUTANDO TESTS AUTOMATIZADOS")
print("=" * 60)

test_results = []

# Test 1: Verificar carga de documentos
print("\nüìù Test 1: Carga de documentos")
try:
    assert 'DOCUMENTS' in globals(), "Variable DOCUMENTS no existe"
    assert len(DOCUMENTS) > 0, "No se cargaron documentos"
    print(f"   ‚úÖ PASS - {len(DOCUMENTS)} documentos cargados")
    test_results.append(('Carga de documentos', True))
except AssertionError as e:
    print(f"   ‚ùå FAIL - {e}")
    test_results.append(('Carga de documentos', False))

# Test 2: Verificar chunks
print("\nüì¶ Test 2: Creaci√≥n de chunks")
try:
    assert 'DOCUMENT_CHUNKS' in globals(), "Variable DOCUMENT_CHUNKS no existe"
    assert len(DOCUMENT_CHUNKS) > 0, "No se crearon chunks"
    assert all('text' in c and 'source' in c for c in DOCUMENT_CHUNKS[:5]), "Chunks mal formados"
    print(f"   ‚úÖ PASS - {len(DOCUMENT_CHUNKS)} chunks generados correctamente")
    test_results.append(('Creaci√≥n de chunks', True))
except AssertionError as e:
    print(f"   ‚ùå FAIL - {e}")
    test_results.append(('Creaci√≥n de chunks', False))

# Test 3: Verificar embeddings/vectordb
print("\nüî¢ Test 3: Vector Database")
try:
    assert 'vectordb' in globals(), "Variable vectordb no existe"
    if vectordb is not None:
        # Test de b√∫squeda simple
        test_query = "constituci√≥n"
        results = vectordb.similarity_search(test_query, k=2)
        assert len(results) > 0, "Vectordb no devuelve resultados"
        print(f"   ‚úÖ PASS - Vectordb funcional con embeddings")
        test_results.append(('Vector Database', True))
    else:
        print(f"   ‚ö†Ô∏è SKIP - Vectordb es None (usando keywords)")
        test_results.append(('Vector Database', 'SKIP'))
except Exception as e:
    print(f"   ‚ùå FAIL - {e}")
    test_results.append(('Vector Database', False))

# Test 4: Verificar funci√≥n retrieve
print("\nüîç Test 4: Funci√≥n de recuperaci√≥n (retrieve)")
try:
    test_query = "libertad"
    results = retrieve(test_query, k=3)
    assert len(results) > 0, "retrieve() no devuelve resultados"
    assert all('text' in r for r in results), "Resultados mal formados"
    print(f"   ‚úÖ PASS - retrieve() devolvi√≥ {len(results)} documentos")
    test_results.append(('Funci√≥n retrieve', True))
except Exception as e:
    print(f"   ‚ùå FAIL - {e}")
    test_results.append(('Funci√≥n retrieve', False))

# Test 5: Verificar RAG
print("\nü§ñ Test 5: Pipeline RAG completo")
try:
    test_question = "¬øQu√© es la constituci√≥n?"
    result = rag_answer(test_question, k=2)
    assert 'answer' in result, "Respuesta RAG sin campo 'answer'"
    assert 'citations' in result, "Respuesta RAG sin campo 'citations'"
    assert len(result['answer']) > 10, "Respuesta demasiado corta"
    print(f"   ‚úÖ PASS - RAG gener√≥ respuesta v√°lida ({len(result['answer'])} chars)")
    test_results.append(('Pipeline RAG', True))
except Exception as e:
    print(f"   ‚ùå FAIL - {e}")
    test_results.append(('Pipeline RAG', False))

# Test 6: Verificar LLM
print("\nüí¨ Test 6: Conexi√≥n con LLM")
try:
    test_prompt = "Responde con una sola palabra: OK"
    response = llm_call(test_prompt)
    assert len(response) > 0, "LLM no devolvi√≥ respuesta"
    assert not response.startswith('[ERROR'), "Error al llamar LLM"
    print(f"   ‚úÖ PASS - LLM respondi√≥ correctamente")
    test_results.append(('Conexi√≥n LLM', True))
except Exception as e:
    print(f"   ‚ùå FAIL - {e}")
    test_results.append(('Conexi√≥n LLM', False))

# Test 7: Verificar agente
print("\nüé≠ Test 7: Agente ReAct")
try:
    assert 'agent' in globals(), "Variable agent no existe"
    # Test simple sin ejecutar (para no gastar tokens)
    assert agent is not None, "Agente no inicializado"
    assert hasattr(agent, 'run'), "Agente sin m√©todo run()"
    print(f"   ‚úÖ PASS - Agente ReAct inicializado correctamente")
    test_results.append(('Agente ReAct', True))
except Exception as e:
    print(f"   ‚ùå FAIL - {e}")
    test_results.append(('Agente ReAct', False))

# Test 8: Verificar memoria
print("\nüß† Test 8: Sistema de memoria")
try:
    assert 'memory' in globals(), "Variable memory no existe"
    assert memory is not None, "Memoria no inicializada"
    # Verificar que puede cargar/guardar
    memory.save_context({"input": "test"}, {"output": "test"})
    history = memory.load_memory_variables({})
    assert 'history' in history, "Memoria no tiene campo history"
    print(f"   ‚úÖ PASS - Sistema de memoria funcional")
    test_results.append(('Sistema de memoria', True))
except Exception as e:
    print(f"   ‚ùå FAIL - {e}")
    test_results.append(('Sistema de memoria', False))

# Resumen final
print("\n" + "=" * 60)
print("üìä RESUMEN DE TESTS")
print("=" * 60)

passed = sum(1 for _, result in test_results if result is True)
failed = sum(1 for _, result in test_results if result is False)
skipped = sum(1 for _, result in test_results if result == 'SKIP')
total = len(test_results)

for test_name, result in test_results:
    symbol = "‚úÖ" if result is True else ("‚ö†Ô∏è" if result == 'SKIP' else "‚ùå")
    status = "PASS" if result is True else ("SKIP" if result == 'SKIP' else "FAIL")
    print(f"{symbol} {test_name}: {status}")

print("\n" + "=" * 60)
print(f"Total: {passed}/{total} tests pasados")
if skipped > 0:
    print(f"Saltados: {skipped}")
if failed > 0:
    print(f"‚ö†Ô∏è Fallidos: {failed} - Revisar errores arriba")
else:
    print("üéâ ¬°Todos los tests pasaron exitosamente!")
print("=" * 60)

üß™ EJECUTANDO TESTS AUTOMATIZADOS

üìù Test 1: Carga de documentos
   ‚úÖ PASS - 1 documentos cargados

üì¶ Test 2: Creaci√≥n de chunks
   ‚úÖ PASS - 165 chunks generados correctamente

üî¢ Test 3: Vector Database
   ‚úÖ PASS - Vectordb funcional con embeddings

üîç Test 4: Funci√≥n de recuperaci√≥n (retrieve)
   ‚úÖ PASS - Vectordb funcional con embeddings

üîç Test 4: Funci√≥n de recuperaci√≥n (retrieve)
   ‚úÖ PASS - retrieve() devolvi√≥ 3 documentos

ü§ñ Test 5: Pipeline RAG completo
   ‚úÖ PASS - retrieve() devolvi√≥ 3 documentos

ü§ñ Test 5: Pipeline RAG completo
   ‚úÖ PASS - RAG gener√≥ respuesta v√°lida (266 chars)

üí¨ Test 6: Conexi√≥n con LLM
   ‚úÖ PASS - RAG gener√≥ respuesta v√°lida (266 chars)

üí¨ Test 6: Conexi√≥n con LLM
   ‚úÖ PASS - LLM respondi√≥ correctamente

üé≠ Test 7: Agente ReAct
   ‚úÖ PASS - Agente ReAct inicializado correctamente

üß† Test 8: Sistema de memoria
   ‚úÖ PASS - Sistema de memoria funcional

üìä RESUMEN DE TESTS
‚úÖ Carga de doc

## Tests Automatizados (Smoke Tests)

Esta secci√≥n ejecuta pruebas r√°pidas para verificar que todos los componentes funcionan correctamente.

In [20]:
# ===== CELDA: Interfaz completa con widgets =====
import ipywidgets as widgets
from IPython.display import display, clear_output, HTML
import time
import os
import textwrap
from langchain.memory import ConversationBufferMemory
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain
from langchain.memory import ConversationBufferMemory
from langchain.prompts import PromptTemplate
from langchain.chains import LLMChain

# ===== INICIALIZAR MEMORIA CONVERSACIONAL =====
# Memoria para mantener contexto entre preguntas
conversation_memory = ConversationBufferMemory(memory_key="history")

# Prompt template que incluye historial para respuestas con memoria
memory_prompt = PromptTemplate(
    input_variables=["history", "question"],
    template="""Eres un asistente legal especializado en derecho colombiano y normativo. Responde SIEMPRE en espa√±ol de forma CONCISA y PROFESIONAL.

INSTRUCCIONES ESPEC√çFICAS PARA TEMAS LEGALES:
- S√© breve pero completo en explicaciones jur√≠dicas
- Usa terminolog√≠a jur√≠dica precisa y actual
- Cita art√≠culos constitucionales, leyes o normas cuando aplique
- Mant√©n objetividad y neutralidad jur√≠dica
- Si no tienes informaci√≥n espec√≠fica, adm√≠telo claramente
- Prioriza respuestas basadas en derecho colombiano

Historial de conversaci√≥n:
{history}

Pregunta actual: {question}

Respuesta jur√≠dica:"""
)

# Chain con memoria para respuestas directas del LLM
llm_memory_chain = LLMChain(
    llm=llm,
    prompt=memory_prompt,
    memory=conversation_memory,
)

# Historial de conversaci√≥n (para mostrar en UI)
conversation_history = []

question_input = widgets.Textarea(
    value='',
    placeholder='Escribe tu pregunta legal aqu√≠... Ejemplo: ¬øQu√© art√≠culo protege la libertad de expresi√≥n?',
    description='Pregunta:',
    layout=widgets.Layout(width='95%', height='80px'),
    style={'description_width': '80px'}
)

submit_button = widgets.Button(
    description='üîç Consultar',
    button_style='primary',
    tooltip='Enviar pregunta al asistente',
    layout=widgets.Layout(width='200px', height='40px')
)

clear_button = widgets.Button(
    description='üóëÔ∏è Limpiar',
    button_style='warning',
    tooltip='Limpiar conversaci√≥n',
    layout=widgets.Layout(width='150px', height='40px')
)

# 2. Dropdown para selecci√≥n de modo
mode_dropdown = widgets.Dropdown(
    options=[
        ('Agente Autom√°tico (ReAct)', 'agent'),
        ('Solo RAG (b√∫squeda directa)', 'rag'),
        ('Solo LLM (sin documentos)', 'llm')
    ],
    value='agent',
    description='Modo:',
    style={'description_width': '80px'},
    layout=widgets.Layout(width='400px')
)

# 3. Checkbox para debug
debug_checkbox = widgets.Checkbox(
    value=False,
    description='Mostrar detalles t√©cnicos (debug)',
    indent=False,
    layout=widgets.Layout(width='300px')
)

# 4. Output areas
output_area = widgets.Output(layout=widgets.Layout(
    border='1px solid #ddd',
    padding='15px',
    margin='10px 0',
    max_height='500px',
    overflow='auto'
))

debug_area = widgets.Output(layout=widgets.Layout(
    border='1px solid #ffa500',
    padding='10px',
    margin='10px 0',
    max_height='300px',
    overflow='auto'
))

# 5. Status indicator
status_label = widgets.HTML(
    value='<span style="color: green;">‚úì Sistema listo</span>',
    layout=widgets.Layout(margin='10px 0')
)

# 6. Stats widget
stats_html = widgets.HTML(
    value=f'''
    <div style="background: #f0f0f0; padding: 10px; border-radius: 5px;">
        <b>üìä Estad√≠sticas del Sistema:</b><br>
        ‚Ä¢ Documentos cargados: {len(DOCUMENTS) if 'DOCUMENTS' in globals() else 0}<br>
        ‚Ä¢ Chunks indexados: {len(DOCUMENT_CHUNKS) if 'DOCUMENT_CHUNKS' in globals() else 0}<br>
        ‚Ä¢ Modo vectordb: {'‚úÖ Activo' if 'vectordb' in globals() and vectordb else '‚ö†Ô∏è Desactivado (keywords)'}<br>
        ‚Ä¢ Memoria conversacional: ‚úÖ Activa<br>
        ‚Ä¢ Proveedor LLM: {os.getenv('LLM_PROVIDER', 'groq').upper()}
    </div>
    ''',
    layout=widgets.Layout(margin='10px 0')
)

# Funci√≥n para formatear respuestas con HTML
def format_response(answer, citations=None, elapsed_time=None):
    html = f'<div style="background: #e8f4f8; padding: 15px; border-radius: 5px; margin: 10px 0;">'
    html += f'<p style="margin: 0; line-height: 1.6;">{answer}</p>'
    
    if citations and len(citations) > 0:
        html += '<hr style="margin: 10px 0;">'
        html += '<p style="margin: 5px 0; font-size: 0.9em;"><b>üìé Referencias:</b></p>'
        html += '<ul style="margin: 5px 0; font-size: 0.85em;">'
        for cit in citations[:3]:  # M√°ximo 3 citas
            source = cit.get('source', 'unknown')
            chunk = cit.get('chunk_index', '?')
            score = cit.get('score')
            score_str = f' (score: {score:.3f})' if score else ''
            html += f'<li>{source} - Fragmento #{chunk}{score_str}</li>'
        html += '</ul>'
    
    if elapsed_time:
        html += f'<p style="margin-top: 10px; font-size: 0.8em; color: #666;">‚è±Ô∏è Tiempo: {elapsed_time:.2f}s</p>'
    
    html += '</div>'
    return html

# ===== FUNCIONES CON MEMORIA CONVERSACIONAL =====

def agent_with_memory(question: str) -> str:
    """Ejecuta el agente con memoria conversacional."""
    try:
        # Crear prompt con historial para el agente
        history = conversation_memory.load_memory_variables({})["history"]
        enhanced_prompt = f"""Eres un asistente legal especializado en derecho colombiano con memoria conversacional. Responde SIEMPRE en espa√±ol.

INSTRUCCIONES PARA AGENTE LEGAL:
- S√© CONCISO pero completo en respuestas jur√≠dicas
- Usa terminolog√≠a jur√≠dica precisa colombiana
- Considera el contexto de la conversaci√≥n anterior
- Prioriza el uso de herramientas especializadas para temas legales espec√≠ficos
- Mant√©n objetividad jur√≠dica profesional

Historial de conversaci√≥n:
{history}

Pregunta actual: {question}

Como agente legal, razona paso a paso y usa las herramientas apropiadas:"""
        
        # Ejecutar agente con prompt mejorado
        result = agent.invoke({"input": enhanced_prompt})
        answer = result.get('output', result.get('result', str(result)))
        
        # Guardar en memoria
        conversation_memory.save_context({"input": question}, {"output": answer})
        
        return answer
    except Exception as e:
        return f"Error en agente con memoria: {e}"

def rag_with_memory(question: str, k: int = 4) -> dict:
    """Ejecuta RAG con memoria conversacional."""
    try:
        # Obtener historial
        history = conversation_memory.load_memory_variables({})["history"]
        
        # Crear prompt que incluye historial
        context_prompt = f"""Eres un asistente legal especializado en derecho colombiano. Responde √öNICAMENTE en espa√±ol y bas√°ndote en el contexto proporcionado.

INSTRUCCIONES JUR√çDICAS CON MEMORIA:
- S√© CONCISO pero completo en explicaciones legales
- Usa terminolog√≠a jur√≠dica colombiana precisa
- Considera el historial de conversaci√≥n para contextualizar la respuesta
- Cita art√≠culos, leyes o normas espec√≠ficas del contexto
- Si el contexto no tiene informaci√≥n relevante, adm√≠telo claramente
- Mant√©n objetividad jur√≠dica profesional

Historial de conversaci√≥n:
{history}

Pregunta actual: {question}

Respuesta jur√≠dica basada √∫nicamente en el contexto de documentos:"""
        
        # Obtener documentos relevantes
        docs = retrieve(question, k)
        if not docs:
            answer = "No se encontraron documentos relevantes."
            citations = []
        else:
            ctx_parts = []
            citations = []
            for d in docs:
                text = d.get('text') if isinstance(d, dict) else str(d)
                meta = d.get('metadata', {}) if isinstance(d, dict) else {}
                src = meta.get('source', meta.get('filename', 'unknown'))
                idx = meta.get('chunk_index')
                score = d.get('score')
                citations.append({'source': src, 'chunk_index': idx, 'score': score})
                snippet = textwrap.shorten(text, width=800, placeholder='...')
                ctx_parts.append(f"[{src}, chunk {idx}]\n{snippet}")
            
            context = "\n\n".join(ctx_parts)
            final_prompt = context_prompt + f"\n\nContexto de documentos:\n{context}"
            
            answer = llm_call(final_prompt)
        
        # Guardar en memoria
        conversation_memory.save_context({"input": question}, {"output": answer})
        
        return {'answer': answer, 'citations': citations}
    except Exception as e:
        return {'answer': f"Error en RAG con memoria: {e}", 'citations': []}

def llm_with_memory(question: str) -> str:
    """Responde con LLM directo usando memoria conversacional."""
    try:
        # Usar el chain con memoria ya configurado
        response = llm_memory_chain.run(question)
        return response
    except Exception as e:
        return f"Error en LLM con memoria: {e}"

# Callback principal para procesar preguntas
def on_submit_clicked(b):
    question = question_input.value.strip()
    
    if not question:
        with output_area:
            clear_output()
            display(HTML('<p style="color: orange;">‚ö†Ô∏è Por favor escribe una pregunta.</p>'))
        return
    
    # Actualizar status
    status_label.value = '<span style="color: orange;">‚è≥ Procesando...</span>'
    
    with output_area:
        clear_output()
        display(HTML(f'<div style="background: #fff3cd; padding: 10px; border-radius: 5px;"><b>‚ùì Tu pregunta:</b> {question}</div>'))
    
    # Limpiar debug area
    if debug_checkbox.value:
        with debug_area:
            clear_output()
            print("üîß MODO DEBUG ACTIVADO\n")
            print(f"Modo seleccionado: {mode_dropdown.value}")
            print(f"Pregunta: {question}\n")
    
    try:
        start_time = time.time()
        mode = mode_dropdown.value
        
        # Procesar seg√∫n el modo (CON MEMORIA CONVERSACIONAL)
        if mode == 'agent':
            if debug_checkbox.value:
                with debug_area:
                    print("Ejecutando agente ReAct con memoria conversacional...\n")
            answer = agent_with_memory(question)
            citations = []
            
        elif mode == 'rag':
            if debug_checkbox.value:
                with debug_area:
                    print("Ejecutando RAG con memoria conversacional...\n")
            rag_result = rag_with_memory(question, k=4)
            answer = rag_result.get('answer', 'No se obtuvo respuesta')
            citations = rag_result.get('citations', [])
            
            if debug_checkbox.value:
                with debug_area:
                    print(f"Documentos recuperados: {len(citations)}")
                    for i, cit in enumerate(citations[:3], 1):
                        print(f"  {i}. {cit.get('source')} (chunk {cit.get('chunk_index')})")
            
        else:  # llm mode
            if debug_checkbox.value:
                with debug_area:
                    print("Ejecutando LLM con memoria conversacional...\n")
            answer = llm_with_memory(question)
            citations = []
        
        elapsed = time.time() - start_time
        
        # Guardar en historial
        conversation_history.append({
            'question': question,
            'answer': answer,
            'mode': mode,
            'timestamp': time.time()
        })
        
        # Mostrar respuesta
        with output_area:
            display(HTML(format_response(answer, citations, elapsed)))
        
        # Status
        status_label.value = f'<span style="color: green;">‚úì Respuesta generada ({elapsed:.2f}s)</span>'
        
        # Limpiar input
        question_input.value = ''
        
    except Exception as e:
        with output_area:
            display(HTML(f'<p style="color: red;">‚ùå Error: {str(e)}</p>'))
        status_label.value = '<span style="color: red;">‚úó Error en el procesamiento</span>'
        
        if debug_checkbox.value:
            with debug_area:
                import traceback
                print("TRACEBACK COMPLETO:")
                print(traceback.format_exc())

def on_clear_clicked(b):
    # Limpiar memoria conversacional
    conversation_memory.clear()
    # Limpiar historial local
    conversation_history.clear()
    question_input.value = ''
    with output_area:
        clear_output()
        display(HTML('<p style="color: gray;">üß† Memoria conversacional y conversaci√≥n limpiadas. Escribe una nueva pregunta.</p>'))
    with debug_area:
        clear_output()
    status_label.value = '<span style="color: green;">‚úì Sistema listo</span>'

# Conectar callbacks
submit_button.on_click(on_submit_clicked)
clear_button.on_click(on_clear_clicked)

# Layout final
ui_container = widgets.VBox([
    widgets.HTML('<h2 style="color: #2c3e50;">üèõÔ∏è Asistente Legal Colombiano</h2>'),
    stats_html,
    widgets.HBox([mode_dropdown, debug_checkbox]),
    question_input,
    widgets.HBox([submit_button, clear_button]),
    status_label,
    output_area,
    debug_area
], layout=widgets.Layout(padding='20px'))

# Mostrar UI
display(ui_container)

VBox(children=(HTML(value='<h2 style="color: #2c3e50;">üèõÔ∏è Asistente Legal Colombiano</h2>'), HTML(value='\n   ‚Ä¶

## üé® Interfaz de Usuario Interactiva

Esta secci√≥n implementa una UI completa con widgets de Jupyter para interactuar con el asistente legal de forma intuitiva.