# Notebook 2: Chatbot Eureka con Graph RAG

**Objetivo:** Cargar el grafo y la base de datos vectorial para ejecutar un chatbot que aprovecha las relaciones entre documentos.

## Celda 1: Crear Archivo de la Aplicación Streamlit

In [None]:
%%writefile app_chatbot.py
import streamlit as st
import time
from datetime import datetime
from pathlib import Path
import logging
from typing import Optional, Dict, List
from dataclasses import dataclass
import networkx as nx

from langchain_ollama.embeddings import OllamaEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_ollama.chat_models import ChatOllama
from langchain.prompts import PromptTemplate

from prompts import EUREKA_PROMPT_TEMPLATE

logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
logger = logging.getLogger(__name__)

@dataclass
class EurekaConfig:
    embedding_model: str = "mxbai-embed-large"
    llm_model: str = "llama3.2"
    chroma_path: str = "./chroma_graph_db"
    graph_path: str = "./knowledge_graph.gml"
    temperature: float = 0.1

class EurekaGraphChatbot:
    def __init__(self, config: EurekaConfig):
        self.config = config
        self.vectorstore = None
        self.graph = None
        self.llm = ChatOllama(model=config.llm_model, temperature=config.temperature)
        self.prompt = PromptTemplate(template=EUREKA_PROMPT_TEMPLATE, input_variables=["context", "question"])

    def initialize(self):
        if not (Path(self.config.chroma_path).exists() and Path(self.config.graph_path).exists()):
            raise FileNotFoundError("Base de datos no encontrada. Ejecuta '1_build_graph_database.ipynb' primero.")
        
        embeddings = OllamaEmbeddings(model=self.config.embedding_model)
        self.vectorstore = Chroma(persist_directory=self.config.chroma_path, embedding_function=embeddings)
        self.graph = nx.read_gml(self.config.graph_path)
        logger.info("✅ Base de datos vectorial y grafo de conocimiento cargados.")

    def get_graph_context(self, doc_id: str) -> str:
        if doc_id not in self.graph:
            return ""
        
        node_data = self.graph.nodes[doc_id]
        context_parts = [f"**Documento Principal:** {node_data.get('title', 'N/A')}\n**Resumen:** {node_data.get('summary', 'N/A')}"]
        
        neighbors = list(self.graph.neighbors(doc_id))
        if neighbors:
            concordancias = [n for n in neighbors if self.graph.nodes[n].get('type') == 'Normativa']
            if concordancias:
                context_parts.append(f"\n**Normativas Relacionadas (Concordancias):**\n- " + "\n- ".join(concordancias[:5]))
        
        return "\n".join(context_parts)

    def query(self, question: str) -> Dict:
        if not self.vectorstore or not self.graph:
            raise ValueError("Sistema no inicializado.")

        # 1. Búsqueda vectorial para encontrar el punto de entrada al grafo
        results = self.vectorstore.similarity_search(question, k=1)
        if not results:
            return {"answer": "No encontré información relevante.", "input_tokens": 0, "output_tokens": 0}

        entry_doc_id = results[0].metadata['doc_id']

        # 2. Usar el grafo para enriquecer el contexto
        graph_context = self.get_graph_context(entry_doc_id)

        # 3. Generar respuesta con el LLM
        prompt_formatted = self.prompt.format(context=graph_context, question=question)
        response_obj = self.llm.invoke(prompt_formatted)
        answer = response_obj.content
        metadata = response_obj.response_metadata

        return {
            "answer": answer,
            "input_tokens": metadata.get('prompt_eval_count', 0),
            "output_tokens": metadata.get('eval_count', 0)
        }

# --- Aplicación Streamlit ---

st.set_page_config(page_title="Eureka Graph RAG", page_icon="🌿", layout="wide")

@st.cache_resource
def initialize_chatbot():
    try:
        config = EurekaConfig()
        chatbot = EurekaGraphChatbot(config)
        chatbot.initialize()
        return chatbot
    except FileNotFoundError as e:
        st.error(f"🚨 Error Crítico: {e}")
        return None

eureka_chatbot = initialize_chatbot()

# ... [El resto de la UI de Streamlit es idéntica a la versión anterior] ...
# ... Header, Sidebar, Métricas, Chat loop ...
col1, col2 = st.columns([1, 4])
with col1: st.image("https://www.anla.gov.co/images/logo-anla.png", width=120)
with col2: 
    st.title("🌿 Eureka: Asistente con Grafo de Conocimiento")
    st.markdown("**Ahora con entendimiento de relaciones entre documentos**")

with st.sidebar:
    st.header("ℹ️ Sobre Eureka (Graph RAG)")
    # ... (resto de la UI sin cambios)
    st.info("Soy tu asistente para facilitar el acceso a información sobre licenciamiento y participación ciudadana. ¡Pregúntame!")
    st.header("📊 Estadísticas de Sesión")
    if 'log' in st.session_state and st.session_state.log:
        # Código de métricas...
    else:
        st.write("Aún no hay interacciones.")

if not eureka_chatbot:
    st.stop()

if "messages" not in st.session_state: st.session_state.messages = [{"role": "assistant", "content": "¡Hola! Soy Eureka, ahora con un grafo de conocimiento para darte respuestas más completas. ¿En qué te puedo ayudar?"}]
for message in st.session_state.messages: 
    with st.chat_message(message["role"]): st.markdown(message["content"])

if prompt := st.chat_input("Escribe tu consulta aquí..."):
    st.session_state.messages.append({"role": "user", "content": prompt})
    with st.chat_message("user"): st.markdown(prompt)

    with st.chat_message("assistant"):
        with st.spinner("Consultando el grafo de conocimiento..."):
            start_time = time.time()
            result = eureka_chatbot.query(prompt)
            response_time = time.time() - start_time
            # log_interaction(prompt, result, response_time)
            response = result["answer"]
            st.markdown(response)

    st.session_state.messages.append({"role": "assistant", "content": response})
    st.rerun()


## Celda 2: Instrucciones de Ejecución

In [None]:
!echo "Para iniciar, ejecuta en tu terminal: streamlit run app_chatbot.py"