# TUIA NLP 2025 - TP Final


## Descarga de Datos

In [1]:
!pip install -q gdown
import gdown
import zipfile
import os

file_id = '12HdLgCWfh2JlLVf_LnAVWWA3hrqut9mi'
output = 'Datos.zip'

# Descargo la carpeta de datos comprimida como .zip
gdown.download(f'https://drive.google.com/uc?id={file_id}', output, quiet=False)

# Descomprimir
with zipfile.ZipFile(output, 'r') as zip_ref:
    zip_ref.extractall('/content')  # Carpeta destino

Downloading...
From: https://drive.google.com/uc?id=12HdLgCWfh2JlLVf_LnAVWWA3hrqut9mi
To: /content/Datos.zip
100%|██████████| 182k/182k [00:00<00:00, 41.6MB/s]


Token: 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

In [9]:
!pip install -q langchain-community
!pip install -q py2neo
!pip install -U duckduckgo-search
!pip install wikipedia
!pip install -qU langchain-community faiss-cpu
!pip install -q transformers torch
!pip install openai langchain



## Bibliotecas

In [3]:
import pandas as pd
import numpy as np
import os
import json
import sqlite3
from typing import List, Dict, Any, Optional
import warnings
import requests
warnings.filterwarnings('ignore')

# Bibliotecas para embeddings y vectores
from sentence_transformers import SentenceTransformer
import faiss
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

# Bibliotecas para LLM
import openai
from transformers import pipeline, AutoTokenizer, AutoModelForSequenceClassification

# Bibliotecas para grafos
import networkx as nx
from py2neo import Graph, Node, Relationship

# Bibliotecas para agente
from langchain.agents import Tool, AgentExecutor, create_react_agent
from langchain.prompts import PromptTemplate
from langchain.memory import ConversationBufferMemory
from langchain.tools import DuckDuckGoSearchRun, WikipediaQueryRun
from langchain.utilities import WikipediaAPIWrapper


## Ejercicio 1: Sistema RAG

In [4]:
class TinyTownsRAG:
  """Sistema RAG para Tiny Towns"""

  def __init__(self, data_path: str = "/content/Datos"):
      self.data_path = data_path
      self.embedding_model = None
      self.vector_db = None
      self.text_chunks = []
      self.df_estadisticas = None
      self.graph_db = None
      self.intent_classifier = None

      # Inicializar componentes
      self._load_data()
      self._setup_embedding_model()
      self._create_vector_database()
      self._setup_statistics_interface()
      self._setup_graph_database()
      self._setup_intent_classifier()

  def _load_data(self):
      """Cargar todos los datos del TP1"""
      print("Cargando datos...")

      # Cargar datos de información (textos)
      self.info_texts = {}
      info_path = os.path.join(self.data_path, "Información")
      for file in os.listdir(info_path):
          if file.endswith('.txt'):
              with open(os.path.join(info_path, file), 'r', encoding='utf-8') as f:
                  self.info_texts[file] = f.read()
          elif file.endswith('.csv'):
              df = pd.read_csv(os.path.join(info_path, file))
              self.info_texts[file] = df.to_string()

      # Cargar estadísticas
      stats_path = os.path.join(self.data_path, "Estadísticas")
      self.df_reseñas = pd.read_csv(os.path.join(stats_path, "reseñas_Tiny_Towns.csv"))
      self.df_boardgame = pd.read_csv(os.path.join(stats_path, "boardgame_data.csv"))
      self.df_credits = pd.read_csv(os.path.join(stats_path, "credits.csv"))

      # Cargar relaciones
      relations_path = os.path.join(self.data_path, "Relaciones")
      self.df_relaciones = pd.read_csv(os.path.join(relations_path, "creditos_relaciones.csv"))

      print("Datos cargados exitosamente")

  def _setup_embedding_model(self):
      """Configurar modelo de embeddings"""
      print("Configurando modelo de embeddings...")
      # Usando sentence-transformers con modelo multilingüe
      self.embedding_model = SentenceTransformer('paraphrase-multilingual-MiniLM-L12-v2')
      print("Modelo de embeddings configurado")

  def _create_text_chunks(self, text: str, chunk_size: int = 500, overlap: int = 50) -> List[str]:
      """Fragmentar texto con overlapping"""
      words = text.split()
      chunks = []

      for i in range(0, len(words), chunk_size - overlap):
          chunk = ' '.join(words[i:i + chunk_size])
          chunks.append(chunk)

      return chunks

  def _create_vector_database(self):
      """Crear base de datos vectorial con FAISS"""
      print("Creando base de datos vectorial...")

      # Fragmentar todos los textos
      all_chunks = []
      chunk_metadata = []

      for filename, text in self.info_texts.items():
          chunks = self._create_text_chunks(text)
          all_chunks.extend(chunks)
          chunk_metadata.extend([{"source": filename, "chunk_id": i} for i in range(len(chunks))])

      self.text_chunks = all_chunks
      self.chunk_metadata = chunk_metadata

      # Crear embeddings
      embeddings = self.embedding_model.encode(all_chunks)

      # Crear índice FAISS
      dimension = embeddings.shape[1]
      self.vector_db = faiss.IndexFlatIP(dimension)  # Inner Product para cosine similarity

      # Normalizar embeddings para cosine similarity
      faiss.normalize_L2(embeddings)
      self.vector_db.add(embeddings.astype('float32'))

      # Configurar TF-IDF para búsqueda híbrida
      self.tfidf_vectorizer = TfidfVectorizer(max_features=1000, stop_words='english')
      self.tfidf_matrix = self.tfidf_vectorizer.fit_transform(all_chunks)

      print(f"Base de datos vectorial creada con {len(all_chunks)} chunks")

  def semantic_search(self, query: str, k: int = 5) -> List[Dict]:
      """Búsqueda semántica en la base de datos vectorial"""
      # Embedding de la consulta
      query_embedding = self.embedding_model.encode([query])
      faiss.normalize_L2(query_embedding)

      # Búsqueda en FAISS
      scores, indices = self.vector_db.search(query_embedding.astype('float32'), k)

      results = []
      for i, idx in enumerate(indices[0]):
          results.append({
              "text": self.text_chunks[idx],
              "score": float(scores[0][i]),
              "metadata": self.chunk_metadata[idx]
          })

      return results

  def hybrid_search(self, query: str, k: int = 5, alpha: float = 0.7) -> List[Dict]:
      """Búsqueda híbrida: semántica + BM25/TF-IDF"""
      # Búsqueda semántica
      semantic_results = self.semantic_search(query, k * 2)

      # Búsqueda por palabras clave (TF-IDF)
      query_tfidf = self.tfidf_vectorizer.transform([query])
      tfidf_scores = cosine_similarity(query_tfidf, self.tfidf_matrix).flatten()

      # Combinar scores
      final_scores = {}

      # Agregar scores semánticos
      for result in semantic_results:
          idx = self.text_chunks.index(result["text"])
          final_scores[idx] = alpha * result["score"]

      # Agregar scores TF-IDF
      for idx, score in enumerate(tfidf_scores):
          if idx in final_scores:
              final_scores[idx] += (1 - alpha) * score
          else:
              final_scores[idx] = (1 - alpha) * score

      # Ordenar y retornar top k
      sorted_indices = sorted(final_scores.keys(), key=lambda x: final_scores[x], reverse=True)[:k]

      results = []
      for idx in sorted_indices:
          results.append({
              "text": self.text_chunks[idx],
              "score": final_scores[idx],
              "metadata": self.chunk_metadata[idx]
          })

      return results

  def rerank_results(self, query: str, results: List[Dict]) -> List[Dict]:
      """Re-ranking de resultados usando cross-encoder"""
      # Implementación usando similarity
      texts = [result["text"] for result in results]
      query_embedding = self.embedding_model.encode([query])
      text_embeddings = self.embedding_model.encode(texts)

      similarities = cosine_similarity(query_embedding, text_embeddings).flatten()

      # Actualizar scores con re-ranking
      for i, result in enumerate(results):
          result["rerank_score"] = similarities[i]

      # Ordenar por nuevo score
      results.sort(key=lambda x: x["rerank_score"], reverse=True)
      return results

  def _setup_statistics_interface(self):
      """Configurar interfaz para datos estadísticos"""
      print("Configurando interfaz estadística...")

      # Analizar estadísticas de los datasets
      self.stats_info = {
          "reseñas": {
              "columns": list(self.df_reseñas.columns),
              "categorical": [],
              "numerical": [],
              "unique_values": {}
          },
          "boardgame": {
              "columns": list(self.df_boardgame.columns),
              "categorical": [],
              "numerical": [],
              "unique_values": {}
          }
      }

      # Analizar tipos de datos
      for dataset_name, df in [("reseñas", self.df_reseñas), ("boardgame", self.df_boardgame)]:
          for col in df.columns:
              if df[col].dtype in ['object', 'string']:
                  self.stats_info[dataset_name]["categorical"].append(col)
                  unique_vals = df[col].unique()[:10]  # Primeros 10 valores únicos
                  self.stats_info[dataset_name]["unique_values"][col] = list(unique_vals)
              else:
                  self.stats_info[dataset_name]["numerical"].append(col)
                  self.stats_info[dataset_name]["unique_values"][col] = {
                      "min": float(df[col].min()),
                      "max": float(df[col].max()),
                      "mean": float(df[col].mean())
                  }

      print("Interfaz estadística configurada")

  def generate_sql_filter(self, query: str, dataset: str = "reseñas") -> str:
      """Generar filtro Pandas usando LLM de Hugging Face"""
      import requests

      api_key = "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"
      api_url = "https://openrouter.ai/api/v1/chat/completions"
      headers = {
                "Authorization": f"Bearer {api_key}",
                "Content-Type": "application/json",
                "HTTP-Referer": "http://localhost",  # poner tu URL si tienes una app
                "X-Title": "MiApp"
            }

      dataset_info = self.stats_info.get(dataset, {})
      # Prompt
      prompt = (
          f"Columnas: {dataset_info.get('columns', [])}\n"
          f"Consulta del usuario: \"{query}\"\n"
      )

      # Estructura de chat para el modelo
      chat_prompt = [
          {"role": "system", "content": ""},
          {"role": "user", "content": prompt}
      ]
      # Unimos los mensajes en un solo string para el modelo Zephyr
      prompt_with_template = ""
      for msg in chat_prompt:
          role = msg["role"]
          prompt_with_template += f"<|{role}|>{msg['content']}</s>\n"
      prompt_with_template += "<|assistant|>\n"

      data = {
            "model": "mistralai/mistral-small-3.2-24b-instruct:free",
            "messages": [
                {"role": "system", "content": "Sos un asistente que responde brevemente"},
                {"role": "user", "content": "¿Qué es el clustering jerárquico?"}
            ],
            "max_tokens": 100
        }

      try:
          response = requests.post(api_url, headers=headers, json=data, timeout=30)
          response.raise_for_status()
          result = response.json()
          generated = result[0]['generated_text'].strip().split('\n')[0]
          return generated
      except Exception as e:
          print(f"Error llamando al LLM: {e}")
          return "df"  # Fallback seguro

  def query_statistics(self, query: str, dataset: str = "reseñas") -> Dict:
      """Consultar datos estadísticos"""
      # Generar filtro con LLM
      filter_code = self.generate_sql_filter(query, dataset)

      # Aplicar filtro
      try:
          df = self.df_reseñas if dataset == "reseñas" else self.df_boardgame
          filtered_df = eval(filter_code)

          return {
              "success": True,
              "data": filtered_df.head(10).to_dict('records'),
              "count": len(filtered_df),
              "filter_used": filter_code
          }
      except Exception as e:
          return {
              "success": False,
              "error": str(e),
              "filter_used": filter_code
          }

  def _setup_graph_database(self):
    """Configurar base de datos de grafos con Neo4j"""
    print("Configurando base de datos de grafos...")

    try:
        from py2neo import Graph
        self.graph_db = Graph("bolt://localhost:7687", auth=("neo4j", "password"))  # Cambia el password si es necesario

        # Limpiar datos existentes
        self.graph_db.run("MATCH (n) DETACH DELETE n")

        # Importar datos desde el dataframe
        for _, row in self.df_relaciones.iterrows():
            source = str(row['Sujeto'])
            target = str(row['Objeto'])
            rel_type = str(row['Relación']).replace(" ", "_").upper()  # Cypher no permite espacios en el tipo de relación

            # Crear nodos y relación
            self.graph_db.run(
                f"MERGE (a:Entity {{name: $source}}) "
                f"MERGE (b:Entity {{name: $target}}) "
                f"MERGE (a)-[r:{rel_type}]->(b)",
                source=source, target=target
            )

        print(f"Grafo Neo4j creado con {len(self.df_relaciones)} relaciones")
    except Exception as e:
        print(f"Error configurando Neo4j: {str(e)}")

  def generate_cypher_query(self, query: str) -> str:
    """Generar consulta Cypher usando LLM de Hugging Face"""
    import requests

    api_key = "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"
    api_url = "https://openrouter.ai/api/v1/chat/completions"
    headers = {
              "Authorization": f"Bearer {api_key}",
              "Content-Type": "application/json",
              "HTTP-Referer": "http://localhost",  # poner tu URL si tienes una app
              "X-Title": "MiApp"
          }

    # Extrae relaciones únicas para ayudar al LLM
    relaciones = list(self.df_relaciones['Relación'].unique())
    prompt = (
        "Eres un experto en grafos y Cypher para Neo4j.\n"
        "El grafo tiene nodos con el atributo 'name' y relaciones de tipo:\n"
        f"{', '.join(relaciones)}\n"
        f"Convierte la siguiente consulta en lenguaje natural a una consulta Cypher.\n"
        f"Consulta: \"{query}\"\n"
        "Devuelve solo la consulta Cypher, sin explicaciones ni comentarios."
    )

    chat_prompt = [
        {"role": "system", "content": "Eres un experto en Cypher y grafos. Devuelve solo la consulta Cypher para la consulta dada."},
        {"role": "user", "content": prompt}
    ]
    prompt_with_template = ""
    for msg in chat_prompt:
        role = msg["role"]
        prompt_with_template += f"<|{role}|>{msg['content']}</s>\n"
    prompt_with_template += "<|assistant|>\n"

    data = {
            "model": "mistralai/mistral-small-3.2-24b-instruct:free",
            "messages": [
                {"role": "system", "content": "Sos un asistente que responde brevemente"},
                {"role": "user", "content": "¿Qué es el clustering jerárquico?"}
            ],
            "max_tokens": 100
        }

    try:
        response = requests.post(api_url, headers=headers, json=data, timeout=30)
        response.raise_for_status()
        result = response.json()
        generated = result[0]['generated_text'].strip().split('\n')[0]
        return generated
    except Exception as e:
        print(f"Error llamando al LLM: {e}")
        return "MATCH (n) RETURN n LIMIT 10"

  def query_graph(self, query: str) -> Dict:
    """Consultar base de datos de grafos con Cypher generado por LLM"""
    try:
        # Generar consulta Cypher
        cypher_query = self.generate_cypher_query(query)

        if hasattr(self, 'graph_db'):
            # Consultar Neo4j
            result = self.graph_db.run(cypher_query).data()
            return {
                "success": True,
                "data": result,
                "query_used": cypher_query
            }
        else:
            # Simular consulta Cypher en NetworkX (para desarrollo)
            # Esto es un aproximado muy básico
            nodes = list(self.graph.nodes())
            edges = list(self.graph.edges(data=True))

            # Filtrar basado en términos de la consulta
            filtered_nodes = [n for n in nodes if any(q.lower() in str(n).lower() for q in query.split())]
            filtered_edges = [e for e in edges if any(q.lower() in str(e).lower() for q in query.split())]

            return {
                "success": True,
                "nodes": filtered_nodes[:10],
                "edges": filtered_edges[:10],
                "query_used": cypher_query
            }
    except Exception as e:
        return {
            "success": False,
            "error": str(e),
            "query_used": cypher_query if 'cypher_query' in locals() else "N/A"
        }

  def _setup_intent_classifier(self):
      """Configurar clasificador de intención mejorado"""
      print("Configurando clasificador de intención avanzado...")

      # Opción 1: Modelo entrenado
      try:
          self.intent_model = pipeline(
              "sentiment-analysis",
              model="cardiffnlp/twitter-roberta-base-sentiment-latest",  # Ruta al modelo entrenado en TP1
              tokenizer="path/to/tokenizer"
          )
          self.use_llm_classifier = False
      except:
          # Opción 2: Clasificador basado en LLM con Few-Shot Prompting
          self.use_llm_classifier = True

      # Definir intenciones con ejemplos para few-shot
      self.intents = {
          "document_search": {
              "description": "Consultas sobre reglas, manuales y cómo jugar",
              "examples": [
                  "¿Dónde puedo encontrar las reglas del juego?",
                  "¿Cómo se configura el tablero al inicio?",
                  "Explica la mecánica de construcción de edificios"
              ]
          },
          "statistics": {
              "description": "Consultas sobre estadísticas y datos numéricos",
              "examples": [
                  "¿Cuál es el rating promedio del juego?",
                  "Muestra los juegos con mayor puntuación",
                  "¿Cuántas reseñas positivas hay?"
              ]
          },
          "relations": {
              "description": "Consultas sobre relaciones entre elementos",
              "examples": [
                  "¿Qué diseñadores trabajaron en expansiones?",
                  "Muestra las conexiones entre mecánicas de juego",
                  "¿Qué expansiones están relacionadas con el diseño base?"
              ]
          },
          "general": {
              "description": "Consultas generales sobre el juego",
              "examples": [
                  "¿Qué es Tiny Towns?",
                  "Dame información general sobre el juego",
                  "¿Qué tipo de juego es Tiny Towns?"
              ]
          }
      }

      print("Clasificador avanzado configurado")

  def classify_intent(self, query: str) -> str:
      """Clasificar intención usando el mejor clasificador disponible"""
      if not self.use_llm_classifier:
          # Usar modelo entrenado
          result = self.intent_model(query)[0]
          return result['label']
      else:
          # Usar LLM con few-shot prompting
          prompt = "Clasifica la siguiente consulta en una de estas categorías:\n"
          for intent, data in self.intents.items():
              prompt += f"- {intent}: {data['description']}\n"
              prompt += "  Ejemplos:\n"
              for example in data['examples']:
                  prompt += f"  * {example}\n"

          prompt += f"\nConsulta a clasificar: \"{query}\"\n"
          prompt += "Devuelve solo el nombre de la categoría sin explicaciones."

          # Llamar al LLM (implementación similar a generate_sql_filter)
          try:
              response = self._call_llm(prompt, max_tokens=10, temperature=0.1)
              return response.strip().lower()
          except:
              # Fallback a clasificación por keywords
              query_lower = query.lower()
              for intent, data in self.intents.items():
                  if any(keyword in query_lower for keyword in data['keywords']):
                      return intent
              return "general"

  def _call_llm(self, prompt: str, max_tokens: int = 64, temperature: float = 0.7) -> str:
        """Función genérica para llamar al LLM"""
        api_key = "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"
        api_url = "https://openrouter.ai/api/v1/chat/completions"
        headers = {
                  "Authorization": f"Bearer {api_key}",
                  "Content-Type": "application/json",
                  "HTTP-Referer": "http://localhost",  # poner tu URL si tienes una app
                  "X-Title": "MiApp"
                  }

        chat_prompt = [
            {"role": "system", "content": "Eres un asistente útil que sigue instrucciones cuidadosamente."},
            {"role": "user", "content": prompt}
        ]

        prompt_with_template = "".join(
            f"<|{msg['role']}|>{msg['content']}</s>\n" for msg in chat_prompt
        ) + "<|assistant|>\n"

        data = {
                "model": "mistralai/mistral-small-3.2-24b-instruct:free",
                "messages": [
                    {"role": "system", "content": "Sos un asistente que responde brevemente"},
                    {"role": "user", "content": "¿Qué es el clustering jerárquico?"}
                ],
                "max_tokens": 100
            }

        try:
            response = requests.post(api_url, headers=headers, json=data, timeout=30)
            response.raise_for_status()
            return response.json()[0]['generated_text'].strip()
        except Exception as e:
            print(f"Error llamando al LLM: {e}")
            return ""

  def process_query(self, query: str, k: int = 5) -> Dict:
      """Procesar consulta completa del RAG"""
      # Clasificar intención
      intent = self.classify_intent(query)

      result = {
          "query": query,
          "intent": intent,
          "response": "",
          "sources": []
      }

      if intent == "document_search":
          # Búsqueda híbrida en documentos
          search_results = self.hybrid_search(query, k)
          reranked_results = self.rerank_results(query, search_results)

          result["sources"] = reranked_results
          result["response"] = self._generate_response(query, reranked_results)

      elif intent == "statistics":
          # Consulta estadística
          stats_result = self.query_statistics(query)
          result["sources"] = [stats_result]
          result["response"] = self._generate_stats_response(query, stats_result)

      elif intent == "relations":
          # Consulta de grafos
          graph_result = self.query_graph(query)
          result["sources"] = [graph_result]
          result["response"] = self._generate_graph_response(query, graph_result)

      else:
          # Búsqueda general
          search_results = self.hybrid_search(query, k)
          result["sources"] = search_results
          result["response"] = self._generate_response(query, search_results)

      return result

  def _generate_response(self, query: str, sources: List[Dict]) -> str:
      """Generar respuesta mejorada usando LLM"""
      if not sources:
          return "No encontré información relevante. ¿Podrías reformular tu pregunta?"

      # Preparar contexto
      context = "Fuentes de información:\n"
      for i, source in enumerate(sources[:3], 1):
          context += f"{i}. {source['text'][:300]}... (Fuente: {source['metadata']['source']})\n"

      # Generar prompt para el LLM
      prompt = (
          "Eres un experto en el juego de mesa Tiny Towns. "
          "A continuación tienes información relevante y una pregunta del usuario.\n\n"
          f"Información relevante:\n{context}\n\n"
          f"Pregunta del usuario: {query}\n\n"
          "Proporciona una respuesta completa y útil basada en la información dada. "
          "Si la información no es suficiente, sugiere reformular la pregunta. "
          "Responde en el mismo idioma de la consulta."
      )

      # Llamar al LLM
      response = self._call_llm(prompt, max_tokens=256)
      return response if response else "No pude generar una respuesta. Por favor intenta con otra pregunta."

  def _generate_stats_response(self, query: str, stats_result: Dict) -> str:
      """Generar respuesta mejorada para estadísticas"""
      if not stats_result["success"]:
          return f"No pude procesar tu consulta estadística: {stats_result['error']}"

      data = stats_result["data"]
      if not data:
          return "No encontré datos que coincidan con tu consulta."

      # Preparar resumen de datos
      summary = f"Encontré {stats_result['count']} registros relevantes:\n"
      for i, record in enumerate(data[:5], 1):
          summary += f"{i}. {str(record)}\n"

      # Generar respuesta con LLM
      prompt = (
          "Eres un analista de datos de juegos de mesa. "
          "A continuación tienes una pregunta y datos relevantes.\n\n"
          f"Pregunta: {query}\n\n"
          f"Datos encontrados:\n{summary}\n\n"
          "Genera un resumen conciso que responda la pregunta usando los datos. "
          "Destaca los valores más importantes. "
          "Responde en el mismo idioma de la consulta."
      )

      response = self._call_llm(prompt, max_tokens=200)
      return response if response else summary

  def _generate_graph_response(self, query: str, graph_result: Dict) -> str:
      """Generar respuesta mejorada para grafos"""
      if not graph_result["success"]:
          return f"Error al consultar relaciones: {graph_result['error']}"

      nodes = graph_result.get("nodes", [])
      edges = graph_result.get("edges", [])

      if not nodes and not edges:
          return "No encontré relaciones relevantes para tu consulta."

      # Preparar resumen de relaciones
      summary = "Relaciones encontradas:\n"
      if nodes:
          summary += f"- Nodos relevantes: {', '.join(str(n) for n in nodes[:5])}\n"
      if edges:
          summary += f"- Conexiones: {', '.join(f'{e[0]} → {e[1]}' for e in edges[:5])}\n"

      # Generar respuesta con LLM
      prompt = (
          "Eres un experto en análisis de relaciones entre elementos de juegos. "
          "A continuación tienes una pregunta y relaciones encontradas.\n\n"
          f"Pregunta: {query}\n\n"
          f"Relaciones:\n{summary}\n\n"
          "Explica las relaciones encontradas de manera clara y cómo responden a la pregunta. "
          "Responde en el mismo idioma de la consulta."
      )

      response = self._call_llm(prompt, max_tokens=200)
      return response if response else summary

## Ejercicio 2: Agente Autonomo

In [8]:
class TinyTownsAgent:
    """Agente autónomo basado en ReAct para Tiny Towns"""

    def __init__(self, rag_system: TinyTownsRAG):
        self.rag_system = rag_system
        self.tools = []
        self.agent = None
        self.memory = ConversationBufferMemory(memory_key="chat_history")

        self._create_tools()
        self._setup_agent()

    def _create_tools(self):
        """Crear herramientas para el agente"""

        # Herramienta de búsqueda en documentos
        def doc_search(query: str) -> str:
            """Busca información en los documentos de Tiny Towns con búsqueda híbrida y re-ranking"""
            results = self.rag_system.hybrid_search(query, k=5)
            reranked = self.rag_system.rerank_results(query, results)

            if not reranked:
                return "No se encontró información relevante en los documentos."

            response = "Información encontrada en documentos:\n"
            for i, result in enumerate(reranked[:3]):
                response += f"{i+1}. {result['text'][:200]}...\n"

            return response

        # Herramienta de búsqueda en tablas
        def table_search(query: str) -> str:
            """Realiza consultas dinámicas a los datos tabulares de Tiny Towns"""
            stats_result = self.rag_system.query_statistics(query)

            if stats_result["success"]:
                response = f"Datos encontrados ({stats_result['count']} registros):\n"
                for record in stats_result["data"][:3]:
                    response += f"- {record}\n"
                return response
            else:
                return f"Error en consulta tabular: {stats_result['error']}"

        # Herramienta de búsqueda en grafos
        def graph_search(query: str) -> str:
            """Realiza consultas dinámicas a la base de datos de grafos"""
            graph_result = self.rag_system.query_graph(query)

            if graph_result["success"]:
                response = f"Relaciones encontradas:\n"
                response += f"Nodos: {graph_result['nodes'][:5]}\n"
                response += f"Conexiones: {graph_result['edges'][:5]}\n"
                return response
            else:
                return f"Error en consulta de grafos: {graph_result['error']}"

        # Crear objetos Tool
        self.tools = [
            Tool(
                name="doc_search",
                description="Busca información en manuales, reglas y documentos sobre Tiny Towns",
                func=doc_search
            ),
            Tool(
                name="table_search",
                description="Consulta estadísticas, ratings y datos tabulares sobre Tiny Towns",
                func=table_search
            ),
            Tool(
                name="graph_search",
                description="Explora relaciones y conexiones entre elementos del juego",
                func=graph_search
            ),
            DuckDuckGoSearchRun(name="web_search"),
            WikipediaQueryRun(api_wrapper=WikipediaAPIWrapper())
        ]

    def _setup_agent(self):
        """Configurar agente ReAct completo"""
        from langchain.chat_models import ChatOpenAI
        from langchain.agents import AgentExecutor, create_react_agent
        from langchain.prompts import PromptTemplate

        # Configurar LLM usando OpenRouter como si fuera OpenAI
        llm = ChatOpenAI(
            model="mistralai/mistral-small-3.2-24b-instruct:free",
            base_url="https://openrouter.ai/api/v1",
            api_key="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",
            temperature=0.3,
            max_tokens=256,
        )

        # Crear prompt template
        template = """Eres un asistente experto en el juego de mesa Tiny Towns. Responde siempre en el mismo idioma de la consulta.

        Herramientas disponibles:
        {tools}
        Nombres de herramientas: {tool_names}

        Instrucciones:
        - Analiza cuidadosamente la pregunta
        - Usa las herramientas necesarias para obtener información
        - Si una herramienta no da resultados, prueba con otra
        - Combina información de múltiples herramientas si es necesario
        - Si no encuentras información relevante, sugiere reformular la pregunta

        Historial de conversación:
        {chat_history}

        Pregunta: {input}
        Thought: {agent_scratchpad}"""

        prompt = PromptTemplate.from_template(template)

        # Crear agente
        self.agent = create_react_agent(llm, self.tools, prompt)

        # Ejecutar agente con herramientas y memoria
        self.agent_executor = AgentExecutor(
            agent=self.agent,
            tools=self.tools,
            memory=self.memory,
            verbose=True,
            handle_parsing_errors=True
        )

        print("Agente ReAct configurado completamente con OpenRouter")


    def chat(self, query: str) -> str:
        """Procesar consulta con el agente completo"""
        try:
            response = self.agent_executor.invoke({"input": query})
            return response["output"]
        except Exception as e:
            print(f"Error en el agente: {e}")
            # Fallback al RAG directo
            result = self.rag_system.process_query(query)
            return result["response"]


## Funcion de evaluacion

In [6]:
def run_evaluation_tests():
    """Ejecutar pruebas de evaluación completas"""
    print("Iniciando evaluación completa del sistema...")

    # Inicializar sistemas
    rag_system = TinyTownsRAG()
    agent = TinyTownsAgent(rag_system)

    # Casos de prueba para evaluar todos los componentes
    test_cases = [
        # Consultas de documentos
        {
            "query": "¿Cómo se configura el tablero al inicio de una partida de Tiny Towns?",
            "type": "document",
            "expected_intent": "document_search"
        },
        {
            "query": "Explica las reglas para construir edificios en el juego",
            "type": "document",
            "expected_intent": "document_search"
        },
        # Consultas estadísticas
        {
            "query": "¿Cuál es la puntuación promedio de Tiny Towns según las reseñas?",
            "type": "statistics",
            "expected_intent": "statistics"
        },
        {
            "query": "Muestra los 5 juegos con mayor rating de dificultad",
            "type": "statistics",
            "expected_intent": "statistics"
        },
        # Consultas de relaciones
        {
            "query": "¿Qué diseñadores trabajaron en expansiones del juego base?",
            "type": "relations",
            "expected_intent": "relations"
        },
        {
            "query": "Muestra las conexiones entre las mecánicas de juego y los diseñadores",
            "type": "relations",
            "expected_intent": "relations"
        },
        # Consultas generales
        {
            "query": "¿Qué tipo de juego es Tiny Towns?",
            "type": "general",
            "expected_intent": "general"
        },
        # Consultas complejas para el agente
        {
            "query": "Compara Tiny Towns con otros juegos de construcción de ciudades en términos de complejidad y rating",
            "type": "complex",
            "expected_intent": None  # El agente debe decidir
        },
        {
            "query": "Busca información sobre la última expansión de Tiny Towns y dime cuándo fue lanzada",
            "type": "complex",
            "expected_intent": None
        }
    ]

    # Evaluar RAG
    print("\n" + "="*50)
    print("EVALUACIÓN SISTEMA RAG")
    print("="*50)

    rag_results = []
    for i, test in enumerate(test_cases[:6], 1):  # Probar solo las primeras 6 (simples)
        print(f"\nPrueba {i}: {test['query']}")
        print("-" * 50)

        result = rag_system.process_query(test['query'])

        # Verificar intención detectada
        intent_match = result['intent'] == test['expected_intent']
        print(f"Intención: {result['intent']} (Esperada: {test['expected_intent']}) → {'✅' if intent_match else '❌'}")

        # Verificar respuesta
        print(f"Respuesta: {result['response'][:100]}...")

        # Verificar fuentes
        sources_ok = len(result['sources']) > 0
        print(f"Fuentes: {len(result['sources'])} → {'✅' if sources_ok else '❌'}")

        # Guardar resultados
        rag_results.append({
            "test": i,
            "query": test['query'],
            "intent_match": intent_match,
            "response_length": len(result['response']),
            "sources_found": sources_ok
        })

    # Evaluar Agente
    print("\n" + "="*50)
    print("EVALUACIÓN AGENTE AUTÓNOMO")
    print("="*50)

    agent_results = []
    for i, test in enumerate(test_cases, 1):
        print(f"\nPrueba {i}: {test['query']}")
        print("-" * 50)

        response = agent.chat(test['query'])

        # Verificar respuesta
        response_ok = len(response) > 20  # Respuesta no vacía
        print(f"Respuesta: {response[:100]}... → {'✅' if response_ok else '❌'}")

        # Guardar resultados
        agent_results.append({
            "test": i,
            "query": test['query'],
            "response_ok": response_ok,
            "response_length": len(response)
        })

    # Mostrar resumen
    print("\n" + "="*50)
    print("RESUMEN DE EVALUACIÓN")
    print("="*50)

    # Estadísticas RAG
    rag_intent_accuracy = sum(1 for r in rag_results if r['intent_match']) / len(rag_results)
    rag_sources_found = sum(1 for r in rag_results if r['sources_found']) / len(rag_results)

    print(f"\nSistema RAG:")
    print(f"- Precisión de intención: {rag_intent_accuracy:.1%}")
    print(f"- Fuentes encontradas: {rag_sources_found:.1%}")
    print(f"- Longitud promedio de respuesta: {sum(r['response_length'] for r in rag_results)/len(rag_results):.0f} chars")

    # Estadísticas Agente
    agent_success = sum(1 for r in agent_results if r['response_ok']) / len(agent_results)

    print(f"\nAgente Autónomo:")
    print(f"- Consultas exitosas: {agent_success:.1%}")
    print(f"- Longitud promedio de respuesta: {sum(r['response_length'] for r in agent_results)/len(agent_results):.0f} chars")

    print("\nEvaluación completada")

## Ejecucion del sistema

In [10]:
if __name__ == "__main__":
    print("SISTEMA RAG Y AGENTE AUTÓNOMO - TINY TOWNS")
    print("=" * 50)

    # Ejecutar evaluación
    run_evaluation_tests()

    print("\nSistema listo para uso interactivo")
    print("Puedes usar las clases TinyTownsRAG y TinyTownsAgent para consultas")

SISTEMA RAG Y AGENTE AUTÓNOMO - TINY TOWNS
Iniciando evaluación completa del sistema...
Cargando datos...
Datos cargados exitosamente
Configurando modelo de embeddings...
Modelo de embeddings configurado
Creando base de datos vectorial...
Base de datos vectorial creada con 123 chunks
Configurando interfaz estadística...
Interfaz estadística configurada
Configurando base de datos de grafos...
Error configurando Neo4j: Cannot open connection to ConnectionProfile('bolt://localhost:7687')
Configurando clasificador de intención avanzado...


Some weights of the model checkpoint at cardiffnlp/twitter-roberta-base-sentiment-latest were not used when initializing RobertaForSequenceClassification: ['roberta.pooler.dense.bias', 'roberta.pooler.dense.weight']
- This IS expected if you are initializing RobertaForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing RobertaForSequenceClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
  llm = ChatOpenAI(


Clasificador avanzado configurado
Agente ReAct configurado completamente con OpenRouter

EVALUACIÓN SISTEMA RAG

Prueba 1: ¿Cómo se configura el tablero al inicio de una partida de Tiny Towns?
--------------------------------------------------
Error llamando al LLM: 0
Error llamando al LLM: 0
Intención:  (Esperada: document_search) → ❌
Respuesta: No pude generar una respuesta. Por favor intenta con otra pregunta....
Fuentes: 5 → ✅

Prueba 2: Explica las reglas para construir edificios en el juego
--------------------------------------------------
Error llamando al LLM: 0
Error llamando al LLM: 0
Intención:  (Esperada: document_search) → ❌
Respuesta: No pude generar una respuesta. Por favor intenta con otra pregunta....
Fuentes: 5 → ✅

Prueba 3: ¿Cuál es la puntuación promedio de Tiny Towns según las reseñas?
--------------------------------------------------
Error llamando al LLM: 0
Error llamando al LLM: 0
Intención:  (Esperada: statistics) → ❌
Respuesta: No pude generar una respuesta