# üå¥ Asistente Tur√≠stico de Tenerife - RAG Demo

## 1. Configuraci√≥n del Entorno
Cargamos las librer√≠as necesarias y verificamos la API Key.

In [1]:
import os
from dotenv import load_dotenv

load_dotenv()
api_key = os.getenv("OPENAI_API_KEY")
if api_key:
    print(f"‚úÖ Key cargada: {api_key[:5]}...")
else:
    print("‚ùå Error de Key")

‚úÖ Key cargada: sk-pr...


In [2]:
# 0. INSTALACI√ìN DE DEPENDENCIAS
# Ejecuta esto PRIMERO. Si hay actualizaciones, Reinicia el Kernel antes de seguir.
%pip install -q -U openai-agents nest_asyncio openai langchain-openai python-dotenv
print("‚úÖ Dependencias verificadas. Si hubo instalaciones nuevas, ve a Kernel > Restart.")

Note: you may need to restart the kernel to use updated packages.
‚úÖ Dependencias verificadas. Si hubo instalaciones nuevas, ve a Kernel > Restart.



[notice] A new release of pip is available: 25.1.1 -> 25.3
[notice] To update, run: python.exe -m pip install --upgrade pip


## 2. Validaci√≥n de Conectividad con OpenAI
Probamos que la llave funcione y el modelo responda.

In [3]:
from langchain_openai import ChatOpenAI

# Inicializamos el modelo
llm = ChatOpenAI(temperature=0, model_name="gpt-3.5-turbo")

# Prueba 'Hol√≠stica'
try:
    response = llm.invoke("Di 'Hola Tenerife' si me escuchas.")
    print(f"ü§ñ Respuesta Modelo: {response.content}")
except Exception as e:
    print(f"‚ùå Error de Conexi√≥n: {e}")

ü§ñ Respuesta Modelo: Hola Tenerife. ¬øEn qu√© puedo ayudarte hoy?


## 3. Fase 2: Ingesta y Vector Store üìö
Subimos el PDF `TENERIFE.pdf` a OpenAI para crear un Vector Store gestionado.

In [4]:
import os
import sys
import openai
from openai import OpenAI
from pathlib import Path

# 1. DIAGN√ìSTICO DE ENTORNO (CR√çTICO)
print(f"üêç Python Executable: {sys.executable}")
if "llm-env" not in sys.executable:
    print("‚ö†Ô∏è ADVERTENCIA: No parece que est√©s usando el entorno virtual 'llm-env'. Verifica tu Kernel.")

print(f"üì¶ OpenAI Version: {openai.__version__}")

client = OpenAI()

pdf_path = Path("../data/raw/TENERIFE.pdf")

if not pdf_path.exists():
    print(f"‚ùå No encontrado: {pdf_path}")
else:
    print(f"‚úÖ Archivo encontrado: {pdf_path}")

    # 2. ADAPTADOR UNIVERSAL DE VECTOR STORES
    try:
        vs_manager = None
        
        # Intento 1: Ruta est√°ndar V2 Beta
        if hasattr(client, 'beta') and hasattr(client.beta, 'vector_stores'):
            vs_manager = client.beta.vector_stores
            print("‚úÖ Conectado v√≠a client.beta.vector_stores")
            
        # Intento 2: Ruta ra√≠z (posible cambio futuro o versi√≥n diferente)
        elif hasattr(client, 'vector_stores'):
            vs_manager = client.vector_stores
            print("‚úÖ Conectado v√≠a client.vector_stores")

        if vs_manager:
            vector_store = vs_manager.create(name="Tenerife Guide Store")
            print(f"üì¶ Vector Store creado: {vector_store.id}")
            
            with open(pdf_path, "rb") as f:
                file_batch = vs_manager.file_batches.upload_and_poll(
                    vector_store_id=vector_store.id, files=[f]
                )
            print(f"üìÑ Estado de carga: {file_batch.status}")
            print(f"üî¢ Archivos procesados: {file_batch.file_counts}")
        else:
            # FALLO TOTAL: Imprimir introspecci√≥n para depurar
            print("‚ùå ERROR: No se encuentra 'vector_stores' en el cliente OpenAI.")
            print("üîç Depuraci√≥n de atributos disponibles:")
            print(f"   client dir: {[x for x in dir(client) if 'vector' in x or 'beta' in x]}")
            if hasattr(client, 'beta'):
                print(f"   client.beta dir: {dir(client.beta)}")
            else:
                print("   client.beta NO existe.")
            raise AttributeError("No se pudo acceder a Vector Stores con esta versi√≥n de librer√≠a/entorno.")

    except Exception as e:
        print(f"‚ùå Excepci√≥n: {e}")

üêç Python Executable: f:\development\Development\Master IA\LLM-large-language-models-entrega-tarea-final\llm-env\Scripts\python.exe
üì¶ OpenAI Version: 2.15.0
‚úÖ Archivo encontrado: ..\data\raw\TENERIFE.pdf
‚úÖ Conectado v√≠a client.vector_stores
üì¶ Vector Store creado: vs_6967758ac54c819185f9a78ae16d9740
üìÑ Estado de carga: completed
üî¢ Archivos procesados: FileCounts(cancelled=0, completed=1, failed=0, in_progress=0, total=1)


## 4. Fase 3: Configuraci√≥n del Agente RAG ü§ñ
Configuramos el agente con capacidad de usar el Vector Store. 
**Nota**: Incluimos la instalaci√≥n de librer√≠as en el kernel para asegurar que el entorno de ejecuci√≥n tenga todo lo necesario.

In [5]:
import nest_asyncio
nest_asyncio.apply()

# Correcci√≥n: La librer√≠a se importa como 'agents' aunque se instale como 'openai-agents'
from agents import Agent, Runner, FileSearchTool

# Recuperamos el ID del Vector Store de la fase anterior
# Fallback a un ID conocido si se ha reiniciado el kernel sin re-ejecutar la Fase 2
try:
    current_vs_id = vector_store.id
except NameError:
    current_vs_id = "vs_69661c161c5881919eadf77744958c70" # ID de ejemplo/previo
    print(f"‚ö†Ô∏è Usando ID recuperado/hardcodeado: {current_vs_id}")

# 1. Definir la herramienta de b√∫squeda de archivos
file_search_tool = FileSearchTool(vector_store_ids=[current_vs_id])

# 2. Instrucciones del Agente (System Prompt)
INSTRUCTIONS = """
Eres un experto gu√≠a tur√≠stico de Tenerife.
Usa la herramienta file_search para encontrar informaci√≥n en la gu√≠a PDF adjunta.
Si la informaci√≥n no est√° en el PDF, dilo claramente. No inventes respuestas.
Responde siempre en espa√±ol, con un tono amable y entusiasta.
"""

# 3. Crear el Agente
agent = Agent(
    name="TenerifeGuide",
    model="gpt-4o-mini",
    instructions=INSTRUCTIONS,
    tools=[file_search_tool]
)

print(f"ü§ñ Agente '{agent.name}' configurado satisfactoriamente.")

ü§ñ Agente 'TenerifeGuide' configurado satisfactoriamente.


### Prueba R√°pida del Agente
Lanzamos una pregunta de prueba para verificar que el RAG funciona.

In [6]:
async def demo_agente():
    pregunta = "¬øQu√© actividades puedo hacer en el Teide?"
    print(f"üë§ Usuario: {pregunta}")
    
    # Ejecutamos el agente
    resultado = await Runner.run(agent, pregunta)
    print(f"ü§ñ Agente: {resultado.final_output}")

await demo_agente()

üë§ Usuario: ¬øQu√© actividades puedo hacer en el Teide?
ü§ñ Agente: ¬°Qu√© emoci√≥n que est√©s interesado en las actividades del Teide! Aqu√≠ tienes algunas recomendaciones:

1. **Subida al Pico del Teide**: Puedes ascender utilizando los telef√©ricos que te llevar√°n cerca de la cima. Desde ah√≠, ¬°las vistas son espectaculares!

2. **Visitas Nocturnas**: Si tienes la oportunidad, considera subir por la noche. El Teide ofrece uno de los cielos estrellados m√°s impresionantes del mundo, especialmente cuando est√° despejado.

3. **Centro de Visitantes**: No olvides visitar el Centro de Visitantes de El Portillo, que es gratuito y ofrece informaci√≥n valiosa sobre el parque.

4. **Senderismo**: Hay diversas rutas de senderismo para todos los niveles. Disfrutar del paisaje volc√°nico y la flora end√©mica es una experiencia √∫nica.

5. **Miradores**: Aprovecha para visitar los miradores como el Mirador de La Tarta, donde puedes disfrutar de vistas incre√≠bles durante tu subida.

¬°As√≠ 

# 4. FASE 4: GENERACI√ìN DE DATASET DE EVALUACI√ìN

Para medir la calidad de nuestro RAG, necesitamos un "Gold Standard" o dataset de prueba.
En lugar de escribirlo a mano, usaremos un **Agente Auxiliar ('DatasetBuilder')**.

Este agente leer√° el PDF y generar√° pares de Pregunta/Respuesta con referencias exactas.
Esto asegura que las pruebas est√©n alineadas con el contenido real del documento.

In [7]:
from typing import List
from pydantic import BaseModel
import json

# Modelo de datos para cada item de evaluaci√≥n
class EvalItem(BaseModel):
    question: str
    answer: str
    references: List[str]

NUM_EXAMPLES = 5  # N√∫mero de pares a generar (puedes aumentar esto luego)
MODEL_GENERATOR = "gpt-4o-mini" # Usamos el mismo modelo capaz

# Definici√≥n del Agente Generador
dataset_agent = Agent(
    name="DatasetBuilder",
    model=MODEL_GENERATOR,
    instructions=(
        "Eres un generador de datasets de QA (Pregunta/Respuesta) basado en un PDF accesible v√≠a file_search. "
        "Crea preguntas variadas (literales, s√≠ntesis, curiosidades) sobre Tenerife y respuestas concisas apoyadas en el texto. "
        "Debes devolver un JSON con una lista de objetos que sigan la estructura {question, answer, references}. "
        "Las 'references' deben ser citas textuales exactas del PDF que soporten la respuesta. NO inventes texto."
    ),
    tools=[file_search_tool], # Reutilizamos la tool configurada en Fase 3
    output_type=List[EvalItem],
)

print("‚úÖ Agente DatasetBuilder configurado.")

‚úÖ Agente DatasetBuilder configurado.


In [8]:
# Prompt para disparar la generaci√≥n
dataset_prompt = (
    f"Genera {NUM_EXAMPLES} pares de pregunta/respuesta basados √∫nicamente en el PDF de Tenerife. "
    "Incluye las referencias textuales relevantes en el campo 'references'. "
    "Responde solo con un JSON v√°lido."
)

print(f"‚è≥ Generando {NUM_EXAMPLES} ejemplos de evaluaci√≥n... (Esto puede tardar unos segundos)")

try:
    # Ejecuci√≥n del agente
    dataset_result = await Runner.run(dataset_agent, dataset_prompt)
    
    # Extracci√≥n del resultado tipado
    eval_dataset = dataset_result.final_output_as(List[EvalItem])
    
    print(f"\n‚úÖ Generados {len(eval_dataset)} ejemplos:")
    for i, item in enumerate(eval_dataset, 1):
        print(f"[{i}] P: {item.question}")
        print(f"    R: {item.answer[:100]}...")

except Exception as e:
    print(f"‚ùå Error generando dataset: {e}")


‚è≥ Generando 5 ejemplos de evaluaci√≥n... (Esto puede tardar unos segundos)

‚úÖ Generados 5 ejemplos:
[1] P: ¬øCu√°l es la capital de Tenerife?
    R: La capital de la isla es Santa Cruz de Tenerife....
[2] P: ¬øCu√°les son las caracter√≠sticas del Teide?
    R: El Teide es el pico m√°s alto de Espa√±a con 3.718 m, ubicado en un parque nacional considerado de obl...
[3] P: ¬øQu√© tipo de clima tiene Tenerife?
    R: Tenerife tiene un clima diverso, con zonas de playa de arena blanca en el sur y m√°s de arena negra e...
[4] P: ¬øCu√°les son las playas m√°s famosas de Tenerife?
    R: Entre las playas m√°s famosas est√°n Playa de Las Teresitas, Playa del Camis√≥n y Playa de Los Cristian...
[5] P: ¬øQu√© actividades se pueden realizar en Tenerife?
    R: Se pueden realizar diversas actividades como senderismo en el Parque Rural de Anaga, visitar el Loro...


In [9]:
# Guardar el dataset en disco para no regenerarlo siempre
DATASET_PATH = Path("eval_dataset_tenerife.json")

if 'eval_dataset' in locals() and eval_dataset:
    with open(DATASET_PATH, "w", encoding="utf-8") as f:
        json.dump([item.model_dump() for item in eval_dataset], f, ensure_ascii=False, indent=2)
    print(f"üíæ Dataset guardado en: {DATASET_PATH.absolute()}")
else:
    print("‚ö†Ô∏è No hay dataset para guardar.")

üíæ Dataset guardado en: f:\development\Development\Master IA\LLM-large-language-models-entrega-tarea-final\notebooks\eval_dataset_tenerife.json


# 5. FASE 5: VERIFICACI√ìN Y M√âTRICAS (JUEZ LLM)

Ya tenemos Agente y Dataset. Ahora necesitamos saber **qu√© tan bien** funciona.
Usaremos un segundo LLM (Juez) para calificar cada respuesta del Agente seg√∫n:
1.  **Faithfulness (Fidelidad):** ¬øSe invent√≥ algo?
2.  **Answer Correctness:** ¬øCoincide con la respuesta esperada?
3.  **Context Precision:** ¬øLos trozos de PDF recuperados eran √∫tiles?

In [10]:
import asyncio
import statistics
from typing import Dict, Any, List
from pydantic import BaseModel

# Aseguramos imports
from agents import Agent, Runner
import nest_asyncio
nest_asyncio.apply()

# Definici√≥n de la Salida del Juez
class JudgeScores(BaseModel):
    faithfulness: float
    answer_correctness: float
    context_precision: float
    reasoning: str

# Definici√≥n del Juez (usamos gpt-4o-mini por ser r√°pido y capaz)
judge_agent = Agent(
    name="EvalJudge",
    model="gpt-4o-mini",
    instructions=(
        "Act√∫as como un juez evaluador de sistemas RAG. "
        "Debes generar puntuaciones (0.0 a 1.0) para: "
        "1. Faithfulness: ¬øLa respuesta se basa solo en el contexto recuperado? (1=S√≠, 0=Alucinaci√≥n total). "
        "2. Answer Correctness: ¬øLa respuesta del agente coincide sem√°nticamente con la respuesta de referencia? "
        "3. Context Precision: ¬øLos contextos recuperados son relevantes para la pregunta? "
        "Devuelve un JSON con los campos num√©ricos y un breve 'reasoning'."
    ),
    output_type=JudgeScores
)

print("‚úÖ Agente Juez configurado.")

‚úÖ Agente Juez configurado.


In [11]:
# Funci√≥n auxiliar para extraer el texto de los contextos recuperados
def extract_contexts(run_result) -> List[str]:
    contexts = []
    # Inspeccionamos items generados buscando llamadas a tools
    if hasattr(run_result, 'new_items'):
        for item in run_result.new_items:
            raw = getattr(item, "raw_item", None)
            # Detectar llamada a file_search
            if getattr(raw, "type", None) == "file_search_call":
                for res in getattr(raw, "results", []) or []:
                    text = getattr(res, "text", None) or getattr(res, "content", None)
                    if text: contexts.append(text)
    return contexts

# Funci√≥n que eval√∫a UNA sola pregunta
async def evaluate_example(agent_to_test: Agent, example: EvalItem):
    # 1. El Agente a testear responde la pregunta
    run_res = await Runner.run(agent_to_test, example.question)
    agent_answer = run_res.final_output
    contexts = extract_contexts(run_res)
    
    # 2. El Juez eval√∫a la calidad
    context_text = "\n---\n".join(contexts[:3]) # Top 3 contextos
    judge_prompt = (
        f"Pregunta: {example.question}\n"
        f"Respuesta Agente: {agent_answer}\n"
        f"Respuesta Referencia: {example.answer}\n"
        f"Contextos Recuperados: {context_text}\n"
        "Eval√∫a con rigor."
    )
    
    judge_res = await Runner.run(judge_agent, judge_prompt)
    scores = judge_res.final_output_as(JudgeScores)
    
    return {
        "question": example.question,
        "agent_answer": agent_answer,
        "reference": example.answer,
        "faithfulness": scores.faithfulness,
        "correctness": scores.answer_correctness,
        "ctx_precision": scores.context_precision,
        "reasoning": scores.reasoning
    }

In [12]:
# Ejecuci√≥n Masiva de la Evaluaci√≥n
print(f"‚è≥ Evaluando los {len(eval_dataset)} ejemplos con el Juez... Estiman 10-20 segundos.")

results = []
for ex in eval_dataset:
    res = await evaluate_example(agent, ex)
    results.append(res)
    # Peque√±o print de progreso
    print(f". Completado: {ex.question[:30]}... -> F:{res['faithfulness']} C:{res['correctness']}")

print("\n‚úÖ Evaluaci√≥n Finalizada.")

‚è≥ Evaluando los 5 ejemplos con el Juez... Estiman 10-20 segundos.
. Completado: ¬øCu√°l es la capital de Tenerif... -> F:1.0 C:1.0
. Completado: ¬øCu√°les son las caracter√≠stica... -> F:1.0 C:0.8
. Completado: ¬øQu√© tipo de clima tiene Tener... -> F:0.9 C:0.7
. Completado: ¬øCu√°les son las playas m√°s fam... -> F:0.8 C:0.7
. Completado: ¬øQu√© actividades se pueden rea... -> F:0.9 C:0.8

‚úÖ Evaluaci√≥n Finalizada.


In [13]:
# Reporte de Resultados
try:
    import pandas as pd
    df_results = pd.DataFrame(results)
    print("\nPromedios Generales:")
    print(df_results[["faithfulness", "correctness", "ctx_precision"]].mean())
    display(df_results) # Pretty print en notebook
except ImportError:
    # Fallback si no hay pandas
    print("\nResultados Detallados:")
    for r in results:
        print(r)


Resultados Detallados:
{'question': '¬øCu√°l es la capital de Tenerife?', 'agent_answer': 'La capital de Tenerife es Santa Cruz de Tenerife. ¬°Es un lugar lleno de vida y con muchos lugares interesantes para explorar! Si tienes alg√∫n otro dato que te gustar√≠a saber sobre Santa Cruz o Tenerife en general, ¬°preg√∫ntame!', 'reference': 'La capital de la isla es Santa Cruz de Tenerife.', 'faithfulness': 1.0, 'correctness': 1.0, 'ctx_precision': 1.0, 'reasoning': 'La respuesta del agente se basa √∫nicamente en el contexto recuperado, que menciona que la capital de Tenerife es Santa Cruz de Tenerife. Adem√°s, la respuesta coincide sem√°nticamente con la respuesta de referencia. Los contextos recuperados son pertinentes, ya que la pregunta se refiere a la capital de Tenerife.'}
{'question': '¬øCu√°les son las caracter√≠sticas del Teide?', 'agent_answer': 'El Teide es el pico m√°s alto de Espa√±a, alcanzando los 3,718 metros sobre el nivel del mar. Se encuentra situado en el Parque Naciona

# 6. FASE 6: FUNCTION CALLING (CLIMA)

Implementamos una herramienta externa (`get_weather`) usando el decorador `@function_tool`.
Esto permite al Agente invocar c√≥digo Python real (o simulado) para obtener estructuras JSON.

In [14]:
import random
import datetime
import json
from agents import function_tool  # Importante: Decorador para herramientas

# 1. Definimos la funci√≥n decorada
@function_tool
def get_weather(location: str, date: str = None) -> str:
    """
    Obtiene la previsi√≥n del tiempo para una ubicaci√≥n y fecha dadas.
    
    Args:
        location: Ciudad o lugar (ej: 'Tenerife').
        date: Fecha en formato YYYY-MM-DD o 'hoy'.
    """
    # Log solicitado por requisitos
    print(f"[TOOL LOG] Llamada a get_weather(location='{location}', date='{date}')")
    
    # Mock (Simulaci√≥n)
    if not date:
        date = datetime.date.today().isoformat()
    
    climates = ["Soleado", "Parcialmente nublado", "Viento moderado"]
    temp = random.randint(20, 28)
    
    return json.dumps({
        "location": location,
        "date": date,
        "condition": random.choice(climates),
        "temperature": f"{temp}¬∫C",
        "note": "Simulaci√≥n acad√©mica"
    })

# 2. Creamos el Agente con la herramienta correctamente configurada
weather_agent = Agent(
    name="TenerifeGuidePro",
    model="gpt-4o-mini",
    instructions=(
        "Eres el experto tur√≠stico definitivo de Tenerife. "
        "Usa file_search para responder dudas sobre lugares bas√°ndote en el PDF. "
        "Usa get_weather si el usuario pregunta por el tiempo o clima actual. "
        "Combina ambas fuentes para dar consejos complejos."
    ),
    tools=[file_search_tool, get_weather]
)

print("‚úÖ Agente 'TenerifeGuidePro' configurado correctamente.")

‚úÖ Agente 'TenerifeGuidePro' configurado correctamente.


In [15]:
# Prueba de Function Calling + RAG
pregunta_clima = "¬øQu√© tiempo hace hoy en el Teide y qu√© me recomiendas hacer all√≠ seg√∫n el PDF?"

print(f"üë§ Usuario: {pregunta_clima}")
print("‚è≥ Pensando...")

try:
    resultado_completo = await Runner.run(weather_agent, pregunta_clima)
    print(f"ü§ñ Agente: {resultado_completo.final_output}")
except Exception as e:
    print(f"‚ùå Error: {e}")

üë§ Usuario: ¬øQu√© tiempo hace hoy en el Teide y qu√© me recomiendas hacer all√≠ seg√∫n el PDF?
‚è≥ Pensando...
[TOOL LOG] Llamada a get_weather(location='Teide', date='hoy')
ü§ñ Agente: Hoy, en el Teide, el clima es **parcialmente nublado** con una temperatura de **24¬∞C**. Es un buen d√≠a para explorar la belleza natural del parque.

### Recomendaciones:
1. **Subida al Teide**:
   - Puedes utilizar el **telef√©rico** para llegar a la cima y disfrutar de vistas espectaculares. Si prefieres una aventura m√°s intensa, considera caminar hasta la cumbre. 
   - Si te interesa la astronom√≠a, una subida nocturna puede ofrecer uno de los cielos estrellados m√°s impresionantes del mundo.

2. **Miradores**:
   - Para vistas panor√°micas incre√≠bles, visita el **Mirador de La Tarta** y el **Mirador de Chipeque**, donde podr√°s disfrutar del "mar de nubes" si tienes suerte.

3. **Centro de Visitantes de El Portillo**:
   - Es gratuito y te proporcionar√° informaci√≥n √∫til sobre el parque y s