<a href="https://colab.research.google.com/github/davidlealo/vocacional-test/blob/main/mentoria_vocacional.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
# Instalar dependencias (solo una vez)
!pip install python-dotenv requests openai --upgrade

# ========================
# 1. Cargar variables del entorno
# ========================
import os
from dotenv import load_dotenv
from openai import AzureOpenAI
import requests

load_dotenv()  # Aseg√∫rate de haber subido el archivo .env

# Azure Search
AZURE_SEARCH_API_KEY = os.environ["AZURE_SEARCH_API_KEY"]
AZURE_SEARCH_ENDPOINT = os.environ["AZURE_SEARCH_ENDPOINT"]
AZURE_SEARCH_INDEX_NAME = os.environ["AZURE_SEARCH_INDEX_NAME"]

# Azure OpenAI
AZURE_OPENAI_API_KEY = os.environ["AZURE_OPENAI_API_KEY"]
AZURE_OPENAI_ENDPOINT = os.environ["AZURE_OPENAI_ENDPOINT"]
AZURE_OPENAI_DEPLOYMENT_NAME = os.environ["AZURE_OPENAI_DEPLOYMENT_NAME"]

# ========================
# 2. Buscar documentos en Azure Search
# ========================
def search_documents(query, top_k=5):
    url = f"{AZURE_SEARCH_ENDPOINT}/indexes/{AZURE_SEARCH_INDEX_NAME}/docs/search?api-version=2023-07-01-Preview"
    headers = {
        "Content-Type": "application/json",
        "api-key": AZURE_SEARCH_API_KEY
    }
    payload = {
        "search": query,
        "top": top_k
    }
    response = requests.post(url, headers=headers, json=payload)
    response.raise_for_status()
    results = response.json()
    return [doc.get("content", "") for doc in results.get("value", [])]

# ========================
# 3. Llamar a Phi-4 con contexto
# ========================
client = AzureOpenAI(
    api_key=AZURE_OPENAI_API_KEY,
    api_version="2023-08-01-preview",
    azure_endpoint=AZURE_OPENAI_ENDPOINT
)

def generate_answer(question, context):
    system_prompt = "Eres un mentor pedag√≥gico. Responde de forma clara, breve y √∫til basado en el contexto."
    user_prompt = f"Pregunta: {question}\n\nContexto:\n{context}"

    response = client.chat.completions.create(
        model=AZURE_OPENAI_DEPLOYMENT_NAME,
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_prompt}
        ],
        temperature=0.3,
        max_tokens=500
    )
    return response.choices[0].message.content




In [3]:
pregunta = "¬øQu√© dijo Valentina sobre el financiamiento de la educaci√≥n?"
documentos = search_documents(pregunta)
contexto = "\n\n".join(documentos)
respuesta = generate_answer(pregunta, contexto)

print("Respuesta del asistente:\n", respuesta)


Respuesta del asistente:
 Parece que no has proporcionado el contexto espec√≠fico en el que Valentina habl√≥ sobre el financiamiento de la educaci√≥n. Si puedes proporcionar m√°s detalles o el texto completo donde se menciona, estar√© encantado de ayudarte a resumir o responder a tu pregunta.


In [4]:
# Cambia aqu√≠ tu nueva pregunta
pregunta = "¬øQu√© desaf√≠os enfrentan los estudiantes en zonas rurales seg√∫n David?"

# Ejecuta las funciones con la nueva pregunta
documentos = search_documents(pregunta)
contexto = "\n\n".join(documentos)
respuesta = generate_answer(pregunta, contexto)

print("Respuesta del asistente:\n", respuesta)


Respuesta del asistente:
 Lamento, pero no puedo proporcionar una respuesta directa a tu pregunta ya que no has proporcionado el contexto o el texto en el que se menciona a David. Por favor, proporci√≥name el contexto o el texto espec√≠fico donde David discute los desaf√≠os que enfrentan los estudiantes en zonas rurales. ¬°Gracias!


In [6]:
# Cambia aqu√≠ tu nueva pregunta
pregunta = "¬øQu√© es proyectate.info?"

# Ejecuta las funciones con la nueva pregunta
documentos = search_documents(pregunta)
contexto = "\n\n".join(documentos)
respuesta = generate_answer(pregunta, contexto)

print("Respuesta del asistente:\n", respuesta)


Respuesta del asistente:
 Parece que te refieres a "projectate.info", pero no tengo informaci√≥n espec√≠fica sobre un sitio web o recurso con ese nombre. Es posible que sea un sitio web menos conocido, un sitio personal, una p√°gina de proyecto o algo similar. Si tienes m√°s contexto o detalles, ¬°puedo intentar ayudarte mejor! Por favor, proporciona m√°s informaci√≥n o aclara tu pregunta.


In [7]:
print("Documentos encontrados:\n", contexto)


Documentos encontrados:
 










In [10]:
# === 1. Instalar dependencias (si no lo hiciste) ===
# !pip install python-dotenv requests openai --upgrade

# === 2. Cargar variables de entorno ===
import os
from dotenv import load_dotenv
from openai import AzureOpenAI
import requests

load_dotenv()

# Azure Cognitive Search
AZURE_SEARCH_API_KEY = os.environ["AZURE_SEARCH_API_KEY"]
AZURE_SEARCH_ENDPOINT = os.environ["AZURE_SEARCH_ENDPOINT"]
AZURE_SEARCH_INDEX_NAME = os.environ["AZURE_SEARCH_INDEX_NAME"]

# Azure OpenAI (Phi-4)
AZURE_OPENAI_API_KEY = os.environ["AZURE_OPENAI_API_KEY"]
AZURE_OPENAI_ENDPOINT = os.environ["AZURE_OPENAI_ENDPOINT"]
AZURE_OPENAI_DEPLOYMENT_NAME = os.environ["AZURE_OPENAI_DEPLOYMENT_NAME"]

# === 3. Buscar documentos en Azure Search ===
def search_documents(query, top_k=10):
    url = f"{AZURE_SEARCH_ENDPOINT}/indexes/{AZURE_SEARCH_INDEX_NAME}/docs/search?api-version=2023-07-01-Preview"
    headers = {
        "Content-Type": "application/json",
        "api-key": AZURE_SEARCH_API_KEY
    }
    payload = {
        "search": query,
        "top": top_k,
        "queryType": "simple",  # Puedes probar "semantic" si lo activas en Azure
        # "semanticConfiguration": "default",  # si activas b√∫squeda sem√°ntica
    }

    response = requests.post(url, headers=headers, json=payload)
    response.raise_for_status()
    results = response.json()

    # Mostrar claves disponibles por documento para verificar campo correcto
    for doc in results.get("value", []):
        print("Campos disponibles:", doc.keys())
        break

    # Cambia "content" por el campo correcto si es necesario (ej. "text", "chunk", "transcription")
    return [doc.get("content", "") for doc in results.get("value", [])]

# === 4. Llamar a Phi-4 con contexto ===
client = AzureOpenAI(
    api_key=AZURE_OPENAI_API_KEY,
    api_version="2023-08-01-preview",
    azure_endpoint=AZURE_OPENAI_ENDPOINT
)

def generate_answer(question, context):
    system_prompt = "Eres un mentor pedag√≥gico. Responde de forma clara, breve y √∫til basado en el contexto."
    user_prompt = f"Pregunta: {question}\n\nContexto:\n{context}"

    response = client.chat.completions.create(
        model=AZURE_OPENAI_DEPLOYMENT_NAME,
        messages=[
            {"role": "system", "content": system_prompt},
            {"role": "user", "content": user_prompt}
        ],
        temperature=0.3,
        max_tokens=500
    )
    return response.choices[0].message.content

# === 5. Ejecutar ejemplo ===
pregunta = "¬øQu√© dijo Valentina sobre el financiamiento de la educaci√≥n?"
documentos = search_documents(pregunta)
contexto = "\n\n".join(documentos)

print("\n--- Documentos recuperados ---")
print(contexto[:1000])  # Muestra los primeros 1000 caracteres del contexto

respuesta = generate_answer(pregunta, contexto)

print("\n--- Respuesta del asistente ---")
print(respuesta)


Campos disponibles: dict_keys(['@search.score', 'chunk_id', 'parent_id', 'chunk', 'title', 'text_vector'])

--- Documentos recuperados ---




















--- Respuesta del asistente ---
Lo siento, pero no puedo proporcionar la informaci√≥n que est√°s buscando porque no tengo el contexto o el texto espec√≠fico en el que Valentina podr√≠a haber hablado sobre el financiamiento de la educaci√≥n. Si puedes proporcionar m√°s detalles o el texto espec√≠fico, estar√© encantado de ayudarte a analizarlo.


In [11]:
# === 5. Ejecutar ejemplo ===
pregunta = "¬øQu√© debo hacer si perd√≠ mis beneficios del credito universitario?"
documentos = search_documents(pregunta)
contexto = "\n\n".join(documentos)

print("\n--- Documentos recuperados ---")
print(contexto[:1000])  # Muestra los primeros 1000 caracteres del contexto

respuesta = generate_answer(pregunta, contexto)

print("\n--- Respuesta del asistente ---")
print(respuesta)


Campos disponibles: dict_keys(['@search.score', 'chunk_id', 'parent_id', 'chunk', 'title', 'text_vector'])

--- Documentos recuperados ---




















--- Respuesta del asistente ---
Si has perdido tus beneficios del cr√©dito universitario, es importante actuar r√°pidamente para resolver el problema. Aqu√≠ hay algunos pasos que puedes seguir:

1. **Contacta al Centro de Ayuda Estudiantil (EAC) de tu universidad**: El EAC es el primer punto de contacto para problemas relacionados con el cr√©dito universitario. Ellos pueden proporcionarte informaci√≥n espec√≠fica sobre tu situaci√≥n y guiarte sobre los pasos a seguir.

2. **Revisa tu informaci√≥n de cr√©dito**: Verifica tu informaci√≥n de cr√©dito para asegurarte de que los cambios se reflejen correctamente. Si hay errores, puedes solicitar una correcci√≥n.

3. **Revisa tu informaci√≥n de identidad**: Aseg√∫rate de que tus datos de identidad sean correctos en las bases de datos del EAC. Cualquier discrepancia podr√≠a causar probl

In [12]:
preguntas = [
    "¬øQu√© es Proyectate?",
    "¬øQu√© dijo Valentina sobre el cr√©dito universitario?",
    "¬øQu√© recomendaci√≥n dio David a los estudiantes rurales?",
]

for pregunta in preguntas:
    print(f"\nüîπ Pregunta: {pregunta}")
    documentos = search_documents(pregunta)
    contexto = "\n\n".join(documentos)
    respuesta = generate_answer(pregunta, contexto)
    print("Respuesta:", respuesta)



üîπ Pregunta: ¬øQu√© es Proyectate?
Campos disponibles: dict_keys(['@search.score', 'chunk_id', 'parent_id', 'chunk', 'title', 'text_vector'])
Respuesta: Parece que la informaci√≥n proporcionada no es suficiente para dar una respuesta precisa. "Proyectate" podr√≠a ser una instrucci√≥n o un t√©rmino en un contexto espec√≠fico, como un juego, una aplicaci√≥n o una conversaci√≥n particular. Si puedes proporcionar m√°s contexto o detalles, estar√© encantado de ayudarte a entender mejor lo que significa "Proyectate". Por favor, proporciona m√°s informaci√≥n.

üîπ Pregunta: ¬øQu√© dijo Valentina sobre el cr√©dito universitario?
Campos disponibles: dict_keys(['@search.score', 'chunk_id', 'parent_id', 'chunk', 'title', 'text_vector'])
Respuesta: Lo siento, pero no puedo ayudarte con eso. ¬øPodr√≠as proporcionar m√°s contexto o detalles sobre lo que dijo Valentina sobre el cr√©dito universitario? Esto me permitir√° darte una respuesta m√°s precisa.

üîπ Pregunta: ¬øQu√© recomendaci√≥n dio D

In [14]:
preguntas = [
    "Qui√©n es Valentina Gran de Fundaci√≥n Por Una Carrera?",
    "Qui√©n es David Leal de Innovacien?",
    "¬øQu√© es el chat de Inteligencia artificial que se present√≥ en la conversaci√≥n?",
]

for pregunta in preguntas:
    print(f"\nüîπ Pregunta: {pregunta}")
    documentos = search_documents(pregunta)
    contexto = "\n\n".join(documentos)
    respuesta = generate_answer(pregunta, contexto)
    print("Respuesta:", respuesta)


üîπ Pregunta: Qui√©n es Valentina Gran de Fundaci√≥n Por Una Carrera?
Campos disponibles: dict_keys(['@search.score', 'chunk_id', 'parent_id', 'chunk', 'title', 'text_vector'])
Respuesta: Valentina Gran es una destacada defensora de la igualdad de g√©nero y la educaci√≥n en Argentina. Es conocida por su trabajo en la Fundaci√≥n Por Una Carrera (FPC), una organizaci√≥n sin fines de lucro dedicada a promover la igualdad de g√©nero en el √°mbito laboral y educativo.

La Fundaci√≥n Por Una Carrera, fundada por Valentina Gran en 2006, se enfoca en la creaci√≥n de oportunidades para las mujeres en el mundo del trabajo y en la educaci√≥n. La organizaci√≥n realiza diversas actividades, como la realizaci√≥n de seminarios, talleres y programas de capacitaci√≥n, con el objetivo de empoderar a las mujeres y promover la igualdad de oportunidades.

Valentina Gran ha sido una figura clave en la promoci√≥n de pol√≠ticas y programas que buscan mejorar la situaci√≥n de las mujeres en Argentina y en La

In [19]:
def get_query_embedding(text):
    response = client.embeddings.create(
        model=os.environ["AZURE_OPENAI_EMBEDDING"],
        input=text
    )
    return response.data[0].embedding


In [20]:
def search_documents_with_vectors(query, top_k=3):
    embedding = get_query_embedding(query)
    url = f"{AZURE_SEARCH_ENDPOINT}/indexes/{AZURE_SEARCH_INDEX_NAME}/docs/search?api-version=2023-07-01-Preview"

    headers = {
        "Content-Type": "application/json",
        "api-key": AZURE_SEARCH_API_KEY
    }

    payload = {
        "vectorQueries": [
            {
                "vector": embedding,
                "k": top_k,
                "fields": "content"
            }
        ],
        "select": "content,source,@search.score"
    }

    response = requests.post(url, headers=headers, json=payload)
    response.raise_for_status()
    results = response.json()
    return [doc["content"] for doc in results.get("value", [])]
