In [21]:
from dotenv import load_dotenv, find_dotenv, dotenv_values
import os

load_dotenv(find_dotenv())  # read local .env file

env_file_keys = list(dotenv_values(find_dotenv()).keys())
api_key = os.getenv('OPENAI_API_KEY')

print('Claves en .env: ', env_file_keys)
print('OPENAI_API_KEY:', api_key if api_key else 'No encontrada')

Claves en .env:  ['OPENAI_API_KEY', 'PINECONE_API_KEY', 'PINECONE_ENV']
OPENAI_API_KEY: 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


In [22]:
from langchain_community.chat_models import ChatOpenAI
from langchain_openai import OpenAIEmbeddings

llm = ChatOpenAI(
    model_name="gpt-3.5-turbo",
    openai_api_key=os.getenv("OPENAI_API_KEY"),
    temperature=0.3,
)

embeddings = OpenAIEmbeddings(model="text-embedding-3-small")

In [23]:
import os
from pinecone import Pinecone

from dotenv import load_dotenv, find_dotenv
load_dotenv(find_dotenv())  # read local .env file

# Verificamos que las variables de entorno estén definidas
api_key = os.getenv("PINECONE_API_KEY")

print("PINECONE_API_KEY:", api_key if api_key else "No encontrada")

# Con pinecone-client 6.x, usamos la nueva sintaxis
if api_key:
    try:
        # Inicializar con la nueva API
        pc = Pinecone(api_key=api_key)
        print("Pinecone inicializado correctamente con API 6.x")

    except Exception as e:
        print(f"Error al inicializar Pinecone: {e}")
else:
    print("Error: Falta la variable de entorno PINECONE_API_KEY")

PINECONE_API_KEY: pcsk_2wmgPR_CgVgRjpcMhmbbuXP6ptQcCFPm8ySFQ7XGNRChYNKmm4ePyvyiTEtg4qZ7FtsgNS
Pinecone inicializado correctamente con API 6.x


In [24]:
index_name = "efisys-wiki-knowledge"
try:
    # Lista los índices disponibles con la nueva API
    indexes = pc.list_indexes()
    print("Índices disponibles:", indexes)
except Exception as e:
    print(f"Error al listar índices: {e}")
    print("Tipo de error:", type(e).__name__)

Índices disponibles: [{
    "name": "efisys-wiki-knowledge",
    "metric": "cosine",
    "host": "efisys-wiki-knowledge-3se3hjl.svc.aped-4627-b74a.pinecone.io",
    "spec": {
        "serverless": {
            "cloud": "aws",
            "region": "us-east-1"
        }
    },
    "status": {
        "ready": true,
        "state": "Ready"
    },
    "vector_type": "dense",
    "dimension": 1536,
    "deletion_protection": "disabled",
    "tags": null
}]


In [25]:
from pinecone import ServerlessSpec

index_name = "efisys-wiki-knowledge"
try:
    # Lista índices existentes
    existing_indexes = [idx.name for idx in pc.list_indexes()]

    if index_name not in existing_indexes:
        print(f"Índice '{index_name}' no existe. Creando con serverless...")
        # Crear índice serverless (gratuito)
        pc.create_index(
            name=index_name,
            dimension=1536,  # Dimensión para text-embedding-3-small
            metric='cosine',
            spec=ServerlessSpec(
                cloud='aws',
                region='us-east-1'
            )
        )
        print(f"Índice '{index_name}' creado exitosamente.")
    else:
        print(f"Índice '{index_name}' ya existe.")
except Exception as e:
    print(f"Error al verificar/crear índice: {e}")
    print(f"Tipo de error: {type(e).__name__}")

Índice 'efisys-wiki-knowledge' ya existe.


In [None]:
import datetime

# Función para consultar la base de datos vectorial de Pinecone
def consultar_pinecone(texto_consulta, pc, index_name, namespace="default", top_k=5, verbose=True):
    """
    Función para buscar documentos similares en Pinecone basado en un texto de consulta.

    Parámetros:
    - texto_consulta (str): El texto que quieres buscar
    - pc: Cliente de Pinecone inicializado
    - index_name (str): Nombre del índice en Pinecone
    - namespace (str): Namespace donde buscar (default: "default")
    - top_k (int): Número máximo de resultados similares a devolver (default: 5)
    - verbose (bool): Si imprimir logs detallados (default: True)

    Retorna:
    - dict: Diccionario con los resultados de la búsqueda
    """

    try:
        if verbose:
            print(f"🔍 Buscando: '{texto_consulta}'")
            print(f"📊 En índice: {index_name}, namespace: {namespace}")

        # 1. Generar embedding para el texto de consulta
        embeddings_model = OpenAIEmbeddings(
            model="text-embedding-3-small",
            openai_api_key=os.getenv("OPENAI_API_KEY")
        )

        if verbose:
            print("🤖 Generando embedding para la consulta...")
        query_embedding = embeddings_model.embed_query(texto_consulta)

        # 2. Conectar al índice
        index = pc.Index(index_name)

        # 3. Realizar la búsqueda vectorial
        if verbose:
            print(f"🎯 Buscando {top_k} documentos más similares...")
        resultados = index.query(
            vector=query_embedding,
            top_k=top_k,
            include_values=False,  # No incluir los vectores completos (ahorra ancho de banda)
            include_metadata=True,  # Incluir metadatos con el texto
            namespace=namespace
            # filter={"source": {"$eq": "manual_pld_2025.pdf"}}   # 🎯 solo busca en este PDF
        )

        # 4. Procesar resultados
        documentos_encontrados = []

        if verbose:
            print(f"✨ Encontrados {len(resultados.matches)} resultados:")
            print("-" * 60)

        for i, match in enumerate(resultados.matches, 1):
            # Extraer número de página del chunk_id o metadata
            pagina = "N/A"
            if match.metadata:
                # Buscar página en diferentes campos posibles
                if 'page' in match.metadata:
                    pagina = match.metadata['page']
                elif 'page_number' in match.metadata:
                    pagina = match.metadata['page_number']
                else:
                    # Intentar extraer de chunk_id si contiene información de página
                    chunk_id = match.metadata.get('chunk_id', '')
                    if isinstance(chunk_id, (int, str)):
                        # Estimación básica: asumiendo ~2-3 chunks por página
                        try:
                            chunk_num = int(chunk_id)
                            pagina = f"~{(chunk_num // 2) + 1}"  # Estimación
                        except (ValueError, TypeError):
                            pagina = "N/A"

            documento = {
                "posicion": i,
                "id": match.id,
                "score": round(match.score, 4),
                "texto": match.metadata.get("text", "No disponible"),
                "fuente": match.metadata.get("source", "Desconocida"),
                "pagina": pagina,
                "chunk_id": match.metadata.get("chunk_id", "N/A"),
                "metadata_completa": match.metadata
            }

            documentos_encontrados.append(documento)

            # Mostrar resultado solo si verbose está activado
            if verbose:
                print(f"🔹 Resultado {i}:")
                print(f"   📄 Fuente: {documento['fuente']}")
                print(f"   📄 Página: {documento['pagina']}")
                print(f"   🆔 ID: {documento['id']}")
                print(f"   📊 Similitud: {documento['score']:.4f}")
                print(f"   📝 Texto: {documento['texto'][:200]}...")
                print()

        # 5. Preparar respuesta estructurada
        respuesta = {
            "consulta": texto_consulta,
            "total_resultados": len(documentos_encontrados),
            "documentos": documentos_encontrados,
            "mejor_resultado": documentos_encontrados[0] if documentos_encontrados else None,
            "index_usado": index_name,
            "namespace_usado": namespace
        }

        if verbose:
            print("🎉 Búsqueda completada exitosamente!")
        return respuesta

    except Exception as e:
        print(f"❌ Error en la consulta: {e}")
        print(f"Tipo de error: {type(e).__name__}")
        return None

# Función auxiliar para buscar y generar respuesta con LLM
def preguntar_con_contexto(pregunta, pc, index_name, llm, namespace="default", top_k=3, verbose=True):
    """
    Función que combina la búsqueda vectorial con un LLM para generar respuestas contextualizadas.

    Parámetros:
    - pregunta (str): La pregunta del usuario
    - pc: Cliente de Pinecone inicializado
    - index_name (str): Nombre del índice en Pinecone
    - llm: Modelo de lenguaje (ChatOpenAI)
    - namespace (str): Namespace donde buscar
    - top_k (int): Número de documentos a usar como contexto
    - verbose (bool): Si imprimir logs detallados (default: True)

    Retorna:
    - str: Respuesta generada por el LLM basada en el contexto encontrado
    """
    timestamp = datetime.datetime.now().strftime("%H:%M:%S.%f")[:-3]
    execution_id = f"[{timestamp}]"

    try:
        if verbose:
            print(f"{execution_id} 🤔 Pregunta: '{pregunta}'")
            print(f"{execution_id} 🔍 Buscando {top_k} documentos relevantes...")

        # 1. Buscar documentos relevantes (SIN logs duplicados)
        resultados = consultar_pinecone(pregunta, pc, index_name, namespace, top_k, verbose=False)

        if not resultados or not resultados["documentos"]:
            return "❌ No se encontraron documentos relevantes para responder tu pregunta."

        if verbose:
            print(f"✨ Encontrados {len(resultados['documentos'])} documentos relevantes")
            print(f"{execution_id} 📋 Fuentes encontradas:")
            for i, doc in enumerate(resultados['documentos'][:5], 1):  # Mostrar solo los primeros 5
                pagina_info = f" | Pág. {doc['pagina']}" if doc['pagina'] != "N/A" else ""
                print(f"{execution_id} - {i}. {doc['fuente']}{pagina_info} (similitud: {doc['score']:.3f})  📝 Texto: {doc['texto'][:200]}...")

        # 2. Construir contexto con los mejores resultados (incluyendo página)
        contexto = "\n\n".join([
            f"Documento {i+1} (Página {doc['pagina']}): {doc['texto']}"
            for i, doc in enumerate(resultados["documentos"])
        ])

        # 3. Crear prompt con contexto
        prompt_con_contexto = f"""
Basándote en la siguiente información de documentos, responde la pregunta del usuario de manera clara y precisa.

CONTEXTO:
{contexto}

PREGUNTA: {pregunta}

INSTRUCCIONES:
- Usa solo la información proporcionada en el contexto
- Si la información no es suficiente, indícalo claramente
- Sé conciso pero completo en tu respuesta
- Si hay múltiples fuentes, puedes mencionarlas con sus páginas correspondientes

RESPUESTA:"""

        # 4. Generar respuesta con el LLM
        if verbose:
            print("🧠 Generando respuesta con IA...")
        respuesta = llm.invoke(prompt_con_contexto)

        if verbose:
            print("✅ Respuesta generada:")
            print("-" * 50)
            print(respuesta.content)
            print("-" * 50)
            print("✅ Contexto:")
            print(contexto)

        return {
            "pregunta": pregunta,
            "respuesta": respuesta.content,
            "contexto_usado": contexto,
            "documentos_fuente": resultados["documentos"],
            "total_documentos": len(resultados["documentos"])
        }

    except Exception as e:
        print(f"❌ Error al generar respuesta: {e}")
        return f"Error: {e}"

In [27]:

print("-" * 40)

respuesta_ai = preguntar_con_contexto(
    pregunta="¿cuales son las obligaciones de un desarrollador?",
    pc=pc,
    index_name="efisys-wiki-knowledge",
    llm=llm,
    namespace="dev-pdf-docs",
    top_k=5,
    verbose=True  # Solo logs esenciales, sin duplicación
)

----------------------------------------
[18:35:34.557] 🤔 Pregunta: '¿cuales son las obligaciones de un desarrollador?'
[18:35:34.557] 🔍 Buscando 5 documentos relevantes...
✨ Encontrados 5 documentos relevantes
[18:35:34.557] 📋 Fuentes encontradas:
[18:35:34.557] - 1. Estandares_Fabrica.pdf | Pág. 53.0 (similitud: 0.645)  📝 Texto: . Es el responsable de darle seguimiento a los desarrollos que va a recibir con el fin de que lleguen en tiempo y forma para su integración. 10. Debe tener una constante comunicación con los líderes d...
[18:35:34.557] - 2. Estandares_Fabrica.pdf | Pág. 53.0 (similitud: 0.632)  📝 Texto: . 5. Notificar a la fábrica de desarrollo sobre cualquier modificación que surja en cuanto a la manera en que se está trabajando. 6. Tiene la obligación de que cualquier solicitud de mejora a los desa...
[18:35:34.557] - 3. Estandares_Fabrica.pdf | Pág. 51.0 (similitud: 0.609)  📝 Texto: Responsabilidades y obligaciones   Por parte del Desarrollador  1. Deberá realizar  las pru