In [9]:
from langchain_community.document_loaders import WebBaseLoader
from langchain.indexes.vectorstore import VectorstoreIndexCreator
from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from langchain.chains import RetrievalQA

# Configurar los embeddings de OpenAI
embeddings = OpenAIEmbeddings(model="text-embedding-3-large")

def extraer_texto_y_preguntar(urls, pregunta):
    """Carga el contenido de múltiples páginas web, lo indexa y permite hacer preguntas."""
    
    # Cargar el contenido de todas las páginas
    documentos = []
    for url in urls:
        loader = WebBaseLoader(url)
        documentos.extend(loader.load())  # Agregar documentos a la lista
    
    # Crear un índice vectorial con todos los documentos
    index = VectorstoreIndexCreator(
        embedding=embeddings
    ).from_documents(documentos)

    # Crear el modelo de lenguaje
    llm = ChatOpenAI(model_name="gpt-3.5-turbo")

    # Crear la cadena de preguntas y respuestas basada en recuperación (RetrievalQA)
    qa = RetrievalQA.from_chain_type(llm=llm, retriever=index.vectorstore.as_retriever())

    # Realizar la pregunta
    respuesta = qa.invoke(pregunta)
    
    return respuesta

# 📌 Ejemplo de uso con múltiples URLs
urls = [
    "https://spot2.mx/terminos-condiciones-broker",
    "https://spot2.mx/codigo-de-etica"
]
pregunta = "como funciona spot2"

respuesta = extraer_texto_y_preguntar(urls, pregunta)
print(f"Respuesta: {respuesta}")



Respuesta: {'query': 'como funciona spot2', 'result': 'Spot2 es una plataforma que actúa como intermediario y facilitador en las relaciones entre distintos brokers inmobiliarios, asegurando transparencia, integridad y cumplimiento de regulaciones. Spot2 regula la comunicación entre brokers, supervisa la colaboración y el flujo de información, estableciendo un marco de interacción claro y equitativo. Los usuarios aceptan estos términos al utilizar la plataforma. Spot2 prioriza la integridad y confiabilidad de las operaciones. Los detalles específicos sobre cómo funciona la plataforma y sus características adicionales pueden estar especificados en los términos y condiciones proporcionados por Spot2.'}
