In [None]:
#Realizado por Luis Burbano, Cesar Loor, Sebastian Torres

In [None]:
import pandas as pd
from sentence_transformers import SentenceTransformer
import chromadb
from chromadb.config import Settings
from chromadb import Client
from langchain_community.llms.ollama import Ollama
from langchain_core.messages import HumanMessage, AIMessage
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder

In [None]:
# Cargar el archivo CSV con delimitador ;
file_path = 'Base_conocimiento_pre.csv'  # Actualiza el |path si es necesario
df = pd.read_csv(file_path, delimiter=';')

In [None]:
df.head(5)

In [None]:
# Limpiar datos faltantes en la columna 'Pregunta'
df['Pregunta'] = df['Pregunta'].fillna('')

In [None]:
df.head(5)

In [None]:
# Cargar el modelo de embeddings
model = SentenceTransformer('all-MiniLM-L6-v2')

In [None]:
# Crear embeddings para las preguntas
df['question_embeddings'] = df['Pregunta'].apply(lambda x: model.encode(x).tolist())

In [None]:
# Configurar Chroma
settings = Settings()
client = Client(settings=settings)

In [None]:
# Crear una colección
collection = client.create_collection(name="qa_collection2")

In [None]:
# Agregar vectores a la colección
for index, row in df.iterrows():
    collection.add(
        documents=[row['Pregunta']],
        embeddings=[row['question_embeddings']],
        ids=[str(index)]  # Cambiado metadatas a ids
    )

In [None]:
def obtener_respuesta(pregunta: str, collection, df, model):
    """
    Obtiene la mejor respuesta para una pregunta dada usando la colección y el modelo de embeddings.
    """
    query_embedding = model.encode(pregunta).tolist()
    results = collection.query(query_embeddings=[query_embedding], n_results=1)
    
    ids_list = results['ids'][0]
    distances_list = results['distances'][0]
    
    if not ids_list:
        return None, float('inf')
    
    best_result = sorted(zip(ids_list, distances_list), key=lambda x: x[1])[0]
    doc_id, distance = best_result
    index = int(doc_id)
    respuesta = df.loc[index, 'Respuesta']
    
    return respuesta, distance

In [None]:
# Configuración del modelo Llama3
llm = Ollama(model="llama3")


In [None]:
prompt_template = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            """Eres una IA llamada Espesito. Tu tarea principal es responder preguntas simples sobre la Universidad de las Fuerzas Armadas "ESPE", basándote en la información proporcionada en las preguntas frecuentes.
            Cuando no tengas una respuesta exacta, responde de acuerdo a lo que has aprendido y el contexto dado en el historial de chat.""",
        ),
        MessagesPlaceholder(variable_name="chat_history"),
        ("human", "{input}"),
    ]
)


In [None]:
chain = prompt_template | llm

In [None]:
def chat():
    chat_history = []
    umbral_similitud = 0.5  # Ajusta este umbral según sea necesario
    while True:
        pregunta = input("You: ")
        if pregunta.lower() == "adios":
            return
        
        # Primero, intenta obtener una respuesta de Chroma
        answer, distance = obtener_respuesta(pregunta, collection, df, model)
        
        if answer and distance < umbral_similitud:
            response = answer
        else:
            # Si no hay respuesta en Chroma o la similitud es baja, utiliza el modelo Llama3
            response = chain.invoke({"input": pregunta, "chat_history": chat_history})
        
        chat_history.append(HumanMessage(content=pregunta))
        chat_history.append(AIMessage(content=response))
        print("_" * 50)
        print("IA: " + response)

In [None]:
import pandas as pd
from langchain.schema import Document


# Convertir el DataFrame en documentos
documents = []
for index, row in df.iterrows():
    # Suponiendo que la columna 'text' contiene el contenido relevante
    content = row['Respuesta']
    document = Document(page_content=content)
    documents.append(document)


In [None]:
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import Chroma

# Configura el modelo de embeddings
embedding_model = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")

# Crea los embeddings para los documentos
document_embeddings = embedding_model.embed_documents([doc.page_content for doc in documents])

# Configura la base de datos vectorial
vector_store = Chroma.from_documents(
    documents,
    embedding_model,
    collection_name="my_collection"
)


In [None]:
from langchain_community.llms.ollama import Ollama
from langchain.prompts import ChatPromptTemplate

# Configura el modelo Llama3
llm = Ollama(model="llama3")

# Configura el template del prompt
prompt_template = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            """Eres una IA llamada Espesito. Tu tarea principal es responder preguntas simples sobre la Universidad de las Fuerzas Armadas "ESPE", basándote en la información proporcionada en las preguntas frecuentes.
            Cuando no tengas una respuesta exacta, responde de acuerdo a lo que has aprendido y el contexto dado en el historial de chat.""",
        ),
        ("human", "{input}"),
    ]
)


In [None]:
def chat():
    chat_history = []
    umbral_similitud = 0.5  # Ajusta este umbral según sea necesario
    while True:
        pregunta = input("You: ")
        if pregunta.lower() == "adios":
            return
        
        # Primero, intenta obtener una respuesta de Chroma
        answer, distance = obtener_respuesta(pregunta, collection, df, embedding_model)
        
        if answer and distance < umbral_similitud:
            response = answer
        else:
            # Si no hay respuesta en Chroma o la similitud es baja, utiliza el modelo Llama3
            response = chain.invoke({"input": pregunta, "chat_history": chat_history})
        
        # Verifica si response es un diccionario y extrae el texto adecuado
        if isinstance(response, dict):
            response_text = response.get('text', 'No response text found')
        else:
            response_text = response
        
        chat_history.append({"role": "user", "content": pregunta})
        chat_history.append({"role": "assistant", "content": response_text})
        print("_" * 50)
        print("IA: " + response_text)


In [None]:
import streamlit as st
import ollama
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.vectorstores import Chroma
from langchain_community.embeddings import OllamaEmbeddings

st.title("Chat with Webpage 🌐")
st.caption("This app allows you to chat with a webpage using local Llama-3 and RAG")

webpage_url = st.text_input("Enter Webpage URL", type="default")

if webpage_url:
    loader = WebBaseLoader(webpage_url)
    docs = loader.load()
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=10)
    splits = text_splitter.split_documents(docs)
    embeddings = OllamaEmbeddings(model="llama3")
 
    vectorstore = Chroma.from_documents(documents=splits, embedding=embeddings)

    def ollama_llm(question, context):
        formatted_prompt = f"Question: {question}\n\nContext: {context}"
        response = ollama.chat(model='llama3', messages=[{'role': 'user', 'content': formatted_prompt}])
        return response['message']['content']

    retriever = vectorstore.as_retriever()

    def combine_docs(docs):
        return "\n\n".join(doc.page_content for doc in docs)

    def rag_chain(question):
        retrieved_docs = retriever.invoke(question)
        formatted_context = combine_docs(retrieved_docs)
        return ollama_llm(question, formatted_context)

    st.success(f"Loaded {webpage_url} successfully!")
    prompt = st.text_input("Ask any question about the webpage")

    if prompt:
        result = rag_chain(prompt)
        st.write(result)



In [None]:
import os
import pandas as pd
from pathlib import Path
from langchain.llms import Ollama
from langchain.embeddings import OllamaEmbeddings
from langchain.vectorstores import Chroma
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate
from langchain.schema import Document

# Configuración de las variables de entorno
os.environ['CHROMA_DB_PATH'] = './chroma_db_data'

# Cargar datos desde un CSV usando pandas
file_path = 'Base_conocimiento_pre.csv'
df2 = pd.read_csv(file_path, delimiter=';')

# Suponiendo que la columna de interés se llama 'Respuesta'
texts = df2['Respuesta'].tolist()

# Convertir textos a objetos Document
documents = [Document(page_content=text) for text in texts]

# Dividir documentos en fragmentos
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=10)
splits = text_splitter.split_documents(documents)

# Crear el cliente de Chroma DB y el vector store
chroma_collection = Chroma.from_documents(documents=splits, embedding=OllamaEmbeddings(model="llama3"))

# Inicializar Ollama y el contexto de servicio
llm = Ollama(model="llama3")

# Crear el prompt para el QA
prompt_template = PromptTemplate(
    input_variables=["context", "question"],
    template="Question: {question}\n\nContext: {context}"
)

# Crear la cadena RetrievalQA
retriever = chroma_collection.as_retriever()
qa_chain = RetrievalQA.from_chain_type(
    llm=llm,
    chain_type="stuff",
    retriever=retriever,
    chain_kwargs={"prompt": prompt_template}
)

# Función para realizar consultas
def perform_query(query):
    response = qa_chain({"question": query})
    return response['result']

# Realizar una consulta y mostrar la respuesta
query = "What are the thoughts on food quality?"
response = perform_query(query)
print(response)


In [None]:
import os
import pandas as pd
from pathlib import Path
from langchain.llms import Ollama
from langchain.embeddings import OllamaEmbeddings
from langchain.vectorstores import Chroma
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate
from langchain.schema import Document


In [None]:

# Configuración de las variables de entorno
os.environ['CHROMA_DB_PATH'] = './chroma_db_data'

# Cargar datos desde un CSV usando pandas
file_path = 'Base_conocimiento_pre.csv'
df = pd.read_csv(file_path, delimiter=';')


In [None]:
from sentence_transformers import SentenceTransformer
import chromadb
from chromadb.config import Settings

# Cargar el modelo para crear embeddings
model = SentenceTransformer('distilbert-base-nli-stsb-mean-tokens')

# Crear embeddings para preguntas y respuestas
df['embedding'] = df['Pregunta'].apply(lambda x: model.encode(x).tolist())

# Inicializar Chroma sin `collection`
client = chromadb.Client(Settings())


In [None]:
# Dividir documentos en fragmentos
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=10)
splits = text_splitter.split_documents(documents)

# Crear el cliente de Chroma DB y el vector store
chroma_collection = Chroma.from_documents(documents=splits, embedding=OllamaEmbeddings(model="llama3"))


In [None]:
# Inicializar Ollama y el contexto de servicio
llm = Ollama(model="llama3")

In [None]:
from langchain_community.llms import Ollama
from langchain_community.document_loaders import WebBaseLoader
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_core.prompts import ChatPromptTemplate
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chains import create_retrieval_chain

# Configuración del modelo de embeddings
model_name = "sentence-transformers/all-mpnet-base-v2"
model_kwargs = {'device': 'cpu'}
encode_kwargs = {'normalize_embeddings': False}
hf = HuggingFaceEmbeddings(
    model_name=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs
)

# Invoke chain with RAG context
llm = Ollama(model="llama3")

# Load page content
loader = WebBaseLoader("https://docs.smith.langchain.com/user_guide")
docs = loader.load()

# Vector store things
text_splitter = RecursiveCharacterTextSplitter()
split_documents = text_splitter.split_documents(docs)
vector_store = Chroma.from_documents(split_documents, hf)

# Prompt construction
prompt = ChatPromptTemplate.from_template(
    """
    Answer the following question only based on the given context
    
    <context>
    {context}
    </context>
    
    Question: {input}
    """
)

# Retrieve context from vector store
docs_chain = create_stuff_documents_chain(llm, prompt)
retriever = vector_store.as_retriever()
retrieval_chain = create_retrieval_chain(retriever, docs_chain)

# Winner winner chicken dinner
response = retrieval_chain.invoke({"input": "how can langsmith help with testing?"})
print(":::ROUND 2:::")
print(response["answer"])


In [None]:
from langchain_community.llms import Ollama
from langchain_community.document_loaders import CSVLoader
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_core.prompts import ChatPromptTemplate
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chains import create_retrieval_chain

# Configura el modelo de embeddings
model_name = "sentence-transformers/all-mpnet-base-v2"
model_kwargs = {'device': 'cpu'}
encode_kwargs = {'normalize_embeddings': False}
hf = HuggingFaceEmbeddings(
    model_name=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs
)

# Configura el CSVLoader para tu archivo
loader = CSVLoader(
    file_path='./Base_conocimiento_pre.csv',
    csv_args={
        'delimiter': ';',
        'quotechar': '"',
        'fieldnames': ['Index', 'Pregunta', 'Respuesta']
    }
)

# Cargar el archivo CSV
docs = loader.load()

# Vector store things
text_splitter = RecursiveCharacterTextSplitter()
split_documents = text_splitter.split_documents(docs)
vector_store = Chroma.from_documents(split_documents, hf)

# Prompt construction
prompt = ChatPromptTemplate.from_template(
    """
    Answer the following question only based on the given context
    
    <context>
    {context}
    </context>
    
    Question: {input}
    """
)

# Retrieve context from vector store
llm = Ollama(model="llama3")
docs_chain = create_stuff_documents_chain(llm, prompt)
retriever = vector_store.as_retriever()
retrieval_chain = create_retrieval_chain(retriever, docs_chain)

# Winner winner chicken dinner
response = retrieval_chain.invoke({"input": "¿Dónde se encuentra el departamento de computación?"})
print(":::ROUND 2:::")
print(response["answer"])


In [None]:
import pandas as pd

file_path = './Base_conocimiento_pre.csv'

try:
    df = pd.read_csv(file_path, delimiter=';')
    print("Archivo CSV cargado con Pandas.")
    print(df.head())  # Muestra las primeras filas del DataFrame para verificar
except Exception as e:
    print(f"Error al cargar el archivo CSV con Pandas: {e}")


In [None]:
import pandas as pd

# Ruta del archivo CSV
file_path = './Base_conocimiento_pre.csv'

# Cargar el archivo CSV con pandas
df = pd.read_csv(file_path, delimiter=';')

# Mostrar las primeras filas del DataFrame para verificar
print(df.head())


In [None]:
import pandas as pd
from langchain_core.documents import Document
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_core.prompts import ChatPromptTemplate
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chains import create_retrieval_chain
from langchain_community.llms import Ollama

# Ruta del archivo CSV
file_path = './Base_conocimiento_pre.csv'

# Cargar el archivo CSV con pandas
df = pd.read_csv(file_path, delimiter=';')

# Convertir DataFrame a una lista de documentos
docs = [Document(page_content=row['Respuesta'], metadata={"id": row['n']}) for index, row in df.iterrows()]

print(f"Documentos cargados: {len(docs)}")

# Configurar el modelo de embeddings
model_name = "sentence-transformers/all-mpnet-base-v2"
model_kwargs = {'device': 'cpu'}
encode_kwargs = {'normalize_embeddings': False}
hf_embeddings = HuggingFaceEmbeddings(
    model_name=model_name,
    model_kwargs=model_kwargs,
    encode_kwargs=encode_kwargs
)

# Configurar el vector store con Chroma
text_splitter = RecursiveCharacterTextSplitter()
split_documents = text_splitter.split_documents(docs)
vector_store = Chroma.from_documents(split_documents, hf_embeddings)

# Configurar el prompt
prompt = ChatPromptTemplate.from_template(
    """
    Answer the following question only based on the given context
    
    <context>
    {context}
    </context>
    
    Question: {input}
    """
)

# Configurar el modelo LLM
llm = Ollama(model="llama3")

# Configurar la cadena de recuperación
docs_chain = create_stuff_documents_chain(llm, prompt)
retriever = vector_store.as_retriever()
retrieval_chain = create_retrieval_chain(retriever, docs_chain)

# Realizar una consulta
response = retrieval_chain.invoke({"input": "¿Dónde se encuentra el departamento de computación?"})
print(":::ROUND 2:::")
print(response["answer"])


In [None]:
# Realizar una consulta
response = retrieval_chain.invoke({"input": "¿Cuáles son mis derechos como estudiante?"})
print(":::ROUND 2:::")
print(response["answer"])

In [None]:
# Realizar una consulta
response = retrieval_chain.invoke({"input": "¿Entonces que pasa si tengo un problema con un profesor?"})
print(":::ROUND 2:::")
print(response["answer"])

In [None]:
# Realizar una consulta
response = retrieval_chain.invoke({"input": "Quiero hacer pasantias en la universidad pero no se con quien y soy de software¿Con quien debo hablar?"})
print(":::ROUND 2:::")
print(response["answer"])

In [None]:
# Realizar una consulta
response = retrieval_chain.invoke({"input": "¿Dónde se encuentra el psicólogo de la universidad?"})
print(":::ROUND 2:::")
print(response["answer"])

In [None]:
import pandas as pd
import torch
from sentence_transformers import SentenceTransformer
import chromadb
from chromadb.config import Settings
from chromadb import Client
from langchain_community.llms.ollama import Ollama
from langchain_core.messages import HumanMessage, AIMessage
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import Chroma
from langchain_core.documents import Document

# Cargar el archivo CSV con delimitador ;
file_path = 'Base_conocimiento_pre.csv'
df = pd.read_csv(file_path, delimiter=';')
df['Pregunta'] = df['Pregunta'].fillna('')

# Dividir los datos en fragmentos si es necesario
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
documents = [Document(page_content=row['Pregunta']) for _, row in df.iterrows()]
all_splits = text_splitter.split_documents(documents)

# Crear embeddings para las preguntas
model_name = "sentence-transformers/all-mpnet-base-v2"
model_kwargs = {"device": "cuda" if torch.cuda.is_available() else "cpu"}

try:
    embeddings_model = HuggingFaceEmbeddings(model_name=model_name, model_kwargs=model_kwargs)
except Exception as ex:
    print("Exception: ", ex)
    local_model_path = "sentence-transformers/all-MiniLM-L6-v2"
    print(f"Use alternative (local) model: {local_model_path}\n")
    embeddings_model = HuggingFaceEmbeddings(model_name=local_model_path, model_kwargs=model_kwargs)

# Configurar Chroma
settings = Settings()
client = Client(settings=settings)
collection = client.create_collection(name="qa_collection")

# Generar embeddings para todos los fragmentos
all_embeddings = [embeddings_model.embed_documents([doc.page_content])[0] for doc in all_splits]
ids = [str(i) for i in range(len(all_splits))]

# Agregar todos los documentos a la colección
collection.add(
    documents=[doc.page_content for doc in all_splits],
    embeddings=all_embeddings,
    ids=ids
)

def obtener_respuesta(pregunta: str, collection, df, model):
    # Obtener el embedding de la pregunta
    query_embedding = model.embed_documents([pregunta])[0]

    # Realizar la consulta en la colección usando similarity_search
    results = collection.query(
        query_embeddings=[query_embedding],  # Consulta con embeddings
        n_results=3  # Número de resultados a devolver
    )

    ids_list = results['ids'][0]
    distances_list = results['distances'][0]

    if not ids_list:
        return None, float('inf'), []

    results_combined = list(zip(ids_list, distances_list))
    sorted_results = sorted(results_combined, key=lambda x: x[1])
    best_result = sorted_results[0]
    doc_id, distance = best_result
    index = int(doc_id)
    respuesta = df.loc[index, 'Respuesta']

    # Contexto adicional
    additional_context = [df.loc[int(doc_id), 'Respuesta'] for doc_id, _ in sorted_results[1:3]]

    return respuesta, distance, additional_context

# Configuración del modelo Ollama
llm = Ollama(model="llama3")

prompt_template = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            """Eres una IA llamada Espesito. Tu tarea principal es responder preguntas simples sobre la Universidad de las Fuerzas Armadas "ESPE", basándote en la información proporcionada en las preguntas frecuentes.
            Cuando no tengas una respuesta exacta, responde de acuerdo a lo que has aprendido y el contexto dado en el historial de chat. Además siempre debes responder en español""",
        ),
        MessagesPlaceholder(variable_name="chat_history"),
        ("human", "{input}"),
    ]
)

chain = prompt_template | llm

def chat():
    chat_history = []
    umbral_similitud = 0.5
    while True:
        pregunta = input("You: ")
        if pregunta.lower() == "adios":
            break
        
        answer, distance, additional_context = obtener_respuesta(pregunta, collection, df, embeddings_model)
        
        if answer and distance < umbral_similitud:
            context = f"La respuesta a tu pregunta es: {answer}. Información adicional: {' '.join(additional_context)}"
            chat_history.append(HumanMessage(content=pregunta))
            chat_history.append(AIMessage(content=answer))
            print(f"Espesito: {answer}")
        else:
            response = chain.invoke({"input": pregunta, "chat_history": chat_history})
            chat_history.append(HumanMessage(content=pregunta))
            chat_history.append(AIMessage(content=response))
            print(f"Espesito: {response}")

# Ejecutar el chat
chat()


In [None]:
chat()

In [None]:
import pandas as pd
import torch
from sentence_transformers import SentenceTransformer
import chromadb
from chromadb.config import Settings
from chromadb import Client
from langchain_community.llms.ollama import Ollama
from langchain_core.messages import HumanMessage, AIMessage
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import Chroma
from langchain_core.documents import Document

# Cargar el archivo CSV con delimitador ;
file_path = 'Base_conocimiento_pre.csv'
df = pd.read_csv(file_path, delimiter=';')
df['Pregunta'] = df['Pregunta'].fillna('')

# Dividir los datos en fragmentos si es necesario
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
documents = [Document(page_content=row['Pregunta']) for _, row in df.iterrows()]
all_splits = text_splitter.split_documents(documents)

# Crear embeddings para las preguntas
model_name = "sentence-transformers/all-mpnet-base-v2"
model_kwargs = {"device": "cuda" if torch.cuda.is_available() else "cpu"}

try:
    embeddings_model = HuggingFaceEmbeddings(model_name=model_name, model_kwargs=model_kwargs)
except Exception as ex:
    print("Exception: ", ex)
    local_model_path = "sentence-transformers/all-MiniLM-L6-v2"
    print(f"Use alternative (local) model: {local_model_path}\n")
    embeddings_model = HuggingFaceEmbeddings(model_name=local_model_path, model_kwargs=model_kwargs)

# Configurar Chroma
settings = Settings()
client = Client(settings=settings)
collection = client.create_collection(name="qa_collection")

# Generar embeddings para todos los fragmentos
all_embeddings = [embeddings_model.embed_documents([doc.page_content])[0] for doc in all_splits]
ids = [str(i) for i in range(len(all_splits))]

# Agregar todos los documentos a la colección
collection.add(
    documents=[doc.page_content for doc in all_splits],
    embeddings=all_embeddings,
    ids=ids
)

def obtener_respuesta(pregunta: str, collection, df, model):
    # Obtener el embedding de la pregunta
    query_embedding = model.embed_documents([pregunta])[0]

    # Realizar la consulta en la colección usando similarity_search
    results = collection.query(
        query_embeddings=[query_embedding],  # Consulta con embeddings
        n_results=3  # Número de resultados a devolver
    )

    ids_list = results['ids'][0]
    distances_list = results['distances'][0]

    if not ids_list:
        return None, float('inf'), []

    results_combined = list(zip(ids_list, distances_list))
    sorted_results = sorted(results_combined, key=lambda x: x[1])
    best_result = sorted_results[0]
    doc_id, distance = best_result
    index = int(doc_id)
    respuesta = df.loc[index, 'Respuesta']

    # Contexto adicional
    additional_context = [df.loc[int(doc_id), 'Respuesta'] for doc_id, _ in sorted_results[1:3]]

    return respuesta, distance, additional_context

# Configuración de los modelos Ollama
llm_gemma2 = Ollama(model="gemma2")
llm_llama3 = Ollama(model="llama3")

prompt_template_gemma2 = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            """Eres una IA llamada Espesito. Tu tarea principal es responder preguntas simples sobre la Universidad de las Fuerzas Armadas "ESPE", basándote en la información proporcionada en las preguntas frecuentes.
            Cuando no tengas una respuesta exacta, responde de acuerdo a lo que has aprendido y el contexto dado en el historial de chat.""",
        ),
        MessagesPlaceholder(variable_name="chat_history"),
        ("human", "{input}"),
    ]
)

prompt_template_llama3 = ChatPromptTemplate.from_messages(
    [
        (
            "system",
            """Eres una IA llamada Espesito. Tu tarea principal es responder preguntas detalladas y complejas sobre la Universidad de las Fuerzas Armadas "ESPE", basándote en la información proporcionada en las preguntas frecuentes.
            Usa toda la información que tengas disponible para proporcionar una respuesta completa y precisa.""",
        ),
        MessagesPlaceholder(variable_name="chat_history"),
        ("human", "{input}"),
    ]
)

chain_gemma2 = prompt_template_gemma2 | llm_gemma2
chain_llama3 = prompt_template_llama3 | llm_llama3

def chat():
    chat_history = []
    umbral_similitud = 0.5
    while True:
        pregunta = input("You: ")
        if pregunta.lower() == "adios":
            break
        
        # Determinar la complejidad de la pregunta
        if len(pregunta.split()) > 10:  # Umbral de complejidad
            model = llm_llama3
            chain = chain_llama3
        else:
            model = llm_gemma2
            chain = chain_gemma2

        answer, distance, additional_context = obtener_respuesta(pregunta, collection, df, embeddings_model)
        
        if answer and distance < umbral_similitud:
            context = f"La respuesta a tu pregunta es: {answer}. Información adicional: {' '.join(additional_context)}"
            chat_history.append(HumanMessage(content=pregunta))
            chat_history.append(AIMessage(content=answer))
            print(f"Espesito: {answer}")
        else:
            response = chain.invoke({"input": pregunta, "chat_history": chat_history})
            chat_history.append(HumanMessage(content=pregunta))
            chat_history.append(AIMessage(content=response))
            print(f"Espesito: {response}")

# Ejecutar el chat
chat()


In [1]:
import pandas as pd
import torch
from sentence_transformers import SentenceTransformer
import chromadb
from chromadb.config import Settings
from chromadb import Client
from langchain_community.llms.ollama import Ollama
from langchain_core.messages import HumanMessage, AIMessage
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import Chroma
from langchain_core.documents import Document
from pdfminer.high_level import extract_text
import requests
from bs4 import BeautifulSoup

  from tqdm.autonotebook import tqdm, trange





In [2]:
import re
import PyPDF2
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_core.documents import Document
def extraer_texto_pdf(pdf_path):
    texto_completo = ""
    with open(pdf_path, 'rb') as archivo_pdf:
        lector_pdf = PyPDF2.PdfReader(archivo_pdf)
        for pagina in lector_pdf.pages:
            texto_completo += pagina.extract_text()
    return texto_completo

def limpiar_texto(texto):
    # Eliminar saltos de línea innecesarios y caracteres especiales
    texto = re.sub(r'\n+', '\n', texto)
    texto = re.sub(r'\s+', ' ', texto)
    texto = re.sub(r'[^\x00-\x7F]+', ' ', texto)  # Eliminar caracteres no ASCII
    return texto.strip()

def segmentar_texto(texto):
    # Puedes segmentar el texto en fragmentos lógicos basados en títulos o párrafos
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
    
    # Opcional: Agregar lógica para identificar y mantener secciones importantes
    secciones = re.split(r'\n\s*\n', texto)  # Dividir por párrafos
    
    documentos = []
    for seccion in secciones:
        # Puedes agregar etiquetas para secciones importantes si es necesario
        fragmentos = text_splitter.split_text(seccion)
        documentos.extend([Document(page_content=frag) for frag in fragmentos])
    
    return documentos

# Función para extraer y procesar texto de una página web
def cargar_web(url):
    response = requests.get(url)
    soup = BeautifulSoup(response.text, 'html.parser')
    
    # Extraer el contenido de la página web
    text = soup.get_text()
    
    # Dividir el texto en fragmentos si es necesario
    documents = [Document(page_content=text)]
    return documents

In [3]:
# Ruta al archivo PDF
pdf_path = 'preguntas.pdf'

# Proceso de preprocesamiento
texto_extraido = extraer_texto_pdf(pdf_path)
texto_limpio = limpiar_texto(texto_extraido)
documentos_segmentados = segmentar_texto(texto_limpio)

# Ahora tienes una lista de `Document` listos para cargar en Chroma
for documento in documentos_segmentados:
    print(documento.page_content) 

La Universidad de las Fuerzas Armadas ( ESPE ), tiene su origen cuando el 16 de junio de 1922 se crea la  Escuela de Oficiales de Ingenieros , mediante Decreto del Presidente de la Rep blica, Dr. Jos  Luis Tamayo, publicado en el Registro Oficial 521; en vista de la necesidad de tecnificar los mandos en las especialidades de ingenier a y artiller a el 22 de octubre de 1936, durante la Presidencia de Federico P ez, se cambia el nombre por  Escuela de Artiller a e Ingenieros . Al ampliar su pensum acad mico y nivelarlo con las dem s universidades ecuatorianas, en 1948 se la denomin  Escuela T cnica de Ingenieros. Ante la crisis universitaria del pa s y las necesidades de las Fuerzas Armadas, en 1972 el Gral. Guillermo Rodr guez Lara, Presidente de la Rep blica abre las puertas para que ingresen es tudiantes civiles. El Depar tamento de Ciencias de la C omputaci n (DCCO ) es el departamento encargado de las carreras de Ingenier a en Software y T ecnolog  as d e la i nformaci  n. Algunas
e

In [4]:
# Cargar y combinar el contenido del PDF y la web
web_documents = cargar_web('https://www.espe.edu.ec/')

In [5]:
# Combinar todos los documentos
all_documents = documentos_segmentados + web_documents

# Dividir los documentos en fragmentos si es necesario
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
all_splits = text_splitter.split_documents(all_documents)

# Crear embeddings para los fragmentos
model_name = "sentence-transformers/all-mpnet-base-v2"
model_kwargs = {"device": "cuda" if torch.cuda.is_available() else "cpu"}

In [6]:
try:
    embeddings_model = HuggingFaceEmbeddings(model_name=model_name, model_kwargs=model_kwargs)
except Exception as ex:
    print("Exception: ", ex)
    local_model_path = "sentence-transformers/all-MiniLM-L6-v2"
    embeddings_model = HuggingFaceEmbeddings(model_name=local_model_path, model_kwargs=model_kwargs)


  warn_deprecated(


In [7]:
# Configurar Chroma
settings = Settings()
client = Client(settings=settings)
collection = client.create_collection(name="qa_collection")

# Crear embeddings y cargar en Chroma
all_embeddings = [embeddings_model.embed_documents([doc.page_content])[0] for doc in all]
ids = [str(i) for i in range(len(all_documents))]

# Agregar todos los documentos a la colección
collection.add(
    documents=[doc.page_content for doc in all_documents],
    embeddings=all_embeddings,
    ids=ids
)

TypeError: 'builtin_function_or_method' object is not iterable

In [None]:
# Configuración de los modelos Ollama
llm_gemma2 = Ollama(model="gemma2")
llm_llama3 = Ollama(model="llama3")

prompt_template_gemma2 = ChatPromptTemplate.from_messages(
    [
        ("system", """Eres una IA llamada Espesito. Tu tarea principal es responder preguntas simples sobre la Universidad de las Fuerzas Armadas "ESPE", basándote en la información proporcionada en las preguntas frecuentes.
        Cuando no tengas una respuesta exacta, responde de acuerdo a lo que has aprendido y el contexto dado en el historial de chat."""),
        MessagesPlaceholder(variable_name="chat_history"),
        ("human", "{input}"),
    ]
)

prompt_template_llama3 = ChatPromptTemplate.from_messages(
    [
        ("system", """Eres una IA llamada Espesito. Tu tarea principal es responder preguntas detalladas y complejas sobre la Universidad de las Fuerzas Armadas "ESPE", basándote en la información proporcionada en las preguntas frecuentes.
        Usa toda la información que tengas disponible para proporcionar una respuesta completa y precisa."""),
        MessagesPlaceholder(variable_name="chat_history"),
        ("human", "{input}"),
    ]
)

In [None]:
chain_gemma2 = prompt_template_gemma2 | llm_gemma2
chain_llama3 = prompt_template_llama3 | llm_llama3



In [None]:
def obtener_respuesta(pregunta: str, collection, embeddings_model, umbral_similitud=0.3):
    # Crear embedding para la pregunta
    query_embedding = embeddings_model.embed_documents([pregunta])[0]
    
    # Realizar la consulta en la colección
    results = collection.query(
        query_embeddings=[query_embedding],
        n_results=3  # Aumentar el número de resultados para tener más contexto
    )
    
    ids_list = results['ids'][0]
    distances_list = results['distances'][0]

    if not ids_list:
        return None, float('inf'), []

    results_combined = list(zip(ids_list, distances_list))
    sorted_results = sorted(results_combined, key=lambda x: x[1])
    best_result = sorted_results[0]
    doc_id, distance = best_result
    
    # Obtener la respuesta más cercana y verificar si está por debajo del umbral
    if distance < umbral_similitud:
        index = int(doc_id)
        respuesta = collection.get_documents([doc_id])[0]
        additional_context = [collection.get_documents([doc_id])[0] for doc_id, _ in sorted_results[1:3]]
        return respuesta, distance, additional_context
    else:
        return None, float('inf'), []


In [None]:
def chat():
    chat_history = []
    umbral_similitud = 0.5  # Ajusta este umbral según sea necesario
    
    while True:
        pregunta = input("You: ")
        
        if pregunta.lower() == "adios":
            print("IA: ¡Adiós! Ha sido un placer hablar contigo.")
            break
        
        # Primero, intenta obtener una respuesta de Chroma
        answer, distance, additional_context = obtener_respuesta(pregunta, collection, embeddings_model)
        
        if answer and distance < umbral_similitud:
            context = f"La respuesta a tu pregunta es: {answer}. Información adicional: {' '.join(additional_context)}"
            chat_history.append(HumanMessage(content=pregunta))
            chat_history.append(AIMessage(content=answer))
            response = chain_llama3.invoke({"input": context, "chat_history": chat_history})
        else:
            # Si no hay respuesta en Chroma o la similitud es baja, utiliza el modelo Llama3 o Gemma2
            if len(pregunta.split()) > 10:
                response = chain_llama3.invoke({"input": pregunta, "chat_history": chat_history})
            else:
                response = chain_gemma2.invoke({"input": pregunta, "chat_history": chat_history})

        chat_history.append(HumanMessage(content=pregunta))
        chat_history.append(AIMessage(content=response))
        
        print("_" * 50)
        print("IA: " + response)

In [None]:
chat()

In [1]:
import re
import requests
import PyPDF2
from bs4 import BeautifulSoup
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_core.documents import Document
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.vectorstores import Chroma
from langchain_core.messages import HumanMessage, AIMessage
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_community.llms.ollama import Ollama
from chromadb.config import Settings
from chromadb import Client
import torch

# Función para extraer texto del PDF
def extraer_texto_pdf(pdf_path):
    texto_completo = ""
    with open(pdf_path, 'rb') as archivo_pdf:
        lector_pdf = PyPDF2.PdfReader(archivo_pdf)
        for pagina in lector_pdf.pages:
            texto_completo += pagina.extract_text()
    return texto_completo

# Función para extraer texto de la web
def extraer_texto_web(url):
    respuesta = requests.get(url)
    sopa = BeautifulSoup(respuesta.content, 'html.parser')
    texto = sopa.get_text()
    return texto

# Función para limpiar el texto
def limpiar_texto(texto):
    texto = re.sub(r'\n+', '\n', texto)
    texto = re.sub(r'\s+', ' ', texto)
    texto = re.sub(r'[^\x00-\x7F]+', ' ', texto)  # Eliminar caracteres no ASCII
    return texto.strip()

# Función para segmentar el texto en fragmentos
def segmentar_texto(texto):
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
    secciones = re.split(r'\n\s*\n', texto)  # Dividir por párrafos
    documentos = []
    for seccion in secciones:
        fragmentos = text_splitter.split_text(seccion)
        documentos.extend([Document(page_content=frag) for frag in fragmentos])
    return documentos

# Configuración de Chroma y modelos
settings = Settings()
client = Client(settings=settings)
collection = client.create_collection(name="qa_collection_combined")

model_name = "sentence-transformers/all-mpnet-base-v2"
model_kwargs = {"device": "cuda" if torch.cuda.is_available() else "cpu"}

try:
    embeddings_model = HuggingFaceEmbeddings(model_name=model_name, model_kwargs=model_kwargs)
except Exception as ex:
    print("Exception: ", ex)
    local_model_path = "sentence-transformers/all-MiniLM-L6-v2"
    embeddings_model = HuggingFaceEmbeddings(model_name=local_model_path, model_kwargs=model_kwargs)

llm_gemma2 = Ollama(model="gemma2")
llm_llama3 = Ollama(model="llama3")

prompt_template_gemma2 = ChatPromptTemplate.from_messages(
    [
        ("system", """Eres una IA llamada Espesito. Tu tarea principal es responder preguntas simples sobre la Universidad de las Fuerzas Armadas "ESPE", basándote en la información proporcionada en las preguntas frecuentes.
        Cuando no tengas una respuesta exacta, responde de acuerdo a lo que has aprendido y el contexto dado en el historial de chat."""),
        MessagesPlaceholder(variable_name="chat_history"),
        ("human", "{input}"),
    ]
)

prompt_template_llama3 = ChatPromptTemplate.from_messages(
    [
        ("system", """Eres una IA llamada Espesito. Tu tarea principal es responder preguntas detalladas y complejas sobre la Universidad de las Fuerzas Armadas "ESPE", basándote en la información proporcionada en las preguntas frecuentes.
        Usa toda la información que tengas disponible para proporcionar una respuesta completa y precisa."""),
        MessagesPlaceholder(variable_name="chat_history"),
        ("human", "{input}"),
    ]
)

chain_gemma2 = prompt_template_gemma2 | llm_gemma2
chain_llama3 = prompt_template_llama3 | llm_llama3

# Procesar PDF
pdf_path = 'preguntas.pdf'
texto_extraido_pdf = extraer_texto_pdf(pdf_path)
texto_limpio_pdf = limpiar_texto(texto_extraido_pdf)
documentos_segmentados_pdf = segmentar_texto(texto_limpio_pdf)

# Procesar web
url_web = 'https://www.espe.edu.ec/'
texto_extraido_web = extraer_texto_web(url_web)
texto_limpio_web = limpiar_texto(texto_extraido_web)
documentos_segmentados_web = segmentar_texto(texto_limpio_web)

# Combinar documentos de PDF y web
documentos_combinados = documentos_segmentados_pdf + documentos_segmentados_web

# Crear embeddings y cargar en Chroma
all_embeddings = [embeddings_model.embed_documents([doc.page_content])[0] for doc in documentos_combinados]
ids = [str(i) for i in range(len(documentos_combinados))]

collection.add(
    documents=[doc.page_content for doc in documentos_combinados],
    embeddings=all_embeddings,
    ids=ids
)

def obtener_respuesta(pregunta: str, collection, model):
    query_embedding = model.embed_documents([pregunta])[0]
    results = collection.query(
        query_embeddings=[query_embedding],
        n_results=3
    )
    ids_list = results['ids'][0]
    distances_list = results['distances'][0]

    if not ids_list:
        return None, float('inf')

    results_combined = list(zip(ids_list, distances_list))
    sorted_results = sorted(results_combined, key=lambda x: x[1])
    best_result = sorted_results[0]
    doc_id, distance = best_result
    respuesta = documentos_combinados[int(doc_id)].page_content
    return respuesta, distance

def chat():
    chat_history = []
    umbral_similitud = 0.5  # Ajusta este umbral según sea necesario
    while True:
        pregunta = input("You: ")
        if pregunta.lower() == "adios":
            return
        
        # Primero, intenta obtener una respuesta de Chroma
        answer, distance = obtener_respuesta(pregunta, collection, embeddings_model)
        
        if answer and distance < umbral_similitud:
            response = answer
        else:
            # Si no hay respuesta en Chroma o la similitud es baja, utiliza el modelo Llama3
            response = chain_llama3.invoke({"input": pregunta, "chat_history": chat_history})
        
        chat_history.append(HumanMessage(content=pregunta))
        chat_history.append(AIMessage(content=response))
        print("_" * 50)
        print("IA: " + response)


  warn_deprecated(
  from tqdm.autonotebook import tqdm, trange





In [11]:
from bs4 import BeautifulSoup
import requests
import PyPDF2

def extraer_texto_pdf(pdf_path):
    # Abrir y leer el archivo PDF
    texto = ""
    with open(pdf_path, 'rb') as pdf_file:
        reader = PyPDF2.PdfReader(pdf_file)
        for page in reader.pages:
            texto += page.extract_text()
    return texto

def extraer_texto_web(url):
    # Obtener el contenido de la página web
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')
    # Extraer todo el texto de la página
    texto = soup.get_text()
    return texto

# Cargar el contenido del PDF y la Web
texto_pdf = extraer_texto_pdf('preguntas.pdf')
texto_web = extraer_texto_web('https://www.espe.edu.ec/')

# Combina el texto de ambas fuentes
texto_combinado = texto_pdf + " " + texto_web


In [12]:
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_core.documents import Document
from chromadb import Client
from chromadb.config import Settings
from langchain.embeddings import SentenceTransformerEmbeddings

# Configuración de Chroma y el modelo de embeddings
client = Client(Settings())
collection = client.create_collection(name="mi_coleccion")

embeddings_model = SentenceTransformerEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")

# Divide el texto en fragmentos si es necesario
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
documents = text_splitter.split_text(texto_combinado)

# Generar embeddings para todos los fragmentos
all_splits = [Document(page_content=doc) for doc in documents]
all_embeddings = [embeddings_model.embed_documents([doc.page_content])[0] for doc in all_splits]
ids = [str(i) for i in range(len(all_splits))]

# Agregar todos los documentos a la colección en Chroma
collection.add(
    documents=[doc.page_content for doc in all_splits],
    embeddings=all_embeddings,
    ids=ids
)


In [21]:
def obtener_respuesta(pregunta, collection, embeddings_model):
    pregunta_embedding = embeddings_model.embed_query(pregunta)
    results = collection.query(query_embeddings=[pregunta_embedding], n_results=3)

    if results['documents']:
        # Selecciona la mejor respuesta
        respuesta = results['documents'][0][0]  # Accede al primer documento del primer resultado
        distancia = results['distances'][0][0]  # Accede a la primera distancia del primer resultado
        contexto_adicional = [doc[0] for doc in results['documents'][1:]]  # Extrae el contexto adicional si existe
        return respuesta, distancia, contexto_adicional
    else:
        return None, float('inf'), []  # Devolver una distancia infinita si no se encuentra nada


In [1]:
from langchain_community.document_loaders import PyPDFDirectoryLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain.schema.document import Document
from langchain_community.embeddings import OllamaEmbeddings
from langchain.vectorstores.chroma import Chroma
from langchain.prompts import ChatPromptTemplate
from langchain_community.llms.ollama import Ollama

class RAGSystem:
    def __init__(self, data_dir_path="data", db_path="chroma") -> None:
        print("Initializing RAG System")
        self.data_directory = data_dir_path
        self.db_path = db_path
        self.model_name = "llama3"
        self.llm_model = "llama3"
        self.model = Ollama(model=self.llm_model)
        self.prompt_template = """
                                Eres una IA llamada Espesito que se centra en responder preguntas pregunta sobre la
                                Universidad de las Fuerzas Armadas ESPE, debes dar respuestas simples a las preguntas y siempre que puedas usa 
                                la información que obtengas del historial del chat, además siempre debes responder en español

                                {context}

                                Question: {question}
                                Answer:
                                """
        self._setup_collection()

    def _setup_collection(self):
        pages = self._load_documents()
        chunks = self._document_splitter(pages)
        chunks = self._get_chunk_ids(chunks)
        vectordb = self._initialize_vectorDB()
        present_in_db = vectordb.get()
        ids_in_db = present_in_db["ids"]
        print(f"Number of existing ids in db: {len(ids_in_db)}")
        # Add chunks to db - check if they already exist
        chunks_to_add = [i for i in chunks if i.metadata.get("chunk_id") not in ids_in_db]
        if len(chunks_to_add) > 0:
            vectordb.add_documents(chunks_to_add, ids=[i.metadata["chunk_id"] for i in chunks_to_add])
            print(f"Added to db: {len(chunks_to_add)} records")
            vectordb.persist()
        else:
            print("No records to add")

    def _get_chunk_ids(self, chunks):
        prev_page_id = None
        for i in chunks:
            src = i.metadata.get("source")
            page = i.metadata.get("page")
            curr_page_id = f"{src}_{page}"
            if curr_page_id == prev_page_id:
                curr_chunk_index += 1
            else:
                curr_chunk_index = 0
            curr_chunk_id = f"{curr_page_id}_{curr_chunk_index}"
            prev_page_id = curr_page_id
            i.metadata["chunk_id"] = curr_chunk_id
        return chunks        

    def _retrieve_context_from_query(self, query_text):
        vectordb = self._initialize_vectorDB()
        context = vectordb.similarity_search_with_score(query_text, k=1)
        return context
    
    def _get_prompt(self, query_text):
        context = self._retrieve_context_from_query(query_text)
        context_text = "\n\n---\n\n".join([doc.page_content for doc, _score in context])
        prompt_template = ChatPromptTemplate.from_template(self.prompt_template)
        prompt = prompt_template.format(context=context_text, question=query_text)
        return prompt

    def answer_query(self, query_text):
        prompt = self._get_prompt(query_text)
        response_text = self.model.invoke(prompt)
        formatted_response = f"Response: {response_text}\n"
        return formatted_response

    def _load_documents(self):
        loader = PyPDFDirectoryLoader(self.data_directory)
        pages = loader.load()
        return pages

    def _document_splitter(self, documents):
        splitter = RecursiveCharacterTextSplitter(
            chunk_size=400,
            chunk_overlap=100,
            length_function=len,
            is_separator_regex=False,
        )
        return splitter.split_documents(documents)
    
    def _get_embedding_func(self):
        embeddings = OllamaEmbeddings(model=self.model_name)
        return embeddings
    
    def _initialize_vectorDB(self):
        return Chroma(
            persist_directory=self.db_path,
            embedding_function=self._get_embedding_func(),
        )

def chat():
    rag_system = RAGSystem()
    chat_history = []
    umbral_similitud = 0.5  # Ajusta este umbral según sea necesario

    while True:
        pregunta = input("You: ")
        if pregunta.lower() == "adios":
            return
        
        # Seleccionar el modelo y la cadena en función de la longitud de la pregunta
        if len(pregunta.split()) > 10:
            model = rag_system.llm_model
            modelo_usado = "Llama3"
        else:
            model = rag_system.llm_model
            modelo_usado = "Gemma2"

        # Mostrar el modelo que va a responder
        print(f"Modelo seleccionado: {modelo_usado}")

        # Intentar obtener una respuesta de Chroma basada en los embeddings del PDF y la web
        answer, distance, additional_context = rag_system._retrieve_context_from_query(pregunta)
        
        if answer and distance < umbral_similitud:
            # Aquí refinamos la respuesta con el modelo LLM, pero usando solo el contexto del PDF o web
            context = f"La respuesta a tu pregunta es: {answer}. Información adicional: {' '.join(additional_context)}"
            chat_history.append({"role": "user", "content": pregunta})
            chat_history.append({"role": "assistant", "content": answer})
            
            refined_response = rag_system.model.invoke(context)
            chat_history.append({"role": "assistant", "content": refined_response})
            print("_" * 50)
            print("IA: " + refined_response)
        else:
            # Si no hay respuesta en Chroma o la similitud es baja, no usar el conocimiento previo
            print("Lo siento, no encontré suficiente información en los documentos proporcionados para responder a tu pregunta.")


In [2]:
chat()

Initializing RAG System
Number of existing ids in db: 0


KeyboardInterrupt: 