# # Chatbot with ChromaDB

In [None]:
from chromadb.utils.embedding_functions import OpenAIEmbeddingFunction
from langchain.document_loaders import CSVLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.vectorstores import Chroma
from langchain_openai import ChatOpenAI, OpenAIEmbeddings
from langchain_core.runnables import RunnablePassthrough
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
import chromadb
from langchain_mongodb.chat_message_histories import MongoDBChatMessageHistory
import os
from langchain_community.embeddings.sentence_transformer import SentenceTransformerEmbeddings
import dotenv

dotenv.load_dotenv()
import warnings
from langchain_core.output_parsers import StrOutputParser

warnings.filterwarnings("ignore")

file_path = "responses.csv"
model = "gpt-3.5-turbo"
llm = ChatOpenAI(temperature=0.5, model=model, max_tokens=4096)
collection_name = "chatbot"
embedding_function = SentenceTransformerEmbeddings(model_name="all-MiniLM-L6-v2")

#MongoDB and chat history
chat_hist_msg_count = int(os.environ.get('CHAT_HISTORY_MESSAGE_COUNT', '24').strip())
chat_session_id = 1
mongo_uri = "mongodb://admin:password@localhost:27017"
mongo_db_name = "chat"
mongo_collection_name = "histories"

# ## Creating client and collection in ChromaDB

In [28]:
client = chromadb.Client()
client.heartbeat()
collection = client.get_or_create_collection(name=collection_name)

{'ids': ['479cf2cf-e702-11ee-a515-001a7dda7115',
  '47b1fe08-e702-11ee-a3b5-001a7dda7115',
  '47b448ad-e702-11ee-9133-001a7dda7115',
  '47b6458d-e702-11ee-b749-001a7dda7115',
  '47b85593-e702-11ee-9f3c-001a7dda7115',
  '47ba5205-e702-11ee-8590-001a7dda7115',
  '47bc3b49-e702-11ee-b6f7-001a7dda7115',
  '47be23f5-e702-11ee-b5b0-001a7dda7115',
  '47c00cd4-e702-11ee-9862-001a7dda7115',
  '47c1ce50-e702-11ee-a670-001a7dda7115'],
 'embeddings': [[0.03410160914063454,
   0.0840248242020607,
   0.02971142902970314,
   0.0006102523184381425,
   0.024832986295223236,
   0.020495034754276276,
   0.09105850756168365,
   -0.03928485885262489,
   0.0210853423923254,
   -0.0005621754680760205,
   0.04977497458457947,
   -0.0421338751912117,
   -0.037842798978090286,
   -0.023108292371034622,
   0.030346820130944252,
   -0.007541237398982048,
   -0.04285589978098869,
   -0.06578578799962997,
   -0.05692629888653755,
   0.025597335770726204,
   0.07266975939273834,
   -0.02979220822453499,
   -0.013449

# ## Loading the data and creating the collection

In [None]:
import uuid

loader = CSVLoader(file_path)
docs = loader.load()
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
splits = text_splitter.split_documents(docs)
for doc in docs:
    collection.add(
        ids=[str(uuid.uuid1())], metadatas=doc.metadata, documents=doc.page_content
    )

## Langchain interface
langchain_chroma = Chroma(
    client=client,
    collection_name=collection_name,
    embedding_function=embedding_function,
)


# ## Testing the chatbot and query

In [None]:
query = "que horarios tienen?"
search = langchain_chroma.similarity_search_with_score(query, k=3)
print(search[0][0].page_content)
print("score: ", search[0][1])

In [None]:
retriever = langchain_chroma.as_retriever(search_type="mmr")
prompt = """
            Hola, soy tu asistente virtual de pedidos. Estoy aquí para ayudarte a realizar tu pedido de manera rápida y eficiente. Por favor, proporcióname los siguientes detalles para poder procesar tu pedido correctamente:

            Nombre del Producto o Servicio: (Por ejemplo, "Pizza Margarita grande", "Reservación para dos personas", etc.)
            
            Cantidad: (Indica cuántas unidades del producto o servicio deseas.)
            
            Opciones Específicas: (Si el producto o servicio tiene opciones adicionales, como tamaño, color, ingredientes extra, etc., inclúyelas aquí.)
            
            Fecha y Hora de Entrega o Reservación: (Especifica cuándo necesitas que se entregue tu pedido o para cuándo deseas hacer la reservación.)
            
            Dirección de Entrega: (Si tu pedido requiere entrega, proporciona la dirección completa y cualquier instrucción específica para el repartidor.)
            
            Información de Contacto: (Incluye un número de teléfono o correo electrónico donde podamos contactarte para confirmar el pedido o en caso de necesitar más detalles.)
            
            Una vez que tengas toda esta información, puedes decírmela o escribirla aquí. Yo me encargaré de revisar los detalles y generar tu pedido. Si hay algo que necesito aclarar o confirmar, te lo haré saber.
            
            En caso de obtener la informacion del cliente y de la orden, retornarla formateada y lista para ser procesada, con una cabezera que diga "Orden de Pedido", generando un numero aleatorio para la orden y los detalles de la orden.
            
            Cuando el cliente confirme la orden se debe enviar un mensaje agradeciendo la orden, con el mismo numero del pedido y dando un tiempo estimado de entrega.
            
            {contexto}
            """
contextualize_q_system_prompt = """Dado un historial de chat y la última pregunta del usuario,
que podría hacer referencia al contexto en el historial de chat, formula una pregunta independiente
que se pueda entender sin el historial de chat. NO respondas a la pregunta,
solo reformúlala si es necesario y, de lo contrario, devuélvela tal cual."""

contextualize_q_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", contextualize_q_system_prompt),
        MessagesPlaceholder(variable_name="chat_history"),
        ("human", "{question}"),
    ]
)
contextualize_q_chain = contextualize_q_prompt | llm | StrOutputParser()


def contextualized_question(input_question: dict):
    if input_question.get("chat_history"):
        return contextualize_q_chain
    else:
        return input_question["question"]


qa_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", prompt),
        MessagesPlaceholder(variable_name="chat_history"),
        ("human", "{question}"),
    ]
)


def format_docs(documents):
    return "\n\n".join(d.page_content for d in documents)


rag_chain = (
    ## Contexto hace referencia a la varible a reemplazar en el prompt
        RunnablePassthrough.assign(
            contexto=contextualized_question | retriever | format_docs
        )
        | qa_prompt
        | llm
)
response_test_fail = rag_chain.invoke({"question": "cuanto mide el sol?", "chat_history": [""]})
print(response_test_fail)

# Chat History

In [None]:
chat_history = MongoDBChatMessageHistory(
    session_id=chat_session_id,
    connection_string=mongo_uri,
    database_name=mongo_db_name,
    collection_name=mongo_collection_name,
)

# ## Query

In [None]:
def query(texto):
    if len(chat_history.messages) <= chat_hist_msg_count:
        msgs = chat_history.messages
    else:
        msgs = chat_history.messages[-chat_hist_msg_count:]

    response = rag_chain.invoke({"question": texto, "chat_history": msgs})
    content = response.content
    if "## Orden de Pedido" in content:
        print("pedido realizado!!")

    chat_history.add_user_message(texto)
    chat_history.add_ai_message(content)
    return content

# UI

In [None]:
import gradio as gr

with gr.Blocks() as demo:
    search = gr.Textbox(label="Search")
    output = gr.Textbox(label="Output")
    greet_btn = gr.Button("Ask")
    greet_btn.click(fn=query, inputs=[search], outputs=output)

demo.launch()

In [27]:
chromadb_client = chromadb.Client()
col_name = "chatbot"
collection_2 = chromadb_client.get_or_create_collection(col_name)
collection_2.peek()


{'ids': ['479cf2cf-e702-11ee-a515-001a7dda7115',
  '47b1fe08-e702-11ee-a3b5-001a7dda7115',
  '47b448ad-e702-11ee-9133-001a7dda7115',
  '47b6458d-e702-11ee-b749-001a7dda7115',
  '47b85593-e702-11ee-9f3c-001a7dda7115',
  '47ba5205-e702-11ee-8590-001a7dda7115',
  '47bc3b49-e702-11ee-b6f7-001a7dda7115',
  '47be23f5-e702-11ee-b5b0-001a7dda7115',
  '47c00cd4-e702-11ee-9862-001a7dda7115',
  '47c1ce50-e702-11ee-a670-001a7dda7115'],
 'embeddings': [[0.03410160914063454,
   0.0840248242020607,
   0.02971142902970314,
   0.0006102523184381425,
   0.024832986295223236,
   0.020495034754276276,
   0.09105850756168365,
   -0.03928485885262489,
   0.0210853423923254,
   -0.0005621754680760205,
   0.04977497458457947,
   -0.0421338751912117,
   -0.037842798978090286,
   -0.023108292371034622,
   0.030346820130944252,
   -0.007541237398982048,
   -0.04285589978098869,
   -0.06578578799962997,
   -0.05692629888653755,
   0.025597335770726204,
   0.07266975939273834,
   -0.02979220822453499,
   -0.013449