# Load libraries

In [1]:
import pandas as pd

from langchain.chat_models import ChatOpenAI
from langchain.embeddings import OpenAIEmbeddings
from langchain.schema import Document
from langchain.chains import RetrievalQA
from langchain.prompts import PromptTemplate

import pinecone
from langchain.vectorstores import Pinecone

import os
from dotenv import load_dotenv

  from tqdm.autonotebook import tqdm


# Load dotenv

In [17]:
load_dotenv()

OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
PINECONE_API_KEY = os.getenv('PINECONE_API_KEY')
PINECONE_ENVIRONMENT = os.getenv('PINECONE_ENVIRONMENT')
PINECONE_INDEX_1 = os.getenv('PINECONE_INDEX_1')
PINECONE_INDEX_2 = os.getenv('PINECONE_INDEX_2')

# Init Pinecone VectorDB

In [5]:
pinecone.init(
    api_key=PINECONE_API_KEY,
    environment=PINECONE_ENVIRONMENT,
)

if PINECONE_INDEX_1 not in pinecone.list_indexes():
    pinecone.create_index(PINECONE_INDEX_1, dimension=1536, metric="cosine")

index = pinecone.Index(PINECONE_INDEX_1)

print(pinecone.list_indexes())
print(pinecone.describe_index(PINECONE_INDEX_1))
print(index.describe_index_stats())

['hackathon-cours', 'hackathon-reglement']
IndexDescription(name='hackathon-reglement', metric='cosine', replicas=1, dimension=1536.0, shards=1, pods=1, pod_type='s1.x1', status={'ready': True, 'state': 'Ready'}, metadata_config=None, source_collection='')
{'dimension': 1536,
 'index_fullness': 0.0,
 'namespaces': {'': {'vector_count': 241}},
 'total_vector_count': 241}


In [23]:
embedding_function = OpenAIEmbeddings(model="text-embedding-ada-002",
                               disallowed_special=())

vectorstore = Pinecone.from_existing_index(
            index_name=PINECONE_INDEX_1,
            embedding=embedding_function,
            #namespace=namespace
            )

k = 10

retriever = vectorstore.as_retriever(search_kwargs={"k": k}, return_source_documents=True)

embedding_function = OpenAIEmbeddings(model="text-embedding-ada-002",
                               disallowed_special=())

vectorstore_2 = Pinecone.from_existing_index(
            index_name=PINECONE_INDEX_2,
            embedding=embedding_function,
            #namespace=namespace
            )

k = 5

retriever_2 = vectorstore_2.as_retriever(search_kwargs={"k": k}, return_source_documents=True)

In [24]:
llm = ChatOpenAI(openai_api_key=OPENAI_API_KEY,
                 model="gpt-4-1106-preview",
                 temperature=0)

In [25]:
template = """
        Vous êtes un assistant qui répond à des questions sur l'Université de Genève, basée en Suisse.
        Utilisez les éléments de contexte et l'historique du chat suivants pour répondre aux questions. 
        Votre réponse doit être liée à l'Université de Genève uniquement. Si la question ne figure pas dans le contexte ou l'historique du chat, répondez "Je suis désolé, je ne connais pas la réponse".
        Les réponses doivent être détaillées mais concises et courtes.
        Respirez profondément et travaillez étape par étape.

        Historique: {chat_history}
        
        Context: {context}

        Question: {question}
        Answer: """

prompt = PromptTemplate(input_variables=["chat_history", "context", "question"], template=template)

In [26]:
from langchain.chains.conversation.memory import ConversationBufferWindowMemory

In [27]:
conversational_memory = ConversationBufferWindowMemory(
        memory_key='chat_history',
        input_key="question",
        k=3,
        return_messages=True
    )

In [28]:
qa = RetrievalQA.from_chain_type(
            llm=llm,
            chain_type="stuff",
            retriever=retriever,
            chain_type_kwargs={"prompt": prompt,
                               "memory": conversational_memory},
            return_source_documents=True,
            verbose=False,
            )

In [None]:
res = qa({"query": "bonjour?"})

In [None]:
conversational_memory.load_memory_variables({})

In [None]:
res = qa({"query": "Je suis en troisième année de médecine puis-je prendre une année sabatique ?",
          "chat_history": mem})

In [None]:
res["query"]

In [None]:
res["result"]

In [None]:
res["source_documents"]

In [None]:
qa.combine_documents_chain.memory

In [None]:
qa.combine_documents_chain.memory.chat_memory

In [None]:
qa.memory

In [None]:
dir(qa)

In [None]:
from langchain.memory import ConversationBufferWindowMemory

In [None]:
memory = ConversationBufferWindowMemory( k=1)

In [None]:
memory.save_context({"input": "hi"}, {"output": "whats up"})
memory.save_context({"input": "not much you"}, {"output": "not much"})

In [None]:
memory.load_memory_variables({})