In [1]:
!pip install langchain
!pip install openai
!pip install pickle




[notice] A new release of pip available: 22.3 -> 23.1.2
[notice] To update, run: python.exe -m pip install --upgrade pip





[notice] A new release of pip available: 22.3 -> 23.1.2
[notice] To update, run: python.exe -m pip install --upgrade pip
ERROR: Could not find a version that satisfies the requirement pickle (from versions: none)
ERROR: No matching distribution found for pickle

[notice] A new release of pip available: 22.3 -> 23.1.2
[notice] To update, run: python.exe -m pip install --upgrade pip


## Loaders  
Um Daten mit einem LLM zu verwenden, müssen Dokumente zunächst in eine Vectordatenbank. 
Der erste Schritt ist diese über einen Loader in memory zu laden 

In [2]:
from langchain.document_loaders import DirectoryLoader, TextLoader

loader = DirectoryLoader('./FAQ', glob="**/*.txt", loader_cls=TextLoader, show_progress=True)
docs = loader.load()

100%|██████████| 3/3 [00:00<00:00, 3003.08it/s]


## Text Splitter
Texte werden nicht 1:1 in die Datenbank geladen, sondern in Stücken, sog. "Chunks". Man kann die Chunk Größe und den Overlap zwischen den Chunks definieren

In [3]:
from langchain.text_splitter import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=100,
)

documents = text_splitter.split_documents(docs)
documents[0]

Document(page_content='Q: Was ist ein Huninchen?\nA: Ein Huninchen ist ein fiktives Tier, das eine Kreuzung aus einem Hund und einem Kaninchen darstellt. Es kombiniert Merkmale beider Arten.\n\nQ: Welche Farbe hat ein Huninchen?\nA: Ein Huninchen kann verschiedene Farben haben, Ã¤hnlich wie Hunde und Kaninchen. Es kann braun, weiÃŸ, schwarz, grau oder sogar eine Mischung aus diesen Farben sein.', metadata={'source': 'FAQ\\Huninchen_Basics.txt'})

## Embeddings
Texte werden nicht als Text in der Datenbank gespeichert, sondern als Vectorrepräenstation.
Embeddings sind eine Art von Wortdarstellung, die die semantische Bedeutung von Wörtern in einem Vektorraum darstellt. 

In [4]:
from langchain.embeddings import OpenAIEmbeddings
embeddings = OpenAIEmbeddings(openai_api_key="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")


## Laden der Vectoren in VectorDB (FAISS)
Wie von OpenAIEmbeddings erstellen Vectoren können nun in der Datenbank gespeichert. Die DB kann als .pkl file abgelegt werden

In [5]:
from langchain.vectorstores.faiss import FAISS
import pickle

vectorstore = FAISS.from_documents(documents, embeddings)

with open("vectorstore.pkl", "wb") as f:
    pickle.dump(vectorstore, f)

## Laden der Datenbank
Vor der Verwendung der Datenbank muss diese natürlich wieder geladen werden. 

In [6]:
with open("vectorstore.pkl", "rb") as f:
    vectorstore = pickle.load(f)

## Prompts
Bei einem LLM hat man die Möglichkeit, diesem vor einer Konversersation eine Identität zu verpassen oder zu definieren wie Frage und Antwort aussehen sollen 

In [7]:
from langchain.prompts import PromptTemplate

prompt_template = """Du bist ein Tierarzt, Usern beim Umgang mit ihrem Tier .

{context}

Question: {question}
Antwort hier:"""
PROMPT = PromptTemplate(
    template=prompt_template, input_variables=["context", "question"]
)


## Chains
Mit Chain Klassen kann man das Verhalten des LLMs leicht beeinflussen

In [8]:
from langchain.llms import OpenAI
from langchain.chains import RetrievalQA

chain_type_kwargs = {"prompt": PROMPT}

llm = OpenAI(openai_api_key="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")
qa = RetrievalQA.from_chain_type(llm=llm, chain_type="stuff", retriever=vectorstore.as_retriever(), chain_type_kwargs=chain_type_kwargs)

query = "Wie alt wird ein Huninhen?"
qa.run(query)


' Ein Huninchen kann ein Lebensalter von 8 bis 10 Jahren erreichen, abhÃ¤ngig von der ErnÃ¤hrung, der Pflege und der Gesundheit des Tieres.'

## Memory
In dem eben gezeigten Beispiel steht jede Anfrage für sich. Eine große Stärke eines LLM ist allerdings, dass diese bei einer Antwort den kompletten Chatverlauf berücksichtigen kann. Dafür muss allerdings aus den unterschiedlichen Fragen und Antworten eine Chathistorie aufgebaut werden. Mit unterschiedlichen Memory Klassen ist dies in Langchain sehr einfach.

In [9]:
from langchain.memory import ConversationBufferMemory

memory = ConversationBufferMemory(memory_key='chat_history', return_messages=True, output_key='answer')

## Memory in Chains verwenden
Die Memory Klasse kann nun einfach in einer Chain verwendet werden. Erkennbar ist dies z.B. daran, dass wenn man von "es" spricht, der Bot das Huninchen in diesem Kontext versteht.

In [10]:
from langchain.chains import ConversationalRetrievalChain

qa = ConversationalRetrievalChain.from_llm(
    llm=OpenAI(model_name="text-davinci-003", temperature=0.7, openai_api_key="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"),
    memory=memory,
    retriever=vectorstore.as_retriever(),
    combine_docs_chain_kwargs={'prompt': PROMPT}
)


query = "Wie alt wird ein Huninhen?"
qa({"question": query})
qa({"question": "Und wie viel frisst es?"})

{'question': 'Und wie viel frisst es?',
 'chat_history': [HumanMessage(content='Wie alt wird ein Huninhen?', additional_kwargs={}, example=False),
  AIMessage(content=' Ein Huninchen kann bis zu 10 Jahre alt werden.', additional_kwargs={}, example=False),
  HumanMessage(content='Und wie viel frisst es?', additional_kwargs={}, example=False),
  AIMessage(content=' Wie viel ein Huninchen isst, hÃ¤ngt von seiner GrÃ¶ÃŸe und seinem Alter ab. Ein Huninchen ist in der Regel zwischen einem Hund und einem Kaninchen in Bezug auf den Appetit. Es sollte mindestens einmal am Tag Futter bekommen, aber je nach GrÃ¶ÃŸe und Alter kann es mehrmals tÃ¤glich gefÃ¼ttert werden.', additional_kwargs={}, example=False)],
 'answer': ' Wie viel ein Huninchen isst, hÃ¤ngt von seiner GrÃ¶ÃŸe und seinem Alter ab. Ein Huninchen ist in der Regel zwischen einem Hund und einem Kaninchen in Bezug auf den Appetit. Es sollte mindestens einmal am Tag Futter bekommen, aber je nach GrÃ¶ÃŸe und Alter kann es mehrmals tÃ¤gli