## **Lernziele**

Durch das Bearbeiten dieser Übungen werden Sie:

- Retrieval-Augmented Generation (RAG) und seine Komponenten verstehen.
- PDF-Dokumente effektiv laden, vorverarbeiten und verarbeiten.
- Textdaten in Embeddings für effiziente Suche umwandeln.
- Dokumenten-Retrieval-Systeme mit LangChain und FAISS implementieren und testen.
- Retrieval-Systeme mit kostenlosen Sprachmodellen (LLMs) von ChatGroq integrieren.
- Ein interaktives chatbasiertes Frage-Antwort-System aufbauen.

---

## **Übung 1: Setup und Aufwärmen**

In dieser Übung richten Sie Ihre Umgebung ein und wählen ein geeignetes Sprachmodell aus.

**Schritte:**

1. **Umgebungsvariablen laden:** Stellen Sie sicher, dass Ihre Umgebungsvariablen (z.B. API-Schlüssel, Tokens) sicher gespeichert und geladen werden.
2. **LLM auswählen:** Wählen Sie ein kostenloses LLM-Modell von ChatGroq aus.
3. **Modell instanziieren:** Erstellen Sie eine Instanz Ihres gewählten Modells.

In [1]:
# Import necessary libraries
from dotenv import load_dotenv
from langchain_huggingface import HuggingFaceEndpoint

# Load environment variables
load_dotenv()

  from .autonotebook import tqdm as notebook_tqdm


True

In [4]:
# warnings.filterwarnings("ignore")
from langchain_groq import ChatGroq

llm = ChatGroq(
    model="llama-3.1-8b-instant", #"llama3-8b-8192",
    temperature=0,
    max_tokens=None,
    timeout=None,
    max_retries=2
)

---

## **Übung 2: Datenaufnahme**

In dieser Übung lernen Sie, PDF-Daten in eine Python-Umgebung zu laden.

**Schritte:**

1. **PDF-Loader importieren:** Verwenden Sie LangChains `PyPDFLoader`.
2. **PDF-Datei laden:** Erstellen Sie eine Funktion zum Lesen der PDF-Datei.
3. **PDF-Inhalt anzeigen:** Geben Sie die Seitenanzahl und den Inhalt der ersten Seite aus.

In [3]:
from langchain_community.document_loaders import DirectoryLoader, TextLoader
from pathlib import Path

data_path = Path("data") 

loader = DirectoryLoader(
    str(data_path),
    glob="**/*.md",
    loader_cls=TextLoader,
    loader_kwargs={"encoding": "utf-8"},
)

docs = loader.load()

print(f"{len(docs)} Dokumente geladen")
    

27 Dokumente geladen


In [23]:
print(docs[3].page_content)

# Day 8, 17.12.2025
Protocol writer: Lisa

---
## __Introduction__
We started the morning with a career course repetition of last week's introduction and collaborated on the protocol for day 7. Then we got introduced to Strings and the many different built-in methods to handle them and did a group exercise on them. We spent the afternoon first discussing the exercise solution, then solving various git/VSCode issues and discussing protocol process (to be continued tomorrow).

Main topics of the day: Strings, git process for daily protocol & exercises 

Next protocol writer for day 9: Gabriela

## __Schedule__ 
|Time|Notes|
|---|---|
|09:00 - 10:00|Career Course|
|10:00 - 10:30|Protocol|
|10:30 - 12:00|Strings| 
|12:00 - 13:00|Lunch Break|  
|13:00 - 14:00|Group Exercise & Self-Help| 
|14:00 - 15:00|Discuss String Exercise| 
|15:00 - 16:00|Trying to solve git issues|

---

## __Strings__ 
* Some important commands
    * adding \n to start a new line in a string (important: no space after

---

## **Übung 3: Dokument-Chunking**

Diese Übung führt das Aufteilen großer Dokumente in handhabbare Textblöcke ein.

**Schritte:**

1. **Text-Splitter importieren:** Verwenden Sie `RecursiveCharacterTextSplitter`.
2. **Dokument aufteilen:** Schreiben Sie eine Funktion, die geladene Dokumente in Chunks aufteilt.
3. **Funktion testen:** Überprüfen Sie das Ergebnis, indem Sie die resultierenden Chunks anzeigen.

In [6]:
react_docs = docs

In [7]:
# Import RecursiveCharacterTextSplitter
from langchain_text_splitters import RecursiveCharacterTextSplitter

def chunk_documents(documents, chunk_size=200, chunk_overlap=50):
    text_splitter = RecursiveCharacterTextSplitter(
        chunk_size=chunk_size,
        chunk_overlap=chunk_overlap
    )
    chunks = text_splitter.split_documents(documents=documents)
    
    # Just to add id for etch chunks to map it later 
    for i, chunk in enumerate(chunks):
         chunk.metadata.update({
        "id": f"chunk_{i}",
    })
    
    return chunks


react_chunks = chunk_documents(react_docs)

In [8]:
# Execute your chunking function and display results here
len(react_chunks)

1115


---

## **Übung 4: Embedding und Speicherung**

In dieser Übung erstellen Sie Embeddings aus Textblöcken und speichern sie effizient.

**Schritte:**

1. **Embedding-Modell wählen:** Verwenden Sie `sentence-transformers/all-mpnet-base-v2` von Hugging Face.
2. **Embeddings generieren:** Wandeln Sie Dokument-Chunks in Embeddings um.
3. **Embeddings speichern:** Speichern Sie diese Embeddings lokal mit FAISS.

In [9]:
# Import libraries
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_community.vectorstores import FAISS
from langchain_community.vectorstores.faiss import DistanceStrategy

def embed_and_store(chunks, db_name):
    """
    This function uses the open-source embedding model HuggingFaceEmbeddings 
    to create embeddings and store those in a VectorStore called FAISS, 
    which allows for efficient similarity search
    """
    # instantiate embedding model
    embedding = HuggingFaceEmbeddings(
        model_name='sentence-transformers/all-mpnet-base-v2',
        encode_kwargs={"normalize_embeddings": True}
    )
    # create the vector store 
    vectorstore = FAISS.from_documents(
        documents=chunks,
        embedding=embedding,
        distance_strategy=DistanceStrategy.COSINE  # or DistanceStrategy.DOT or DistanceStrategy.L2 
        
    )
    # save VectorStore locally
    vectorstore.save_local(f"../vector_databases/vector_db_{db_name}")
    return vectorstore



In [22]:
# Generate embeddings and save them locally
all_embedding=embed_and_store(chunks=react_chunks, db_name="chatbot")

'(ProtocolError('Connection aborted.', RemoteDisconnected('Remote end closed connection without response')), '(Request ID: 3eb4ed36-ab5b-42b8-8ad3-607261523351)')' thrown while requesting HEAD https://huggingface.co/sentence-transformers/all-mpnet-base-v2/resolve/main/./modules.json
Retrying in 1s [Retry 1/5].


---

## **Übung 5: Retrieval aus FAISS**

Hier lernen Sie, wie man Dokumente aus einer Vektordatenbank mithilfe von Embeddings abruft.

**Schritte:**

1. **Embeddings laden:** Laden Sie gespeicherte Embeddings aus der FAISS-Datenbank.
2. **Retrieval implementieren:** Erstellen Sie eine Logik zum Abrufen relevanter Chunks basierend auf Abfragen.
3. **Retriever testen:** Führen Sie die Suche mit Beispielabfragen durch.

In [11]:
# Implement retrieval logic from your FAISS database
def retrieve_from_vector_db(vector_db_path):
    """
    this function splits out a retriever object from a local VectorStore
    """
    # instantiate embedding model
    embeddings = HuggingFaceEmbeddings(
        model_name='sentence-transformers/all-mpnet-base-v2',
        encode_kwargs={"normalize_embeddings": True}
    )
    react_vectorstore = FAISS.load_local(
        folder_path=vector_db_path,
        embeddings=embeddings,
        allow_dangerous_deserialization=True,
        distance_strategy=DistanceStrategy.COSINE  # or DistanceStrategy.DOT or DistanceStrategy.L2 
    )
    retriever = react_vectorstore.as_retriever()
    return retriever ,react_vectorstore

# Load the retriever and index
react_retriever,react_vectorstore = retrieve_from_vector_db("../vector_databases/vector_db_ezb")
type(react_retriever),type(react_vectorstore)

(langchain_core.vectorstores.base.VectorStoreRetriever,
 langchain_community.vectorstores.faiss.FAISS)

In [12]:
# Test your retrieval system with queries
react_retriever.get_relevant_documents("Anekdote",k=3)

  react_retriever.get_relevant_documents("Anekdote",k=3)


[Document(id='42c48773-00c5-471e-a576-bf25132e945d', metadata={'source': 'data\\Day_26_02_02_26.md', 'id': 'chunk_738'}, page_content='Day 26, 02.02.2026  \nProtocol writer: Preeti\n\n---\n\n## __Introduction__  \nThe session was on A/B Testing\n\n---'),
 Document(id='4bed9e32-21e4-4f4d-a5bc-ffc639395b0c', metadata={'source': 'data\\Day_08_17-12-25.md', 'id': 'chunk_82'}, page_content='---'),
 Document(id='39e48a48-9f9c-45e6-9836-1ebde6f8f1c1', metadata={'source': 'data\\Day_09_18-12-25.md', 'id': 'chunk_128'}, page_content='---')]

---

## **Übung 6: Retrieval mit LLM verbinden**

Nun verbinden Sie das Dokument-Retrieval mit dem Sprachmodell.

**Schritte:**

1. **Retrieval-Chain erstellen:** Verknüpfen Sie Ihr Retrieval-System mit Ihrem instanziierten LLM.
2. **Chain testen:** Bestätigen Sie die Funktionalität, indem Sie Antworten aus abgerufenen Dokumenten generieren.

In [13]:
from langchain import hub
from langchain.chains.combine_documents import create_stuff_documents_chain
from langchain.chains.retrieval import create_retrieval_chain

# Write a function to create retrieval and document processing chains
def connect_chains(retriever):
    """
    this function connects stuff_documents_chain with retrieval_chain
    """
    stuff_documents_chain = create_stuff_documents_chain(
        llm=llm,
        prompt=hub.pull("langchain-ai/retrieval-qa-chat")
    )
    retrieval_chain = create_retrieval_chain(
        retriever=retriever,
        combine_docs_chain=stuff_documents_chain
    )
    return retrieval_chain


react_retrieval_chain = connect_chains(react_retriever)

In [21]:
# Invoke your chain with a sample question
output = react_retrieval_chain.invoke(
    {"input": "gib einen grundlegenden Überblick über den Tag 13'?"}
)
output['answer']

'Ich kann dir auf Grundlage des Kontextes folgendes sagen:\n\nDer Tag 13 war am 08.01.2026. Der Protokollschreiber war Preeti.'

In [30]:
react_retrieval_chain.invoke(
    {"input": "Bitte fasse die Konjunkturentwicklung nach der vorläufigen Schnellschätzung von Eurostat in 5 Sätzen zusammen."}
)['answer']

'Die vorläufige Schnellschätzung von Eurostat weist ein Wirtschaftswachstum von 0,3 % im vierten Quartal 2025 aus. Dieses Wachstum ist hauptsächlich auf die Entwicklung im Euroraum zurückzuführen. Die genauen Details über die Ursachen des Wachstums sind nicht im bereitgestellten Text erwähnt. Die Wirtschaftsentwicklung wird durch verschiedene Indikatoren wie den Arbeitsplatzverlust und den Preisdruck auf der Wertschöpfungskette beurteilt. Die genauen Zahlen und Details zu diesen Indikatoren sind jedoch nicht im bereitgestellten Text enthalten.'

---

## **Übung 7: Interaktives Chat-System**

In der letzten Übung bauen Sie ein interaktives chatbasiertes Abfragesystem.

**Schritte:**

1. **Chat-Oberfläche erstellen:** Entwickeln Sie eine einfache Funktion für interaktive Abfragen.
2. **Chat ausführen:** Ermöglichen Sie es Nutzern, Fragen zu stellen und sofortige Antworten zu erhalten.

In [34]:
# Define your interactive chat querying function

while True:
    # 1. Do something (runs at least once)
    user_query = input("Frag ans RAG-System: ")
    
    # 2. Check the "until" condition
    if user_query == 'quit':
        break
    print(react_retrieval_chain.invoke({"input":user_query})['answer'])
    print("...")

Ja, das weltweite Wirtschaftswachstum hat sich insgesamt weiterhin als robust erwiesen. Dies ist zu verdanken an:

1. Kräftiges Wirtschaftswachstum im dritten Quartal 2025
2. Robuste Nachfrage nach höher rentierenden Staatsanleihen

Diese Faktoren haben dazu beigetragen, dass das weltweite Wirtschaftswachstum stabil und kräftig bleibt.
...
Das Dokument sagt, dass der Einkaufsmanagerindex (EMI) für die Produktion im verarbeitenden Gewerbe und im Dienstleistungssektor im Januar 2026 weitgehend stabil geblieben ist.
...
Es scheint, dass der bereitgestellte Text nicht explizit fünf Kernaussagen enthält. Der Text scheint eher ein Fragment zu sein, das verschiedene Ideen und Aussagen enthält, aber keine klaren Kernaussagen. Es gibt jedoch einige Schlüsselaussagen, die ich herausgreifen kann:

1. Die Fähigkeiten, Kenntnisse und Kompetenzen für Aktivitäten mit Brennstoffen sind nicht ein separates Spektrum an Fähigkeiten.
2. Brennstoffe mit höheren Grenzkosten führen tendenziell zu höheren Str

In [26]:
# Run and test your interactive chat system

---

## **Fazit & Reflexion**

Nach Abschluss dieser Übungen:

- Fassen Sie die gelernten Schlüsselkonzepte zusammen.
- Reflektieren Sie über die Wirksamkeit und Einschränkungen des kostenlosen LLM und des von Ihnen aufgebauten RAG-Systems.
- Überlegen Sie, wie Sie Ihr System in praktischen Anwendungen verbessern oder erweitern könnten.

---