# 🧠 Lokales RAG mit llama-index
Dieses Notebook begleitet dich beim Einrichten und Ausführen eines einfachen Retrieval-Augmented Generation (RAG) Workflows mit `llama-index`. Bitte führe jede Zelle **einzeln** aus, nicht alle auf einmal.

## ✅ Schritt 1: Notwendige Pakete installieren
**Nur beim ersten Mal nötig.** Wenn du Jupyter neu gestartet hast, kannst du diesen Schritt überspringen, wenn die Pakete schon installiert sind.

**Wichtig:** Jede Zeile separat ausführen!

In [None]:
!pip install llama-index

In [None]:
!pip install llama-index-readers-file

In [None]:
!pip install llama-index-embeddings-openai

#### ➡️ zusätzlich API importieren, anzeigen und testen

In [5]:
import os
# 🔐 API key entfernt aus Sicherheitsgründen

In [8]:
import os
# 🔐 API key entfernt aus Sicherheitsgründen

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


In [9]:
from llama_index.embeddings.openai import OpenAIEmbedding

embedding = OpenAIEmbedding()
print("Bereit! ✅")

Bereit! ✅


## ✅ Schritt 2: Komponenten importieren
Wenn alle Pakete installiert sind, kannst du diese Zelle ausführen:

In [2]:
from llama_index.core import VectorStoreIndex, SimpleDirectoryReader
from llama_index.embeddings.openai import OpenAIEmbedding
from llama_index.core.node_parser import SimpleNodeParser

[nltk_data] Downloading package punkt_tab to
[nltk_data]     C:\Users\store\env\Lib\site-
[nltk_data]     packages\llama_index\core\_static/nltk_cache...
[nltk_data]   Package punkt_tab is already up-to-date!


## 📂 Schritt 3: Dokument laden und Index aufbauen
Lege eine Text- oder PDF-Datei in denselben Ordner wie dieses Notebook.
Die Datei sollte z. B. `dokument.txt` heißen.

Wenn die Datei im Ordner liegt, kannst du diese Zelle ausführen:

In [6]:
documents = SimpleDirectoryReader(input_dir=".").load_data()
index = VectorStoreIndex.from_documents(documents)

## ❓ Schritt 4: Fragen an den Index stellen
Jetzt kannst du dem Index Fragen stellen, z. B. zu deinem eigenen PDF/Dokument.

In [7]:
query_engine = index.as_query_engine()
antwort = query_engine.query("Teile die Kundenbeschwerden in 3 sinnvolle Gruppen?")
print(antwort)

Die Kundenbeschwerden können in die folgenden drei sinnvollen Gruppen unterteilt werden:

1. Leistungsprobleme: Kunden A, F, J, M
2. Funktionalitätsmängel: Kunden B, D, I, O, P, Q, R
3. Benutzerfreundlichkeitsprobleme: Kunden C, E, G, H, K, L, N, S, T
