In [1]:
# Basis-Pakete fuer die lokale Qdrant-Demo
%pip install qdrant-client sentence-transformers

# Falls ein Keras-3 / tf-keras Fehler auftritt (je nach Umgebung), zusaetzlich ausfuehren:
# %pip install tf-keras







In [2]:
from qdrant_client import QdrantClient

client = QdrantClient(path="../qdrant_data")
print("Qdrant Local Mode lÃ¤uft")

Qdrant Local Mode lÃ¤uft


In [3]:
import os

# Verhindert in manchen Umgebungen (z.B. mit Keras 3), dass transformers den TF-Pfad laedt.
os.environ["TRANSFORMERS_NO_TF"] = "1"
os.environ["USE_TF"] = "0"

try:
    from sentence_transformers import SentenceTransformer
except Exception as e:
    raise RuntimeError(
        "Import von sentence-transformers fehlgeschlagen. \
Falls ein Keras-3 / tf-keras Konflikt vorliegt, fuehre in der ersten Zelle zusaetzlich `%pip install tf-keras` aus \
und starte den Kernel neu."
    ) from e

model = SentenceTransformer("sentence-transformers/all-MiniLM-L6-v2")
dim = model.get_sentence_embedding_dimension()
print("Embedding-Dimension:", dim)
texts = [
    "Paris ist die Hauptstadt von Frankreich.",
    "Berlin ist die Hauptstadt von Deutschland.",
    "Rom ist die Hauptstadt von Italien."
]

print("Texte geladen:", len(texts))


  from tqdm.autonotebook import tqdm, trange


Embedding-Dimension: 384
Texte geladen: 3


In [4]:
from qdrant_client.models import VectorParams, Distance

COLLECTION = "demo_texts"

# Neu anlegen (fÃ¼r sauberen Start)
if client.collection_exists(COLLECTION):
    client.delete_collection(COLLECTION)

client.create_collection(
    collection_name=COLLECTION,
    vectors_config=VectorParams(size=dim, distance=Distance.COSINE)
)

print("Collection erstellt:", COLLECTION)


Collection erstellt: demo_texts


In [5]:
from qdrant_client.models import PointStruct

vectors = model.encode(texts, normalize_embeddings=True)

points = [
    PointStruct(
        id=i,
        vector=vectors[i].tolist(),
        payload={"text": texts[i]}
    )
    for i in range(len(texts))
]

client.upsert(collection_name=COLLECTION, points=points)

print("Gespeichert:", len(points), "Texte")


Gespeichert: 3 Texte


In [6]:
query = "Was ist die Hauptstadt von Frankreich?"
qvec = model.encode([query], normalize_embeddings=True)[0].tolist()

res = client.query_points(
    collection_name=COLLECTION,
    query=qvec,
    limit=3,
    with_payload=True
)

# je nach Version: res.points enthÃ¤lt die Treffer
hits = res.points if hasattr(res, "points") else res

print("ðŸ”Ž Treffer:")
for h in hits:
    payload = h.payload if hasattr(h, "payload") else h.get("payload", {})
    score = h.score if hasattr(h, "score") else h.get("score")
    print("-", payload.get("text"), "(score:", round(score, 3), ")")


ðŸ”Ž Treffer:
- Paris ist die Hauptstadt von Frankreich. (score: 0.822 )
- Berlin ist die Hauptstadt von Deutschland. (score: 0.672 )
- Rom ist die Hauptstadt von Italien. (score: 0.62 )
