# Vector DB Sample


In [1]:
%pip install chromadb
%pip install langchain
%pip install langchain-community
%pip install langchain-chroma
%pip install langchain-huggingface

Collecting chromadb
  Downloading chromadb-0.6.3-py3-none-any.whl.metadata (6.8 kB)
Collecting build>=1.0.3 (from chromadb)
  Downloading build-1.2.2.post1-py3-none-any.whl.metadata (6.5 kB)
Collecting chroma-hnswlib==0.7.6 (from chromadb)
  Downloading chroma_hnswlib-0.7.6-cp311-cp311-macosx_11_0_arm64.whl.metadata (252 bytes)
Collecting posthog>=2.4.0 (from chromadb)
  Downloading posthog-3.20.0-py2.py3-none-any.whl.metadata (2.9 kB)
Collecting onnxruntime>=1.14.1 (from chromadb)
  Downloading onnxruntime-1.21.0-cp311-cp311-macosx_13_0_universal2.whl.metadata (4.5 kB)
Collecting opentelemetry-api>=1.2.0 (from chromadb)
  Downloading opentelemetry_api-1.31.0-py3-none-any.whl.metadata (1.6 kB)
Collecting opentelemetry-exporter-otlp-proto-grpc>=1.2.0 (from chromadb)
  Downloading opentelemetry_exporter_otlp_proto_grpc-1.31.0-py3-none-any.whl.metadata (2.5 kB)
Collecting opentelemetry-instrumentation-fastapi>=0.41b0 (from chromadb)
  Downloading opentelemetry_instrumentation_fastapi-0.52

In [2]:
from langchain_huggingface import HuggingFaceEmbeddings
from langchain_chroma import Chroma

# prepare the embedding model
embedding_function = HuggingFaceEmbeddings(model_name = 'intfloat/multilingual-e5-large')

# prepare the vector db
db = Chroma(embedding_function = embedding_function, persist_directory = './chromadb/')

  from .autonotebook import tqdm as notebook_tqdm


In [3]:
# prepare the data and load it to the db

texts = [
    'Die Sonne erzeugt ihre Energie durch Kernfusion. In ihrem Kern verschmelzen Wasserstoffatome unter extremem Druck und bei sehr hohen Temperaturen zu Helium. Dieser Prozess setzt enorme Mengen an Energie frei, die als Licht und Wärme zur Erde gelangen.',
    'Die Sonne ist ein Stern von enormer Größe und Masse. Sie hat einen Durchmesser von etwa 1,4 Millionen Kilometern, was ungefähr dem 109-fachen des Erddurchmessers entspricht. Die Masse der Sonne macht etwa 99,86% der gesamten Masse des Sonnensystems aus.',
    'Die Sonne durchläuft einen etwa 11-jährigen Aktivitätszyklus, der durch die Anzahl und Verteilung von Sonnenflecken gemessen wird. Diese Zyklen variieren in Intensität und können Einfluss auf das Raumwetter und die Kommunikationstechnologie auf der Erde haben.',
    'Die Sonne besteht hauptsächlich aus Wasserstoff (etwa 75% ihrer Masse) und Helium (etwa 24% ihrer Masse). Die restlichen 1% enthalten schwerere Elemente wie Sauerstoff, Kohlenstoff, Neon und Eisen.',
    'Die Sonne stößt kontinuierlich einen Strom geladener Teilchen aus, der als Sonnenwind bekannt ist. Dieser Wind reist durch das Sonnensystem und interagiert mit Planetenmagnetfeldern und Atmosphären, was unter anderem zur Ausbildung von Polarlichtern führen kann.',
    'Die Temperatur der Sonne variiert je nach Schicht. Im Kern der Sonne, wo die Kernfusion stattfindet, erreichen die Temperaturen etwa 15 Millionen Grad Celsius (27 Millionen Grad Fahrenheit). Dies ist unvergleichlich heißer als übliche Prozesse und Zustände, die wir auf der Erde erleben. An der sichtbaren Oberfläche der Sonne, der Photosphäre, liegt die Temperatur bei ungefähr 5.500 Grad Celsius (etwa 9.932 Grad Fahrenheit). Die Temperatur steigt wieder in der Sonnenatmosphäre, speziell in der Korona, wo sie Millionen von Grad erreichen kann. Diese extrem heißen Temperaturen sind paradox, weil man erwarten würde, dass die Temperatur von der Wärmequelle weg abnimmt. Dieses Phänomen, bekannt als das Koronaheizungsproblem, ist immer noch Gegenstand intensiver Forschung und Debatten in der Astrophysik.',
]

db.add_texts(texts)

['030140ef-ca51-4aa1-9928-9e27d625f32b',
 '53bd4fc8-3c21-46d6-8a4a-01595bc0e3d8',
 '259864dd-cc2c-498e-9429-28160af3c293',
 'e13da27d-ff46-44ee-92da-5672a4a98cc2',
 'fea46a05-866d-4ce4-9988-c74af17f61fe',
 'a738b514-3bcc-4645-b6fe-7f7f0262363f']

In [4]:
# query

query = 'Wie groß ist die Sonne?'
# query = 'Wie heiss ist die Sonne?'

results = db.similarity_search_with_score(query)

for result in results:
    print(f'Score: {result[1]}')
    print(f'Text:\n{result[0].page_content}\n\n')

Score: 0.22285535977620946
Text:
Die Sonne ist ein Stern von enormer Größe und Masse. Sie hat einen Durchmesser von etwa 1,4 Millionen Kilometern, was ungefähr dem 109-fachen des Erddurchmessers entspricht. Die Masse der Sonne macht etwa 99,86% der gesamten Masse des Sonnensystems aus.


Score: 0.3309372146137654
Text:
Die Temperatur der Sonne variiert je nach Schicht. Im Kern der Sonne, wo die Kernfusion stattfindet, erreichen die Temperaturen etwa 15 Millionen Grad Celsius (27 Millionen Grad Fahrenheit). Dies ist unvergleichlich heißer als übliche Prozesse und Zustände, die wir auf der Erde erleben. An der sichtbaren Oberfläche der Sonne, der Photosphäre, liegt die Temperatur bei ungefähr 5.500 Grad Celsius (etwa 9.932 Grad Fahrenheit). Die Temperatur steigt wieder in der Sonnenatmosphäre, speziell in der Korona, wo sie Millionen von Grad erreichen kann. Diese extrem heißen Temperaturen sind paradox, weil man erwarten würde, dass die Temperatur von der Wärmequelle weg abnimmt. Dieses