In [1]:
from pathlib import Path
from langchain_community.vectorstores import FAISS
from dotenv import load_dotenv
import os
from langchain_huggingface import HuggingFaceEmbeddings

In [3]:
load_dotenv()

True

In [5]:
HUGGINGFACEHUB_API_TOKEN = os.getenv('HUGGINGFCEHUB_API_TOKEN')
EMBEDDING_MODEL = os.getenv("EMBEDDING_MODEL")

In [None]:
embeddings = HuggingFaceEmbeddings(model_name=EMBEDDING_MODEL)

In [7]:
folder_path = Path('..') / "vectorstore/faiss-insurance-agent-500"
faissdb = FAISS.load_local(folder_path=str(folder_path.resolve()),
                                embeddings=embeddings,
                                allow_dangerous_deserialization=True)    

In [24]:
# Perform a similarity search with an empty query to get random documents
documents = faissdb.similarity_search("Private Haftpflicht­versicherung", k=5)

for doc in documents:
    print(f"Content: {doc.page_content[:50]}...")  # Print first 50 chars of content
    print(f"Metadata: {doc.metadata}")
    print("---")

Content: Die private Haftpflichtversicherung...
Metadata: {'source': 'https://www.wuerttembergische.de/versicherungen/stadt/wuppertal/', 'content_type': 'text/html; charset=UTF-8', 'title': 'Versicherung in Wuppertal', 'description': 'Ihre Versicherungsagentur in Wuppertal: Kommen Sie zur Württembergischen Versicherung und profitieren Sie von einer persönlichen Beratung und ausgezeichnetem Service. ', 'language': 'de'}
---
Content: Haftpflichtversicherung...
Metadata: {'source': 'https://www.wuerttembergische.de/wohnen/hausratversicherung/sengschaden/', 'content_type': 'text/html; charset=UTF-8', 'title': 'Sengschäden: So schützt Sie Ihre Hausrat- und Wohngebäudeversicherung', 'description': 'Deckt Ihre Hausratversicherung Sengschäden ab? Finden Sie heraus, wie Sie bei Schäden durch Glut oder Hitze ohne direktes Feuer geschützt sind.\n', 'language': 'de'}
---
Content: Die Leistungen unserer privaten Haftpflichtversich...
Metadata: {'source': 'https://www.wuerttembergische.de/existenz/p

In [19]:
num_entries = len(faissdb.index_to_docstore_id)
print(f"Number of entries in the database: {num_entries}")

Number of entries in the database: 62496


In [20]:
num_entries = faissdb.index.ntotal
print(f"Number of entries in the database: {num_entries}")

Number of entries in the database: 62496
