In [None]:
# Explore index.pkl

import pickle  # Pour lire les objets Python sérialisés dans le fichier .pkl

# 📂 Ouvre le fichier 'index.pkl' contenant :
# 1. un InMemoryDocstore (avec tous les documents)
# 2. un id_map (associant les index FAISS aux IDs des documents)
with open("../vectorstore/index.pkl", "rb") as f:
    docstore, id_map = pickle.load(f)

# 🧮 Affiche le nombre total de vecteurs/document enregistrés
print("📦 Nombre de vecteurs indexés :", len(id_map))

# 🔁 Parcours les 3 premiers documents vectorisés
for i, vector_idx in enumerate(id_map):
    # 🔗 Récupère l'identifiant du document à partir de l’index FAISS
    doc_id = id_map[vector_idx]

    # 📄 Récupère le document (texte + métadonnées) depuis le docstore
    doc = docstore._dict[doc_id]

    # 🖨️ Affiche un aperçu du contenu textuel
    print(f"\n🧩 Vector #{vector_idx}")
    print("📝 Contenu :", doc.page_content[:100], "...")  # Aff_

📦 Nombre de vecteurs indexés : 1

🧩 Vector #0
📝 Contenu : Mohcine
EL HARRAS
Data Scientist / Chef de projet
Professionnel ambitieux avec une expertise en Data ...


In [15]:
# Explore index.faiss
import faiss  # Librairie pour manipulation de vecteurs

# 📂 Chargement de l'index FAISS depuis le fichier binaire
index = faiss.read_index("../vectorstore/index.faiss")

# 🧮 Affiche la dimension des vecteurs (ex: 1536 pour OpenAI, 768 pour d'autres)
print("📐 Dimension des vecteurs :", index.d)

# 📊 Affiche combien de vecteurs sont stockés dans l'index
print("📦 Nombre total de vecteurs :", index.ntotal)

# 🔍 Récupère le vecteur de l'élément à la position 0 (le premier chunk indexé)
vec_0 = index.reconstruct(0)

# 🖨️ Affiche les 10 premières valeurs du vecteur pour aperçu
print("🔢 Vecteur 0 (aperçu des 10 premières dimensions) :", vec_0[:10])


📐 Dimension des vecteurs : 1536
📦 Nombre total de vecteurs : 1
🔢 Vecteur 0 (aperçu des 10 premières dimensions) : [-0.01958076 -0.00858437  0.01171458 -0.02487909 -0.0081643   0.03986616
 -0.00183612  0.00592504 -0.0164099  -0.01916069]
