In [1]:
import os
import numpy as np
import faiss

# FAISS 인덱스 초기화
# L2 거리 (유클리디안 거리) 기준 인덱스 생성
index = faiss.IndexFlatL2(5)  # 벡터 차원 5


In [2]:
# 벡터 생성
example_vectors = np.random.randn(10, 5).astype('float32')  # FAISS는 float32를 요구
example_ids = [f"vec_{i}" for i in range(len(example_vectors))]

# 벡터 삽입
index.add(example_vectors)  # 벡터 추가
print(f"FAISS 인덱스에 {index.ntotal}개의 벡터가 추가되었습니다.")

# ID와 벡터 인덱스 매핑
id_to_index = {i: example_ids[i] for i in range(len(example_vectors))}

# 인덱스 저장
faiss.write_index(index, "faiss_index.bin")

FAISS 인덱스에 10개의 벡터가 추가되었습니다.


In [3]:
# 저장된 인덱스 불러오기
index = faiss.read_index("faiss_index.bin")

# 벡터 검색
test_vec = np.random.randn(1, 5).astype('float32')  # 검색할 벡터
k = 5  # 상위 5개 유사 벡터 검색

# 검색 수행
distances, indices = index.search(test_vec, k)

# 결과 출력
def show_results(test_vec, distances, indices):
    for rank, (dist, idx) in enumerate(zip(distances[0], indices[0])):
        vector_id = id_to_index[idx]
        print(f"Rank {rank + 1}: ID = {vector_id}, Distance = {dist}")

print("\nTop 5 Nearest Vectors:")
show_results(test_vec, distances, indices)


Top 5 Nearest Vectors:
Rank 1: ID = vec_7, Distance = 2.33762526512146
Rank 2: ID = vec_6, Distance = 2.458592176437378
Rank 3: ID = vec_8, Distance = 2.7448859214782715
Rank 4: ID = vec_9, Distance = 2.774972438812256
Rank 5: ID = vec_0, Distance = 2.900031089782715
