## Faiss 
: Faiss is a library for efficient similarity search and clustering of dense vectors. It contains algorithms that search in sets of vectors of any size, up to ones that possibly do not fit in RAM. It also contains supporting code for evaluation and parameter tuning. Faiss is written in C++ with complete wrappers for Python/numpy. Some of the most useful algorithms are implemented on the GPU. It is developed by Facebook AI Research.

: Faiss는 dense vector들의 유사도와 클러시터링을 효과적으로하는 라이브러리이다. 평가하고 파라미터를 튜닝하는 코드를 포함하고있다. Faiss는 C++를 작성되었으며, 파이썬 인터페이스를 가지고 있다. 

- 설치하는 방법
: https://github.com/facebookresearch/faiss/blob/main/INSTALL.md

- cpu와 gpu에 따라 다르다.

!conda install -c pytorch faiss-cpu --y

## 사용법

In [20]:
# import 
import faiss
import pandas as pd
import numpy as np

#### faiss 사용
- input data : ( a, b )
    - a : 유사도를 찾고 싶은 이미지 / 텍스트
    - b : 기존의 저장된 모든 item에 대한 embedding vector

In [40]:
# 1. 모든 아이템에 대한 임베딩 백터 모음 : random 으로 임시 데이터 넣기.
# 1024백터를 가진 100개의 값을 만들어줌 
text_vector = np.random.rand(100,1024).astype('float32') 
print('text_vector shape : ', text_vector.shape)


# 값을 코사인 유사도를 해주기 위해서 normalize 해줌 
faiss.normalize_L2(text_vector)

# 백터의 차원을 알려주는 역할을 함 # build the index
# IP : inner product, L2 : euclidean (이게 디폴트)
cos_index = faiss.IndexFlatIP(text_vector.shape[1])
print(cos_index.is_trained)

# add 함수로 vector 값을 넣어주기  add vectors to the index
cos_index.add(text_vector) 
print(cos_index.ntotal)

# search 함수로 유사한 인덱스를 찾아오기
k  = 51 # knn 에서 가져올 갯수 - shoppe 에서는 51개를 찾아오기 ( 1개는 자기 자신 )
distances, indices = cos_index.search(text_vector[2].reshape(1,-1), k)
print(distances)
print(indices)

# 1. threshold 0.5이상
# 2. min 도 설정 

text_vector shape :  (100, 1024)
True
100
[[1.0000001  0.76358855 0.7622145  0.7599109  0.7596993  0.75937784
  0.7589336  0.758888   0.75888    0.75854146 0.7576566  0.7575613
  0.75684404 0.7568104  0.7568047  0.7564365  0.756219   0.7559742
  0.75565505 0.755398   0.75538635 0.75529265 0.7552351  0.7550036
  0.7548517  0.7545134  0.75445575 0.7543615  0.75425774 0.7539754
  0.7539154  0.75383043 0.75378954 0.7528512  0.75283146 0.75239354
  0.7515775  0.75157666 0.75144184 0.75092167 0.75032836 0.7501446
  0.7501217  0.7494577  0.7491888  0.74900985 0.7489486  0.74857074
  0.74817574 0.7480401  0.7478156 ]]
[[ 2 28 37 91 31 80 54 56  9 15 89  8 92 35 94 47 25 55 76 72 33 38 34 36
  51 69 74  5 49 40 57 30 14 73 84 52 78 29 16 11  3 60  0 44 68 23 41 59
  82 86  7]]
