# FAISS DB
- Facebook AI Similarity Search

In [26]:
!pip install faiss-cpu
# !pip install faiss-gpu



### 영화 추천 시스템

In [27]:
import faiss
import numpy as np
from sentence_transformers import SentenceTransformer

model = SentenceTransformer('all-MiniLM-L6-v2')

In [28]:
movies = [
    {"id": 0, "title": "인셉션", "description": "꿈속에서 다른 사람의 생각을 조작하는 스토리"},
    {"id": 1, "title": "기생충", "description": "가난한 가족이 부유한 집에 점점 스며드는 이야기"},
    {"id": 2, "title": "인터스텔라", "description": "인류의 생존을 위해 우주로 떠나는 아버지의 여정"},
    {"id": 3, "title": "타이타닉", "description": "운명적인 사랑과 침몰하는 배에서의 비극적인 이야기"},
    {"id": 4, "title": "어벤져스: 엔드게임", "description": "사라진 인류를 되찾기 위한 히어로들의 마지막 전투"},
    {"id": 5, "title": "스파이더맨: 노 웨이 홈", "description": "정체가 드러난 스파이더맨이 다중우주 속 문제에 맞서는 이야기"},
    {"id": 6, "title": "라라랜드", "description": "꿈을 좇는 연인들의 아름답고도 쓸쓸한 사랑 이야기"},
    {"id": 7, "title": "조커", "description": "한 남자가 광대에서 범죄자로 변해가는 심리 드라마"},
    {"id": 8, "title": "매드 맥스: 분노의 도로", "description": "황폐한 미래에서 자유를 위해 싸우는 전사들의 이야기"},
    {"id": 9, "title": "겨울왕국", "description": "자신의 능력을 받아들이고 가족의 사랑을 찾는 자매의 모험"},
    {"id": 10, "title": "올드보이", "description": "15년간 감금된 남자의 복수극"},
    {"id": 11, "title": "해리 포터와 마법사의 돌", "description": "마법 세계로 입문한 소년의 첫 번째 모험"},
    {"id": 12, "title": "반지의 제왕: 반지 원정대", "description": "세상을 구하기 위해 반지를 파괴하려는 원정대의 여정"},
    {"id": 13, "title": "아바타", "description": "판도라 행성에서 벌어지는 인간과 나비족의 갈등"},
    {"id": 14, "title": "어바웃 타임", "description": "시간여행 능력을 가진 남자의 인생과 사랑 이야기"},
    {"id": 15, "title": "보헤미안 랩소디", "description": "퀸과 프레디 머큐리의 음악과 인생을 그린 이야기"},
    {"id": 16, "title": "이터널스", "description": "수천 년을 살아온 초능력자들의 지구 수호 이야기"},
    {"id": 17, "title": "미나리", "description": "미국으로 이주한 한인 가족의 정착과 희망의 이야기"},
    {"id": 18, "title": "캐롤", "description": "1950년대 여성들의 금지된 사랑과 선택의 이야기"},
    {"id": 19, "title": "벌새", "description": "사춘기 소녀의 내면 성장과 가족, 사회 속 고독"}
]

In [29]:
descriptions = [movie['description'] for movie in movies]
desc_embed = np.array([model.encode(description) for description in descriptions], dtype="float32")

In [30]:
dim = desc_embed.shape[1]
idx = faiss.IndexFlatL2(dim)
idx.add(desc_embed)

In [31]:
query_text = "히어로 이야기"
query_embed = np.array([model.encode(query_text)], dtype='float32')

In [32]:
top_n = 5
distances, indices = idx.search(query_embed, top_n)

In [33]:
print(distances)
print(indices)

[[0.82064337 0.85785466 0.8603085  0.9253434  0.9464458 ]]
[[ 7  0 10 11  8]]


In [34]:
for i in range(top_n):
    movie_id = indices[0][i]
    print(f"{i+1}번째 추천: {movies[movie_id]['title']} (유사도 거리: {distances[0][i]:.2f})")

1번째 추천: 조커 (유사도 거리: 0.82)
2번째 추천: 인셉션 (유사도 거리: 0.86)
3번째 추천: 올드보이 (유사도 거리: 0.86)
4번째 추천: 해리 포터와 마법사의 돌 (유사도 거리: 0.93)
5번째 추천: 매드 맥스: 분노의 도로 (유사도 거리: 0.95)


### 사용자 맞춤 뉴스 추천 <실습>

In [None]:
# 뉴스의 제목을 10, 20 크롤링
# 키워드 입력
# FAISS 활용해 맞춤 뉴스 추천