## Data

In [27]:
data = {
    "restaurants": [
        {
            "restaurant_id": "res_1234",
            "restaurant_name": "비즐",
            "reviews": [
                {
                    "user_id": "user_2001",
                    "datetime": "2026-01-03 12:10:00",
                    "group": "카카오",
                    "review_id": "rev_3001",
                    "review": "점심시간이라 사람이 많았지만 생각보다 빨리 나왔다.",
                    "images": {
                        "image_id": "img_1001",
                        "url": "http://localhost:8000/bizzle_image1.jpeg"
                    }
                },
                {
                    "user_id": "user_2002",
                    "datetime": "2026-01-03 12:12:00",
                    "group": "네이버",
                    "review_id": "rev_3002",
                    "review": "가츠동은 괜찮았는데 다른 메뉴는 좀 애매했다.",
                    "images": {
                        "image_id": "img_1002",
                        "url": "http://localhost:8000/bizzle_image2.jpeg"
                    }
                },
                {
                    "user_id": "user_2003",
                    "datetime": "2026-01-04 18:45:00",
                    "group": "카카오",
                    "review_id": "rev_3003",
                    "review": "직원 응대가 그날그날 다른 느낌이다.",
                    "images":
                    {
                        "image_id": "img_1003",
                        "url": "http://localhost:8000/bizzle_image2.jpeg"
                    }
                },
                {
                    "user_id": "user_2004",
                    "datetime": "2026-01-05 13:00:00",
                    "group": "네이버",
                    "review_id": "rev_3004",
                    "review": "음식은 맛있을 때도 있지만 오늘은 좀 짰다.",
                    "images": []
                },
                {
                    "user_id": "user_2005",
                    "datetime": "2026-01-06 19:20:00",
                    "group": "카카오",
                    "review_id": "rev_3005",
                    "review": "웨이팅이 길 줄 알았는데 회전이 빨라서 괜찮았다.",
                    "images": []
                },
                {
                    "user_id": "user_2006",
                    "datetime": "2026-01-06 19:25:00",
                    "group": "네이버",
                    "review_id": "rev_3006",
                    "review": "서비스는 기대 안 하는 게 정신 건강에 좋다.",
                    "images": []
                }
            ]
        },
        {
            "restaurant_id": "res_1235",
            "restaurant_name": "시올돈",
            "reviews": [
                {
                    "user_id": "user_2101",
                    "datetime": "2026-02-03 18:00:00",
                    "group": "카카오",
                    "review_id": "rev_4001",
                    "review": "음식 맛은 무난하고 실패는 없는 편이다.",
                    "images":
                    {
                        "image_id": "img_2001",
                        "url": "http://localhost:8000/sioldon_image1.jpeg"
                    }
                },
                {
                    "user_id": "user_2102",
                    "datetime": "2026-02-03 18:20:00",
                    "group": "네이버",
                    "review_id": "rev_4002",
                    "review": "웨이팅이 너무 길어서 중간에 포기할 뻔했다.",
                    "images":
                    {
                        "image_id": "img_2002",
                        "url": "http://localhost:8000/sioldon_image2.jpeg"
                    }
                },
                {
                    "user_id": "user_2103",
                    "datetime": "2026-02-04 12:40:00",
                    "group": "카카오",
                    "review_id": "rev_4003",
                    "review": "기다리는 동안 직원이 계속 안내해줘서 불편하진 않았다.",
                    "images": []
                },
                {
                    "user_id": "user_2104",
                    "datetime": "2026-02-05 19:10:00",
                    "group": "네이버",
                    "review_id": "rev_4004",
                    "review": "음식은 평타 이상인데 웨이팅 각오는 해야 한다.",
                    "images": []
                },
                {
                    "user_id": "user_2105",
                    "datetime": "2026-02-06 20:00:00",
                    "group": "카카오",
                    "review_id": "rev_4005",
                    "review": "직원들이 전반적으로 친절해서 인상은 좋았다.",
                    "images": []
                }
            ]
        }
    ]
}

## 모듈 Import

먼저 필요한 모듈들을 import합니다.

In [28]:
# 모듈 import
import sys
import os
sys.path.append(os.path.dirname(os.path.abspath('')))

from src import (
    get_review_list,
    SentimentAnalyzer,
    VectorSearch,
    LLMUtils,
    summarize_reviews,
    extract_strengths,
    extract_reviews_from_payloads,
    query_similar_reviews,
    get_restaurant_reviews,
    get_reviews_with_images,
    prepare_qdrant_points,
)
from src.config import Config

# 필요한 라이브러리 import
from openai import OpenAI
from transformers import pipeline
from qdrant_client import QdrantClient, models
from sentence_transformers import SentenceTransformer
import json
import logging

# 로깅 설정
logging.basicConfig(level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s')
logger = logging.getLogger(__name__)

# 클라이언트 초기화
openai_client = OpenAI()
encoder = SentenceTransformer(Config.EMBEDDING_MODEL)
qdrant_client = QdrantClient(":memory:")

# 사용 예시
review_list, restaurant_id = get_review_list(data, "비즐")
print(f"레스토랑 ID: {restaurant_id}")
print(f"리뷰 개수: {len(review_list)}")
print(review_list)

2026-01-02 20:10:27,557 - INFO - Use pytorch device_name: mps
2026-01-02 20:10:27,558 - INFO - Load pretrained SentenceTransformer: jhgan/ko-sbert-multitask
'(ReadTimeoutError("HTTPSConnectionPool(host='huggingface.co', port=443): Read timed out. (read timeout=10)"), '(Request ID: b1b14e03-7f52-434e-9a1d-0e4aec8124a8)')' thrown while requesting HEAD https://huggingface.co/jhgan/ko-sbert-multitask/resolve/main/./modules.json
Retrying in 1s [Retry 1/5].


레스토랑 ID: res_1234
리뷰 개수: 6
['점심시간이라 사람이 많았지만 생각보다 빨리 나왔다.', '가츠동은 괜찮았는데 다른 메뉴는 좀 애매했다.', '직원 응대가 그날그날 다른 느낌이다.', '음식은 맛있을 때도 있지만 오늘은 좀 짰다.', '웨이팅이 길 줄 알았는데 회전이 빨라서 괜찮았다.', '서비스는 기대 안 하는 게 정신 건강에 좋다.']


In [None]:
# 감성 분석기 초기화
sentiment_analyzer = SentimentAnalyzer(
    openai_client=openai_client,
    score_threshold=0.8,
)

# 감성 분석 수행
result = sentiment_analyzer.analyze(review_list, "비즐", restaurant_id)
print(json.dumps(result, ensure_ascii=False, indent=2))


## 벡터 검색 및 RAG 설정

In [None]:
# Qdrant 컬렉션 생성
qdrant_client.create_collection(
    collection_name=Config.COLLECTION_NAME,
    vectors_config=models.VectorParams(
        size=encoder.get_sentence_embedding_dimension(),
        distance=models.Distance.COSINE,
    ),
)

# 벡터 검색 객체 생성
vector_search = VectorSearch(encoder, qdrant_client, Config.COLLECTION_NAME)

# 포인트 생성 및 업로드
points = vector_search.prepare_points(data)
vector_search.upload_points(points)

## 그냥 확인

In [None]:
# 레스토랑 리뷰 조회
records1 = vector_search.get_restaurant_reviews("res_1234")
records1

[{'restaurant_id': 'res_1234',
  'restaurant_name': '비즐',
  'review_id': 'rev_3005',
  'user_id': 'user_2005',
  'datetime': '2026-01-06 19:20:00',
  'group': '카카오',
  'review': '웨이팅이 길 줄 알았는데 회전이 빨라서 괜찮았다.',
  'image_urls': []},
 {'restaurant_id': 'res_1234',
  'restaurant_name': '비즐',
  'review_id': 'rev_3001',
  'user_id': 'user_2001',
  'datetime': '2026-01-03 12:10:00',
  'group': '카카오',
  'review': '점심시간이라 사람이 많았지만 생각보다 빨리 나왔다.',
  'image_urls': ['http://localhost:8000/bizzle_image1.jpeg']},
 {'restaurant_id': 'res_1234',
  'restaurant_name': '비즐',
  'review_id': 'rev_3003',
  'user_id': 'user_2003',
  'datetime': '2026-01-04 18:45:00',
  'group': '카카오',
  'review': '직원 응대가 그날그날 다른 느낌이다.',
  'image_urls': ['http://localhost:8000/bizzle_image2.jpeg']},
 {'restaurant_id': 'res_1234',
  'restaurant_name': '비즐',
  'review_id': 'rev_3004',
  'user_id': 'user_2004',
  'datetime': '2026-01-05 13:00:00',
  'group': '네이버',
  'review': '음식은 맛있을 때도 있지만 오늘은 좀 짰다.',
  'image_urls': []},
 {'re

In [None]:
# 리뷰 텍스트 추출
payload1_review_list = extract_reviews_from_payloads(records1)
for review in payload1_review_list:
    print(review)
payload1_review_list


웨이팅이 길 줄 알았는데 회전이 빨라서 괜찮았다.
점심시간이라 사람이 많았지만 생각보다 빨리 나왔다.
직원 응대가 그날그날 다른 느낌이다.
음식은 맛있을 때도 있지만 오늘은 좀 짰다.
서비스는 기대 안 하는 게 정신 건강에 좋다.
가츠동은 괜찮았는데 다른 메뉴는 좀 애매했다.


['웨이팅이 길 줄 알았는데 회전이 빨라서 괜찮았다.',
 '점심시간이라 사람이 많았지만 생각보다 빨리 나왔다.',
 '직원 응대가 그날그날 다른 느낌이다.',
 '음식은 맛있을 때도 있지만 오늘은 좀 짰다.',
 '서비스는 기대 안 하는 게 정신 건강에 좋다.',
 '가츠동은 괜찮았는데 다른 메뉴는 좀 애매했다.']

In [None]:
records2 = vector_search.get_restaurant_reviews("res_1235")
records2

[{'restaurant_id': 'res_1235',
  'restaurant_name': '시올돈',
  'review_id': 'rev_4004',
  'user_id': 'user_2104',
  'datetime': '2026-02-05 19:10:00',
  'group': '네이버',
  'review': '음식은 평타 이상인데 웨이팅 각오는 해야 한다.',
  'image_urls': []},
 {'restaurant_id': 'res_1235',
  'restaurant_name': '시올돈',
  'review_id': 'rev_4002',
  'user_id': 'user_2102',
  'datetime': '2026-02-03 18:20:00',
  'group': '네이버',
  'review': '웨이팅이 너무 길어서 중간에 포기할 뻔했다.',
  'image_urls': ['http://localhost:8000/sioldon_image2.jpeg']},
 {'restaurant_id': 'res_1235',
  'restaurant_name': '시올돈',
  'review_id': 'rev_4005',
  'user_id': 'user_2105',
  'datetime': '2026-02-06 20:00:00',
  'group': '카카오',
  'review': '직원들이 전반적으로 친절해서 인상은 좋았다.',
  'image_urls': []},
 {'restaurant_id': 'res_1235',
  'restaurant_name': '시올돈',
  'review_id': 'rev_4001',
  'user_id': 'user_2101',
  'datetime': '2026-02-03 18:00:00',
  'group': '카카오',
  'review': '음식 맛은 무난하고 실패는 없는 편이다.',
  'image_urls': ['http://localhost:8000/sioldon_image1.jpeg']},
 {

In [None]:
payload2_review_list = extract_reviews_from_payloads(records2)
for review in payload2_review_list:
    print(review)
payload2_review_list

음식은 평타 이상인데 웨이팅 각오는 해야 한다.
웨이팅이 너무 길어서 중간에 포기할 뻔했다.
직원들이 전반적으로 친절해서 인상은 좋았다.
음식 맛은 무난하고 실패는 없는 편이다.
기다리는 동안 직원이 계속 안내해줘서 불편하진 않았다.


['음식은 평타 이상인데 웨이팅 각오는 해야 한다.',
 '웨이팅이 너무 길어서 중간에 포기할 뻔했다.',
 '직원들이 전반적으로 친절해서 인상은 좋았다.',
 '음식 맛은 무난하고 실패는 없는 편이다.',
 '기다리는 동안 직원이 계속 안내해줘서 불편하진 않았다.']

## 맛에 대한 쿼리

In [None]:
# 유사 리뷰 검색
positive_results = vector_search.query_similar_reviews(
    "맛있다 좋다", restaurant_id="res_1234", limit=3
)

positive_reviews = []
for result in positive_results:
    print(result["payload"], "score:", result["score"])
    positive_reviews.append(result["payload"]["review"])

positive_reviews

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

{'restaurant_id': 'res_1234', 'restaurant_name': '비즐', 'review_id': 'rev_3004', 'user_id': 'user_2004', 'datetime': '2026-01-05 13:00:00', 'group': '네이버', 'review': '음식은 맛있을 때도 있지만 오늘은 좀 짰다.', 'image_urls': []} score: 0.6644747803260752
{'restaurant_id': 'res_1234', 'restaurant_name': '비즐', 'review_id': 'rev_3002', 'user_id': 'user_2002', 'datetime': '2026-01-03 12:12:00', 'group': '네이버', 'review': '가츠동은 괜찮았는데 다른 메뉴는 좀 애매했다.', 'image_urls': ['http://localhost:8000/bizzle_image2.jpeg']} score: 0.48151022370481983
{'restaurant_id': 'res_1234', 'restaurant_name': '비즐', 'review_id': 'rev_3005', 'user_id': 'user_2005', 'datetime': '2026-01-06 19:20:00', 'group': '카카오', 'review': '웨이팅이 길 줄 알았는데 회전이 빨라서 괜찮았다.', 'image_urls': []} score: 0.4267195382422997


['음식은 맛있을 때도 있지만 오늘은 좀 짰다.',
 '가츠동은 괜찮았는데 다른 메뉴는 좀 애매했다.',
 '웨이팅이 길 줄 알았는데 회전이 빨라서 괜찮았다.']

In [None]:
negative_results = vector_search.query_similar_reviews(
    "맛없다 안좋다", restaurant_id="res_1234", limit=3
)

negative_reviews = []
for result in negative_results:
    print(result["payload"], "score:", result["score"])
    negative_reviews.append(result["payload"]["review"])

negative_reviews

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

{'restaurant_id': 'res_1234', 'restaurant_name': '비즐', 'review_id': 'rev_3004', 'user_id': 'user_2004', 'datetime': '2026-01-05 13:00:00', 'group': '네이버', 'review': '음식은 맛있을 때도 있지만 오늘은 좀 짰다.', 'image_urls': []} score: 0.528726950686659
{'restaurant_id': 'res_1234', 'restaurant_name': '비즐', 'review_id': 'rev_3002', 'user_id': 'user_2002', 'datetime': '2026-01-03 12:12:00', 'group': '네이버', 'review': '가츠동은 괜찮았는데 다른 메뉴는 좀 애매했다.', 'image_urls': ['http://localhost:8000/bizzle_image2.jpeg']} score: 0.4761943816483879
{'restaurant_id': 'res_1234', 'restaurant_name': '비즐', 'review_id': 'rev_3001', 'user_id': 'user_2001', 'datetime': '2026-01-03 12:10:00', 'group': '카카오', 'review': '점심시간이라 사람이 많았지만 생각보다 빨리 나왔다.', 'image_urls': ['http://localhost:8000/bizzle_image1.jpeg']} score: 0.25660422522963655


['음식은 맛있을 때도 있지만 오늘은 좀 짰다.',
 '가츠동은 괜찮았는데 다른 메뉴는 좀 애매했다.',
 '점심시간이라 사람이 많았지만 생각보다 빨리 나왔다.']

In [None]:
# 리뷰 요약
llm_utils = LLMUtils(openai_client)
summary = llm_utils.summarize_reviews(positive_reviews, negative_reviews)
print(json.dumps(summary, ensure_ascii=False, indent=2))


2026-01-02 16:15:16,358 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


{
  "positive_summary": "웨이팅이 길 줄 알았지만 회전이 빨라서 괜찮았다.",
  "negative_summary": "음식이 짰고, 다른 메뉴가 애매했다.",
  "overall_summary": "음식의 맛이 일관되지 않고, 일부 메뉴는 만족스럽지 않았지만, 회전율이 빨라서 대기 시간은 짧았다."
}


## 강점 추출

In [None]:
positive_results1 = vector_search.query_similar_reviews(
    "맛있다 좋다", restaurant_id="res_1234", limit=3
)

positive_reviews1 = []
for result in positive_results1:
    print(result["payload"], "score:", result["score"])
    positive_reviews1.append(result["payload"]["review"])

positive_reviews1


Batches:   0%|          | 0/1 [00:00<?, ?it/s]

{'restaurant_id': 'res_1234', 'restaurant_name': '비즐', 'review_id': 'rev_3004', 'user_id': 'user_2004', 'datetime': '2026-01-05 13:00:00', 'group': '네이버', 'review': '음식은 맛있을 때도 있지만 오늘은 좀 짰다.', 'image_urls': []} score: 0.6644747803260752
{'restaurant_id': 'res_1234', 'restaurant_name': '비즐', 'review_id': 'rev_3002', 'user_id': 'user_2002', 'datetime': '2026-01-03 12:12:00', 'group': '네이버', 'review': '가츠동은 괜찮았는데 다른 메뉴는 좀 애매했다.', 'image_urls': ['http://localhost:8000/bizzle_image2.jpeg']} score: 0.48151022370481983
{'restaurant_id': 'res_1234', 'restaurant_name': '비즐', 'review_id': 'rev_3005', 'user_id': 'user_2005', 'datetime': '2026-01-06 19:20:00', 'group': '카카오', 'review': '웨이팅이 길 줄 알았는데 회전이 빨라서 괜찮았다.', 'image_urls': []} score: 0.4267195382422997


['음식은 맛있을 때도 있지만 오늘은 좀 짰다.',
 '가츠동은 괜찮았는데 다른 메뉴는 좀 애매했다.',
 '웨이팅이 길 줄 알았는데 회전이 빨라서 괜찮았다.']

In [None]:
other_positive_results = vector_search.query_similar_reviews(
    "맛있다 좋다", restaurant_id="res_1235", limit=3
)

other_positive_reviews = []
other_positive_reviews_all = []

for result in other_positive_results:
    print(result["payload"], "score:", result["score"])
    other_positive_reviews_all.append(result["payload"])
    other_positive_reviews.append(result["payload"]["review"])

print("전체:", other_positive_reviews_all)
print("리뷰:", other_positive_reviews)

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

{'restaurant_id': 'res_1235', 'restaurant_name': '시올돈', 'review_id': 'rev_4004', 'user_id': 'user_2104', 'datetime': '2026-02-05 19:10:00', 'group': '네이버', 'review': '음식은 평타 이상인데 웨이팅 각오는 해야 한다.', 'image_urls': []} score: 0.5049491391227632
{'restaurant_id': 'res_1235', 'restaurant_name': '시올돈', 'review_id': 'rev_4001', 'user_id': 'user_2101', 'datetime': '2026-02-03 18:00:00', 'group': '카카오', 'review': '음식 맛은 무난하고 실패는 없는 편이다.', 'image_urls': ['http://localhost:8000/sioldon_image1.jpeg']} score: 0.49059393092041925
{'restaurant_id': 'res_1235', 'restaurant_name': '시올돈', 'review_id': 'rev_4005', 'user_id': 'user_2105', 'datetime': '2026-02-06 20:00:00', 'group': '카카오', 'review': '직원들이 전반적으로 친절해서 인상은 좋았다.', 'image_urls': []} score: 0.3537727139536416
전체: [{'restaurant_id': 'res_1235', 'restaurant_name': '시올돈', 'review_id': 'rev_4004', 'user_id': 'user_2104', 'datetime': '2026-02-05 19:10:00', 'group': '네이버', 'review': '음식은 평타 이상인데 웨이팅 각오는 해야 한다.', 'image_urls': []}, {'restaurant_id': 'res

In [None]:
# 강점 추출
strength_result = llm_utils.extract_strengths(
    positive_reviews1, other_positive_reviews
)
print(json.dumps(strength_result, ensure_ascii=False, indent=2))


2026-01-02 16:15:17,576 - INFO - HTTP Request: POST https://api.openai.com/v1/chat/completions "HTTP/1.1 200 OK"


{
  "strength_summary": "웨이팅이 빨라서 대기 시간에 대한 부담이 적다."
}


## 이미지 있는 리뷰를 이용한 추천

In [None]:
# 이미지가 있는 리뷰 검색
image_reviews = vector_search.get_reviews_with_images("맛있다 좋다", limit=10)

images_list = []
for review in image_reviews:
    print(review["payload"])
    images_list.append(review["image_urls"])

images_list

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

{'restaurant_id': 'res_1235', 'restaurant_name': '시올돈', 'review_id': 'rev_4001', 'user_id': 'user_2101', 'datetime': '2026-02-03 18:00:00', 'group': '카카오', 'review': '음식 맛은 무난하고 실패는 없는 편이다.', 'image_urls': ['http://localhost:8000/sioldon_image1.jpeg']}
{'restaurant_id': 'res_1234', 'restaurant_name': '비즐', 'review_id': 'rev_3002', 'user_id': 'user_2002', 'datetime': '2026-01-03 12:12:00', 'group': '네이버', 'review': '가츠동은 괜찮았는데 다른 메뉴는 좀 애매했다.', 'image_urls': ['http://localhost:8000/bizzle_image2.jpeg']}
{'restaurant_id': 'res_1234', 'restaurant_name': '비즐', 'review_id': 'rev_3001', 'user_id': 'user_2001', 'datetime': '2026-01-03 12:10:00', 'group': '카카오', 'review': '점심시간이라 사람이 많았지만 생각보다 빨리 나왔다.', 'image_urls': ['http://localhost:8000/bizzle_image1.jpeg']}
{'restaurant_id': 'res_1235', 'restaurant_name': '시올돈', 'review_id': 'rev_4002', 'user_id': 'user_2102', 'datetime': '2026-02-03 18:20:00', 'group': '네이버', 'review': '웨이팅이 너무 길어서 중간에 포기할 뻔했다.', 'image_urls': ['http://localhost:8000/siol

[['http://localhost:8000/sioldon_image1.jpeg'],
 ['http://localhost:8000/bizzle_image2.jpeg'],
 ['http://localhost:8000/bizzle_image1.jpeg'],
 ['http://localhost:8000/sioldon_image2.jpeg']]