In [38]:
# Cell 1: 라이브러리 임포트 및 환경 변수 로드
import os
import json
import numpy as np
from collections import defaultdict
from dotenv import load_dotenv
import openai
import time

from langchain.embeddings import OpenAIEmbeddings
from langchain.chat_models import ChatOpenAI
from langchain.prompts import ChatPromptTemplate
from pinecone import Pinecone

# .env 파일 로드
load_dotenv()
openai.api_key = os.getenv("OPENAI_API_KEY")

# 환경 변수 출력 (디버깅용)
print("OPENAI_API_KEY:", os.getenv("OPENAI_API_KEY"))
print("PINECONE_API_KEY:", os.getenv("PINECONE_API_KEY"))
print("INDEX_NAME:", "vectorspace")

# Cell 2: OpenAI 임베딩 모델 생성 및 Pinecone 클라이언트 초기화
OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
PINECONE_API_KEY = os.getenv("PINECONE_API_KEY")
INDEX_NAME = "vectorspace"

# Pinecone 클라이언트 초기화 및 인덱스 연결
pc = Pinecone(api_key=PINECONE_API_KEY)
index = pc.Index(INDEX_NAME)

print("Embeddings와 Pinecone 클라이언트가 정상적으로 초기화되었습니다.")

# Cell 3: 사용자 쿼리 및 해당 임베딩 생성
def get_embedding(text):
    """Fetch embedding for a single text."""
    try:
        if not isinstance(text, str) or not text.strip():
            return None  # ✅ Skip empty or non-string texts

        response = openai.embeddings.create(
            model="text-embedding-3-small",
            input=text
        )
        return response.data[0].embedding  # ✅ Extract the embedding

    except Exception as e:
        print(f"❌ Error processing text: {e}")
        time.sleep(5)  # ✅ Wait & retry on failure
        return None
    
query = "오뎅바에서 시원한 오뎅국물 마시고 오뎅 질겅질겅 씹으면서 사케로 입 씻고 싶다."
query_embedding = get_embedding(query) # 텍스트를 벡터로 변환

print("사용자 쿼리:", query)
print("임베딩 벡터 길이:", len(query_embedding))

# Pinecone에서 벡터 검색
results = index.query(vector=query_embedding, top_k=10, include_metadata=True)
print("Pinecone 검색 완료, 반환된 매치 수:", len(results.matches))

# 실제 반환된 match의 정보를 확인
for i, match in enumerate(results.matches, start=1):
    print(f"\n=== Match {i} ===")
    print(f"Match ID: {match.id}")
    print(f"Score: {match.score}")

    # 메타데이터 확인
    print(f"Metadata: {match.metadata}")

# Cell 5: 검색 결과 처리
restaurant_reviews = defaultdict(list)
restaurant_scores = defaultdict(float)
restaurant_counts = defaultdict(int)

for match in results.matches:
    meta = match.metadata
    restaurant_name = meta.get("name")
    review_text = meta.get("text", "")
    
    # 해당 레스토랑의 리뷰 그룹화
    restaurant_reviews[restaurant_name].append(review_text)
    
    # 유사도 점수 누적
    restaurant_scores[restaurant_name] += match.score
    restaurant_counts[restaurant_name] += 1

print("검색 결과 처리 완료.")
print("레스토랑 ID 목록:", list(restaurant_reviews.keys()))


# Cell 6: 평균 유사도 계산 및 상위 3개 레스토랑 선정
restaurant_avg_scores = []
for rid, total_score in restaurant_scores.items():
    count = restaurant_counts[rid]
    avg_score = total_score / count
    restaurant_avg_scores.append((rid, avg_score))

restaurant_avg_scores.sort(key=lambda x: x[1], reverse=True)
top_3 = restaurant_avg_scores[:3]

print("상위 3개 레스토랑 (ID, 평균 유사도):", top_3)

# Cell 7: 추천된 레스토랑 및 리뷰 문자열 포맷팅
recommendation_context = ""
for idx, (rid, avg_score) in enumerate(top_3, start=1):
    reviews = restaurant_reviews.get(rid, [])
    reviews_text = "\n    - ".join(reviews) if reviews else "리뷰 없음"
    recommendation_context += (
        f"{idx}. 레스토랑: {rid} (평균 유사도: {avg_score:.2f})\n"
        f"   리뷰:\n    - {reviews_text}\n\n"
    )

print("포맷팅된 추천 및 리뷰 정보:\n")
print(recommendation_context)


OPENAI_API_KEY: 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
PINECONE_API_KEY: pcsk_6e2pDL_U1qFnMXUfLqaPKaZffThQUbdHoRPS7Wb7EBvfRyLFuQcSM4T5ZgjMNKND2vqnkG
INDEX_NAME: vectorspace
Embeddings와 Pinecone 클라이언트가 정상적으로 초기화되었습니다.
사용자 쿼리: 오뎅바에서 시원한 오뎅국물 마시고 오뎅 질겅질겅 씹으면서 사케로 입 씻고 싶다.
임베딩 벡터 길이: 1536
Pinecone 검색 완료, 반환된 매치 수: 10

=== Match 1 ===
Match ID: 710cafa1b708ddb0f5015cbdffa3e12d
Score: 0.503288031
Metadata: {'id': 166.0, 'name': '정든집', 'text': '이차로 갔는데 나란히 앉는 좌석이라서 이야기하기 좋아요 먹은 만큼 금액이 나오는 거라 좋고 오뎅 국물도 홀짝이면서 먹기 좋아요 오뎅도 곤약이랑 사각오뎅 넘맛있어요 사케랑 정종 도쿠리 시켜서 먹었는데 오뎅이랑 잘 어울려요'}

=== Match 2 ===
Match ID: a606fbc33747dac12ffe3f6736e8678d
Score: 0.496507794
Metadata: {'id': 54.0, 'name': '우라난바', 'text': '오늘도 날씨가그래서 오뎅 생맥주 마시다가 사케로 추천해 준 거 좋다'}

=== Match 3 ===
Match ID: 9ed25833749ca5e9a8fa8bca8478ed14
Score: 0.47111389
Metadata: {'id': 126.0, 'name': '성립', 'text': '망원역에서 가까운 사케 바입

In [39]:
# Cell 8: Output
from langchain.schema import SystemMessage, HumanMessage

# 1) 메시지 객체 생성
system_message = SystemMessage(
    content="당신은 설명 가능한 AI 어시스턴트입니다. "
            "주어진 리뷰와 추천 정보를 기반으로, 사용자 쿼리에 맞는 "
            "레스토랑 추천과 그 이유를 상세하게 설명해 주세요."
)

human_message = HumanMessage(
    content=(
        f"사용자 쿼리: {query}\n\n"
        "추천된 레스토랑과 해당 리뷰 목록:\n"
        f"{recommendation_context}\n\n"
        "이 정보를 종합하여, 왜 이 레스토랑들이 추천되는지 구체적인 이유와 함께 답변해 주세요."
    )
)

# 2) ChatPromptTemplate 생성 (from_messages에 Message 객체 리스트)
rag_prompt = ChatPromptTemplate.from_messages([system_message, human_message])

# 3) LLM 설정
llm = ChatOpenAI(
    temperature=0,
    model_name="gpt-4-turbo"
)

# 4) PromptValue 포맷팅

prompt_value = rag_prompt.format_prompt(
    query=query,
    recommendation_context=recommendation_context
)

# 5) 최신 호출 방식: llm.invoke(...)
#    메시지 객체로 변환한 뒤 LLM 호출
messages = prompt_value.to_messages()
final_answer = llm.invoke(messages)

print("\n[최종 추천 및 설명 답변]")
print(final_answer.content)



[최종 추천 및 설명 답변]
사용자님의 요구사항을 고려하여 세 개의 레스토랑을 분석한 결과, 다음과 같은 이유로 각각의 레스토랑을 추천드립니다:

1. **정든집**:
   - **오뎅과 사케의 조합**: 이 레스토랑은 오뎅과 사케를 함께 즐길 수 있는 곳으로, 리뷰에 따르면 오뎅 국물을 홀짝이며 먹기 좋고, 다양한 종류의 오뎅(곤약, 사각오뎅)이 매우 맛있다고 합니다. 또한, 사케와 정종 도쿠리를 함께 시켜 먹었을 때 오뎅과 잘 어울린다고 평가되어 있습니다.
   - **분위기**: 좌석 배치가 나란히 앉아 이야기하기 좋은 구조로 되어 있어, 친구들과의 대화나 혼자서의 식사에도 적합할 것으로 보입니다.

2. **우라난바**:
   - **사케 추천**: 이 레스토랑은 사케를 추천해주는 서비스가 좋은 것으로 보이며, 오뎅과 함께 사케를 즐기기에 적합한 곳입니다. 특히, 생맥주와 함께 시작해서 사케로 넘어가는 추천이 좋았다는 평가가 있습니다.
   - **날씨에 따른 선택**: 날씨가 추울 때 오뎅과 사케는 특히 좋은 조합이 될 수 있으며, 이 레스토랑은 그러한 날씨에 방문하기 좋은 곳으로 추천됩니다.

3. **성립**:
   - **다양한 메뉴와 사케**: 이 레스토랑은 사케 선택에 있어서도 좋은 추천을 제공하며, 다양한 일본 요리와 함께 사케를 즐길 수 있는 곳입니다. 특히, 이소베마끼와 같은 특별한 요리를 제공하며, 국물과 사케를 함께 즐기며 시간을 보내기 좋다고 평가되었습니다.
   - **분위기**: 친구들과 함께 방문하거나 혼자서 방문하기에도 좋은 분위기를 제공합니다. 특히, 친절한 사장님이 운영하는 점도 긍정적인 요소로 작용할 수 있습니다.

종합적으로, **정든집**은 오뎅과 사케를 중점적으로 즐기고 싶은 분에게 가장 적합할 것으로 보이며, **우라난바**와 **성립**은 사케와 함께 다양한 일본 요리를 경험하고 싶은 분들에게 좋은 선택이 될 것입니다.
