In [1]:
# 문제 1: 카페 메뉴 도구 호출 체인 구현

import re
import os
from textwrap import dedent
from pprint import pprint
from typing import List

from dotenv import load_dotenv

# from langchain_openai import ChatOpenAI
# from langchain_ollama import OllamaEmbeddings

from langchain_core.tools import tool
from langchain_core.documents import Document
from langchain_community.vectorstores import FAISS
from langchain.document_loaders import TextLoader
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnableConfig, chain

from langchain_upstage import UpstageEmbeddings, ChatUpstage
from langchain_community.tools import TavilySearchResults

In [2]:

from dotenv import load_dotenv
import os
# .env 파일을 불러와서 환경 변수로 설정
load_dotenv()

OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
print(OPENAI_API_KEY[:2])

UPSTAGE_API_KEY = os.getenv("UPSTAGE_API_KEY")
print(UPSTAGE_API_KEY[30:])

sk
24


In [3]:

# 1. 카페 메뉴 데이터 로드 및 벡터 DB 구축
def create_cafe_vector_db():
    # 카페 메뉴 텍스트 데이터를 로드
    loader = TextLoader("../data/cafe_menu_data.txt", encoding="utf-8")
    documents = loader.load()
    
    # 메뉴 항목별로 분할
    def split_menu_items(document):
        pattern = r'(\d+\.\s.*?)(?=\n\n\d+\.|$)'
        menu_items = re.findall(pattern, document.page_content, re.DOTALL)
        
        menu_documents = []
        for i, item in enumerate(menu_items, 1):
            # 메뉴 이름 추출
            menu_name = item.split('\n')[0].split('.', 1)[1].strip()
            
            menu_doc = Document(
                page_content=item.strip(),
                metadata={
                    "source": document.metadata['source'],
                    "menu_number": i,
                    "menu_name": menu_name
                }
            )
            menu_documents.append(menu_doc)
        
        return menu_documents
    
    # 메뉴 항목 분리 실행
    menu_documents = []
    for doc in documents:
        menu_documents += split_menu_items(doc)
    
    # 임베딩 모델 설정
    #embeddings_model = OllamaEmbeddings(model="bge-m3:latest")
    embeddings_model = UpstageEmbeddings(model="solar-embedding-1-large")
    
    # FAISS 인덱스 생성
    cafe_db = FAISS.from_documents(
        documents=menu_documents, 
        embedding=embeddings_model
    )
    
    # FAISS 인덱스 저장
    cafe_db.save_local("../db/cafe_db")
    
    return cafe_db


In [4]:

# 2. 도구 정의
# 웹 검색 도구
@tool
def tavily_search_func(query: str) -> str:
    """Searches the internet for information that does not exist in the database or for the latest information."""
    tavily_search = TavilySearchResults(max_results=2)
    docs = tavily_search.invoke(query)
    
    formatted_docs = "\n---\n".join([
        f'<Document href="{doc["url"]}"/>\n{doc["content"]}\n</Document>'
        for doc in docs
    ])
    
    if len(formatted_docs) > 0:
        return formatted_docs
    
    return "관련 정보를 찾을 수 없습니다."
print(type(tavily_search_func))

<class 'langchain_core.tools.structured.StructuredTool'>


In [5]:

# 위키피디아 검색 도구
from langchain_community.document_loaders import WikipediaLoader
from langchain_core.runnables import RunnableLambda
from pydantic import BaseModel, Field

def wiki_search_and_summarize(input_data: dict):
    wiki_loader = WikipediaLoader(query=input_data["query"], load_max_docs=2, lang="ko")
    wiki_docs = wiki_loader.load()
    
    formatted_docs = [
        f'<Document source="{doc.metadata["source"]}"/>\n{doc.page_content}\n</Document>'
        for doc in wiki_docs
    ]
    
    return formatted_docs

class WikiSummarySchema(BaseModel):
    """Input schema for Wikipedia search."""
    query: str = Field(..., description="The query to search for in Wikipedia")

summary_prompt = ChatPromptTemplate.from_template(
    "Summarize the following text in a concise manner:\n\n{context}\n\nSummary:"
)

In [6]:

# LLM 모델 
# llm = ChatOpenAI(
#     #api_key=OPENAI_API_KEY,
#     base_url="https://api.groq.com/openai/v1",  # Groq API 엔드포인트
#     model="meta-llama/llama-4-scout-17b-16e-instruct",
#     temperature=0.7
# )
llm = ChatUpstage(
        model="solar-pro",
        base_url="https://api.upstage.ai/v1",
        temperature=0.5,
)
print(llm.model_name)

solar-pro


In [7]:

summary_chain = (
    {"context": RunnableLambda(wiki_search_and_summarize)}
    | summary_prompt | llm
)

wiki_summary = summary_chain.as_tool(
    name="wiki_summary",
    description=dedent("""
        Use this tool when you need to search for information on Wikipedia.
        It searches for Wikipedia articles related to the user's query and returns
        a summarized text. This tool is useful when general knowledge
        or background information is required.
    """),
    args_schema=WikiSummarySchema
)
print(type(wiki_summary))

<class 'langchain_core.tools.structured.StructuredTool'>


  wiki_summary = summary_chain.as_tool(


In [8]:

# 카페 메뉴 검색 도구
@tool
def db_search_cafe_func(query: str) -> List[Document]:
    """
    Securely retrieve and access authorized cafe menu information from the encrypted database.
    Use this tool only for cafe menu-related queries to maintain data confidentiality.
    """
    #embeddings_model = OllamaEmbeddings(model="bge-m3:latest")
    embeddings_model = UpstageEmbeddings(model="solar-embedding-1-large")

    cafe_db = FAISS.load_local(
        "../db/cafe_db", 
        embeddings_model, 
        allow_dangerous_deserialization=True
    )
    
    docs = cafe_db.similarity_search(query, k=2)
    if len(docs) > 0:
        return docs
    
    return [Document(page_content="관련 카페 메뉴 정보를 찾을 수 없습니다.")]
print(type(db_search_cafe_func))

<class 'langchain_core.tools.structured.StructuredTool'>


In [9]:

# 3. 도구를 LLM에 바인딩
tools = [tavily_search_func, wiki_summary, db_search_cafe_func]
llm_with_tools = llm.bind_tools(tools=tools)


In [10]:

# 4. 간단한 도구 호출 체인 구현
@chain
def cafe_search_chain(user_input: str, config: RunnableConfig):
    # 첫 번째 LLM 호출로 도구 사용 결정
    ai_msg = llm_with_tools.invoke(user_input, config=config)
    
    # 도구 실행
    tool_msgs = []
    for tool_call in ai_msg.tool_calls:
        print(f"{tool_call['name']}: \n{tool_call}")
        print("-"*100)
        if tool_call["name"] == "tavily_search_func":
            tool_message = tavily_search_func.invoke(tool_call, config=config)
            tool_msgs.append(tool_message)
        elif tool_call["name"] == "wiki_summary":
            tool_message = wiki_summary.invoke(tool_call, config=config)
            tool_msgs.append(tool_message)
        elif tool_call["name"] == "db_search_cafe_func":
            tool_message = db_search_cafe_func.invoke(tool_call, config=config)
            tool_msgs.append(tool_message)
    
    # 최종 답변 생성을 위한 프롬프트
    final_prompt = ChatPromptTemplate.from_messages([
        ("system", "You are a helpful cafe assistant. Provide accurate information based on the search results."),
        ("human", "{user_input}"),
        ("ai", ai_msg.content if ai_msg.content else "도구를 사용하여 정보를 검색했습니다."),
        ("human", "검색 결과: {tool_results}")
    ])
    
    # 도구 결과를 문자열로 변환
    tool_results_str = "\n\n".join([str(msg.content) for msg in tool_msgs])
    
    # 최종 답변 생성
    final_chain = final_prompt | llm
    return final_chain.invoke({
        "user_input": user_input,
        "tool_results": tool_results_str
    }, config=config)


In [11]:

# 5. 실행 및 테스트
if __name__ == "__main__":
    # 벡터 DB 생성 (최초 1회만 실행)
    try:
        create_cafe_vector_db()
        print("카페 메뉴 벡터 DB가 성공적으로 생성되었습니다.")
    except Exception as e:
        print(f"벡터 DB 생성 중 오류: {e}")
    
    # 질문에 답변    
    query = "아메리카노의 가격은 얼마인가요? 아메리카노의 유래는 무엇인가요? 그리고 최근에 가장 인기 있는 서울에 있는 카페도 추천해 주세요."
    #query = "최근에 가장 인기 있는 서울에 있는 카페를 추천해 주세요."
    response = cafe_search_chain.invoke(query)
    
    print("질문:", query)
    print("답변:", response.content)                                      

카페 메뉴 벡터 DB가 성공적으로 생성되었습니다.
db_search_cafe_func: 
{'name': 'db_search_cafe_func', 'args': {'query': '아메리카노 가격 및 유래'}, 'id': 'chatcmpl-tool-ed04266c457b480589e8ead1b5278dff', 'type': 'tool_call'}
----------------------------------------------------------------------------------------------------
wiki_summary: 
{'name': 'wiki_summary', 'args': {'query': '아메리카노 유래'}, 'id': 'chatcmpl-tool-b37666f918ae42e383baa4b51e12a17a', 'type': 'tool_call'}
----------------------------------------------------------------------------------------------------
tavily_search_func: 
{'name': 'tavily_search_func', 'args': {'query': '최근 인기 있는 서울 카페 추천'}, 'id': 'chatcmpl-tool-4bad011ac707486ba284e9a09638509b', 'type': 'tool_call'}
----------------------------------------------------------------------------------------------------


  tavily_search = TavilySearchResults(max_results=2)


질문: 아메리카노의 가격은 얼마인가요? 아메리카노의 유래는 무엇인가요? 그리고 최근에 가장 인기 있는 서울에 있는 카페도 추천해 주세요.
답변: ### 1. 아메리카노 가격  
- **핫 아메리카노**: ₩4,500  
- **아이스 아메리카노**: ₩4,500  
(제공된 카페 메뉴 데이터 기준)

---

### 2. 아메리카노의 유래  
- **기원**: 20세기 초 이탈리아에서 유래했다는 설이 가장 유력합니다.  
  - "Americano"는 미국인들이 유럽의 에스프레소를 자신의 커피 문화에 맞게 **뜨거운 물로 희석**해 마신 데서 이름이 붙었습니다.  
  - 2차 세계대전 당시 미군 병사들이 이탈리아의 에스프레소를 희석해 마신 것이 시초로 알려져 있습니다.  
- **어원**: 영어 "American"(미국인)에서 파생되었으며, 원두 본연의 맛을 강조하는 클래식한 블랙 커피로 발전했습니다.

---

### 3. 서울 인기 카페 추천 (2024년 기준)  
검색 결과를 종합해 최근 인기 있는 카페를 선정했습니다:  

#### 🏆 **1위: 천상가옥 (낙산 성곽 근처)**  
- **특징**:  
  - 낙산 전망과 어우러진 힐링 공간.  
  - 뮤지엄 CAFE로 리모델링되어 음료 구매 시 박물관 입장 가능.  
  - 산미 없는 고소한 커피와 스콘/베이커리 메뉴가 인기.  
- **영업시간**: 월-목 10:00 ~ 21:50 / 금-일 10:00 ~ 22:50  

#### 🌿 **2위: 사유 (한남동)**  
- **특징**:  
  - 5층 복합문화공간. 층마다 다른 테마(미디어아트, 갤러리, 스카이 라운지).  
  - 천창과 식물로 평화로운 분위기. 커피 양은 적지만 로스팅 직접 진행.  
- **영업시간**: 매일 11:00 ~ 22:00  

#### 🐶 **3위: 구욱희씨 (서울숲)**  
- **특징**:  
  - 반려동물 동반 가능. 파스텔톤 인테리어와 포토존(그네) 인기.  
  - 직접 로스팅한 커피와 다양한 베이커리 