In [None]:
import requests
from urllib.parse import quote

client_id = "SWe77FM8c_EjAm5Y93h5"
client_secret = "mAz_OvLf7T"

def naver_shop_search(query, display=10):
    encoded_query = quote(query)
    url = f"https://openapi.naver.com/v1/search/shop.json?query={encoded_query}&display={display}&start=1&sort=sim&exclude=used:cbshop:rental"

    headers = {
        "X-Naver-Client-Id": client_id,
        "X-Naver-Client-Secret": client_secret
    }

    response = requests.get(url, headers=headers)

    if response.status_code == 200:
        return response.json()
    else:
        return {"error": response.status_code}

result = naver_shop_search("영양제", 100)

# if 'items' in result:
#   for item in result['items']:
#     if item['brand'] != '':
#       print(f"브랜드: {item['brand']}")
#       print(f"이름: {item['title']}")
#       print(f"상품ID: {item['productId']}")
#       print(f"링크: {item['link']}")
#       print("-" * 50)
# else:
#   print("Error:", result.get('error', 'Unknown error'))


In [None]:
!pip install -q chromadb sentence-transformers
!pip install -q langchain langchain-community langchain-core langchain_openai

In [None]:
import chromadb
from chromadb.utils import embedding_functions
from sentence_transformers import SentenceTransformer

# 1. 데이터 전처리 함수
def preprocess_items(items):
    processed = []
    for item in items:
        data = {
            "id": item['productId'],
            "text": f"{item['title']} {item['brand']} {item['maker']} {item['category3']}",  # 임베딩용 텍스트
            "metadata": {
                "price": int(item['lprice']),
                "brand": item['brand'],
                "category": f"{item['category1']}>{item['category2']}>{item['category3']}",
                "link": item['link']
            }
        }
        processed.append(data)
    return processed

# 2. Chroma DB 설정
client = chromadb.PersistentClient(path="./naver_shopping_db")
embedding_model = embedding_functions.SentenceTransformerEmbeddingFunction(
    model_name="sentence-transformers/paraphrase-multilingual-mpnet-base-v2"
)

# 기존 컬렉션이 있으면 삭제 후 재생성
try:
    client.delete_collection("products")
except:
    pass
collection = client.create_collection(
    name="products",
    embedding_function=embedding_model,  # 반드시 임베딩 함수 재지정
    metadata={"hnsw:space": "cosine"}  # 거리 측정 방식 변경
)

# 3. 데이터 삽입 (API 결과 사용)
if 'items' in result:
    processed_data = preprocess_items(result['items'])

    # 벡터 DB에 문서 추가
    collection.add(
        ids=[item['id'] for item in processed_data],
        documents=[item['text'] for item in processed_data],
        metadatas=[item['metadata'] for item in processed_data]
    )
    print("✅ 성공적으로", len(processed_data), "개 상품 저장됨")
else:
    print("Error:", result.get('error', '데이터 없음'))

# 4. 검색 예시 함수
def search_products(query, n_results=3):
    results = collection.query(
        query_texts=[query],
        n_results=n_results
    )
    for idx, (doc, meta) in enumerate(zip(results['documents'][0], results['metadatas'][0]), 1):
        print(f"🔍 [{idx}] {doc}")
        print(f"   가격: {meta['price']:,}원 | 브랜드: {meta['brand']}")
        print(f"   카테고리: {meta['category']}")
        print(f"   링크: {meta['link']}")
        print("-"*50)

✅ 성공적으로 100 개 상품 저장됨


In [None]:
# LLM 적용 전, 벡터 DB에 잘 들어가있는지 확인
search_products("피곤할 때 먹는 영양제", 5)

🔍 [1] 얼라이브 원스데일리 멀티/포맨/ 우먼 60정 비타민B군 미네랄 종합<b>영양제</b> 네츄럴라이프얼라이브 네이쳐스웨이 비타민제
   가격: 23,900원 | 브랜드: 네츄럴라이프얼라이브
   카테고리: 식품>건강식품>비타민제
   링크: https://smartstore.naver.com/main/products/309612084
--------------------------------------------------
🔍 [2] 뉴트리포유 듀얼 이뮨샷 액상 마시는 멀티비타민 미네랄 <b>영양제</b> 30개입 피로회복 종합<b>영양제</b>  소셜빈 비타민제
   가격: 54,900원 | 브랜드: 
   카테고리: 식품>건강식품>비타민제
   링크: https://smartstore.naver.com/main/products/10532848731
--------------------------------------------------
🔍 [3] 센트룸 실버 포 맨 종합 멀티 비타민 112정 코스트코 남성 50+ 대용량 <b>영양제</b> 센트룸 화이자 비타민제
   가격: 34,900원 | 브랜드: 센트룸
   카테고리: 식품>건강식품>비타민제
   링크: https://smartstore.naver.com/main/products/9244093197
--------------------------------------------------
🔍 [4] 세노비스 수험생 중학생 고등학생 성인 청소년 종합 <b>영양제</b> 멀티비타민 미네랄 젤리 60구미   비타민제
   가격: 23,900원 | 브랜드: 
   카테고리: 식품>건강식품>비타민제
   링크: https://smartstore.naver.com/main/products/7281402394
--------------------------------------------------
🔍 [5] 올인원<b>영양제</b> 이뮨 멀티팩 남성 여성 종합비타민   비타민제
   가격: 38,800원

In [1]:
# Hugging Face 및 Google API 인증
from google.colab import userdata
HF_TOKEN = userdata.get('HF_TOKEN') # Hugging Face 액세스 토큰
GOOGLE_API_KEY = userdata.get('GOOGLE_API_KEY') # Google Custom Search API 키
GOOGLE_CSE_ID = userdata.get('GOOGLE_CSE_ID') # Programmable Search Engine ID
OPENAI_API_KEY = userdata.get('OPENAI_API_KEY') # OpenAI API Key
print(OPENAI_API_KEY)

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


In [None]:
# 2. Google Programmable Search Engine 설정
from googleapiclient.discovery import build

def google_search(query, num=3):
    """
    구글 커스텀 검색을 실행하는 함수

    Parameters:
    - query (str): 검색할 질의어(검색어)입니다. 예: "비타민C 효능"
    - num (int): 검색 결과에서 반환할 최대 문서(스니펫) 개수입니다. 기본값은 3개입니다.

    Returns:
    - list: 각 검색 결과의 요약(snippet) 텍스트 리스트
    """
    service = build("customsearch", "v1", developerKey=GOOGLE_API_KEY)
    res = service.cse().list(q=query, cx=GOOGLE_CSE_ID, num=num).execute()
    return [item["snippet"] for item in res["items"]]


In [None]:
from langchain.agents import AgentExecutor, create_openai_tools_agent
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain_core.tools import tool

# 2. 검색 도구 정의 (Function Calling)
@tool
def search_products(query: str, max_results: int = 5) -> list:
    """제품 검색을 위해 Chroma DB를 쿼리하는 도구"""
    """
    Chroma DB를 쿼리하여 제품 정보를 검색하는 도구

    Parameters:
    - query (str): 제품 검색 질의어입니다. 예: "비타민C 고함량"
    - max_results (int): 반환할 최대 제품 개수입니다. 기본값은 3개입니다.

    Returns:
    - list: 각 제품의 정보(제품명, 가격, 링크)를 담은 딕셔너리들의 리스트
      예시: [{"제품": "제품명", "가격": 10000, "링크": "https://..."}, ...]
    """
    results = collection.query(
        query_texts=[query],
        n_results=max_results
    )
    return [{
        "제품": doc,
        "가격": meta['price'],
        "링크": meta['link']
    } for doc, meta in zip(results['documents'][0], results['metadatas'][0])]

@tool
def google_search_tool(query: str, num_results: int = 10) -> list:
    """구글 검색을 통해 제품 상세 정보 및 최신 논문을 찾는 도구. 질문 답변에 필요한 웹 기반 정보 수집에 사용"""
    """
    구글 검색 API를 통해 웹에서 정보를 검색하는 도구

    Parameters:
    - query (str): 검색할 질의어(검색어)입니다. 예: "2025년 영양제 트렌드"
    - num_results (int): 반환할 최대 검색 결과 개수입니다. 기본값은 3개입니다.

    Returns:
    - list: 각 검색 결과의 요약(snippet) 텍스트 리스트
    """
    return google_search(query, num=num_results)

# 3. 에이전트 설정
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0.3, openai_api_key=OPENAI_API_KEY)
llm_with_tools = llm.bind_tools([search_products, google_search_tool])

system_prompt = """당신은 영양제 전문 약사 어시스턴트입니다. 다음 규칙을 준수하세요:
- 사용자 질문 유형에 따라 적절한 도구 선택
  - 제품 검색: search_products
  - 제품 상세 정보, 최신 논문: google_search_tool
- 검색 결과를 바탕으로 정확한 정보 제공
- 추천하는 이유를 자세하게 설명
- 가격, 성분 비교시 표 형태로 응답
- 모르는 정보는 확대 해석하지 말 것
"""

prompt = ChatPromptTemplate.from_messages([
    ("system", system_prompt),
    ("human", "{input}"),
    MessagesPlaceholder("agent_scratchpad")
])

tools = [search_products]
agent = create_openai_tools_agent(llm_with_tools, tools, prompt)
agent_executor = AgentExecutor(agent=agent, tools=tools, verbose=False) # verbose=True 로 변경안해도 됨


In [None]:
# 4. 실행 예시
response = agent_executor.invoke({
    "input": "종종 머리가 아프고 눈이 피곤해. 어떤 영양제를 먹으면 좋을지 추천해줘. 주요 성분과 함량도 알려줘."
})
print(response['output'])

두통과 눈 피로를 완화하기 위해 추천할 수 있는 영양제는 다음과 같습니다. 각 제품의 주요 성분과 함량도 함께 안내드립니다.

| 제품명 | 가격 | 주요 성분 | 링크 |
|--------|------|-----------|------|
| 종근당 아임비타 멀티비타민 이뮨플러스 14병 샷 | 21,900원 | 비타민 A, C, D, E, B군, 아연 | [구매하기](https://smartstore.naver.com/main/products/11097440087) |
| [1+1]종근당 아임비타 이뮨플러스 샷 2박스 | 23,500원 | 비타민 A, C, D, E, B군, 아연 | [구매하기](https://smartstore.naver.com/main/products/8566190007) |
| 뉴트리포유 듀얼 이뮨샷 액상 | 54,900원 | 비타민 B군, 비타민 C, 아연, 셀레늄 | [구매하기](https://smartstore.naver.com/main/products/10532848731) |
| 세노비스 수험생 중학생 고등학생 성인 청소년 종합 영양제 | 23,900원 | 비타민 A, C, D, E, B군, 아연 | [구매하기](https://smartstore.naver.com/main/products/7281402394) |
| 얼라이브 원스데일리 멀티 | 23,900원 | 비타민 A, C, D, E, B군, 미네랄 | [구매하기](https://smartstore.naver.com/main/products/309612084) |

### 추천 이유:
1. **비타민 B군**: 에너지 대사에 중요한 역할을 하며, 두통 완화에 도움을 줄 수 있습니다.
2. **비타민 C**: 항산화 작용을 통해 피로 회복에 기여합니다.
3. **아연**: 면역력 강화에 도움을 주며, 눈 건강에도 긍정적인 영향을 미칩니다.
4. **액상 형태**: 흡수율이 높아 빠르게 효과를 볼 수 있습니다.

이 제품들은 두통과 눈 피로를 완화하는 데 도움을 줄 수 있는 다양