In [1]:
from dotenv import load_dotenv
load_dotenv()

True

In [2]:
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model='gpt-4o')
small_llm = ChatOpenAI(model='gpt-4o-mini')

### 1. RDBMS to VectorDB
- 변동성이 적은 Admin 메뉴 데이터 VeoctorDB 적재

In [None]:
import mysql.connector
from langchain_openai import OpenAIEmbeddings
from langchain_community.vectorstores import Chroma
from langchain_core.documents import Document

conn = mysql.connector.connect(
    host="localhost",
    user="root",
    password="1234",
    database="noticeboard"
)
cursor = conn.cursor(dictionary=True)

# 1. 데이터 조회
cursor.execute("""
    SELECT page_id, domain, page_url, description
    FROM page_metadata
""")
rows = cursor.fetchall()

# 2. LangChain 데이터 형식(Document)으로 변환
documents = []
for row in rows:
    # 벡터화할 핵심 텍스트: description
    page_content = row['description'] 
    
    # 저장할 메타데이터: 검색 결과에서 꺼내 쓸 정보들
    metadata = {
        "page_id": row["page_id"],
        "domain": row["domain"],
        "page_url": row["page_url"]
    }
    
    documents.append(Document(page_content=page_content, metadata=metadata))

# 3. Embedding 모델 설정 및 Vector DB 저장
embeddings = OpenAIEmbeddings(model="text-embedding-3-small")

# Chroma DB에 저장 - .from_documents() 메서드 사용
vector_db = Chroma(
    persist_directory="./my_vector_db",
    embedding_function=embeddings
)


In [8]:
# 사용자의 질문(의도) 시뮬레이션
query = "비밀번호를 잊어버렸는데 로그인 어떻게 해?"

# 유사도 검색 수행 (가장 유사한 2개 가져오기)
search_results = vector_db.similarity_search(query, k=2)

for doc in search_results:
    print(f"도메인: {doc.metadata['domain']}")
    print(f"경로(URL): {doc.metadata['page_url']}")
    print(f"매칭된 설명: {doc.page_content}")
    print("-" * 30)

도메인: 회원
경로(URL): /login
매칭된 설명: 사용자가 아이디와 비밀번호로 로그인하는 화면이다. 인증 성공 시 서비스에 접근할 수 있다.
------------------------------
도메인: 보안
경로(URL): /security/2fa
매칭된 설명: 사용자의 계정 보안을 강화하기 위해 2단계 인증을 설정하는 화면이다. OTP 또는 QR 기반 인증을 설정한다.
------------------------------


### 2. RAG 답변 체인 구성

In [None]:
from langchain_openai import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough

# 프롬프트 디자인 (페르소나 부여)
template = """
당신은 시스템 이용을 돕는 친절한 AI 가이드입니다. 
사용자의 질문에 대해 [검색 결과]를 바탕으로 자연스럽고 친절하게 답변하세요.
답변에는 반드시 이동해야 할 페이지의 이름과 URL을 포함해 주세요.

[검색 결과]:
{context}

사용자 질문: {question}

친절한 답변:"""

prompt = ChatPromptTemplate.from_template(template)

# 검색 및 답변 생성 체인 구성
def format_docs(docs):
    # 검색된 문서들을 하나의 텍스트로 합침
    return "\n\n".join([f'''페이지명: {d.metadata['domain']}
                        URL: {d.metadata['page_url']}\n설명: {d.page_content}''' for d in docs])

retriever = vector_db.as_retriever(search_kwargs={"k": 2})

chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | llm
)

In [None]:
response = chain.invoke("재고 보고싶어")
print(response.content)

"""
안녕하세요! 상품의 재고 현황과 입출고 내역을 확인하고 싶으시군요. 재고 관리를 위해서는 "재고" 페이지로 이동하시면 됩니다. 아래의 링크를 클릭하시면 자세한 정보를 확인하실 수 있습니다:

[재고 페이지](/inventory)

필요한 정보를 잘 찾으시길 바랍니다! 추가로 궁금한 점이 있으면 언제든지 말씀해 주세요.
"""

### 3. 도구 정의

In [9]:
from langchain_core.tools import tool

@tool
def search_page_tool(query: str) -> str:
    """관리자용 AI 어시스턴트가 메뉴 페이지를 검색하는 도구"""
    search_results = vector_db.similarity_search(query, k=2)
    formatted_results = format_docs(search_results)
    return formatted_results

In [None]:
from langchain_core.tools import tool
import requests

def search_inventory_tool(item_name: str):
    """실시간 재고 시스템 API를 호출하여 최신 수량과 상세 페이지 경로를 가져오는 도구"""
    
    API_URL = f"http://localhost:8081/inventories/{item_name}"
    response = requests.get(API_URL)
    item_list = response.json()
    
    if isinstance(item_list, list) and len(item_list) > 0:
        results = []
        for item in item_list:
            # 데이터 추출 
            prod_id = item.get('productId', '알수없음')
            qty = item.get('orderQty', 0)
            price = item.get('unitPrice', 0)
            path = f"/inventory/{prod_id}"
            
            # 개별 항목 문자열 생성
            info = f"- 상품ID: {prod_id}\n  재고: {qty}개\n  단가: {price}원\n  경로: {path}"
            results.append(info)
        
        # 모든 결과를 줄바꿈으로 합쳐서 반환
        all_inventory_info = "\n\n".join(results)
        return f"'{item_name}' 검색 결과 총 {len(item_list)}건이 발견되었습니다:\n\n{all_inventory_info}"
        
    else:
        return f"현재 시스템상에 '{item_name}' 품목이 존재하지 않습니다."

In [21]:
result = search_inventory_tool("마우스")
print(result)

'마우스' 검색 결과 총 1건이 발견되었습니다:

- 상품ID: 2
  재고: 20개
  단가: 15000원
  경로: /inventory/2


In [22]:
import openai
import json

def keyword_expansion_node(user_query: str):
    """
    사용자의 질문을 분석하여 검색에 최적화된 3~4개의 키워드를 추출하는 노드
    """
    
    prompt = f"""
    당신은 재고 관리 시스템의 검색 전문가입니다.
    사용자의 질문을 분석하여 '재고 검색 API'에 던질 최적의 검색 키워드를 3~4개 추출하세요.
    
    [지침]
    1. 사용자가 '컴퓨터'라고 하면 ['컴퓨터', '모니터', '노트북', '데스크탑']과 같이 연관 상품을 제안하세요.
    2. 너무 포괄적인 단어보다는 실제 상품이 존재할 법한 구체적인 단어를 선택하세요.
    3. 반드시 JSON 리스트 형식으로만 응답하세요. 예: ["키워드1", "키워드2"]

    사용자 질문: "{user_query}"
    """

    try:
        response = openai.chat.completions.create(
            model=small_llm, # 또는 gpt-3.5-turbo
            messages=[{"role": "user", "content": prompt}],
            response_format={ "type": "json_object" } # JSON 출력을 보장
        )
        
        # LLM 응답 파싱
        content = response.choices[0].message.content
        keywords_data = json.loads(content)
        
        # JSON 구조에 따라 리스트 추출 (예: {"keywords": ["a", "b"]})
        keywords = keywords_data.get("keywords", [])
        
        # 만약 dict 형식이 아니고 바로 list 형태인 경우를 대비한 안전장치
        if isinstance(keywords_data, list):
            keywords = keywords_data
            
        return keywords

    except Exception as e:
        print(f"키워드 확장 중 오류 발생: {e}")
        return [user_query] # 오류 시 원본 질문이라도 반환

In [23]:
result = keyword_expansion_node("컴퓨터할 때 필요한 제품 없을까?")
print(result)

키워드 확장 중 오류 발생: Error code: 400 - {'error': {'message': "We could not parse the JSON body of your request. (HINT: This likely means you aren't using your HTTP library correctly. The OpenAI API expects a JSON payload, but what was sent was not valid JSON. If you have trouble figuring out how to fix this, please contact us through our help center at help.openai.com.)", 'type': 'invalid_request_error', 'param': None, 'code': None}}
['컴퓨터할 때 필요한 제품 없을까?']
