# 사내 근무지원시스템 AI FirmAgent
- 제목 : FirmAgent

## 데모
- 회사 부서별 업무가 작성되어있는 조직이 사용하는 업무 도구 문서(Profile of Task and Tools, 이하 POTAT)문서를 엑셀로 작성해서 입력하면, 필요한 도구로
```
<입력예시>
유저입력 : 사내 탬플릿과 문서양식을 어디서 확인해
유저입력 : 사내어린이집은 어디에서 도움받지?

<출력예시>
생성된 계획: {
  "plan": {
    "Childcare Support": [
      "사내 어린이집 운영에 대한 정보는 어디에서 확인할 수 있나요?",
      "사내 어린이집 지원을 받으려면 어떻게 해야 하나요?"
    ]
  },
  "selected_tools": [
    "Childcare Support"
  ]
}

FirmAgent 정제 질문 : 생성된 계획: {
  "plan": {
    "Internal Comms": [
      "사내 템플릿과 문서 양식을 확인할 수 있는 시스템이나 위치를 안내해 주세요."
    ]
  },
  "selected_tools": [
    "Internal Comms"
  ]
}
```
- POTAT 문서를 사내 타팀에 전달하여, 취합 후, 고성능 LLM 에 입력하면 FirmAgent 가 "멀티턴", "멀티쿼리", "툴 셀렉" 3가지 분리해 유저 입력 문맥과 행간의 의미를 파악 하여 질문을 정제하고, 적절한 정보와 기능을 갖춘 후방시스템에 넘겨주는 **"분기처리기"** 역할을 수행하게 됩니다

## POTAT 문서 예시
- 아래 예시는 "네이버 주식회사" 의 2023년 사업보고서를 기반으로 POTAT 문서를 작성한 예시 입니다.
![image.png](https://private-user-images.githubusercontent.com/31065684/420677877-be00f820-02ca-495b-9491-948ea9331581.png?jwt=eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJpc3MiOiJnaXRodWIuY29tIiwiYXVkIjoicmF3LmdpdGh1YnVzZXJjb250ZW50LmNvbSIsImtleSI6ImtleTUiLCJleHAiOjE3NDE1MzAzNjMsIm5iZiI6MTc0MTUzMDA2MywicGF0aCI6Ii8zMTA2NTY4NC80MjA2Nzc4NzctYmUwMGY4MjAtMDJjYS00OTViLTk0OTEtOTQ4ZWE5MzMxNTgxLnBuZz9YLUFtei1BbGdvcml0aG09QVdTNC1ITUFDLVNIQTI1NiZYLUFtei1DcmVkZW50aWFsPUFLSUFWQ09EWUxTQTUzUFFLNFpBJTJGMjAyNTAzMDklMkZ1cy1lYXN0LTElMkZzMyUyRmF3czRfcmVxdWVzdCZYLUFtei1EYXRlPTIwMjUwMzA5VDE0MjEwM1omWC1BbXotRXhwaXJlcz0zMDAmWC1BbXotU2lnbmF0dXJlPWZiZjNhNzBkYTE4NzM1MzNkYjA1YzdiNWQ3YzY3NjJhZmExOTdiOWRkYmUyM2NjNGJiM2Y4ZWVjODljMTVmMjgmWC1BbXotU2lnbmVkSGVhZGVycz1ob3N0In0.IEKppeGfXguF871payldpZVnBaHEixXui06Qw4JzOh8)

## 기획
- 회사에서 "업무" 이외의 다른 일들이 많은데, 각각의 개개인이 핵심 업무에 집중할수 있도록 비핵심업무에 대한 자동화를 해주는 AI Agent 입니다.
- 예시 1) HR팀 케이스
  - HR팀의 핵심업무 : 채용관리, 인재관리, 조직개발, 인사평가 및 성과보상 등등..
  - HR팀의 비 핵심 업무 : 신규입사자 문의, 사내생활관련 문의대응, 복지제도안내, 등등.. >> 자동화 목표
- 예시 2) Biz팀 케이스
  - 핵심업무 : 신규 고객 발굴, CRM, 세일즈 전략 수립 및 실행, 매출 및 수익 관리
  - 비핵심업무 : 행사 및 마케팅지원, CS VoC 처리 >> 자동화
- 예시 3) 웹 백엔드 개발자 케이스
  - 서버&DB 아키설계, 비즈니스 로직 구현, 성능&리소스 최적화, api 개발, 보안, test, CICD
  - 내부문의대응(데이터추출, 보정), 기획서 검토, 데이터 지표 Aggregate
- 이외 모든 직군이 겪을수 있는 비 핵심 업무
  - 형식적인 보고서 작성 : 사내표준문서양식 (ppt, 설문조사 등..) 찾아서 보고서 수정
  - 출장비, 업무경비 정산 및 영수증처리
  - 비품요청

### 용어집
- 멀티턴 (Multi-turn): 여러 번의 질문과 응답을 주고받으며 대화를 이어가는 방식.
- 멀티쿼리 (Multi-query): 여러 개의 검색 또는 요청을 동시에 실행하는 방식.
- 툴 셀렉 (Tool Select): 요청에 맞는 가장 적합한 툴을 자동으로 선택하는 과정.

In [1]:
!pip install langchain langchain_openai langchain_community pypdf faiss-cpu --quiet

In [2]:
# 필요한 라이브러리 임포트
import os
import json
from typing import List, Dict, Any, Optional, Tuple
from IPython.display import display, Markdown

from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_openai import OpenAIEmbeddings, ChatOpenAI
from langchain_community.vectorstores import FAISS
from langchain.docstore.document import Document
from langchain.prompts import PromptTemplate

#### OPENAI Key 는 파일시스템에서 읽어오게 처리하였습니다.
- colab 환경의 경우 하드코딩으로 변경해주세요!

In [3]:
# OpenAI API 키 설정
OPENAI_API_KEY = ""

#OPENAI_APIKEY=""
with open("../secrets/apikey.txt", "r") as file:
    OPENAI_API_KEY = file.read().strip()
    os.environ["OPENAI_API_KEY"] = file.read().strip()

os.environ["OPENAI_API_KEY"] = OPENAI_API_KEY

## 1. PDF 파일 다운로드

In [4]:
# URL에서 PDF 파일 다운로드
import urllib.request

"""
- 사실 사내 챗봇을 만들려면, 사내 데이터 각 부서가 어떤 업무를 담당하고 있는지에 대한 데이터가 필요합니다.
- 그런데 그런 데이터는 외부인이 구할수 없기 때문에 아쉬운대로 최대한 비슷한 네이버의 사업보고서, IR 자료등을 데이터셋으로 넣었습니다.
- 참고링크 : https://www.navercorp.com/investment/irReport
"""

# 데이터셋
list_of_downloads_pdf = {
    "https://www.navercorp.com/api/article/download/3216dc37-0b95-4f12-ab59-e475fa22ec03": "2024년 3분기 검토보고서",
    "https://www.navercorp.com/api/article/download/7dee92cb-9c55-4476-8477-d0600b799125": "2023년 NAVER 사업보고서",
    "https://www.navercorp.com/api/article/download/439815bb-16ac-4b81-b364-6227ec28a3d8": "2023 통합보고서",
    "https://www.navercorp.com/api/article/download/8b7f2fa1-c6bd-4ed8-9478-25a6ada62c26": "2023 TCFD 보고서",
    "https://www.navercorp.com/api/article/download/f06ed790-683a-4463-aa75-7ea2127c4c04": "2024년 4분기 NAVER 실적발표",
    "https://www.navercorp.com/api/download/776d0bff-78de-4f85-9fbe-e687cf7c5f42": "CEO 주주서한 - AI 시대 속 네이버의 경쟁력",
    "https://www.navercorp.com/api/download/eee8efa9-61ae-496a-ba5e-0a950acb3a2f": "CEO 주주서한 - 네이버 커머스의 현재와 미래"
}
## 중간에 두개 뺴놓은건 너무 커서 임시로 빼움

# PDF 다운로드 함수
def download_pdf_from_url(url: str, output_filename: str):
    print(f"PDF 다운로드 시작: {url}")
    urllib.request.urlretrieve(url, filename=output_filename)
    print(f"PDF 다운로드 완료: {output_filename}")

In [5]:
list_pdf_files = []
for key, value in list_of_downloads_pdf.items():
    list_pdf_files.append(value+".pdf")

print("\n".join(list_pdf_files))

2024년 3분기 검토보고서.pdf
2023년 NAVER 사업보고서.pdf
2023 통합보고서.pdf
2023 TCFD 보고서.pdf
2024년 4분기 NAVER 실적발표.pdf
CEO 주주서한 - AI 시대 속 네이버의 경쟁력.pdf
CEO 주주서한 - 네이버 커머스의 현재와 미래.pdf


In [6]:
# 순회하며 다운로드
for key, value in list_of_downloads_pdf.items():
    #print(f"TASK 데이터셋 로딩 URL: {(str(key)[:10])}, Description: {value}")
    download_pdf_from_url(url=key,output_filename=value+".pdf")

PDF 다운로드 시작: https://www.navercorp.com/api/article/download/3216dc37-0b95-4f12-ab59-e475fa22ec03
PDF 다운로드 완료: 2024년 3분기 검토보고서.pdf
PDF 다운로드 시작: https://www.navercorp.com/api/article/download/7dee92cb-9c55-4476-8477-d0600b799125
PDF 다운로드 완료: 2023년 NAVER 사업보고서.pdf
PDF 다운로드 시작: https://www.navercorp.com/api/article/download/439815bb-16ac-4b81-b364-6227ec28a3d8
PDF 다운로드 완료: 2023 통합보고서.pdf
PDF 다운로드 시작: https://www.navercorp.com/api/article/download/8b7f2fa1-c6bd-4ed8-9478-25a6ada62c26
PDF 다운로드 완료: 2023 TCFD 보고서.pdf
PDF 다운로드 시작: https://www.navercorp.com/api/article/download/f06ed790-683a-4463-aa75-7ea2127c4c04
PDF 다운로드 완료: 2024년 4분기 NAVER 실적발표.pdf
PDF 다운로드 시작: https://www.navercorp.com/api/download/776d0bff-78de-4f85-9fbe-e687cf7c5f42
PDF 다운로드 완료: CEO 주주서한 - AI 시대 속 네이버의 경쟁력.pdf
PDF 다운로드 시작: https://www.navercorp.com/api/download/eee8efa9-61ae-496a-ba5e-0a950acb3a2f
PDF 다운로드 완료: CEO 주주서한 - 네이버 커머스의 현재와 미래.pdf


In [7]:
# PDF 파일로부터 벡터 DB 생성 함수
def create_vectorstore_from_pdf(pdf_path: str, db_name: str) -> FAISS:
    print(f"PDF 로딩 시작: {pdf_path}")
    print(f"모든 pdf 파일을 하나의 벡터스토어로 합치도록 코드를 변경하였으므로 개별파일의 벡터화는 스킵함")
    return None
    # PDF 로드 및 분할
    loader = PyPDFLoader(pdf_path)
    doc_splitter = RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=100)
    docs = loader.load_and_split(doc_splitter)

    print(f"PDF 로딩 완료: {len(docs)}개 청크 생성됨")

    # 임베딩 및 벡터스토어 생성
    embedding = OpenAIEmbeddings(model="text-embedding-3-large")
    vectorstore = FAISS.from_documents(docs, embedding)

    # 벡터스토어 저장
    persist_directory = f"./DB/{db_name}"
    os.makedirs(persist_directory, exist_ok=True)
    vectorstore.save_local(persist_directory)

    print(f"{db_name} 벡터스토어 생성 완료")
    return vectorstore

이 함수는 PDF 파일을 로드하여 검색 가능한 벡터 데이터베이스를 생성합니다.
1. PDF 파일 로딩: PyPDFLoader를 사용하여 PDF 파일의 텍스트를 추출합니다.
2. 텍스트 분할: RecursiveCharacterTextSplitter를 사용하여 추출된 텍스트를 300자 크기의
  청크로 분할하며, 인접 청크 간에 100자의 중복을 허용합니다. 이 중복은 문맥 연속성을
  유지하는 데 중요합니다.
3. 벡터 임베딩 생성: OpenAI의 text-embedding-3-large 모델을 사용하여 각 텍스트 청크를
  고차원 벡터 공간에 표현합니다. 이 임베딩은 의미적 유사도 검색의 기반이 됩니다.
4. FAISS 벡터스토어 생성: Facebook AI의 FAISS 라이브러리를 사용하여 임베딩된 벡터들을
  효율적으로 저장하고 검색할 수 있는 인덱스를 구축합니다.
5. 벡터스토어 저장: 생성된 벡터스토어를 로컬 디렉토리에 저장하여 나중에 다시 로드할 수
  있게 합니다. 이는 매번 임베딩을 다시 계산하지 않아도 되므로 시간을 절약할 수 있습니다.
각 단계마다 진행 상황을 출력하여 처리 과정을 모니터링할 수 있습니다.
함수는 최종적으로 생성된 FAISS 벡터스토어 객체를 반환하며, 이는 이후 유사도 기반
검색에 사용됩니다.

In [8]:
# 이제 다운로드된 PDF 파일을 사용하여 벡터스토어 생성
db_list = []
# 순회하며 벡터스토어 생성
for key, value in list_of_downloads_pdf.items():
    db = create_vectorstore_from_pdf((value+".pdf"),value)
    db_list.append(db)

PDF 로딩 시작: 2024년 3분기 검토보고서.pdf
모든 pdf 파일을 하나의 벡터스토어로 합치도록 코드를 변경하였으므로 개별파일의 벡터화는 스킵함
PDF 로딩 시작: 2023년 NAVER 사업보고서.pdf
모든 pdf 파일을 하나의 벡터스토어로 합치도록 코드를 변경하였으므로 개별파일의 벡터화는 스킵함
PDF 로딩 시작: 2023 통합보고서.pdf
모든 pdf 파일을 하나의 벡터스토어로 합치도록 코드를 변경하였으므로 개별파일의 벡터화는 스킵함
PDF 로딩 시작: 2023 TCFD 보고서.pdf
모든 pdf 파일을 하나의 벡터스토어로 합치도록 코드를 변경하였으므로 개별파일의 벡터화는 스킵함
PDF 로딩 시작: 2024년 4분기 NAVER 실적발표.pdf
모든 pdf 파일을 하나의 벡터스토어로 합치도록 코드를 변경하였으므로 개별파일의 벡터화는 스킵함
PDF 로딩 시작: CEO 주주서한 - AI 시대 속 네이버의 경쟁력.pdf
모든 pdf 파일을 하나의 벡터스토어로 합치도록 코드를 변경하였으므로 개별파일의 벡터화는 스킵함
PDF 로딩 시작: CEO 주주서한 - 네이버 커머스의 현재와 미래.pdf
모든 pdf 파일을 하나의 벡터스토어로 합치도록 코드를 변경하였으므로 개별파일의 벡터화는 스킵함


In [9]:
from langchain.vectorstores import FAISS
from langchain.embeddings import OpenAIEmbeddings
from langchain.document_loaders import PyPDFLoader
from langchain.text_splitter import RecursiveCharacterTextSplitter
import os
import numpy as np
import faiss

def create_vectorstore_from_all_pdfs(pdf_paths: list[str], db_name: str) -> FAISS:
    print(f"PDF 파일 로딩 시작: {len(pdf_paths)}개 파일 처리")

    # PDF에서 로딩된 모든 문서 청크를 저장할 리스트
    all_docs = []

    # 각 PDF 파일을 처리
    for pdf_path in pdf_paths:
        print(f"로딩 중: {pdf_path}")

        # PDF 로드 및 분할
        loader = PyPDFLoader(pdf_path)
        doc_splitter = RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=100)
        docs = loader.load_and_split(doc_splitter)

        print(f"{pdf_path} 로딩 완료: {len(docs)}개 청크 생성됨")
        all_docs.extend(docs)  # 각 PDF 파일에서 생성된 청크들을 모두 합침

    print(f"모든 PDF 로딩 완료: 총 {len(all_docs)}개 청크 생성됨")

    # 임베딩 및 벡터스토어 생성
    embedding = OpenAIEmbeddings(model="text-embedding-3-large")
    vectorstore = FAISS.from_documents(all_docs, embedding)

    # 벡터스토어 저장
    persist_directory = f"./DB/{db_name}"
    os.makedirs(persist_directory, exist_ok=True)
    vectorstore.save_local(persist_directory)

    print(f"{db_name} 벡터스토어 생성 완료")
    return vectorstore


In [10]:
merged_db = create_vectorstore_from_all_pdfs(list_pdf_files,"naver_vector")


PDF 파일 로딩 시작: 7개 파일 처리
로딩 중: 2024년 3분기 검토보고서.pdf
2024년 3분기 검토보고서.pdf 로딩 완료: 325개 청크 생성됨
로딩 중: 2023년 NAVER 사업보고서.pdf
2023년 NAVER 사업보고서.pdf 로딩 완료: 3783개 청크 생성됨
로딩 중: 2023 통합보고서.pdf
2023 통합보고서.pdf 로딩 완료: 1468개 청크 생성됨
로딩 중: 2023 TCFD 보고서.pdf
2023 TCFD 보고서.pdf 로딩 완료: 218개 청크 생성됨
로딩 중: 2024년 4분기 NAVER 실적발표.pdf
2024년 4분기 NAVER 실적발표.pdf 로딩 완료: 47개 청크 생성됨
로딩 중: CEO 주주서한 - AI 시대 속 네이버의 경쟁력.pdf
CEO 주주서한 - AI 시대 속 네이버의 경쟁력.pdf 로딩 완료: 42개 청크 생성됨
로딩 중: CEO 주주서한 - 네이버 커머스의 현재와 미래.pdf
CEO 주주서한 - 네이버 커머스의 현재와 미래.pdf 로딩 완료: 34개 청크 생성됨
모든 PDF 로딩 완료: 총 5917개 청크 생성됨


  embedding = OpenAIEmbeddings(model="text-embedding-3-large")


naver_vector 벡터스토어 생성 완료


In [11]:
## 각 부서가 무슨일을 하는지-부서의 데이터셋을 구할수 없는 시점이라, 회사 외부 자료를 기준으로 하나의 백터DB 애서만 처리할 수 있도록 수정하였습니다!

## 2. 도구 생성

In [12]:
from dataclasses import dataclass

@dataclass
class Tool:
    tool_name: str
    description: str
    vectorstore: any = None

    def __str__(self):
        return f"{self.tool_name}: {self.description}, db={self.vectorstore}"

In [13]:
# 테스트로 도구 인스턴스 생성해보기
test_tool = Tool("test", "테스트 도구입니다")
print(test_tool)

test: 테스트 도구입니다, db=None


### 도구 시트 다운로드 받기
- 스프레드시트 뷰어 링크 : https://docs.google.com/spreadsheets/d/1Qy-K7CDvWLwfmt7LBQMt5KRYYnSRpaNk/edit?usp=sharing&ouid=103304252528783415009&rtpof=true&sd=true
- 다운로드 링크 : https://docs.google.com/uc?export=download&id=1Qy-K7CDvWLwfmt7LBQMt5KRYYnSRpaNk&confirm=t

In [14]:
! pip install openpyxl



In [15]:
# 도구 엑셀시트 로드 
TOOLS_SHEET_URL = "https://docs.google.com/uc?export=download&id=1Qy-K7CDvWLwfmt7LBQMt5KRYYnSRpaNk&confirm=t"
TOOL_SHEET_FILENAME="TOOLS_SHEET.xlsx"
urllib.request.urlretrieve(TOOLS_SHEET_URL, filename=TOOL_SHEET_FILENAME)

('TOOLS_SHEET.xlsx', <http.client.HTTPMessage at 0x125bec040>)

In [16]:
import pandas as pd

def convert_excel_to_tools(excel_file):
    # Read the Excel file into a pandas DataFrame
    df = pd.read_excel(excel_file)

    tools = []

    # Iterate over each row in the DataFrame
    for _, row in df.iterrows():
        # Extract 'tool_name' from 'keyword' column
        tool_name = row['keyword']
        
        # Create the description by joining required columns with a comma
        description = ', '.join([str(row[col]) for col in ['업무영역', '업무구분', 'TASK', '시스템&솔루션', 'keyword']])
        vectorstore = merged_db
        # Create Tool object
        tool = Tool(tool_name=tool_name, description=description,vectorstore=merged_db)
        tools.append(tool)
    
    return tools

In [17]:
tools_list = convert_excel_to_tools(TOOL_SHEET_FILENAME)
tools = tools_list
for tool in tools:
    print(str(tool)[:70])
    #print(type(tool))


print(type(tools))

#import numpy as np
#tools = np.array(tools_list)

# # 도구 목록 확인
# for name, tool in tools.items():
#     print(f"{name}: {tool.description}")

Fund & Investment: 자금운용 및 조달, 투자 및 자금 관리, 자금 흐름 관리, 금융기관 협업, 투자 리스크 분석
Forex & Exchange: 자금운용 및 조달, 외환 및 환율 관리, 환율 변동성 분석, 외화 자금 운용, 외환관리 시스템
Corporate Reporting: 재무회계, 법인 결산 및 재무 보고, 월별, 분기별, 연간 결산 / 재무제표 작성, ER
Tax Filing & Strategy: 세무 관리, 세금 신고 및 절세 전략, 법인세, 부가세 신고 / 절세 방안 마련, 세
Recruitment & Mgmt: 채용 및 온보딩, 인재 채용 및 관리, 채용 공고, 지원자 관리, 입사 프로세스 운영, A
Payroll & Benefits: 급여 및 복지 관리, 급여 정산 및 복지제도, 급여 계산, 4대 보험 신고, 연말정산, 급
Executive Scheduling: 일정 및 의전 관리, 임원 일정 관리, 회의 일정 조율, 출장 예약, VIP 응대, 그
Internal Comms: 문서 및 정보 관리, 내부 커뮤니케이션 관리, 내부 보고서 작성, 메일 응대, 문서 보안 유지, 
Strategy Planning: 사업 기획 및 분석, 중장기 전략 수립, 시장 분석, 경쟁사 벤치마킹, 사업 타당성 평가, 
Budgeting & Execution: 예산 및 비용 관리, 연간 예산 편성 및 집행, 부서별 예산 수립, 예산 사용 모니터
Network & Security: IT 인프라 관리, 네트워크 및 보안 관리, 기업 내부 IT 인프라 운영, 데이터 보안 정
System Maintenance: 시스템 운영 및 유지보수, 업무 시스템 유지보수, ERP, 그룹웨어, 사내 시스템 유지보수
Job Posting & Mgmt: 인재 채용 및 온보딩, 채용 공고 및 후보자 관리, 채용 공고 등록, 지원자 관리, 면접 
Onboarding & Training: 인재 채용 및 온보딩, 온보딩 및 초기 교육, 신입사원 온보딩 프로그램 운영, 사내 
Payrol

## 3. 계획 테스트

In [18]:
# 도구 선택 계획 생성기
class ToolPlanGenerator:
    def __init__(self, tools: Dict[str, Tool], model_name="gpt-4o", temperature=0):
        self.tools = tools
        self.llm = ChatOpenAI(temperature=temperature, model_name=model_name, max_tokens=1500)

        # 도구 설명 구성
        tool_descriptions = "\n".join([f"- {tool.tool_name}: {tool.description}" for tool in self.tools])

        self.template = """
        당신은 사용자 질문을 분석하여 적절한 도구와 쿼리를 결정하는 전문가입니다.

        # 사용 가능한 도구
        {tool_descriptions}

        # 이전 대화 맥락
        이전 질문: {prev_query}
        이전 답변: {prev_response}

        # 현재 질문
        사용자 질문: {current_query}

        # 분석 지침
        1. 사용자의 질문을 분석하고, 이전 대화 맥락도 고려하세요.
        2. 질문에 여러 개의 요청이 포함되어 있다면, 각각에 대해 별도의 쿼리를 생성하세요.
        3. 각 쿼리가 어떤 도구를 사용해야 하는지 결정하세요.
        4. 질문이 어떤 도구와도 관련이 없다면 'no_tool'을 선택하세요.
        5. 마크다운 형식으로 작성하지 마세요.

        # 출력 형식
        반드시 다음 JSON 형식으로 출력하세요:
        {{
          "plan": {{
            "도구이름1": ["쿼리1", "쿼리2", ...],
            "도구이름2": ["쿼리3", "쿼리4", ...],
            ...
          }}
        }}
        """

        self.prompt = PromptTemplate(
            input_variables=["tool_descriptions", "prev_query", "prev_response", "current_query"],
            template=self.template
        )

    def generate_plan(self, prev_query: str, prev_response: str, current_query: str) -> Dict:
        # 도구 설명 구성
        tool_descriptions = "\n".join([f"- {tool.tool_name}: {tool.description}" for tool in self.tools])

        try:
            # 프롬프트 준비 및 실행
            formatted_prompt = self.prompt.format(
                tool_descriptions=tool_descriptions,
                prev_query=prev_query,
                prev_response=prev_response,
                current_query=current_query
            )

            # LLM 호출
            llm_response = self.llm.invoke(formatted_prompt)
            llm_content = llm_response.content
            
            # print("1------")
            # print(llm_response)
            # print(type(llm_response))
            # print("2------")
            # JSON 파싱
            try:
                plan_json = json.loads(llm_content) # plan_json 형식 검증
                # print("3------")
                # print(type(plan_json))
                plan_keys = plan_json["plan"].keys()
                # print(type(plan_keys))
                # print("3------")
                plan_json.update({"selected_tools": list(plan_keys)})   
                if "plan" not in plan_json:
                    print(f"응답에 'plan' 키가 없습니다: {plan_json}")
                    return {"plan": {"no_tool": [current_query]}}
                # print(plan_keys)
                print(f"agent-planner 응답 : {plan_json}")
                return plan_json
            except json.JSONDecodeError as json_err:
                print(f"JSON 파싱 오류: {str(json_err)}")
                print(f"LLM 원본 응답: {llm_content}")
                return {"plan": {"no_tool": [current_query]}}
        except Exception as e:
            print(f"계획 생성 중 오류 발생: {str(e)}")
            return {"plan": {"no_tool": [current_query]}}

In [19]:
# 계획 생성기 테스트
planner = ToolPlanGenerator(tools)
## print(planner)
test_plan = planner.generate_plan("", "", "사내복지대출은 어디서 물어봐야해?")
#print("생성된 계획:")
print(json.dumps(test_plan, indent=2, ensure_ascii=False))

agent-planner 응답 : {'plan': {'Employee Loan': ['사내복지대출 관련 문의는 어디서 해야 하는지 알려주세요.']}, 'selected_tools': ['Employee Loan']}
{
  "plan": {
    "Employee Loan": [
      "사내복지대출 관련 문의는 어디서 해야 하는지 알려주세요."
    ]
  },
  "selected_tools": [
    "Employee Loan"
  ]
}


## 4. 도구 선택 능력 + 멀티턴 + 멀티 쿼리 시스템

In [24]:
# 멀티 도구 RAG 시스템
class MultiToolRAG:
    def __init__(self, tools: Dict[str, Tool], model_name="gpt-4o", temperature=0.2):
        self.tools = tools
        self.tool_planner = ToolPlanGenerator(tools, model_name)
        self.llm = ChatOpenAI(temperature=temperature, model_name=model_name)

        self.prev_query = ""
        self.prev_response = ""

        # 응답 생성 프롬프트
        self.response_template = """
        당신은 사용자 질문에 대한 답변을 제공하는 AI 어시스턴트입니다.

        사용자 질문: {query}

        다음은 질문에 관련된 정보입니다:
        {context}

        # 지침
        1. 제공된 정보를 바탕으로 사용자 질문에 답변하세요.
        2. 사용자 질문에 여러 질의가 있다면 각각에 대해 답변하세요.
        3. 제공된 정보가 충분하지 않으면 솔직히 모른다고 답변하세요.
        4. 답변은 한국어로 작성하세요.
        """

        self.response_prompt = PromptTemplate(
            input_variables=["query", "context"],
            template=self.response_template
        )

    def update_conversation(self, query: str, response: str):
        self.prev_query = query
        self.prev_response = response

    def search_with_tool(self, tool_name: str, queries: List[str], num_docs=3) -> List[Document]:
        # 선택된 도구로 문서 검색
        tool = "no_tool"
        #tool = self.tools.get(tool_name)
        #if not tool or tool_name == "no_tool" or not tool.vectorstore:
        #return []  # no_tool이거나 벡터스토어가 없는 경우 빈 리스트 반환

        all_docs = []
        seen_contents = set()

        for query in queries:
            try:
                docs = tool.vectorstore.similarity_search(query, k=num_docs)
                print(f"{tool_name} 도구로 '{query}' 검색 완료: {len(docs)}개 문서 찾음")

                # 중복 제거
                for doc in docs:
                    if doc.page_content not in seen_contents:
                        seen_contents.add(doc.page_content)
                        # 메타데이터에 도구 및 쿼리 정보 추가
                        if not hasattr(doc, 'metadata') or doc.metadata is None:
                            doc.metadata = {}
                        doc.metadata['tool'] = tool_name
                        doc.metadata['query'] = query
                        all_docs.append(doc)
            except Exception as e:
                print(f"{tool_name} 도구로 '{query}' 검색 중 오류 발생: {str(e)}")

        return all_docs

    def query(self, current_query: str) -> Dict:
        # 도구 계획 생성
        plan = self.tool_planner.generate_plan(self.prev_query, self.prev_response, current_query)
        print(f"생성된 계획: {json.dumps(plan, indent=2, ensure_ascii=False)}")

        # 모든 도구에서 검색 수행
        all_docs = []
        for tool_name, queries in plan.get("plan", {}).items():
            tool_docs = self.search_with_tool(tool_name, queries)
            all_docs.extend(tool_docs)
            print(f"{tool_name} 도구에서 {len(tool_docs)}개 문서 검색됨")

        # 검색 결과가 없고 no_tool이 아닌 경우, no_tool 추가
        if not all_docs and "no_tool" not in plan.get("plan", {}):
            #print("검색 결과가 없어 no_tool 사용")
            plan["plan"]["no_tool"] = [current_query]

        # 컨텍스트 구성
        if all_docs:
            context = "\n\n".join([f"[{doc.metadata.get('tool', 'unknown')}] 문서 {i+1}:\n{doc.page_content}"
                                 for i, doc in enumerate(all_docs)])
        else:
            context = "관련 문서가 검색되지 않았습니다."

        # 응답 생성
        formatted_prompt = self.response_prompt.format(
            query=current_query,
            context=context
        )

        result = self.llm.invoke(formatted_prompt)
        response = result.content

        # 대화 기록 업데이트
        self.update_conversation(current_query, response)

        # 결과 반환
        return {
            "query": current_query,
            "result": response,
            "plan": plan,
            "source_documents": all_docs
        }

In [25]:
# RAG 시스템 초기화
rag_system = MultiToolRAG(tools)

In [26]:
# 대화 예시 1: 일본 ICT 관련 질문
query1 = "어뷰징 신고는 어디서 해"
result1 = rag_system.query(query1)

print(f"\n질문: {query1}")
print(f"답변:\n{result1['result']}")

agent-planner 응답 : {'plan': {'Anti-Abuse & Spam': ['어뷰징 신고 처리 방법']}, 'selected_tools': ['Anti-Abuse & Spam']}
생성된 계획: {
  "plan": {
    "Anti-Abuse & Spam": [
      "어뷰징 신고 처리 방법"
    ]
  },
  "selected_tools": [
    "Anti-Abuse & Spam"
  ]
}
Anti-Abuse & Spam 도구로 '어뷰징 신고 처리 방법' 검색 중 오류 발생: 'str' object has no attribute 'vectorstore'
Anti-Abuse & Spam 도구에서 0개 문서 검색됨

질문: 어뷰징 신고는 어디서 해
답변:
죄송하지만, 어뷰징 신고에 대한 구체적인 정보를 제공할 수 없습니다. 일반적으로 어뷰징 신고는 해당 서비스나 플랫폼의 고객 지원 센터나 신고 기능을 통해 할 수 있습니다. 사용하는 서비스의 공식 웹사이트나 앱에서 신고 절차를 확인해 보시기 바랍니다.


In [27]:
# 대화 예시 2: 멀티쿼리 및 멀티턴
query2 = "음 그렇다면 사내복지기금 정보는 어디서 물어봐?"
result2 = rag_system.query(query2)

print(f"\n질문: {query2}")
print(f"답변:\n{result2['result']}")

agent-planner 응답 : {'plan': {'Benefits Inquiry': ['사내복지기금 정보 문의']}, 'selected_tools': ['Benefits Inquiry']}
생성된 계획: {
  "plan": {
    "Benefits Inquiry": [
      "사내복지기금 정보 문의"
    ]
  },
  "selected_tools": [
    "Benefits Inquiry"
  ]
}
Benefits Inquiry 도구로 '사내복지기금 정보 문의' 검색 중 오류 발생: 'str' object has no attribute 'vectorstore'
Benefits Inquiry 도구에서 0개 문서 검색됨

질문: 음 그렇다면 사내복지기금 정보는 어디서 물어봐?
답변:
죄송하지만, 제공된 정보로는 사내복지기금에 대한 구체적인 내용을 알 수 없습니다. 사내복지기금에 대한 정보는 일반적으로 회사의 인사부서나 복지 담당 부서에 문의하시면 자세한 안내를 받을 수 있습니다. 회사의 내부 포털이나 인트라넷에 관련 정보가 게시되어 있을 수도 있으니 참고하시기 바랍니다.


In [28]:
# 대화 예시 3: 도구와 관련 없는 질문
query3 = "너는 누구니?"
result3 = rag_system.query(query3)

print(f"\n질문: {query3}")
print(f"답변:\n{result3['result']}")

agent-planner 응답 : {'plan': {'no_tool': ['너는 누구니?']}, 'selected_tools': ['no_tool']}
생성된 계획: {
  "plan": {
    "no_tool": [
      "너는 누구니?"
    ]
  },
  "selected_tools": [
    "no_tool"
  ]
}
no_tool 도구로 '너는 누구니?' 검색 중 오류 발생: 'str' object has no attribute 'vectorstore'
no_tool 도구에서 0개 문서 검색됨

질문: 너는 누구니?
답변:
저는 사용자 질문에 대한 답변을 제공하는 AI 어시스턴트입니다. 더 궁금한 점이 있으면 언제든지 물어보세요!


## 5. 챗봇 UI

In [29]:
!pip install gradio --quiet

In [None]:
import gradio as gr

# 챗봇의 응답을 처리하는 함수 (qa_chain 함수는 미리 정의되어 있어야 합니다)
def respond(message, chat_history):
    # 메시지 처리: qa_chain 또는 rag_system.query 함수 호출
    result = rag_system.query(message)
    bot_message = result['result']

    # 채팅 기록 업데이트: (사용자 메시지, 챗봇 응답) 튜플 추가
    chat_history.append((message, bot_message))
    return "", chat_history

# Gradio Blocks 인터페이스 생성
with gr.Blocks() as demo:
    # 챗봇 채팅 기록 표시 (좌측 상단 레이블 지정)
    chatbot = gr.Chatbot(label="사내 업무지원 AI 챗봇 ")
    # 사용자 입력 텍스트박스 (하단 레이블 지정)
    msg = gr.Textbox(label="질문해주세요!")
    # 입력창과 채팅 기록 모두 초기화할 수 있는 ClearButton
    clear = gr.ClearButton([msg, chatbot])

    # 사용자가 텍스트박스에 입력 후 제출하면 respond 함수 호출
    msg.submit(respond, inputs=[msg, chatbot], outputs=[msg, chatbot])

# 인터페이스 실행 (debug=True로 실행하면 디버깅 정보를 확인할 수 있습니다)
demo.launch(debug=True)



* Running on local URL:  http://127.0.0.1:7860

To create a public link, set `share=True` in `launch()`.


agent-planner 응답 : {'plan': {'Benefits Inquiry': ['복지제도 관련 정보를 알아보는 방법', '복지제도에 대한 문의를 어디서 할 수 있는지']}, 'selected_tools': ['Benefits Inquiry']}
생성된 계획: {
  "plan": {
    "Benefits Inquiry": [
      "복지제도 관련 정보를 알아보는 방법",
      "복지제도에 대한 문의를 어디서 할 수 있는지"
    ]
  },
  "selected_tools": [
    "Benefits Inquiry"
  ]
}
Benefits Inquiry 도구로 '복지제도 관련 정보를 알아보는 방법' 검색 중 오류 발생: 'str' object has no attribute 'vectorstore'
Benefits Inquiry 도구로 '복지제도에 대한 문의를 어디서 할 수 있는지' 검색 중 오류 발생: 'str' object has no attribute 'vectorstore'
Benefits Inquiry 도구에서 0개 문서 검색됨
agent-planner 응답 : {'plan': {'Childcare Support': ['사내 어린이집 운영에 대한 정보는 어디에서 확인할 수 있나요?', '사내 어린이집 지원을 받으려면 어떻게 해야 하나요?']}, 'selected_tools': ['Childcare Support']}
생성된 계획: {
  "plan": {
    "Childcare Support": [
      "사내 어린이집 운영에 대한 정보는 어디에서 확인할 수 있나요?",
      "사내 어린이집 지원을 받으려면 어떻게 해야 하나요?"
    ]
  },
  "selected_tools": [
    "Childcare Support"
  ]
}
Childcare Support 도구로 '사내 어린이집 운영에 대한 정보는 어디에서 확인할 수 있나요?' 검색 중 오류 발생: 'str' object has no at