## Setting & Import

In [1]:
import sys
from pathlib import Path

# sub-files 경로를 파이썬 모듈 검색 경로에 추가
BASE_DIR = Path().resolve()  # 현재 노트북이 있는 code 디렉터리
SUB_FILES_DIR = BASE_DIR / "sub-files"
if str(SUB_FILES_DIR) not in sys.path:
    sys.path.append(str(SUB_FILES_DIR))

# 분리한 모듈들 import
from config import df, model
from state import GraphState, generate_session_id
from workflow import graph


def run_query(question: str, context: str | None = None, relevance: str | None = None):
    session_id = generate_session_id()
    state: GraphState = {
        "question": question,
        "q_type": "",
        "answer": "",
        "session_id": session_id,
        "context": context,
        "relevance": relevance,
        "execution_id": None,
    }

    result = graph.invoke(
        state, 
        config={"configurable": {"thread_id": session_id, "session_id": session_id}}
    )
    return result


## Test

## Examples

In [3]:
Q1 = run_query("서울에서 공장이 가장 많은 구는 어디야?")
print("답변:", Q1["answer"])

답변: 서울에서 공장이 가장 많은 구는 **금천구**이고,  
해당 데이터 기준 **공장 수는 4059개**입니다.


In [9]:
Q5

{'question': '공장 면적 대비 직원 수가 많은 공장과 적은 공장 상위 5개씩 알려줘',
 'q_type': 'domain_specific',
 'answer': '공장 면적 대비 직원 수(직원 밀도)를 기준으로 상위 5개, 하위 5개 공장은 다음과 같습니다.  \n(직원수_대비_면적비율 = 종업원합계 ÷ 제조시설면적, 단위: 인/㎡ 수준)\n\n1. 직원 밀도가 높은 공장 상위 5개  \n- 공장관리번호: 115452016361024  \n  - 회사명: 롯데이노베이트(주)아이씨씨  \n  - 위치: 서울특별시 금천구  \n  - 종업원합계: 6552명  \n  - 제조시설면적: 574.038㎡  \n  - 직원수_대비_면적비율: 약 11.41 인/㎡  \n\n- 공장관리번호: 115002021612159  \n  - 회사명: (주)잉카인터넷  \n  - 위치: 서울특별시 강서구  \n  - 종업원합계: 363명  \n  - 제조시설면적: 51.990㎡  \n  - 직원수_대비_면적비율: 약 6.98 인/㎡  \n\n- 공장관리번호: 111402023004481  \n  - 회사명: (주)위지원시스템즈  \n  - 위치: 서울특별시 중구  \n  - 종업원합계: 96명  \n  - 제조시설면적: 19.800㎡  \n  - 직원수_대비_면적비율: 약 4.85 인/㎡  \n\n- 공장관리번호: 115602018420131  \n  - 회사명: (주)브리지텍  \n  - 위치: 서울특별시 영등포구  \n  - 종업원합계: 540명  \n  - 제조시설면적: 119.880㎡  \n  - 직원수_대비_면적비율: 약 4.50 인/㎡  \n\n- 공장관리번호: 116502023025574  \n  - 회사명: 주식회사 아키아카  \n  - 위치: 서울특별시 서초구  \n  - 종업원합계: 480명  \n  - 제조시설면적: 118.470㎡  \n  - 직원수_대비_면적비율: 약 4.05 인/㎡  \n\n2. 직원 밀도가 낮은 공장 상위 5개 (사실상 0명)  \

In [2]:
Q2 = run_query("지난 20년간 서울에서 공장 수가 가장 많이 증가한 5개 구를 알려줘")
print("답변:", Q2["answer"])

답변: 지난 20년간 서울에서 공장 수가 가장 많이 증가한 상위 5개 구는 다음과 같습니다.  
(기준: 약 20년 전 대비 현재까지 공장 수 증가량)

1. 금천구  
   - 20년 전 공장 수: 564개  
   - 현재 공장 수: 4,058개  
   - 증가량: 3,494개

2. 구로구  
   - 20년 전 공장 수: 208개  
   - 현재 공장 수: 1,204개  
   - 증가량: 996개

3. 영등포구  
   - 20년 전 공장 수: 210개  
   - 현재 공장 수: 826개  
   - 증가량: 616개

4. 성동구  
   - 20년 전 공장 수: 300개  
   - 현재 공장 수: 851개  
   - 증가량: 551개

5. 중구  
   - 20년 전 공장 수: 620개  
   - 현재 공장 수: 1,070개  
   - 증가량: 450개

요약하면, 금천구가 공장 수 증가 폭이 가장 크고, 그 다음이 구로구, 영등포구, 성동구, 중구 순입니다.


In [2]:
Q3 = run_query("새로 생긴 공장들이 요즘 어느 지역에 많이 몰려 있어?")
print("답변:", Q3["answer"])

Error in RootListenersTracer.on_chain_end callback: ValueError("Expected str, BaseMessage, List[BaseMessage], or Tuple[BaseMessage]. Got {'q_type': 'domain_specific', 'question': '새로 생긴 공장들이 요즘 어느 지역에 많이 몰려 있어?'}.")


답변: 요청하신 “요즘 새로 생긴 공장들이 어느 지역에 많이 몰려 있는지”를, 2020-01-01 이후 최초등록된 공장을 기준으로 집계한 결과입니다.

1. 가장 많이 몰린 지역 (상위권)
- 서울특별시 금천구: 1,493개
- 서울특별시 구로구: 358개
- 서울특별시 성동구: 162개
- 서울특별시 영등포구: 160개
- 서울특별시 중랑구: 133개
- 서울특별시 강서구: 118개
- 서울특별시 중구: 110개  

2. 그 외 서울 내 주요 분포
- 송파구: 88개
- 동대문구: 54개
- 종로구: 44개
- 노원구: 40개
- 강남구: 33개
- 양천구: 32개
- 마포구: 27개
- 도봉구: 24개
- 서초구: 23개
- 강북구: 21개
- 광진구: 19개
- 성북구: 18개
- 은평구: 17개
- 관악구: 16개
- 용산구: 15개
- 서대문구: 8개
- 동작구: 4개
- 강동구: 1개

정리하면, 2020년 이후 새로 등록된 공장은 특히 **서울 금천구와 구로구**에 압도적으로 많이 몰려 있고, 그 다음으로 **성동구·영등포구·중랑구·강서구·중구** 등에 비교적 많이 분포해 있습니다.


In [5]:
Q4 = run_query("금천구에서 규모가 가장 회사는 어디야? 종업원수, 규모를 종합적으로 고려해서 알려줘")
print("답변:", Q4["answer"])

답변: 금천구에서 현재 데이터 기준으로 규모(종업원수 중심)가 가장 큰 회사는 다음과 같습니다.

- 회사명: 롯데이노베이트(주)아이씨씨  
- 종업원수(합계): 6,552명  
- 업종: 기타 무선 통신장비 제조업  
- 주소: 서울특별시 금천구  

설명:  
보유한 서울시 사업체 데이터에서 금천구에 위치한 사업체만 필터링한 뒤, 회사명별로 종업원수를 모두 합산해 규모를 비교했습니다. 매출액·자산총액 같은 재무 지표는 데이터에 없어, 종업원수(규모점수) 기준으로 가장 큰 회사를 선정했으며, 그 결과가 롯데이노베이트(주)아이씨씨입니다.


In [6]:
Q5 = run_query("공장 면적 대비 직원 수가 많은 공장과 적은 공장 상위 5개씩 알려줘")
print("답변:", Q5["answer"])

답변: 공장 면적 대비 직원 수(직원 밀도)를 기준으로 상위 5개, 하위 5개 공장은 다음과 같습니다.  
(직원수_대비_면적비율 = 종업원합계 ÷ 제조시설면적, 단위: 인/㎡ 수준)

1. 직원 밀도가 높은 공장 상위 5개  
- 공장관리번호: 115452016361024  
  - 회사명: 롯데이노베이트(주)아이씨씨  
  - 위치: 서울특별시 금천구  
  - 종업원합계: 6552명  
  - 제조시설면적: 574.038㎡  
  - 직원수_대비_면적비율: 약 11.41 인/㎡  

- 공장관리번호: 115002021612159  
  - 회사명: (주)잉카인터넷  
  - 위치: 서울특별시 강서구  
  - 종업원합계: 363명  
  - 제조시설면적: 51.990㎡  
  - 직원수_대비_면적비율: 약 6.98 인/㎡  

- 공장관리번호: 111402023004481  
  - 회사명: (주)위지원시스템즈  
  - 위치: 서울특별시 중구  
  - 종업원합계: 96명  
  - 제조시설면적: 19.800㎡  
  - 직원수_대비_면적비율: 약 4.85 인/㎡  

- 공장관리번호: 115602018420131  
  - 회사명: (주)브리지텍  
  - 위치: 서울특별시 영등포구  
  - 종업원합계: 540명  
  - 제조시설면적: 119.880㎡  
  - 직원수_대비_면적비율: 약 4.50 인/㎡  

- 공장관리번호: 116502023025574  
  - 회사명: 주식회사 아키아카  
  - 위치: 서울특별시 서초구  
  - 종업원합계: 480명  
  - 제조시설면적: 118.470㎡  
  - 직원수_대비_면적비율: 약 4.05 인/㎡  

2. 직원 밀도가 낮은 공장 상위 5개 (사실상 0명)  
- 공장관리번호: 114402019431915  
  - 회사명: 웽커스  
  - 위치: 서울특별시 마포구  
  - 종업원합계: 0명  
  - 제조시설면적: 180.00㎡  
  - 직원수_대비_면적비율: 0.0 인/㎡  

- 공