In [1]:

import os
import glob
from dotenv import load_dotenv
import gradio as gr

In [2]:
from langchain.document_loaders import DirectoryLoader, TextLoader
from langchain.text_splitter import CharacterTextSplitter

In [3]:
MODEL = "gpt-4o-mini"
db_name = "vector_db"

In [4]:
load_dotenv()
os.environ['OPENAI_API_KEY'] = os.getenv('OPENAI_API_KEY', 'your-key-if-not-using-env')

In [5]:
folders = glob.glob("knowledge-base/*")

text_loader_kwargs = {'encoding': 'utf-8'}

documents = []
for folder in folders:
    doc_type = os.path.basename(folder)
    loader = DirectoryLoader(folder, glob="**/*.md", loader_cls=TextLoader, loader_kwargs=text_loader_kwargs)
    folder_docs = loader.load()
    for doc in folder_docs:
        doc.metadata["doc_type"] = doc_type
        documents.append(doc)

In [6]:
len(documents)

16

In [7]:
documents[15]

Document(metadata={'source': 'knowledge-base/employees/Minji Choi.md', 'doc_type': 'employees'}, page_content='# 최민지 (Minji Choi)  \n\n## 요약  \n- **생년월일**: 1994년 11월 3일  \n- **직책**: 마케팅 매니저  \n- **근무지**: 대한민국 제주  \n\n## Insurellm 경력 발전  \n- **2018년 2월**: 마케팅 매니저로 입사. 디지털 마케팅 캠페인 기획 및 실행.  \n- **2020년 5월**: 콘텐츠 마케팅 팀장으로 승진. 브랜드 전략 재구축.  \n\n## 연간 성과 기록  \n- **2019년**:  \n  - **성과 평가**: 4.5/5  \n  - **주요 업적**: 소셜 미디어 팔로워 200% 증가.  \n\n- **2021년**:  \n  - **성과 평가**: 4.8/5  \n  - **주요 업적**: 캠페인 전환율 45% 달성.  \n\n## 보상 기록  \n- **2019년**:  \n  - **기본 연봉**: ₩43,000,000  \n  - **성과 보너스**: ₩5,000,000  \n\n- **2021년**:  \n  - **기본 연봉**: ₩54,000,000  \n  - **성과 보너스**: ₩10,000,000  \n\n\n')

In [8]:
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
chunks = text_splitter.split_documents(documents)

In [9]:
len(chunks)

33

In [16]:
chunks[0]

Document(metadata={'source': 'knowledge-base/products/Rellm.md', 'doc_type': 'products'}, page_content='# 제품 요약\n\n# Rellm: AI 기반 엔터프라이즈 재보험 솔루션\n\n## 요약\n\nRellm은 Insurellm이 개발한 혁신적인 엔터프라이즈 재보험 제품으로, 재보험 회사의 운영 방식을 혁신적으로 변화시키기 위해 설계되었습니다. 인공지능(AI)의 강력한 기술을 활용하여, Rellm은 위험 관리, 의사 결정 과정, 운영 효율성을 최적화하는 고급 플랫폼을 제공합니다. 원활한 통합과 강력한 분석 기능을 통해 보험사는 포트폴리오를 선제적으로 관리하고, 시장 변화에 민첩하게 대응할 수 있습니다.\n\n## 주요 기능\n\n### AI 기반 분석\nRellm은 첨단 AI 알고리즘을 사용하여 위험 노출에 대한 예측 인사이트를 제공합니다. 이를 통해 사용자는 트렌드를 예측하고 정보에 입각한 결정을 내릴 수 있습니다. 실시간 데이터 분석을 통해 재보험 전문가에게 실행 가능한 지능 정보를 제공합니다.\n\n### 원활한 통합\nRellm의 아키텍처는 기존 시스템과의 통합을 간편하게 지원하도록 설계되었습니다. 정책 관리, 청구 처리, 재무 보고와 같은 다양한 데이터 소스와 매끄럽게 연결되어 통합된 생태계를 형성합니다.\n\n### 위험 평가 모듈\nRellm의 종합적인 위험 평가 모듈은 보험사가 위험 프로필을 정확하게 평가할 수 있도록 합니다. 과거 데이터를 활용하고 고급 모델링 기술을 적용하여 잠재적 책임과 예상 결과를 명확히 보여줍니다.\n\n### 맞춤형 대시보드\nRellm은 핵심 지표와 성과 지표를 직관적으로 표시하는 맞춤형 대시보드를 제공합니다. 사용자는 자신의 비즈니스에 가장 중요한 요소를 중심으로 보기 화면을 조정할 수 있어 사용자 경험과 생산성을 향상시킵니다.\n\n### 규제 준수 도구\nRellm은 조직이 지역 및 국제 규제 표준을 충족할 수 있도록 규제 추적 기

In [17]:
chunks[1]

Document(metadata={'source': 'knowledge-base/products/Rellm.md', 'doc_type': 'products'}, page_content='### 규제 준수 도구\nRellm은 조직이 지역 및 국제 규제 표준을 충족할 수 있도록 규제 추적 기능을 내장하고 있습니다. 이를 통해 재보험 관행이 투명하고 신뢰성을 유지할 수 있도록 지원합니다.\n\n### 고객 및 브로커 포털\nRellm은 고객 및 브로커를 위한 전용 포털을 제공하여 실시간 커뮤니케이션과 문서 공유를 지원합니다. 이를 통해 파트너십을 강화하고 전반적인 운영 우수성을 확보합니다.\n\n## 가격 정책\n\nRellm은 다양한 비즈니스 요구를 충족할 수 있도록 유연한 가격 플랜을 제공합니다:\n\n- **기본 플랜**: 월 $5,000  \n  - 핵심 기능 및 표준 통합 기능 포함.  \n\n- **전문 플랜**: 월 $10,000  \n  - 모든 기능, 고급 통합 및 우선 고객 지원 포함.  \n\n- **엔터프라이즈 플랜**: 맞춤형 가격  \n  - 맞춤형 기능, 광범위한 통합, 전담 계정 관리 포함.  \n\nRellm을 활용하여 재보험 프로세스를 강화하고 수익성과 준수성을 동시에 높이는 많은 조직에 합류하세요.\n\n## 2025-2026 로드맵\n\nInsurellm은 Rellm의 지속적인 개선을 위해 다음과 같은 로드맵을 수립했습니다:\n\n- **2025년 3분기**:  \n  - 이동 중에도 인사이트와 관리가 가능한 Rellm 모바일 앱 출시.  \n  - 인터랙티브 위험 평가를 위한 증강 현실(AR) 기능 도입.  \n\n- **2026년 1분기**:  \n  - 더욱 정확한 위험 예측을 위한 고급 머신러닝 모델 배포.  \n  - 보험 업계의 신기술을 지원하기 위한 통합 기능 확장.  \n\n- **2026년 3분기**:  \n  - Rellm 사용자들이 인사이트, 팁, 모범 사례를 교환할 수 있는 커뮤니티 플랫폼 출시.  \n  -

In [18]:
doc_types = set(chunk.metadata['doc_type'] for chunk in chunks)
print(f"Document types found: {', '.join(doc_types)}")

Document types found: etc, company, employees, products


In [22]:
for chunk in chunks:
    if '성과' in chunk.page_content:
        print(chunk)
        print("_________")

page_content='# 제품 요약

# Rellm: AI 기반 엔터프라이즈 재보험 솔루션

## 요약

Rellm은 Insurellm이 개발한 혁신적인 엔터프라이즈 재보험 제품으로, 재보험 회사의 운영 방식을 혁신적으로 변화시키기 위해 설계되었습니다. 인공지능(AI)의 강력한 기술을 활용하여, Rellm은 위험 관리, 의사 결정 과정, 운영 효율성을 최적화하는 고급 플랫폼을 제공합니다. 원활한 통합과 강력한 분석 기능을 통해 보험사는 포트폴리오를 선제적으로 관리하고, 시장 변화에 민첩하게 대응할 수 있습니다.

## 주요 기능

### AI 기반 분석
Rellm은 첨단 AI 알고리즘을 사용하여 위험 노출에 대한 예측 인사이트를 제공합니다. 이를 통해 사용자는 트렌드를 예측하고 정보에 입각한 결정을 내릴 수 있습니다. 실시간 데이터 분석을 통해 재보험 전문가에게 실행 가능한 지능 정보를 제공합니다.

### 원활한 통합
Rellm의 아키텍처는 기존 시스템과의 통합을 간편하게 지원하도록 설계되었습니다. 정책 관리, 청구 처리, 재무 보고와 같은 다양한 데이터 소스와 매끄럽게 연결되어 통합된 생태계를 형성합니다.

### 위험 평가 모듈
Rellm의 종합적인 위험 평가 모듈은 보험사가 위험 프로필을 정확하게 평가할 수 있도록 합니다. 과거 데이터를 활용하고 고급 모델링 기술을 적용하여 잠재적 책임과 예상 결과를 명확히 보여줍니다.

### 맞춤형 대시보드
Rellm은 핵심 지표와 성과 지표를 직관적으로 표시하는 맞춤형 대시보드를 제공합니다. 사용자는 자신의 비즈니스에 가장 중요한 요소를 중심으로 보기 화면을 조정할 수 있어 사용자 경험과 생산성을 향상시킵니다.

### 규제 준수 도구
Rellm은 조직이 지역 및 국제 규제 표준을 충족할 수 있도록 규제 추적 기능을 내장하고 있습니다. 이를 통해 재보험 관행이 투명하고 신뢰성을 유지할 수 있도록 지원합니다.' metadata={'source': 'knowledge-base/products/Rellm.md', '