## 각 파일에 대한 안내

이론 수업에서 소개 드렸던 3개 주제애 대한 간단한 소개 및 실행 방법에 대한 안내를 제공합니다.
- 첨부 문서를 기반으로 질의응답을 수행하는 RAG 챗봇
- 키워드 기반 산업 뉴스 수집 및 요약 챗봇 
- 회의록 요약 보고서 자동 생성기

3개의 파일 모두 OPEN API 키를 사용하므로, 아래 설명에 따라 env.txt 파일을 구성하신 뒤 사용 가능합니다. 

**안전하게 API Key를 사용하는 방법**

API Key는 소스코드에 직접 작성하지 말고, ".env" 파일에 저장하여 환경변수로 불러오는 방식을 권장합니다.  
Jupyter Notebook에서는 기본적으로 숨김 파일(.으로 시작하는 파일)을 새로 생성하거나 업로드할 수 없도록 제한하기 때문에 
**env.txt** 파일에 API KEY를 저장하겠습니다.
```bash
# env.txt 파일 예시
HF_TOKEN=your-api-key-here
```

파이썬에서 env.txt 파일의 값 불러오기
```python
from dotenv import load_dotenv  # 환경변수 로딩을 위한 라이브러리
# .env 파일을 로드하는 경우는 load_dotenv() 형식 사용. env.txt처럼 파일명이 다를 경우 파일명 기입
load_dotenv("env.txt")
```

---

### `rag_chatbot_main.py` - 첨부 문서 기반 RAG 챗봇

PDF 또는 TXT 문서를 업로드하면, 해당 문서를 기반으로 GPT가 질의응답을 수행하는 웹 챗봇입니다.  
LangChain의 최신 문법(LCEL)을 사용하여 RAG 체인을 구성하며, 벡터 저장소로 FAISS를 활용합니다.  
Streamlit으로 구현되어, 문서 기반 질문-응답을 간편하게 웹에서 실행할 수 있습니다.  

**추천 개선 포인트**  

- **상용 API 모델 → 로컬 오픈소스 모델로 전환**  
  회의록이나 내부 문서 등 민감한 데이터를 처리하는 경우, OpenAI와 같은 상용 API 대신 **로컬에서 실행 가능한 오픈소스 LLM(LLaMA, Gemma등)** 으로 전환하는 것이 바람직합니다. 

- **단순 응답 → 보고서 형식 출력으로 개선**  
  모델이 단순히 텍스트 응답을 제공하는 대신, **비즈니스 보고서 형식(제목, 요약, 표 형식의 액션아이템 등)** 으로 출력되도록 구조화하면 활용도가 크게 향상됩니다. 회의록, 전략 분석 등 업무 문서와 바로 연계할 수 있습니다.

- **프롬프트 개선을 통한 맞춤형 출력**  
  조직 특성과 문서 목적에 맞게 **프롬프트를 세분화**하여, 원하는 항목이 더 잘 반영되도록 개선할 수 있습니다. 특정 문서 유형에 최적화된 템플릿 프롬프트를 활용하는 것이 효과적입니다.

- **Langfuse 연계를 통한 사용 모니터링 및 성능 분석**  
  Langfuse를 연동하면 사용자가 입력한 프롬프트, 생성된 응답, 응답 시간 등의 **실행 로그와 품질 데이터를 시각적으로 추적하고 분석**할 수 있어, 모델 개선 및 사용자 경험 향상에 유용합니다.
  
**실행 방법**
```bash
streamlit run rag_chatbot.py
```

---

### `news_summary_bot.py` - 키워드 기반 산업 뉴스 수집 및 요약 챗봇

- `#키워드` 형식으로 입력한 산업 관련 키워드에 대해, NewsAPI를 통해 영어 뉴스를 수집합니다.
- 시작일과 종료일을 입력받아 기간 필터링을 수행하고, 수집된 뉴스 내용을 GPT로 요약합니다.
- 수집된 뉴스의 제목과 링크를 표시하고, 전체 내용을 GPT 모델을 통해 요약해 보여줍니다.
- Gradio를 활용한 간단한 웹 UI를 제공하며, 인터랙티브하게 키워드와 날짜를 입력할 수 있습니다.
- 사용을 위해 https://newsapi.org/ 에 가입하여 API 키를 발급받은 후, 해당 키를 `env.txt` 파일에 `NEWS_API_KEY=...` 형식으로 추가해야 합니다.

**추천 개선 포인트**  

- **단순 요약에서 질의응답 기능으로 확장**  
  요약된 내용만 제공하는 데서 나아가, 사용자가 자유롭게 질문을 입력하면 관련 뉴스를 기반으로 **질문에 답변하는 질의응답 기능(RAG)** 을 추가할 수 있습니다.

- **뉴스 수집부터 요약, 보고서 작성까지 자동화**  
  키워드 기반 뉴스 수집 → 요약 → 비교 분석 → 보고서 형식 출력까지의 전 과정을 **단일 파이프라인으로 자동화**하면 실무 활용성이 높아집니다.

- **Langfuse 연계를 통한 사용 모니터링 및 성능 분석**  
  Langfuse를 연동하면 사용자가 입력한 프롬프트, 생성된 응답, 응답 시간 등의 **실행 로그와 품질 데이터를 시각적으로 추적하고 분석**할 수 있어, 모델 개선 및 사용자 경험 향상에 유용합니다.

**실행 방법**
```bash
python news_summary_bot.py
```

---

### `meeting_summary_bot.py` - 회의록 요약 보고서 자동 생성기

- `.txt` 형식의 사내 회의록을 업로드하면, GPT 모델이 일반적인 회의 보고서 형식으로 자동 요약해줍니다.
- 회의 주제, 주요 논의사항을 포함한 정형화된 결과를 출력합니다.
- 사내 문서 보안 이슈를 고려해, 향후 로컬 LLM으로도 쉽게 전환 가능한 구조입니다.

**개선 포인트 예시**

- **보안 강화를 위한 로컬 LLM 전환**  
  회의록은 내부 기밀이 포함된 문서이므로, OpenAI API와 같은 외부 API 대신, **로컬에서 실행 가능한 오픈소스 LLM(Mistral, LLaMA 등)** 으로 전환하는 것이 보안 측면에서 필수적입니다.

- **부서 및 업무 특성에 맞춘 맞춤형 프롬프트 적용**  
  일률적인 요약이 아닌, **회의 목적이나 부서별 요구에 맞춰 프롬프트를 세분화**하여 보다 정확하고 실용적인 보고서 형식으로 출력되도록 개선할 수 있습니다.

- **참석자 명단 입력 기능 추가**  
  사용자가 **회의 참석자 또는 담당자 목록을 함께 입력**하면, 모델이 역할에 따라 업무를 분류하고 **담당자별 Action Item을 더욱 정확하게 추출**할 수 있습니다.

- **다양한 파일 형식 지원**  
  현재 `.txt` 파일만 지원하는 구조를 개선하여, **PDF, Word(.docx), Markdown 등 다양한 형식의 문서도 업로드 가능**하도록 확장하면 사용자 편의성이 높아집니다.

- **Langfuse 연계를 통한 사용 모니터링 및 성능 분석**  
  Langfuse를 연동하면 사용자가 입력한 프롬프트, 생성된 응답, 응답 시간 등의 **실행 로그와 품질 데이터를 시각적으로 추적하고 분석**할 수 있어, 모델 개선 및 사용자 경험 향상에 유용합니다.

**실행 방법**
```bash
python meeting_summary_bot.py
```

## Streamlit 실행을 위한 환경 구성 안내 (개인 PC용)

Streamlit 앱을 개인 컴퓨터에서 실행하고 싶은 경우, 다음 단계를 순서대로 따라 설치하면 됩니다.

### 1. Python 설치
- [https://www.python.org/downloads/](https://www.python.org/downloads/) 에서 Python 3.10 이상 버전을 설치합니다.
- 설치 시 **"Add Python to PATH"** 옵션을 반드시 체크하세요.

설치 후, 터미널(명령 프롬프트)에서 아래 명령어로 정상 설치 여부를 확인합니다:

```bash
python --version
```

### 2. 가상환경 생성 (선택 권장)
원하는 프로젝트 디렉토리에서 아래 명령어를 실행해 가상환경을 만들고 활성화합니다:
```bash
# 가상환경 생성
python -m venv venv

# Windows
venv\Scripts\activate

# macOS/Linux
source venv/bin/activate
```

###  3. 필수 라이브러리 설치
Streamlit 앱이 정상 실행되기 위해 필요한 핵심 라이브러리를 설치합니다:

```bash
pip install streamlit python-dotenv langchain langchain-community langchain-openai pymupdf
```

###  4. 환경 변수 파일 준비
API 키 등의 민감 정보를 저장할 .env 파일을 루트 디렉토리에 생성하고, 아래와 같이 작성합니다:

```bash
OPENAI_API_KEY=sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxx
+기타 환경변수 추가
```

### 5. 실행
```bash
streamlit run rag_chatbot.py
```