# 📌 GPT 기반 RAG 챗봇 프로젝트 요약 (Markdown 버전)

---

## ✅ 1. Baseline 코드 이해 요약

- `.env`에서 OpenAI API 키를 로드
- YAML 프롬프트를 불러와 GPT-4o 호출
- `call_gpt()` 함수로 프롬프트에 따라 응답 생성
- 예외 처리 포함
- 기본 실행 시 `default` 프롬프트 실행

---

## ✅ 2. LLM (Large Language Model) 요약

| 항목 | 내용 |
|------|------|
| 정의 | 대규모 텍스트를 학습한 자연어 모델 (수십~수천억 파라미터) |
| 발전 | N-gram → RNN → Transformer 기반 LLM |
| 작동 | 사전학습 → 파인튜닝을 거쳐 다양한 NLP 작업 수행 |
| 대표 | GPT-4, Claude, Gemini, LLaMA 등 |
| 활용 | 텍스트 생성, 요약/번역, 코드 작성, Q&A, 지식 추출 등 |
| 한계 | 비용, 편향, 정확성 부족, 제어 어려움 등 |

---

## ✅ 3. LLM 기반 챗봇 동작 흐름
- 입력 → 토큰화/벡터화 → 확률 기반 텍스트 생성 → 사용자에 출력
- 고급 기능: 메모리 유지, 외부 도구 연동, 안전 필터링 등

---

## ✅ 4. RAG 아키텍처 요약

| 항목 | 설명 |
|------|------|
| 정의 | Retrieval-Augmented Generation (검색 기반 생성) |
| 핵심 | 외부 문서를 검색한 뒤 LLM이 생성에 활용 |
| 구성 | Query → Retriever → Knowledge Base → Generator |
| 장점 | 최신 정보 반영, 도메인 지식 반영, 정확도 향상, 재학습 불필요 |
| 활용 | 리서치 보조, 기업 문서 챗봇, 법률/의료 보조, 고객센터 등 |

---

## ✅ 5. Prompt Engineering 요약

| 항목 | 내용 |
|------|------|
| 정의 | LLM이 원하는 출력을 하도록 입력(Prompt)을 정교하게 설계하는 기술 |
| 기법 | 명령형, Few-shot, Zero-shot, Chain-of-Thought, Role 부여 등 |
| 중요성 | LLM 출력 품질 향상, 비용 절감, 모델 미수정으로 제어 가능 |
| 과제 | 결과의 불확실성, 실험 반복 필요, 길이 제한 등 |

---

## ✅ 6. Gradio + RAG 챗봇의 AWS 배포 절차 요약

### 🔹 핵심 구조

- `main.py`: Gradio UI + RAG 로직
- `Dockerfile`: 실행 환경 정의
- `requirements.txt`: 의존 패키지
- `vector_index/`, `data/`: 문서 및 임베딩 저장

### 🔹 EC2 배포 순서

1. EC2 인스턴스 생성 (Ubuntu 22.04, 포트 22/7860 개방)
2. SSH 접속 후 Docker 설치
3. 챗봇 코드 업로드 (`git clone` or `scp`)
4. Docker 이미지 빌드 및 실행

```bash
docker build -t rag-chatbot .
docker run -d -p 7860:7860 rag-chatbot
```

5. 접속:http://<EC2-IP>:7860에서 챗봇 확인

### 🔹 추가 설정

- .env로 API 키 관리
- HTTPS 적용 (Nginx + SSL)
- EC2 부팅 시 자동 실행 설정 (systemd)