# Baseline 코드 이해하기

Baseline 코드는 GPT 모델을 활용하여 프롬프트 기반 응답을 생성하는 구조로 구성되어 있음.

## 주요 구성 요소

- **환경 변수 로드 (.env)**:
  - API 키, 기본 설정 등을 환경 변수로 분리하여 보안성 확보
  - `dotenv` 라이브러리를 통해 로드

- **OpenAI 클라이언트 초기화**:
  - `openai` 라이브러리 사용
  - `OpenAI(api_key=...)`와 같이 객체 생성

- **프롬프트 로드**:
  - YAML 파일에서 system/user 프롬프트 불러오기
  - 작업 목적에 따라 다양한 프롬프트 구성 가능

- **GPT 호출 함수**:
  - `call_gpt(prompt_key)` 형태로 GPT-4o API 호출
  - 선택된 프롬프트를 기반으로 응답 생성
  - 예외 처리 포함

- **자동 실행 메인**:
  - `if __name__ == "__main__":` 블록에서 기본 프롬프트 실행


# LLM(Large Language Model)이란?

## 정의
- 대규모 데이터와 수십억 개의 파라미터를 기반으로 학습한 **자연어 처리 모델**
- 문맥 이해, 생성, 추론 등 다양한 언어 작업 수행 가능

## 기술 발전
- N-gram → RNN → LSTM → Transformer
- 현재는 **Transformer 기반 LLM**이 주류

## 대표 모델
- GPT (OpenAI)
- Claude (Anthropic)
- Gemini/PaLM (Google)
- LLaMA (Meta)

## 구성 요소
- **Pretraining**: 대규모 코퍼스에서 일반 언어 패턴 학습
- **Fine-tuning**: 특정 작업에 맞춰 추가 학습

# LLM 기반 챗봇의 동작 과정

1. **입력 처리**
   - 사용자의 질문 또는 대화문 입력
   - 토크나이저(tokenizer)를 통해 입력을 토큰화

2. **프롬프트 구성**
   - system/user 역할 지정
   - 문맥 유지 및 목적에 맞는 프롬프트 설계

3. **LLM 호출**
   - Transformer 기반 모델이 입력 토큰을 바탕으로 응답 생성
   - 다음 토큰을 확률적으로 예측하여 문장 완성

4. **출력 생성**
   - 토큰을 다시 텍스트로 변환
   - 사용자가 이해 가능한 형태로 출력

5. **후처리(Optional)**
   - 응답 정제, 하이라이트, 요약, 하위 태스크 연계 등

# RAG 아키텍처란?

**RAG (Retrieval-Augmented Generation)**는 검색 기반 문서 생성 구조로,
LLM의 지식 한계를 극복하기 위해 외부 문서를 참조하는 방식.

## 구성 요소

1. **Retriever (검색기)**:
   - 사용자 질문을 벡터화하여, 벡터 DB에서 관련 문서를 검색
   - ex: FAISS, Weaviate, Pinecone 등 사용

2. **Generator (생성기)**:
   - 검색된 문서를 기반으로 LLM이 정답 생성
   - 검색 결과를 프롬프트에 포함시켜 응답 품질 향상

## 장점
- 최신 정보 반영 가능
- 파라미터 업데이트 없이 성능 향상 가능
- 설명 가능성(Explainability) 증가

# AWS 배포 과정 정리

## 1. 프로젝트 준비
- 모델 코드, 프롬프트 파일, requirements.txt 등 정리
- `.env` 파일은 비공개 처리

## 2. 도커라이징
- `Dockerfile` 생성
- 모델 및 서버 실행 환경 컨테이너화

## 3. 클라우드 환경 준비
- AWS EC2 인스턴스 생성 (Ubuntu 권장)
- 혹은 AWS SageMaker / ECS 활용 가능

## 4. 배포 작업
- EC2 접속 후 Docker 이미지 실행
- nginx, gunicorn 등을 통한 백엔드 서비스 구동
- 로드 밸런서나 도메인 연결(Optional)

## 5. 보안 및 인증 설정
- 보안 그룹 설정 (포트 80/443 허용)
- SSL 인증서 적용 (Let's Encrypt 등)
- IAM 역할 관리 및 키 보호

## 6. 유지 관리
- CloudWatch, 로그 모니터링
- 주기적 백업 및 업데이트 자동화 스크립트 구성



