# 1-1 LLM이란?
- 대형 언어 모델
- RAG, Vector DB, LangChain 같은 최신 기술 트렌드에 대한 이해도를 높일 수 있다.
- 대규모 텍스트 데이터를 학습하고 생성한다.
- 자연어 이해(NLU), 번역, 질문 응답, 텍스트 생성 등

## 1. 동작원리
### 1) 학습
- 대규모 텍스트 데이터셋을 이용해 학습한다.
- 단어와 문장의 ***패턴***을 찾아내고 적용한다.

### 2) 추론
- 질문이나 입력을 받으면, 추론을 통해 답변을 생성
- 이전의 맥락을 기억한다.

### 3) 랜덤성 및 조건성
- 확률을 기반으로 다양한 답변을 생성하며, 조건에 따라 결과가 달라진다.

### 4) 미세 조정
- 도메인이나 용도에 맞춰 추가 학습(미세조정)을 할 수 있다.
- 분야에 맞는 데이터를 통해 진행한다.

## 2. LLM의 랜덤성
- 확률에 기반해 문장 생성(같은 질문에 다른 답변)
- 토큰의 확률 분포를 계산하여 그 중에서 높은 확률을 가진 토큰을 선택해 생성한다.
- 매개변수 ***온도(temperature)*** 로 얼마나 랜덤하게 생성할지 설정 가능
- 온도가 낮을 땐 일관적이고 일반적인 답변 높을 땐 창의적이고 예측이 어려운 결과 생성

## 3. LLM의 조건성
- 조건부 확률을 기반으로 결과 생성
- 컨텍스트: 이전 입력 내용에 따라 문장을 조건부로 생성
- 매개변수(프롬프트, 맥락 기억)
- 프롬프트: 입력된 문장이나 질문이 무엇인지에 따라 결과 생성
- 맥락 기억: 이전 문장이나 대화흐름을 기억하고 이에 맞게 답변 생성

-----------

# 1-2 LLM의 기법 및 요소 개념

## 1. RAG란?

### 1) RAG 동작 원리
1. 질문 입력: 질문을 하면 RAG시스템이 답변 전 검색 단계를 가진다.
2. 문서 검색: 텍스트를 벡터화하여 벡터 DB나 기타 정보 저장소에서 질문과 관련된 문서를 검색해 찾는다.
3. 답변 생성: 검색된 문서를 바탕으로 LLM이 답변 생성.

### 2) RAG의 장점
1. 최신 정보 활용
2. 특정 도메인 정보 제공
3. 효율적인 지식 활용

## 2. Vector DB(벡터 데이터 베이스)

### 1) Vector DB란?
- 텍스트, 이미지 등의 데이터를 벡터 형태로 변환해 저장
- 벡터 DB는 임베딩(embedding)이라는 방법으로 데이터를 벡터화해서 검색한다.

### 2) 임베딩이란?
- 텍스트나 이미지를 수학적으로 벡터(숫자 배열)로 변환하는 과정
- 비슷한 종류끼리 유사한 백터값을 가질 수 있다.
- 이러한 벡터화된 데이터로 문서 검색을 수행

### 3) Vector DB 동작 과정
1. 임베딩 생성
2. 벡터 저장
3. 벡터 검색
4. 결과 제공

### 4) 활용 사례
- 문서 검색 시스템
- 이미지 검색
- 질문 답변 시스템

## 3. LangChain

### 1) LangChain이란?
- 언어 모델을 효율적으로 활용할 수 있게 하는 프레임 워크
- LLM돠 외부 리소스를 결합해 언어기반 애플리케이션을 만들도록 돕는다.
- 데이터 소스, API, 데이터 베이스 등을 쉽게 통합할 수 있다.
- 작업 흐름 자동화: LLM 작업을 순차적으로 실행할 수 이는 워크플로우 제공

### 2) 동작 원리

#### 1. 프롬프트 체인: 
- 여러단계의 프롬프트를 연속적으로 연결하고, 복잡한 작업 수행
- 예를 들어 문서를 요약하고, 그 내용으로 질문에 답하는 구조를 만든다.

#### 2. 메모리 기능:
- LLM은 일반적으로 이전 대화를 기억 못하지만 LangChain을 통해 가능하게 만든다.

#### 3. 외부 리소스 통합:
- API, 데이터베이스, 웹 검색 등 다양한 외부 리소스를 결합해 LLM의 한계를 보완한다.

#### 4. 활용 사례
1. 자동화 텍스트 처리
2. 대화형 에이전트
3. 복잡한 워크플로우 처리

----------

# 1-3 OpenAI Playground

## OpenAI Playground란?
- 프롬프트의 실험환경(모델설정, 파라미터 설정 가능)
- 웹 기반의 실험 환경으로, GPT 모델을 자유롭게 활용해보고 프롬프트 실험을 할 수 있는 플랫폼
- 프롬프트 엔지니어링 실습, AI 모델의 응답 패턴을 이해하는 데 유용
- 프롬프트 테스트, 모델 성능 평가, 텍스트 생성 실험

### 1. 할 수 있는 것
#### 1) 텍스트 생성
- 사용자가 입력한 프롬프트를 바탕으로 GPT모델이 답변을 생성

#### 2) 다양한 작업 테스트
- 요약, 번역, 질문 답변, 창의적 글쓰기

#### 3) 프롬프트 엔지니어링 실험
- 프롬프트 작성의 방식이나 내용에 따라 모델의 응답이 어떻게 달라지는지 실험할 수 있다.
- 페르소나 설정: 모델에 역할을 지정해줄 수 있다.("당신은 역사학자입니다. 역사적 사실을 설명해주세요.")

### 2. 주요 설정
1. 모델 선택
2. 온도(Temperature, 랜덤성)
3. 토큰 길이(Max Tokens)
4. 탑 - 피(Top-p, Nucleus Sampling): 응답의 다양성을 제어(1.0: 모든 답변 고려, 0.5 상위 50%에 해당하는 답변 선택)
5. 프롬프트 형식(Stop Sequences)
6. Frequency Penalty: 단어나 문장을 반복하지 않도록 하는 설정
7. Presence Penalty: 새로운 단어나 아이디어를 더 많이 사용하도록 유도하는 설정

### 3. 역할 설정
#### 1) User(사용자)
- User는 대화의 주체로, 프롬프트를 입력하는 역할
- 질문을 하거나 특정 작업을 요청

#### 2) Assistant(도우미)
- Assistant는 User의 요청에 응답하는 역할
- GPT 모델이 답변을 생성하는 역할을 수행

#### 3) System(시스템)
- 대화의 전반적인 규칙이나 지침을 제공
- System 역할은 Assistant가 어떻게 응답할지 지침을 제공
- Assistant의 성격이나 스타일을 조정할 수 있다.