# Day19_0: 생성형 AI와 대규모 언어 모델(LLM) 이해

## 학습 목표

**Part 1: 기초**
1. 생성형 AI(Generative AI)의 개념을 정의하고, 전통적인 AI와의 근본적인 차이점을 설명할 수 있습니다.
2. 대규모 언어 모델(LLM)이 무엇인지 이해하고, GPT, BERT, T5와 같은 주요 모델들의 구조적 차이와 용도를 비교할 수 있습니다.
3. LLM의 발전을 이끈 핵심 기술인 Transformer와 Self-Attention의 원리를 이해합니다.
4. OpenAI API를 사용하여 GPT 모델을 호출하고 응답을 받아올 수 있습니다.
5. API 파라미터(temperature, max_tokens 등)의 의미를 이해하고 적절히 조절할 수 있습니다.

**Part 2: 심화**
1. "크면 클수록 좋다"는 스케일링 법칙(Scaling Laws)이 LLM 발전에 어떤 의미를 갖는지 설명할 수 있습니다.
2. LLM이 현실 세계의 다양한 산업(콘텐츠 제작, 챗봇, 코딩 등)에 어떻게 응용되고 있는지 사례를 통해 이해합니다.
3. 프롬프트 엔지니어링 기법을 활용하여 원하는 출력을 유도할 수 있습니다.
4. Few-shot 프롬프팅과 시스템 프롬프트를 설계하여 실무 문제를 해결할 수 있습니다.

---

## 왜 이것을 배우나요?

| 개념 | 실무 활용 | 예시 |
|------|----------|------|
| 생성형 AI 개념 | AI 서비스 기획 및 활용 | ChatGPT, Claude, Gemini 이해 |
| LLM 아키텍처 | 용도에 맞는 모델 선택 | GPT(생성), BERT(이해), T5(변환) |
| OpenAI API | AI 기반 애플리케이션 개발 | 챗봇, 자동 요약, 콘텐츠 생성 |
| 프롬프트 엔지니어링 | 원하는 출력 정확도 향상 | 정확한 분류, 일관된 포맷 출력 |

**분석가 관점**: LLM API를 활용하면 텍스트 데이터 분석(감성 분류, 요약, 번역)을 자동화할 수 있습니다. 데이터 분석 파이프라인에 LLM을 통합하여 비정형 데이터도 효율적으로 처리할 수 있습니다!

---

# Part 1: 기초

---

## 1.1 생성형 AI(Generative AI)란?

### "패턴 인식"을 넘어 "패턴 창조"로

생성형 AI는 학습한 데이터의 패턴과 구조를 바탕으로, 세상에 없던 **새로운 콘텐츠(텍스트, 이미지, 코드, 음악 등)를 만들어내는** 인공지능 기술입니다.

| 단계 | 설명 |
|------|------|
| **학습 단계** | 방대한 양의 데이터(예: 웹 텍스트, 이미지 모음)를 학습하며 그 안에 내재된 통계적 패턴과 규칙을 익힙니다. |
| **생성 단계** | 사용자로부터 받은 입력(프롬프트, Prompt)을 조건으로, 학습한 패턴에 따라 가장 그럴듯한(probable) 결과물을 새롭게 생성합니다. |

**핵심 차별점**: 기존 AI가 주어진 데이터를 **분류(Classification)**하거나 **예측(Prediction)**하는 '판별' 모델에 가까웠다면, 생성형 AI는 새로운 데이터를 '생성'하는 **'생성' 모델**이라는 점에서 근본적인 차이가 있습니다.

> **작동 방식 요약**:  
> "수많은 고양이 사진을 본 AI에게 '귀여운 고양이를 그려줘'라고 했을 때, 사진들의 공통적인 특징(뾰족한 귀, 동그란 눈, 수염 등)을 조합하여 세상에 단 하나뿐인 새로운 고양이 이미지를 창조해내는 것"

### 전통적 AI vs. 생성형 AI 비교

전통적 AI와 생성형 AI는 목표와 작동 방식에서 명확히 구분됩니다.

| 구분 | 전통적 AI (판별형 AI) | 생성형 AI |
|------|---------------------|----------|
| **목표** | 데이터 분류, 예측, 추천 | 새로운 콘텐츠 생성 |
| **작동 원리** | 정해진 규칙 또는 데이터 패턴 분석 | 학습된 데이터의 확률 분포 기반 생성 |
| **산출물** | 예측 값, 분류 레이블 (e.g., 스팸/정상) | 텍스트, 이미지, 코드 등 새로운 데이터 |
| **창의성** | 없음 (정해진 범위 내에서 동작) | 높음 (새로운 아이디어/결과물 생성) |
| **데이터** | 주로 정형화된 데이터에 강점 | 대규모 비정형 데이터 기반 학습 |
| **예시** | 스팸 메일 필터, 상품 추천 시스템 | ChatGPT, DALL-E, GitHub Copilot |

**핵심 비유**:
> 전통적 AI가 "이 사진에 고양이가 **있는지 없는지 판단**하는 심판"이라면,  
> 생성형 AI는 "'상상 속의 고양이'를 **새롭게 그려내는** 화가"입니다.

---

## 1.2 대규모 언어 모델(LLM)이란?

### 언어를 이해하고 생성하는 거대한 뇌

**대규모 언어 모델(Large Language Model, LLM)**은 수천억 개 이상의 매개변수(Parameter)를 가진 거대한 인공 신경망으로, 방대한 양의 텍스트 데이터를 학습하여 인간의 언어를 이해하고 생성하는 능력을 갖춘 모델입니다.

| 특성 | 설명 |
|------|------|
| **핵심 기술** | 대부분의 현대 LLM은 **Transformer** 아키텍처를 기반으로 합니다. |
| **학습 데이터** | 인터넷의 웹 페이지, 책, 뉴스 기사 등 상상할 수 있는 거의 모든 텍스트를 학습합니다. |
| **능력** | 문맥 이해, 문장 생성, 번역, 요약, 질의응답 등 다재다능한 언어 과제를 수행할 수 있습니다. |
| **대표 주자** | OpenAI의 **GPT** 시리즈, Google의 **BERT, T5, Gemini**, Meta의 **LLaMA** 등이 있습니다. |

**"대규모"의 의미**:
> LLM의 '대규모'는 단순히 큰 것이 아니라, 모델의 크기(파라미터 수)가 일정 수준을 넘어서면서 기존 모델에서는 볼 수 없었던 **창발적 능력(Emergent Abilities)** - 예를 들어 추론, 복잡한 지시 이해 등 - 이 나타나기 시작했다는 점에서 중요합니다.

### 주요 LLM 아키텍처 비교: GPT vs BERT vs T5

LLM은 Transformer 구조를 어떻게 활용하는지에 따라 크게 세 가지 계열로 나뉩니다.

| 계열 | 대표 모델 | Transformer 구조 | 핵심 특징 | 주요 용도 |
|------|----------|-----------------|----------|----------|
| **디코더-Only** | GPT, LLaMA, PaLM | Decoder | **단방향(왼쪽→오른쪽) 문맥**을 보고 다음 단어를 예측 (Auto-regressive). 문장 생성에 특화. | **텍스트 생성**, 챗봇, 창작, 요약 |
| **인코더-Only** | BERT, RoBERTa | Encoder | **양방향 문맥**을 모두 보고 빈칸(MASK)을 예측. 문장 전체의 의미 이해에 특화. | **자연어 이해(NLU)**, 문장 분류, 감성 분석, 개체명 인식 |
| **인코더-디코더** | T5, BART | Encoder + Decoder | 입력 시퀀스를 다른 출력 시퀀스로 변환하는 **Seq2Seq** 구조. 모든 NLP 문제를 "Text-to-Text"로 접근. | **번역**, 요약, 문서 변환 |

**모델 선택 가이드**:
- 텍스트를 **생성**해야 한다면 → **GPT 계열**
- 텍스트를 **이해/분류**해야 한다면 → **BERT 계열**
- 텍스트를 **변환**해야 한다면 → **T5 계열**

---

## 1.3 핵심 혁신 1: Transformer & Self-Attention

### LLM 시대를 연 결정적 기술

2017년 논문 **"Attention Is All You Need"**에서 등장한 Transformer는 순차적으로 정보를 처리하던 기존 RNN/LSTM의 한계를 극복했습니다.

| 구분 | RNN의 한계 | Transformer의 혁신 |
|------|-----------|-------------------|
| **처리 방식** | **순차 처리**: 문장이 길어지면 처리 속도가 느림 (병렬화 불가) | **병렬 처리**: 문장 전체를 한 번에 입력받아 모든 단어 간 관계를 동시에 계산 |
| **장기 의존성** | **장기 의존성 문제**: 문장 앞부분의 정보가 뒤로 갈수록 희미해짐 | **Self-Attention**: 멀리 떨어진 단어 간의 관계도 직접적으로 파악 |

### Self-Attention: 단어 간의 관계 네트워크

Self-Attention은 문장 내 한 단어가 다른 모든 단어와 얼마나 관련이 있는지(Attention Score)를 계산하여, 중요한 단어의 정보에 더 '집중'하는 메커니즘입니다.

```
문장: "그 동물은 길을 건너지 못했다 왜냐하면 피곤해서"

"못했다"라는 단어를 처리할 때:
- '동물', '건너지', '피곤해서' 등의 단어에 높은 Attention을 줌
- 문맥을 파악하여 "피곤해서 건너지 못했다"는 의미를 이해
```

이 메커니즘 덕분에 Transformer는 긴 문장에서도 문맥을 정확하게 파악할 수 있습니다.

---

## 1.4 OpenAI API 기본 사용법

### 환경 설정

In [1]:
from dotenv import load_dotenv
load_dotenv()

True

In [3]:
import os
import openai

client = openai.OpenAI(
    base_url="https://api.groq.com/openai/v1",
    api_key=os.environ.get("GROQ_API_KEY")
)

In [None]:
# OpenAI 라이브러리 설치 (필요시)
# !pip install openai python-dotenv

In [4]:
# import os
# from dotenv import load_dotenv
# from openai import OpenAI

# # .env 파일에서 환경 변수 로드
# load_dotenv()

# # API 키 설정 (환경변수에서 자동으로 가져옴: OPENAI_API_KEY)
# client = OpenAI()

# print("OpenAI 클라이언트가 설정되었습니다.")

### API 키 보안 주의사항

| 방법 | 권장 여부 | 설명 |
|------|----------|------|
| 환경변수 | **권장** | `export OPENAI_API_KEY='sk-...'` |
| .env 파일 | 권장 | `.gitignore`에 추가 필수 |
| 코드에 직접 입력 | **위험** | 깃허브 유출 위험 |

```bash
# .env 파일 예시
OPENAI_API_KEY=sk-proj-xxxxx
```

### 첫 번째 API 호출

In [7]:
# 가장 기본적인 API 호출
response = client.chat.completions.create(
    model="qwen/qwen3-32b",  # 사용할 모델
    messages=[
        {"role": "user", "content": "안녕하세요! 간단히 자기소개 해주세요."}
    ]
)

# 응답 출력
print(response.choices[0].message.content)

<think>
Okay, the user said "안녕하세요! 간단히 자기소개 해주세요." which means "Hello! Please do a brief self-introduction." I need to provide a short and friendly introduction of myself. Let me start by greeting them back in Korean. Then mention that I'm an AI assistant developed by Alibaba Cloud. Highlight my capabilities like answering questions, providing information, and helping with tasks. Keep it concise but welcoming. Make sure to use proper Korean etiquette and a helpful tone. Avoid any technical jargon. Maybe end with an invitation for them to ask questions. Let me check the structure: greeting, name, purpose, capabilities, offer help. That should cover it. Now, put it all together in natural Korean.
</think>

안녕하세요! 저는 알리바바 클라우드에서 개발한 대형 언어 모델인 쿤이차(Qwen)입니다. 궁금한 점이 있거나 정보가 필요하시면 언제든지 도와드릴 수 있어요. 질문해 주세요!


### 메시지 역할 (Role) 이해하기

| 역할 | 설명 | 예시 |
|------|------|------|
| `system` | AI의 행동 방식, 역할, 제약 조건 정의 | "당신은 친절한 요리사입니다" |
| `user` | 사용자의 질문이나 요청 | "파스타 레시피 알려주세요" |
| `assistant` | AI의 이전 응답 (대화 히스토리) | "네, 파스타 레시피를 알려드릴게요..." |

In [8]:
# 시스템 메시지를 포함한 호출
response = client.chat.completions.create(
    model="openai/gpt-oss-120b",
    messages=[
        {"role": "system", "content": "당신은 데이터 분석 전문가입니다. 한국어로 답변하세요."},
        {"role": "user", "content": "pandas와 numpy의 차이점을 설명해주세요."}
    ]
)

print(response.choices[0].message.content)

## pandas와 numpy의 차이점

| 구분 | **NumPy** | **pandas** |
|------|-----------|------------|
| **주된 목적** | 고성능 수치 연산 및 다차원 배열 처리 | **표(table) 형태**의 데이터 조작·분석(시계열, 카테고리 등) |
| **핵심 자료구조** | `ndarray` (동일한 자료형을 갖는 다차원 배열) | `Series` (1차원 레이블 배열) <br> `DataFrame` (2차원 레이블 테이블) |
| **데이터 타입** | 기본적으로 **동일한 dtype**(예: `float64`, `int32`)만 허용 | 각 컬럼마다 **다른 dtype** 가능 (숫자, 문자열, datetime, 범주형 등) |
| **인덱싱/라벨링** | 정수 인덱스 기반 슬라이싱·정수 배열 | **라벨 기반 인덱싱** (`.loc`, `.iloc`), 복합 인덱스(MultiIndex) 지원 |
| **브로드캐스팅** | 배열 연산 시 자동 브로드캐스팅 지원 | `Series`와 `DataFrame` 간 연산에서도 브로드캐스팅 적용되지만, 라벨 정렬이 먼저 수행 |
| **결측치 처리** | `np.nan`은 부동소수점 전용, 정수 배열은 `np.nan`을 직접 저장 불가 (masked array 필요) | `NaN`, `None`, `pd.NA`(새로운 nullable dtype) 등 다양한 결측치 표현·전용 메서드(`.isna()`, `.fillna()`) 제공 |
| **파일 입출력** | `np.save`, `np.load`, `np.genfromtxt` 등 (주로 binary/텍스트) | CSV, Excel, JSON, SQL, Parquet, Feather 등 **다양한 포맷**을 손쉽게 읽고 쓸 수 있는 메서드 제공 (`read_csv`, `to_excel` 등) |
| **시계열/시간 인덱스** | 기본 제공되지 않음 (datetime 배열은 가능하지만 기능 제한) | 강력한 **시계열

---

## 1.5 API 파라미터 이해하기

### 주요 파라미터

| 파라미터 | 범위 | 설명 |
|---------|------|------|
| `model` | - | 사용할 모델 (gpt-4o, gpt-4o-mini 등) |
| `temperature` | 0~2 | 창의성/무작위성 조절 (0: 결정적, 높을수록 창의적) |
| `max_tokens` | - | 응답의 최대 토큰 수 |
| `top_p` | 0~1 | 확률 기반 샘플링 (nucleus sampling) |
| `presence_penalty` | -2~2 | 새로운 주제 유도 |
| `frequency_penalty` | -2~2 | 반복 감소 |

In [None]:
# temperature 비교: 낮은 값 (결정적)
response_low_temp = client.chat.completions.create(
    model="openai/gpt-oss-120b",
    messages=[{"role": "user", "content": "사과에 대해 한 문장으로 설명해주세요."}],
    temperature=0.0,  # 가장 확률 높은 답변
    max_tokens=100
)

print("Temperature 0.0:")
print(response_low_temp.choices[0].message.content)
print()

Temperature 0.0:
사과는 달콤하면서도 상큼한 과육과 바삭한 식감을 가진, 비타민 C와 섬유질이 풍부한 둥근 과일입니다.



In [18]:
# temperature 비교: 높은 값 (창의적)
response_high_temp = client.chat.completions.create(
    model="openai/gpt-oss-120b",
    messages=[{"role": "user", "content": "사과에 대해 한 문장으로 설명해주세요."}],
    temperature=1.5,  # 더 다양하고 창의적인 답변
    max_tokens=100
)

print("Temperature 1.5:")
print(response_high_temp.choices[0].message.content)

Temperature 1.5:
사과는 달콤하고 아삭한 식감을 가진, 비타민·식이섬유가 풍부한 다목적 과일입니다.


### Temperature 가이드라인

| 용도 | 권장 temperature | 이유 |
|------|-----------------|------|
| 코드 생성 | 0.0 ~ 0.3 | 정확성 중요 |
| 데이터 분석 | 0.0 ~ 0.3 | 일관된 결과 필요 |
| 일반 대화 | 0.5 ~ 0.7 | 자연스러움 |
| 창작/브레인스토밍 | 0.8 ~ 1.5 | 다양성 필요 |

---

# Part 2: 심화

---

## 2.1 핵심 혁신 2: 스케일링 법칙 (Scaling Laws)

### "크기가 성능을 만든다"

2020년 OpenAI의 연구는 LLM의 성능이 세 가지 요소에 따라 **예측 가능하게 향상**된다는 것을 실험적으로 증명했습니다. 이를 **스케일링 법칙**이라고 합니다.

**성능 ∝ (모델 크기, 데이터셋 크기, 컴퓨팅 파워)**

| 요소 | 설명 |
|------|------|
| **모델 크기 (Parameters)** | 신경망의 파라미터(가중치) 수. 클수록 더 복잡한 패턴 학습 가능 |
| **데이터셋 크기 (Tokens)** | 모델이 학습하는 텍스트의 양. 많을수록 더 넓은 지식 습득 |
| **컴퓨팅 파워 (FLOPs)** | 학습에 사용되는 총 연산량 |

이 세 가지 요소를 **균형 있게 함께 늘리면**, 모델의 성능(손실 값 감소)은 멱함수(Power-law) 형태로 꾸준히 향상됩니다.

**스케일링 법칙의 시사점**:
> "더 똑똑한 모델을 만들고 싶다면, **더 큰 모델을, 더 많은 데이터로, 더 오래 학습시켜라!**"  
> 이 법칙은 GPT-3와 같은 초거대 AI 모델 개발의 이론적 토대가 되었고, 이후 LLM 경쟁을 촉발시켰습니다.

---

## 2.2 LLM의 현실 세계 응용 사례

### 산업을 바꾸는 게임 체인저

LLM은 다양한 산업 분야에서 혁신적인 서비스를 가능하게 하며 빠르게 확산되고 있습니다.

| 분야 | 활용 사례 | 예시 서비스 |
|------|----------|------------|
| **콘텐츠 생성 & 마케팅** | 블로그 글, 광고 카피, 이메일, 제품 설명 등을 자동으로 생성하여 생산성을 극대화 | Jasper, Copy.ai |
| **대화형 AI & 챗봇** | 단순 응대를 넘어, 고객의 의도를 파악하고 사람처럼 자연스러운 대화가 가능한 지능형 챗봇 구현 | ChatGPT, 기업용 AI 상담원 |
| **문서 요약 & 지식 관리** | 긴 보고서, 뉴스 기사, 논문을 핵심 내용만 간추려 요약하고, 문서 기반 질의응답 시스템 구축 | 회의록 요약, 법률 문서 분석 |
| **코드 생성 & 개발 지원** | 개발자의 주석이나 함수명만 보고 필요한 코드를 자동으로 완성해주어 개발 속도 향상 | GitHub Copilot, Amazon CodeWhisperer |

**주의할 점: 환각과 편향**
> LLM은 매우 유용하지만, 때때로 사실이 아닌 내용을 그럴듯하게 지어내는 **환각(Hallucination)** 현상이나, 학습 데이터에 내재된 **편향(Bias)**을 드러낼 수 있습니다. 따라서 중요한 작업에는 반드시 사람의 검토가 필요합니다.

---

## 2.3 프롬프트 엔지니어링 기초

### 좋은 프롬프트의 원칙

| 원칙 | 설명 | 예시 |
|------|------|------|
| **명확성** | 구체적이고 명확한 지시 | "요약해주세요" → "3문장으로 요약해주세요" |
| **역할 부여** | AI에게 특정 역할 지정 | "당신은 10년 경력의 데이터 분석가입니다" |
| **구조화** | 출력 형식 지정 | "JSON 형식으로 답변하세요" |
| **단계별 추론** | 복잡한 문제 분해 | "단계별로 설명해주세요" |

In [19]:
# 나쁜 프롬프트 예시
bad_response = client.chat.completions.create(
    model="openai/gpt-oss-120b",
    messages=[{"role": "user", "content": "파이썬 알려줘"}],
    temperature=0.5
)
print("=== 나쁜 프롬프트 ===")
print(bad_response.choices[0].message.content[:300] + "...")

=== 나쁜 프롬프트 ===
## 파이썬 입문 가이드 (한국어)

### 1. 파이썬이란?
- **인터프리터 언어**: 코드를 한 줄씩 바로 실행합니다. (컴파일이 필요 없음)
- **읽기 쉬운 문법**: 들여쓰기와 간결한 구문 덕분에 초보자에게 친숙합니다.
- **다양한 분야**: 웹 개발, 데이터 분석, 인공지능, 자동화, 게임 등 거의 모든 분야에서 사용됩니다.
- **플랫폼 독립**: Windows, macOS, Linux 어디서든 동일하게 실행됩니다.

---

## 2. 파이썬 설치 & 실행

| OS | 설치 방법 |
|----|----------...


In [20]:
# 좋은 프롬프트 예시
good_response = client.chat.completions.create(
    model="openai/gpt-oss-120b",
    messages=[
        {"role": "system", "content": "당신은 프로그래밍 교육 전문가입니다. 초보자도 이해할 수 있게 설명하세요."},
        {"role": "user", "content": """파이썬 프로그래밍 언어에 대해 다음 형식으로 설명해주세요:

1. 정의: (한 문장)
2. 주요 특징: (3가지 불릿 포인트)
3. 대표 활용 분야: (2가지)"""}
    ],
    temperature=0.3
)
print("=== 좋은 프롬프트 ===")
print(good_response.choices[0].message.content)

=== 좋은 프롬프트 ===
**1. 정의:**  
파이썬은 읽기 쉬운 문법과 풍부한 표준 라이브러리를 갖춘, 범용 목적의 고급 프로그래밍 언어입니다.  

**2. 주요 특징:**  
- **간결하고 직관적인 문법** – 초보자도 쉽게 배울 수 있도록 설계되었습니다.  
- **다양한 라이브러리와 프레임워크** – 데이터 과학, 웹 개발, 자동화 등 여러 분야에서 바로 활용 가능하도록 풍부한 생태계를 제공합니다.  
- **플랫폼 독립성** – Windows, macOS, Linux 등 대부분의 운영체제에서 동일하게 실행됩니다.  

**3. 대표 활용 분야:**  
- **데이터 과학·인공지능** (예: NumPy, pandas, TensorFlow, PyTorch)  
- **웹·애플리케이션 개발** (예: Django, Flask)  


---

## 2.4 Few-shot 프롬프팅

### Zero-shot vs One-shot vs Few-shot

| 방식 | 예시 수 | 특징 |
|------|--------|------|
| Zero-shot | 0개 | 예시 없이 직접 지시 |
| One-shot | 1개 | 하나의 예시 제공 |
| Few-shot | 2~5개 | 여러 예시 제공 |

In [21]:
# Zero-shot: 예시 없이 분류
zero_shot = client.chat.completions.create(
    model="openai/gpt-oss-120b",
    messages=[{"role": "user", "content": """다음 리뷰의 감성을 '긍정', '부정', '중립' 중 하나로 분류하세요.

리뷰: "배송은 빨랐는데 제품 품질이 별로네요."
감성:"""}],
    temperature=0.0
)
print("=== Zero-shot ===")
print(zero_shot.choices[0].message.content)

=== Zero-shot ===
부정


In [22]:
# Few-shot: 여러 예시 제공
few_shot = client.chat.completions.create(
    model="openai/gpt-oss-120b",
    messages=[{"role": "user", "content": """다음 리뷰의 감성을 분류하세요.

예시 1:
리뷰: "정말 만족합니다! 다음에도 또 구매할게요."
감성: 긍정

예시 2:
리뷰: "제품이 파손되어 왔어요. 실망입니다."
감성: 부정

예시 3:
리뷰: "그냥 평범해요. 특별한 건 없네요."
감성: 중립

이제 다음 리뷰를 분류하세요:
리뷰: "배송은 빨랐는데 제품 품질이 별로네요."
감성:"""}],
    temperature=0.0
)
print("=== Few-shot ===")
print(few_shot.choices[0].message.content)

=== Few-shot ===
감성: 부정


---

## 2.5 실무 활용 예제

### 유틸리티 함수 만들기

In [25]:
def chat_with_gpt(prompt, system_message=None, temperature=0.7, max_tokens=500):
    """
    GPT API를 호출하고 응답을 파싱하는 함수
    
    Parameters:
    - prompt: 사용자 질문
    - system_message: 시스템 메시지 (선택)
    - temperature: 창의성 조절 (0~2)
    - max_tokens: 최대 응답 길이
    
    Returns:
    - dict: 응답 내용과 메타데이터
    """
    messages = []
    
    if system_message:
        messages.append({"role": "system", "content": system_message})
    
    messages.append({"role": "user", "content": prompt})
    
    response = client.chat.completions.create(
        model="openai/gpt-oss-120b",
        messages=messages,
        temperature=temperature,
        max_tokens=max_tokens
    )
    
    return {
        "content": response.choices[0].message.content,
        "tokens": {
            "prompt": response.usage.prompt_tokens,
            "completion": response.usage.completion_tokens,
            "total": response.usage.total_tokens
        },
        "finish_reason": response.choices[0].finish_reason
    }


In [26]:

# 테스트
result = chat_with_gpt(
    prompt="머신러닝과 딥러닝의 차이점은?",
    system_message="간결하게 답변하세요.",
    temperature=0.5
)

print("응답:", result["content"])
print(f"\n토큰 사용: {result['tokens']['total']}")

응답: **머신러닝 (ML)**  
- 데이터와 레이블을 이용해 **특징(feature)**을 직접 설계하고, 그 특징을 바탕으로 모델을 학습시킴.  
- 대표 알고리즘: 선형 회귀, SVM, 결정 트리, 랜덤 포레스트 등.  
- 비교적 적은 데이터와 연산 자원으로도 사용 가능.  

**딥러닝 (DL)**  
- 다층 **인공신경망**이 자동으로 특징을 추출·학습함(특히 이미지·음성·텍스트에 강함).  
- 대표 구조: CNN, RNN, Transformer 등.  
- 대규모 데이터와 높은 연산량(GPU/TPU)이 필요하지만, 복잡한 패턴을 높은 정확도로 모델링 가능.  

**핵심 차이**  
1. **특징 설계**: ML은 수동, DL은 자동.  
2. **모델 복잡도**: ML은 비교적 얕고 단순, DL은 깊고 복잡.  
3. **데이터·연산 요구**: ML은 적은 데이터·자원, DL은 대규모 데이터·고성능 하드웨어 필요.

토큰 사용: 393


### 텍스트 요약 함수

In [None]:
def summarize_text(text, max_sentences=3):
    """텍스트를 지정된 문장 수로 요약"""
    result = chat_with_gpt(
        prompt=f"""다음 텍스트를 {max_sentences}문장 이내로 요약하세요.

텍스트:
{text}

요약:""",
        system_message="당신은 전문 요약가입니다. 핵심 내용만 간결하게 요약하세요.",
        temperature=0.3
    )
    return result["content"]

# 테스트
sample_text = """인공지능(AI)은 인간의 학습, 추론, 지각, 자연어 처리 등의 지적 능력을 
컴퓨터 프로그램으로 구현한 기술입니다. 최근 딥러닝의 발전으로 AI는 이미지 인식, 
음성 인식, 자연어 처리 등 다양한 분야에서 인간 수준의 성능을 보여주고 있습니다. 
특히 2022년 ChatGPT의 등장은 대중에게 AI의 가능성을 직접 체험하게 해주었으며, 
이후 다양한 산업 분야에서 AI 도입이 가속화되고 있습니다."""

summary = summarize_text(sample_text, max_sentences=2)
print("=== 원문 ===")
print(sample_text)
print("\n=== 요약 ===")
print(summary)

### 감성 분류 함수

In [None]:
import json

def classify_sentiment(text):
    """텍스트의 감성을 분류하고 JSON으로 반환"""
    result = chat_with_gpt(
        prompt=f"""다음 텍스트의 감성을 분석하세요.

텍스트: "{text}"

다음 JSON 형식으로만 응답하세요:
{{"sentiment": "positive/negative/neutral", "score": 0.0~1.0, "reason": "이유"}}""",
        system_message="감성 분석 API입니다. JSON만 출력하세요.",
        temperature=0.0
    )
    try:
        return json.loads(result["content"])
    except:
        return {"error": "파싱 실패", "raw": result["content"]}

# 테스트
reviews = [
    "이 제품 정말 최고예요! 강력 추천합니다.",
    "배송이 늦어서 짜증나요. 다시는 안 삽니다.",
    "그냥 그래요. 가격 대비 보통입니다."
]

for review in reviews:
    result = classify_sentiment(review)
    print(f"리뷰: {review}")
    print(f"결과: {result}")
    print()

---

## 실습 퀴즈

**난이도 분포**: 기본 3개 / 응용 3개 / 복합 2개 / 종합 2개

---

### Q1. LLM 개념 이해 (기본)

**문제**: 다음 빈칸을 채우세요.

1. LLM은 (______) 아키텍처를 기반으로 합니다.
2. GPT는 (______)-Only 구조이고, BERT는 (______)-Only 구조입니다.
3. GPT는 다음 (______)을 예측하는 방식으로 텍스트를 생성합니다.

In [None]:
# 여기에 답을 작성하세요
answer1 = ""
answer2_gpt = ""
answer2_bert = ""
answer3 = ""

print(f"1. {answer1}")
print(f"2. GPT: {answer2_gpt}, BERT: {answer2_bert}")
print(f"3. {answer3}")

### Q2. 기본 API 호출 (기본)

**문제**: OpenAI API를 사용하여 "대한민국의 수도는 어디인가요?"라는 질문에 답변을 받으세요.

In [None]:
# 여기에 코드를 작성하세요


### Q3. 파라미터 이해 (기본)

**문제**: temperature를 0.0과 1.5로 각각 설정하여 같은 질문("창의적인 회사 이름 하나 제안해주세요")에 대한 응답을 비교하세요.

In [None]:
# 여기에 코드를 작성하세요


### Q4. 응답 파싱 (응용)

**문제**: API 응답에서 다음 정보를 추출하는 코드를 작성하세요.
- 응답 텍스트
- 사용된 총 토큰 수
- 종료 사유(finish_reason)

In [None]:
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": "Python의 장점 3가지를 알려주세요."}]
)

# 여기에 코드를 작성하세요 (위 response에서 정보 추출)


### Q5. 시스템 프롬프트 (응용)

**문제**: AI가 "친절한 한국어 선생님" 역할을 하도록 시스템 프롬프트를 작성하고, "안녕하세요"의 존댓말 사용법을 질문하세요.

In [None]:
# 여기에 코드를 작성하세요


### Q6. 프롬프트 엔지니어링 (응용)

**문제**: 다음 텍스트를 "불릿 포인트 3개"로 요약하도록 프롬프트를 작성하세요.

텍스트: "파이썬은 1991년 귀도 반 로섬이 개발한 프로그래밍 언어입니다. 읽기 쉬운 문법과 다양한 라이브러리로 인해 데이터 분석, 웹 개발, 인공지능 등 다양한 분야에서 널리 사용됩니다. 특히 초보자가 배우기 쉬워 프로그래밍 입문 언어로 많이 추천됩니다."

In [None]:
text = """파이썬은 1991년 귀도 반 로섬이 개발한 프로그래밍 언어입니다. 
읽기 쉬운 문법과 다양한 라이브러리로 인해 데이터 분석, 웹 개발, 인공지능 등 
다양한 분야에서 널리 사용됩니다. 특히 초보자가 배우기 쉬워 프로그래밍 입문 
언어로 많이 추천됩니다."""

# 여기에 코드를 작성하세요


### Q7. Few-shot 프롬프팅 (복합)

**문제**: Few-shot 방식으로 이메일 분류기를 만드세요. 카테고리: 업무, 광고, 개인

예시를 3개 제공하고, 새로운 이메일 "내일 회의 시간 변경 건으로 연락드립니다."를 분류하세요.

In [None]:
# 여기에 코드를 작성하세요


### Q8. JSON 출력 (복합)

**문제**: 다음 제품 리뷰를 분석하여 JSON 형식으로 출력하는 함수를 작성하세요.

출력 형식:
```json
{
    "product": "제품명 추출",
    "rating": 1-5,
    "pros": ["장점1", "장점2"],
    "cons": ["단점1", "단점2"]
}
```

테스트 리뷰: "갤럭시 S24 사용 중인데, 카메라가 정말 좋고 배터리도 오래가요. 다만 가격이 비싸고 무게가 좀 있네요."

In [None]:
import json

# 여기에 코드를 작성하세요


### Q9. 텍스트 분석 봇 (종합)

**문제**: 긴 텍스트를 입력받아 다음을 수행하는 함수를 작성하세요.
1. 핵심 키워드 3개 추출
2. 한 문장 요약
3. 긍/부정 톤 판단

결과는 딕셔너리로 반환하세요.

In [None]:
def analyze_text(text):
    """텍스트를 분석하여 키워드, 요약, 톤을 반환"""
    # 여기에 코드를 작성하세요
    pass

# 테스트
test_text = """최근 출시된 AI 스피커 신제품이 큰 인기를 끌고 있습니다. 
이 제품은 기존 모델보다 음성 인식 정확도가 30% 향상되었으며, 
스마트홈 연동 기능도 강화되었습니다. 다만 가격이 전작 대비 20% 인상되어 
소비자들의 부담이 커질 것으로 예상됩니다."""

result = analyze_text(test_text)
print(result)

### Q10. 다중 리뷰 분류 파이프라인 (종합)

**문제**: 여러 개의 고객 리뷰를 받아 감성 분석 후 pandas DataFrame으로 결과를 반환하는 파이프라인을 구축하세요.

요구사항:
1. 각 리뷰의 감성(긍정/부정/중립)과 신뢰도(0~1) 분석
2. 결과를 DataFrame으로 정리
3. 감성별 통계 출력

In [None]:
import pandas as pd
import json

def analyze_reviews(reviews):
    """리뷰 리스트를 분석하여 DataFrame 반환"""
    # 여기에 코드를 작성하세요
    pass

# 테스트 데이터
test_reviews = [
    "정말 좋은 제품이에요! 강력 추천합니다.",
    "배송이 너무 느려요. 일주일이나 걸렸습니다.",
    "가격 대비 괜찮은 품질입니다.",
    "AS 서비스가 최악이에요. 다시는 안 삽니다.",
    "디자인이 예쁘고 사용하기 편해요!"
]

result_df = analyze_reviews(test_reviews)
print(result_df)
print("\n=== 감성별 통계 ===")
# 통계 출력 코드 추가

---

## 학습 정리

### Part 1: 기초 핵심 요약

| 개념 | 핵심 내용 | 실무 활용 |
|------|----------|----------|
| 생성형 AI | 패턴 인식을 넘어 패턴 창조 | ChatGPT, DALL-E, Copilot |
| LLM | Transformer 기반 대규모 언어 모델 | GPT(생성), BERT(이해), T5(변환) |
| Self-Attention | 단어 간 관계를 병렬로 계산 | 장거리 의존성 해결 |
| OpenAI API | `client.chat.completions.create()` | 애플리케이션 개발 |
| temperature | 0~2, 창의성 조절 | 0: 결정적, 높을수록 창의적 |

### Part 2: 심화 핵심 요약

| 개념 | 핵심 기법 | 언제 사용? |
|------|----------|----------|
| 스케일링 법칙 | 모델/데이터/컴퓨팅 균형 증가 | LLM 성능 예측 |
| 프롬프트 엔지니어링 | 명확성, 역할 부여, 구조화 | 원하는 출력 유도 |
| Few-shot | 예시 제공 | 일관된 형식, 분류 |
| JSON 출력 | 형식 지정 프롬프트 | 데이터 파이프라인 |

### 실무 팁

1. **API 키 보안**: 환경변수 또는 .env 파일 사용, 절대 코드에 직접 입력 금지
2. **temperature 선택**: 분석/코드는 낮게(0~0.3), 창작은 높게(0.8+)
3. **토큰 비용 관리**: max_tokens 적절히 설정, 불필요한 출력 제한
4. **환각 주의**: 중요한 정보는 반드시 사람이 검증
5. **프롬프트 테스트**: 여러 번 실행하여 일관성 확인