# OpenAI API 강의 2
## 주제: ChatGPT 모델 심화 및 프롬프트 엔지니어링


## 학습 목표
- ChatGPT 모델 구조 및 기능 이해
- 프롬프트 엔지니어링 기법 실습
- System / User / Assistant 역할의 차이 학습
- 다양한 프롬프트 스타일 비교 (지시형, 예시형, Few-shot 등)



## 1. ChatGPT 모델 개요
| 항목 | 설명 |
|------|------|
| 모델 이름 | `gpt-4.1`, `gpt-4o-mini`, `gpt-3.5-turbo` 등 |
| 모델 특징 | 대화형 자연어 처리에 최적화 |
| 주요 기능 | 대화 유지, 문맥 기억, 다양한 역할(System/User/Assistant) |
| 활용 예시 | 챗봇, 고객지원, 문서 요약, 질의응답, 코드 보조 |


In [1]:
from openai import OpenAI
client = OpenAI()

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "너는 친절한 AI 강사야."},
        {"role": "user", "content": "딥러닝에서 나오는 adam에 대해 설명해줘."}
    ]
)


print(response.choices[0].message.content)
markdown_doc = response.choices[0].message.content

Adam(Adaptive Moment Estimation)은 딥러닝에서 널리 사용되는 최적화 알고리즘 중 하나입니다. 이 알고리즘은 경량화된 효율성과 뛰어난 성능 덕분에 많은 딥러닝 프레임워크에서 기본 최적화 방법으로 채택되고 있습니다.

### Adam의 주요 특징

1. **모멘텀을 사용하는 최적화**:
   - Adam은 과거의 기울기를 고려하여 현재의 기울기 업데이트에 모멘텀을 추가하는 방식으로 동작합니다. 이를 통해 스무딩 효과를 얻고, 경량화된 학습 속도를 유지할 수 있습니다.

2. **적응형 학습률**:
   - Adam은 각 파라미터에 대해 별도의 학습률을 조정합니다. 각 파라미터의 기울기 1차 순간(moment)과 2차 순간(variance)을 추정하여, 더 자주 업데이트되는 파라미터의 학습률은 줄이고, 적게 업데이트되는 파라미터의 학습률은 높입니다.

3. **바라라 안정성**:
   - 이 방법은 초깃값과 학습률에 대한 민감도가 낮아서, 비교적 좋은 성능을 보여줍니다.

### Adam의 수식

Adam은 다음과 같은 단계로 최적화됩니다:

1. **1차 모멘트 추정**: 현재의 기울기로부터 첫 번째 모멘트를 추정합니다.
   \[
   m_t = \beta_1 m_{t-1} + (1 - \beta_1) g_t
   \]
   여기서 \(g_t\)는 현재의 기울기, \(\beta_1\)는 모멘텀을 조정하는 하이퍼파라미터입니다.

2. **2차 모멘트 추정**: 현재의 기울기의 제곱으로부터 두 번째 모멘트를 추정합니다.
   \[
   v_t = \beta_2 v_{t-1} + (1 - \beta_2) g_t^2
   \]
   \(\beta_2\)는 2차 모멘트의 하이퍼파라미터입니다.

3. **편향 보정**: 초기 단계에서는 \(m_t\)와 \(v_t\)가 0으로 시작되기 때문에 편향을 보정합니다.
   \[
   \hat{m}_t = \frac{m_t}{1 - \beta_1^t}
   \]
   \[
   \hat{v}_t = \fra

In [2]:
from IPython.display import Markdown, display
Markdown(response.choices[0].message.content)

Adam(Adaptive Moment Estimation)은 딥러닝에서 널리 사용되는 최적화 알고리즘 중 하나입니다. 이 알고리즘은 경량화된 효율성과 뛰어난 성능 덕분에 많은 딥러닝 프레임워크에서 기본 최적화 방법으로 채택되고 있습니다.

### Adam의 주요 특징

1. **모멘텀을 사용하는 최적화**:
   - Adam은 과거의 기울기를 고려하여 현재의 기울기 업데이트에 모멘텀을 추가하는 방식으로 동작합니다. 이를 통해 스무딩 효과를 얻고, 경량화된 학습 속도를 유지할 수 있습니다.

2. **적응형 학습률**:
   - Adam은 각 파라미터에 대해 별도의 학습률을 조정합니다. 각 파라미터의 기울기 1차 순간(moment)과 2차 순간(variance)을 추정하여, 더 자주 업데이트되는 파라미터의 학습률은 줄이고, 적게 업데이트되는 파라미터의 학습률은 높입니다.

3. **바라라 안정성**:
   - 이 방법은 초깃값과 학습률에 대한 민감도가 낮아서, 비교적 좋은 성능을 보여줍니다.

### Adam의 수식

Adam은 다음과 같은 단계로 최적화됩니다:

1. **1차 모멘트 추정**: 현재의 기울기로부터 첫 번째 모멘트를 추정합니다.
   \[
   m_t = \beta_1 m_{t-1} + (1 - \beta_1) g_t
   \]
   여기서 \(g_t\)는 현재의 기울기, \(\beta_1\)는 모멘텀을 조정하는 하이퍼파라미터입니다.

2. **2차 모멘트 추정**: 현재의 기울기의 제곱으로부터 두 번째 모멘트를 추정합니다.
   \[
   v_t = \beta_2 v_{t-1} + (1 - \beta_2) g_t^2
   \]
   \(\beta_2\)는 2차 모멘트의 하이퍼파라미터입니다.

3. **편향 보정**: 초기 단계에서는 \(m_t\)와 \(v_t\)가 0으로 시작되기 때문에 편향을 보정합니다.
   \[
   \hat{m}_t = \frac{m_t}{1 - \beta_1^t}
   \]
   \[
   \hat{v}_t = \frac{v_t}{1 - \beta_2^t}
   \]

4. **파라미터 업데이트**: 최종적으로 파라미터를 업데이트합니다.
   \[
   \theta_{t+1} = \theta_t - \frac{\alpha}{\sqrt{\hat{v}_t} + \epsilon} \hat{m}_t
   \]
   여기서 \(\alpha\)는 학습률, \(\epsilon\)은 0으로 나누는 것을 방지하는 작은 상수입니다.

### Adam의 장점

- 빠르고 효율적인 학습.
- 다양한 문제에서 잘 작동(flagging).
- 적응형 학습률 덕분에 각 파라미터에 대한 최적화 효과가 뛰어남.

### Adam의 단점

- 일반적으로 좋은 성능을 내지만 경우에 따라 큐딩이나 안정성이 떨어질 수 있습니다.
- 하이퍼파라미터 조정이 필요할 수 있습니다.

이렇게 Adam은 딥러닝에서 자주 사용되며, 성능과 효율성을 강조하는 현대적인 최적화 알고리즘으로 자리잡고 있습니다.


## 2. 역할(Role)의 이해
| Role | 설명 | 예시 |
|------|------|------|
| system | 모델의 성격과 역할을 정의 | "너는 데이터 분석 전문가야." |
| user | 사용자의 질문이나 요청 | "데이터 시각화 코드를 작성해줘." |
| assistant | 모델이 생성한 응답 | "다음은 matplotlib을 활용한 코드야..." |



## 3. 프롬프트 엔지니어링 기법
| 기법 | 설명 | 예시 |
|------|------|------|
| 지시형 (Instruction) | 명확한 지시문 형태로 요청 | "Python으로 파일 읽는 코드를 작성해줘." |
| 예시형 (Example-based) | 예시를 통해 출력 패턴 유도 | "입력: 사과 → 출력: Apple" |
| Few-shot | 여러 예시로 패턴 학습 유도 | "입력: 고양이→Cat, 입력: 강아지→Dog" |
| Chain-of-Thought | 단계별 사고 유도 | "단계별로 이유를 설명하면서 답변해줘." |


In [3]:
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {"role": "system", "content": "너는 번역가야."},
        # {"role": "user", "content": "입력: 안녕하세요 → 출력:"}
        {"role": "user", "content": f"입력: {markdown_doc} → 출력:"}
    ]
)
print(response.choices[0].message.content)


Adam (Adaptive Moment Estimation) is one of the widely used optimization algorithms in deep learning. This algorithm is adopted as the default optimization method in many deep learning frameworks due to its lightweight efficiency and outstanding performance.

### Key Features of Adam

1. **Momentum-Based Optimization**:
   - Adam operates by incorporating momentum into the current gradient update based on past gradients. This results in a smoothing effect, allowing for a stable and efficient learning pace.

2. **Adaptive Learning Rate**:
   - Adam adjusts separate learning rates for each parameter. It estimates the first moment (mean) and the second moment (variance) of each parameter’s gradient to decrease the learning rate for parameters that are updated frequently, while increasing it for parameters that are updated less often.

3. **Robustness to Initialization**:
   - This method exhibits relatively good performance with low sensitivity to initial values and learning rates.

### A

In [13]:
Markdown(response.choices[0].message.content)

Adam (Adaptive Moment Estimation) is one of the widely used optimization algorithms in deep learning. Proposed in 2014, Adam provides a lightweight learning rate and helps convergence more quickly and effectively than traditional methods like SGD (Stochastic Gradient Descent).

The main features of Adam are as follows:

1. **Adaptive Learning Rate**: Adam adjusts the learning rate individually for each parameter, allowing for more efficient parameter updates.

2. **Momentum**: Adam incorporates the concept of momentum by considering previous gradients. This enables lightweight updates and reduces the problem of getting stuck in local minima.

3. **Two Exponential Moving Averages**:
   - **First Moment**: Represents the average of the gradients and acts as a type of momentum.
   - **Second Moment**: Represents the average of the squared gradients, reflecting the magnitude of changes for each parameter.

4. **Bias-Correction**: To address the issue of initial momentum estimates being close to zero, Adam employs a bias correction technique to adjust for imbalances in the early stages.

The update formulas for Adam are as follows:

1. \( m_t = \beta_1 m_{t-1} + (1 - \beta_1) g_t \)
2. \( v_t = \beta_2 v_{t-1} + (1 - \beta_2) g_t^2 \)
3. \( \hat{m}_t = \frac{m_t}{1 - \beta_1^t} \)
4. \( \hat{v}_t = \frac{v_t}{1 - \beta_2^t} \)
5. \( \theta_{t+1} = \theta_t - \frac{\eta}{\sqrt{\hat{v}_t} + \epsilon} \hat{m}_t \)

Where:
- \( g_t \) is the gradient at the current step,
- \( m_t \) is the first moment,
- \( v_t \) is the second moment,
- \( \beta_1 \) and \( \beta_2 \) are coefficients typically set to 0.9 and 0.999 for momentum,
- \( \epsilon \) is a small value for numerical stability.

Thus, Adam is effective in solving various types of optimization problems and has become a very popular choice in multiple deep learning models.


## 4. 다양한 프롬프트 스타일 비교
### (1) 지시형 프롬프트


In [4]:

prompt = "인공지능의 장단점을 표로 정리해줘."
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[{"role": "user", "content": prompt}]
)
print(response.choices[0].message.content)


다음은 인공지능의 장단점을 정리한 표입니다.

| 장점                             | 단점                             |
|----------------------------------|----------------------------------|
| 1. **자동화**                   | 1. **고용 감소**                |
| 2. **작업 효율성 향상**         | 2. **높은 초기 비용**           |
| 3. **데이터 분석 및 예측**      | 3. **윤리적 문제**              |
| 4. **24/7 작업 가능**           | 4. **의존성 증가**              |
| 5. **정확성 및 일관성**         | 5. **보안 문제**                |
| 6. **개인화된 서비스 제공**     | 6. **프라이버시 침해 가능성**   |
| 7. **위험한 작업 대체**         | 7. **감정과 창의력 부족**       |

위의 표는 인공지능의 주요 장점과 단점을 간략하게 정리한 것입니다. 각 항목은 더 깊이 있는 논의를 필요로 할 수 있습니다.


In [5]:
Markdown(response.choices[0].message.content)

다음은 인공지능의 장단점을 정리한 표입니다.

| 장점                             | 단점                             |
|----------------------------------|----------------------------------|
| 1. **자동화**                   | 1. **고용 감소**                |
| 2. **작업 효율성 향상**         | 2. **높은 초기 비용**           |
| 3. **데이터 분석 및 예측**      | 3. **윤리적 문제**              |
| 4. **24/7 작업 가능**           | 4. **의존성 증가**              |
| 5. **정확성 및 일관성**         | 5. **보안 문제**                |
| 6. **개인화된 서비스 제공**     | 6. **프라이버시 침해 가능성**   |
| 7. **위험한 작업 대체**         | 7. **감정과 창의력 부족**       |

위의 표는 인공지능의 주요 장점과 단점을 간략하게 정리한 것입니다. 각 항목은 더 깊이 있는 논의를 필요로 할 수 있습니다.

### (2) Few-shot 프롬프트

In [6]:

messages = [
    {"role": "system", "content": "너는 한국어-영어 번역가야."},
    {"role": "user", "content": "입력: 학교 → 출력: school"},
    {"role": "user", "content": "입력: 책 → 출력:"}
]

response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=messages
)
print(response.choices[0].message.content)


book



## 5. 실습 과제
1. 자신이 선택한 직업(예: 데이터 분석가, 마케터, 개발자)에 맞는 system role을 설정해보세요.
2. 3가지 프롬프트 기법(지시형, 예시형, few-shot)을 각각 적용해 보세요.
3. 어떤 방식이 가장 좋은 결과를 주었는지 토의해 봅시다.



## 참고 자료
- [OpenAI Chat Completions API Docs](https://platform.openai.com/docs/api-reference/chat)
- [Prompt Engineering Guide](https://www.promptingguide.ai/)
- [OpenAI Cookbook - Prompt Design](https://github.com/openai/openai-cookbook)
