# OpenAI: ChatCompletion

In [7]:
#!pip install python-dotenv

In [1]:
from openai import OpenAI
from dotenv import load_dotenv
import os

load_dotenv()
client = OpenAI(api_key=os.getenv("OPENAI_API_KEY"))

## Client 생성

- `client` 는 OpenAI 모듈로 생성된 인스턴스 입니다.

[주의] 아래의 코드에서 오류가 난다면 API 키의 오류일 가능성이 높습니다.


In [2]:
from openai import OpenAI 

MODEL="gpt-4o-mini"
client = OpenAI()
client

<openai.OpenAI at 0x7ff38a213750>

## ChatCompletions

- API Reference: https://platform.openai.com/docs/api-reference/chat

In [3]:
completion = client.chat.completions.create(
    model=MODEL,
    messages=[
        {
            "role": "system",
            "content": "당신은 Python 프로그래머입니다.",
        },
        {
            "role": "user",
            "content": "2차 방정식을 생성하는 Python 프로그램을 코딩해주세요.",
        },
    ],
)

In [4]:
print(completion.choices[0].message.content)

아래는 사용자로부터 계수 \( a \), \( b \), \( c \)를 입력받아 2차 방정식 \( ax^2 + bx + c = 0 \)을 생성하고 그 방정식의 해를 계산하는 Python 프로그램입니다.

```python
import math

# 2차 방정식의 계수 입력
def get_coefficients():
    print("2차 방정식의 계수를 입력하세요.")
    a = float(input("a: "))
    b = float(input("b: "))
    c = float(input("c: "))
    return a, b, c

# 2차 방정식의 해 구하기
def solve_quadratic(a, b, c):
    discriminant = b**2 - 4*a*c
    if discriminant > 0:
        root1 = (-b + math.sqrt(discriminant)) / (2*a)
        root2 = (-b - math.sqrt(discriminant)) / (2*a)
        return (root1, root2)
    elif discriminant == 0:
        root = -b / (2*a)
        return (root,)
    else:
        return None

def main():
    a, b, c = get_coefficients()
    if a == 0:
        print("a는 0이 될 수 없습니다. 2차 방정식이 아닙니다.")
        return
        
    roots = solve_quadratic(a, b, c)
    
    if roots is None:
        print("실수 해가 존재하지 않습니다.")
    elif len(roots) == 1:
        print(f"유일한 해: x = {roots[0]}")
    else:
        print(f"두 개의 해: x1 = {

## 스트리밍(Streaming)

In [5]:
from openai import OpenAI

completion = client.chat.completions.create(
    model=MODEL,
    messages=[
        {
            "role": "system",
            "content": "당신은 Python 프로그래머입니다.",
        },
        {
            "role": "user",
            "content": "2차 방정식을 생성하는 Python 프로그램을 코딩해주세요.",
        },
    ],
    stream=True,  # 스트림 모드 활성화
)

final_answer = []

# 스트림 모드에서는 completion.choices 를 반복문으로 순회
for chunk in completion:
    # chunk 를 저장
    chunk_content = chunk.choices[0].delta.content
    # chunk 가 문자열이면 final_answer 에 추가
    if isinstance(chunk_content, str):
        final_answer.append(chunk_content)
        # 토큰 단위로 실시간 답변 출력
        print(chunk_content, end="")

2차 방정식을 생성하는 Python 프로그램을 작성해보겠습니다. 2차 방정식은 일반적으로 \( ax^2 + bx + c = 0 \)의 형태를 가지며, 여기서 \( a \), \( b \), \( c \)는 실수입니다. 사용자가 값을 입력하도록 하여 해당 방정식을 생성할 수 있도록 하겠습니다.

아래는 Python 코드입니다:

```python
def main():
    print("2차 방정식 생성기")
    
    # 사용자가 a, b, c 값을 입력합니다.
    a = float(input("a의 값을 입력하세요 (a ≠ 0): "))
    # a가 0이면 2차 방정식이 아닙니다.
    while a == 0:
        print("a의 값은 0이 될 수 없습니다. 다시 입력하세요.")
        a = float(input("a의 값을 입력하세요 (a ≠ 0): "))
    
    b = float(input("b의 값을 입력하세요: "))
    c = float(input("c의 값을 입력하세요: "))
    
    # 방정식 표현
    equation = f"{a}x^2 + {b}x + {c} = 0"
    
    print("생성된 2차 방정식은 다음과 같습니다:")
    print(equation)

if __name__ == "__main__":
    main()
```

### 사용 방법:
1. 코드를 실행하면, 프로그램이 2차 방정식의 계수 \( a \), \( b \), \( c \)를 입력하도록 요구합니다.
2. 사용자로부터 입력받은 값을 바탕으로 2차 방정식을 문자열로 생성합니다.
3. 생성된 방정식을 콘솔에 출력합니다.

이 프로그램은 기본적인 형태의 2차 방정식을 생성하는 기능을 제공합니다. 필요에 따라 추가적인 기능(예: 방정식의 해를 구하기 등)을 통합할 수 있습니다.

In [6]:
# 전체 답변인 final_answer 를 문자열로 변환하여 출력
final_answer = "".join(final_answer)
print(final_answer)

2차 방정식을 생성하는 Python 프로그램을 작성해보겠습니다. 2차 방정식은 일반적으로 \( ax^2 + bx + c = 0 \)의 형태를 가지며, 여기서 \( a \), \( b \), \( c \)는 실수입니다. 사용자가 값을 입력하도록 하여 해당 방정식을 생성할 수 있도록 하겠습니다.

아래는 Python 코드입니다:

```python
def main():
    print("2차 방정식 생성기")
    
    # 사용자가 a, b, c 값을 입력합니다.
    a = float(input("a의 값을 입력하세요 (a ≠ 0): "))
    # a가 0이면 2차 방정식이 아닙니다.
    while a == 0:
        print("a의 값은 0이 될 수 없습니다. 다시 입력하세요.")
        a = float(input("a의 값을 입력하세요 (a ≠ 0): "))
    
    b = float(input("b의 값을 입력하세요: "))
    c = float(input("c의 값을 입력하세요: "))
    
    # 방정식 표현
    equation = f"{a}x^2 + {b}x + {c} = 0"
    
    print("생성된 2차 방정식은 다음과 같습니다:")
    print(equation)

if __name__ == "__main__":
    main()
```

### 사용 방법:
1. 코드를 실행하면, 프로그램이 2차 방정식의 계수 \( a \), \( b \), \( c \)를 입력하도록 요구합니다.
2. 사용자로부터 입력받은 값을 바탕으로 2차 방정식을 문자열로 생성합니다.
3. 생성된 방정식을 콘솔에 출력합니다.

이 프로그램은 기본적인 형태의 2차 방정식을 생성하는 기능을 제공합니다. 필요에 따라 추가적인 기능(예: 방정식의 해를 구하기 등)을 통합할 수 있습니다.


## 연쇄적인 대화


In [7]:
completion = client.chat.completions.create(
    model=MODEL,
    messages=[
        {
            "role": "system",
            "content": "You are a helpful assistant. You must answer in Korean.",
        },
        {
            "role": "user",
            "content": "대한민국의 광역시를 모두 알려줘?",
        },
    ],
)

print(completion.choices[0].message.content)

대한민국의 광역시는 총 6곳입니다. 이들은 다음과 같습니다:

1. 서울특별시
2. 부산광역시
3. 대구광역시
4. 인천광역시
5. 광주광역시
6. 대전광역시

이 외에도 울산광역시가 있는데, 규정상 울산은 광역시로 분류됩니다. 이를 포함하면 총 7개의 광역시가 됩니다.


In [8]:
def question(prompt):
    completion = client.chat.completions.create(
        model=MODEL,
        messages=[
            {
                "role": "system",
                "content": "You are a helpful assistant. You must answer in Korean.",
            },
            {
                "role": "user",
                "content": prompt,  # 사용자의 질문을 입력
            },
        ],
    )
    # 답변을 반환
    return completion.choices[0].message.content

In [9]:
# 첫 번째 질문
question("대한민국의 광역시를 모두 알려줘")

'대한민국의 광역시는 다음과 같습니다:\n\n1. 서울특별시\n2. 부산광역시\n3. 인천광역시\n4. 대구광역시\n5. 대전광역시\n6. 울산광역시\n7. 광주광역시\n8. 세종특별자치시\n\n이상입니다.'

In [10]:
# 두 번째 질문
question("영어로 답변해줄래")

'죄송하지만, 한국어로만 답변해 드릴 수 있습니다. 어떤 질문이든지 말씀해 주세요!'

위의 답변에서 보듯이, GPT가 **다음 질문에 대한 답변을 잘못했습니다.** 이는 이전 대화내용에 대한 **저장을 하지 않았기 때문** 입니다.

이를 해결하기 위해, 대화의 연속성을 유지하는 로직을 추가해야 합니다. 대화의 각 부분(사용자의 질문과 AI의 응답)을 messages 리스트에 순차적으로 추가함으로써, 챗봇은 이전의 대화 내용을 참조하여 적절한 답변을 생성할 수 있습니다.


In [11]:
completion = client.chat.completions.create(
    model=MODEL,
    messages=[
        {
            "role": "system",
            "content": "You are a helpful assistant. You must answer in Korean.",
        },
        {
            "role": "user",
            "content": "대한민국의 광역시를 모두 알려줘?",  # 첫 번째 질문
        },
        {
            "role": "assistant",
            "content": "대한민국의 광역시는 총 6곳입니다.",  # 첫 번째 답변
        },
        {
            "role": "user",
            "content": "이전의 답변을 영어로 번역해 주세요.",  # 두 번째 질문
        },
    ],
)

# 두 번째 답변을 출력
print(completion.choices[0].message.content)

There are a total of 6 metropolitan cities in South Korea.


## 사용자 정의 함수

In [12]:
def question(prompt, history=[], model=MODEL):
    if len(history) == 0:
        # 최초 질문
        history.append(
            {
                "role": "system",
                "content": "You are a helpful assistant. You must answer in Korean.",
            }
        )

    # 사용자 질문 추가
    history.append(
        {
            "role": "user",
            "content": prompt,
        },
    )

    # GPT에 질문을 전달하여 답변을 생성
    completion = client.chat.completions.create(
        model=model,
        messages=history,
    )

    # 사용자 질문에 대한 답변을 추가
    history.append(
        {"role": "assistant", "content": completion.choices[0].message.content}
    )

    return history

In [13]:
# 최초 질문
history = question(
    "엔트로피에서 확율에 대하여 설명해줄래", 
    history=[]
)

# 최초 답변
print(history[-1])

{'role': 'assistant', 'content': '엔트로피는 정보 이론에서 중요한 개념으로, 주어진 확률 분포에 대한 불확실성 또는 난이도를 정량적으로 측정합니다. 주로 클로드 섀넌(Claude Shannon)이 개발한 개념으로, 시스템이나 데이터 집합의 무작위성과 정보량을 평가하는 데 사용됩니다.\n\n확률과 엔트로피의 관계를 이해하기 위해서는 다음의 두 가지 주요 개념을 알아야 합니다.\n\n1. **확률 분포**: 확률 분포는 특정 사건이 발생할 가능성을 나타내는 함수입니다. 예를 들어, 동전을 던질 때 앞면이 나올 확률이 0.5, 뒷면이 나올 확률이 0.5인 경우, 이 이벤트의 확률 분포는 동전의 두 면 간의 균등한 확률로 설명됩니다.\n\n2. **엔트로피 계산**: 주어진 확률 분포 \\( P(X) \\)에 대해 엔트로피 \\( H(X) \\)는 다음과 같이 정의됩니다:\n\n   \\[\n   H(X) = - \\sum_{i} P(x_i) \\log P(x_i)\n   \\]\n\n   여기서 \\( x_i \\)는 가능한 사건을 나타내고, \\( P(x_i) \\)는 해당 사건의 발생 확률입니다. 로그는 일반적으로 밑이 2인 로그를 사용하여 정보량을 비트 단위로 측정합니다.\n\n이 식에서 볼 수 있듯이, 확률이 낮은 사건은 엔트로피에 더 큰 기여를 하며, 확률이 높은 사건은 적은 기여를 합니다. 따라서 엔트로피는 사건의 확률이 클수록 정보량이 적고, 확률이 작을수록 정보량이 많다는 것을 의미합니다. \n\n요약하자면, 엔트로피는 확률을 통해 특정 시스템의 불확실성과 정보를 측정하는 데 필수적인 도구입니다. 확률이 높을수록 더 예측 가능하여 엔트로피는 낮아지고, 확률이 낮을수록 예측 불가능하여 엔트로피는 높아집니다.'}


In [14]:
history

[{'role': 'system',
  'content': 'You are a helpful assistant. You must answer in Korean.'},
 {'role': 'user', 'content': '엔트로피에서 확율에 대하여 설명해줄래'},
 {'role': 'assistant',
  'content': '엔트로피는 정보 이론에서 중요한 개념으로, 주어진 확률 분포에 대한 불확실성 또는 난이도를 정량적으로 측정합니다. 주로 클로드 섀넌(Claude Shannon)이 개발한 개념으로, 시스템이나 데이터 집합의 무작위성과 정보량을 평가하는 데 사용됩니다.\n\n확률과 엔트로피의 관계를 이해하기 위해서는 다음의 두 가지 주요 개념을 알아야 합니다.\n\n1. **확률 분포**: 확률 분포는 특정 사건이 발생할 가능성을 나타내는 함수입니다. 예를 들어, 동전을 던질 때 앞면이 나올 확률이 0.5, 뒷면이 나올 확률이 0.5인 경우, 이 이벤트의 확률 분포는 동전의 두 면 간의 균등한 확률로 설명됩니다.\n\n2. **엔트로피 계산**: 주어진 확률 분포 \\( P(X) \\)에 대해 엔트로피 \\( H(X) \\)는 다음과 같이 정의됩니다:\n\n   \\[\n   H(X) = - \\sum_{i} P(x_i) \\log P(x_i)\n   \\]\n\n   여기서 \\( x_i \\)는 가능한 사건을 나타내고, \\( P(x_i) \\)는 해당 사건의 발생 확률입니다. 로그는 일반적으로 밑이 2인 로그를 사용하여 정보량을 비트 단위로 측정합니다.\n\n이 식에서 볼 수 있듯이, 확률이 낮은 사건은 엔트로피에 더 큰 기여를 하며, 확률이 높은 사건은 적은 기여를 합니다. 따라서 엔트로피는 사건의 확률이 클수록 정보량이 적고, 확률이 작을수록 정보량이 많다는 것을 의미합니다. \n\n요약하자면, 엔트로피는 확률을 통해 특정 시스템의 불확실성과 정보를 측정하는 데 필수적인 도구입니다. 확률이 높을수록 더 예측 가능하여 엔트로피는 낮아지고, 확률이 낮

In [15]:
# 두 번째 질문
history = question(
    "이전의 내용을 영어로 답변해줄래.", 
    history=history
)
# 두 번째 답변
print(history[-1])

{'role': 'assistant', 'content': 'Sure! Here’s the explanation in English:\n\nEntropy is an important concept in information theory that quantitatively measures the uncertainty or difficulty of a given probability distribution. It was primarily developed by Claude Shannon and is used to evaluate randomness and the amount of information in a system or dataset.\n\nTo understand the relationship between probability and entropy, we need to consider two main concepts:\n\n1. **Probability Distribution**: A probability distribution is a function that describes the likelihood of particular outcomes. For instance, when flipping a coin, if the probability of heads is 0.5 and the probability of tails is also 0.5, this event has a uniform probability distribution between the two sides of the coin.\n\n2. **Entropy Calculation**: For a given probability distribution \\( P(X) \\), the entropy \\( H(X) \\) is defined as follows:\n\n   \\[\n   H(X) = - \\sum_{i} P(x_i) \\log P(x_i)\n   \\]\n\n   Here, 

In [16]:
history

[{'role': 'system',
  'content': 'You are a helpful assistant. You must answer in Korean.'},
 {'role': 'user', 'content': '엔트로피에서 확율에 대하여 설명해줄래'},
 {'role': 'assistant',
  'content': '엔트로피는 정보 이론에서 중요한 개념으로, 주어진 확률 분포에 대한 불확실성 또는 난이도를 정량적으로 측정합니다. 주로 클로드 섀넌(Claude Shannon)이 개발한 개념으로, 시스템이나 데이터 집합의 무작위성과 정보량을 평가하는 데 사용됩니다.\n\n확률과 엔트로피의 관계를 이해하기 위해서는 다음의 두 가지 주요 개념을 알아야 합니다.\n\n1. **확률 분포**: 확률 분포는 특정 사건이 발생할 가능성을 나타내는 함수입니다. 예를 들어, 동전을 던질 때 앞면이 나올 확률이 0.5, 뒷면이 나올 확률이 0.5인 경우, 이 이벤트의 확률 분포는 동전의 두 면 간의 균등한 확률로 설명됩니다.\n\n2. **엔트로피 계산**: 주어진 확률 분포 \\( P(X) \\)에 대해 엔트로피 \\( H(X) \\)는 다음과 같이 정의됩니다:\n\n   \\[\n   H(X) = - \\sum_{i} P(x_i) \\log P(x_i)\n   \\]\n\n   여기서 \\( x_i \\)는 가능한 사건을 나타내고, \\( P(x_i) \\)는 해당 사건의 발생 확률입니다. 로그는 일반적으로 밑이 2인 로그를 사용하여 정보량을 비트 단위로 측정합니다.\n\n이 식에서 볼 수 있듯이, 확률이 낮은 사건은 엔트로피에 더 큰 기여를 하며, 확률이 높은 사건은 적은 기여를 합니다. 따라서 엔트로피는 사건의 확률이 클수록 정보량이 적고, 확률이 작을수록 정보량이 많다는 것을 의미합니다. \n\n요약하자면, 엔트로피는 확률을 통해 특정 시스템의 불확실성과 정보를 측정하는 데 필수적인 도구입니다. 확률이 높을수록 더 예측 가능하여 엔트로피는 낮아지고, 확률이 낮

이번에는 이전 대화내용을 `history` 에 저장하여 전달하였습니다. 이전 대화내용을 저장하면서 `history` 를 통해 대화를 이어나갈 수 있습니다.


## Parser: json_object 답변

In [17]:
completion = client.chat.completions.create(
    model=MODEL,
    messages=[
        {
            "role": "system",
            # 답변 형식을 JSON 으로 받기 위해 프롬프트에 JSON 형식을 지정
            "content": "You are a helpful assistant designed to output JSON. You must answer in Korean.",
        },
        {
            "role": "user",
            "content": "대한민국의 광역시를 모두 알려줘.",
        },
    ],
    response_format={"type": "json_object"},  # 답변 형식을 JSON 으로 지정
)

print(completion.choices[0].message.content)

{
  "광역시": [
    "서울특별시",
    "부산광역시",
    "대구광역시",
    "인천광역시",
    "광주광역시",
    "대전광역시",
    "울산광역시"
  ]
}


In [18]:
response = client.chat.completions.create(
    model=MODEL,
    response_format={"type": "json_object"},
    messages=[
        {
            "role": "system",
            "content": "You are a helpful assistant designed to output JSON.",
        },
        {
            "role": "user",
            "content": "딥러닝에 대한 문제를 5지 선다형으로 만들어줘.",
        },
    ],
    temperature=0.5,
    max_tokens=300,
)
print(response.choices[0].message.content)

{
  "questions": [
    {
      "question": "딥러닝에서 '신경망'이란 무엇을 의미하는가?",
      "options": [
        "A. 데이터의 전처리 방법",
        "B. 기계 학습의 한 종류",
        "C. 인간의 뇌 구조를 모방한 알고리즘",
        "D. 데이터베이스 관리 시스템",
        "E. 통계 분석 기법"
      ],
      "answer": "C"
    },
    {
      "question": "딥러닝에서 '과적합'이란 어떤 상황을 의미하는가?",
      "options": [
        "A. 모델이 학습 데이터에 너무 잘 맞추어져 일반화 능력이 떨어지는 현상",
        "B. 모델이 학습 데이터와 테스트 데이터 모두에 잘 맞는 상태",
        "C. 모델이 학습 데이터에 전혀 맞지 않는 상태",
        "D. 모델의 학습 속도가 느린 현상",
        "E. 모델이 너무 간단하여 복잡한 데이터를 처리하지 못하는 현상"
      ],
      "answer": "A"
    },
    {
      "question": "딥러닝에서 '활성화 함수'의 주된 목적은 무엇인가?",
      "options": [
        "A. 입력 데이터를 정규화하기 위함",
        "B. 신경망의 비선


In [19]:
response = client.chat.completions.create(
    model=MODEL,
    response_format={"type": "json_object"},
    messages=[
        {
            "role": "system",
            "content": "You are a helpful assistant designed to output JSON.",
        },
        {
            "role": "user",
            "content": "딥러닝에 대한 5지 선다형 객관식 문제를 만들어줘. 정답은 index 번호로 알려줘."
            "난이도는 [상, 중, 하] 중 하나로 표기해줘.",
        },
    ],
    temperature=0.5,
    max_tokens=300,
    n=5,
)

In [20]:
for res in response.choices:
    print(res.message.content)

{
  "questions": [
    {
      "question": "딥러닝에서 '오버피팅(overfitting)'이란 무엇을 의미하는가?",
      "options": [
        "모델이 훈련 데이터에 너무 잘 맞춰져서 새로운 데이터에 대한 일반화 성능이 떨어지는 현상",
        "모델이 훈련 데이터와 검증 데이터 모두에 대해 성능이 좋지 않은 현상",
        "모델이 훈련 데이터에 대해 성능이 나쁘지만 새로운 데이터에 대해서는 좋은 성능을 보이는 현상",
        "모델이 훈련 데이터의 일부만 학습하는 현상",
        "모델이 훈련 과정에서 너무 많은 학습을 하여 성능이 저하되는 현상"
      ],
      "answer": 0,
      "difficulty": "중"
    },
    {
      "question": "CNN(Convolutional Neural Network)의 주된 용도는 무엇인가?",
      "options": [
        "자연어 처리",
        "이미지 인식 및 처리",
        "시계열 데이터 분석",
        "강화 학습",
        "클러스터링"
      ],
      "answer": 1,
      "difficulty": "하"
    },
    {
      "question": "딥러닝에서 '활성화 함수'의 역할은 무엇인가?",
      "options":
{"questions":[{"question":"딥러닝에서 '과적합(overfitting)'을 방지하기 위한 일반적인 방법은 무엇인가요?","options":["데이터 증강(data augmentation)","모델의 복잡성 증가","학습률을 높인다","배치 정규화(batch normalization) 사용","훈련 데이터의 양을 줄인다"],"answer":0,"difficulty":"중"},{"question":"다음 중 CNN(합성곱 신경망)의 주요 구성 요소는