# 프롬프트 커스터마이징을 통한 응답 형식 제한

## 필요 패키지 및 환경변수 설정

In [None]:
OPENAI_API_KEY= ""

## OpenAI 예시 프롬프트

In [6]:
from openai import OpenAI
client = OpenAI(api_key=OPENAI_API_KEY)

In [7]:
response = client.responses.create(
  model="gpt-4o-mini",
  input=[
    {
      "role": "system",
      "content": [
        {
          "type": "input_text",
          "text": "You will be provided with unstructured data, and your task is to parse it into CSV format."
        }
      ]
    },
    {
      "role": "user",
      "content": [
        {
          "type": "input_text",
          "text": "There are many fruits that were found on the recently discovered planet Goocrux. There are neoskizzles that grow there, which are purple and taste like candy. There are also loheckles, which are a grayish blue fruit and are very tart, a little bit like a lemon. Pounits are a bright green color and are more savory than sweet. There are also plenty of loopnovas which are a neon pink flavor and taste like cotton candy. Finally, there are fruits called glowls, which have a very sour and bitter taste which is acidic and caustic, and a pale orange tinge to them."
        }
      ]
    }
  ],
  temperature=1,
  max_output_tokens=256
)

In [8]:
# 결과 출력
print(response.output_text)

Here's the parsed data in CSV format:

```csv
Fruit,Color,Taste
Neoskizzles,Purple,Candy-like
Loheckles,Grayish Blue,Tart (like lemon)
Pounits,Bright Green,Savory
Loopnovas,Neon Pink,Cotton Candy-like
Glowls,Pale Orange,Sour and Bitter (acidic and caustic)
```


## 프롬프트 커스터마이징 (CSV 파싱)

In [9]:
user_prompt = "한국 사람들이 좋아하는 과일은 사과, 배, 귤, 포도, 수박, 참외, 딸기, 감, 복숭아 같은 것들이 있어요. 계절마다 선호하는 과일이 좀 다른데, 여름엔 수박이나 참외를 많이 먹고, 겨울엔 귤이 인기 많죠. 딸기는 봄철에 특히 많이 찾고, 가을엔 감이나 배를 많이 먹어요. 포도도 여름에서 가을 사이에 인기가 많고, 복숭아도 달콤하고 부드러워서 좋아하는 사람이 많아요. - 출처 : 00뉴스"

In [12]:
response = client.responses.create(
  model="gpt-4o-mini",
  input=[
    {
      "role": "system",
      "content": [
        {
          "type": "input_text",
          "text": "당신은 구조화 되지 않은 데이터를 CSV 형식으로 변환하는 AI입니다. 사용자가 과일에 대한 설명을 제공하면, 과일 이름만 CSV 형식으로 출력해주세요."
        }
      ]
    },
    {
      "role": "user",
      "content": [
        {
          "type": "input_text",
          "text": user_prompt
        }
      ]
    }
  ],
  temperature=1,
  max_output_tokens=256
)


In [13]:
print(response.output_text)

```
사과
배
귤
포도
수박
참외
딸기
감
복숭아
```


## 프롬프트 커스터마이징 (XML 파싱)

In [14]:
response = client.responses.create(
  model="gpt-4o-mini",
  input=[
    {
      "role": "system",
      "content": [
        {
          "type": "input_text",
          "text": "당신은 구조화 되지 않은 데이터를 XML 형식으로 변환하는 AI입니다. 사용자가 과일에 대한 설명을 제공하면, 과일 이름만 XML 형식으로 출력해주세요."
        }
      ]
    },
    {
      "role": "user",
      "content": [
        {
          "type": "input_text",
          "text": user_prompt
        }
      ]
    }
  ],
  temperature=1,
  max_output_tokens=256
)


In [15]:
print(response.output_text)

```xml
<fruits>
    <fruit>사과</fruit>
    <fruit>배</fruit>
    <fruit>귤</fruit>
    <fruit>포도</fruit>
    <fruit>수박</fruit>
    <fruit>참외</fruit>
    <fruit>딸기</fruit>
    <fruit>감</fruit>
    <fruit>복숭아</fruit>
</fruits>
```


In [16]:
print(type(response.output_text))

<class 'str'>


## 프롬프트 커스터마이징 (JSON 파싱)

### 프롬프팅을 통한 JSON 스키마 설정


In [17]:
response = client.responses.create(
  model="gpt-4o-mini",
  input=[
    {
      "role": "system",
      "content": [
        {
          "type": "input_text",
          "text": "당신은 구조화 되지 않은 데이터를 JSON 형식으로 변환하는 AI입니다. 사용자가 과일에 대한 설명을 제공하면, 과일 이름만 JSON 형식으로 출력해주세요."
        }
      ]
    },
    {
      "role": "user",
      "content": [
        {
          "type": "input_text",
          "text": user_prompt
        }
      ]
    }
  ],
  temperature=1,
  max_output_tokens=256
)


In [19]:
print(response.output_text)
print(type(response.output_text))

```json
{
  "과일": [
    "사과",
    "배",
    "귤",
    "포도",
    "수박",
    "참외",
    "딸기",
    "감",
    "복숭아"
  ]
}
```
<class 'str'>


In [None]:
import json

parsed_data = json.loads(response.output_text)

In [20]:
# JSON 파싱 방법 1 – 프롬프트 엔지니어링 (프롬프트 수정)
response = client.responses.create(
  model="gpt-4o-mini",
  input=[
    {
      "role": "system",
      "content": [
        {
          "type": "input_text",
          "text": """당신은 구조화 되지 않은 데이터를 JSON 형식으로 변환하는 AI입니다. 
          사용자가 과일에 대한 설명을 제공하면, 과일 이름만 JSON 형식으로 출력해주세요.
          답변 예시 : 

          {
            "fruits" : ["과일 1", "과일 2", ...]
              }
          절대로 JSON 형식 외에는 어떠한 텍스트도 추가하지 마시오. Markdown을 쓰지 마시오.
          JSON 데이터로만 출력하시오. 답변은 반드시 '{'로 시작하여 '}'로 끝나야 합니다.
          """
        }
      ]
    },
    {
      "role": "user",
      "content": [
        {
          "type": "input_text",
          "text": user_prompt
        }
      ]
    }
  ],
  temperature=1,
  max_output_tokens=256
)

In [21]:
print(response.output_text)

{
  "fruits": ["사과", "배", "귤", "포도", "수박", "참외", "딸기", "감", "복숭아"]
}


In [22]:
print(type(response.output_text))

<class 'str'>


In [25]:
# json.loads
# JSON 형식의 문자열을 파이썬 객체로 변환
# json => dict
import json
parsed_data = json.loads(response.output_text)
print(parsed_data)
print(type(parsed_data))

{'fruits': ['사과', '배', '귤', '포도', '수박', '참외', '딸기', '감', '복숭아']}
<class 'dict'>


In [27]:
# json.dumps
# 파이썬 객체를 JSON 형식의 문자열로 변환
json_data = json.dumps(parsed_data, indent=4, ensure_ascii=False)
print(json_data)
print(type(json_data))

{
    "fruits": [
        "사과",
        "배",
        "귤",
        "포도",
        "수박",
        "참외",
        "딸기",
        "감",
        "복숭아"
    ]
}
<class 'str'>


###  text 입력 파라미터

In [None]:
response = client.responses.create(
    model="gpt-4o-mini",
    input=[
        {
            "role": "system",
            "content": [
                {
                    "type": "input_text",
                    "text": (
                        "당신은 구조화 되지 않은 데이터를 JSON 형식으로 변환하는 AI입니다.\n"
                        "사용자가 과일에 대한 설명을 제공하면, 과일 이름만 JSON 형식으로 출력해주세요."
                    )
                }
            ]
        },
        {
            "role": "user",
            "content": [
                {
                    "type": "input_text",
                    "text": user_prompt
                }
            ]
        }
    ],
    text={
        "format": {
            "type": "json_object"
        }
    },
    temperature=1,
    max_output_tokens=256
)


In [32]:
print(response.output_text)

{
  "과일": [
    "사과",
    "배",
    "귤",
    "포도",
    "수박",
    "참외",
    "딸기",
    "감",
    "복숭아"
  ]
}


In [33]:
# 복잡한 구조의 JSON 파싱 요청
response = client.responses.create(
  model="gpt-4o-mini",
  input=[
    {
      "role": "system",
      "content": [
        {
          "type": "input_text",
          "text": "당신은 구조화 되지 않은 데이터를 JSON 형식으로 변환하는 AI입니다. 사용자가 과일에 대한 설명을 제공하면, 과일 이름과 과일 수, 출처를 JSON 형식으로 추출하세요."
        }
      ]
    },
    {
      "role": "user",
      "content": [
        {
          "type": "input_text",
          "text": user_prompt
        }
      ]
    }
  ],
  text={"format": {"type": "json_object"}},
  temperature=1,
  max_output_tokens=256
)

In [34]:
print(response.output_text)

{
  "과일": [
    {
      "이름": "사과",
      "수": 1,
      "출처": "00뉴스"
    },
    {
      "이름": "배",
      "수": 1,
      "출처": "00뉴스"
    },
    {
      "이름": "귤",
      "수": 1,
      "출처": "00뉴스"
    },
    {
      "이름": "포도",
      "수": 1,
      "출처": "00뉴스"
    },
    {
      "이름": "수박",
      "수": 1,
      "출처": "00뉴스"
    },
    {
      "이름": "참외",
      "수": 1,
      "출처": "00뉴스"
    },
    {
      "이름": "딸기",
      "수": 1,
      "출처": "00뉴스"
    },
    {
      "이름": "감",
      "수": 1,
      "출처": "00뉴스"
    },
    {
      "이름": "복숭아",
      "수": 


### 코드를 통한 JSON 스키마 설정 (베타)

In [35]:
# https://platform.openai.com/docs/guides/structured-outputs?api-mode=chat
from pydantic import BaseModel

In [36]:
# 공식문서 스키마 붙여넣기
class CalendarEvent(BaseModel):
    name: str
    date: str
    participants: list[str]

In [37]:
# API 코드 붙여넣기
completion = client.beta.chat.completions.parse(
    model="gpt-4o-2024-08-06",
    messages=[
        {"role": "system", "content": "Extract the event information."},
        {"role": "user", "content": "Alice and Bob are going to a science fair on Friday."},
    ],
    response_format=CalendarEvent,
)

In [38]:
# 응답 출력
print(completion.choices[0].message.content)

{"name":"Science Fair","date":"Friday","participants":["Alice","Bob"]}


In [39]:
# 나만의 과일 정보 스키마 작성
class FruitInfoJsonFormat(BaseModel):
    fruits : list[str]
    num_of_fruits: int
    ref : str

In [44]:
# 사전에 정의한 스키마(과일, 과일 개수, 출처를 이용한 프롬프팅)을 이용하여 구조화된 JSON 만들기
response = client.beta.chat.completions.parse(
    model="gpt-4o-2024-08-06",
    messages=[
        {"role": "system", "content": "당신은 구조화 되지 않은 data를 Json 형식으로 변환하는 AI입니다. 사용자가 과일에 대한 설명을 제공하면, 과일 이름과 과일 수, 출처를 JSON 형식으로 추출하세요."},
        {"role": "user", "content": user_prompt},
    ],
    response_format=FruitInfoJsonFormat,
)

In [45]:
# 응답 출력
print(response.choices[0].message.content)

{"fruits":["사과","배","귤","포도","수박","참외","딸기","감","복숭아"],"num_of_fruits":9,"ref":"00뉴스"}


In [46]:
print(type(response.choices[0].message.content))

<class 'str'>


In [47]:
import json

# GPT의 응답을 JSON으로 변환
# str -> dict
parsed_data = json.loads(response.choices[0].message.content)

# 변환된 JSON 출력
# dict -> str
json_data = json.dumps(parsed_data, indent=4, ensure_ascii=False)
print(json_data)

{
    "fruits": [
        "사과",
        "배",
        "귤",
        "포도",
        "수박",
        "참외",
        "딸기",
        "감",
        "복숭아"
    ],
    "num_of_fruits": 9,
    "ref": "00뉴스"
}


# OpenAI TTS (시연)

In [48]:
client = OpenAI(api_key=OPENAI_API_KEY)
speech_file_path = "speech3.mp3"

with client.audio.speech.with_streaming_response.create(
    model="gpt-4o-mini-tts",
    voice="alloy",
    input="오늘 소개할 책은 대한민국 최초 노벨상 수상자 한강 작가의 채식주의자입니다!",
    instructions="Speak in a very negative tone",
) as response:
    response.stream_to_file(speech_file_path)