# **GPT API 사용법 드가자**

## API
- Application Programming Interface
- 프로그램과 프로그램이 대화하는 방법
- 다른 서비스나 프로그램의 기능을 네 프로그램에 쉽게 가져다 쓰기 위해 사용

## GPT API
- OpenAI의 GPT 모델을 내 프로그램에서 사용할 수 있도록 제공하는 API
- GPT 모델 종류: gpt-4o, gpt-4o-mini, gpt-3.5-turbo
- 텍스트 생성, 번역, 요약, 질문-답변, 분류 등 지원

In [2]:
# !pip install openai

Collecting openai
  Downloading openai-1.99.1-py3-none-any.whl.metadata (29 kB)
Collecting jiter<1,>=0.4.0 (from openai)
  Downloading jiter-0.10.0-cp312-cp312-win_amd64.whl.metadata (5.3 kB)
Downloading openai-1.99.1-py3-none-any.whl (767 kB)
   ---------------------------------------- 0.0/767.8 kB ? eta -:--:--
   -- ------------------------------------- 41.0/767.8 kB 2.0 MB/s eta 0:00:01
   --------------------------------------  757.8/767.8 kB 12.1 MB/s eta 0:00:01
   ---------------------------------------- 767.8/767.8 kB 9.7 MB/s eta 0:00:00
Downloading jiter-0.10.0-cp312-cp312-win_amd64.whl (206 kB)
   ---------------------------------------- 0.0/206.2 kB ? eta -:--:--
   --------------------------------------- 206.2/206.2 kB 12.2 MB/s eta 0:00:00
Installing collected packages: jiter, openai
Successfully installed jiter-0.10.0 openai-1.99.1


In [12]:
from openai import OpenAI
# 보안 정보를 화면에 표시없이 입력받을 때 사용하는 함수
from getpass import getpass

## 1) API Key 설정
- API Key는 잘못 유출되면 엄청난 금전적 손실을 볼 수 있으므로 감춰서 사용하기
### getpass
- 터미널에 입력한 글자를 화면에 표시하지 않고 안전하게 비밀 값을 입력받을 때 사용
- API 키 받을 때 딱 좋음.


In [14]:
My_API_KEY = getpass.getpass("OpenAi Key: ")

OpenAi Key:  ········


## 2) OpenAI 객체 생성
- client = OpenAI(api_key = My_API_KEY)
  - api_key 매개변수에 getpass()로 입력받은 키를 직접 넣어서 인증
  - 이후 client 객체로 GPT API를 호출할 수 있음.

In [16]:
client = OpenAI(api_key = My_API_KEY)

## 3) GPT 채팅 모델 불러와서 질문 해보기
- .chat.completions.create: OpenAI의 채팅 API 생성
  - .chat: 대화 형식의 프롬프트를 주고받겠다는 뜻
    - GPT는 사실 여러 가지 모드가 있음.
      - 대화(Chat) 모드 → 질문과 대답 주고받기
      - 이미지 모드 → 그림 만들기
      - 오디오 모드 → 음성 만들거나 음성 인식하기
  - .completion(완성하기): 내 프롬프트를 보고 완성(completion)된 답변을 생성해달라는 의미
  - .create: 새 응답을 생성하라는 뜻의 메소드. 서버에 요청을 보내서 GPT 모델이 답을 create 하게 함.
- parameter
  - model: 답변을 생성할 GPT 버전 하나 고르기
  - messages: GPT에게 보내는 대화 내용
    - {role: 'user', ...}: 이건 내가 한 말이라는 뜻
    - {..., content: question}: 내가 하고 싶은 질문
  - max_tokens: GPT가 대답할 때 최대 글자 수 제한. 너무 길게 떠들지 말라는 뜻^^
  - temperature: GPT의 재미, 창의성 정도를 정하는 변수 (0~2)
    - 0: 진지하고 똑같은 대답을 함.
    - 2: 상상력 풍부하고 다양하게 대답함.
    - 0.8이 디폴트임.

In [30]:
question = "Hi! What's up?"

response = client.chat.completions.create(model = "gpt-3.5-turbo",
                                          messages = [{'role':'user','content':question}],
                                          max_tokens = 150,
                                          temperature = 0)
response

ChatCompletion(id='chatcmpl-C1nFFOa0mX4sM2HbyLfVbkFBdSK8v', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content="Hello! I'm just here, ready to chat and help with anything you need. How can I assist you today?", refusal=None, role='assistant', annotations=[], audio=None, function_call=None, tool_calls=None))], created=1754543661, model='gpt-3.5-turbo-0125', object='chat.completion', service_tier='default', system_fingerprint=None, usage=CompletionUsage(completion_tokens=24, prompt_tokens=13, total_tokens=37, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=0, audio_tokens=0, reasoning_tokens=0, rejected_prediction_tokens=0), prompt_tokens_details=PromptTokensDetails(audio_tokens=0, cached_tokens=0)))

In [32]:
type(response)

openai.types.chat.chat_completion.ChatCompletion

## 4) 답변 꺼내기
- response에는 GPT가 보내준 모든 정보가 들어있음. GPT의 대답, 대답 만든 시간, 대답 길이 등 메타데이터가 다 들어있음.
- response.id
  - 요청·응답에 붙는 고유 id번호
  - 로그 남기기, 디버깅(문제 생겼을 때 찾기)할 때 유용
- response.choices
  - 모델이 만든 답 후보들의 리스트
  - 옵션에 따라 여러 개의 답을 한 번에 뽑을 수도 있어서
- response.choices[0].message
  - 첫 번째 답의 본문 객체
  - role, content가 안에 있는데, content에 답변이 있음!!!✨
- response.choices[0].message.role
  - 모델이 응답할 때 role은 항상 assistant로 출력됨.
  - 우리가 질문할 때는 user로 질문해야함.
- response.choices[0].message.content: 내가 한 질문에 대한 GPT의 답변

In [34]:
response.id

'chatcmpl-C1nFFOa0mX4sM2HbyLfVbkFBdSK8v'

In [36]:
response.choices # 리스트 형태

[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content="Hello! I'm just here, ready to chat and help with anything you need. How can I assist you today?", refusal=None, role='assistant', annotations=[], audio=None, function_call=None, tool_calls=None))]

In [40]:
response.choices[0].message

ChatCompletionMessage(content="Hello! I'm just here, ready to chat and help with anything you need. How can I assist you today?", refusal=None, role='assistant', annotations=[], audio=None, function_call=None, tool_calls=None)

In [42]:
response.choices[0].message.role # 계속 .으로 접근

'assistant'

In [44]:
response.choices[0].message.content # 응답 텍스트 출력

"Hello! I'm just here, ready to chat and help with anything you need. How can I assist you today?"

## ⚠️자주 발생하는 코드 에러
- RateLimitError: 이제 그만! 오늘 쓸 수 있는 코인을 다 썼어!!!
  - API 크레딧 사용 한도를 초과한 경우
  - API는 하루나 1분 단위로 부를 수 있는 횟수 또는 쓸 수 있는 크레딧 양이 정해져 있음.
  - 해결방법: 시간이 지나서 한도가 초기화될 때까지 기다리기, API 호출 횟수 줄이기
- InvalidRequestError: GPT한테 보낸 요청 내용에 오류가 있을 때
  - 모델 이름을 잘못 썼다던가 메세지 형식이 잘못되었다던가...
- APIConnectionError: 전화가 안 터져서 연결이 안 돼
  - API서버와의 연결 문제를 발생한 경우 ex) 인터넷이 끊김. 서버가 잠시 다운 됨.
  - 해결방법: 인터넷 연결 확인, 잠시 후 다시 시도
- OpenAIError: 정확히는 모르겠지만 에러가 남.
  - 기타 openai 라이브러리 사용시 발생하는 에러

In [57]:
question = "What's SSE, SSR, SST???"

response = client.chat.completions.create(model = "gpt-3.5-turbo",
                                          messages = [{'role':'user','content':question}],
                                          temperature = 0)
print(response.choices[0].message.content)

SSE, SSR, and SST are terms commonly used in statistics to describe the variation in a dataset.

1. SSE (Sum of Squared Errors): SSE is a measure of the variation within a dataset that is not explained by a statistical model. It is calculated by summing the squared differences between the observed values and the predicted values from the model.

2. SSR (Sum of Squared Regression): SSR is a measure of the variation in a dataset that is explained by a statistical model. It is calculated by summing the squared differences between the predicted values from the model and the mean of the observed values.

3. SST (Total Sum of Squares): SST is the total variation in a dataset and is calculated by summing the squared differences between the observed values and the mean of the observed values. It is equal to the sum of SSE and SSR.

These terms are commonly used in regression analysis to assess the goodness of fit of a model and to determine how much of the variation in the data can be explaine

In [59]:
# 없는 데이터에 대한 요청
question = "Can you visualize last year's sales data???"

response = client.chat.completions.create(model = "gpt-3.5-turbo",
                                          messages = [{'role':'user','content':question}],
                                          temperature = 0)
print(response.choices[0].message.content)

I'm sorry, but as an AI language model, I do not have the ability to visualize data. However, I can help analyze and interpret data if you provide me with the necessary information.


In [61]:
# 없는 데이터에 대한 요청
question = "Can you visualize last year's sales data???"

response = client.chat.completions.create(model = "gpt-4o", # 상위 모델의 성능이 뛰어남!!
                                          messages = [{'role':'user','content':question}],
                                          temperature = 0)
print(response.choices[0].message.content)
# 현재는 ChatGPT 서비스를 이용하는 게 아니라 API로 로컬에서 동작시키기 때문에 직접 시각화된 이미지가 나오지는 않고 코드로 제공함.

I'm unable to visualize data directly as I don't have access to external databases or files, and I can't create visual content. However, I can guide you on how to visualize your sales data using tools like Microsoft Excel, Google Sheets, or data visualization software like Tableau or Power BI.

Here's a basic guide on how you can visualize sales data using Excel:

1. **Organize Your Data**: Ensure your sales data is organized in a spreadsheet with columns for relevant information such as Date, Product, Sales Amount, Region, etc.

2. **Select Your Data**: Highlight the data you want to visualize.

3. **Insert a Chart**:
   - Go to the "Insert" tab in Excel.
   - Choose the type of chart that best represents your data. Common choices for sales data include Line Charts (for trends over time), Bar Charts (for comparing categories), or Pie Charts (for showing proportions).

4. **Customize Your Chart**:
   - Add titles and labels to make your chart easy to understand.
   - Use different colo

In [67]:
# 없는 데이터에 대한 요청
question = "What major factors are there that leads people to unsucscribe platforms like Netflix???"

response = client.chat.completions.create(model = "gpt-3.5-turbo",
                                          messages = [{'role':'user','content':question}],
                                          temperature = 0)
print(response.choices[0].message.content)

1. Cost: One of the major factors that leads people to unsubscribe from platforms like Netflix is the cost. As subscription fees continue to rise, some users may find it difficult to justify the expense, especially if they are not using the platform frequently or if they can find similar content for free elsewhere.

2. Lack of content: Another reason people may unsubscribe from platforms like Netflix is if they feel that the content available is not worth the subscription fee. If users are not finding shows or movies that interest them, they may choose to cancel their subscription and look for entertainment elsewhere.

3. Competition: With the rise of other streaming platforms like Amazon Prime, Hulu, Disney+, and HBO Max, users may choose to unsubscribe from Netflix in favor of a different platform that offers content they prefer or that is more affordable.

4. Technical issues: If users experience frequent technical issues such as buffering, poor video quality, or difficulty navigati

## 입력된 파일에 대한 분석 요청

In [22]:
# 파일 위치를 data 매개변수에, 질문을 question에, 모델명을 model에 넣기
def analysis_data(data, question, model):
    prompt = f"Data: {data}, Question: {question}" # data에는 파일 경로가 들어감.
    response = client.chat.completions.create(model = model,
                                          messages = [{'role':'user','content':prompt}],
                                          temperature = 0)
    return response.choices[0].message.content

In [24]:
data = "data/bmi_500.csv"
question = """This is a csv file that contains height, weight, gender, label(bmi data) of 500 people.
I want you to tell me number of people of each labels from 'Extremely Weak' to 'Extreme Obesity'."""
model = "gpt-4o"

result = analysis_data(data, question, model)
print(result)

To determine the number of people in each BMI category from the CSV file `bmi_500.csv`, you would typically need to load the data and then count the occurrences of each label. Since I can't directly access files, I'll guide you on how to do this using Python with the pandas library:

1. **Load the CSV file**: Use pandas to read the CSV file into a DataFrame.
2. **Count the occurrences of each label**: Use the `value_counts()` function to count how many times each label appears.

Here's a sample code snippet to achieve this:

```python
import pandas as pd

# Load the CSV file into a DataFrame
df = pd.read_csv('data/bmi_500.csv')

# Count the occurrences of each label
label_counts = df['label'].value_counts()

# Print the counts for each label
print(label_counts)
```

This code will output the number of people in each BMI category, assuming the column containing the BMI labels is named 'label'. If the column name is different, you should replace `'label'` with the correct column name. Th

## Recap
- API로 만든 프로그램을 각자 자기 컴퓨터에서 실행한다고 했을 때, 사람마다 설치된 파이썬 버전, 라이브러리, 운영체제, 화면 환경이 다르기 때문에, 시각화(그래프, 차트) 같은 걸 보여주는 코드를 모든 환경에서 돌아갈 수 있는 형태로 짜서 공유하는 경우가 많다.\
➡️누구나 쓸 수 있는 표준 코드로 만들어야 한다.
- ChapGPT 웹 버전 3.5 무료 버전은 파일 입력 기능이 없지만, GPT API의 3.5버전은 로컬 pc의 파일을 읽어올 수 있음.
- gpt-4나 gpt-4o처럼 상위 버전 모델이 보통 더 똑똑하고 답변 품질이 좋지만, AI모든 응답이 정확성을 담보로 하지 않기 때문에 100% 믿으면 안 됨.