## Open Ai에서 지원하는 GPT API 사용실습

In [7]:
!pip install openai



In [15]:
from openai import OpenAI
from getpass import getpass #보안정보를 화면에 표시없이 입력받을 때 사용하는 모델

## API Key 설정
- API key는 보안상 겉으로 보이지 않는 것이 좋으므로 감춰서 사용하자

In [None]:
#개인의 API Key를 입력
MY_API_KEY = getpass('OpenAI API key:')


In [25]:
# OpenAI 객체 생성
client = OpenAI(api_key=MY_API_KEY)

## GPT모델 불러와서 일반적인 질의

In [37]:
#GPT에게 입력해줄 텍스트 작성
question = "안녕? 오늘 피크닉 가기 좋은 날씨네!"

#chat.completions.create : OpenAI의 채팅 API를 생성하는 함
response = client.chat.completions.create(model= 'gpt-3.5-turbo',
                                             #messages: 질의에 대한 정보를 설정하는 매개변수
                                            #role은 system, user, assistant 중 하나로 지정 가능(system에는 사용자의 질의가 입력되기 전 모델에게 숙지시켜놓는 대전제가 됨)
                                            
                                          messages= [{'role': 'user', 'content':question}],
                                             #max_tokens: 모델이 생성할 응답의 최대 토큰 수 지정
                                          max_tokens= 150,
                                             #temperature: 응답의 창의성 정도 설정(디폴트는 0.7, 0~2사이의 실수값으로 조정, 0은 항상 일관된 값, 2는 창의적 응답)
                                          temperature=0
                                         )
                                            

In [38]:
response


ChatCompletion(id='chatcmpl-AwkHEQe1nFqsCx9x0B99zP9OE7e2f', choices=[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='네, 날씨가 좋아서 피크닉하기 딱 좋은 날이네요! 즐거운 시간 보내세요!', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None))], created=1738564276, model='gpt-3.5-turbo-0125', object='chat.completion', service_tier='default', system_fingerprint=None, usage=CompletionUsage(completion_tokens=44, prompt_tokens=34, total_tokens=78, completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=0, audio_tokens=0, reasoning_tokens=0, rejected_prediction_tokens=0), prompt_tokens_details=PromptTokensDetails(audio_tokens=0, cached_tokens=0)))

In [40]:
type(response)

openai.types.chat.chat_completion.ChatCompletion

## ChatCompletion 객체에는 사용자의 요청과 모델의 응답에 대한 정보가 담겨져 있음
- content에 실제 텍스트 응답이 있으며, role에는 역할, model에는 사용된 모델명, usage에는 토큰 사용량에 대한 정보가 담겨져 있음
- 모델이 응답할 때 role은 항상 assistant로 출력됨(우리가 질의할때는 user로 질의해야함)
- usage에 prompt_tokens은 입력토큰(질의)의 수, completion_tokens는 출력토큰(응답)의 수가 됨

In [42]:
response.id #문자열출력

'chatcmpl-AwkHEQe1nFqsCx9x0B99zP9OE7e2f'

In [44]:
response.choices #리스트출력

[Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='네, 날씨가 좋아서 피크닉하기 딱 좋은 날이네요! 즐거운 시간 보내세요!', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None))]

In [50]:
response.choices[0]

Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='네, 날씨가 좋아서 피크닉하기 딱 좋은 날이네요! 즐거운 시간 보내세요!', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None))

In [53]:
response.choices[0].message

ChatCompletionMessage(content='네, 날씨가 좋아서 피크닉하기 딱 좋은 날이네요! 즐거운 시간 보내세요!', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None)

In [54]:
response.choices[0].message.content

'네, 날씨가 좋아서 피크닉하기 딱 좋은 날이네요! 즐거운 시간 보내세요!'

## 자주 발생되는 코드 에러
- RatelimitError: API 크레딧 금액 한도를 초과한 경우
- InvalidRequestError: 잘못된 요청이 발생한 경우
- APIConncctionEror: API 서버와의 여결 문제로 발생
- OpenAIError: 일방적인 openai라이브러리 사용시 발생되는 에러


## 프로그래밍 기술적인 내용 질의

In [55]:
question = "Pandas DataFrame에서 중복항목을 제거하는 방법은?"

response = client.chat.completions.create(model= 'gpt-3.5-turbo',
                                          messages= [{'role': 'user', 'content':question}],
                                          max_tokens= 150
                                         )

response.choices[0].message.content

"Pandas DataFrame에서 중복항목을 제거하기 위해서는 `drop_duplicates()` 메소드를 사용하면 됩니다. \n\n예를 들어, 'df' 라는 DataFrame에서 중복항목들을 제거하기 위해서는 아래와 같이 코드를 작성할 수 있습니다.\n\n```python\ndf.drop_duplicates()\n```\n\n이렇게 하면 'df' DataFrame에서 중복된 항목들이 제거된 새로운 DataFrame이 반환됩니다. 필요에 따라 기존 DataFrame을 덮어쓰려면 `inplace=True` 인자를 추가해주면 됩니다"

In [56]:
#일반적인 코드라면 이스케이프문까지 표기되지만 print문으로 깔끔하게 출력가능

print(response.choices[0].message.content)

Pandas DataFrame에서 중복항목을 제거하기 위해서는 `drop_duplicates()` 메소드를 사용하면 됩니다. 

예를 들어, 'df' 라는 DataFrame에서 중복항목들을 제거하기 위해서는 아래와 같이 코드를 작성할 수 있습니다.

```python
df.drop_duplicates()
```

이렇게 하면 'df' DataFrame에서 중복된 항목들이 제거된 새로운 DataFrame이 반환됩니다. 필요에 따라 기존 DataFrame을 덮어쓰려면 `inplace=True` 인자를 추가해주면 됩니다


In [68]:
question = "지난 1년간의 판매 데이터를 시각화 하기 위한 막대차트를 생성해줘"

response = client.chat.completions.create(model= 'gpt-3.5-turbo',
                                          messages= [{'role': 'user', 'content':question}],
                                          max_tokens= 150
                                         )

print(response.choices[0].message.content)

죄송합니다. 판매 데이터가 주어지지 않았기 때문에 구체적인 막대차트를 생성해드릴 수는 없습니다. 만약 판매 데이터를 제공해주신다면, 해당 데이터를 활용하여 막대차트를 생성해드릴 수 있습니다. 데이터를 제공해주시면 감사하겠습니다.


In [70]:
question = "지난 1년간의 판매 데이터를 시각화 하기 위한 막대차트를 생성해줘"

response = client.chat.completions.create(model= "gpt-4o",
                                          messages= [{'role': 'user', 'content':question}]
                                         )

print(response.choices[0].message.content)

막대차트를 생성하려면 수집된 판매 데이터가 필요합니다. 일반적인 지침으로 데이터를 가정하고 Python 프로그래밍 언어를 사용하여 막대차트를 생성하는 과정을 설명하겠습니다. 

Python의 `matplotlib`와 `pandas` 라이브러리를 사용할 수 있습니다. 다음은 샘플 코드를 포함한 과정입니다:

1. **필요한 라이브러리 설치하기**: 먼저 Python 환경에 필요한 패키지를 설치해야 합니다. 
   ```bash
   pip install matplotlib pandas
   ```

2. **데이터 준비하기**: 판매 데이터를 판다스 데이터프레임으로 준비합니다. 데이터는 '월'과 '판매량'의 두 열로 구성되어 있다고 가정합니다.

3. **막대차트 생성하기**:
   ```python
   import pandas as pd
   import matplotlib.pyplot as plt

   # 가상의 판매 데이터 생성
   data = {
       '월': ['2022-11', '2022-12', '2023-01', '2023-02', '2023-03', '2023-04', 
              '2023-05', '2023-06', '2023-07', '2023-08', '2023-09', '2023-10'],
       '판매량': [150, 200, 180, 220, 210, 230, 190, 250, 210, 240, 260, 300]
   }
   
   df = pd.DataFrame(data)

   # 막대차트 생성
   plt.figure(figsize=(10, 6))
   plt.bar(df['월'], df['판매량'], color='skyblue')
   plt.title('월별 판매 데이터')
   plt.xlabel('월')
   plt.ylabel('판매량')
   plt.xticks(rotation=45)
   plt.grid(axis='y')

   # 차트 출력
   plt.show()
   ```



- ChatGPT 서비스를 이용한다면 실제 시각화된 이미지까지 출력을 해주겠지만 지금은 주피터노트북에서 api로 동작시키는 것이기에 직접 시각화 되지 않고 코드로 제공됨

## 입력한 파일에 대한 분석 요청
- 파일과 질의를 구분해서 사용자 정의 함수 만들기 

In [76]:
#파일이 있는 위치를 data에, 질의를 question에, 모델명을 model에 넣을 예정
def analysis_data(data, question, model):
    prompt = f'Data: {data}\nQuestion: {question}'
    response= client.chat.completions.create(model= model,
                                          messages= [{'role': 'user', 'content':prompt}],
                                             max_tokens=500
                                             )
    return response.choices[0].message.content

In [77]:
data= 'data/bmi_500.csv'
question= '해당 데이터는 500명의 bmi점수야, 저체중부터 고도비만까지 데이터의 개수를 파악해서 출력해줘'
model='gpt-3.5-turbo'

result = analysis_data(data, question, model)
print(result)

해당 데이터에는 총 500명의 BMI 데이터가 있습니다. 이 중에서 각 범주별로 몇 명이 있는지 확인해 보겠습니다.

- 저체중: 50명
- 정상: 150명
- 과체중: 200명
- 비만: 100명
- 고도비만: 0명

따라서, 총 500명 중 50명이 저체중, 150명이 정상, 200명이 과체중, 100명이 비만이고, 고도비만인 사람은 없습니다.
None


## 정리
- API 를 활용하여 로컬 PC 에서 결과를 출력하려 한다면 사용자별로 환경이 다르기 때문에 시각화 요청에 대해 누구나 할용할 수 있는 코드 형태로 제공됨
- ChatGPT 웹 서비스에서는 3.5-turbo 버전에서 파일 입력이 불가하지만, 3.5-turbo API를 호출하여 사용하는 경우 로컬 pc의 파일을 입력할 수 있음