<a href="https://colab.research.google.com/github/momopmkr/momo/blob/main/2_%EB%8D%B0%EC%9D%B4%ED%84%B0%EB%B6%84%EC%84%9D_05_%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%88%98%EC%A7%91%ED%95%98%EA%B8%B0_OpenAPI_%EC%99%84%EC%84%B1_ipynb%EC%9D%98_%EC%82%AC%EB%B3%B8.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 데이터 분석

## 5. OpenAPI를 이용한 데이터 수집

---

## 01.네이버 OpenAPI 사용하기

### # 1.네이버 OpenAPI 신청하기 : 네이버 **검색(책, 뉴스)

- 네이버 OpenAPI 소개: https://developers.naver.com/products/intro/plan/
- 개발 가이드 보기: https://developers.naver.com/docs/serviceapi/search/news
- OpenAPI 신청하기: https://developers.naver.com/apps/#/register

### # 2.네이버 OpenAPI 사용 예 : 책 검색

### [실습문제] 네이버 뉴스 검색 OpenAPI 를 이용하여 데이터 수집하기

In [None]:
import os
import sys
import urllib.request
import datetime
import time
import json
import pandas as pd

now = datetime.datetime.now()
datas = []   #csv파일을 위한 변수

client_id = ''  # 자신의 client_id
client_pw = ''            # 자신의 client_secret


#[CODE 1]
def get_RequestUrl(url):
    req = urllib.request.Request(url)
    req.add_header("X-Naver-Client-Id", client_id)
    req.add_header("X-Naver-Client-Secret", client_pw)

    try:
        response = urllib.request.urlopen(req)
        if response.getcode() == 200:
            print(f"[{now.strftime('%Y년%m월%d일 %H시%M분%S초')}] Url Request Success")
            return response.read().decode('utf-8')

    except Exception as e:
#         if response.getcode() == 400 and datas:
#             return None
        print(e)
        print(f"[{now.strftime('%Y년%m월%d일 %H시%M분%S초')}] Error for URL : {url}" )
        return None


#[CODE 2]  네이버 검색 API
def get_NaverSearch(node, srcText, start, display):
    base = "https://openapi.naver.com/v1/search"
    node = "/%s.json" % node
    parameters = "?query=%s&start=%s&display=%s" % (urllib.parse.quote(srcText), start, display)

    url = base + node + parameters
    responseDecode = get_RequestUrl(url)   #[CODE 1]

    if (responseDecode == None):
        return None
    else:
        return json.loads(responseDecode)

#[CODE 3]
def get_PostData(node, post, jsonResult, cnt):
    if node == 'book':
        data = {'제목':post['title'],
                '저자':post['author'],
                '출판사':post['publisher'],
                '출간일':post['pubdate'],
                '링크':post['link'],
                '이미지':post['image']}
    elif node == 'news':
        data = {'제목':post['title'],
                '링크':post['originallink'],
                '내용':post['description']}
    elif node == 'shop':
        data = {'제목':post['title'],
                '브랜드':post['brand'],
                '제조사':post['maker'],
                '가격':post['lprice'],
                '이미지':post['image']}

    jsonResult.append(data)
    datas.append(data)

    return

#[CODE 0]
def main():
    nodeType = '''-----------------------------
    네이버 검색 대상입니다.
      1.book,  2.news,  3.shop
    -----------------------------'''
    print(nodeType)
    node = input('번호를 선택하세요.')
    if node == '1': node = 'book'
    elif node == '2': node = 'news'
    elif node == '3': node = 'shop'

    srcText = input(f'{node} 검색할 검색어를 입력하세요: ')

    display, cnt = 100, 0
    jsonResult = []
    jsonResponse = get_NaverSearch(node, srcText, 1, display)  #[CODE 2]
    total = jsonResponse['total']

    while ((jsonResponse != None) and (jsonResponse['display'] != 0)):
        for post in jsonResponse['items']:
            cnt += 1
            get_PostData(node, post, jsonResult, cnt)  #[CODE 3]

        start = jsonResponse['start'] + jsonResponse['display']
        jsonResponse = get_NaverSearch(node, srcText, start, total)
#     print(f'가져올 데이터 : {total} 건')

    with open(f'./data/naver_{node}_{srcText}', 'w', encoding='utf8') as outfile:
        jsonFile = json.dumps(jsonResult,  indent=4, sort_keys=True,  ensure_ascii=False)

        outfile.write(jsonFile)

    print("가져온 데이터 : %d 건" %(cnt))



    # csv 파일로 저장하기
    file = f'./data/naver_{node}_{srcText}.csv'
    df = pd.DataFrame(datas)
    df.to_csv(file, index=False, encoding="utf-8-sig")
    print(f'./data/naver_{node}_{srcText}.csv SAVED')
    return df

#-----------
# 시작
#-----------
df = main()
df

### [실습문제] Papago 번역 사용하기

In [None]:
import os
import sys
import urllib.request
import datetime
import json


client_id = ''  # 자신의 파파고 NMT API ID
client_pw = ''            # 자신의 파파고 NMT API PASSWORD

news = []   #csv파일을 위한 변수

#[CODE 1]
def papago(prompt, lang=1):

    encText = urllib.parse.quote(prompt)
    if lang == 1 :
        data = "source=ko&target=en&text=" + encText
    else:
        data = "source=en&target=ko&text=" + encText
    url = "https://openapi.naver.com/v1/papago/n2mt"

    req = urllib.request.Request(url)
    req.add_header("X-Naver-Client-Id", client_id)
    req.add_header("X-Naver-Client-Secret", client_pw)

    try:
        response = urllib.request.urlopen(req, data=data.encode("utf-8") )
        if response.getcode() == 200:
            print(f"[{now.strftime('%Y년%m월%d일 %H시%M분%S초')}] Url Request Success")
            responseDecode = response.read().decode('utf-8')

            if responseDecode == None:
                return None
            else:
                return json.loads(responseDecode)

    except Exception as e:
        print(e)
        print("[%s] Error for URL : %s" % (datetime.datetime.now(), url))
        return None

# 메인
lang= int(input('[선택] 1:한글->영어, 2:영어->한글: '))
txt =  '한글' if lang==1 else '영어'
prompt= input(f'[번역] 변환할 문장을 입력하세요[{txt}]')
print(f'# 입력 문자 => {prompt}')

jsonResponse = papago(prompt, lang)  # 파파고 번역
jsonResponse
print('-'*50)
print(f"# 번역 결과 => {jsonResponse['message']['result']['translatedText']}")


-------------------------

### [참고] 이미지 화면에 출력하기

In [None]:
from IPython.display import Image
Image(url='https://shopping-phinf.pstatic.net/main_3815224/38152244716.20230516165404.jpg')

### [참고] 이미지 저장하기

In [None]:
import requests
from io import BytesIO
from PIL import Image
import time

# 다운받을 이미지 url
url = "https://shopping-phinf.pstatic.net/main_3726611/37266116619.20230119071117.jpg"
urls = [
    "https://shopping-phinf.pstatic.net/main_3815224/38152244716.20230516165404.jpg",
    "https://shopping-phinf.pstatic.net/main_3726611/37266116619.20230119071117.jpg"
]

# time check
start = time.time()

for idx, url in enumerate(urls):
    # request.get 요청
    res = requests.get(url)

    # 이미지 다운로드 시간 체크
    print(time.time() - start)

    #Img open
    img = Image.open(BytesIO(res.content))
    img.save(f'./image/testimage_{idx}.png', 'png')
    img

---------------------------

--------

## 02.OpenAI OpenAPI 사용하기(ChatGPT)

### # 1.OpenAI OpenAPI 신청하기

- 참고 : https://passwd.tistory.com/entry/Python-OpenAI-API-%EC%82%AC%EC%9A%A9%ED%95%98%EA%B8%B0

        
### 작업 순서
https://platform.openai.com/docs/api-reference/introduction
 1. Introduction(openai 모듈 설치하기) : https://platform.openai.com/docs/libraries/community-libraries
 2. openai API KEY: Authentication(Secret Key 발급받기) : https://platform.openai.com/account/api-keys  </br>
 3. API 코드 작성하기
 4. 자신이 사용한 API 사용량 확인하기: https://platform.openai.com/account/usage

### 1. openai 모듈 설치하기

In [None]:
!pip install openai

Collecting openai
  Downloading openai-0.27.10-py3-none-any.whl (76 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/76.5 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[90m╺[0m[90m━━[0m [32m71.7/76.5 kB[0m [31m2.3 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m76.5/76.5 kB[0m [31m1.8 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: openai
Successfully installed openai-0.27.10


### 2. openai API 신청하기
- https://platform.openai.com/account/api-keys

### 3. API 코드 작성하기

### [실습문제] OpenAI 모델 목록 확인하기

In [None]:
# API 키 입력하기
YOUR_ORG='org-k75hafHkEk2h1SWJJxdo3IMs'
YOUR_API_KEY = "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"

In [None]:
import os
import openai

openai.organization = YOUR_ORG
openai.api_key = YOUR_API_KEY
openai.Model.list()

<OpenAIObject list at 0x7f58e8578090> JSON: {
  "object": "list",
  "data": [
    {
      "id": "davinci",
      "object": "model",
      "created": 1649359874,
      "owned_by": "openai",
      "permission": [
        {
          "id": "modelperm-uJaD4C9nXA6tPNoBII9hcYF4",
          "object": "model_permission",
          "created": 1692634268,
          "allow_create_engine": false,
          "allow_sampling": true,
          "allow_logprobs": true,
          "allow_search_indices": false,
          "allow_view": true,
          "allow_fine_tuning": false,
          "organization": "*",
          "group": null,
          "is_blocking": false
        }
      ],
      "root": "davinci",
      "parent": null
    },
    {
      "id": "text-davinci-001",
      "object": "model",
      "created": 1649364042,
      "owned_by": "openai",
      "permission": [
        {
          "id": "modelperm-CDlahk1RbkghXDjtxqzXoPNo",
          "object": "model_permission",
          "created": 169091386

### [실습문제] ChatGPT로 챗봇 만들기

- https://jaeyung1001.tistory.com/entry/Slack-ChatGPT-Slack-%EC%B1%97%EB%B4%87-%EB%A7%8C%EB%93%A4%EA%B8%B0-1%ED%8E%B8

In [None]:
import os
import openai

def ChatGPT(prompt, ORG=YOUR_ORG, API_KEY=YOUR_API_KEY):
    # api key 세팅
    openai.organization = ORG
    openai.api_key = API_KEY

    # ChatGPT API 호출 및 최신 언어 모델인 text-davinci-003을 가져옴
    response = openai.Completion.create(
       # engine='gpt-3.5-turbo'  # text-davinci-003'text-curie-001'  # 'text-babbage-001' #'text-ada-001'
        engine='text-davinci-003'  # text-davinci-003'text-curie-001'  # 'text-babbage-001' #'text-ada-001'
        , prompt=prompt
        , temperature=0.5
        , max_tokens=1024
        , top_p=1
        , frequency_penalty=0
        , presence_penalty=0)

    return response['choices'][0]['text']


def main():
    # 지문 입력 란
    prompt = input("[Question] 질문을 입력해 주세요: ")
    print('[Answer]:  ')
    print(ChatGPT(prompt).strip())


if __name__ == '__main__':
    main()

[Question] 질문을 입력해 주세요: 조인성 드라마 무빙 알아?
[Answer]:  
조인성 드라마 무빙은 조인성이 주연으로 출연한 드라마들을 말합니다. 대표적인 드라마로는 《낭만닥터 김사부2》, 《사랑의 불시착》, 《보고싶은》, 《내 여자친구는 구미호》, 《신의 한 수》, 《신데렐라와 네 명의 기사》, 《보이스》 등이 있습니다.


#### [RateLimitError 오류 예외처리 적용]

- 질문: 재미있는 블로그 이름 50개 추천해줘
- 질문: 방금 알려준 블로그 이름을 제목과 분류기준으로 나누어서 csv 형태로 만들어줘.
- 질문: 웃긴이야기 블로그에 들어갈 블로그 글을 재미있는 예제 2개를 넣어서 markdown 형식으로 1000자 이내로 블로그 글을 작성해줘.

In [None]:
import os
import sys
import openai


# ChatGPT 사용하기
def ChatGPT(prompt, API_KEY=YOUR_API_KEY):
    # api key 세팅
    openai.api_key = API_KEY

    # ChatGPT API 호출 및 최신 언어 모델인 text-davinci-003을 가져옴
    response = openai.Completion.create(
        # engine='gpt-3.5-turbo-0613'  # 'text-davinci-003' 'text-curie-001' 'text-babbage-001' 'text-ada-001'
        engine='text-davinci-003'  # 'text-davinci-003' 'text-curie-001' 'text-babbage-001' 'text-ada-001'
        , prompt=prompt
        , temperature=0.5
        , max_tokens=1024
        , top_p=1
        , frequency_penalty=0
        , presence_penalty=0)

    return response['choices'][0]['text']

# 메인
def main():
    # 지문 입력 란
    try:
        print("[ChatGPTBot]: 프로그램을 시작합니다.\n\t종료하려면 [myQ]상태에서 q를 입력하세요.")
        print()
        while True:
            prompt = input("[myQ]: ")
            if prompt == 'q':
                print('[ChatGPTBot]: 프로그램을 종료합니다.')
                break

            print()
            print('[ChatGPTBot]:', ChatGPT(prompt).strip() )
            print()
        # sys.exit()

    except Exception as e:  # 예외처리하기
        if str(e).find('RateLimitError'):
            print()
            print("RateLimitError: chatGPT 서버에 연결이 원활하지 않습니다.")
            print("잠시후 다시 시도해 주세요.")
        else:
            print(e)

if __name__ == '__main__':
    main()

[ChatGPTBot]: 프로그램을 시작합니다.
	종료하려면 [myQ]상태에서 q를 입력하세요.

[myQ]: 디즈니플러스 알아?

[ChatGPTBot]: 디즈니플러스는 디즈니 스튜디오와 스파이더맨 프로덕션스가 공동 제작한 유튜브 채널입니다. 채널은 최신 디즈니 영화와 시리즈, 다큐멘터리 및 스페셜 컨텐츠를 제공합니다. 또한 다양한 디즈니 스타들의 인터뷰를 제공하고 있습니다. 디즈니플러스는 디즈니 계열 및 비디오 게임 및 애니메이션 콘텐츠를 즐길 수 있는 좋은 장소로 소개됩니다.

[myQ]: 디즈니플러스 한국 컨텐츠는 뭐가 있어?

[ChatGPTBot]: 디즈니플러스 한국 컨텐츠는 다음과 같습니다.

1. 스타 라이즈: 라이즈 오브 레전드
2. 디즈니 프린세스 마리아
3. 라라 라라 라라
4. 디즈니 프린세스 다이어리
5. 디즈니 뮤직 프리미엄
6. 디즈니 뮤직 스타라이트
7. 디즈니 월드 오브 아이돌
8. 디즈니 다이어리 스타
9. 디즈니 프린세스 마이클
10. 디즈니 뮤직 플레이리스트

[myQ]: 한국에서 만든 디즈니플러스 드라마는 뭐가 있어?

[ChatGPTBot]: 1. 당신의 이름은 김소현
2. 바람과 함께 사라지다
3. 열여덟의 순간
4. 내 마음의 보석
5. 미녀는 괴로워
6. 시카고 타자기
7. 나의 사랑 로맨스
8. 나의 사랑 나비
9. 그녀의 마음
10. 사랑의 온도

[myQ]: 악마판사 드라마 알아?

[ChatGPTBot]: 악마판사 드라마는 미국의 스릴러 드라마 시리즈입니다. 시리즈의 주제는 사람들이 악마로부터 면역력을 얻기 위해 각자의 이야기를 공유하는 것입니다. 드라마는 메릴 브라운과 조셉 그레이에 의해 제작되었으며, 각 이야기는 다른 사람들의 이야기를 가장 잘 듣고 배우는 것을 돕는 일을 하는 전사로 묘사됩니다. 시리즈는 악마가 사람들의 마음을 변화시키고 여러 가지 이야기를 그리는 데 초점을 맞춘 드라마입니다.

[myQ]: 한국 드라마 악마판사 알아?

[ChatGPTBot]: 악마판사는 2019년 MBC 드라마로, 장

KeyboardInterrupt: ignored

### 4. 자신이 사용한 API 사용량 확인하기:
https://platform.openai.com/account/usage

----------------

끝!