# 네이버 API: 블로그 검색

- 네이버 개발자센터(https://developers.naver.com/main) 페이지를 찾습니다.
  - 로그인하고 애플리케이션을 등록합니다.
  - Client ID와 Secret를 복사하여 Jupyter Notebook에 붙여넣습니다.
  - 검색 개발 가이드에서 요청 및 응답 메시지를 확인합니다.

### HTTP 요청 실행

In [None]:
# 관련 라이브러리를 호출합니다.
import requests

In [None]:
# 요청 URL을 설정합니다.(출력 포맷: JSON)
url = 'https://openapi.naver.com/v1/search/blog.json'

In [None]:
# 검색어를 설정합니다.
searchWord = '스탠바이미'

In [None]:
# 쿼리 문자열을 딕셔너리로 설정합니다.
query = {'query': searchWord}

In [None]:
# 요청 헤더를 딕셔너리로 지정합니다.
headers = {'X-Naver-Client-Id': 'Client ID 붙여넣기',
           'X-Naver-Client-Secret': 'Client Secret 붙여넣기'}

In [None]:
# HTTP 요청을 실행합니다.
res = requests.get(url = url, params = query, headers = headers)

### HTTP 응답 확인

In [None]:
# HTTP 응답 상태코드를 확인합니다.
res.status_code

In [None]:
# HTTP 응답 헤더에서 Content-Type을 확인합니다.
res.headers['content-type']

In [None]:
# HTTP 응답 바디 문자열을 출력합니다.
print(res.text)

In [None]:
# HTTP 요청 URL을 확인합니다.
res.url

### JSON 데이터 전처리

In [None]:
# 관련 라이브러리를 호출합니다.
import json

In [None]:
# HTTP 응답 바디 문자열을 딕셔너리로 변환합니다.
dat = json.loads(s = res.text)

In [None]:
# dat를 확인합니다.
dat

In [None]:
# dat의 클래스를 확인합니다.
type(dat)

In [None]:
# dat에서 결과를 선택하고 result에 할당합니다.
result = dat['items']

### 데이터프레임 생성

In [None]:
# 관련 라이브러리를 호출합니다.
import pandas as pd

In [None]:
# result로 데이터프레임을 생성합니다.
df = pd.DataFrame(data = result)

In [None]:
# df의 정보를 확인합니다.
df.info()

In [None]:
# df의 처음 5행을 출력합니다.
df.head()

### 데이터 전처리

In [None]:
# df에서 일부 열을 삭제하고 df에 재할당합니다.
df = df.drop(columns = ['description', 'bloggerlink'])

In [None]:
# title 열의 원소를 전처리할 정규표현식 패턴을 지정합니다.
p = r'<.+?>|\[.+?\]|\]|&#8203;'

In [None]:
# title 열의 원소에서 정규표현식 패턴을 모두 삭제합니다.
df['title'] = df['title'].str.replace(pat = p, repl = '', regex = True)

In [None]:
# postdate의 자료형을 날짜시간형으로 변환합니다.
df['postdate'] = pd.to_datetime(arg = df['postdate'], format = '%Y%m%d')

### 작업 경로 확인 및 변경

In [None]:
# 관련 라이브러리를 호출합니다.
import os

In [None]:
# 현재 작업 경로를 확인합니다.
os.getcwd()

In [None]:
# data 폴더로 작업 경로를 변경합니다.
os.chdir(path = '../data')

### xlsx 파일로 저장

In [None]:
# xlsx 파일로 저장합니다.
df.to_excel(excel_writer = 'Naver_API_Blog.xlsx', index = None)

In [None]:
# 현재 작업 경로에 있는 폴더명과 파일명을 출력합니다.
os.listdir()

## End of Document