## Open API(Rest API)를 활용한 크롤링

### Open API(Rest API)란?
 - **API:** Application Programming Interface의 약자로, 특정 프로그램을 만들기 위해 제공되는 모듈(함수 등)을 의미
 - **Open API:** 공개 API라고도 불리우며, 누구나 사용할 수 있도록 공개된 API (주로 Rest API 기술을 많이 사용함)
 - **Rest API:** Representational State Transfer API의 약자로, HTTP프로토콜을 통해 서버 제공 기능을 사용할 수 있는 함수를 의미
   - 일반적으로 XML, JSON의 형태로 응답을 전달(원하는 데이터 추출이 수월)
   - [참고 - RestAPI란](http://hyunalee.tistory.com/1)

### JSON 이란?
 - JavaScript Object Notation 줄임말
 - 웹환경에서 서버와 클라이언트 사이에 데이터를 주고 받을때 많이 사용
   - Rest API가 주요한 예제
 - JSON 포멧 예 <br>
 { "id":"01", "language": "Java", "edition": "third", "author": "Herbert Schildt" }
 <br>
 <br>
 
 - 참고 (https://books.google.co.kr/books?id=euSiAwAAQBAJ&pg=PT1755&lpg=PT1755&dq=json+%EC%9E%A5%EC%A0%90&source=bl&ots=VjTIoOjbTK&sig=3t7MXA7g2CvEi8SyD0-GQVywzw0&hl=ko&sa=X&ved=0ahUKEwiwo8OvxJfWAhXDsJQKHYaBDpI4ChDoAQhVMAg#v=onepage&q=json%20%EC%9E%A5%EC%A0%90&f=false)

 출처: http://dpug.tistory.com/67#.WbycWshJaUk [퍼그의 전초기지]

In [5]:
import json

# 네이버 쇼핑에서, android 라는 키워드로 검색한 상품 리스트 결과
data = """
{
    "lastBuildDate": "Sat, 22 Jun 2019 14:57:13 +0900",
    "total": 634151,
    "start": 1,
    "display": 10,
    "items": [
        {
            "title": "MHL 케이블 (아이폰, <b>안드로이드</b> 스마트폰 HDMI TV연결)",
            "link": "https://search.shopping.naver.com/gate.nhn?id=10782444869",
            "image": "https://shopping-phinf.pstatic.net/main_1078244/10782444869.5.jpg",
            "lprice": "16500",
            "hprice": "0",
            "mallName": "투데이샵",
            "productId": "10782444869",
            "productType": "2"
        },
        {
            "title": "파인디지털 파인드라이브 Q300",
            "link": "https://search.shopping.naver.com/gate.nhn?id=19490416717",
            "image": "https://shopping-phinf.pstatic.net/main_1949041/19490416717.20190527115824.jpg",
            "lprice": "227050",
            "hprice": "359000",
            "mallName": "네이버",
            "productId": "19490416717",
            "productType": "1"
        },
        {
            "title": "주파집 USB NEW 마그네틱 5핀 <b>안드로이드</b> 자석 고속충전케이블",
            "link": "https://search.shopping.naver.com/gate.nhn?id=16222651410",
            "image": "https://shopping-phinf.pstatic.net/main_1622265/16222651410.20181120154423.jpg",
            "lprice": "6500",
            "hprice": "11900",
            "mallName": "네이버",
            "productId": "16222651410",
            "productType": "1"
        },
        {
            "title": "MHL 케이블 아이폰 <b>안드로이드</b> HDMI 미러링",
            "link": "https://search.shopping.naver.com/gate.nhn?id=11859583359",
            "image": "https://shopping-phinf.pstatic.net/main_1185958/11859583359.1.jpg",
            "lprice": "12500",
            "hprice": "0",
            "mallName": "가가넷",
            "productId": "11859583359",
            "productType": "2"
        },
        {
            "title": "아이폰삼각대 / ios&amp;<b>Android</b> 호환 가능",
            "link": "https://search.shopping.naver.com/gate.nhn?id=16341221561",
            "image": "https://shopping-phinf.pstatic.net/main_1634122/16341221561.4.jpg",
            "lprice": "31900",
            "hprice": "0",
            "mallName": "포시즌몰",
            "productId": "16341221561",
            "productType": "2"
        },
        {
            "title": "뷰잉 (viewing)",
            "link": "https://search.shopping.naver.com/gate.nhn?id=13030462232",
            "image": "https://shopping-phinf.pstatic.net/main_1303046/13030462232.20190306144248.jpg",
            "lprice": "87110",
            "hprice": "180000",
            "mallName": "네이버",
            "productId": "13030462232",
            "productType": "1"
        },
        {
            "title": "샤오미 Mi Box (TELEBEE)",
            "link": "https://search.shopping.naver.com/gate.nhn?id=12302122742",
            "image": "https://shopping-phinf.pstatic.net/main_1230212/12302122742.20170920112004.jpg",
            "lprice": "54900",
            "hprice": "99000",
            "mallName": "네이버",
            "productId": "12302122742",
            "productType": "1"
        },
        {
            "title": "MHL 케이블 아이폰 <b>안드로이드</b> HDMI 미러링 TV연결",
            "link": "https://search.shopping.naver.com/gate.nhn?id=8678305242",
            "image": "https://shopping-phinf.pstatic.net/main_8678305/8678305242.5.jpg",
            "lprice": "5500",
            "hprice": "0",
            "mallName": "글로벌텐교",
            "productId": "8678305242",
            "productType": "2"
        },
        {
            "title": "파인디지털 파인드라이브 Q30",
            "link": "https://search.shopping.naver.com/gate.nhn?id=18711239261",
            "image": "https://shopping-phinf.pstatic.net/main_1871123/18711239261.20190415105108.jpg",
            "lprice": "199000",
            "hprice": "315640",
            "mallName": "네이버",
            "productId": "18711239261",
            "productType": "1"
        },
        {
            "title": "이노아이오 스마트빔 3",
            "link": "https://search.shopping.naver.com/gate.nhn?id=14032821135",
            "image": "https://shopping-phinf.pstatic.net/main_1403282/14032821135.20180413144450.jpg",
            "lprice": "259870",
            "hprice": "387000",
            "mallName": "네이버",
            "productId": "14032821135",
            "productType": "1"
        }
    ]
}
"""

json_data = json.loads(data)
print (json_data['items'][0]['title'])
print (json_data['items'][0]['link'])


MHL 케이블 (아이폰, <b>안드로이드</b> 스마트폰 HDMI TV연결)
https://search.shopping.naver.com/gate.nhn?id=10782444869


### 네이버 검색 Open API를 이용한 크롤링 초간단 실습
 - https://developers.naver.com/main/
 - [블로그 검색 가이드 문서](https://developers.naver.com/docs/search/blog/)
   - 네이버 Open API 이용신청 [참고](http://hnark.tistory.com/135)

- postman 설치 (https://www.getpostman.com/downloads/) 
  - (상세 가이드: http://www.a-mean-blog.com/ko/blog/Node-JS-API/_/API-%ED%85%8C%EC%8A%A4%ED%8A%B8-%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%A8-Postman-%EC%84%A4%EC%B9%98%EB%B0%8F-%EA%B0%84%EB%8B%A8-%EC%82%AC%EC%9A%A9%EB%B2%95)

- 사용법
   1. Sign Up in Postman
   2. Insert https://openapi.naver.com/v1/search/news.json?query=스마트 into GET
   3. Add X-Naver-Client-Id(key), <font color="blue">CsODwdUTyG9vOI1uIeIf</font>(value) into Headers
   4. Add X-Naver-Client-Secret(key), <font color="blue">YmIx0GW8JG</font>(value) into Headers
   5. Send
   <img src="postman.png" />

- [참고: 네이버 Open API HTTP 응답 상태 에러 코드 목록1](https://developers.naver.com/docs/common/openapiguide/#/errorcode.md)
- [참고: 일반적인 HTTP 응답 상태 코드](http://ooz.co.kr/260) 

### 네이버 Open API 사용하기

In [6]:
import requests
import pprint

client_id = 'OefH3AmFlzpgpJzkSk5W'
client_secret = 'iCUusAYmZ6'

naver_open_api = 'https://openapi.naver.com/v1/search/shop.json?query=갤럭시노트10'
header_params = {"X-Naver-Client-Id":client_id, "X-Naver-Client-Secret":client_secret}
res = requests.get(naver_open_api, headers=header_params)

if res.status_code == 200:
    data = res.json()
    for index, item in enumerate(data['items']):
        print (index + 1, item['title'], item['link'])
else:
    print ("Error Code:", res.status_code)



1 삼성전자 <b>갤럭시노트10</b> 256GB SM-N971N [자급제] https://search.shopping.naver.com/gate.nhn?id=20899748682
2 삼성전자 <b>갤럭시노트10</b> 256GB SM-N971S [SKT 기기변경] https://search.shopping.naver.com/gate.nhn?id=20552943544
3 삼성전자 <b>갤럭시노트10</b>플러스 256GB SM-N976S [SKT 기기변경] https://search.shopping.naver.com/gate.nhn?id=20554996135
4 삼성전자 <b>갤럭시노트10</b>플러스 5G 512GB SM-N976S (SKT) https://search.shopping.naver.com/gate.nhn?id=23936154523
5 삼성전자 <b>갤럭시노트10</b> 256GB SM-N971K [KT 기기변경] https://search.shopping.naver.com/gate.nhn?id=20552777949
6 삼성전자 <b>갤럭시노트10</b>플러스 256GB SM-N976K [KT 기기변경] https://search.shopping.naver.com/gate.nhn?id=20554188925
7 <b>갤럭시노트10</b>/플러스 256GB 공기계/자급제 유심기변 약정할인 https://search.shopping.naver.com/gate.nhn?id=83031865853
8 삼성전자 <b>갤럭시노트10</b>플러스 5G 512GB SM-N976L (LG U+) https://search.shopping.naver.com/gate.nhn?id=23935933527
9 삼성전자 <b>갤럭시노트10</b>플러스 5G 512GB SM-N976K (KT) https://search.shopping.naver.com/gate.nhn?id=23934003526
10 삼성전자 <b>갤럭시노트10</b>플러스 256GB SM-N976N [자급제]

In [3]:
import requests
import openpyxl

client_id = 'OefH3AmFlzpgpJzkSk5W'
client_secret = 'iCUusAYmZ6'
start, num = 1, 0

excel_file = openpyxl.Workbook()
excel_sheet = excel_file.active
excel_sheet.column_dimensions['B'].width = 100
excel_sheet.column_dimensions['C'].width = 100
excel_sheet.append(['랭킹', '제목', '링크'])

for index in range(10):
    start_number = start + (index * 100)
    naver_open_api = 'https://openapi.naver.com/v1/search/shop.json?query=샤오미&display=100&start=' + str(start_number)
    header_params = {"X-Naver-Client-Id":client_id, "X-Naver-Client-Secret":client_secret}
    res = requests.get(naver_open_api, headers=header_params)
    if res.status_code == 200:
        data = res.json()
        for item in data['items']:
            num += 1
            excel_sheet.append([num, item['title'], item['link']])
    else:
        print ("Error Code:", res.status_code)

excel_file.save('IT.xlsx')
excel_file.close()

In [4]:
# 네이버 검색 API예제는 블로그를 비롯 전문자료까지 호출방법이 동일하므로 blog검색만 대표로 예제를 올렸습니다.
# 네이버 검색 Open API 예제 - 블로그 검색
import os
import sys
import urllib.request

client_id = 'OefH3AmFlzpgpJzkSk5W'
client_secret = 'iCUusAYmZ6'

encText = urllib.parse.quote("검색할 단어")
url = "https://openapi.naver.com/v1/search/blog?query=" + encText # json 결과
# url = "https://openapi.naver.com/v1/search/blog.xml?query=" + encText # xml 결과
request = urllib.request.Request(url)
request.add_header("X-Naver-Client-Id",client_id)
request.add_header("X-Naver-Client-Secret",client_secret)
response = urllib.request.urlopen(request)
rescode = response.getcode()
if(rescode==200):
    response_body = response.read()
    print(response_body.decode('utf-8'))
else:
    print("Error Code:" + rescode)

{
"lastBuildDate": "Sun, 05 Dec 2021 12:16:27 +0900",
"total": 743457,
"start": 1,
"display": 10,
"items": [
{
"title": "딕셔너리 활용 예제 | 영어 <b>단어</b> <b>검색</b> 프로그램 만들기",
"link": "https:\/\/blog.naver.com\/codethem?Redirect=Log&logNo=222310806177",
"description": "아래와 같이 <b>검색할 단어</b>를 입력하면, 검색한 단어의 뜻을 알려줍니다. 그리고 등록되어 있지 않은 단어는 등록되어 있지 않다는 메시지를 띄워줍니다. 함께 코드를 만들어 나가기 전에, 아래 영상을 통해... ",
"bloggername": "꿈을 코딩하다 CodeThem",
"bloggerlink": "https://blog.naver.com/codethem",
"postdate": "20210415"

},
{
"title": "여러 pdf파일에서 한번에 내용(<b>단어</b>) <b>검색</b>하는 방법... ",
"link": "https:\/\/blog.naver.com\/sossos721?Redirect=Log&logNo=221798623753",
"description": "설정 됐으면 첫번째칸( What word or phrase would you like to search for? )에 <b>검색할 단어</b>나 문장을 입력한다. 난 특허 관련된 장표를 찾으려고 특허를 입력했다. 특허라는 단어가 들어있는 장표를 모두... ",
"bloggername": "신쟈의블로그",
"bloggerlink": "https://blog.naver.com/sossos721",
"postdate": "20200206"

},
{
"title": "교제 살인이라는 <b>단어</b>가 <b>검색</b>이 안 될 때",
"link": "https:\/\/blog.naver.com\/gkdmsinj?R