## Open API(Rest API)를 활용한 크롤링

### Open API(Rest API)란?
 - **API:** Application Programming Interface의 약자로, 특정 프로그램을 만들기 위해 제공되는 모듈(함수 등)을 의미
 - **Open API:** 공개 API라고도 불리우며, 누구나 사용할 수 있도록 공개된 API (주로 Rest API 기술을 많이 사용함)
 - **Rest API:** Representational State Transfer API의 약자로, HTTP프로토콜을 통해 서버 제공 기능을 사용할 수 있는 함수를 의미
   - 일반적으로 XML, JSON의 형태로 응답을 전달(원하는 데이터 추출이 수월)
   - [참고 - RestAPI란](http://hyunalee.tistory.com/1)

### JSON 이란?
 - JavaScript Object Notation 줄임말
 - 웹환경에서 서버와 클라이언트 사이에 데이터를 주고 받을때 많이 사용
   - Rest API가 주요한 예제
 - JSON 포멧 예 <br>
 { "id":"01", "language": "Java", "edition": "third", "author": "Herbert Schildt" }
 <br>
 <br>
 
 - 참고 (https://books.google.co.kr/books?id=euSiAwAAQBAJ&pg=PT1755&lpg=PT1755&dq=json+%EC%9E%A5%EC%A0%90&source=bl&ots=VjTIoOjbTK&sig=3t7MXA7g2CvEi8SyD0-GQVywzw0&hl=ko&sa=X&ved=0ahUKEwiwo8OvxJfWAhXDsJQKHYaBDpI4ChDoAQhVMAg#v=onepage&q=json%20%EC%9E%A5%EC%A0%90&f=false)

 출처: http://dpug.tistory.com/67#.WbycWshJaUk [퍼그의 전초기지]

In [16]:
import json
# 네이버 쇼핑에서, graphiccard 라는 키워드로 검색한 상품 리스트 결과
data = """
{
    "lastBuildDate": "Mon, 12 Jul 2021 16:55:48 +0900",
    "total": 324360,
    "start": 1,
    "display": 10,
    "items": [
        {
            "title": "MSI 지포스 RTX 3060 게이밍 X D6 12GB 트윈프로져8",
            "link": "https://search.shopping.naver.com/gate.nhn?id=27313935527",
            "image": "https://shopping-phinf.pstatic.net/main_2731393/27313935527.20210526110950.jpg",
            "lprice": "699000",
            "hprice": "",
            "mallName": "네이버",
            "productId": "27313935527",
            "productType": "1",
            "brand": "MSI",
            "maker": "MSI",
            "category1": "디지털/가전",
            "category2": "PC부품",
            "category3": "그래픽카드",
            "category4": "NVIDIA계열"
        },
        {
            "title": "조텍 GAMING 지포스 GTX 1660 SUPER AMP D6 6GB 백플레이트",
            "link": "https://search.shopping.naver.com/gate.nhn?id=21232743899",
            "image": "https://shopping-phinf.pstatic.net/main_2123274/21232743899.20210423153620.jpg",
            "lprice": "480600",
            "hprice": "",
            "mallName": "네이버",
            "productId": "21232743899",
            "productType": "1",
            "brand": "조텍",
            "maker": "조텍",
            "category1": "디지털/가전",
            "category2": "PC부품",
            "category3": "그래픽카드",
            "category4": "NVIDIA계열"
        },
        {
            "title": "ASUS ROG STRIX 지포스 RTX 3070 Ti O8G GAMING OC D6X 8GB",
            "link": "https://search.shopping.naver.com/gate.nhn?id=27715542523",
            "image": "https://shopping-phinf.pstatic.net/main_2771554/27715542523.20210624142541.jpg",
            "lprice": "1199000",
            "hprice": "",
            "mallName": "네이버",
            "productId": "27715542523",
            "productType": "1",
            "brand": "ASUS",
            "maker": "ASUS",
            "category1": "디지털/가전",
            "category2": "PC부품",
            "category3": "그래픽카드",
            "category4": "NVIDIA계열"
        },
        {
            "title": "GeForce Nvidia GTX660 GTX750 GTX760 GTX960 GTX1050TI GTX1060 게이밍<b>그래픽카드</b>",
            "link": "https://search.shopping.naver.com/gate.nhn?id=82274366944",
            "image": "https://shopping-phinf.pstatic.net/main_8227436/82274366944.1.jpg",
            "lprice": "70000",
            "hprice": "",
            "mallName": "컴기공",
            "productId": "82274366944",
            "productType": "2",
            "brand": "NVIDIA",
            "maker": "NVIDIA",
            "category1": "디지털/가전",
            "category2": "PC부품",
            "category3": "그래픽카드",
            "category4": "NVIDIA계열"
        },
        {
            "title": "갤럭시코리아 GALAX 지포스 RTX 3070 D6 8GB LHR",
            "link": "https://search.shopping.naver.com/gate.nhn?id=27697700523",
            "image": "https://shopping-phinf.pstatic.net/main_2769770/27697700523.20210623110731.jpg",
            "lprice": "971000",
            "hprice": "",
            "mallName": "네이버",
            "productId": "27697700523",
            "productType": "1",
            "brand": "GALAX",
            "maker": "갤럭시코리아",
            "category1": "디지털/가전",
            "category2": "PC부품",
            "category3": "그래픽카드",
            "category4": "NVIDIA계열"
        },
        {
            "title": "조텍 GAMING 지포스 RTX 3070 Ti AMP Holo Black D6X 8GB",
            "link": "https://search.shopping.naver.com/gate.nhn?id=27568278523",
            "image": "https://shopping-phinf.pstatic.net/main_2756827/27568278523.20210614112019.jpg",
            "lprice": "1109970",
            "hprice": "",
            "mallName": "네이버",
            "productId": "27568278523",
            "productType": "1",
            "brand": "조텍",
            "maker": "조텍",
            "category1": "디지털/가전",
            "category2": "PC부품",
            "category3": "그래픽카드",
            "category4": "NVIDIA계열"
        },
        {
            "title": "컬러풀 기가바이트 RTX 3060 / 3060 TI / 3070 / 3080 <b>그래픽카드</b>",
            "link": "https://search.shopping.naver.com/gate.nhn?id=82798892451",
            "image": "https://shopping-phinf.pstatic.net/main_8279889/82798892451.1.jpg",
            "lprice": "695000",
            "hprice": "",
            "mallName": "바디퓨",
            "productId": "82798892451",
            "productType": "2",
            "brand": "컬러풀",
            "maker": "컬러풀",
            "category1": "디지털/가전",
            "category2": "PC부품",
            "category3": "그래픽카드",
            "category4": "NVIDIA계열"
        },
        {
            "title": "컬러풀 지포스 RTX 2060 토마호크 D6 6GB",
            "link": "https://search.shopping.naver.com/gate.nhn?id=27177428522",
            "image": "https://shopping-phinf.pstatic.net/main_2717742/27177428522.20210517143506.jpg",
            "lprice": "540590",
            "hprice": "",
            "mallName": "네이버",
            "productId": "27177428522",
            "productType": "1",
            "brand": "컬러풀",
            "maker": "컬러풀",
            "category1": "디지털/가전",
            "category2": "PC부품",
            "category3": "그래픽카드",
            "category4": "NVIDIA계열"
        },
        {
            "title": "갤럭시코리아 GALAX 지포스 RTX 3070 Ti SG OC D6X 8GB",
            "link": "https://search.shopping.naver.com/gate.nhn?id=27696462528",
            "image": "https://shopping-phinf.pstatic.net/main_2769646/27696462528.20210623111545.jpg",
            "lprice": "1165000",
            "hprice": "",
            "mallName": "네이버",
            "productId": "27696462528",
            "productType": "1",
            "brand": "GALAX",
            "maker": "갤럭시코리아",
            "category1": "디지털/가전",
            "category2": "PC부품",
            "category3": "그래픽카드",
            "category4": "NVIDIA계열"
        },
        {
            "title": "이엠텍 지포스 GTX 1660 SUPER STORM X Dual BASIC OC D6 6GB",
            "link": "https://search.shopping.naver.com/gate.nhn?id=27012637522",
            "image": "https://shopping-phinf.pstatic.net/main_2701263/27012637522.20210503122838.jpg",
            "lprice": "482720",
            "hprice": "",
            "mallName": "네이버",
            "productId": "27012637522",
            "productType": "1",
            "brand": "이엠텍",
            "maker": "이엠텍",
            "category1": "디지털/가전",
            "category2": "PC부품",
            "category3": "그래픽카드",
            "category4": "NVIDIA계열"
        }
    ]
}
"""

json_data = json.loads(data)
print (json_data['items'][0]['title'])
for item in json_data['items']:
    print (item['ti'])
    print (item['link'])


MSI 지포스 RTX 3060 게이밍 X D6 12GB 트윈프로져8
https://search.shopping.naver.com/gate.nhn?id=27313935527
https://search.shopping.naver.com/gate.nhn?id=21232743899
https://search.shopping.naver.com/gate.nhn?id=27715542523
https://search.shopping.naver.com/gate.nhn?id=82274366944
https://search.shopping.naver.com/gate.nhn?id=27697700523
https://search.shopping.naver.com/gate.nhn?id=27568278523
https://search.shopping.naver.com/gate.nhn?id=82798892451
https://search.shopping.naver.com/gate.nhn?id=27177428522
https://search.shopping.naver.com/gate.nhn?id=27696462528
https://search.shopping.naver.com/gate.nhn?id=27012637522


### 네이버 검색 Open API를 이용한 크롤링 초간단 실습
 - https://developers.naver.com/main/
 - [블로그 검색 가이드 문서](https://developers.naver.com/docs/search/blog/)
   - 네이버 Open API 이용신청 [참고](http://hnark.tistory.com/135)

- postman 설치 (https://www.getpostman.com/downloads/) 
  - (상세 가이드: http://www.a-mean-blog.com/ko/blog/Node-JS-API/_/API-%ED%85%8C%EC%8A%A4%ED%8A%B8-%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%A8-Postman-%EC%84%A4%EC%B9%98%EB%B0%8F-%EA%B0%84%EB%8B%A8-%EC%82%AC%EC%9A%A9%EB%B2%95)

- 사용법
   1. Sign Up in Postman
   2. Insert https://openapi.naver.com/v1/search/news.json?query=스마트 into GET
   3. Add X-Naver-Client-Id(key), <font color="blue">CsODwdUTyG9vOI1uIeIf</font>(value) into Headers
   4. Add X-Naver-Client-Secret(key), <font color="blue">YmIx0GW8JG</font>(value) into Headers
   5. Send
   <img src="postman.png" />

- [참고: 네이버 Open API HTTP 응답 상태 에러 코드 목록1](https://developers.naver.com/docs/common/openapiguide/#/errorcode.md)
- [참고: 일반적인 HTTP 응답 상태 코드](http://ooz.co.kr/260) 

### 네이버 Open API 사용하기

In [48]:
import requests
import pprint

client_id = 'BTMVavws8Is7jmVpUcSL'
client_secret = 'sDgiapg86l'

naver_open_api = 'https://openapi.naver.com/v1/search/shop.json?query=갤럭시노트10'
header_params = {"X-Naver-Client-Id":client_id, "X-Naver-Client-Secret":client_secret}
res = requests.get(naver_open_api, headers=header_params)

if res.status_code == 200:
    data = res.json()
    for index, item in enumerate(data['items']):
        print (index + 1, item['title'], item['link'])
else:
    print ("Error Code:", res.status_code)



1 삼성전자 갤럭시탭10.1 SHW-M380S/K/W <b>갤럭시노트10</b>. https://search.shopping.naver.com/gate.nhn?id=15705550514
2 삼성 <b>Galaxy Note 10</b>.1 GT-N8010EAADBT WiFi only (25,7 cm (10,1 Zoll) 태블릿 (Quad-core, 1,4GHz, 16GB inter https://search.shopping.naver.com/gate.nhn?id=15816182521
3 삼성 <b>Galaxy Note 10</b>.1 GT-N8010ZWADBT WiFi only (25,7 cm (10,1 Zoll) 태블릿 (Quad-core, 1,4GHz, 16GB inter https://search.shopping.naver.com/gate.nhn?id=15815943909
4 [헤븐엠]<b>10</b> 1 <b>Galaxy NOTE</b> 32 GB (GT-N8013EAVXAR) - https://search.shopping.naver.com/gate.nhn?id=7922959881
5 삼성 <b>갤럭시 노트</b> 프로 12.2 SM-P900 SM-P901 SM-905 태블릿에 대 한 <b>10</b>FT USB 3.0 마이크로 B 데이터 동기화 충전기 케이블 코드 https://search.shopping.naver.com/gate.nhn?id=17620695866
6 C19560 TD019560 <b>갤럭시노트 10</b> 1LTE E230 태블릿 방탄필름 https://search.shopping.naver.com/gate.nhn?id=19249611936
7 삼성전자 <b>갤럭시 노트 10</b>.1 (2014년형) 16G https://search.shopping.naver.com/gate.nhn?id=16958447459
8 Samsung SAM-EP-TA<b>10</b>JWE 삼성 전자 갤럭시 S5, <b>갤럭시 노트</b> 3 용 Unive

In [73]:
import requests
import openpyxl

client_id = 'BTMVavws8Is7jmVpUcSL'
client_secret = 'sDgiapg86l'
start, num = 1, 0

excel_file = openpyxl.Workbook()
excel_sheet = excel_file.active
excel_sheet.column_dimensions['B'].width = 100
excel_sheet.column_dimensions['C'].width = 100
excel_sheet.append(['랭킹', '제목', '링크'])

for index in range(10):
    start_number = start + (index * 100)
    naver_open_api = 'https://openapi.naver.com/v1/search/shop.json?query=샤오미&display=100&start=' + str(start_number)
    header_params = {"X-Naver-Client-Id":client_id, "X-Naver-Client-Secret":client_secret}
    res = requests.get(naver_open_api, headers=header_params)
    if res.status_code == 200:
        data = res.json()
        for item in data['items']:
            num += 1
            excel_sheet.append([num, item['title'], item['link']])
    else:
        print ("Error Code:", res.status_code)

excel_file.save('IT.xlsx')
excel_file.close()