## Open API(Rest API)를 활용한 크롤링

### Open API(Rest API)란?
 - **API:** Application Programming Interface의 약자로, 특정 프로그램을 만들기 위해 제공되는 모듈(함수 등)을 의미
 - **Open API:** 공개 API라고도 불리우며, 누구나 사용할 수 있도록 공개된 API (주로 Rest API 기술을 많이 사용함)
 - **Rest API:** Representational State Transfer API의 약자로, HTTP프로토콜을 통해 서버 제공 기능을 사용할 수 있는 함수를 의미
   - 일반적으로 XML, JSON의 형태로 응답을 전달(원하는 데이터 추출이 수월)
   - [참고 - RestAPI란](http://hyunalee.tistory.com/1)

### JSON 이란?
 - JavaScript Object Notation 줄임말
 - 웹환경에서 서버와 클라이언트 사이에 데이터를 주고 받을때 많이 사용
   - Rest API가 주요한 예제
 - JSON 포멧 예 <br>
 { "id":"01", "language": "Java", "edition": "third", "author": "Herbert Schildt" }
 <br>
 <br>
 
 - 참고 (https://books.google.co.kr/books?id=euSiAwAAQBAJ&pg=PT1755&lpg=PT1755&dq=json+%EC%9E%A5%EC%A0%90&source=bl&ots=VjTIoOjbTK&sig=3t7MXA7g2CvEi8SyD0-GQVywzw0&hl=ko&sa=X&ved=0ahUKEwiwo8OvxJfWAhXDsJQKHYaBDpI4ChDoAQhVMAg#v=onepage&q=json%20%EC%9E%A5%EC%A0%90&f=false)

 출처: http://dpug.tistory.com/67#.WbycWshJaUk [퍼그의 전초기지]

In [4]:
import json

# 네이버 쇼핑에서, android 라는 키워드로 검색한 상품 리스트 결과
data = """
{
    "lastBuildDate": "Thu, 14 Jan 2021 16:19:35 +0900",
    "total": 23203,
    "start": 1,
    "display": 10,
    "items": [
        {
            "title": "“갤럭시S21 언팩 홍보에 아이폰이 왜 나와?” 소동 뭐길래? [IT선빵!]",
            "originallink": "http://news.heraldcorp.com/view.php?ud=20210114000869",
            "link": "https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=105&oid=016&aid=0001779271",
            "description": "지난해 10월 애플 트위터 계정(@AppleSupport)에 올라온 워치운영체계(OS) 홍보에 ‘Twitter for <b>Android</b>(안드로이드에서 올림)’ 문구가 포착, 약 7분여만에 급히 수정됐다. 지난 2018년에는 애플 뮤직 트위터(@AppleMusic)... ",
            "pubDate": "Thu, 14 Jan 2021 14:54:00 +0900"
        },
        {
            "title": "Hyundai Motor Group to Introduce iPhone Digital Key",
            "originallink": "http://www.businesskorea.co.kr/news/articleView.html?idxno=58446",
            "link": "http://www.businesskorea.co.kr/news/articleView.html?idxno=58446",
            "description": "Its digital key is currently limited to Samsung and LG <b>Android</b> smartphones. The group recently... BMW and Apple unveiled it in June last year and <b>Android</b> phone users cannot use the same technology... ",
            "pubDate": "Thu, 14 Jan 2021 09:03:00 +0900"
        },
        {
            "title": "Millions Flock to Telegram and Signal as Fears Grow Over Big Tech",
            "originallink": "https://www.nytimes.com/2021/01/13/technology/telegram-signal-apps-big-tech.html?partner=naver",
            "link": "https://www.nytimes.com/2021/01/13/technology/telegram-signal-apps-big-tech.html?partner=naver",
            "description": "1 app in 70 countries on iOS devices and in 45 countries on <b>Android</b> devices, with India being one of the biggest areas of new user growth. For both Signal and Telegram, new installations came... ",
            "pubDate": "Thu, 14 Jan 2021 07:53:00 +0900"
        },
        {
            "title": "The Capitol Was Just the Start",
            "originallink": "https://www.nytimes.com/2021/01/13/opinion/capitol-riot-internet.html?partner=naver",
            "link": "https://www.nytimes.com/2021/01/13/opinion/capitol-riot-internet.html?partner=naver",
            "description": "To hear more audio stories from publishers like The New York Times, download Audm for iPhone or <b>Android</b>. These were not just the Trump loyalists of lore, that economically marginalized, over... ",
            "pubDate": "Thu, 14 Jan 2021 05:02:00 +0900"
        },
        {
            "title": "4 Ways to Do More With Your Smartphone Camera",
            "originallink": "https://www.nytimes.com/2021/01/13/technology/personaltech/smartphone-camera-do-more.html?partner=naver",
            "link": "https://www.nytimes.com/2021/01/13/technology/personaltech/smartphone-camera-do-more.html?partner=naver",
            "description": "for <b>Android</b> and Apple’s Camera app for the iOS system on its iPhones. Get Hands-Free Help Your... Google Assistant is available for <b>Android</b> and iOS. Apple’s Siri assistant also responds to... ",
            "pubDate": "Wed, 13 Jan 2021 23:02:00 +0900"
        },
        {
            "title": "OnePlus Band release date, features: Rookie fitness tracker receives lac...",
            "originallink": "https://www.econotimes.com/OnePlus-Band-release-date-features-Rookie-fitness-tracker-receives-lackluster-reviews-in-comparison-with-Xiaomi-Mi-Band-5-1600020",
            "link": "https://www.econotimes.com/OnePlus-Band-release-date-features-Rookie-fitness-tracker-receives-lackluster-reviews-in-comparison-with-Xiaomi-Mi-Band-5-1600020",
            "description": "In the experience of <b>Android</b> Authority, the device’s ability to consistently and accurately... Granted that activating all trackers and sensors will drastically decrease battery life, <b>Android</b>... ",
            "pubDate": "Wed, 13 Jan 2021 15:09:00 +0900"
        },
        {
            "title": "현대 아반떼 ‘2021 북미 올해의 차’ 수상…9년만의 재 수상",
            "originallink": "http://www.smartfn.co.kr/view.php?ud=2021011310533095137c01d83724_46",
            "link": "http://www.smartfn.co.kr/view.php?ud=2021011310533095137c01d83724_46",
            "description": "파라메트릭 다이내믹스 디자인을 테마로 한 드라마틱한 4도어 쿠페 룩이 살아있으며 세그먼트 최초로 무선 애플 카플레이(Apple CarPlay ™) 와 안드로이드오토(<b>Android</b> Auto ™), 현대 디지털 키 등 첨단 기능을... ",
            "pubDate": "Wed, 13 Jan 2021 10:56:00 +0900"
        },
        {
            "title": "[CES 2021 All Digital] 교세라(Kyocera) Ultra 5G UW, Ultra-Rught <b>Android</b> ...",
            "originallink": "http://kr.aving.net/news/view.php?articleId=1589079&Branch_ID=kr&rssid=naver&mn_name=news",
            "link": "http://kr.aving.net/news/view.php?articleId=1589079&Branch_ID=kr&rssid=naver&mn_name=news",
            "description": "Kyocera는 Verizon 5G UW(Ultra Wideband) 네트워크를 통해 초내구성과 초고속 속도, 초저 지연성을 제공하는 최초의 DuraForce Ultra 5G UW를 공개했다. DuraForce Ultra 5G는 Kyocera의 10년 이상의 견고한 장치 전문 지식을... ",
            "pubDate": "Wed, 13 Jan 2021 10:41:00 +0900"
        },
        {
            "title": "엘란트라 “2021 북미 올해의 차’",
            "originallink": "http://www.koreatimes.com/article/1345198",
            "link": "http://www.koreatimes.com/article/1345198",
            "description": "글로벌 베스트셀링 모델 엘란트라는 ▲드라마틱한 4도어 쿠페 등 미래를 담아낸 파격 디자인 ▲3세대 신규 플랫폼으로 빚어낸 탄탄한 기본기 ▲동급 최초 무선 Apple CarPlay™/<b>Android</b> Auto™ 및 현대 디지털 키 적용... ",
            "pubDate": "Wed, 13 Jan 2021 10:12:00 +0900"
        },
        {
            "title": "현대차 아반떼 '2021 북미 올해의 차' 수상..SUV 인기 뛰어넘은 성과",
            "originallink": "http://kpenews.com/View.aspx?No=1414649",
            "link": "http://kpenews.com/View.aspx?No=1414649",
            "description": "파라메트릭 다이내믹스 디자인을 테마로 한 드라마틱한 4도어 쿠페 룩이 살아있으며, 세그먼트 최초로 무선 애플 카플레이(Apple CarPlay) 와 안드로이드오토(<b>Android</b> Auto), 현대 디지털 키 등 첨단 기능을 탑재했다.... ",
            "pubDate": "Wed, 13 Jan 2021 09:57:00 +0900"
        }
    ]
}
"""

json_data = json.loads(data)
print (json_data['items'][0]['title'])
print (json_data['items'][0]['link'])


“갤럭시S21 언팩 홍보에 아이폰이 왜 나와?” 소동 뭐길래? [IT선빵!]
https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=105&oid=016&aid=0001779271


### 네이버 검색 Open API를 이용한 크롤링 초간단 실습
 - https://developers.naver.com/main/
 - [블로그 검색 가이드 문서](https://developers.naver.com/docs/search/blog/)
   - 네이버 Open API 이용신청 [참고](http://hnark.tistory.com/135)

- postman 설치 (https://www.getpostman.com/downloads/) 
  - (상세 가이드: http://www.a-mean-blog.com/ko/blog/Node-JS-API/_/API-%ED%85%8C%EC%8A%A4%ED%8A%B8-%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%A8-Postman-%EC%84%A4%EC%B9%98%EB%B0%8F-%EA%B0%84%EB%8B%A8-%EC%82%AC%EC%9A%A9%EB%B2%95)

- 사용법
   1. Sign Up in Postman
   2. Insert https://openapi.naver.com/v1/search/news.json?query=스마트 into GET
   3. Add X-Naver-Client-Id(key), <font color="blue">CsODwdUTyG9vOI1uIeIf</font>(value) into Headers
   4. Add X-Naver-Client-Secret(key), <font color="blue">YmIx0GW8JG</font>(value) into Headers
   5. Send
   <img src="postman.png" />

- [참고: 네이버 Open API HTTP 응답 상태 에러 코드 목록1](https://developers.naver.com/docs/common/openapiguide/#/errorcode.md)
- [참고: 일반적인 HTTP 응답 상태 코드](http://ooz.co.kr/260) 

### 네이버 Open API 사용하기

In [41]:
import requests
import pprint

client_id = "ffwHx7CC3Ss4eiUkCspN"
client_secret = "_3qkPRRwc6"

naver_open_api = "https://openapi.naver.com/v1/search/news.json?query=갤럭시s21"
header_params = {"X-Naver-Client-Id": client_id, "X-Naver-Client-Secret": client_secret}
res = requests.get(naver_open_api, headers=header_params)

if res.status_code == 200:
    data = res.json()
    for index, item in enumerate(data['items']):
        print(index + 1, item['title'], item['link'])
else:
    print("Error Code: ", res.status_code)

1 <b>갤럭시S21</b> 사전예약 경쟁…KT도 최고 50만원으로 상향 https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=105&oid=277&aid=0004829702
2 이베이코리아, 삼성전자 '<b>갤럭시 S21</b>' 시리즈 예약 판매 http://www.newslock.co.kr/news/articleView.html?idxno=35314
3 <b>갤럭시 S21</b> 사전예약 가격 공개…S20보다 저렴해 https://www.itbiznews.com/news/articleView.html?idxno=28089
4 [뉴시스Pic] 사진으로 본 일주일 https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=102&oid=003&aid=0010297259
5 ‘어 애니콜이네!’ 이건희폰 갤버즈 프로 케이스 화제 https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=105&oid=018&aid=0004830086
6 “24만원→50만원” KT ‘<b>갤럭시S21</b>’ 지원금 하루 만에 2배로! https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=105&oid=016&aid=0001780029
7 뉴버스폰, <b>갤럭시S21</b> 공개 사전예약 혜택 진행 http://www.incheonilbo.com/news/articleView.html?idxno=1075736
8 <b>갤럭시S21</b> 공개 사전예약 진행, 'S20 BTS·노트20 울트라' 이벤트 진행 http://www.lawissue.co.kr/view.php?ud=2021011609224658636cf2d78c68_12
9 삼성카드, 21일까지 '<b>갤럭시S21</b>' 사전예약 구매 혜택 http://www.shinailbo.co.kr/news/articleView.html?

In [61]:
import requests
import openpyxl

client_id = "ffwHx7CC3Ss4eiUkCspN"
client_secret = "_3qkPRRwc6"
start, num = 1, 0

excel_file = openpyxl.Workbook()
excel_sheet = excel_file.active
excel_sheet.column_dimensions['B'].width = 100
excel_sheet.column_dimensions['C'].width = 100
excel_sheet.append(['랭킹', '제목', '링크'])

for i in range(1, 4):
    cell = excel_sheet.cell(row=1, column=i)
    cell.alignment = openpyxl.styles.Alignment(horizontal='center')

for index in range(10):
    start_number = start + (index * 100)
    naver_open_api = "https://openapi.naver.com/v1/search/news.json?query=갤럭시노트20&display=100&start=" + str(start_number)
    header_params = {"X-Naver-Client-Id": client_id, "X-Naver-Client-Secret": client_secret}
    res = requests.get(naver_open_api, headers=header_params)

    if res.status_code == 200:
        data = res.json()
        for item in data['items']:
            num += 1
            excel_sheet.append([num, item['title'], item['link']])
    else:
        print("Error Code: ", res.status_code)

excel_file.save('shoppting_with_galaxy.xlsx')
excel_file.close()