## 네이버 OPEN API
### 인증 여부에 따라 구분
- 로그인 방식 오픈 API
- 비로그인 방식 오픈 API
    - HTTP 헤더에 클라이언트 아이디와 클라이언트 시크릿 값만 전송해 사용할 수 있는 오픈 API
    - 네이버 아이디로 로그인의 인증을 통한 접근 토큰을 획득할 필요가 없음
    - 검색, 공유하기, 지도, 캡차(이미지) 등의 오픈 API
- 개발자 센터에 개발자 등록 후
    - client_id 와 client_key를 발급받아 사용

In [1]:
# 네이버 검색 API는 블로그부터 전문자료까지 호출방법이 동일
# 블로그 검색 - 네이버 검색 Open API에서 제공하는 예제
import os
import sys
import urllib.request

In [2]:
# 네이버 검색 Open API 예제 - 블로그 검색
client_id = "pOdfwRraC5W55dxPeRPQ"
client_secret = "8jQTYZWryv"
encText = urllib.parse.quote("강남역")
url = "https://openapi.naver.com/v1/search/blog?query=" + encText # json 결과
# url = "https://openapi.naver.com/v1/search/blog.xml?query=" + encText # xml 결과
request = urllib.request.Request(url)
request.add_header("X-Naver-Client-Id",client_id)
request.add_header("X-Naver-Client-Secret",client_secret)
response = urllib.request.urlopen(request)
rescode = response.getcode()
# 400 : 클라이언트 문제
# 500 : 서버문제
if(rescode==200):
    response_body = response.read()
    print(response_body.decode('utf-8'))
else:
    print("Error Code:" + rescode)

{
	"lastBuildDate":"Thu, 28 Jul 2022 13:52:46 +0900",
	"total":1925484,
	"start":1,
	"display":10,
	"items":[
		{
			"title":"매료됐던 <b>강남역<\/b> 고기집",
			"link":"https:\/\/blog.naver.com\/speednet05?Redirect=Log&logNo=222811527824",
			"description":"얼마 전 오랜만에 만난 지인들과 강남에 갔다 항정살로 유명한 <b>강남역<\/b> 고기집을 찾아갔어요. 생고기 못지 않게 수준급 육질이였고, 추가로 시킨 사이드메뉴까지 특별난 맛을 자랑한 곳이랍니다. 우리가 방문한... ",
			"bloggername":"열살",
			"bloggerlink":"https:\/\/blog.naver.com\/speednet05",
			"postdate":"20220714"
		},
		{
			"title":"<b>강남역<\/b>임플란트치과 상실된 부분을 수복하여",
			"link":"https:\/\/blog.naver.com\/alexkimhd?Redirect=Log&logNo=222822426691",
			"description":"<b>강남역<\/b>임플란트치과 상실된 부분을 수복하여 치아상실은 여러가지의 원인이 있었어요. 사고나... 영구치가 탈락하고나면 다양한 문제가 생길 수 있기때문에 <b>강남역<\/b>임플란트치과에서 개선할 수 있었어요.... ",
			"bloggername":"강남애프터치과의원 공식블로그",
			"bloggerlink":"https:\/\/blog.naver.com\/alexkimhd",
			"postdate":"20220721"
		},
		{
			"title":"후회없던 <b>강남역<\/b> 고기집 도마3",
			"link":"https:\/\/blog.naver.com\/artkal?Redirect=Log&logNo=2228229974

In [3]:
# requests 함수를 이용해서 요청
# header 구성이 간단함
import requests
from urllib.parse import urlparse # 한글처리
import urllib.parse

In [6]:
client_id = "pOdfwRraC5W55dxPeRPQ"
client_secret = "8jQTYZWryv"

keyword = urllib.parse.quote('강남역')
# 서버측으로 파라미터(요청변수)를 전달할 대 한글은 2바이트이므로 한바이트씩 분리해서 전달해야 함
# quote()는 한글을 통신data로 변경하는 역할을 함
# keyword

# 요청 URL
base_url = 'https://openapi.naver.com/v1/search/blog.json'
param = '?query=' + keyword
url = base_url + param
url

# 인증정보는 header에 포함
headers = {"X-Naver-Client-Id": client_id, 
           "X-Naver-Client-Secret" : client_secret}

# 요청
result = requests.get(url,headers=headers)
result

<Response [200]>

In [7]:
# result 파싱
# json으로 요청했으므로 json type으로 변환해서 추출
json_obj = result.json()
json_obj

{'lastBuildDate': 'Thu, 28 Jul 2022 14:36:52 +0900',
 'total': 1925534,
 'start': 1,
 'display': 10,
 'items': [{'title': '매료됐던 <b>강남역</b> 고기집',
   'link': 'https://blog.naver.com/speednet05?Redirect=Log&logNo=222811527824',
   'description': '얼마 전 오랜만에 만난 지인들과 강남에 갔다 항정살로 유명한 <b>강남역</b> 고기집을 찾아갔어요. 생고기 못지 않게 수준급 육질이였고, 추가로 시킨 사이드메뉴까지 특별난 맛을 자랑한 곳이랍니다. 우리가 방문한... ',
   'bloggername': '열살',
   'bloggerlink': 'https://blog.naver.com/speednet05',
   'postdate': '20220714'},
  {'title': '<b>강남역</b>임플란트치과 상실된 부분을 수복하여',
   'link': 'https://blog.naver.com/alexkimhd?Redirect=Log&logNo=222822426691',
   'description': '<b>강남역</b>임플란트치과 상실된 부분을 수복하여 치아상실은 여러가지의 원인이 있었어요. 사고나... 영구치가 탈락하고나면 다양한 문제가 생길 수 있기때문에 <b>강남역</b>임플란트치과에서 개선할 수 있었어요.... ',
   'bloggername': '강남애프터치과의원 공식블로그',
   'bloggerlink': 'https://blog.naver.com/alexkimhd',
   'postdate': '20220721'},
  {'title': '후회없던 <b>강남역</b> 고기집 도마3',
   'link': 'https://blog.naver.com/artkal?Redirect=Log&logNo=222822997465',
   'description': '입

In [13]:
json_obj['lastBuildDate'] # 요청 후 검색한 시간
json_obj['total'] # 전체 검색 결과
json_obj['start'] # 갖고온 결과의 시작
json_obj['display'] # 몇개의 결과를 갖고 왔는지
len(json_obj['items'])

10

In [14]:
# 네이버 open API가 반환해준 검색 내용
json_obj['items'][0].keys()

dict_keys(['title', 'link', 'description', 'bloggername', 'bloggerlink', 'postdate'])

In [16]:
# items에서 특성 속성값만 추출
for item in json_obj['items'] :
    print(item['title'].replace("<b>","").replace("</b>",""))

매료됐던 강남역 고기집
강남역임플란트치과 상실된 부분을 수복하여
후회없던 강남역 고기집 도마3
이맛이었던 강남역 고기집
강남역 카페 타르트 맛집 타르타르
강남역마사지 만족스러워요!
콜키지프리 가능한 강남역 레스토랑
맛 정말 좋았던 강남역 고기집 봉우이층집
놀라웠던 강남역 회식장소
가성비 좋은 강남역 고기집


In [17]:
for item in json_obj['items'] :
    print(item['title'].replace("<b>","").replace("</b>",""),item['link'])

매료됐던 강남역 고기집 https://blog.naver.com/speednet05?Redirect=Log&logNo=222811527824
강남역임플란트치과 상실된 부분을 수복하여 https://blog.naver.com/alexkimhd?Redirect=Log&logNo=222822426691
후회없던 강남역 고기집 도마3 https://blog.naver.com/artkal?Redirect=Log&logNo=222822997465
이맛이었던 강남역 고기집 https://blog.naver.com/jinhot?Redirect=Log&logNo=222764742330
강남역 카페 타르트 맛집 타르타르 https://blog.naver.com/l4o8v6ez?Redirect=Log&logNo=222824664525
강남역마사지 만족스러워요! https://blog.naver.com/dasul119?Redirect=Log&logNo=222783258275
콜키지프리 가능한 강남역 레스토랑 https://blog.naver.com/eunji4620?Redirect=Log&logNo=222795995803
맛 정말 좋았던 강남역 고기집 봉우이층집 https://blog.naver.com/13qjrmadl?Redirect=Log&logNo=222763678031
놀라웠던 강남역 회식장소 https://blog.naver.com/papalagi2?Redirect=Log&logNo=222765186953
가성비 좋은 강남역 고기집 https://blog.naver.com/sia855?Redirect=Log&logNo=222764823644


### 검색 결과를 10개에서 100개로 늘리기
- 네이버의 검색 결과 기본 값 : 10
- 관련 요청 변수 : display(최대값 100)

In [18]:
client_id = "pOdfwRraC5W55dxPeRPQ"
client_secret = "8jQTYZWryv"

keyword = urllib.parse.quote('강남역')
# 서버측으로 파라미터(요청변수)를 전달할 대 한글은 2바이트이므로 한바이트씩 분리해서 전달해야 함
# quote()는 한글을 통신data로 변경하는 역할을 함
# keyword
num = 100
# 요청 URL
base_url = 'https://openapi.naver.com/v1/search/blog.json'
param = '?query=' + keyword + '&display=' + str(num) 
url = base_url + param
url

# 인증정보는 header에 포함
headers = {"X-Naver-Client-Id": client_id, 
           "X-Naver-Client-Secret" : client_secret}

# 요청
result = requests.get(url,headers=headers)
result

<Response [200]>

In [19]:
json_obj = result.json()
json_obj

{'lastBuildDate': 'Thu, 28 Jul 2022 14:55:27 +0900',
 'total': 1925536,
 'start': 1,
 'display': 100,
 'items': [{'title': '매료됐던 <b>강남역</b> 고기집',
   'link': 'https://blog.naver.com/speednet05?Redirect=Log&logNo=222811527824',
   'description': '얼마 전 오랜만에 만난 지인들과 강남에 갔다 항정살로 유명한 <b>강남역</b> 고기집을 찾아갔어요. 생고기 못지 않게 수준급 육질이였고, 추가로 시킨 사이드메뉴까지 특별난 맛을 자랑한 곳이랍니다. 우리가 방문한... ',
   'bloggername': '열살',
   'bloggerlink': 'https://blog.naver.com/speednet05',
   'postdate': '20220714'},
  {'title': '<b>강남역</b>임플란트치과 상실된 부분을 수복하여',
   'link': 'https://blog.naver.com/alexkimhd?Redirect=Log&logNo=222822426691',
   'description': '<b>강남역</b>임플란트치과 상실된 부분을 수복하여 치아상실은 여러가지의 원인이 있었어요. 사고나... 영구치가 탈락하고나면 다양한 문제가 생길 수 있기때문에 <b>강남역</b>임플란트치과에서 개선할 수 있었어요.... ',
   'bloggername': '강남애프터치과의원 공식블로그',
   'bloggerlink': 'https://blog.naver.com/alexkimhd',
   'postdate': '20220721'},
  {'title': '후회없던 <b>강남역</b> 고기집 도마3',
   'link': 'https://blog.naver.com/artkal?Redirect=Log&logNo=222822997465',
   'description': '

In [20]:
len(json_obj['items'])

100

In [22]:
num = 0
for item in json_obj['items'] :
    num += 1
    print(num,".",item['title'].replace("<b>","").replace("</b>",""),item['link'])


1 . 매료됐던 강남역 고기집 https://blog.naver.com/speednet05?Redirect=Log&logNo=222811527824
2 . 강남역임플란트치과 상실된 부분을 수복하여 https://blog.naver.com/alexkimhd?Redirect=Log&logNo=222822426691
3 . 후회없던 강남역 고기집 도마3 https://blog.naver.com/artkal?Redirect=Log&logNo=222822997465
4 . 이맛이었던 강남역 고기집 https://blog.naver.com/jinhot?Redirect=Log&logNo=222764742330
5 . 강남역 카페 타르트 맛집 타르타르 https://blog.naver.com/l4o8v6ez?Redirect=Log&logNo=222824664525
6 . 강남역마사지 만족스러워요! https://blog.naver.com/dasul119?Redirect=Log&logNo=222783258275
7 . 콜키지프리 가능한 강남역 레스토랑 https://blog.naver.com/eunji4620?Redirect=Log&logNo=222795995803
8 . 맛 정말 좋았던 강남역 고기집 봉우이층집 https://blog.naver.com/13qjrmadl?Redirect=Log&logNo=222763678031
9 . 놀라웠던 강남역 회식장소 https://blog.naver.com/papalagi2?Redirect=Log&logNo=222765186953
10 . 가성비 좋은 강남역 고기집 https://blog.naver.com/sia855?Redirect=Log&logNo=222764823644
11 . 가성비높은 강남역 모임장소 https://blog.naver.com/siver1024?Redirect=Log&logNo=222765155697
12 . 박수쳤던 강남역 점심 맛집 https://blog.naver.com/p03kiwon03?Redirect

### 호출 코드를 함수로 구현
- 네이버 API는 한번에 100개의 결과가 최대
- 100개 이상을 수집하려면 페이지(start)를 넘겨가면서 여러번 호출해야 함
- 함수로 구현해서 여러번 호출 시 사용
- get_api_result(keyword,display)
    - 검색어 설정
    - 최대 100개 내에서 검색 갯수 설정

In [23]:
def get_api_result(key, dis) :
    client_id = "pOdfwRraC5W55dxPeRPQ"
    client_secret = "8jQTYZWryv"

    keyword = urllib.parse.quote(key)
    num = dis
    # 요청 URL
    base_url = 'https://openapi.naver.com/v1/search/blog.json'
    param = '?query=' + keyword + '&display=' + str(num) 
    url = base_url + param
    # 인증정보는 header에 포함
    headers = {"X-Naver-Client-Id": client_id, 
               "X-Naver-Client-Secret" : client_secret}

    # 요청
    result = requests.get(url,headers=headers)
    # json 변환
    json_obj = result.json()
    return json_obj

In [27]:
# 함수 테스트
res = get_api_result('시청',80)['items']
get_api_result('시청',80)['display']

80

In [28]:
res

[{'title': '숨어있던 부산<b>시청</b> 맛집',
  'link': 'https://blog.naver.com/yt2341?Redirect=Log&logNo=222791136992',
  'description': '지난 주말 휴가를 사용해서 부산으로 여행을 다녀오며 미리 알아둔 부산<b>시청</b> 맛집을 찾아갔어요.... 위치도 부산<b>시청</b>역에서 도보로 5분정도 소요되고 저녁에는 와인바처럼 이용하기도 좋겠더라고요. 좋은... ',
  'bloggername': '클로이 Chloe Blog',
  'bloggerlink': 'https://blog.naver.com/yt2341',
  'postdate': '20220627'},
 {'title': '부천<b>시청</b>역 맛집 청기와타운 중동점 부천 소고기 이제 여기로~!',
  'link': 'https://blog.naver.com/codnjswhddn?Redirect=Log&logNo=222829505738',
  'description': '산더미처럼 맛있는 갈비를 지대로 구워서 맛볼 수 있는 부천<b>시청</b>역 맛집 청기와타운 부천중동점... 그야말로 MZ세대를 겨냥한 인테리어 인가용 부천<b>시청</b>역 맛집 이라 썼지만 핫플 느낌이 폴폴 남편도 인테리어가... ',
  'bloggername': '하요하요! 8살1살 하하자매',
  'bloggerlink': 'https://blog.naver.com/codnjswhddn',
  'postdate': '20220726'},
 {'title': '단골하고 싶은 제주 <b>시청</b> 맛집',
  'link': 'https://blog.naver.com/actor_pak?Redirect=Log&logNo=222784017445',
  'description': '며칠 전 제주에 살고있는 친구를 보러갔다가 동네에서 소문이 난 제주 <b>시청</b> 맛집을 들렸어요. 인증된... 제주<b>시청</b>에서 차로 5분정도 소요됐어요

### 함수 수정
- 시작페이지를 지정할 수 있게

In [30]:
def get_api_result(key, dis, start_num) :
    client_id = "pOdfwRraC5W55dxPeRPQ"
    client_secret = "8jQTYZWryv"

    keyword = urllib.parse.quote(key)
    num = dis
    start = start_num
    # 요청 URL
    base_url = 'https://openapi.naver.com/v1/search/blog.json'
    param = '?query=' + keyword + \
            '&display=' + str(num) + \
            '&start='+ str(start)
    
    url = base_url + param
    # 인증정보는 header에 포함
    headers = {"X-Naver-Client-Id": client_id, 
               "X-Naver-Client-Secret" : client_secret}

    # 요청
    result = requests.get(url,headers=headers)
    # json 변환
    json_obj = result.json()
    return json_obj

In [32]:
get_api_result('겨울',100,201)

{'lastBuildDate': 'Thu, 28 Jul 2022 15:32:49 +0900',
 'total': 27132974,
 'start': 201,
 'display': 100,
 'items': [{'title': '호주 멜번 여행, 멜번 6월 옷차림, 호주 <b>겨울</b> 날씨, 멜번 카페 맛집',
   'link': 'https://blog.naver.com/without_wing?Redirect=Log&logNo=222791632029',
   'description': '지난번에 친구가 말해준대로 <b>겨울</b> 패딩 챙겨갔는데 진짜 잘했다 생각 들었음! 호주 <b>겨울</b>옷차림은 지난번에 얘기한 것 처럼 대중없다. 이번엔 어그 신은 남자도 봄.. 반면에 반바지 입고나온 남자도 봄. 아디다스... ',
   'bloggername': 'eternal nostalgia',
   'bloggerlink': 'https://blog.naver.com/without_wing',
   'postdate': '20220628'},
  {'title': '가야 봄여름가을<b>겨울</b> 부산 미분양 아파트 줍줍하세요',
   'link': 'https://blog.naver.com/zjft38777?Redirect=Log&logNo=222777321411',
   'description': '가야 봄여름가을<b>겨울</b> 부산 미분양 아파트 줍줍하세요 무주택자 분들은 부산미분양아파트 좋은... 그리고 가야 봄여름가을<b>겨울</b>의 건설사는 롯데, 현대, 삼성 등 메이저 건설사는 아니지만 근 30년간 부산에서... ',
   'bloggername': '친절한신소장',
   'bloggerlink': 'https://blog.naver.com/zjft38777',
   'postdate': '20220617'},
  {'title': '<b>겨울</b>에 만나는 강원 2: 인제&amp;양구 가볼 만한 곳',
   'link': 'https://

In [None]:
# 검색어와 시작페이지, 추출개수를 전달받아서
# 검색결과에 대해 블로그 제목, 글 링크, 블로거이름을 출력하는 함수

- call_and_print(key,dis_num,start_num)
    - 검색결과에 대해 블로그 제목, 글 링크, 블로거이름을 출력하는 함수

In [33]:
def call_and_print(key,dis_num,start_num) :
    json_obj = get_api_result(key,dis_num,start_num)
    
    for item in json_obj['items'] :
        print(item['title'],item['link'],item['bloggername'])

In [34]:
call_and_print('하늘',100,201)

박노해 시집 너의 <b>하늘</b>을 보아 https://blog.naver.com/jangmi2954?Redirect=Log&logNo=222829231871 운동화,구두,명품,스니커즈,부츠,가방,카시트,유모차
기대이상 영종도 <b>하늘</b>도시 맛집 https://blog.naver.com/dk2fkd?Redirect=Log&logNo=222737113015 순덕이는 순덕순덕해
<b>하늘</b>맛집 계양산성과 계양산 https://blog.naver.com/chorok2800?Redirect=Log&logNo=222798310934 더기의 프랑스자수
트니트니, <b>하늘</b>이 간식주는 아이 d-908 https://blog.naver.com/borori20?Redirect=Log&logNo=222799794014 매일육아
서울캠핑장 : 세 번째 캠핑. 제천 <b>하늘</b>뜨레 서울캠핑장 https://blog.naver.com/kimhjya?Redirect=Log&logNo=222809157261 구구네
경포해변(해수욕장) 모처럼 파란 <b>하늘</b> https://blog.naver.com/uock?Redirect=Log&logNo=222797026004 유쾌한 사진공작소
이 땅에서 약속의 땅 즉 새<b>하늘</b>과 새 땅에 들어가기 위해...  https://blog.naver.com/hiinyoun?Redirect=Log&logNo=222830810847 한사랑의 마음 두드리기
포켓몬스터 영화 - 기라티나와 <b>하늘</b>의 꽃다발 쉐이미 https://blog.naver.com/ssuminn?Redirect=Log&logNo=222816200878 My Place
<b>하늘</b>호수와 떠나는 중미&amp;콜롬비아, 에콰도르 34일 여행, 출발...  https://blog.naver.com/jy9218?Redirect=Log&logNo=222802689997 하늘호수의 세계여행
2022.2.1 오랫만의 파란 <b>하늘</b> https

In [37]:
import pandas as pd
# data 추출 후 저장하는 함수
# def call_and_save(key,dis_num,start_num) :
#     json_obj = get_api_result(key,dis_num,start_num)
    
#     title = [item['title'] for item in json_obj['items']]
#     link = [item['link'] for item in json_obj['items']]
#     b_name = [item['bollgername'] for item in json_obj['items']]
    
#     return pd.DataFrame({'title':title,
#                         'link':title,
#                         'b_name':b_name,})
def call_and_save(key,dis_num,start_num) :
    json_obj = get_api_result(key,dis_num,start_num)
    
    title = [item['title'] for item in json_obj['items']]
    link=[item['link'] for item in json_obj['items']]
    b_name=[item['bloggername'] for item in json_obj['items']]
    
    return pd.DataFrame({'title':title,
                         'link' : link,
                         'b_name' : b_name})


In [38]:
call_and_save('시청',100,1)

Unnamed: 0,title,link,b_name
0,숨어있던 부산<b>시청</b> 맛집,https://blog.naver.com/yt2341?Redirect=Log&log...,클로이 Chloe Blog
1,부천<b>시청</b>역 맛집 청기와타운 중동점 부천 소고기 이제 여기로~!,https://blog.naver.com/codnjswhddn?Redirect=Lo...,하요하요! 8살1살 하하자매
2,단골하고 싶은 제주 <b>시청</b> 맛집,https://blog.naver.com/actor_pak?Redirect=Log&...,Daddy 파크
3,제대로였던 춘천 <b>시청</b> 맛집,https://blog.naver.com/myskynature?Redirect=Lo...,유주의살찌는이유
4,만족스러운 서울 <b>시청</b> 맛집,https://blog.naver.com/lazuli83?Redirect=Log&l...,따뜻한게 좋아♡
...,...,...,...
95,[이벤트] 더위 날리는 &apos;아리아리 화순&apos; 영상 <b>시청</b> ...,https://blog.naver.com/cleanhwasun?Redirect=Lo...,화순군 공식블로그
96,<b>시청</b> 대도회관 탕탕이삼합 찐맛도리,https://blog.naver.com/yuji2774?Redirect=Log&l...,행복은 선택
97,신일전자 X CJ온스타일 최화정쇼 일정 안내 및 <b>시청</b> 인증 EVENT!,https://blog.naver.com/shinil1959?Redirect=Log...,신일 공식 블로그
98,[KINS 영상 <b>시청</b> 이벤트] 한국원자력안전기술원 영상 <b>시청</b...,https://blog.naver.com/kins20?Redirect=Log&log...,한국원자력안전기술원


In [40]:
list(range(1,402,100))

[1, 101, 201, 301, 401]

In [41]:
df_fin = pd.DataFrame()
for start in range(1,402,100) :
    df = call_and_save('시청',100,start)
    df_fin = pd.concat([df_fin,df],axis=0,ignore_index=True)

In [42]:
df_fin.shape

(500, 3)

In [43]:
df_fin.tail()

Unnamed: 0,title,link,b_name
495,꽃게와 밥 / 부천 꽃게와 밥 / 부천 간장게장 맛집 / 부천<b>시청</b>...,https://blog.naver.com/shaki0909?Redirect=Log&...,히토미의 블로그
496,푸짐했던 속초 <b>시청</b> 맛집 소개,https://blog.naver.com/duvmfh0327?Redirect=Log...,깡다맘
497,"서울 지하철 50개 역명 공개 입찰 &apos;강남, <b>시청</b>역 이름 팝니...",https://blog.naver.com/apple0006175?Redirect=L...,WONDER VAPE 강남
498,하남신축빌라 하남<b>시청</b>역 도보4분 스타타운,https://blog.naver.com/sim82007?Redirect=Log&l...,빌라팩토리 심팀장! 내집을 부탁해~~
499,광주 <b>시청</b> 맛집 깔끔하고 든든한 도토리편백집,https://blog.naver.com/lovepink030?Redirect=Lo...,:: 데일리인영 ::


In [44]:
df_fin.to_csv('./crawl_data/naver_blog_시청.csv')

### 뉴스 검색
- 블로그, 뉴스 검색 후 결과를 저장하는 함수 구성
- 블로그와 뉴스에 대한 url 변경되게 구성
- 두 검색에서 동일한 필드를 추출
    - title, link

In [49]:
def call_and_save(sel,key,dis_num,start_num) :
    json_obj = get_api_result(sel,key,dis_num,start_num)
    
    title = [item['title'] for item in json_obj['items']]
    link=[item['link'] for item in json_obj['items']]
    
    return pd.DataFrame({'title':title,
                         'link' : link,
                         'cate' : sel})

In [46]:
def get_api_result(sel, key, dis, start_num) :
    client_id = "pOdfwRraC5W55dxPeRPQ"
    client_secret = "8jQTYZWryv"

    keyword = urllib.parse.quote(key)
    num = dis
    start = start_num
    # 요청 URL
    base_url = 'https://openapi.naver.com/v1/search/'+sel+'.json'
    param = '?query=' + keyword + \
            '&display=' + str(num) + \
            '&start='+ str(start)
    
    url = base_url + param
    # 인증정보는 header에 포함
    headers = {"X-Naver-Client-Id": client_id, 
               "X-Naver-Client-Secret" : client_secret}

    # 요청
    result = requests.get(url,headers=headers)
    # json 변환
    json_obj = result.json()
    return json_obj

In [47]:
get_api_result('news','시청',10,1)

{'lastBuildDate': 'Thu, 28 Jul 2022 16:05:48 +0900',
 'total': 8978074,
 'start': 1,
 'display': 10,
 'items': [{'title': 'NCT 도영, 종영 소감 &quot;정말 소중하고 값진 경험&quot;\xa0',
   'originallink': 'http://news.tf.co.kr/read/entertain/1955023.htm',
   'link': 'https://n.news.naver.com/mnews/article/629/0000163728?sid=106',
   'description': '그려내 <b>시청</b>자들의 좋은 반응을 얻었다. 도영은 종영을 앞두고 &quot;&apos;나를 사랑하지 않는 X에게&apos;를 촬영한 것은... 시호와 저를 응원하면서 지켜봐 주신 팬분들과 <b>시청</b>자분들께 감사드린다&quot;고 진심 어린 소감을 밝혔다. 도영의... ',
   'pubDate': 'Thu, 28 Jul 2022 16:03:00 +0900'},
  {'title': '‘아다마스’ 지성X서지혜X허성태, 살벌한 삼자대면',
   'originallink': 'https://www.newsen.com/news_view.php?uid=202207281600442410',
   'link': 'https://n.news.naver.com/mnews/article/609/0000608660?sid=106',
   'description': '눈앞에서 정체를 간파당한 최총괄이 보안시스템에서 자신을 빼달라는 하우신의 요구를 수락하는 대신 총구를 들이대 <b>시청</b>자들의 간담을 서늘하게 했다. 28일 공개된 사진 속에는 각자의 목표가 맞물린 세 사람의 조합이... ',
   'pubDate': 'Thu, 28 Jul 2022 16:03:00 +0900'},
  {'title': '아프리카TV, ‘2022 GSL 시즌2’ 결승전 29일 개최',
   'o

In [None]:
df_fin = pd.DataFrame()

In [52]:
for start in range(1,402,100) :
    df = call_and_save('blog','시청',100,start)
    df_fin = pd.concat([df_fin,df],axis=0,ignore_index=True)

In [53]:
df_fin.head()
df_fin.tail()

Unnamed: 0,title,link,cate
995,[부산/<b>시청</b>역/분식]... 떡볶이가 땡길 때 부산 신참떡볶이 <b>시청...,https://blog.naver.com/wjywjy0107?Redirect=Log...,blog
996,"대전 둔산동 마라탕 맛집, <b>시청</b>역 근처 &lt;마라공방&gt; 깨끗한...",https://blog.naver.com/heekyeung902?Redirect=L...,blog
997,푸짐했던 속초 <b>시청</b> 맛집 소개,https://blog.naver.com/duvmfh0327?Redirect=Log...,blog
998,꽃게와 밥 / 부천 꽃게와 밥 / 부천 간장게장 맛집 / 부천<b>시청</b>...,https://blog.naver.com/shaki0909?Redirect=Log&...,blog
999,부천<b>시청</b>역 - 2022.7.25,https://blog.naver.com/soapdiary?Redirect=Log&...,blog


In [54]:
df_fin.to_csv('./crawl_data/naver_news_blod_시청.csv')

### 연습문제
- 위 함수 
    - call_and_save, get_api_result 를 
    - 수집하고자 하는 총 갯수를 전달하면 해당 갯수만큼 데이터를 추출해서 df로 반환하도록 수정하시오.
    - call_and_save('news','시청',250) 으로 호출하면 
    - 뉴스에 대해 시청으로 검색한 결과 250개를 추출하여 df로 저장
    - 저장 필드는 title,link
