# 네이버 블로그 크롤링 - 제주 맛집

In [112]:
from selenium import webdriver
from bs4 import BeautifulSoup 
import time
import pandas as pd 
from urllib.parse import quote

In [113]:
url = f'https://search.naver.com/search.naver?where=view&sm=tab_jum&query={quote("제주맛집")}'
driver = webdriver.Chrome('chromedriver.exe')
driver.get(url)
time.sleep(2)

In [114]:
# blog페이지를 아래로 내려서 많은 데이터 확보
from selenium.webdriver.common.keys import Keys

body = driver.find_element_by_tag_name('body')
for _ in range(30):
    body.send_keys(Keys.PAGE_DOWN)
    time.sleep(1)

In [115]:
soup = BeautifulSoup(driver.page_source)

In [116]:
lis = soup.select('li.bx._svp_item')
len(lis)

110

In [117]:
li = lis[0]

- ### 제목

In [118]:
title = li.select_one('.api_txt_lines.total_tit._cross_trigger').get_text()
title

'만족뿐인 제주 맛집 공유'

- ### 날짜

In [119]:
date = li.select_one('.sub_time.sub_txt').get_text().strip()
date

'2021.11.19.'

- ### 글,후기

In [120]:
desc = li.select_one('.api_txt_lines.dsc_txt').get_text().strip()
desc

'지난 주말 친구들과 제주여행을 떠났다가 이름알려진 제주 맛집에 갔다왔어요. 전복뚝배기부터 고등어조림,쌈밥 등 풍성한 음식에 아름다운 바다풍경까지 감상할 수 있었던 식당으로 만족스러웠던 곳이랍니다. 1....'

- ### href 구하기

In [121]:
href = li.select_one('.total_dsc._cross_trigger')['href']
href

'https://blog.naver.com/tok4/222573156818'

- ### 날짜 처리하기

In [122]:
from datetime import datetime, timedelta

In [123]:
today = datetime.now()                 # datetime.today() 해도 됨.
today

datetime.datetime(2021, 12, 8, 11, 59, 35, 191594)

In [124]:
today.year, today.month, today.day

(2021, 12, 8)

- ### 날자가 '어제' 일때

In [125]:
date = today - timedelta(1)
f'{date.year}.{date.month}.{date.day}.'

'2021.12.7.'

- ### 날짜가 ' 6일 전' 일때

In [126]:
date = today - timedelta(6)                     # timedelta( days = 6 ) 생략
f'{date.year:02d}.{date.month:02d}.{date.day:02d}.'

'2021.12.02.'

- ### 날짜가 '13시간 전' 일때

In [127]:
date = today - timedelta(hours=13)
f'{date.year}.{date.month:02d}.{date.day:02d}.'

'2021.12.07.'

- ### 날짜가 ' 45분 전 ' 일때

In [128]:
date = today - timedelta(minutes=45)
f'{date.year}.{date.month:02d}.{date.day:02d}.'

'2021.12.08.'

- ### 위에 날짜들을 한번에 사용할 수 있는 함수 만들기!

In [129]:
def convert_date(s):
    if len (s) == 11 :
        return s[:-1]

    today = datetime.now()   
    if '어제' in s:
        date = today - timedelta(1)
    elif '분' in s :
        date = today - timedelta(minutes=int(s.split('분')[0]))     #int(s[:-3])
    elif '시간' in s:
        date = today - timedelta(hours=int(s.split('시간')[0]))     #int(s[:-4])
    elif '일' in s:
        date = today - timedelta(days=int(s.split('일')[0]))        #int(s[:-3])
        
    return f'{date.year}.{date.month:02d}.{date.day:02d}.'

In [130]:
before = '20일 전'
convert_date(before)

'2021.11.18.'

- ### 반복문으로 데이터 가져오기

In [131]:
lines = []
for li in lis:
    title = li.select_one('.api_txt_lines.total_tit._cross_trigger').get_text()
    date = li.select_one('.sub_time.sub_txt').get_text().strip()
    desc = li.select_one('.api_txt_lines.dsc_txt').get_text().strip()    
    href = li.select_one('.total_dsc._cross_trigger')['href']
    lines.append([title, convert_date(date),desc,href])

In [132]:
df = pd.DataFrame(lines, columns=['제목','날짜','내용','href'])
df

Unnamed: 0,제목,날짜,내용,href
0,만족뿐인 제주 맛집 공유,2021.11.19,지난 주말 친구들과 제주여행을 떠났다가 이름알려진 제주 맛집에 갔다왔어요. 전복뚝배...,https://blog.naver.com/tok4/222573156818
1,또 생각났던 제주 맛집,2021.12.02.,제가 시킨 제주 비빔국수는 갖은 야채들이 그릇에 알록달록 예쁘게 가득 채워져 있었는...,https://cafe.naver.com/ungsangstory/940466
2,북적였던 제주 맛집 리스트,2021.11.13,무엇보다 비린내 한번 느껴지지 않아 배가 부른 상태였음에도 쉽사리 남길 수가 없었던...,https://blog.naver.com/caucommando/222564796496
3,감격했던 제주 맛집 소개,2021.11.15,얼마 전 친구들과 제주로 여행갔다가 현지인께 추천받은 제주 맛집에 다녀왔어요. 갓 ...,https://blog.naver.com/topnotchlady/222568948674
4,제주도 가볼만한곳 제주 맛집,2021.12.01.,제주도 가볼만한곳 제주 맛집은 깔끔한 메뉴가 푸짐하게 나오기로 소문 난 곳이라 부담...,https://cafe.naver.com/gangmok/1543161
...,...,...,...,...
105,제쇼 12월 제주맛집 공유상 진행합니다.^^,2021.12.06.,[제쇼 12월 제주맛집 공유상 ] 회원님들의 제주맛집 또는 제주카페 정보를 공유해주...,https://cafe.naver.com/lovejeju24/72363
106,만족했던 소노벨 제주 맛집,2021.10.19,맛도 퀄리티도 좋았던 곳이라 평소에 족발이나 보쌈 좋아하셨다면 소노벨 제주 맛집 여...,https://cafe.naver.com/cosmania/33406306
107,[제주맛집] 사장님 귀는 당나귀 귀 정호영쉐프가 운영하는 제주 교래리 우동카덴,2021.11.27,그렇지만 아주 특별한 맛은 아닌것 같음. 우동 그릇이 엄청 크고 무거움(세수대야 수...,https://cafe.naver.com/lovejeju24/72006
108,풍요로운 제주 맛집 추천,2021.08.15,이어서 등장만으로도 이목을 집중시킨 제주 맛집 추천의 제주달빛좋은밤이 야심차게 마련...,https://cafe.naver.com/gangmok/1506627


In [133]:
df.to_csv('네이버-제주맛집.csv',index=False)

In [134]:
driver.close()