## 크롤링 및 데이터베이스 저장함수 생성

In [4]:
%%writefile naver.py


from fake_useragent import UserAgent
from selenium import webdriver
import os
from PIL import Image as pil
import re
import pandas as pd
import time
import requests
from sqlalchemy import *
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker


class Naver:
    def __init__(self, region="09"):
        options = webdriver.ChromeOptions()
        options.add_argument("headless")
        options.add_argument("user-agent={}".format(UserAgent().chrome))
        self.driver = webdriver.Chrome("/usr/local/bin/chromedriver",options=options)
        url = "https://m.naver.com/history/?menu=PLACE_{}".format(region)
        self.driver.get(url)
        self.df = None
        self.datas2 = []
        self.datas3 = []
        self.view = { "06" : "대구.경북", "10" : "울산.경남", "13" : "전북", "05" : "광주.전남", "16" : "충북",
                     "07" : "대전.세종.충남", "14" : "제주", "01" : "강원", "08" : "부산", "11" : "인천", "02" : "경기",
                     "09" : "서울"}



    def crawling(self):
        datas = []
      
        for region, name in self.view.items():
            url = "https://m.naver.com/history/?menu=PLACE_{}".format(region)
            self.driver.get(url)
            elements = self.driver.find_elements_by_css_selector(".cvr_list_item")

            for element in elements:
                data = ({
#                    'rank': element.find_element_by_css_selector(".cvr_li_ranking").text.replace("순위\n", ""),
                    'title': element.find_element_by_css_selector(".cvr_info_title").text,
                    'link': element.find_element_by_css_selector(".cvr_li_link").get_attribute("href"),
                    'region' : name
                })
                datas.append(data)
        self.df = pd.DataFrame(datas)
        
    def crawling_1(self):

        for link in self.df["link"]:
        
            url2 = "https://blog.like.naver.com/v1/search/contents?suppress_response_codes=\true&q=BLOG[{}_{}]&isDuplication=true".format(link.split('/')[-2], link.split('/')[-1])
            self.driver.get(url2)
            response = requests.get(url2)
            try:  
                self.datas2.append(re.findall("\"count\":([\d]+)", response.text)[0])
            except:
                self.datas2.append("")
            url3 = link
            self.driver.get(url3)
            try:
                self.datas3.append(self.driver.find_element_by_css_selector(".blog_date").text)
            except:
                self.datas3.append("")
        
        
        self.df["rank"] = self.datas2
        self.df["date"] = self.datas3
        return self.df
    
    def close(self):
        self.driver.quit()  
        
    def save(self):
        engine = create_engine("mysql://root:dss@15.165.125.84:3306/project?charset=utf8", encoding='utf-8')
        self.df.to_sql(name="region", con=engine, if_exists="append", index=False)    

Writing naver.py


In [5]:
%%writefile setup.py

# setup.py 생성 및 설정

from setuptools import setup, find_packages

setup(
    name='dss.naver',
    packages=find_packages(),
    include_package_data=True,
    version="0.0.1",
    author='Fast Campus, inc.',
    author_email="yeoyeongung@gmail.com",
    zip_safe=False,
)

Writing setup.py


In [6]:
# setup.py를 통해 만든 naver module 설치하기

!python setup.py develop

running develop
running egg_info
creating dss.naver.egg-info
writing dss.naver.egg-info/PKG-INFO
writing dependency_links to dss.naver.egg-info/dependency_links.txt
writing top-level names to dss.naver.egg-info/top_level.txt
writing manifest file 'dss.naver.egg-info/SOURCES.txt'
reading manifest file 'dss.naver.egg-info/SOURCES.txt'
writing manifest file 'dss.naver.egg-info/SOURCES.txt'
running build_ext
Creating /home/ubuntu/.pyenv/versions/3.6.9/envs/python3/lib/python3.6/site-packages/dss.naver.egg-link (link to .)
dss.naver 0.0.1 is already the active version in easy-install.pth

Installed /home/ubuntu/python3/notebooks/crawling_project
Processing dependencies for dss.naver==0.0.1
Finished processing dependencies for dss.naver==0.0.1


In [7]:
!pip list | grep naver

dss.naver             0.0.1     /home/ubuntu/python3/notebooks/crawling_project


In [1]:
import naver as nv

In [2]:
naver = nv.Naver()

In [3]:
naver.crawling()

In [4]:
naver.df

Unnamed: 0,title,link,region
0,트인 곳에서 즐기는 대구 달성현대미술제 실외전시,https://m.blog.naver.com/daeguvisit/222090027381,대구.경북
1,성큼 다가온 가을과 함께 경산 금호강변 힐링 산책,https://m.blog.naver.com/gbnadri/222090200532,대구.경북
2,예술가들의 정취를 느껴보는 대구 남구 대명공연거리,https://m.blog.naver.com/daegu_namgu/222090079611,대구.경북
3,비대면 여행 가기 좋은 안동 비밀의 숲 낙강물길공원,https://m.blog.naver.com/andongcity00/22208865...,대구.경북
4,가을 하늘과 바다가 있는 포항 이가리 닻 전망대,https://m.blog.naver.com/gbnadri/222086506209,대구.경북
5,언택트 시대에 맞춰 가기 좋은 울산의 숨은 관광지,https://m.blog.naver.com/ulsannuri/222089055291,울산.경남
6,새롭게 바뀐 통영 진두마을·봉암마을에서 즐기는 힐링,https://m.blog.naver.com/tongyeongsi/222067119893,울산.경남
7,소소한 일상에서 쉬어갈 수 있는 김해 생림면 마사마을,https://m.blog.naver.com/gimhae4you/222089270500,울산.경남
8,반려동물과 함께 힐링할 수 있는 밀양 뷰 맛집 카페,https://m.blog.naver.com/miryangsi/222076860545,울산.경남
9,반짝반짝 영롱함 끝판왕! 울산 야경 명소 5곳 추천,https://m.blog.naver.com/ulsannuri/222086355798,울산.경남


In [5]:
naver.crawling_1()

Unnamed: 0,title,link,region,rank,date
0,트인 곳에서 즐기는 대구 달성현대미술제 실외전시,https://m.blog.naver.com/daeguvisit/222090027381,대구.경북,90.0,2020. 9. 15. 13:34
1,성큼 다가온 가을과 함께 경산 금호강변 힐링 산책,https://m.blog.naver.com/gbnadri/222090200532,대구.경북,101.0,2020. 9. 15. 16:36
2,예술가들의 정취를 느껴보는 대구 남구 대명공연거리,https://m.blog.naver.com/daegu_namgu/222090079611,대구.경북,21.0,2020. 9. 15. 14:32
3,비대면 여행 가기 좋은 안동 비밀의 숲 낙강물길공원,https://m.blog.naver.com/andongcity00/22208865...,대구.경북,24.0,2020. 9. 14. 11:00
4,가을 하늘과 바다가 있는 포항 이가리 닻 전망대,https://m.blog.naver.com/gbnadri/222086506209,대구.경북,123.0,2020. 9. 11. 11:58
5,언택트 시대에 맞춰 가기 좋은 울산의 숨은 관광지,https://m.blog.naver.com/ulsannuri/222089055291,울산.경남,43.0,2020. 9. 14. 13:39
6,새롭게 바뀐 통영 진두마을·봉암마을에서 즐기는 힐링,https://m.blog.naver.com/tongyeongsi/222067119893,울산.경남,52.0,2020. 9. 14. 9:17
7,소소한 일상에서 쉬어갈 수 있는 김해 생림면 마사마을,https://m.blog.naver.com/gimhae4you/222089270500,울산.경남,65.0,2020. 9. 14. 17:21
8,반려동물과 함께 힐링할 수 있는 밀양 뷰 맛집 카페,https://m.blog.naver.com/miryangsi/222076860545,울산.경남,44.0,2020. 9. 10. 13:00
9,반짝반짝 영롱함 끝판왕! 울산 야경 명소 5곳 추천,https://m.blog.naver.com/ulsannuri/222086355798,울산.경남,27.0,2020. 9. 11. 8:58


In [6]:
naver.df

Unnamed: 0,title,link,region,rank,date
0,트인 곳에서 즐기는 대구 달성현대미술제 실외전시,https://m.blog.naver.com/daeguvisit/222090027381,대구.경북,90.0,2020. 9. 15. 13:34
1,성큼 다가온 가을과 함께 경산 금호강변 힐링 산책,https://m.blog.naver.com/gbnadri/222090200532,대구.경북,101.0,2020. 9. 15. 16:36
2,예술가들의 정취를 느껴보는 대구 남구 대명공연거리,https://m.blog.naver.com/daegu_namgu/222090079611,대구.경북,21.0,2020. 9. 15. 14:32
3,비대면 여행 가기 좋은 안동 비밀의 숲 낙강물길공원,https://m.blog.naver.com/andongcity00/22208865...,대구.경북,24.0,2020. 9. 14. 11:00
4,가을 하늘과 바다가 있는 포항 이가리 닻 전망대,https://m.blog.naver.com/gbnadri/222086506209,대구.경북,123.0,2020. 9. 11. 11:58
5,언택트 시대에 맞춰 가기 좋은 울산의 숨은 관광지,https://m.blog.naver.com/ulsannuri/222089055291,울산.경남,43.0,2020. 9. 14. 13:39
6,새롭게 바뀐 통영 진두마을·봉암마을에서 즐기는 힐링,https://m.blog.naver.com/tongyeongsi/222067119893,울산.경남,52.0,2020. 9. 14. 9:17
7,소소한 일상에서 쉬어갈 수 있는 김해 생림면 마사마을,https://m.blog.naver.com/gimhae4you/222089270500,울산.경남,65.0,2020. 9. 14. 17:21
8,반려동물과 함께 힐링할 수 있는 밀양 뷰 맛집 카페,https://m.blog.naver.com/miryangsi/222076860545,울산.경남,44.0,2020. 9. 10. 13:00
9,반짝반짝 영롱함 끝판왕! 울산 야경 명소 5곳 추천,https://m.blog.naver.com/ulsannuri/222086355798,울산.경남,27.0,2020. 9. 11. 8:58


In [7]:
naver.save()

In [8]:
naver.close()

In [3]:
!pip uninstall dss.naver -y



In [14]:
!pip list | grep naver

### 데이터 베이스 저장


In [None]:
%%writefile project.py
import naver as nv

naver = nv.Naver()
naver.crawling()
naver.crawling_1()
naver.save()
naver.close()

### 슬랙 카카오톡으로 메세지 전송

In [None]:
%%writefile weekend.py
from sqlalchemy import *
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker
import json
import requests
import pandas as pd
import numpy as np

engine = create_engine("mysql://root:dss@15.165.125.84:3306/project?charset=utf8", encoding='utf-8')
QUERY = """
    SELECT *
    FROM region
"""

naver_df = pd.read_sql(QUERY, engine)
naver_dfff = naver_df.loc[naver_df["rank"] != "", :]
naver_df1 = naver_dfff.loc[naver_dfff["date"] != "", :]
naver_df1["rank"] = naver_df1["rank"].astype("int")
naver_df1.sort_values(by="rank", ascending=False, inplace=True)
naver_df1.drop_duplicates(subset="title", inplace=True, keep='first')
naver_df1 = naver_df1.loc[naver_df1["region"] == "경기",:]

datas = []

naver_df1["today"] = pd.datetime.now().date()
naver_df1["date"] = naver_df1["date"].astype('datetime64[ns]').dt.date
naver_df1["time"] = naver_df1["today"]-naver_df1["date"]
naver_df1["time"] = naver_df1["time"].astype("str").str.replace(" days 00:00:00.000000000", "").astype("int")

for i in naver_df1["time"]:
    if i <= 7:
        datas.append(3)
    elif 7<i<=14:
        datas.append(2)        
    elif 14<i<=21:
        datas.append(1)     
    else:
        datas.append(0)
        
naver_df1["time_score"] = datas     
naver_df1["point"] = naver_df1["rank"]*1 + naver_df1["time_score"]*20
naver_df1.sort_values(by="point", ascending=False, inplace=True)


# 슬랙 보내기
webhook = "https://hooks.slack.com/services/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"
payload = {
    "channel":"#yong",
    "username":"도도용",
    "text": "===============================\n\
    네이버 우리동네판 베스트 5 블로그 지역정보\n\
    ==============================="
}
requests.post(webhook, json.dumps(payload))
for i in np.arange(0,5):
    webhook = "https://hooks.slack.com/services/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"
    payload = {
        "channel":"#yong",
        "username":"도도용",
        "text": "{} 순위 지역 : {},  날짜 : {} \n\
            {} : {}".format((i+1) ,naver_df1.iloc[i,2], naver_df1.iloc[i,4],naver_df1.iloc[i,0], naver_df1.iloc[i,1])
    }
    requests.post(webhook, json.dumps(payload))
    

# 카카오톡 보내기
user_data = {'access_token': '93dyByLndcp2oGJpzJq-vXuDD5gCR5oo_bJ47Qo9dNkAAAF0wnqpNA',
 'token_type': 'bearer',
 'refresh_token': 'gC7EXJmpQqMoQL7l7O1BgaIwI5MUfpJJ6i7IqQo9dNkAAAF0wnqpMw',
 'expires_in': 21599,
 'scope': 'talk_message profile',
 'refresh_token_expires_in': 5183999}
app_key = "d4149ce7884af103149bafa3bd626349"
url = "https://kapi.kakao.com/v2/api/talk/memo/default/send"
for i in np.arange(0,5):
    params = {
    "object_type" : "text",
    "text": "{} 순위 지역 : {},  날짜 : {} \n\
            {} {}".format((i+1) ,naver_df1.iloc[i,2], naver_df1.iloc[i,4],naver_df1.iloc[i,0], naver_df1.iloc[i,1]),
    "link" : {"mobile_web_url" : naver_df1.iloc[i,1],
              "web_url" : naver_df1.iloc[i,1]},
    "button_title" : "위 링크 클릭하세요!"
            }

    headers = {
    "Content-Type" : "application/x-www-form-urlencoded",
    "Authorization": "Bearer {}".format(user_data["access_token"])
        }

    payload = "template_object=" + str(json.dumps(params))
    response = requests.post(url, payload, headers=headers)

response