### 네이버 기사 크롤링
- selenium
- pipeline : database

In [None]:
import scrapy
import requests
from scrapy.http import TextResponse
from selenium import webdriver

#### 1. 프로젝트 생성

In [None]:
!scrapy startproject naver_article

New Scrapy project 'naver_article', using template directory '/home/ubuntu/.pyenv/versions/3.6.9/envs/python3/lib/python3.6/site-packages/scrapy/templates/project', created in:
    /home/ubuntu/notebooks/test/03_scrapy/naver_article

You can start your first spider with:
    cd naver_article
    scrapy genspider example example.com


#### 2. xpath 확인

In [None]:
# link

In [None]:
url = "https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=100"
headers = {"User-Agent": 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.183 Safari/537.36'}
req = requests.get(url, headers=headers)
response = TextResponse(req.url, body=req.text, encoding="utf-8")
response

<200 https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=100>

In [None]:
# photo class가 아닌 dt 엘리먼트를 선택
links = response.xpath('//*[@id="main_content"]/div[2]/ul/li/dl/dt[not(@class="photo")]/a/@href').extract()
len(links), links[0]

(20,
 'https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=018&aid=0004783032')

In [None]:
options = webdriver.ChromeOptions()
options.add_argument("headless")
driver = webdriver.Chrome(options=options)

In [None]:
driver.get(url)

In [None]:
elements = driver.find_elements_by_xpath('//*[@id="main_content"]/div[2]/ul/li/dl/dt[not(@class="photo")]/a')

In [None]:
len(elements)

20

In [None]:
links = [element.get_attribute("href") for element in elements]

In [None]:
print(links[0])

https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=025&aid=0003051267


In [None]:
# title, category, content

In [None]:
req = requests.get(links[1], headers=headers)
response = TextResponse(req.url, body=req.text, encoding="utf-8")
response

<200 https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=025&aid=0003051266>

In [None]:
title = response.xpath('//*[@id="articleTitle"]/text()')[0].extract()
category = response.xpath('//*[@id="lnb"]/ul/li[2]/a/@href')[0].extract().split("sid1=")[1]
content = response.xpath('//*[@id="articleBodyContents"]/text()').extract()
content = "".join(content).strip()
title, category, content[:200]

('[진중권의 퍼스펙티브] 바이든의 가면 쓰고 트럼프로 행동, 종지부 찍어야',
 '001',
 '지난 5일 백악관 기자회견의 방송 중계가 갑자기 중단됐다. 트럼프 대통령이 “우편투표가 사기”라는 등 끝없이 거짓말을 늘어놓자 메이저 방송 3사가 “이 주장에는 증거가 없다”며 중계를 끊어버린 것이다. 작지만 매우 상징적인 사건이다. 적어도 미국에서는 이로써 거짓이 사실로 행세하는 이른바 ‘탈진실’(post-truth)의 시대에 종지부가 찍힌 것이다.   ')

In [None]:
driver.quit()

In [None]:
# 3. items.py 작성

In [None]:
%%writefile naver_article/naver_article/items.py
import scrapy


class NaverArticleItem(scrapy.Item):
    title = scrapy.Field()
    content = scrapy.Field()
    category = scrapy.Field()
    link = scrapy.Field()

Overwriting naver_article/naver_article/items.py


In [None]:
# 4. spider.py 작성

In [None]:
%%writefile naver_article/naver_article/spiders/spider.py
import scrapy
from selenium import webdriver
from naver_article.items import NaverArticleItem

class ArticleSpider(scrapy.Spider):
    name = "NaverArticle"
    allow_domain = ["https://news.naver.com"]
    start_urls = ["https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=100"]
    
    def parse(self, response):
        options = webdriver.ChromeOptions()
        options.add_argument("headless")
        driver = webdriver.Chrome(options=options)
        driver.get(response.url)
        elements = driver.find_elements_by_xpath('//*[@id="main_content"]/div[2]/ul/li/dl/dt/a')
        links = [element.get_attribute("href") for element in elements]
        driver.quit()
        for link in links:
            yield scrapy.Request(link, callback=self.parse_content)
            
    def parse_content(self, response):
        item = NaverArticleItem()
        item["title"] = response.xpath('//*[@id="articleTitle"]/text()')[0].extract()
        item["category"] = response.xpath('//*[@id="lnb"]/ul/li[2]/a/@href')[0].extract().split("sid1=")[1]
        content = response.xpath('//*[@id="articleBodyContents"]/text()').extract()
        item["content"] = "".join(content).strip()
        item["link"] = response.url
        yield item

Writing naver_article/naver_article/spiders/spider.py


In [None]:
# 5. scrapy 실행
# setting.py의 robots.txt 수정

In [None]:
%%writefile run.sh
cd naver_article
scrapy crawl NaverArticle -o article.csv

Writing run.sh


In [None]:
!/bin/bash run.sh

2020-11-11 00:49:49 [scrapy.utils.log] INFO: Scrapy 2.4.0 started (bot: naver_article)
2020-11-11 00:49:49 [scrapy.utils.log] INFO: Versions: lxml 4.6.1.0, libxml2 2.9.10, cssselect 1.1.0, parsel 1.6.0, w3lib 1.22.0, Twisted 20.3.0, Python 3.6.9 (default, Oct 22 2020, 02:49:16) - [GCC 7.5.0], pyOpenSSL 19.1.0 (OpenSSL 1.1.1h  22 Sep 2020), cryptography 3.2.1, Platform Linux-5.4.0-1028-aws-x86_64-with-debian-buster-sid
2020-11-11 00:49:49 [scrapy.utils.log] DEBUG: Using reactor: twisted.internet.epollreactor.EPollReactor
2020-11-11 00:49:49 [scrapy.crawler] INFO: Overridden settings:
{'BOT_NAME': 'naver_article',
 'NEWSPIDER_MODULE': 'naver_article.spiders',
 'ROBOTSTXT_OBEY': True,
 'SPIDER_MODULES': ['naver_article.spiders']}
2020-11-11 00:49:49 [scrapy.extensions.telnet] INFO: Telnet Password: 466e7761c8927e2d
2020-11-11 00:49:49 [scrapy.middleware] INFO: Enabled extensions:
['scrapy.extensions.corestats.CoreStats',
 'scrapy.extensions.telnet.TelnetConsole',
 'scrapy.extensions.memus

In [None]:
import pandas as pd

In [None]:
df = pd.read_csv("naver_article/article.csv")
df.tail(2)

Unnamed: 0,category,content,link,title
18,1,주호영 미래통합당 원내대표는 취임 100일을 맞아 통합당을 진정한 수권정당으로 만들...,https://news.naver.com/main/read.nhn?mode=LSD&...,"‘취임 100일’ 주호영 “통합당, 진정한 수권정당으로 만들겠다”"
19,1,"[머니투데이 김하늬 , 이해진 기자] [[the300]]더불어민주당이 새로운 지도...",https://news.naver.com/main/read.nhn?mode=LSD&...,"與 ""전당대회 채택 강령에 '한국판 뉴딜·행정수도 이전' 명시"""


In [None]:
# 6. mongodb 모듈 생성

In [None]:
import pymongo

In [None]:
client = pymongo.MongoClient("mongodb://dss:dss@52.78.52.151:27017")

In [None]:
db = client.naver_pdj
collection = db.article
collection.insert({"title":"scrapy"})

ObjectId('5f3600ffda891d99d22700c9')

In [None]:
%%writefile naver_article/naver_article/mongodb.py
import pymongo

client = pymongo.MongoClient("mongodb://dss:dss@52.78.52.151:27017")
db = client.naver_pdj
collection = db.article

Writing naver_article/naver_article/mongodb.py


In [None]:
# 7. pipeline 작성 및 설정

In [None]:
"문재인" in '[파이낸셜뉴스] 문재인 대통령 국정 수행 지지도가 10개월'

True

In [None]:
%%writefile naver_article/naver_article/pipelines.py
import json
import requests
from itemadapter import ItemAdapter
from .mongodb import collection

class NaverArticlePipeline:
    def process_item(self, item, spider):
        
        print("="*50)
        print("이낙연" in item["title"], item["title"])
        print("="*50)
        
        if "이낙연" in item["title"]:
            print("Run!!!!")
            webhook = "https://hooks.slack.com/services/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"
            payload = {
                "channel": "#dss",
                "username": "기사봇",
                "text": item["title"] + item["link"],
            }
            requests.post(webhook, json.dumps(payload))
        
        
        collection.insert({
            "title": item["title"],
            "category": item["category"],
            "content": item["content"],
            "link": item["link"],
        })
        
        return item

Overwriting naver_article/naver_article/pipelines.py


In [None]:
!/bin/bash run.sh

2020-08-14 12:56:47 [scrapy.utils.log] INFO: Scrapy 2.3.0 started (bot: naver_article)
2020-08-14 12:56:47 [scrapy.utils.log] INFO: Versions: lxml 4.5.2.0, libxml2 2.9.10, cssselect 1.1.0, parsel 1.6.0, w3lib 1.22.0, Twisted 20.3.0, Python 3.6.9 (default, Jul 23 2020, 01:59:28) - [GCC 7.5.0], pyOpenSSL 19.1.0 (OpenSSL 1.1.1g  21 Apr 2020), cryptography 3.0, Platform Linux-5.3.0-1032-aws-x86_64-with-debian-buster-sid
2020-08-14 12:56:47 [scrapy.utils.log] DEBUG: Using reactor: twisted.internet.epollreactor.EPollReactor
2020-08-14 12:56:47 [scrapy.crawler] INFO: Overridden settings:
{'BOT_NAME': 'naver_article',
 'NEWSPIDER_MODULE': 'naver_article.spiders',
 'SPIDER_MODULES': ['naver_article.spiders']}
2020-08-14 12:56:47 [scrapy.extensions.telnet] INFO: Telnet Password: c1f0e4c6b737040e
2020-08-14 12:56:47 [scrapy.middleware] INFO: Enabled extensions:
['scrapy.extensions.corestats.CoreStats',
 'scrapy.extensions.telnet.TelnetConsole',
 'scrapy.extensions.memusage.MemoryUsage',
 'scrapy.

2020-08-14 12:56:49 [urllib3.connectionpool] DEBUG: http://127.0.0.1:41711 "POST /session/9e7220db1ff41c951cf680ce53653518/execute/sync HTTP/1.1" 200 97
2020-08-14 12:56:49 [selenium.webdriver.remote.remote_connection] DEBUG: Finished Request
2020-08-14 12:56:49 [selenium.webdriver.remote.remote_connection] DEBUG: POST http://127.0.0.1:41711/session/9e7220db1ff41c951cf680ce53653518/execute/sync {"script": "return (function(){return function(){var d=this;function f(a){return\"string\"==typeof a};function h(a,b){this.code=a;this.a=l[a]||m;this.message=b||\"\";a=this.a.replace(/((?:^|\\s+)[a-z])/g,function(a){return a.toUpperCase().replace(/^[\\s\\xa0]+/g,\"\")});b=a.length-5;if(0>b||a.indexOf(\"Error\",b)!=b)a+=\"Error\";this.name=a;a=Error(this.message);a.name=this.name;this.stack=a.stack||\"\"}\n(function(){var a=Error;function b(){}b.prototype=a.prototype;h.b=a.prototype;h.prototype=new b;h.prototype.constructor=h;h.a=function(b,c,g){for(var e=Array(arguments.length-2),k=2;k<argumen

2020-08-14 12:56:49 [urllib3.connectionpool] DEBUG: http://127.0.0.1:41711 "POST /session/9e7220db1ff41c951cf680ce53653518/execute/sync HTTP/1.1" 200 97
2020-08-14 12:56:49 [selenium.webdriver.remote.remote_connection] DEBUG: Finished Request
2020-08-14 12:56:49 [selenium.webdriver.remote.remote_connection] DEBUG: POST http://127.0.0.1:41711/session/9e7220db1ff41c951cf680ce53653518/execute/sync {"script": "return (function(){return function(){var d=this;function f(a){return\"string\"==typeof a};function h(a,b){this.code=a;this.a=l[a]||m;this.message=b||\"\";a=this.a.replace(/((?:^|\\s+)[a-z])/g,function(a){return a.toUpperCase().replace(/^[\\s\\xa0]+/g,\"\")});b=a.length-5;if(0>b||a.indexOf(\"Error\",b)!=b)a+=\"Error\";this.name=a;a=Error(this.message);a.name=this.name;this.stack=a.stack||\"\"}\n(function(){var a=Error;function b(){}b.prototype=a.prototype;h.b=a.prototype;h.prototype=new b;h.prototype.constructor=h;h.a=function(b,c,g){for(var e=Array(arguments.length-2),k=2;k<argumen

2020-08-14 12:56:49 [urllib3.connectionpool] DEBUG: http://127.0.0.1:41711 "POST /session/9e7220db1ff41c951cf680ce53653518/execute/sync HTTP/1.1" 200 97
2020-08-14 12:56:49 [selenium.webdriver.remote.remote_connection] DEBUG: Finished Request
2020-08-14 12:56:49 [selenium.webdriver.remote.remote_connection] DEBUG: POST http://127.0.0.1:41711/session/9e7220db1ff41c951cf680ce53653518/execute/sync {"script": "return (function(){return function(){var d=this;function f(a){return\"string\"==typeof a};function h(a,b){this.code=a;this.a=l[a]||m;this.message=b||\"\";a=this.a.replace(/((?:^|\\s+)[a-z])/g,function(a){return a.toUpperCase().replace(/^[\\s\\xa0]+/g,\"\")});b=a.length-5;if(0>b||a.indexOf(\"Error\",b)!=b)a+=\"Error\";this.name=a;a=Error(this.message);a.name=this.name;this.stack=a.stack||\"\"}\n(function(){var a=Error;function b(){}b.prototype=a.prototype;h.b=a.prototype;h.prototype=new b;h.prototype.constructor=h;h.a=function(b,c,g){for(var e=Array(arguments.length-2),k=2;k<argumen

2020-08-14 12:56:49 [urllib3.connectionpool] DEBUG: http://127.0.0.1:41711 "POST /session/9e7220db1ff41c951cf680ce53653518/execute/sync HTTP/1.1" 200 97
2020-08-14 12:56:49 [selenium.webdriver.remote.remote_connection] DEBUG: Finished Request
2020-08-14 12:56:49 [selenium.webdriver.remote.remote_connection] DEBUG: POST http://127.0.0.1:41711/session/9e7220db1ff41c951cf680ce53653518/execute/sync {"script": "return (function(){return function(){var d=this;function f(a){return\"string\"==typeof a};function h(a,b){this.code=a;this.a=l[a]||m;this.message=b||\"\";a=this.a.replace(/((?:^|\\s+)[a-z])/g,function(a){return a.toUpperCase().replace(/^[\\s\\xa0]+/g,\"\")});b=a.length-5;if(0>b||a.indexOf(\"Error\",b)!=b)a+=\"Error\";this.name=a;a=Error(this.message);a.name=this.name;this.stack=a.stack||\"\"}\n(function(){var a=Error;function b(){}b.prototype=a.prototype;h.b=a.prototype;h.prototype=new b;h.prototype.constructor=h;h.a=function(b,c,g){for(var e=Array(arguments.length-2),k=2;k<argumen

2020-08-14 12:56:49 [selenium.webdriver.remote.remote_connection] DEBUG: POST http://127.0.0.1:41711/session/9e7220db1ff41c951cf680ce53653518/execute/sync {"script": "return (function(){return function(){var d=this;function f(a){return\"string\"==typeof a};function h(a,b){this.code=a;this.a=l[a]||m;this.message=b||\"\";a=this.a.replace(/((?:^|\\s+)[a-z])/g,function(a){return a.toUpperCase().replace(/^[\\s\\xa0]+/g,\"\")});b=a.length-5;if(0>b||a.indexOf(\"Error\",b)!=b)a+=\"Error\";this.name=a;a=Error(this.message);a.name=this.name;this.stack=a.stack||\"\"}\n(function(){var a=Error;function b(){}b.prototype=a.prototype;h.b=a.prototype;h.prototype=new b;h.prototype.constructor=h;h.a=function(b,c,g){for(var e=Array(arguments.length-2),k=2;k<arguments.length;k++)e[k-2]=arguments[k];return a.prototype[c].apply(b,e)}})();var m=\"unknown error\",l={15:\"element not selectable\",11:\"element not visible\"};l[31]=m;l[30]=m;l[24]=\"invalid cookie domain\";l[29]=\"invalid element coordinates\";l[

2020-08-14 12:56:50 [urllib3.connectionpool] DEBUG: http://127.0.0.1:41711 "POST /session/9e7220db1ff41c951cf680ce53653518/execute/sync HTTP/1.1" 200 97
2020-08-14 12:56:50 [selenium.webdriver.remote.remote_connection] DEBUG: Finished Request
2020-08-14 12:56:50 [selenium.webdriver.remote.remote_connection] DEBUG: POST http://127.0.0.1:41711/session/9e7220db1ff41c951cf680ce53653518/execute/sync {"script": "return (function(){return function(){var d=this;function f(a){return\"string\"==typeof a};function h(a,b){this.code=a;this.a=l[a]||m;this.message=b||\"\";a=this.a.replace(/((?:^|\\s+)[a-z])/g,function(a){return a.toUpperCase().replace(/^[\\s\\xa0]+/g,\"\")});b=a.length-5;if(0>b||a.indexOf(\"Error\",b)!=b)a+=\"Error\";this.name=a;a=Error(this.message);a.name=this.name;this.stack=a.stack||\"\"}\n(function(){var a=Error;function b(){}b.prototype=a.prototype;h.b=a.prototype;h.prototype=new b;h.prototype.constructor=h;h.a=function(b,c,g){for(var e=Array(arguments.length-2),k=2;k<argumen

2020-08-14 12:56:50 [urllib3.connectionpool] DEBUG: http://127.0.0.1:41711 "DELETE /session/9e7220db1ff41c951cf680ce53653518 HTTP/1.1" 200 14
2020-08-14 12:56:50 [selenium.webdriver.remote.remote_connection] DEBUG: Finished Request
2020-08-14 12:56:50 [scrapy.dupefilters] DEBUG: Filtered duplicate request: <GET https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=088&aid=0000659858> - no more duplicates will be shown (see DUPEFILTER_DEBUG to show all duplicates)
2020-08-14 12:56:50 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=088&aid=0000659858> (referer: https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=100)
2020-08-14 12:56:50 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=047&aid=0002280684> (referer: https://news.naver.com/main/list.nhn?mode=LSD&mid=sec&sid1=100)
2020-08-14 12:56:50 [scrapy.core.engine] DEBUG: Crawled (200) <

False 취임 100일 주호영 "국민들이 다시 마음 주신다"
2020-08-14 12:56:50 [scrapy.core.scraper] DEBUG: Scraped from <200 https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=047&aid=0002280682>
{'category': '001',
 'content': '[이경태, 남소연 기자]\xa0주호영 미래통합당 원내대표가 취임 100일을 하루 앞둔 14일 오전 열린 기자간담회에서 '
            '한 말이다. "청와대와 더불어민주당은 국민이 왜 지지를 철회하는지, 무엇 때문에 지지를 철회하는지를 제대로 검토해 '
            '지금이라도 국민이 원하는 방향으로 제대로 잘해줄 것을 부탁한다"면서 우회적으로 자신감을 내비치기도 했다.\xa0최근 '
            '당의 지지율 상승 국면을 염두에 둔 발언이었다. 참고로, 리얼미터가 tbs의뢰로 지난 10~12일 전국 유권자 '
            '1507명을 대상으로 조사해 13일 발표한 결과에 따르면, 통합당 지지율(36.5%)은 탄핵정국 후 4년 만에 '
            '더불어민주당(33.4%)을 역전했다(무선 전화면접 및 유무선 자동응답 혼용, 표본오차 95% 신뢰수준에 ±2.5%p, '
            '자세한 사항은 중앙선거여론조사심의위 홈페이지 참조).\xa0한국갤럽이 지난 11~13일 전국 유권자 1001명을 '
            '대상으로 전화조사원 인터뷰해 이날(14일) 발표한 결과도 추세는 비슷했다. 통합당 지지율은 전주 대비 2%p 상승한 '
            '27%를 기록, 민주당(33%)을 6%p 차로 따라 붙었다. 이는 2016년 국정농단 사태 본격화 이후 최소 '
            '격차다(표본오차 95% 신뢰수준에 ±3.1%p, 자세한 사항은 중앙선거여론조사심의위 홈페이지 참조).\xa0그간 원 '
  

False 文대통령 국정지지율 39%..'부동산 논란'에 취임 후 최저 기록
2020-08-14 12:56:52 [scrapy.core.scraper] DEBUG: Scraped from <200 https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=014&aid=0004477365>
{'category': '001',
 'content': '[파이낸셜뉴스] 문재인 대통령 국정 수행 지지도가 10개월 만에 40%대로 조사된 여론조사 결과가 발표됐다.    '
            "14일 한국갤럽이 발표한 8월2주차(11~13일) 대통령 직무수행 평가 결과에 따르면 문 대통령 국정에 대해 '잘 "
            "하고 있다'는 긍정평가는 39%로 조사됐다. 이는 전주 대비 5%포인트 하락한 수치로 취임 후 최저치다.    "
            "'잘못하고 있다'는 부정평가는 53%로 전주 대비 7%포인트 올랐다. 문 대통령 국정에 부정평가를 응답 한 응답자는 "
            "그 이유로 '부동산 정책'(35%)을 가장 많이 꼽았다.    긍·부정률 차이는 14%포인트로 벌어졌다. '어느 쪽도 "
            "아니다'는 평가 보류는 3%, 모름·응답 거절은 5%로 집계됐다.    문 대통령 국정 지지율은 지난해 조국 장관 "
            '사태를 거치며 10월 셋 째주 39%까지 떨어진 바 있다. 올해는 코로나19 대응과정을 거치며 5월1주차에 71%까지 '
            '지지율이 상승하기도 했다.    하지만 이후 부동산 논란 등을 거치며 하락세가 계속됐고 조국 정국 이후 10개월만에 '
            '30%대 지지율을 기록하게 됐다.    이에 대해 한국갤럽은 "이번 주 대통령 직무 긍정률 하락폭은 '
            '30대(60%→43%), 지역별로는 서울(48%→35%) 등에서 상대적으로 컸다"며 "30대는 전월세 거주·생애 

2020-08-14 12:56:52 [scrapy.core.scraper] DEBUG: Scraped from <200 https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=001&aid=0011815208>
{'category': '001',
 'content': "(서울=연합뉴스) 진성철 기자 = 14일 국회 의원회관에서 범시민사회단체연합 주최로 열린 문재인 정권의 '수도 서울 "
            "이전' 과연 타당한가?에서 이석연 전 법제처장(가운데)이 발언하고 있다.  2020.8.14    "
            'zjin@yna.co.kr',
 'link': 'https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=001&aid=0011815208',
 'title': "'수도서울이전' 과연 타당한가 토론회"}
False '수도서울이전' 과연 타당한가 토론회
2020-08-14 12:56:52 [scrapy.core.scraper] DEBUG: Scraped from <200 https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=001&aid=0011815209>
{'category': '001',
 'content': "(서울=연합뉴스) 진성철 기자 = 14일 국회 의원회관에서 범시민사회단체연합 주최로 열린 문재인 정권의 '수도 서울 "
            "이전' 과연 타당한가?에서 이석연 전 법제처장이 발언하고 있다.  2020.8.14    zjin@yna.co.kr",
 'link': 'https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=100&oid=001&aid=0011815209',
 'title': "'수도서울이전' 과연 타당한가 토론회"}
False 국민은 아니라는데…與 박주민

In [None]:
webhook = "https://hooks.slack.com/services/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"

In [None]:
import json

In [None]:
payload = {
    "channel": "#dss",
    "username": "기사봇",
    "text": "테스트",
}

In [None]:
requests.post(webhook, json.dumps(payload))

<Response [200]>