Scrapy 라이브러리를 이용한 Crawling 배워보기 - https://festa.io/events/717/
Python 라이브러리 'Scrapy'를 이용해 네이버 뉴스 크롤링까지 할 수 있는 세미나 입니다.
tutorial 디렉토리는 scrapy project이며 코드는 spiders에서 참고하시기 바랍니다.
settings.py 의 ROBOTSTXT_OBEY = False 로 변경해 주세요.
ROBOTSTXT_OBEY = False
$ scrapy list
basic
main_news
news_basic
news_pages
$ scrapy crawl [spider_name]
$ scrapy crawl [spider_name] -o [file_name].csv
$ scrapy crawl [spider_name] -o [file_name].json