Skip to content

LeeChungHyun/Scrapy-Seminar

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Scrapy-Seminar

scrapy

Scrapy 라이브러리를 이용한 Crawling 배워보기 - https://festa.io/events/717/

Python 라이브러리 'Scrapy'를 이용해 네이버 뉴스 크롤링까지 할 수 있는 세미나 입니다.

tutorial 디렉토리는 scrapy project이며 코드는 spiders에서 참고하시기 바랍니다.


주의사항

settings.py 의 ROBOTSTXT_OBEY = False 로 변경해 주세요.

ROBOTSTXT_OBEY = False

Scrapy 실행방법

프로젝트에 존재하는 spider를 조회

$ scrapy list
basic
main_news
news_basic
news_pages

spider 실행

$ scrapy crawl [spider_name]

spider 실행 후 scv, xml, json 파일로 출력

$ scrapy crawl [spider_name] -o [file_name].csv
$ scrapy crawl [spider_name] -o [file_name].json

About

No description or website provided.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%