介绍

这个项目主要用Scrapy抓取目标网站，每个目录下都抓取特定的网站。由于网站类型不同，因此每个特定的spider都有不一样的功能，不同的配置，不同过滤数据的方式。当然了，参照这个仓库的例子，你完全可以定制你自己的爬虫，抓取你自己想要的网站。

版本

下面，是我写这个项目时用到的版本：

Python : 2.7.12

Scrapy : 1.1.0

numpy : 1.11.1

对应的目录有相应的运行说明

这个项目只是一个开始，还有非常多要完善的地方。如果大家对这个项目有兴趣的话，可以联系我，我们一起完善这个项目。

Name		Name	Last commit message	Last commit date
Latest commit History 41 Commits
douban		douban
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md