百度博客爬虫
- 1.爬取百度空间博客文章到本地
- 2.爬取百度空间博客文章到数据库(Mongo)
- 3.爬取百度空间博客评论到数据库(Mongo)
npm install supervisor
npm install express
npm install express-generator
npm install cheerio
npm install request
cd baiduBlogSpider
supervisor ./bin/www
http://127.0.0.1:3000/
ps 目前初始版本暂时还没做分页爬取,明天搞分页,具体实现代码在 routes/index.js中,后面会再重构。