- Scrapy多页面抓取数据
- MongoDB保持抓取的数据
- Scrapy分页爬取四川大学公共管理学院全职教师信息及学院新闻
- Scrapy抓取在不同级别Request之间传递参数
- Scrapy官方文档:Requests and Responses
- Scrapy官方文档:Item pipeline
- PyMongo 3.4.0 documentation
# 错误的代码
def parse_jobs(self, response):
jobs = response.css('div.rlOne')
jobsItem = GxrcwItem()
for job in jobs:
# 抓取一部分数据
# 正确的代码
def parse_jobs(self, response):
jobs = response.css('div.rlOne')
for job in jobs:
jobsItem = GxrcwItem()
# 抓取一部分数据