使用的python模块包括,grequest、click.参考文章
- clone到你的电脑
git clone https://github.com/laodiaoyadashu/zhihu-image-crawler.git
- 切换目录
cd zhihu-image-crawler
- 安装依赖
pip install -r requirements.txt
- 命令说明
python main.py
接受两个参数,你也可以使用python main.py --help
获取帮助。
question
: 你想要爬取的问题id,例如在这个问题中question
就是296631231
https://www.zhihu.com/question/296631231
votenum
: 将会过滤掉点赞数小于该值的回答. 例如:python main.py --question 296631231 --votenum 1000
代码中加入了sleep
用来减小爬虫的频率。不管怎么爬,一定要保证知乎正常的服务。