欢迎蛋友! 你可以利用脚本搜索自己在jandan发过的帖子。
可以在线执行,只需要修改个名字(需要登录谷歌账号,使用谷歌的服务): https://colab.research.google.com/drive/1jSeSCFKpJkIoNMmMy9YEm9w8msfi5Rti?usp=sharing
- kasusa
- Xeterium
下载源码后,首先需要确保拥有这些pip包,下载pip包太慢可以参考这个pip配置豆瓣源
pip install bs4
pip install requests
可以通过传递参数的方式来指定搜索用户名、爬取的页数。
py me_in_jandan.py --username kasusa --max-pages 10
目前去除了硬编码用户名和页数,仅通过传入参数来设定
BASE_URLS
是要进行爬取的网站列表,如树洞、无聊图、问答区,去掉自己不需要爬取的url可以提升脚本的速度。
BASE_URLS = [
"http://jandan.net/pic",
"http://jandan.net/treehole",
"http://jandan.net/qa",
]
高阶:另外还提供了一个jandan.bat
,可以把它放在自己的用户目录,这样可以在命令行中快速启动脚本!
- 增加oo、xx数量的显示 ✅