为了获得所有萌娘词条。
由于萌娘百科长期以来官方API较为繁琐,并且不提供所有词条(仅词条标题不包含其他)数据。
词条标题作为词语具有一定价值,例如:制作输入法词库、分析流行用语趋势等。
本项目旨在获取所有萌娘词条,按计划会定期发布词条到 release。
注:2、3 部分仅面向希望运行脚本的,只想要词条数据请自行到 release 获取。
- 克隆仓库并进入文件夹。
git clone https://github.com/shitlime/MoeGirlOh.git
cd MoeGirlOh
- 运行脚本。
python moegirl-all.py
moegirl-all-titles.txt
全部词条萌娘词条a.txt
过程中累积记录的词条(很可能不完全,用于Debug,会占用一定空间需手动删除)nextPage
用于爬取中断与恢复
本项目仅供学习参考,请勿用于非法用途。
使用本项目产生的一切后果自行承担,开发者不承担任何责任。