此仓库的 python 实现仅供参考。半次元的 API 有特别多的坑,目前很多人都在超量爬取半次元,注意做请求失败时重试。
Nyamisty 实际使用 Golang 爬取全站,由于包含了 private session key,直到关站前,Golang 版本的实际爬虫应该不会开源(?)。
ArchiveTeam 的 warrior 的初版见 https://github.com/yts98/banciyuan-grab ,实际项目见 https://github.com/ArchiveTeam/banciyuan-grab 。AT 是走 网页+WebAPI 来做存档,具体见其 Wiki 和 IRC。
我们 STWP 的项目群:https://t.me/saveweb_projects/319