BeautifulSoup
- BeautifulSoup官方文档: https://beautifulsoup.cn
bs4(BeautifulSoup)
requests
fake_useragent
PIL(pillow)
PyPDF2
sys
time
os
shutil
re
- img转PDF(实验性)
- PDF合并PDF
pip install pillow requests fake_useragent bs4 PyPDF2 lxml
注意: 输入地址时不要忘记最后的正斜杠(/)
正确的地址:https://baozimh.org/manga/yaoguaijiuguan-muba/
错误的地址:https://baozimh.org/manga/yaoguaijiuguan-muba
, https://baozimh.org/chapterlist/yaoguaijiuguan-muba/
, https://baozimh.org/chapterlist/yaoguaijiuguan-muba
等等。
在使用中如果出现bug,请前往反馈,点这里
注意: 提交Bug时,请复制所有报错信息,并附加漫画地址。
目前已知BUG:
1. PDF排版(包括合并版(合并.pdf)与分集版(contract{n}.pdf))顺序出错
2. 可能出现重复画面(极少部分)
- 修改
main.py
文件main_url
处地址为自己想下载漫画的地址(见使用方法) - 保存提交
- 运行Action,等待下载完成。
注意:不建议自己下载,网速太慢(能嫖20MB/S的下载速度为啥有人要在个人设备上运行:see_no_evil:?)。
电脑操作(Windows&Linux)
预先条件
I. Windows: 系统可以成功调用aria2下载程序
II. Linux: sudo apt install aria2
- 同GitHub Action 下载教程
- 安装依赖
- 修改
cmd = 'aria2c -x 16 -s 32 -j 32 -d ./new/'+str(i)+' -i ./data/manga_per'+str(i)+'.txt --continue=true'
中-x
、-s
、-j
之后的数值(改小,目前这是最大值) - 保存运行。
手机操作
- 手机安装Termux(直达release下载地址)
- Termux换源
termux-chage-repo
(墙裂推荐BFSU源可比清华的快多了(大嘘)) apt install python python-pip git libxml2 libxslt nano aria2
pkg i libjpeg-turbo zlib
- 安装依赖(时间比较长,等待)
- 克隆仓库
git clone https://github.com/LemonFan-maker/Comic_Spider.git
- 同电脑操作
提示: 可采用nano
进行编辑
恶!大概率没人能看懂这破东西到底是咋写的(我也不知道我写这玩儿意的时候喝了几瓶子假酒……?)
│ .gitignore
│ aria2c.md
│ check_param.py
│ check_pic.py
│ check_url.py
│ combine2pdf.py
│ get_every_page.py
│ get_list.py
│ get_newest_elements.py
│ LICENSE
│ main.py
│ README.md
│ rebuild_combine2pdf.py
│
├─.github
│ ├─ISSUE_TEMPLATE
│ │ Bug.md
│ │
│ └─workflows
│ blank.yml
│
└─assets
helper1.png
helper2.png
原理简述:
主程序,调用文件夹下所有的模组文件,并且重新创建文件夹(空的)
验证这个漫画是否存在章节列表(方便下载),并返回章节列表的地址
判断漫画是否存在(方法有待改进,目前已经有想法了)
把章节列表保存在chapter.txt文件,方便后面读取
调用系统aria2下载漫画(**注意:**aria2必须在环境变量里否则无法调用会报错)
大概是返回漫画每一页的地址……?(忘了)
获得最新漫画页
旧的image转pdf
新式转换算法
- 修复错误
支持github action 打包下载(初步已实现)- 修改漫画是否存在检测方式
- 更新img2PDF
- 下载指定章节
- 以漫画名称命名目录
- ,etc