Skip to content

maoyj/18comic-Download

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

52 Commits
 
 
 
 

Repository files navigation

该项目已停止维护。

作为原作者删除后的继续改进,受于本人水平有限,本Fork中的很多流程和逻辑设计是有问题的。

禁漫网站添加了随机切分图片的功能后,新的切分方法倒是弄清楚了,但是本Fork的流程要把新切分方法的参数传进去很困难。 所以本项目干脆直接重构了 新项目 https://github.com/maoyj/18comic-Download2

由于最近工作比较忙,重构后的项目一直没有上线,抱歉抱歉。 (其实是女儿出生后每天根本没有时间看漫画,索性直接鸽了) 如果新项目还没改完,那就是因为懒

18comic-Download(禁漫天堂)

python多线程下载禁漫天堂comic 18comic.vip

这是最初由 TG: @Core_i0 开发的项目。因被官方联系而终止。(为什么我不终止?当然是因为程序有了节操修复了没有线程限制的缺陷) 我从中途fork后,进行了一些改动和优化。我一直担心是因为早期我不停的测试代码,频繁下载那个几千页的漫画,造成每次几千线程,动静太大了。当然现在不会有这个问题了

经过我横向比较,当前18comic的爬虫程序有很多。其中有些甚至已经支持到了按标签爬虫。但是他们都没有使用多线程。其代码中有import process却没有实际使用,估计因为同样的原因。 我由于网络较差,很容易出现断流,因此不会放弃多线程下载。 当前版本中已启用了最大线程控制(默认最大数量5),请不要随便增加最大线程数,以免对服务器造成过大负载。喝水不忘挖井人

使用方法:

  1. 执行py文件。将会提示输入漫画地址。 可输入以下格式的网址:
https://18comic.org/album/232758/%E7%B4%97%E5%A4%9C%E8%88%87%E6%97%A5%E8%8F%9C-bang-dream-ezr%E5%80%8B%E4%BA%BA%E6%BC%A2%E5%8C%96-ryu-minbs-%E6%B5%81%E6%B0%91-%E7%B4%97%E5%A4%9C%E3%81%95%E3%82%93%E3%81%A8%E6%97%A5%E8%8F%9C%E3%81%A1%E3%82%83%E3%82%93-bang-dream
https://18comic.org/photo/232758/
  1. 其他额外选项 接下来,程序可能会询问,“发现包含多个章节,是否全部下载”。此时按1全部下载的话,将会在各个章节目录下生成一个index.html,以连续方式阅读该章节漫画,并包含目录。(如果选0只下载当前章节的话,则不会生成index.html)

3.等待下载完成 程序将自动以所含漫画页数或最大线程限制的最小值开始下载。如果出现下载失败的图片页,程序将重复尝试。 该章节完成将自动开始下一章节的下载,直到全部章节完成。 全部章节完成后才会开始生成html文件。

更新历史:(原作者开发到2.2版本后终止)

2021/01/20更新:version:2.0 解决了下载图片被分割的问题,原网站对源图片资源进行了反爬虫,现在下载comic images正常了。
2021/01/31更新:version:2.1 增加下载多章节功能。
2021/02/08更新:version:2.2 将多进程下载改成多线程下载。解决多进程闪退,error,因过密集io操作使系统发生死锁问题。进一步提高下载速度。
2021/02/24更新:version:2.3 加入线程池和线程上限。多集下载自动生成含目录的html。修复了诸多bug
2021/06/02更新:version:2.3.1 现在可以跳过已经合集中已经下载的章节。修复了一些可能导致下载失败的bug。被ddos防护后会更换图片镜像。

必看声明:

  • 安装所需依赖库(直接运行脚本的话,打包好的exe可执行文件不需要安装依赖库)
pip3 install bs4 Pillow tqdm concurrent

About

python爬虫自动多线程下载禁漫天堂漫画

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Python 100.0%