Skip to content

Tiankui/manga-spider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

漫画SPIDER爬虫项目

基于ruby的open-uri和nokogiri

目前实现到抓取到网站全部目录下的卷数

对于每页的img抓取,已有方案,待有时间实现。

目前粗算目的网站的IMG数据将会是500G左右的图片数据,从数据量和流量成本看来漫画站盈利应该不差。

About

站点爬虫,抓取所有漫画目录、卷目录,IMG分析并下载。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages