Switch branches/tags
Nothing to show
Find file History
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
..
Failed to load latest commit information.
001.png
README.md
Screenshot.py

README.md

😬多进程批量网页截图工具

使用规则:

  • 在urls.txt文本中放入需要截图的链接,格式为这种

savename,https://www.baidu.com
即图片要保存的名称和网页链接,用英文逗号隔开,每行放一个

  • 程序会读取电脑的CPU核数,然后选择最大的进程数进行多进程批量截图,图片会保存在当前文件夹下的pics文件夹中, 这个文件夹如果不存在就会自动创建一个

实现原理:

  • 使用selenium的全屏截图功能
  • 难点在于需要根据网页的总长度(包括下拉途中新加载的)来加载全部网页, 实现整个网页的截屏,这个拉下的方式是经过我多次试验和比较网上的方式 实现的最优方式。
  • PS:网上搜到的大部分是用纯JS实现,但是并不完善,因为下拉中途加载的时候读取的网页 总长度会发生变化,因此必须实时读取网页总长度

这个工具在多进程的情况下截图的效率还算不错,在批量操作上起码比人操作快的多