提取JS_URL的正则部分使用的是JSFinder
提取URL的正则部分使用的是dirmap
网页URL探测脚本,因觉得Burpsuite的爬虫不爽,就自己写了一个爬虫脚本。
可以通过设置目标站点进行获取网站的全部URL。
注:如发现bug请联系我~ aixic@qq.com
-
通过目标站点进行URL的爬取;
-
多线程效率可自定义;
-
爬取深度可自定义;
-
可爬取JS文件中的URL;
-
获取子域名。
-
从网站上收集域名;
-
发现不容易找到的目录。
- 可进行分布式部署。通过主控发送目标URL。
Redis去重
DB0 用来存放全部爬取过的URL,查重使用的数据库
DB1 存放当前目标的URL写入Mysql数据库后清空
DB2 存放爬取不同的域名
Re正则匹配
xpath匹配
多线程