这是一个用于自动下载指定 GitHub 用户仓库代码的工具,通过 Selenium 模拟浏览器操作,实现批量下载仓库的 ZIP 压缩包。
-
自动获取目标 GitHub 用户的仓库总数
-
分页遍历用户的所有仓库
-
自动点击进入仓库、打开下载菜单并下载 ZIP 包
-
支持 Chrome 和 Edge 两种浏览器
-
Python 3.x
-
所需 Python 库:
-
requests
-
beautifulsoup4
: 爬虫
- 安装依赖库:
pip install -r requirements.txt
- 下载对应浏览器的驱动:
可在代码中修改以下配置参数:
url = "https://github.com/codewithsadee?page=1&tab=repositories" # 目标GitHub用户仓库页面
waitTime = 2 # 普通操作等待时间(秒)
waitDownTime = 30 # 下载等待时间(秒)
positionX = 250 # 浏览器窗口X坐标
positionY = 0 # 浏览器窗口Y坐标
-
修改 url 为目标 GitHub 用户的仓库页面地址
-
选择要使用的浏览器(Chrome 或 Edge)
-
运行主程序:
make run
-
下载速度取决于网络状况和仓库大小,请根据实际情况调整 waitDownTime
-
程序会自动处理分页,无需手动干预
-
若遇到元素定位失败的问题,可能是 GitHub 页面结构更新导致,需相应调整 XPath 表达式
本工具仅用于学习和研究目的,使用者应自行承担使用本工具的一切风险和责任。请遵守以下原则:
- 遵守 GitHub 的使用条款和访问速率限制
- 尊重开源项目作者的知识产权和许可协议
- 不要将下载的代码用于商业用途(除非原项目许可证明确允许)
- 本工具的开发者不对因使用本工具而可能导致的任何问题或损失负责
使用本工具即表示您同意上述免责声明。如果您不同意,请勿使用本工具。