Python3.9 Spider爬虫IP代理池的建池程序,通过IP代理池的建池程序,可以学习到基本的爬虫方法和思路(仅供参考)
-
Python 3.9
-
selenium 4.1.3
-
chromedriver 100.0.4896.60 (需要适配本电脑chrome版本) 下载链接
-
git clone git@gitee.com:mz100/ip_poolding.git
-
进入目录,执行:pip install -r requirements.txt
-
当前文件执行 python main.py
学习Python爬虫,必不可少就是建立自己的IP代理池,项目就是为了建立自己IP代理池进行设计,爬取免费代理IP提供商的网站,建造自己的IP代理池。
目前爬取的网站:快代理,89免费代理,高可用全球免费代理ip库(当然,如果需要稳定性还是购买他们的收费产品)
通过建造自己的IP代理池,可以让我们学习到基础的爬虫知识:requests、selement、pands、sqlite等。
详细的流程说明请看: