Skip to content

使用requests库实现爬取cnvd漏洞详情,selenium库获取cookie反反爬,使用sqlalchemy存储数据

Notifications You must be signed in to change notification settings

justein/cnvd_requests_spider

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 

Repository files navigation

爬取cnvd最近3年的漏洞详情

环境

软件 版本
python 3.6
requests
sqlalchemy
selenium
chromedriver
mysql 5.7

sudo python3 -m pip install --upgrade pip

sudo python3 -m pip install --upgrade setuptools

sudo python3 -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ requests

sudo python3 -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ selenium

sudo python3 -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ sqlalchemy

  • chrome与chromedriver安装自行百度

功能

  • 按顺序依次爬取cnvd的漏洞详情,起始url在代码中修改

  • 使用sqlchemy保存数据,也可以改为csv文件存储

  • 使用selenium反反爬虫,主要是获取cookie,每隔5次爬取自动打开浏览器获取一下新cookie

注意

  • 使用前请务必修改数据库的连接信息与User-Agent,UA必须与chromedriver的版本一致

  • mysql务必使用utf8字符集创建数据库

运行

sudo python3 cnvd2.py

About

使用requests库实现爬取cnvd漏洞详情,selenium库获取cookie反反爬,使用sqlalchemy存储数据

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 100.0%