Skip to content

Files

Latest commit

 

History

History
9 lines (5 loc) · 481 Bytes

ReadMe.md

File metadata and controls

9 lines (5 loc) · 481 Bytes

网络爬虫之用户名密码及验证码登陆:爬取知乎网站

一些说明:

  • 使用requests包来爬取。首先尝试用用户名密码自动登陆,如果失败,则需要采用cookie登陆。

  • 配置文件config.ini,其中包括用户名密码信息,如果有验证码情况,需要手动登陆一次网站获取cookie信息。

  • 判断登陆成功与否,看生成的html文件中有没有用户信息。