Skip to content

pandaboy1123/-

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

douban_spider


1.使用任意代理IP进行如下操作=>完成

2.使用requests模块进行豆瓣电影的个人用户登录操作=>完成

3.使用requests模块访问个人用户的电影排行榜->分类排行榜->任意分类对应的子页面=>完成

4.爬取需求3对应页面的电影详情数据=>完成(可爬取全部数据)

5.爬取3对应页面中滚动条向下拉动2000像素后加载出所有电影详情数据,存储到本地json文件中或者相应数据库中=>保存为本地json文件,但是没有使用滑动像素的方式

【备注】电影详情数据包括:海报url、电影名称、导演、编剧、主演,类型,语言,上映日期,片长,豆瓣评分


1.部分爬取数据保存在详细信息中

2.如果代理ip失效了,请找新的代理ip

3.其他信息可以访问https://github.com/pandaboy1123/-

About

豆瓣爬虫

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages