Skip to content

按年份爬取豆瓣网的电影数据并存入数据库中

Notifications You must be signed in to change notification settings

y1x4/douban_movies_spider

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

douban_movies_spider 爬虫报告

1. 任务说明
  • 爬取豆瓣网的电影数据,包括电影ID(movie_id)、电影名称(name)、上映年份(year)、用户评分(rating)、评论人数(comment_count)、主页链接(link)、海报地址(poster),因数据量太大只爬取2000年~2019年共 42701 部
  • GitHub地址:https://github.com/wangyixu/douban_movies_spider
  • MySQL数据库接口信息如下: | IP | 端口号 | 用户名 | 密码 | 数据库名 | 数据表名 | | :------: | :------: | :------: | | 114.116.43.151 | 3306 | visitor | password | douban | movies |
  • 百度云:https://pan.baidu.com/s/1SyPjW2_ivM8_83ccHRua-g ;密码:ci9y。
2. 实践流程

About

按年份爬取豆瓣网的电影数据并存入数据库中

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages