Skip to content

Latest commit

 

History

History
30 lines (23 loc) · 2 KB

README.md

File metadata and controls

30 lines (23 loc) · 2 KB

douban-top250

Python实现豆瓣电影TOP250抓取,然后对爬取的数据进行分析。
详细分析见个人博客:豆瓣电影TOP250抓取

豆瓣电影TOP250抓取

本部分包括:
豆瓣电影TOP250抓取思路分析---top250-spider.md
豆瓣电影TOP250抓取思路分析---top250-spider.ipynb
豆瓣电影TOP250抓取全部代码---top250-spider.py
抓取结果---top250_movie.csv
Excel打开不乱码的抓取结果---top250_movie_ANSI.csv

豆瓣电影TOP250数据分析

本部分详细分析见:豆瓣电影TOP250数据分析---top250-analyse.ipynb

分析结果

电影制作国家统计
电影制作国家统计

电影类型统计
电影类型统计

导演统计
导演统计

电影评分统计
电影评分统计

电影评分和排名关系的散点图
电影评分和排名关系的散点图