Skip to content

zhang020801/douban_bookTop250

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

爬取豆瓣读书Top250读书榜单,并将数据可视化

一、项目介绍

1、爬取豆瓣读书榜单数据,数据包含:排名、图书名、图书链接、封面链接、作者/译者、出版社、出版时间、图书售价、评分、评价人数、简要介绍,这11个数据。

2、将爬取的数据保存到sqlite数据库中。

3、可视化爬取的数据。

二、项目实现

1、爬取实现:test01.py实现爬取数据并保存到sqlite数据库,通过beautifulsoup4实现解析网页,通过re正则表达式提取网页数据,编写sql语句创建sqlite数据库,并将数据保存到该数据库中。

2、运行test01.py生成book.db数据库以及豆瓣读书Top250.xls数据表。

3、templates文件夹下包含几个html文件,static文件夹中包含前面所述网页的样式及内容图片、图标。

4、app.py是网页页面服务的实现,book_worcloud.py实现词云的生成。

5、页面的实现应用了Flask框架Echarts图表、wordcloud词云等。

About

爬取豆瓣读书Top250读书榜单,并将数据可视化。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published