Skip to content

对知乎上关注人数最多的1000个问题进行数据分析

Notifications You must be signed in to change notification settings

SeekingMini/zhihu-problems

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Zhihu-Problems

数据来源:知乎关注人数最高的1000个问题
感谢陈鹏举的数据!

  • 特别说明
    • 该数据集是2016年的数据,2018年可能已经发生较大变化,但是仍不失为一个好的数据分析练习的素材!
    • 我目前还是一个数据分析入门者,整个分析过程存在诸多漏洞,望批评指正!

目录

开发环境

分析思路

  • 保存知乎关注人数最高的1000个问题的网页源码
  • 用正则表达式分别提取1000个问题的ID Name Type(参考文件info.csv),为进一步分析做准备(具体代码以及文件参考original data)
  • 对1000个问题的Type(问题类别)进行汇总统计(具体代码以及文件参考wd)
  • 从1000个问题中筛选出100个具有代表性的,对每一个问题的回答的赞同数进行分析(具体代码以及文件参考res)

分析过程

About

对知乎上关注人数最多的1000个问题进行数据分析

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published