为本人论文《数据挖掘技术在问答社区中的应用-以知乎为例》主要代码
结构
-
第三章 知乎爬虫及数据预处理程序(数据爬取与预处理文件夹)
- Crawl.py 文件:数据爬取与数据存储文件
- Eda.py文件:数据预处理及部分统计分析文件
- 数据预处理.Rmd:部分统计分析文件
- 问题四分类数据预处理.R:问题四分类预处理
-
第四章 网络数据处理与分析程序(网络分析文件夹)
- ForGephi.py:网络数据
- Web文件夹:网络可视化文件
-
第五章 文本挖掘程序(文本挖掘文件夹)
- text_EDA.Rmd:文本分析及可视化文件