Text-Classification 机器学习入门/数据挖掘:中文文本分类器 数据集过大请自行下载,不在仓库附带 数据预处理采用jieba进行分词和TF/IDF加权,利用Redis数据库进行数据存储 采用朴素贝叶斯分类器、支持向量机(SVM)、逻辑回归(LR)三种模型实现训练和测试 分类结果和词频词云实现了可视化 数据集来源: http://thuctc.thunlp.org/