Skip to content

FAWC438/Text-Classification

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Text-Classification

机器学习入门/数据挖掘:中文文本分类器

数据集过大请自行下载,不在仓库附带

数据预处理采用jieba进行分词和TF/IDF加权,利用Redis数据库进行数据存储

采用朴素贝叶斯分类器、支持向量机(SVM)、逻辑回归(LR)三种模型实现训练和测试

分类结果和词频词云实现了可视化

数据集来源: http://thuctc.thunlp.org/

Releases

No releases published

Packages

No packages published

Languages