Skip to content

自然语言处理之中文文本分类(以垃圾短信识别为例)

Notifications You must be signed in to change notification settings

junxincai/ChineseTextClassification

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

10 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

ChineseTextClassification

自然语言处理之中文文本分类(以垃圾短信识别为例)

数据集

  • 格式:标签\t文本
  • 标签:正样本标签为1,表示垃圾短信;负样本标签为0,表示正常短信
  • 文本:短信文本

环境依赖

  • Python3.6
  • jieba
  • Scikit-learn

分类算法

  • SVM:支持向量机

可根据需要替换为其他分类模型

使用说明

python train.py

流程图

流程图

About

自然语言处理之中文文本分类(以垃圾短信识别为例)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages