junxincai / ChineseTextClassification Public

Notifications You must be signed in to change notification settings
Fork 3
Star 16

自然语言处理之中文文本分类（以垃圾短信识别为例）

16 stars 3 forks Branches Tags Activity

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
data		data
model		model
README.md		README.md
flow chart.jpg		flow chart.jpg
train.py		train.py

Repository files navigation

ChineseTextClassification

自然语言处理之中文文本分类（以垃圾短信识别为例）

数据集

格式：标签\t文本
标签：正样本标签为1，表示垃圾短信；负样本标签为0，表示正常短信
文本：短信文本

环境依赖

Python3.6
jieba
Scikit-learn

分类算法

SVM：支持向量机

可根据需要替换为其他分类模型

使用说明

python train.py

流程图

About

自然语言处理之中文文本分类（以垃圾短信识别为例）

Report repository

Releases

No releases published

Packages

Languages

Python 100.0%