基于互信息熵的朴素贝叶斯分类,数据集选择英文的恶意邮件,首先通过tf-idf对文本特征化,后通过高斯分布对连续特征概率进行估计,使用互信息进行加权,最终正确率为94%,想对比原始朴素贝叶斯分类提高4%左右
-
Notifications
You must be signed in to change notification settings - Fork 1
hualoveshao/MI_Naive_Bayesian
About
基于互信息熵的朴素贝叶斯分类,数据集选择英文的恶意邮件,首先通过tf-idf对文本特征化,后通过高斯分布对连续特征概率进行估计,使用互信息进行加权,最终正确率为94%,想对比原始朴素贝叶斯分类提高4%左右
Resources
Stars
Watchers
Forks
Releases
No releases published
Packages 0
No packages published