Skip to content
This repository has been archived by the owner on Oct 18, 2022. It is now read-only.

关于准确率的疑问 #2

Open
dongyuanxin opened this issue Oct 29, 2017 · 0 comments
Open

关于准确率的疑问 #2

dongyuanxin opened this issue Oct 29, 2017 · 0 comments
Labels

Comments

@dongyuanxin
Copy link
Owner

dongyuanxin commented Oct 29, 2017

在不过拟合的前提下,相信样本的打标的准确率是大家最期待的结果。那么,这里公布一下的1000个打标的数据模型,在留一验证后的准确率。

二分类

只是将新闻打标分为正极和负极,各路论文的常见分类。
two-tag

三分类

将新闻文本分为正极、负极和中性三个类别。基本上,所有论文都尽力规避中性分类,但是,在现实中确是存在的问题。当然,在打标上,中性分类的标注也需要斟酌。就目前结果来看,三分类的效果可以接受。
three-tag

一些说明

由于一些问题,这里先取消了tf-idfsvm及相关模型的组合,具体原因请移步bug Issues查看。(上面结果中,会有一行一列均为0)

@dongyuanxin dongyuanxin changed the title 关于准确率的说明 关于准确率的疑问 Oct 29, 2017
Sign up for free to subscribe to this conversation on GitHub. Already have an account? Sign in.
Labels
Projects
None yet
Development

No branches or pull requests

1 participant