New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
请教一下一个初级的问题 #4
Comments
你好,rrl.txt的每一个列(字段)的含义如下:
|
非常感谢您的回复,我是刚接触机器学习不久,望您包涵,那我是不是可以简单的将分类的weight和bias做如下计算得到各类别的分类概率呢? 那么又怎么看出rrl.txt中到底哪条规则对于分类更为有效呢,也就是说规则rule列有复杂也有简单的规则,而且所覆盖的数据集样本也不一样,那么到底那一条或者那几条规则更为准确呢,这个我认为就是可以让使用者去平衡规则复杂度和模型准确性的地方 |
有个地方你理解的有点问题。就是如果要分类一个实例,我们需要先找到所有激活的规则,然后按照类别求和所有激活的规则对应的weight,再加上bias,最后算softmax。举个例子:
那么激活的是r1和r3,则数组A应该为[W11+W31+b1, W12+W32+b2],然后再计算softmax(A)即可。要记住分类是所有规则共同作用的结果。 另外如果你是已经训练好了模型,想找哪些规则比较重要,可以看weight的绝对值的大小,以及support值。 |
rrl.text中的结果的每个字段是什么含义能够解释一下吗?RID我理解是规则ID,但他的取值是什么意思呢,这个标签特征的分类|class_negative(b=-2.1733) | class_positive(b=1.9689)括号中的b是代表平均值吗,每个标签的值是结果的概率吗?那个support又代表什么意思呢?
The text was updated successfully, but these errors were encountered: