Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

基于新闻推荐 特征工程 #6

Closed
jiangshu-cn opened this issue Mar 23, 2021 · 4 comments
Closed

基于新闻推荐 特征工程 #6

jiangshu-cn opened this issue Mar 23, 2021 · 4 comments

Comments

@jiangshu-cn
Copy link

jiangshu-cn commented Mar 23, 2021

特征工程中只有基于召回结果构建的监督数据集label都为0,没有找到构建label为1的日志数据的这部分代码,是省略了吗?

@ruyiluo
Copy link
Collaborator

ruyiluo commented Mar 27, 2021

在给数据打标签的那一部分就是包括了label为0和为1的情况呀,为什么是只有label为0的呢?你那边的结果是发现label都是0么?那可能是召回部分效果不好导致的,所以打标签的时候没有1. 不知道我又没有理解到你的意思。

@jiangshu-cn
Copy link
Author

大佬,非常感谢回答,我之前理解的是召回的物品结果集,都是用户没有访问过的物品,所以lable肯定为0,后来用基于物品的召回代码调试的时候也是没有发现lable为1的,您的意思是召回的结果中也有已经访问过的物品吗

@jiangshu-cn jiangshu-cn changed the title 特征工程 基于新闻推荐 特征工程 Mar 27, 2021
@ruyiluo
Copy link
Collaborator

ruyiluo commented Mar 27, 2021

召回的时候就把用户最后一次点击给去掉了,作为在做排序特征时候的真实点击标签,如果在去掉最后一次点击之后的召回过程中能召回到哪些真实的点击标签,这样的在排序特征里面label是1,相反就是0. 所以其实在召回的时候负样本(就是标签为0的)会特别多,一般就涉及到负采样了。特征工程的文档中应该都有

@jiangshu-cn
Copy link
Author

大佬,谢谢解惑,我明白你的意思了

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants