Skip to content

Kaggle比赛,第一个进了前10%,想分享一下自己的做法,和总结一些大神们的做法。

Notifications You must be signed in to change notification settings

RellRex/Kaggle-Santander-Customer-Transaction-Prediction

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

11 Commits
 
 

Repository files navigation

Kaggle-Santander-Customer-Transaction-Prediction

Kaggle比赛,第一个进了前10%,想分享一下自己的做法,和总结一些大神们的做法。

count => 0.908

kernel 这步的做法是,将train和“真实”的test数据相结合,统计每个样本中每个特征的值,在所有该特征的取值中出现的次数。比如,对于第一个样本,特征var0的值为8.9255,在该特征所有的取值中出现了8次。
那为什么这个看似很“神奇”的方法会产生作用,kernel作者认为这个数据集可能没有一个数据是真实的,所以一些关于这些数据是如何产生的信息能够更好的帮助我们进行预测。。。这篇kernel的作者说,在他的工作经验中,对于类别变量,机器学习算法并不能自己学习到里面的统计信息。

About

Kaggle比赛,第一个进了前10%,想分享一下自己的做法,和总结一些大神们的做法。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published