Skip to content

阿里音乐流行趋势预测大赛代码(包括初赛、复赛)

Notifications You must be signed in to change notification settings

mindawei/alimusic-predict

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 

Repository files navigation

alimusic-predict

阿里音乐流行趋势预测大赛比赛要求参赛者利用阿里音乐用户前 6 个月的播放数据预测未来 2 个月的播放情况。本人在比赛中负责数据的清洗和平滑、规则的编写。初赛排名第216名(前500名进入复赛),复赛排名第 12(共 5476 队),获得极客奖。

alimusic-predict-1

这是初赛代码(Python),解题思路:进行数据分析,清理异常值,构造数据特征,调用一些模型(GBDT,随机深林)进行预测。

alimusic-predict-2

这是复赛代码(Java),解题思路:由于数据质量不高,均值预测效果较好。趋势的反映可以制定相关规则实现。

总结

  • 基本概念一定要清晰:其他选手会将一些输入输出公式化;宏观问题不适合使用微观因素,因为缺少部分它们之间的相互关系。
  • 分类效率不高:我们使用一些规则、人工进行判断 <-> 对方 GBDT 进行分类
  • 预测模型:我们是直线 <-> 对方是V字型
  • 公式观察:没有观察 <-> 对方分析,公式来看偏小值进行预测比偏大值预测分数高
  • 提交问题:直观分析 <-> 记录每次提交的详细信息,并分析分数变动的原因;为了一些未知的部分,可以设定值去试
  • 其他:对手模型融合增加鲁棒性;分类部分GBDT基本默认参数;数据清洗;充分运用均值、中位数等

About

阿里音乐流行趋势预测大赛代码(包括初赛、复赛)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages