Python 是 Guido van Rossum 1989 年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言.
Python 哲学就是简单优雅,尽量写容易看明白的代码,尽量写少的代码.
Python 开发了很多明星网站,例如 YouTube、Instagram、Douban.
任何关于数据分析的模块都少不了它们两个
Matplotlib 是一个非常强大的 Python 画图工具
『解决一个问题的方法和思路不止一种』 『没有所谓的机器学习算法优劣,也没有绝对高性能的机器学习算法,只有在特定的场景、数据和特征下更合适的机器学习算法。』
Andrew Ng 语录
应用机器学习,不要一上来就试图做到完美,先lu一个baseline的model出来,再进行后续的分析步骤,一步步提高,所谓后续步骤可能包括『分析model现在的状态(欠/过拟合),分析我们使用的feature的作用大小,进行feature selection,以及我们模型下的bad case和产生的原因』等等。
Kaggle大神们 experience 总结 :
- 『对数据的认识太重要了!』
- 『数据中的特殊点/离群点的分析和处理太重要了!』
- 『特征工程(feature engineering)太重要了!在很多Kaggle的场景下,甚至比model本身还要重要』
- 『要做模型融合(model ensemble)啊啊啊!』