Skip to content

blaire101/machine-learning-action

Repository files navigation

data mining

Python

Python 是 Guido van Rossum 1989 年圣诞节期间,为了打发无聊的圣诞节而编写的一个编程语言.

Python 哲学就是简单优雅,尽量写容易看明白的代码,尽量写少的代码.

Python 开发了很多明星网站,例如 YouTube、Instagram、Douban.

Numpy & Pandas

任何关于数据分析的模块都少不了它们两个

Matplotlib

Matplotlib 是一个非常强大的 Python 画图工具

Machine Learning

『解决一个问题的方法和思路不止一种』 『没有所谓的机器学习算法优劣,也没有绝对高性能的机器学习算法,只有在特定的场景、数据和特征下更合适的机器学习算法。』

Andrew Ng 语录

应用机器学习,不要一上来就试图做到完美,先lu一个baseline的model出来,再进行后续的分析步骤,一步步提高,所谓后续步骤可能包括『分析model现在的状态(欠/过拟合),分析我们使用的feature的作用大小,进行feature selection,以及我们模型下的bad case和产生的原因』等等。

Kaggle大神们 experience 总结

  1. 『对数据的认识太重要了!』
  2. 『数据中的特殊点/离群点的分析和处理太重要了!』
  3. 『特征工程(feature engineering)太重要了!在很多Kaggle的场景下,甚至比model本身还要重要』
  4. 『要做模型融合(model ensemble)啊啊啊!』

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages