说明:此 repository 来源于 apacheCN, 为什么不 fork,而要自己重新创建一个呢?
- 1.) 万一有一天他们的 repository 被drop了呢,或者不公开了呢?
- 2.) 自己也可以完全自己重新创建,那会花费我大量的时间去整理代码,编辑
markdown
文档,没有太多时间,所以感谢 apacheCN!
此外:简单说明一下各文件夹内容:
- 1.) 文件夹
/ebooks
中存放 机器学习实战 电子书,没错就是你们知道的那本,中英文都有,中文版当然是扫描版,尽量选英文版看(清晰)- 2.) 文件夹
/codes
中存放机器学习各算法的python
代码,算比较全面了,不过还是推荐去看 Scikit-learn 机器学习库的教程- 3.) 文件夹
/inputDataset
中存放了用来训练的简单的数据集。其他文件夹啥也没有,Please don't click!
- 1.) 机器学习基础
- 2.) k-近邻算法
- 3.) 决策树
- 4.) 基于概率论的分类方法:朴素贝叶斯
- 5.) Logistic回归
- 6.) 支持向量机
- 7.) 集成方法-随机森林和AdaBoost
- 8.) 预测数值型数据:回归
- 9.) 树回归
- 10.) 使用K-均值聚类算法对未标注数据分组:k-means聚类
- 11.) 使用Apriori算法进行关联分析
- 12.) 使用FP-growth算法来高效发现频繁项集
- 13.) 利用PCA来简化数据
- 14.) 利用SVD简化数据
- 15.) 大数据与MapReduce
- 16.) 推荐系统