DecisionTree

数据

mnist_all.mat

mnist手写数字识别数据集

模型

ID3
C4.5
CART
RandomForest
Adaboost
GBDT
XGBoost
LightGBM
Catboost

结果

模型	数据	结果
custom ID3未剪枝	1000张训练+10000张测试	0.6468
custom ID3预剪枝
custom ID3后剪枝
skearn ID3	1000张训练+10000张测试	0.6331
custom C4.5未剪枝	1000张训练+10000张测试	0.6173
custom C4.5预剪枝
custom C4.5后剪枝
custom CART未剪枝	1000张训练+10000张测试	0.6721
custom CART后剪枝
sklearn CART	1000张训练+10000张测试	0.6486
custom RandomForest	1000张训练+10000张测试	0.7844
sklearn RandomForest	1000张训练+10000张测试	0.8254
custom Adaboost	1000张训练+10000张测试	0.7216
sklearn Adaboost	1000张训练+10000张测试	0.7325
custom GBDT	100张训练+10000张测试	0.3637
sklearn GBDT	100张训练+10000张测试	0.3651
custom XGBoost	100张训练+10000张测试	0.4024
XGBoost	100张训练+10000张测试	0.4237
custom LightGBM
LightGBM
custom CatBoost
CatBoost

说明

未考虑缺失值处理
在ID3中，处理连续值时，是选择使information gain最大的切分点，

在C4.5中是仍然选择使information gain最大的切分点还是选择使gain ratio最大的切分点？

我实现的时候选择了使gain ratio最大的切分点。
使用60000张训练很慢，因此只用了1000张
我实现的决策树之所以慢，一个可能的原因是采用了连续的特征，而不是将图像二值化

参考

致谢

感谢 lgr 老师的帮助！

Name		Name	Last commit message	Last commit date
Latest commit History 23 Commits
.ipynb_checkpoints		.ipynb_checkpoints
data		data
gbdt		gbdt
AdaBoost.ipynb		AdaBoost.ipynb
C4.5_without_pruning.ipynb		C4.5_without_pruning.ipynb
CART_without_pruning.ipynb		CART_without_pruning.ipynb
ID3_without_pruning.ipynb		ID3_without_pruning.ipynb
README.md		README.md
RandomForest.ipynb		RandomForest.ipynb
XGBoost.ipynb		XGBoost.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

.ipynb_checkpoints

.ipynb_checkpoints

data

data

gbdt

gbdt

AdaBoost.ipynb

AdaBoost.ipynb

C4.5_without_pruning.ipynb

C4.5_without_pruning.ipynb

CART_without_pruning.ipynb

CART_without_pruning.ipynb

ID3_without_pruning.ipynb

ID3_without_pruning.ipynb

README.md

README.md

RandomForest.ipynb

RandomForest.ipynb

XGBoost.ipynb

XGBoost.ipynb

Repository files navigation

DecisionTree

数据

模型

结果

说明

参考

致谢

About

Releases

Packages

Languages

bufuchangfeng/DecisionTree

Folders and files

Latest commit

History

Repository files navigation

DecisionTree

数据

模型

结果

说明

参考

致谢

About

Resources

Stars

Watchers

Forks

Languages