1.基于Histogram的决策树算法
2.带深度限制的leaf-wise的树生长策略
(ps: 为了简化码字量,统一用lgb指代LightGBM)
1.似乎在xgb和lgb中,都没有提供针对多分类的平衡方案(只有二分类)?
-
lgb的树生长算法是leaf-wise,当需要调节模型(树)复杂度时,以num_leaves为主,max_depth为辅。
-
解决二分类问题的不平衡参数:‘is_unbalance’=True。该参数将不平衡问题解决放入模型构建过程中,解放劳动力。不过对lgb如何解决不平衡问题仍然保持好奇?
scale_pos_weight=1.0,weight of positive class in binary classification task.
-
bagging思想的融入。bagging_fraction和bagging_freq同时设置,feature_fraction。从fraction的字面意思来理解,应该是通过sampling增加多样性,避免overfitting。
-
min_data_in_leaf
-
min_sum_hessian_in_leaf