In [41]:
import pandas as pd
import numpy as np

# Models to use
import lightgbm as lgb
import catboost as cb

# Importing the metrics
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.metrics import roc_auc_score
from sklearn.metrics import classification_report
#from sklearn.metrics import confusion_matrix
#from sklearn.metrics import plot_confusion_matrix

# For measuring the training time taken during the fit process
import time

from hyperopt import hp
from hyperopt import fmin, tpe, STATUS_OK, STATUS_FAIL, Trials, space_eval

# Importing the Scalers
from sklearn.preprocessing import StandardScaler, MinMaxScaler


In [42]:
df = pd.read_csv('higgs_cleaned.csv')
df.head()

Unnamed: 0,class,lepton_pT,lepton_eta,lepton_phi,missing_energy_magnitude,missing_energy_phi,jet1pt,jet1eta,jet1phi,jet1b-tag,...,jet4eta,jet4phi,jet4b-tag,m_jj,m_jjj,m_lv,m_jlv,m_bb,m_wbb,m_wwbb
0,1,0.907542,0.329147,0.359412,1.49797,-0.31301,1.095531,-0.557525,-1.58823,2.173076,...,-1.13893,-0.000819,0.0,0.30222,0.833048,0.9857,0.978098,0.779732,0.992356,0.798343
1,1,0.798835,1.470639,-1.635975,0.453773,0.425629,1.104875,1.282322,1.381664,0.0,...,1.128848,0.900461,0.0,0.909753,1.10833,0.985692,0.951331,0.803252,0.865924,0.780118
2,0,1.344385,-0.876626,0.935913,1.99205,0.882454,1.786066,-1.646778,-0.942383,0.0,...,-0.678379,-1.360356,0.0,0.946652,1.028704,0.998656,0.728281,0.8692,1.026736,0.957904
3,1,1.105009,0.321356,1.522401,0.882808,-1.205349,0.681466,-1.070464,-0.921871,0.0,...,-0.373566,0.113041,0.0,0.755856,1.361057,0.98661,0.838085,1.133295,0.872245,0.808487
4,0,1.595839,-0.607811,0.007075,1.81845,-0.111906,0.84755,-0.566437,1.581239,2.173076,...,-0.654227,-1.274345,3.101961,0.823761,0.938191,0.971758,0.789176,0.430553,0.961357,0.957818


In [43]:
X, y = df.drop('class', axis=1), df['class']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1864)
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.15, random_state=1864)

In [44]:
scaler = MinMaxScaler()

X_train = scaler.fit_transform(X_train)
X_val = scaler.transform(X_val)
X_test = scaler.transform(X_test)

y_train = scaler.fit_transform(y_train.values.reshape(-1, 1)).reshape(-1)
y_val = scaler.transform(y_val.values.reshape(-1, 1)).reshape(-1)
y_test = scaler.transform(y_test.values.reshape(-1, 1)).reshape(-1)

Scaling is surely an important part of the pipeline but I realized that I forgot doing it in the end. I will add several choices for scalers later on, but for now lets move to designing the search space.

For the meaning of search functions such as hp.uniform, you can take a look at here: http://hyperopt.github.io/hyperopt/getting-started/search_spaces/.

In [45]:
classifier_parameters = {
    'learning_rate':    hp.choice('learning_rate',    np.arange(0.01, 0.31, 0.05)),
    'max_depth':        hp.choice('max_depth',        np.arange(2, 13, 1, dtype=int)),
    'min_child_weight': hp.choice('min_child_weight', np.arange(0.5, 10, 1, dtype=int)),
    'colsample_bytree': hp.choice('colsample_bytree', np.arange(0.5, 1, 0.1)),
    'subsample':        hp.uniform('subsample', 0.6, 1),
    'n_estimators':     hp.choice('n_estimators ', [100, 150, 200, 350, 500]),
    'min_child_samples':hp.choice('min_child_samples', np.arange(50, 500, 75, dtype=int)),
    'num_leaves':       hp.choice('num_leaves', [4, 8, 16, 32]),
    'objective':        'binary',
    'boosting_type':    hp.choice('boosting_type', ['gbdt', 'dart']),
    'random_seed':      1864
}
fit_parameters = {
    'eval_metric': 'logloss',
    'early_stopping_rounds': 10,
    'verbose': False
}

lgb_para = dict()
lgb_para['clf_params'] = classifier_parameters
lgb_para['fit_params'] = fit_parameters

In [46]:
classifier_parameters = {
    'l2_leaf_reg': hp.qloguniform('l2_leaf_reg', 0, 2, 1), # Coefficient of the regularizer for the cost function.
    'learning_rate': hp.uniform('learning_rate', 1e-3, 5e-1), # Self-explanatory. I think this will be quite important since it affects overfitting
    'max_depth': hp.choice('max_depth', np.arange(2, 14, dtype=int)), # Tree depths
    'num_trees': hp.choice('num_trees', [25, 50, 100, 150 , 200, 350, 500]), # Number of trees to be grown
    'colsample_bylevel': hp.uniform('colsample_bylevel', 0.5, 1.0), # Fraction of randomly selected features to use at each split
    'min_data_in_leaf': hp.choice('min_data_in_leaf', np.arange(2, 32, 2, dtype=int)), # Minimum data required in leaves for a split to occur
    #'num_leaves': hp.choice('num_leaves', [4, 8, 16, 32]), # max number of leaves
    'eval_metric': 'Accuracy',
    'loss_function':'Logloss',
    'random_seed': 1864
}


fit_parameters = {
    'early_stopping_rounds': 10,
    'verbose': False
}

ctb_para = dict()
ctb_para['clf_params'] = classifier_parameters
ctb_para['fit_params'] = fit_parameters

Objective function to optimize. It is a bit wordy for now but defining it as a class rather than a function may come in handy later on, in case we add more boosting models.

In [47]:
class objective_fn(object):
    
    def __init__(self, X_train, X_val, X_test, y_train, y_val, y_test):
        self.X_train = X_train
        self.X_val   = X_val
        self.X_test  = X_test
        
        self.y_train = y_train
        self.y_val   = y_val
        self.y_test  = y_test
        
    def process(self, fn_name, space, trials, algo, max_evals):
        fn = getattr(self, fn_name)
        try:
            result = fmin(fn=fn, space=space, algo=algo, max_evals=max_evals, trials=trials)
        except Exception as e:
            return {'status': STATUS_FAIL,
                    'exception': str(e)}
        return result, trials
    
    def ctb_clf(self, para):
        clf = cb.CatBoostClassifier(**para['clf_params'])
        return self.train(clf, para)
    
    def lgb_clf(self, para):
        clf = lgb.LGBMClassifier(**para['clf_params'])
        return self.train(clf, para)
    
    def train(self, clf, para):
        clf.fit(self.X_train, self.y_train,
                eval_set=[(self.X_train, self.y_train), (self.X_val, self.y_val)],
                **para['fit_params'])
        
        preds = clf.predict(self.X_test)
        acc = accuracy_score(self.y_test, preds)
        return {'loss': -acc, 'status': STATUS_OK}

We can now start the trials. Hyperopt tries to minimize the objective function value so the more negative the accuracy, the better. Playing with clf parameters or the value of maximum number of evaluations may give better results, but I'll keep the searching procedure not too expensive.

In [48]:
obj = objective_fn(X_train, X_val, X_test, y_train, y_val, y_test)

trials = Trials()
start = time.time()
best = obj.process(fn_name='lgb_clf', space=lgb_para, trials=trials, algo=tpe.suggest, max_evals=200)
end = time.time()

total_time = end - start

  0%|                                                                                                                                                       | 0/200 [00:00<?, ?trial/s, best loss=?]




  0%|▌                                                                                                                         | 1/200 [00:23<1:16:21, 23.02s/trial, best loss: -0.6774604793472718]




  1%|█▏                                                                                                                          | 2/200 [00:28<58:53, 17.85s/trial, best loss: -0.7146353901070882]




  2%|███                                                                                                                         | 5/200 [00:34<24:12,  7.45s/trial, best loss: -0.7215706272310046]




  3%|███▋                                                                                                                        | 6/200 [00:38<20:12,  6.25s/trial, best loss: -0.7215706272310046]




  4%|████▎                                                                                                                       | 7/200 [00:42<18:17,  5.69s/trial, best loss: -0.7215706272310046]




  4%|████▉                                                                                                                       | 8/200 [00:44<14:24,  4.50s/trial, best loss: -0.7215706272310046]




  4%|█████▌                                                                                                                      | 9/200 [01:10<35:16, 11.08s/trial, best loss: -0.7215706272310046]




  6%|██████▊                                                                                                                    | 11/200 [01:15<20:24,  6.48s/trial, best loss: -0.7215706272310046]




  6%|███████▉                                                                                                                   | 13/200 [01:44<29:52,  9.59s/trial, best loss: -0.7250892401835798]




  7%|████████▌                                                                                                                  | 14/200 [01:47<24:10,  7.80s/trial, best loss: -0.7250892401835798]




  8%|██████████▍                                                                                                                | 17/200 [02:12<25:34,  8.38s/trial, best loss: -0.7250892401835798]




  9%|███████████                                                                                                                | 18/200 [02:27<31:01, 10.23s/trial, best loss: -0.7250892401835798]




 10%|███████████▋                                                                                                               | 19/200 [02:30<24:40,  8.18s/trial, best loss: -0.7250892401835798]




 10%|████████████▎                                                                                                              | 20/200 [02:49<34:38, 11.55s/trial, best loss: -0.7250892401835798]




 10%|████████████▉                                                                                                              | 21/200 [03:23<53:41, 18.00s/trial, best loss: -0.7250892401835798]




 11%|█████████████▎                                                                                                           | 22/200 [03:55<1:06:29, 22.41s/trial, best loss: -0.7250892401835798]




 12%|█████████████▉                                                                                                           | 23/200 [04:35<1:21:18, 27.56s/trial, best loss: -0.7250892401835798]




 12%|██████████████▌                                                                                                          | 24/200 [05:19<1:35:36, 32.59s/trial, best loss: -0.7250892401835798]




 12%|███████████████▏                                                                                                         | 25/200 [06:01<1:42:46, 35.24s/trial, best loss: -0.7250892401835798]




 13%|███████████████▋                                                                                                         | 26/200 [06:27<1:34:31, 32.60s/trial, best loss: -0.7250892401835798]




 14%|████████████████▎                                                                                                        | 27/200 [06:49<1:24:25, 29.28s/trial, best loss: -0.7250892401835798]




 14%|████████████████▉                                                                                                        | 28/200 [07:12<1:19:12, 27.63s/trial, best loss: -0.7250892401835798]




 15%|██████████████████▍                                                                                                        | 30/200 [07:34<53:59, 19.06s/trial, best loss: -0.7250892401835798]




 16%|███████████████████                                                                                                        | 31/200 [07:51<51:34, 18.31s/trial, best loss: -0.7250892401835798]




 16%|███████████████████▎                                                                                                     | 32/200 [08:25<1:04:32, 23.05s/trial, best loss: -0.7250892401835798]




 17%|████████████████████▉                                                                                                      | 34/200 [08:43<42:11, 15.25s/trial, best loss: -0.7250892401835798]




 18%|█████████████████████▌                                                                                                     | 35/200 [09:08<50:40, 18.43s/trial, best loss: -0.7250892401835798]




 18%|██████████████████████▊                                                                                                    | 37/200 [09:55<52:16, 19.24s/trial, best loss: -0.7250892401835798]




 19%|██████████████████████▉                                                                                                  | 38/200 [10:25<1:00:25, 22.38s/trial, best loss: -0.7250892401835798]




 20%|███████████████████████▌                                                                                                 | 39/200 [11:04<1:13:37, 27.44s/trial, best loss: -0.7250892401835798]




 20%|█████████████████████████▏                                                                                                 | 41/200 [11:13<40:49, 15.40s/trial, best loss: -0.7250892401835798]




 21%|█████████████████████████▍                                                                                               | 42/200 [12:16<1:18:24, 29.78s/trial, best loss: -0.7250892401835798]




 22%|██████████████████████████                                                                                               | 43/200 [12:27<1:03:13, 24.17s/trial, best loss: -0.7250892401835798]




 22%|███████████████████████████▋                                                                                               | 45/200 [12:45<43:26, 16.82s/trial, best loss: -0.7250892401835798]




 23%|███████████████████████████▊                                                                                             | 46/200 [13:36<1:09:45, 27.18s/trial, best loss: -0.7265680775114738]




 24%|█████████████████████████████▌                                                                                             | 48/200 [13:50<41:52, 16.53s/trial, best loss: -0.7265680775114738]




 24%|██████████████████████████████▏                                                                                            | 49/200 [13:55<32:52, 13.06s/trial, best loss: -0.7265680775114738]




 25%|██████████████████████████████▎                                                                                          | 50/200 [15:23<1:28:41, 35.48s/trial, best loss: -0.7265680775114738]




 26%|███████████████████████████████▍                                                                                         | 52/200 [16:37<1:22:09, 33.31s/trial, best loss: -0.7265680775114738]




 26%|████████████████████████████████                                                                                         | 53/200 [18:16<2:10:06, 53.11s/trial, best loss: -0.7306986231514533]




 27%|████████████████████████████████▋                                                                                        | 54/200 [18:56<1:59:02, 48.92s/trial, best loss: -0.7306986231514533]




 28%|█████████████████████████████████▉                                                                                       | 56/200 [19:50<1:25:46, 35.74s/trial, best loss: -0.7306986231514533]




 28%|██████████████████████████████████▍                                                                                      | 57/200 [20:46<1:39:56, 41.93s/trial, best loss: -0.7306986231514533]




 29%|███████████████████████████████████                                                                                      | 58/200 [21:21<1:34:26, 39.90s/trial, best loss: -0.7306986231514533]




 30%|███████████████████████████████████▋                                                                                     | 59/200 [21:37<1:16:59, 32.76s/trial, best loss: -0.7306986231514533]




 30%|████████████████████████████████████▉                                                                                    | 61/200 [22:35<1:06:01, 28.50s/trial, best loss: -0.7306986231514533]




 31%|█████████████████████████████████████▌                                                                                   | 62/200 [23:03<1:04:55, 28.23s/trial, best loss: -0.7306986231514533]




 32%|██████████████████████████████████████                                                                                   | 63/200 [24:04<1:26:57, 38.09s/trial, best loss: -0.7306986231514533]




 32%|██████████████████████████████████████▋                                                                                  | 64/200 [24:14<1:07:29, 29.78s/trial, best loss: -0.7306986231514533]




 32%|███████████████████████████████████████▉                                                                                   | 65/200 [24:21<51:24, 22.85s/trial, best loss: -0.7306986231514533]




 33%|███████████████████████████████████████▉                                                                                 | 66/200 [25:13<1:11:02, 31.81s/trial, best loss: -0.7306986231514533]




 34%|████████████████████████████████████████▌                                                                                | 67/200 [26:05<1:23:29, 37.66s/trial, best loss: -0.7306986231514533]




 34%|█████████████████████████████████████████▏                                                                               | 68/200 [27:15<1:44:40, 47.58s/trial, best loss: -0.7306986231514533]




 34%|█████████████████████████████████████████▋                                                                               | 69/200 [28:49<2:14:17, 61.50s/trial, best loss: -0.7306986231514533]




 35%|██████████████████████████████████████████▎                                                                              | 70/200 [30:33<2:40:42, 74.18s/trial, best loss: -0.7306986231514533]




 36%|██████████████████████████████████████████▉                                                                              | 71/200 [32:20<3:00:36, 84.00s/trial, best loss: -0.7306986231514533]




 36%|███████████████████████████████████████████▌                                                                             | 72/200 [33:50<3:03:09, 85.85s/trial, best loss: -0.7306986231514533]




 36%|████████████████████████████████████████████▏                                                                            | 73/200 [33:57<2:11:19, 62.05s/trial, best loss: -0.7306986231514533]




 37%|████████████████████████████████████████████▊                                                                            | 74/200 [34:43<2:00:10, 57.22s/trial, best loss: -0.7306986231514533]




 38%|█████████████████████████████████████████████▍                                                                           | 75/200 [36:53<2:44:36, 79.02s/trial, best loss: -0.7306986231514533]




 38%|██████████████████████████████████████████████▌                                                                          | 77/200 [37:08<1:26:29, 42.19s/trial, best loss: -0.7306986231514533]




 39%|███████████████████████████████████████████████▏                                                                         | 78/200 [37:55<1:28:23, 43.47s/trial, best loss: -0.7306986231514533]




 40%|███████████████████████████████████████████████▊                                                                         | 79/200 [38:13<1:12:27, 35.93s/trial, best loss: -0.7306986231514533]




 40%|████████████████████████████████████████████████▍                                                                        | 80/200 [39:50<1:48:27, 54.23s/trial, best loss: -0.7306986231514533]




 41%|██████████████████████████████████████████████████▍                                                                        | 82/200 [40:05<59:33, 30.29s/trial, best loss: -0.7306986231514533]




 42%|███████████████████████████████████████████████████                                                                        | 83/200 [40:13<45:59, 23.59s/trial, best loss: -0.7306986231514533]




 42%|██████████████████████████████████████████████████▊                                                                      | 84/200 [41:55<1:31:01, 47.09s/trial, best loss: -0.7306986231514533]




 43%|████████████████████████████████████████████████████▉                                                                      | 86/200 [42:05<48:28, 25.52s/trial, best loss: -0.7306986231514533]




 44%|█████████████████████████████████████████████████████▌                                                                     | 87/200 [42:14<38:37, 20.51s/trial, best loss: -0.7306986231514533]




 44%|█████████████████████████████████████████████████████▏                                                                   | 88/200 [43:57<1:24:16, 45.14s/trial, best loss: -0.7306986231514533]




 44%|█████████████████████████████████████████████████████▊                                                                   | 89/200 [45:21<1:45:09, 56.84s/trial, best loss: -0.7306986231514533]




 46%|███████████████████████████████████████████████████████▉                                                                   | 91/200 [45:27<53:26, 29.42s/trial, best loss: -0.7306986231514533]




 46%|████████████████████████████████████████████████████████▌                                                                  | 92/200 [45:34<41:04, 22.82s/trial, best loss: -0.7306986231514533]




 46%|█████████████████████████████████████████████████████████▏                                                                 | 93/200 [46:15<50:26, 28.28s/trial, best loss: -0.7306986231514533]




 48%|██████████████████████████████████████████████████████████▍                                                                | 95/200 [46:24<27:56, 15.97s/trial, best loss: -0.7306986231514533]




 48%|███████████████████████████████████████████████████████████                                                                | 96/200 [47:08<42:02, 24.25s/trial, best loss: -0.7306986231514533]




 48%|███████████████████████████████████████████████████████████▋                                                               | 97/200 [47:11<31:08, 18.14s/trial, best loss: -0.7306986231514533]




 49%|████████████████████████████████████████████████████████████▎                                                              | 98/200 [47:34<33:17, 19.59s/trial, best loss: -0.7306986231514533]




 50%|█████████████████████████████████████████████████████████████                                                             | 100/200 [47:44<19:46, 11.87s/trial, best loss: -0.7306986231514533]




 50%|█████████████████████████████████████████████████████████████▌                                                            | 101/200 [48:04<23:36, 14.30s/trial, best loss: -0.7306986231514533]




 51%|██████████████████████████████████████████████████████████████▏                                                           | 102/200 [48:32<30:06, 18.43s/trial, best loss: -0.7306986231514533]




 52%|██████████████████████████████████████████████████████████████▊                                                           | 103/200 [48:42<25:45, 15.94s/trial, best loss: -0.7306986231514533]




 52%|███████████████████████████████████████████████████████████████▍                                                          | 104/200 [48:51<22:18, 13.94s/trial, best loss: -0.7306986231514533]




 53%|████████████████████████████████████████████████████████████████▋                                                         | 106/200 [49:02<14:25,  9.21s/trial, best loss: -0.7306986231514533]




 54%|█████████████████████████████████████████████████████████████████▎                                                        | 107/200 [49:10<14:04,  9.08s/trial, best loss: -0.7306986231514533]




 54%|█████████████████████████████████████████████████████████████████▉                                                        | 108/200 [49:20<14:08,  9.22s/trial, best loss: -0.7306986231514533]




 55%|██████████████████████████████████████████████████████████████████▍                                                       | 109/200 [49:27<13:07,  8.65s/trial, best loss: -0.7306986231514533]




 56%|███████████████████████████████████████████████████████████████████▋                                                      | 111/200 [49:37<09:27,  6.37s/trial, best loss: -0.7306986231514533]




 56%|████████████████████████████████████████████████████████████████████▎                                                     | 112/200 [49:43<09:17,  6.33s/trial, best loss: -0.7306986231514533]




 56%|████████████████████████████████████████████████████████████████████▉                                                     | 113/200 [49:46<07:36,  5.25s/trial, best loss: -0.7306986231514533]




 57%|█████████████████████████████████████████████████████████████████████▌                                                    | 114/200 [50:05<13:25,  9.36s/trial, best loss: -0.7306986231514533]




 58%|██████████████████████████████████████████████████████████████████████▊                                                   | 116/200 [50:13<09:13,  6.58s/trial, best loss: -0.7306986231514533]




 58%|███████████████████████████████████████████████████████████████████████▎                                                  | 117/200 [50:15<07:20,  5.30s/trial, best loss: -0.7306986231514533]




 59%|███████████████████████████████████████████████████████████████████████▉                                                  | 118/200 [50:21<07:23,  5.41s/trial, best loss: -0.7306986231514533]




 60%|████████████████████████████████████████████████████████████████████████▌                                                 | 119/200 [50:39<12:26,  9.22s/trial, best loss: -0.7306986231514533]




 60%|█████████████████████████████████████████████████████████████████████████▊                                                | 121/200 [50:45<08:02,  6.11s/trial, best loss: -0.7306986231514533]




 61%|██████████████████████████████████████████████████████████████████████████▍                                               | 122/200 [50:48<06:42,  5.16s/trial, best loss: -0.7306986231514533]




 62%|███████████████████████████████████████████████████████████████████████████                                               | 123/200 [51:02<10:14,  7.98s/trial, best loss: -0.7306986231514533]




 62%|███████████████████████████████████████████████████████████████████████████▋                                              | 124/200 [51:09<09:32,  7.53s/trial, best loss: -0.7306986231514533]




 63%|████████████████████████████████████████████████████████████████████████████▊                                             | 126/200 [51:15<06:27,  5.23s/trial, best loss: -0.7306986231514533]




 64%|█████████████████████████████████████████████████████████████████████████████▍                                            | 127/200 [51:39<12:58, 10.66s/trial, best loss: -0.7306986231514533]




 64%|██████████████████████████████████████████████████████████████████████████████                                            | 128/200 [51:48<12:15, 10.21s/trial, best loss: -0.7306986231514533]




 64%|██████████████████████████████████████████████████████████████████████████████▋                                           | 129/200 [52:16<18:30, 15.64s/trial, best loss: -0.7306986231514533]




 66%|███████████████████████████████████████████████████████████████████████████████▉                                          | 131/200 [52:20<09:57,  8.66s/trial, best loss: -0.7306986231514533]




 66%|████████████████████████████████████████████████████████████████████████████████▌                                         | 132/200 [52:41<13:51, 12.23s/trial, best loss: -0.7306986231514533]




 66%|█████████████████████████████████████████████████████████████████████████████████▏                                        | 133/200 [52:46<11:27, 10.27s/trial, best loss: -0.7306986231514533]




 67%|█████████████████████████████████████████████████████████████████████████████████▋                                        | 134/200 [53:15<17:21, 15.78s/trial, best loss: -0.7306986231514533]




 68%|██████████████████████████████████████████████████████████████████████████████████▉                                       | 136/200 [53:24<10:26,  9.79s/trial, best loss: -0.7306986231514533]




 68%|███████████████████████████████████████████████████████████████████████████████████▌                                      | 137/200 [53:33<09:57,  9.48s/trial, best loss: -0.7306986231514533]




 69%|████████████████████████████████████████████████████████████████████████████████████▏                                     | 138/200 [53:35<07:34,  7.33s/trial, best loss: -0.7306986231514533]




 70%|████████████████████████████████████████████████████████████████████████████████████▊                                     | 139/200 [54:09<15:37, 15.36s/trial, best loss: -0.7306986231514533]




 70%|█████████████████████████████████████████████████████████████████████████████████████▍                                    | 140/200 [54:24<15:17, 15.29s/trial, best loss: -0.7306986231514533]




 71%|██████████████████████████████████████████████████████████████████████████████████████▌                                   | 142/200 [54:33<09:14,  9.55s/trial, best loss: -0.7306986231514533]




 72%|███████████████████████████████████████████████████████████████████████████████████████▏                                  | 143/200 [54:43<09:16,  9.76s/trial, best loss: -0.7306986231514533]




 72%|███████████████████████████████████████████████████████████████████████████████████████▊                                  | 144/200 [55:40<22:22, 23.96s/trial, best loss: -0.7306986231514533]




 72%|████████████████████████████████████████████████████████████████████████████████████████▍                                 | 145/200 [55:59<20:37, 22.50s/trial, best loss: -0.7306986231514533]




 73%|█████████████████████████████████████████████████████████████████████████████████████████                                 | 146/200 [56:09<16:44, 18.60s/trial, best loss: -0.7306986231514533]




 74%|█████████████████████████████████████████████████████████████████████████████████████████▋                                | 147/200 [56:15<13:09, 14.89s/trial, best loss: -0.7306986231514533]




 74%|██████████████████████████████████████████████████████████████████████████████████████████▎                               | 148/200 [56:23<11:16, 13.01s/trial, best loss: -0.7306986231514533]




 74%|██████████████████████████████████████████████████████████████████████████████████████████▉                               | 149/200 [56:31<09:44, 11.46s/trial, best loss: -0.7306986231514533]




 75%|███████████████████████████████████████████████████████████████████████████████████████████▌                              | 150/200 [56:37<08:13,  9.87s/trial, best loss: -0.7306986231514533]




 76%|████████████████████████████████████████████████████████████████████████████████████████████                              | 151/200 [56:48<08:13, 10.07s/trial, best loss: -0.7306986231514533]




 76%|████████████████████████████████████████████████████████████████████████████████████████████▋                             | 152/200 [56:56<07:39,  9.58s/trial, best loss: -0.7306986231514533]




 76%|█████████████████████████████████████████████████████████████████████████████████████████████▎                            | 153/200 [57:03<06:49,  8.72s/trial, best loss: -0.7306986231514533]




 77%|█████████████████████████████████████████████████████████████████████████████████████████████▉                            | 154/200 [57:23<09:08, 11.93s/trial, best loss: -0.7306986231514533]




 78%|██████████████████████████████████████████████████████████████████████████████████████████████▌                           | 155/200 [57:44<11:02, 14.71s/trial, best loss: -0.7306986231514533]




 78%|███████████████████████████████████████████████████████████████████████████████████████████████▏                          | 156/200 [57:55<10:02, 13.70s/trial, best loss: -0.7306986231514533]




 78%|███████████████████████████████████████████████████████████████████████████████████████████████▊                          | 157/200 [58:08<09:42, 13.55s/trial, best loss: -0.7306986231514533]




 79%|████████████████████████████████████████████████████████████████████████████████████████████████▍                         | 158/200 [58:15<08:08, 11.63s/trial, best loss: -0.7306986231514533]




 80%|████████████████████████████████████████████████████████████████████████████████████████████████▉                         | 159/200 [58:30<08:37, 12.62s/trial, best loss: -0.7306986231514533]




 80%|█████████████████████████████████████████████████████████████████████████████████████████████████▌                        | 160/200 [59:00<11:45, 17.64s/trial, best loss: -0.7306986231514533]




 80%|██████████████████████████████████████████████████████████████████████████████████████████████████▏                       | 161/200 [59:50<17:52, 27.50s/trial, best loss: -0.7306986231514533]




 81%|█████████████████████████████████████████████████████████████████████████████████████████████████▏                      | 162/200 [1:00:05<14:58, 23.64s/trial, best loss: -0.7306986231514533]




 82%|██████████████████████████████████████████████████████████████████████████████████████████████████▍                     | 164/200 [1:00:14<08:14, 13.74s/trial, best loss: -0.7306986231514533]




 82%|███████████████████████████████████████████████████████████████████████████████████████████████████                     | 165/200 [1:01:41<20:55, 35.88s/trial, best loss: -0.7306986231514533]




 83%|███████████████████████████████████████████████████████████████████████████████████████████████████▌                    | 166/200 [1:03:22<31:18, 55.26s/trial, best loss: -0.7306986231514533]




 84%|████████████████████████████████████████████████████████████████████████████████████████████████████▏                   | 167/200 [1:05:10<39:09, 71.21s/trial, best loss: -0.7306986231514533]




 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████▍                  | 169/200 [1:06:36<27:26, 53.12s/trial, best loss: -0.7306986231514533]




 85%|██████████████████████████████████████████████████████████████████████████████████████████████████████                  | 170/200 [1:08:21<34:16, 68.55s/trial, best loss: -0.7306986231514533]




 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████▌                 | 171/200 [1:10:16<39:50, 82.42s/trial, best loss: -0.7306986231514533]




 86%|███████████████████████████████████████████████████████████████████████████████████████████████████████▏                | 172/200 [1:11:07<34:04, 73.02s/trial, best loss: -0.7306986231514533]




 86%|███████████████████████████████████████████████████████████████████████████████████████████████████████▊                | 173/200 [1:12:26<33:43, 74.94s/trial, best loss: -0.7306986231514533]




 88%|█████████████████████████████████████████████████████████████████████████████████████████████████████████               | 175/200 [1:14:02<23:50, 57.21s/trial, best loss: -0.7306986231514533]




 88%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▌              | 176/200 [1:15:23<25:45, 64.41s/trial, best loss: -0.7306986231514533]




 88%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▏             | 177/200 [1:16:50<27:16, 71.14s/trial, best loss: -0.7306986231514533]




 89%|██████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 178/200 [1:17:25<22:03, 60.17s/trial, best loss: -0.7306986231514533]




 90%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▍            | 179/200 [1:18:52<23:55, 68.34s/trial, best loss: -0.7306986231514533]




 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▌           | 181/200 [1:20:14<16:11, 51.13s/trial, best loss: -0.7306986231514533]




 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▏          | 182/200 [1:21:00<14:54, 49.72s/trial, best loss: -0.7306986231514533]




 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▊          | 183/200 [1:22:04<15:17, 53.97s/trial, best loss: -0.7306986231514533]




 92%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▍         | 184/200 [1:23:03<14:49, 55.60s/trial, best loss: -0.7306986231514533]




 92%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████         | 185/200 [1:23:29<11:39, 46.63s/trial, best loss: -0.7306986231514533]




 94%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏       | 187/200 [1:24:39<08:12, 37.85s/trial, best loss: -0.7306986231514533]




 94%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊       | 188/200 [1:24:41<05:25, 27.13s/trial, best loss: -0.7306986231514533]




 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍      | 189/200 [1:25:30<06:12, 33.82s/trial, best loss: -0.7306986231514533]




 95%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████      | 190/200 [1:25:46<04:44, 28.49s/trial, best loss: -0.7306986231514533]




 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌     | 191/200 [1:25:49<03:07, 20.79s/trial, best loss: -0.7306986231514533]




 96%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊    | 193/200 [1:26:57<02:52, 24.63s/trial, best loss: -0.7306986231514533]




 97%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍   | 194/200 [1:27:59<03:35, 35.84s/trial, best loss: -0.7306986231514533]




 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████   | 195/200 [1:28:03<02:11, 26.27s/trial, best loss: -0.7306986231514533]




 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌  | 196/200 [1:28:27<01:42, 25.55s/trial, best loss: -0.7306986231514533]




 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏ | 197/200 [1:29:10<01:32, 30.85s/trial, best loss: -0.7306986231514533]




100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍| 199/200 [1:29:20<00:17, 17.54s/trial, best loss: -0.7306986231514533]




100%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 200/200 [1:30:18<00:00, 27.09s/trial, best loss: -0.7306986231514533]


In [49]:
print('Parameters for the best LGBM Model:')
print()
for k,v in best[0].items():
    print(k, ':', v)
print()
print('Time taken for HyperParam Search:', round(total_time/60, 2), 'mins')

Parameters for the best LGBM Model:

boosting_type : 1
colsample_bytree : 3
learning_rate : 4
max_depth : 10
min_child_samples : 1
min_child_weight : 8
n_estimators  : 4
num_leaves : 3
subsample : 0.7049265682103403

Time taken for HyperParam Search: 90.31 mins


We have used the hp.choice function which returns the **index** of the best hyperparameter inside the given list of hyperparameters. So of course, the best hyperparameters for the number of trees is not 2, but 100.

The list below returns the correct model hyperparameters.

In [50]:
best_params = space_eval(lgb_para['clf_params'], trials.argmin)
best_params

{'boosting_type': 'dart',
 'colsample_bytree': 0.7999999999999999,
 'learning_rate': 0.21000000000000002,
 'max_depth': 12,
 'min_child_samples': 125,
 'min_child_weight': 8,
 'n_estimators': 500,
 'num_leaves': 32,
 'objective': 'binary',
 'random_seed': 1864,
 'subsample': 0.7049265682103403}

In [51]:
train_new_x = pd.concat([pd.DataFrame(X_train), pd.DataFrame(X_val)])
train_new_y = pd.concat([pd.DataFrame(y_train.reshape(-1)), pd.DataFrame(y_val.reshape(-1))])

In [52]:
clf = lgb.LGBMClassifier(**best_params)

clf.fit(train_new_x, train_new_y, verbose=False, eval_set=[(train_new_x, train_new_y), (X_test, y_test.reshape(-1))],
        eval_metric= 'logloss',
        early_stopping_rounds=50)

preds = clf.predict(X_test)

print(accuracy_score(y_test.reshape(-1), preds))

  return f(**kwargs)


0.7283528811830698


In [54]:
clf.booster_.save_model('model_minmax_lgbm_dart.txt')

<lightgbm.basic.Booster at 0x197708bc970>

In [53]:
"""clf.save_model(
    "model3_minmax_lgbm_dart.json",
    format="json",
    # pool=pool  # this parameter is required only for models with categorical features.
)"""

AttributeError: 'LGBMClassifier' object has no attribute 'save_model'