In [1]:
import gc
from glob import glob
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from pathlib import Path
import time
from typing import Tuple

import xgboost as xgb
from sklearn import metrics

import sys
sys.path.append("../utils")
from metrics import compute_recall_at4, compute_normalized_gini, compute_amex_metric
#from messaging import send_message

pd.set_option('display.max_columns', None)

In [2]:
# metrics in xgboost format

def metric_recall_at4(predt: np.ndarray, dtrain: xgb.DMatrix) -> Tuple[str, float]:
    y_true = dtrain.get_label()
    return 'recall_at4', compute_recall_at4(y_true, predt)

def metric_normalized_gini(predt: np.ndarray, dtrain: xgb.DMatrix) -> Tuple[str, float]:
    y_true = dtrain.get_label()
    return 'norm_gini', compute_normalized_gini(y_true, predt)

def metric_amex(predt: np.ndarray, dtrain: xgb.DMatrix) -> Tuple[str, float]:
    y_true = dtrain.get_label()
    return 'amex_metric', compute_amex_metric(y_true, predt)

In [3]:
# CONFIG PARAMS
N_REPEATS = 3
DATASET_VERSION = "06"

In [4]:
OOF_PATH = Path(f"../data/oof/xgboost-dsv{DATASET_VERSION}")
SUB_PATH = Path(f"../data/subs/xgboost-dsv{DATASET_VERSION}")
ART_PATH = Path(f"../artifacts/xgboost-dsv{DATASET_VERSION}")

if not OOF_PATH.exists():
    OOF_PATH.mkdir(parents=True, exist_ok=True)
if not SUB_PATH.exists():
    SUB_PATH.mkdir(parents=True, exist_ok=True)
if not ART_PATH.exists():
    ART_PATH.mkdir(parents=True, exist_ok=True)

***
## load and prepare data

In [5]:
train = pd.read_parquet(f"../data/processed/dsv{DATASET_VERSION}/train.parquet")
train_labels = pd.read_csv("../data/raw/train_labels.csv", index_col="customer_ID")

In [6]:
input_feats = train.columns.tolist()
len(input_feats)

1308

In [7]:
train = pd.merge(train, train_labels, how="inner", left_index=True, right_index=True)
del train_labels
gc.collect()

517

***
## model training

train with repeated cross validation

In [8]:
model_params = {
    'booster': 'gbtree',
    'objective': 'binary:logistic',
    'seed': 2112,
    'disable_default_eval_metric':True,
    # general params
    'eta': 0.05,
    'max_depth': 5,
    'tree_method': 'hist',
    'grow_policy': 'depthwise',
    'colsample_bytree': 0.1,
    'subsample': 0.8,
    'iterations': 4400,
    # regularization
    'min_child_weight': 100,
    'alpha': 28.291386794681554,
    'lambda': 3.5708647839613525,
    'max_delta_step': 0.7209862295680118,    
    'min_split_loss': 1.4540866337770056e-05,
    'max_bin': 1023,
}
MAX_ITERATIONS = model_params.pop("iterations")
print(MAX_ITERATIONS)

4400


In [9]:
def train_models(dataframe: pd.DataFrame, n_folds: int = 5,) -> tuple:
    
    models = list()
    
    # dataframe to store the oof predictions
    oof = dataframe[["target"]].copy()
    oof["pred"] = -1

    for fold in range(n_folds):
        
        print(f" training model {fold+1}/{n_folds} ".center(100, "#"))
        
        train_df = dataframe.query("fold != @fold").copy()
        valid_df = dataframe.query("fold == @fold").copy()
                                
        train_dset = xgb.DMatrix(
            data=train_df.loc[:,input_feats],
            label=train_df.loc[:,"target"].values,
        )
        valid_dset = xgb.DMatrix(
            data=valid_df.loc[:,input_feats],
            label=valid_df.loc[:,"target"].values,
        )
        model = xgb.train(
            params = model_params,
            dtrain=train_dset,
            num_boost_round=MAX_ITERATIONS,
            evals=[(valid_dset,"eval"), ],
            custom_metric=metric_amex,
            verbose_eval=50,
        )
          
        oof.loc[valid_df.index,"pred"] = model.predict(valid_dset)
        
        models.append(model)
        del train_df,valid_df,train_dset,valid_dset
        gc.collect()
    
    return models,oof

In [10]:
# implement repeated cross validation
sorted(glob("../data/processed/cv*.csv"))

['../data/processed/cv0.csv',
 '../data/processed/cv1.csv',
 '../data/processed/cv2.csv',
 '../data/processed/cv3.csv',
 '../data/processed/cv4.csv',
 '../data/processed/cv5.csv',
 '../data/processed/cv6.csv',
 '../data/processed/cv7.csv',
 '../data/processed/cv8.csv',
 '../data/processed/cv9.csv']

In [11]:
%%time 

all_models = list()
all_oof_dfs = list()

for repetition in range(N_REPEATS):
    print(f" repeated cross-validation step: {repetition+1}/{N_REPEATS} ".center(100, "#"))

    folds = pd.read_csv(f'../data/processed/cv{repetition}.csv', index_col="customer_ID")
    _train = pd.merge(train, folds, how="inner", left_index=True, right_index=True).reset_index(drop=True)
    
    tic = time.time()
    models,oof = train_models(_train, n_folds=5)
    tac = time.time()
    print(f"Training time: {(tac-tic)/60} min.")
          
    # oof metrics
    print("OOF recall_at4:", compute_recall_at4(oof.target.values, oof.pred.values))
    print("OOF normalized_gini:", compute_normalized_gini(oof.target.values, oof.pred.values))
    print("OOF competition metric:", compute_amex_metric(oof.target.values, oof.pred.values))
    
    all_models.append(models)
    all_oof_dfs.append(oof)
    
    # save oof predictions
    oof.to_csv(OOF_PATH/f"oof-cv{repetition}.csv", index=False)
    
    # save models
    #for fold,_model in enumerate(models):
    #    _model.save_model(ART_PATH/f"/model-cv{repetition}-fold{fold}.cbm", format="cbm")
          
    del _train, folds; gc.collect()

############################### repeated cross-validation step: 1/3 ################################


######################################## training model 1/5 ########################################


[0]	eval-amex_metric:0.57169


[50]	eval-amex_metric:0.75700


[100]	eval-amex_metric:0.77068


[150]	eval-amex_metric:0.77763


[200]	eval-amex_metric:0.78201


[250]	eval-amex_metric:0.78530


[300]	eval-amex_metric:0.78786


[350]	eval-amex_metric:0.78966


[400]	eval-amex_metric:0.79088


[450]	eval-amex_metric:0.79188


[500]	eval-amex_metric:0.79226


[550]	eval-amex_metric:0.79317


[600]	eval-amex_metric:0.79421


[650]	eval-amex_metric:0.79468


[700]	eval-amex_metric:0.79468


[750]	eval-amex_metric:0.79568


[800]	eval-amex_metric:0.79640


[850]	eval-amex_metric:0.79610


[900]	eval-amex_metric:0.79627


[950]	eval-amex_metric:0.79666


[1000]	eval-amex_metric:0.79648


[1050]	eval-amex_metric:0.79705


[1100]	eval-amex_metric:0.79758


[1150]	eval-amex_metric:0.79807


[1200]	eval-amex_metric:0.79843


[1250]	eval-amex_metric:0.79854


[1300]	eval-amex_metric:0.79851


[1350]	eval-amex_metric:0.79889


[1400]	eval-amex_metric:0.79870


[1450]	eval-amex_metric:0.79846


[1500]	eval-amex_metric:0.79866


[1550]	eval-amex_metric:0.79857


[1600]	eval-amex_metric:0.79885


[1650]	eval-amex_metric:0.79889


[1700]	eval-amex_metric:0.79888


[1750]	eval-amex_metric:0.79858


[1800]	eval-amex_metric:0.79865


[1850]	eval-amex_metric:0.79852


[1900]	eval-amex_metric:0.79870


[1950]	eval-amex_metric:0.79836


[2000]	eval-amex_metric:0.79861


[2050]	eval-amex_metric:0.79915


[2100]	eval-amex_metric:0.79906


[2150]	eval-amex_metric:0.79881


[2200]	eval-amex_metric:0.79885


[2250]	eval-amex_metric:0.79866


[2300]	eval-amex_metric:0.79877


[2350]	eval-amex_metric:0.79883


[2400]	eval-amex_metric:0.79891


[2450]	eval-amex_metric:0.79890


[2500]	eval-amex_metric:0.79919


[2550]	eval-amex_metric:0.79875


[2600]	eval-amex_metric:0.79889


[2650]	eval-amex_metric:0.79862


[2700]	eval-amex_metric:0.79841


[2750]	eval-amex_metric:0.79866


[2800]	eval-amex_metric:0.79876


[2850]	eval-amex_metric:0.79902


[2900]	eval-amex_metric:0.79913


[2950]	eval-amex_metric:0.79927


[3000]	eval-amex_metric:0.79908


[3050]	eval-amex_metric:0.79866


[3100]	eval-amex_metric:0.79921


[3150]	eval-amex_metric:0.79859


[3200]	eval-amex_metric:0.79841


[3250]	eval-amex_metric:0.79854


[3300]	eval-amex_metric:0.79869


[3350]	eval-amex_metric:0.79871


[3400]	eval-amex_metric:0.79868


[3450]	eval-amex_metric:0.79917


[3500]	eval-amex_metric:0.79939


[3550]	eval-amex_metric:0.79882


[3600]	eval-amex_metric:0.79875


[3650]	eval-amex_metric:0.79860


[3700]	eval-amex_metric:0.79887


[3750]	eval-amex_metric:0.79872


[3800]	eval-amex_metric:0.79901


[3850]	eval-amex_metric:0.79887


[3900]	eval-amex_metric:0.79832


[3950]	eval-amex_metric:0.79842


[4000]	eval-amex_metric:0.79840


[4050]	eval-amex_metric:0.79829


[4100]	eval-amex_metric:0.79829


[4150]	eval-amex_metric:0.79816


[4200]	eval-amex_metric:0.79848


[4250]	eval-amex_metric:0.79805


[4300]	eval-amex_metric:0.79836


[4350]	eval-amex_metric:0.79844


[4399]	eval-amex_metric:0.79840


######################################## training model 2/5 ########################################


[0]	eval-amex_metric:0.56802


[50]	eval-amex_metric:0.75455


[100]	eval-amex_metric:0.76850


[150]	eval-amex_metric:0.77558


[200]	eval-amex_metric:0.78017


[250]	eval-amex_metric:0.78422


[300]	eval-amex_metric:0.78651


[350]	eval-amex_metric:0.78866


[400]	eval-amex_metric:0.79011


[450]	eval-amex_metric:0.79111


[500]	eval-amex_metric:0.79171


[550]	eval-amex_metric:0.79309


[600]	eval-amex_metric:0.79376


[650]	eval-amex_metric:0.79434


[700]	eval-amex_metric:0.79398


[750]	eval-amex_metric:0.79383


[800]	eval-amex_metric:0.79382


[850]	eval-amex_metric:0.79450


[900]	eval-amex_metric:0.79414


[950]	eval-amex_metric:0.79464


[1000]	eval-amex_metric:0.79482


[1050]	eval-amex_metric:0.79572


[1100]	eval-amex_metric:0.79545


[1150]	eval-amex_metric:0.79544


[1200]	eval-amex_metric:0.79537


[1250]	eval-amex_metric:0.79571


[1300]	eval-amex_metric:0.79577


[1350]	eval-amex_metric:0.79627


[1400]	eval-amex_metric:0.79650


[1450]	eval-amex_metric:0.79642


[1500]	eval-amex_metric:0.79676


[1550]	eval-amex_metric:0.79725


[1600]	eval-amex_metric:0.79740


[1650]	eval-amex_metric:0.79708


[1700]	eval-amex_metric:0.79744


[1750]	eval-amex_metric:0.79708


[1800]	eval-amex_metric:0.79771


[1850]	eval-amex_metric:0.79753


[1900]	eval-amex_metric:0.79764


[1950]	eval-amex_metric:0.79788


[2000]	eval-amex_metric:0.79790


[2050]	eval-amex_metric:0.79787


[2100]	eval-amex_metric:0.79763


[2150]	eval-amex_metric:0.79711


[2200]	eval-amex_metric:0.79765


[2250]	eval-amex_metric:0.79808


[2300]	eval-amex_metric:0.79778


[2350]	eval-amex_metric:0.79749


[2400]	eval-amex_metric:0.79792


[2450]	eval-amex_metric:0.79795


[2500]	eval-amex_metric:0.79793


[2550]	eval-amex_metric:0.79799


[2600]	eval-amex_metric:0.79826


[2650]	eval-amex_metric:0.79814


[2700]	eval-amex_metric:0.79795


[2750]	eval-amex_metric:0.79815


[2800]	eval-amex_metric:0.79816


[2850]	eval-amex_metric:0.79760


[2900]	eval-amex_metric:0.79732


[2950]	eval-amex_metric:0.79721


[3000]	eval-amex_metric:0.79776


[3050]	eval-amex_metric:0.79778


[3100]	eval-amex_metric:0.79826


[3150]	eval-amex_metric:0.79778


[3200]	eval-amex_metric:0.79755


[3250]	eval-amex_metric:0.79781


[3300]	eval-amex_metric:0.79788


[3350]	eval-amex_metric:0.79818


[3400]	eval-amex_metric:0.79816


[3450]	eval-amex_metric:0.79818


[3500]	eval-amex_metric:0.79813


[3550]	eval-amex_metric:0.79811


[3600]	eval-amex_metric:0.79775


[3650]	eval-amex_metric:0.79784


[3700]	eval-amex_metric:0.79766


[3750]	eval-amex_metric:0.79775


[3800]	eval-amex_metric:0.79758


[3850]	eval-amex_metric:0.79782


[3900]	eval-amex_metric:0.79756


[3950]	eval-amex_metric:0.79732


[4000]	eval-amex_metric:0.79772


[4050]	eval-amex_metric:0.79746


[4100]	eval-amex_metric:0.79772


[4150]	eval-amex_metric:0.79755


[4200]	eval-amex_metric:0.79772


[4250]	eval-amex_metric:0.79814


[4300]	eval-amex_metric:0.79821


[4350]	eval-amex_metric:0.79783


[4399]	eval-amex_metric:0.79772


######################################## training model 3/5 ########################################


[0]	eval-amex_metric:0.53492


[50]	eval-amex_metric:0.74900


[100]	eval-amex_metric:0.76337


[150]	eval-amex_metric:0.77116


[200]	eval-amex_metric:0.77624


[250]	eval-amex_metric:0.77947


[300]	eval-amex_metric:0.78219


[350]	eval-amex_metric:0.78329


[400]	eval-amex_metric:0.78430


[450]	eval-amex_metric:0.78522


[500]	eval-amex_metric:0.78664


[550]	eval-amex_metric:0.78740


[600]	eval-amex_metric:0.78829


[650]	eval-amex_metric:0.78854


[700]	eval-amex_metric:0.78870


[750]	eval-amex_metric:0.78842


[800]	eval-amex_metric:0.78914


[850]	eval-amex_metric:0.78893


[900]	eval-amex_metric:0.78920


[950]	eval-amex_metric:0.78918


[1000]	eval-amex_metric:0.78962


[1050]	eval-amex_metric:0.78997


[1100]	eval-amex_metric:0.79022


[1150]	eval-amex_metric:0.79042


[1200]	eval-amex_metric:0.79008


[1250]	eval-amex_metric:0.79028


[1300]	eval-amex_metric:0.79045


[1350]	eval-amex_metric:0.79041


[1400]	eval-amex_metric:0.79056


[1450]	eval-amex_metric:0.79078


[1500]	eval-amex_metric:0.79086


[1550]	eval-amex_metric:0.79066


[1600]	eval-amex_metric:0.79093


[1650]	eval-amex_metric:0.79087


[1700]	eval-amex_metric:0.79173


[1750]	eval-amex_metric:0.79173


[1800]	eval-amex_metric:0.79166


[1850]	eval-amex_metric:0.79190


[1900]	eval-amex_metric:0.79163


[1950]	eval-amex_metric:0.79166


[2000]	eval-amex_metric:0.79173


[2050]	eval-amex_metric:0.79179


[2100]	eval-amex_metric:0.79161


[2150]	eval-amex_metric:0.79156


[2200]	eval-amex_metric:0.79171


[2250]	eval-amex_metric:0.79183


[2300]	eval-amex_metric:0.79198


[2350]	eval-amex_metric:0.79197


[2400]	eval-amex_metric:0.79165


[2450]	eval-amex_metric:0.79134


[2500]	eval-amex_metric:0.79193


[2550]	eval-amex_metric:0.79153


[2600]	eval-amex_metric:0.79203


[2650]	eval-amex_metric:0.79225


[2700]	eval-amex_metric:0.79230


[2750]	eval-amex_metric:0.79241


[2800]	eval-amex_metric:0.79194


[2850]	eval-amex_metric:0.79222


[2900]	eval-amex_metric:0.79222


[2950]	eval-amex_metric:0.79209


[3000]	eval-amex_metric:0.79246


[3050]	eval-amex_metric:0.79214


[3100]	eval-amex_metric:0.79197


[3150]	eval-amex_metric:0.79220


[3200]	eval-amex_metric:0.79228


[3250]	eval-amex_metric:0.79202


[3300]	eval-amex_metric:0.79224


[3350]	eval-amex_metric:0.79213


[3400]	eval-amex_metric:0.79220


[3450]	eval-amex_metric:0.79213


[3500]	eval-amex_metric:0.79270


[3550]	eval-amex_metric:0.79237


[3600]	eval-amex_metric:0.79266


[3650]	eval-amex_metric:0.79222


[3700]	eval-amex_metric:0.79286


[3750]	eval-amex_metric:0.79272


[3800]	eval-amex_metric:0.79275


[3850]	eval-amex_metric:0.79259


[3900]	eval-amex_metric:0.79279


[3950]	eval-amex_metric:0.79247


[4000]	eval-amex_metric:0.79204


[4050]	eval-amex_metric:0.79199


[4100]	eval-amex_metric:0.79200


[4150]	eval-amex_metric:0.79196


[4200]	eval-amex_metric:0.79219


[4250]	eval-amex_metric:0.79257


[4300]	eval-amex_metric:0.79300


[4350]	eval-amex_metric:0.79215


[4399]	eval-amex_metric:0.79259


######################################## training model 4/5 ########################################


[0]	eval-amex_metric:0.55039


[50]	eval-amex_metric:0.74959


[100]	eval-amex_metric:0.76314


[150]	eval-amex_metric:0.77070


[200]	eval-amex_metric:0.77515


[250]	eval-amex_metric:0.77801


[300]	eval-amex_metric:0.78057


[350]	eval-amex_metric:0.78227


[400]	eval-amex_metric:0.78330


[450]	eval-amex_metric:0.78398


[500]	eval-amex_metric:0.78482


[550]	eval-amex_metric:0.78554


[600]	eval-amex_metric:0.78599


[650]	eval-amex_metric:0.78614


[700]	eval-amex_metric:0.78744


[750]	eval-amex_metric:0.78759


[800]	eval-amex_metric:0.78825


[850]	eval-amex_metric:0.78819


[900]	eval-amex_metric:0.78896


[950]	eval-amex_metric:0.78907


[1000]	eval-amex_metric:0.78909


[1050]	eval-amex_metric:0.78926


[1100]	eval-amex_metric:0.78897


[1150]	eval-amex_metric:0.78938


[1200]	eval-amex_metric:0.78942


[1250]	eval-amex_metric:0.79001


[1300]	eval-amex_metric:0.79010


[1350]	eval-amex_metric:0.78987


[1400]	eval-amex_metric:0.79007


[1450]	eval-amex_metric:0.78975


[1500]	eval-amex_metric:0.79047


[1550]	eval-amex_metric:0.79100


[1600]	eval-amex_metric:0.79093


[1650]	eval-amex_metric:0.79094


[1700]	eval-amex_metric:0.79100


[1750]	eval-amex_metric:0.79163


[1800]	eval-amex_metric:0.79155


[1850]	eval-amex_metric:0.79159


[1900]	eval-amex_metric:0.79178


[1950]	eval-amex_metric:0.79188


[2000]	eval-amex_metric:0.79209


[2050]	eval-amex_metric:0.79225


[2100]	eval-amex_metric:0.79168


[2150]	eval-amex_metric:0.79158


[2200]	eval-amex_metric:0.79139


[2250]	eval-amex_metric:0.79148


[2300]	eval-amex_metric:0.79187


[2350]	eval-amex_metric:0.79183


[2400]	eval-amex_metric:0.79213


[2450]	eval-amex_metric:0.79184


[2500]	eval-amex_metric:0.79217


[2550]	eval-amex_metric:0.79208


[2600]	eval-amex_metric:0.79192


[2650]	eval-amex_metric:0.79167


[2700]	eval-amex_metric:0.79190


[2750]	eval-amex_metric:0.79213


[2800]	eval-amex_metric:0.79207


[2850]	eval-amex_metric:0.79258


[2900]	eval-amex_metric:0.79239


[2950]	eval-amex_metric:0.79281


[3000]	eval-amex_metric:0.79247


[3050]	eval-amex_metric:0.79249


[3100]	eval-amex_metric:0.79207


[3150]	eval-amex_metric:0.79242


[3200]	eval-amex_metric:0.79232


[3250]	eval-amex_metric:0.79228


[3300]	eval-amex_metric:0.79216


[3350]	eval-amex_metric:0.79283


[3400]	eval-amex_metric:0.79213


[3450]	eval-amex_metric:0.79193


[3500]	eval-amex_metric:0.79212


[3550]	eval-amex_metric:0.79217


[3600]	eval-amex_metric:0.79210


[3650]	eval-amex_metric:0.79237


[3700]	eval-amex_metric:0.79214


[3750]	eval-amex_metric:0.79231


[3800]	eval-amex_metric:0.79229


[3850]	eval-amex_metric:0.79245


[3900]	eval-amex_metric:0.79257


[3950]	eval-amex_metric:0.79268


[4000]	eval-amex_metric:0.79291


[4050]	eval-amex_metric:0.79286


[4100]	eval-amex_metric:0.79273


[4150]	eval-amex_metric:0.79273


[4200]	eval-amex_metric:0.79260


[4250]	eval-amex_metric:0.79277


[4300]	eval-amex_metric:0.79256


[4350]	eval-amex_metric:0.79201


[4399]	eval-amex_metric:0.79231


######################################## training model 5/5 ########################################


[0]	eval-amex_metric:0.56847


[50]	eval-amex_metric:0.75919


[100]	eval-amex_metric:0.77334


[150]	eval-amex_metric:0.78045


[200]	eval-amex_metric:0.78408


[250]	eval-amex_metric:0.78742


[300]	eval-amex_metric:0.78996


[350]	eval-amex_metric:0.79138


[400]	eval-amex_metric:0.79278


[450]	eval-amex_metric:0.79312


[500]	eval-amex_metric:0.79403


[550]	eval-amex_metric:0.79432


[600]	eval-amex_metric:0.79512


[650]	eval-amex_metric:0.79589


[700]	eval-amex_metric:0.79680


[750]	eval-amex_metric:0.79726


[800]	eval-amex_metric:0.79742


[850]	eval-amex_metric:0.79825


[900]	eval-amex_metric:0.79876


[950]	eval-amex_metric:0.79920


[1000]	eval-amex_metric:0.79925


[1050]	eval-amex_metric:0.79975


[1100]	eval-amex_metric:0.80028


[1150]	eval-amex_metric:0.79989


[1200]	eval-amex_metric:0.80011


[1250]	eval-amex_metric:0.80045


[1300]	eval-amex_metric:0.80043


[1350]	eval-amex_metric:0.80039


[1400]	eval-amex_metric:0.80059


[1450]	eval-amex_metric:0.80081


[1500]	eval-amex_metric:0.80064


[1550]	eval-amex_metric:0.80073


[1600]	eval-amex_metric:0.80112


[1650]	eval-amex_metric:0.80109


[1700]	eval-amex_metric:0.80134


[1750]	eval-amex_metric:0.80161


[1800]	eval-amex_metric:0.80165


[1850]	eval-amex_metric:0.80158


[1900]	eval-amex_metric:0.80181


[1950]	eval-amex_metric:0.80196


[2000]	eval-amex_metric:0.80122


[2050]	eval-amex_metric:0.80105


[2100]	eval-amex_metric:0.80174


[2150]	eval-amex_metric:0.80227


[2200]	eval-amex_metric:0.80225


[2250]	eval-amex_metric:0.80222


[2300]	eval-amex_metric:0.80229


[2350]	eval-amex_metric:0.80181


[2400]	eval-amex_metric:0.80202


[2450]	eval-amex_metric:0.80245


[2500]	eval-amex_metric:0.80241


[2550]	eval-amex_metric:0.80229


[2600]	eval-amex_metric:0.80246


[2650]	eval-amex_metric:0.80257


[2700]	eval-amex_metric:0.80243


[2750]	eval-amex_metric:0.80250


[2800]	eval-amex_metric:0.80215


[2850]	eval-amex_metric:0.80220


[2900]	eval-amex_metric:0.80256


[2950]	eval-amex_metric:0.80240


[3000]	eval-amex_metric:0.80220


[3050]	eval-amex_metric:0.80179


[3100]	eval-amex_metric:0.80193


[3150]	eval-amex_metric:0.80203


[3200]	eval-amex_metric:0.80176


[3250]	eval-amex_metric:0.80182


[3300]	eval-amex_metric:0.80180


[3350]	eval-amex_metric:0.80167


[3400]	eval-amex_metric:0.80196


[3450]	eval-amex_metric:0.80205


[3500]	eval-amex_metric:0.80211


[3550]	eval-amex_metric:0.80168


[3600]	eval-amex_metric:0.80201


[3650]	eval-amex_metric:0.80136


[3700]	eval-amex_metric:0.80196


[3750]	eval-amex_metric:0.80192


[3800]	eval-amex_metric:0.80171


[3850]	eval-amex_metric:0.80193


[3900]	eval-amex_metric:0.80207


[3950]	eval-amex_metric:0.80210


[4000]	eval-amex_metric:0.80200


[4050]	eval-amex_metric:0.80166


[4100]	eval-amex_metric:0.80175


[4150]	eval-amex_metric:0.80170


[4200]	eval-amex_metric:0.80137


[4250]	eval-amex_metric:0.80145


[4300]	eval-amex_metric:0.80119


[4350]	eval-amex_metric:0.80121


[4399]	eval-amex_metric:0.80187


Training time: 270.4643552382787 min.


OOF recall_at4: 0.6678308142861952


OOF normalized_gini: 0.9250798219504209


OOF competition metric: 0.796455318118308


############################### repeated cross-validation step: 2/3 ################################


######################################## training model 1/5 ########################################


[0]	eval-amex_metric:0.56734


[50]	eval-amex_metric:0.75611


[100]	eval-amex_metric:0.77098


[150]	eval-amex_metric:0.77851


[200]	eval-amex_metric:0.78389


[250]	eval-amex_metric:0.78761


[300]	eval-amex_metric:0.79051


[350]	eval-amex_metric:0.79216


[400]	eval-amex_metric:0.79276


[450]	eval-amex_metric:0.79465


[500]	eval-amex_metric:0.79506


[550]	eval-amex_metric:0.79534


[600]	eval-amex_metric:0.79561


[650]	eval-amex_metric:0.79609


[700]	eval-amex_metric:0.79601


[750]	eval-amex_metric:0.79702


[800]	eval-amex_metric:0.79750


[850]	eval-amex_metric:0.79786


[900]	eval-amex_metric:0.79796


[950]	eval-amex_metric:0.79932


[1000]	eval-amex_metric:0.79965


[1050]	eval-amex_metric:0.79975


[1100]	eval-amex_metric:0.79988


[1150]	eval-amex_metric:0.79988


[1200]	eval-amex_metric:0.80023


[1250]	eval-amex_metric:0.80017


[1300]	eval-amex_metric:0.80035


[1350]	eval-amex_metric:0.80017


[1400]	eval-amex_metric:0.80039


[1450]	eval-amex_metric:0.80006


[1500]	eval-amex_metric:0.80083


[1550]	eval-amex_metric:0.80126


[1600]	eval-amex_metric:0.80132


[1650]	eval-amex_metric:0.80125


[1700]	eval-amex_metric:0.80148


[1750]	eval-amex_metric:0.80151


[1800]	eval-amex_metric:0.80128


[1850]	eval-amex_metric:0.80083


[1900]	eval-amex_metric:0.80135


[1950]	eval-amex_metric:0.80101


[2000]	eval-amex_metric:0.80108


[2050]	eval-amex_metric:0.80115


[2100]	eval-amex_metric:0.80159


[2150]	eval-amex_metric:0.80139


[2200]	eval-amex_metric:0.80126


[2250]	eval-amex_metric:0.80076


[2300]	eval-amex_metric:0.80054


[2350]	eval-amex_metric:0.80126


[2400]	eval-amex_metric:0.80094


[2450]	eval-amex_metric:0.80107


[2500]	eval-amex_metric:0.80101


[2550]	eval-amex_metric:0.80098


[2600]	eval-amex_metric:0.80130


[2650]	eval-amex_metric:0.80110


[2700]	eval-amex_metric:0.80125


[2750]	eval-amex_metric:0.80070


[2800]	eval-amex_metric:0.80075


[2850]	eval-amex_metric:0.80046


[2900]	eval-amex_metric:0.80097


[2950]	eval-amex_metric:0.80035


[3000]	eval-amex_metric:0.80026


[3050]	eval-amex_metric:0.80043


[3100]	eval-amex_metric:0.80060


[3150]	eval-amex_metric:0.80028


[3200]	eval-amex_metric:0.80064


[3250]	eval-amex_metric:0.80078


[3300]	eval-amex_metric:0.80120


[3350]	eval-amex_metric:0.80056


[3400]	eval-amex_metric:0.80067


[3450]	eval-amex_metric:0.80094


[3500]	eval-amex_metric:0.80077


[3550]	eval-amex_metric:0.80092


[3600]	eval-amex_metric:0.80082


[3650]	eval-amex_metric:0.80097


[3700]	eval-amex_metric:0.80060


[3750]	eval-amex_metric:0.80030


[3800]	eval-amex_metric:0.80048


[3850]	eval-amex_metric:0.80010


[3900]	eval-amex_metric:0.80054


[3950]	eval-amex_metric:0.80023


[4000]	eval-amex_metric:0.80075


[4050]	eval-amex_metric:0.80034


[4100]	eval-amex_metric:0.80021


[4150]	eval-amex_metric:0.80021


[4200]	eval-amex_metric:0.80018


[4250]	eval-amex_metric:0.80045


[4300]	eval-amex_metric:0.80024


[4350]	eval-amex_metric:0.80040


[4399]	eval-amex_metric:0.80075


######################################## training model 2/5 ########################################


[0]	eval-amex_metric:0.54958


[50]	eval-amex_metric:0.75177


[100]	eval-amex_metric:0.76494


[150]	eval-amex_metric:0.77107


[200]	eval-amex_metric:0.77650


[250]	eval-amex_metric:0.78042


[300]	eval-amex_metric:0.78284


[350]	eval-amex_metric:0.78384


[400]	eval-amex_metric:0.78516


[450]	eval-amex_metric:0.78610


[500]	eval-amex_metric:0.78701


[550]	eval-amex_metric:0.78821


[600]	eval-amex_metric:0.78872


[650]	eval-amex_metric:0.78875


[700]	eval-amex_metric:0.78880


[750]	eval-amex_metric:0.78941


[800]	eval-amex_metric:0.78990


[850]	eval-amex_metric:0.79029


[900]	eval-amex_metric:0.79003


[950]	eval-amex_metric:0.79047


[1000]	eval-amex_metric:0.79124


[1050]	eval-amex_metric:0.79132


[1100]	eval-amex_metric:0.79182


[1150]	eval-amex_metric:0.79191


[1200]	eval-amex_metric:0.79270


[1250]	eval-amex_metric:0.79254


[1300]	eval-amex_metric:0.79284


[1350]	eval-amex_metric:0.79315


[1400]	eval-amex_metric:0.79282


[1450]	eval-amex_metric:0.79290


[1500]	eval-amex_metric:0.79314


[1550]	eval-amex_metric:0.79365


[1600]	eval-amex_metric:0.79336


[1650]	eval-amex_metric:0.79309


[1700]	eval-amex_metric:0.79327


[1750]	eval-amex_metric:0.79317


[1800]	eval-amex_metric:0.79340


[1850]	eval-amex_metric:0.79306


[1900]	eval-amex_metric:0.79334


[1950]	eval-amex_metric:0.79326


[2000]	eval-amex_metric:0.79339


[2050]	eval-amex_metric:0.79349


[2100]	eval-amex_metric:0.79368


[2150]	eval-amex_metric:0.79364


[2200]	eval-amex_metric:0.79374


[2250]	eval-amex_metric:0.79356


[2300]	eval-amex_metric:0.79356


[2350]	eval-amex_metric:0.79359


[2400]	eval-amex_metric:0.79380


[2450]	eval-amex_metric:0.79364


[2500]	eval-amex_metric:0.79278


[2550]	eval-amex_metric:0.79279


[2600]	eval-amex_metric:0.79312


[2650]	eval-amex_metric:0.79313


[2700]	eval-amex_metric:0.79344


[2750]	eval-amex_metric:0.79344


[2800]	eval-amex_metric:0.79314


[2850]	eval-amex_metric:0.79323


[2900]	eval-amex_metric:0.79323


[2950]	eval-amex_metric:0.79324


[3000]	eval-amex_metric:0.79304


[3050]	eval-amex_metric:0.79290


[3100]	eval-amex_metric:0.79287


[3150]	eval-amex_metric:0.79325


[3200]	eval-amex_metric:0.79318


[3250]	eval-amex_metric:0.79265


[3300]	eval-amex_metric:0.79281


[3350]	eval-amex_metric:0.79290


[3400]	eval-amex_metric:0.79323


[3450]	eval-amex_metric:0.79315


[3500]	eval-amex_metric:0.79255


[3550]	eval-amex_metric:0.79273


[3600]	eval-amex_metric:0.79279


[3650]	eval-amex_metric:0.79321


[3700]	eval-amex_metric:0.79295


[3750]	eval-amex_metric:0.79328


[3800]	eval-amex_metric:0.79296


[3850]	eval-amex_metric:0.79285


[3900]	eval-amex_metric:0.79292


[3950]	eval-amex_metric:0.79308


[4000]	eval-amex_metric:0.79285


[4050]	eval-amex_metric:0.79277


[4100]	eval-amex_metric:0.79295


[4150]	eval-amex_metric:0.79224


[4200]	eval-amex_metric:0.79204


[4250]	eval-amex_metric:0.79199


[4300]	eval-amex_metric:0.79215


[4350]	eval-amex_metric:0.79209


[4399]	eval-amex_metric:0.79248


######################################## training model 3/5 ########################################


[0]	eval-amex_metric:0.55237


[50]	eval-amex_metric:0.74803


[100]	eval-amex_metric:0.76194


[150]	eval-amex_metric:0.76997


[200]	eval-amex_metric:0.77429


[250]	eval-amex_metric:0.77866


[300]	eval-amex_metric:0.78022


[350]	eval-amex_metric:0.78188


[400]	eval-amex_metric:0.78276


[450]	eval-amex_metric:0.78375


[500]	eval-amex_metric:0.78467


[550]	eval-amex_metric:0.78577


[600]	eval-amex_metric:0.78648


[650]	eval-amex_metric:0.78724


[700]	eval-amex_metric:0.78729


[750]	eval-amex_metric:0.78765


[800]	eval-amex_metric:0.78804


[850]	eval-amex_metric:0.78864


[900]	eval-amex_metric:0.78818


[950]	eval-amex_metric:0.78888


[1000]	eval-amex_metric:0.78892


[1050]	eval-amex_metric:0.78921


[1100]	eval-amex_metric:0.78911


[1150]	eval-amex_metric:0.78969


[1200]	eval-amex_metric:0.79020


[1250]	eval-amex_metric:0.79036


[1300]	eval-amex_metric:0.79041


[1350]	eval-amex_metric:0.79087


[1400]	eval-amex_metric:0.79115


[1450]	eval-amex_metric:0.79142


[1500]	eval-amex_metric:0.79108


[1550]	eval-amex_metric:0.79154


[1600]	eval-amex_metric:0.79091


[1650]	eval-amex_metric:0.79076


[1700]	eval-amex_metric:0.79092


[1750]	eval-amex_metric:0.79162


[1800]	eval-amex_metric:0.79153


[1850]	eval-amex_metric:0.79134


[1900]	eval-amex_metric:0.79150


[1950]	eval-amex_metric:0.79150


[2000]	eval-amex_metric:0.79168


[2050]	eval-amex_metric:0.79114


[2100]	eval-amex_metric:0.79136


[2150]	eval-amex_metric:0.79105


[2200]	eval-amex_metric:0.79079


[2250]	eval-amex_metric:0.79068


[2300]	eval-amex_metric:0.79106


[2350]	eval-amex_metric:0.79078


[2400]	eval-amex_metric:0.79082


[2450]	eval-amex_metric:0.79105


[2500]	eval-amex_metric:0.79114


[2550]	eval-amex_metric:0.79094


[2600]	eval-amex_metric:0.79099


[2650]	eval-amex_metric:0.79143


[2700]	eval-amex_metric:0.79114


[2750]	eval-amex_metric:0.79127


[2800]	eval-amex_metric:0.79130


[2850]	eval-amex_metric:0.79165


[2900]	eval-amex_metric:0.79097


[2950]	eval-amex_metric:0.79102


[3000]	eval-amex_metric:0.79087


[3050]	eval-amex_metric:0.79117


[3100]	eval-amex_metric:0.79116


[3150]	eval-amex_metric:0.79064


[3200]	eval-amex_metric:0.79065


[3250]	eval-amex_metric:0.79061


[3300]	eval-amex_metric:0.79065


[3350]	eval-amex_metric:0.79077


[3400]	eval-amex_metric:0.79095


[3450]	eval-amex_metric:0.79068


[3500]	eval-amex_metric:0.79041


[3550]	eval-amex_metric:0.79043


[3600]	eval-amex_metric:0.79104


[3650]	eval-amex_metric:0.79080


[3700]	eval-amex_metric:0.79071


[3750]	eval-amex_metric:0.79064


[3800]	eval-amex_metric:0.79066


[3850]	eval-amex_metric:0.79048


[3900]	eval-amex_metric:0.79081


[3950]	eval-amex_metric:0.79070


[4000]	eval-amex_metric:0.79111


[4050]	eval-amex_metric:0.79126


[4100]	eval-amex_metric:0.79123


[4150]	eval-amex_metric:0.79106


[4200]	eval-amex_metric:0.79124


[4250]	eval-amex_metric:0.79083


[4300]	eval-amex_metric:0.79102


[4350]	eval-amex_metric:0.79067


[4399]	eval-amex_metric:0.79091


######################################## training model 4/5 ########################################


[0]	eval-amex_metric:0.53742


[50]	eval-amex_metric:0.75692


[100]	eval-amex_metric:0.77014


[150]	eval-amex_metric:0.77686


[200]	eval-amex_metric:0.78137


[250]	eval-amex_metric:0.78511


[300]	eval-amex_metric:0.78735


[350]	eval-amex_metric:0.78877


[400]	eval-amex_metric:0.78937


[450]	eval-amex_metric:0.79128


[500]	eval-amex_metric:0.79278


[550]	eval-amex_metric:0.79295


[600]	eval-amex_metric:0.79371


[650]	eval-amex_metric:0.79403


[700]	eval-amex_metric:0.79458


[750]	eval-amex_metric:0.79495


[800]	eval-amex_metric:0.79541


[850]	eval-amex_metric:0.79529


[900]	eval-amex_metric:0.79608


[950]	eval-amex_metric:0.79655


[1000]	eval-amex_metric:0.79697


[1050]	eval-amex_metric:0.79672


[1100]	eval-amex_metric:0.79782


[1150]	eval-amex_metric:0.79777


[1200]	eval-amex_metric:0.79771


[1250]	eval-amex_metric:0.79744


[1300]	eval-amex_metric:0.79696


[1350]	eval-amex_metric:0.79734


[1400]	eval-amex_metric:0.79729


[1450]	eval-amex_metric:0.79751


[1500]	eval-amex_metric:0.79751


[1550]	eval-amex_metric:0.79761


[1600]	eval-amex_metric:0.79704


[1650]	eval-amex_metric:0.79744


[1700]	eval-amex_metric:0.79758


[1750]	eval-amex_metric:0.79791


[1800]	eval-amex_metric:0.79798


[1850]	eval-amex_metric:0.79800


[1900]	eval-amex_metric:0.79831


[1950]	eval-amex_metric:0.79843


[2000]	eval-amex_metric:0.79803


[2050]	eval-amex_metric:0.79863


[2100]	eval-amex_metric:0.79848


[2150]	eval-amex_metric:0.79815


[2200]	eval-amex_metric:0.79842


[2250]	eval-amex_metric:0.79921


[2300]	eval-amex_metric:0.79891


[2350]	eval-amex_metric:0.79856


[2400]	eval-amex_metric:0.79851


[2450]	eval-amex_metric:0.79855


[2500]	eval-amex_metric:0.79852


[2550]	eval-amex_metric:0.79849


[2600]	eval-amex_metric:0.79817


[2650]	eval-amex_metric:0.79847


[2700]	eval-amex_metric:0.79808


[2750]	eval-amex_metric:0.79846


[2800]	eval-amex_metric:0.79844


[2850]	eval-amex_metric:0.79846


[2900]	eval-amex_metric:0.79835


[2950]	eval-amex_metric:0.79791


[3000]	eval-amex_metric:0.79836


[3050]	eval-amex_metric:0.79892


[3100]	eval-amex_metric:0.79863


[3150]	eval-amex_metric:0.79898


[3200]	eval-amex_metric:0.79849


[3250]	eval-amex_metric:0.79864


[3300]	eval-amex_metric:0.79860


[3350]	eval-amex_metric:0.79868


[3400]	eval-amex_metric:0.79891


[3450]	eval-amex_metric:0.79867


[3500]	eval-amex_metric:0.79888


[3550]	eval-amex_metric:0.79864


[3600]	eval-amex_metric:0.79875


[3650]	eval-amex_metric:0.79882


[3700]	eval-amex_metric:0.79915


[3750]	eval-amex_metric:0.79918


[3800]	eval-amex_metric:0.79929


[3850]	eval-amex_metric:0.79879


[3900]	eval-amex_metric:0.79875


[3950]	eval-amex_metric:0.79854


[4000]	eval-amex_metric:0.79831


[4050]	eval-amex_metric:0.79811


[4100]	eval-amex_metric:0.79771


[4150]	eval-amex_metric:0.79807


[4200]	eval-amex_metric:0.79824


[4250]	eval-amex_metric:0.79838


[4300]	eval-amex_metric:0.79873


[4350]	eval-amex_metric:0.79894


[4399]	eval-amex_metric:0.79898


######################################## training model 5/5 ########################################


[0]	eval-amex_metric:0.57115


[50]	eval-amex_metric:0.75538


[100]	eval-amex_metric:0.76974


[150]	eval-amex_metric:0.77729


[200]	eval-amex_metric:0.78181


[250]	eval-amex_metric:0.78347


[300]	eval-amex_metric:0.78555


[350]	eval-amex_metric:0.78795


[400]	eval-amex_metric:0.78904


[450]	eval-amex_metric:0.79022


[500]	eval-amex_metric:0.79068


[550]	eval-amex_metric:0.79131


[600]	eval-amex_metric:0.79224


[650]	eval-amex_metric:0.79222


[700]	eval-amex_metric:0.79330


[750]	eval-amex_metric:0.79296


[800]	eval-amex_metric:0.79361


[850]	eval-amex_metric:0.79441


[900]	eval-amex_metric:0.79464


[950]	eval-amex_metric:0.79497


[1000]	eval-amex_metric:0.79511


[1050]	eval-amex_metric:0.79518


[1100]	eval-amex_metric:0.79560


[1150]	eval-amex_metric:0.79585


[1200]	eval-amex_metric:0.79630


[1250]	eval-amex_metric:0.79657


[1300]	eval-amex_metric:0.79636


[1350]	eval-amex_metric:0.79622


[1400]	eval-amex_metric:0.79661


[1450]	eval-amex_metric:0.79670


[1500]	eval-amex_metric:0.79702


[1550]	eval-amex_metric:0.79673


[1600]	eval-amex_metric:0.79747


[1650]	eval-amex_metric:0.79732


[1700]	eval-amex_metric:0.79778


[1750]	eval-amex_metric:0.79786


[1800]	eval-amex_metric:0.79746


[1850]	eval-amex_metric:0.79769


[1900]	eval-amex_metric:0.79771


[1950]	eval-amex_metric:0.79814


[2000]	eval-amex_metric:0.79842


[2050]	eval-amex_metric:0.79817


[2100]	eval-amex_metric:0.79825


[2150]	eval-amex_metric:0.79831


[2200]	eval-amex_metric:0.79822


[2250]	eval-amex_metric:0.79835


[2300]	eval-amex_metric:0.79843


[2350]	eval-amex_metric:0.79820


[2400]	eval-amex_metric:0.79788


[2450]	eval-amex_metric:0.79804


[2500]	eval-amex_metric:0.79792


[2550]	eval-amex_metric:0.79831


[2600]	eval-amex_metric:0.79816


[2650]	eval-amex_metric:0.79825


[2700]	eval-amex_metric:0.79834


[2750]	eval-amex_metric:0.79845


[2800]	eval-amex_metric:0.79842


[2850]	eval-amex_metric:0.79854


[2900]	eval-amex_metric:0.79789


[2950]	eval-amex_metric:0.79823


[3000]	eval-amex_metric:0.79872


[3050]	eval-amex_metric:0.79811


[3100]	eval-amex_metric:0.79854


[3150]	eval-amex_metric:0.79853


[3200]	eval-amex_metric:0.79847


[3250]	eval-amex_metric:0.79810


[3300]	eval-amex_metric:0.79850


[3350]	eval-amex_metric:0.79834


[3400]	eval-amex_metric:0.79834


[3450]	eval-amex_metric:0.79790


[3500]	eval-amex_metric:0.79833


[3550]	eval-amex_metric:0.79847


[3600]	eval-amex_metric:0.79849


[3650]	eval-amex_metric:0.79844


[3700]	eval-amex_metric:0.79817


[3750]	eval-amex_metric:0.79832


[3800]	eval-amex_metric:0.79828


[3850]	eval-amex_metric:0.79856


[3900]	eval-amex_metric:0.79866


[3950]	eval-amex_metric:0.79847


[4000]	eval-amex_metric:0.79819


[4050]	eval-amex_metric:0.79823


[4100]	eval-amex_metric:0.79856


[4150]	eval-amex_metric:0.79853


[4200]	eval-amex_metric:0.79827


[4250]	eval-amex_metric:0.79862


[4300]	eval-amex_metric:0.79872


[4350]	eval-amex_metric:0.79850


[4399]	eval-amex_metric:0.79860


Training time: 269.87785678307216 min.
OOF recall_at4: 0.6670565859898341
OOF normalized_gini: 0.9250685076984577
OOF competition metric: 0.7960625468441459


############################### repeated cross-validation step: 3/3 ################################


######################################## training model 1/5 ########################################


[0]	eval-amex_metric:0.54820


[50]	eval-amex_metric:0.75244


[100]	eval-amex_metric:0.76547


[150]	eval-amex_metric:0.77177


[200]	eval-amex_metric:0.77730


[250]	eval-amex_metric:0.78046


[300]	eval-amex_metric:0.78192


[350]	eval-amex_metric:0.78450


[400]	eval-amex_metric:0.78544


[450]	eval-amex_metric:0.78728


[500]	eval-amex_metric:0.78837


[550]	eval-amex_metric:0.78904


[600]	eval-amex_metric:0.78974


[650]	eval-amex_metric:0.79056


[700]	eval-amex_metric:0.79080


[750]	eval-amex_metric:0.79117


[800]	eval-amex_metric:0.79150


[850]	eval-amex_metric:0.79199


[900]	eval-amex_metric:0.79182


[950]	eval-amex_metric:0.79161


[1000]	eval-amex_metric:0.79175


[1050]	eval-amex_metric:0.79173


[1100]	eval-amex_metric:0.79225


[1150]	eval-amex_metric:0.79294


[1200]	eval-amex_metric:0.79324


[1250]	eval-amex_metric:0.79318


[1300]	eval-amex_metric:0.79319


[1350]	eval-amex_metric:0.79320


[1400]	eval-amex_metric:0.79340


[1450]	eval-amex_metric:0.79367


[1500]	eval-amex_metric:0.79362


[1550]	eval-amex_metric:0.79381


[1600]	eval-amex_metric:0.79422


[1650]	eval-amex_metric:0.79443


[1700]	eval-amex_metric:0.79490


[1750]	eval-amex_metric:0.79465


[1800]	eval-amex_metric:0.79504


[1850]	eval-amex_metric:0.79483


[1900]	eval-amex_metric:0.79522


[1950]	eval-amex_metric:0.79510


[2000]	eval-amex_metric:0.79468


[2050]	eval-amex_metric:0.79472


[2100]	eval-amex_metric:0.79443


[2150]	eval-amex_metric:0.79448


[2200]	eval-amex_metric:0.79484


[2250]	eval-amex_metric:0.79483


[2300]	eval-amex_metric:0.79454


[2350]	eval-amex_metric:0.79434


[2400]	eval-amex_metric:0.79449


[2450]	eval-amex_metric:0.79458


[2500]	eval-amex_metric:0.79458


[2550]	eval-amex_metric:0.79480


[2600]	eval-amex_metric:0.79478


[2650]	eval-amex_metric:0.79438


[2700]	eval-amex_metric:0.79463


[2750]	eval-amex_metric:0.79425


[2800]	eval-amex_metric:0.79425


[2850]	eval-amex_metric:0.79438


[2900]	eval-amex_metric:0.79425


[2950]	eval-amex_metric:0.79421


[3000]	eval-amex_metric:0.79432


[3050]	eval-amex_metric:0.79424


[3100]	eval-amex_metric:0.79464


[3150]	eval-amex_metric:0.79454


[3200]	eval-amex_metric:0.79435


[3250]	eval-amex_metric:0.79465


[3300]	eval-amex_metric:0.79442


[3350]	eval-amex_metric:0.79471


[3400]	eval-amex_metric:0.79487


[3450]	eval-amex_metric:0.79525


[3500]	eval-amex_metric:0.79481


[3550]	eval-amex_metric:0.79472


[3600]	eval-amex_metric:0.79447


[3650]	eval-amex_metric:0.79432


[3700]	eval-amex_metric:0.79449


[3750]	eval-amex_metric:0.79420


[3800]	eval-amex_metric:0.79435


[3850]	eval-amex_metric:0.79414


[3900]	eval-amex_metric:0.79373


[3950]	eval-amex_metric:0.79394


[4000]	eval-amex_metric:0.79427


[4050]	eval-amex_metric:0.79393


[4100]	eval-amex_metric:0.79405


[4150]	eval-amex_metric:0.79363


[4200]	eval-amex_metric:0.79391


[4250]	eval-amex_metric:0.79380


[4300]	eval-amex_metric:0.79378


[4350]	eval-amex_metric:0.79414


[4399]	eval-amex_metric:0.79432


######################################## training model 2/5 ########################################


[0]	eval-amex_metric:0.53066


[50]	eval-amex_metric:0.75147


[100]	eval-amex_metric:0.76439


[150]	eval-amex_metric:0.77089


[200]	eval-amex_metric:0.77616


[250]	eval-amex_metric:0.77949


[300]	eval-amex_metric:0.78242


[350]	eval-amex_metric:0.78443


[400]	eval-amex_metric:0.78503


[450]	eval-amex_metric:0.78627


[500]	eval-amex_metric:0.78717


[550]	eval-amex_metric:0.78764


[600]	eval-amex_metric:0.78819


[650]	eval-amex_metric:0.78876


[700]	eval-amex_metric:0.78936


[750]	eval-amex_metric:0.79022


[800]	eval-amex_metric:0.79001


[850]	eval-amex_metric:0.79094


[900]	eval-amex_metric:0.79118


[950]	eval-amex_metric:0.79110


[1000]	eval-amex_metric:0.79100


[1050]	eval-amex_metric:0.79083


[1100]	eval-amex_metric:0.79113


[1150]	eval-amex_metric:0.79162


[1200]	eval-amex_metric:0.79173


[1250]	eval-amex_metric:0.79161


[1300]	eval-amex_metric:0.79186


[1350]	eval-amex_metric:0.79190


[1400]	eval-amex_metric:0.79188


[1450]	eval-amex_metric:0.79202


[1500]	eval-amex_metric:0.79194


[1550]	eval-amex_metric:0.79253


[1600]	eval-amex_metric:0.79282


[1650]	eval-amex_metric:0.79227


[1700]	eval-amex_metric:0.79277


[1750]	eval-amex_metric:0.79287


[1800]	eval-amex_metric:0.79256


[1850]	eval-amex_metric:0.79292


[1900]	eval-amex_metric:0.79297


[1950]	eval-amex_metric:0.79318


[2000]	eval-amex_metric:0.79331


[2050]	eval-amex_metric:0.79385


[2100]	eval-amex_metric:0.79347


[2150]	eval-amex_metric:0.79378


[2200]	eval-amex_metric:0.79389


[2250]	eval-amex_metric:0.79392


[2300]	eval-amex_metric:0.79353


[2350]	eval-amex_metric:0.79401


[2400]	eval-amex_metric:0.79406


[2450]	eval-amex_metric:0.79427


[2500]	eval-amex_metric:0.79394


[2550]	eval-amex_metric:0.79414


[2600]	eval-amex_metric:0.79406


[2650]	eval-amex_metric:0.79384


[2700]	eval-amex_metric:0.79372


[2750]	eval-amex_metric:0.79388


[2800]	eval-amex_metric:0.79388


[2850]	eval-amex_metric:0.79417


[2900]	eval-amex_metric:0.79418


[2950]	eval-amex_metric:0.79429


[3000]	eval-amex_metric:0.79410


[3050]	eval-amex_metric:0.79406


[3100]	eval-amex_metric:0.79449


[3150]	eval-amex_metric:0.79423


[3200]	eval-amex_metric:0.79421


[3250]	eval-amex_metric:0.79451


[3300]	eval-amex_metric:0.79464


[3350]	eval-amex_metric:0.79517


[3400]	eval-amex_metric:0.79534


[3450]	eval-amex_metric:0.79490


[3500]	eval-amex_metric:0.79530


[3550]	eval-amex_metric:0.79476


[3600]	eval-amex_metric:0.79457


[3650]	eval-amex_metric:0.79463


[3700]	eval-amex_metric:0.79497


[3750]	eval-amex_metric:0.79497


[3800]	eval-amex_metric:0.79476


[3850]	eval-amex_metric:0.79484


[3900]	eval-amex_metric:0.79526


[3950]	eval-amex_metric:0.79485


[4000]	eval-amex_metric:0.79507


[4050]	eval-amex_metric:0.79464


[4100]	eval-amex_metric:0.79483


[4150]	eval-amex_metric:0.79506


[4200]	eval-amex_metric:0.79499


[4250]	eval-amex_metric:0.79509


[4300]	eval-amex_metric:0.79544


[4350]	eval-amex_metric:0.79548


[4399]	eval-amex_metric:0.79493


######################################## training model 3/5 ########################################


[0]	eval-amex_metric:0.55984


[50]	eval-amex_metric:0.75378


[100]	eval-amex_metric:0.76862


[150]	eval-amex_metric:0.77639


[200]	eval-amex_metric:0.78230


[250]	eval-amex_metric:0.78540


[300]	eval-amex_metric:0.78809


[350]	eval-amex_metric:0.78953


[400]	eval-amex_metric:0.79092


[450]	eval-amex_metric:0.79209


[500]	eval-amex_metric:0.79313


[550]	eval-amex_metric:0.79373


[600]	eval-amex_metric:0.79434


[650]	eval-amex_metric:0.79485


[700]	eval-amex_metric:0.79509


[750]	eval-amex_metric:0.79505


[800]	eval-amex_metric:0.79556


[850]	eval-amex_metric:0.79528


[900]	eval-amex_metric:0.79605


[950]	eval-amex_metric:0.79697


[1000]	eval-amex_metric:0.79680


[1050]	eval-amex_metric:0.79680


[1100]	eval-amex_metric:0.79678


[1150]	eval-amex_metric:0.79701


[1200]	eval-amex_metric:0.79705


[1250]	eval-amex_metric:0.79724


[1300]	eval-amex_metric:0.79710


[1350]	eval-amex_metric:0.79743


[1400]	eval-amex_metric:0.79740


[1450]	eval-amex_metric:0.79753


[1500]	eval-amex_metric:0.79747


[1550]	eval-amex_metric:0.79766


[1600]	eval-amex_metric:0.79760


[1650]	eval-amex_metric:0.79796


[1700]	eval-amex_metric:0.79748


[1750]	eval-amex_metric:0.79758


[1800]	eval-amex_metric:0.79832


[1850]	eval-amex_metric:0.79851


[1900]	eval-amex_metric:0.79814


[1950]	eval-amex_metric:0.79836


[2000]	eval-amex_metric:0.79793


[2050]	eval-amex_metric:0.79816


[2100]	eval-amex_metric:0.79812


[2150]	eval-amex_metric:0.79857


[2200]	eval-amex_metric:0.79892


[2250]	eval-amex_metric:0.79870


[2300]	eval-amex_metric:0.79843


[2350]	eval-amex_metric:0.79807


[2400]	eval-amex_metric:0.79809


[2450]	eval-amex_metric:0.79818


[2500]	eval-amex_metric:0.79846


[2550]	eval-amex_metric:0.79867


[2600]	eval-amex_metric:0.79859


[2650]	eval-amex_metric:0.79864


[2700]	eval-amex_metric:0.79847


[2750]	eval-amex_metric:0.79945


[2800]	eval-amex_metric:0.79922


[2850]	eval-amex_metric:0.79936


[2900]	eval-amex_metric:0.79943


[2950]	eval-amex_metric:0.80025


[3000]	eval-amex_metric:0.79987


[3050]	eval-amex_metric:0.79955


[3100]	eval-amex_metric:0.79911


[3150]	eval-amex_metric:0.79925


[3200]	eval-amex_metric:0.79950


[3250]	eval-amex_metric:0.79946


[3300]	eval-amex_metric:0.79906


[3350]	eval-amex_metric:0.79899


[3400]	eval-amex_metric:0.79897


[3450]	eval-amex_metric:0.79939


[3500]	eval-amex_metric:0.79935


[3550]	eval-amex_metric:0.79869


[3600]	eval-amex_metric:0.79931


[3650]	eval-amex_metric:0.79906


[3700]	eval-amex_metric:0.79870


[3750]	eval-amex_metric:0.79887


[3800]	eval-amex_metric:0.79873


[3850]	eval-amex_metric:0.79938


[3900]	eval-amex_metric:0.79935


[3950]	eval-amex_metric:0.79936


[4000]	eval-amex_metric:0.79942


[4050]	eval-amex_metric:0.79937


[4100]	eval-amex_metric:0.79911


[4150]	eval-amex_metric:0.79949


[4200]	eval-amex_metric:0.79947


[4250]	eval-amex_metric:0.79936


[4300]	eval-amex_metric:0.79927


[4350]	eval-amex_metric:0.79902


[4399]	eval-amex_metric:0.79986


######################################## training model 4/5 ########################################


[0]	eval-amex_metric:0.56059


[50]	eval-amex_metric:0.75808


[100]	eval-amex_metric:0.77122


[150]	eval-amex_metric:0.77983


[200]	eval-amex_metric:0.78583


[250]	eval-amex_metric:0.78922


[300]	eval-amex_metric:0.79121


[350]	eval-amex_metric:0.79280


[400]	eval-amex_metric:0.79452


[450]	eval-amex_metric:0.79617


[500]	eval-amex_metric:0.79666


[550]	eval-amex_metric:0.79699


[600]	eval-amex_metric:0.79747


[650]	eval-amex_metric:0.79794


[700]	eval-amex_metric:0.79898


[750]	eval-amex_metric:0.79929


[800]	eval-amex_metric:0.79947


[850]	eval-amex_metric:0.80030


[900]	eval-amex_metric:0.80086


[950]	eval-amex_metric:0.80096


[1000]	eval-amex_metric:0.80088


[1050]	eval-amex_metric:0.80120


[1100]	eval-amex_metric:0.80238


[1150]	eval-amex_metric:0.80216


[1200]	eval-amex_metric:0.80229


[1250]	eval-amex_metric:0.80230


[1300]	eval-amex_metric:0.80230


[1350]	eval-amex_metric:0.80229


[1400]	eval-amex_metric:0.80220


[1450]	eval-amex_metric:0.80238


[1500]	eval-amex_metric:0.80253


[1550]	eval-amex_metric:0.80240


[1600]	eval-amex_metric:0.80241


[1650]	eval-amex_metric:0.80225


[1700]	eval-amex_metric:0.80288


[1750]	eval-amex_metric:0.80297


[1800]	eval-amex_metric:0.80336


[1850]	eval-amex_metric:0.80324


[1900]	eval-amex_metric:0.80310


[1950]	eval-amex_metric:0.80336


[2000]	eval-amex_metric:0.80349


[2050]	eval-amex_metric:0.80395


[2100]	eval-amex_metric:0.80329


[2150]	eval-amex_metric:0.80334


[2200]	eval-amex_metric:0.80305


[2250]	eval-amex_metric:0.80288


[2300]	eval-amex_metric:0.80307


[2350]	eval-amex_metric:0.80334


[2400]	eval-amex_metric:0.80363


[2450]	eval-amex_metric:0.80376


[2500]	eval-amex_metric:0.80377


[2550]	eval-amex_metric:0.80381


[2600]	eval-amex_metric:0.80395


[2650]	eval-amex_metric:0.80353


[2700]	eval-amex_metric:0.80370


[2750]	eval-amex_metric:0.80358


[2800]	eval-amex_metric:0.80352


[2850]	eval-amex_metric:0.80371


[2900]	eval-amex_metric:0.80377


[2950]	eval-amex_metric:0.80375


[3000]	eval-amex_metric:0.80336


[3050]	eval-amex_metric:0.80335


[3100]	eval-amex_metric:0.80317


[3150]	eval-amex_metric:0.80342


[3200]	eval-amex_metric:0.80325


[3250]	eval-amex_metric:0.80293


[3300]	eval-amex_metric:0.80310


[3350]	eval-amex_metric:0.80344


[3400]	eval-amex_metric:0.80343


[3450]	eval-amex_metric:0.80322


[3500]	eval-amex_metric:0.80339


[3550]	eval-amex_metric:0.80334


[3600]	eval-amex_metric:0.80376


[3650]	eval-amex_metric:0.80349


[3700]	eval-amex_metric:0.80334


[3750]	eval-amex_metric:0.80382


[3800]	eval-amex_metric:0.80386


[3850]	eval-amex_metric:0.80371


[3900]	eval-amex_metric:0.80415


[3950]	eval-amex_metric:0.80379


[4000]	eval-amex_metric:0.80357


[4050]	eval-amex_metric:0.80318


[4100]	eval-amex_metric:0.80371


[4150]	eval-amex_metric:0.80334


[4200]	eval-amex_metric:0.80361


[4250]	eval-amex_metric:0.80353


[4300]	eval-amex_metric:0.80326


[4350]	eval-amex_metric:0.80356


[4399]	eval-amex_metric:0.80377


######################################## training model 5/5 ########################################


[0]	eval-amex_metric:0.55223


[50]	eval-amex_metric:0.75382


[100]	eval-amex_metric:0.76685


[150]	eval-amex_metric:0.77514


[200]	eval-amex_metric:0.77989


[250]	eval-amex_metric:0.78320


[300]	eval-amex_metric:0.78355


[350]	eval-amex_metric:0.78385


[400]	eval-amex_metric:0.78531


[450]	eval-amex_metric:0.78646


[500]	eval-amex_metric:0.78710


[550]	eval-amex_metric:0.78769


[600]	eval-amex_metric:0.78829


[650]	eval-amex_metric:0.78915


[700]	eval-amex_metric:0.78978


[750]	eval-amex_metric:0.79058


[800]	eval-amex_metric:0.79056


[850]	eval-amex_metric:0.79090


[900]	eval-amex_metric:0.79104


[950]	eval-amex_metric:0.79181


[1000]	eval-amex_metric:0.79225


[1050]	eval-amex_metric:0.79152


[1100]	eval-amex_metric:0.79195


[1150]	eval-amex_metric:0.79174


[1200]	eval-amex_metric:0.79206


[1250]	eval-amex_metric:0.79230


[1300]	eval-amex_metric:0.79224


[1350]	eval-amex_metric:0.79215


[1400]	eval-amex_metric:0.79217


[1450]	eval-amex_metric:0.79323


[1500]	eval-amex_metric:0.79354


[1550]	eval-amex_metric:0.79364


[1600]	eval-amex_metric:0.79370


[1650]	eval-amex_metric:0.79439


[1700]	eval-amex_metric:0.79382


[1750]	eval-amex_metric:0.79399


[1800]	eval-amex_metric:0.79401


[1850]	eval-amex_metric:0.79422


[1900]	eval-amex_metric:0.79454


[1950]	eval-amex_metric:0.79444


[2000]	eval-amex_metric:0.79459


[2050]	eval-amex_metric:0.79427


[2100]	eval-amex_metric:0.79400


[2150]	eval-amex_metric:0.79388


[2200]	eval-amex_metric:0.79393


[2250]	eval-amex_metric:0.79385


[2300]	eval-amex_metric:0.79408


[2350]	eval-amex_metric:0.79409


[2400]	eval-amex_metric:0.79451


[2450]	eval-amex_metric:0.79401


[2500]	eval-amex_metric:0.79386


[2550]	eval-amex_metric:0.79392


[2600]	eval-amex_metric:0.79429


[2650]	eval-amex_metric:0.79384


[2700]	eval-amex_metric:0.79441


[2750]	eval-amex_metric:0.79438


[2800]	eval-amex_metric:0.79454


[2850]	eval-amex_metric:0.79500


[2900]	eval-amex_metric:0.79511


[2950]	eval-amex_metric:0.79526


[3000]	eval-amex_metric:0.79503


[3050]	eval-amex_metric:0.79438


[3100]	eval-amex_metric:0.79420


[3150]	eval-amex_metric:0.79452


[3200]	eval-amex_metric:0.79465


[3250]	eval-amex_metric:0.79459


[3300]	eval-amex_metric:0.79499


[3350]	eval-amex_metric:0.79503


[3400]	eval-amex_metric:0.79528


[3450]	eval-amex_metric:0.79489


[3500]	eval-amex_metric:0.79471


[3550]	eval-amex_metric:0.79462


[3600]	eval-amex_metric:0.79468


[3650]	eval-amex_metric:0.79470


[3700]	eval-amex_metric:0.79473


[3750]	eval-amex_metric:0.79475


[3800]	eval-amex_metric:0.79510


[3850]	eval-amex_metric:0.79508


[3900]	eval-amex_metric:0.79486


[3950]	eval-amex_metric:0.79453


[4000]	eval-amex_metric:0.79474


[4050]	eval-amex_metric:0.79475


[4100]	eval-amex_metric:0.79465


[4150]	eval-amex_metric:0.79472


[4200]	eval-amex_metric:0.79455


[4250]	eval-amex_metric:0.79451


[4300]	eval-amex_metric:0.79455


[4350]	eval-amex_metric:0.79451


[4399]	eval-amex_metric:0.79471


Training time: 268.71879264116285 min.
OOF recall_at4: 0.6693792708789175
OOF normalized_gini: 0.9252386726860224
OOF competition metric: 0.79730897178247


CPU times: user 10d 12h 57min 36s, sys: 2min 53s, total: 10d 13h 30s
Wall time: 13h 29min 18s


In [12]:
results = list()

for oof in all_oof_dfs:  
    r = {
        "recall_at4": compute_recall_at4(oof.target.values, oof.pred.values),
        "gini": compute_normalized_gini(oof.target.values, oof.pred.values),
        "metric": compute_amex_metric(oof.target.values, oof.pred.values),
    }
    results.append(r)

results = pd.DataFrame(results)
display(results)

print("\nmean:")
display(results.mean(axis=0))

print("\nstd:")
display(results.std(axis=0))

Unnamed: 0,recall_at4,gini,metric
0,0.667831,0.92508,0.796455
1,0.667057,0.925069,0.796063
2,0.669379,0.925239,0.797309



mean:


recall_at4    0.668089
gini          0.925129
metric        0.796609
dtype: float64


std:


recall_at4    0.001183
gini          0.000095
metric        0.000637
dtype: float64

In [13]:
del train
gc.collect()

21

***
## make predictions and submit

In [14]:
def make_predictions(
        dataframe:pd.DataFrame, 
        input_feats:list,
        models:list,
    ) -> np.array:
    preds = list()
    for model in models:
        _dataframe = dataframe.copy()
        _dataframe_casted = xgb.DMatrix(data=_dataframe[input_feats])
        preds.append( model.predict(_dataframe_casted))
    return np.mean(preds, axis=0)   

In [15]:
test = pd.read_parquet(f"../data/processed/dsv{DATASET_VERSION}/test.parquet")
sub = pd.read_csv("../data/raw/sample_submission.csv")

In [16]:
%%time

all_preds = list()

for repetition in range(N_REPEATS):
    if "prediction" in sub.columns:
        sub.drop("prediction", axis=1, inplace=True)
    if "prediction" in test.columns:
        test.drop("prediction", axis=1, inplace=True)
        
    models = all_models[repetition]
    preds = make_predictions(test, input_feats, models)
    all_preds.append(preds)
       
    test["prediction"] = preds
    sub["prediction"] = test.loc[sub.customer_ID.values,"prediction"].values
    assert sub.prediction.isna().sum() == 0
    sub.to_csv(SUB_PATH/f"submission-cv{repetition}.csv", index=False)

CPU times: user 59min 47s, sys: 1min 32s, total: 1h 1min 19s
Wall time: 5min 29s


In [17]:
%%time
# predict using all the trained models
if "prediction" in sub.columns:
    sub.drop("prediction", axis=1, inplace=True)
if "prediction" in test.columns:
    test.drop("prediction", axis=1, inplace=True)

test["prediction"] = np.mean(all_preds, axis=0)
sub["prediction"] = test.loc[sub.customer_ID.values,"prediction"].values
assert sub.prediction.isna().sum() == 0
sub.to_csv(SUB_PATH/f"submission-all.csv", index=False)

CPU times: user 4.21 s, sys: 2.19 s, total: 6.39 s
Wall time: 6.39 s


***