# NBA Winner Classifier

## Imports

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
#pd.options.display.max_columns = None
#pd.set_option("display.max_colwidth", None)
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"
#pd.set_option("display.max_rows", None)
import model.train as train
import model.config as model_config
import utils
import model.dataset.game_matchup as gm
import experiments as exp
import qgrid
from yellowbrick import classifier, features, regressor
import yellowbrick.model_selection as ms
from pandas_profiling import ProfileReport

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler, MinMaxScaler
from sklearn.compose import ColumnTransformer

## Setup

In [None]:
%load_ext autoreload
%autoreload 2
%matplotlib inline

sns.set(style="whitegrid", palette="husl")

### Utils functions

In [None]:
def show_qgrid(df_):
    qgrid_widget = qgrid.show_grid(df_, show_toolbar=True , grid_options={'forceFitColumns': False, 'defaultColumnWidth': 200})
    qgrid_widget

In [None]:
def plot_results(experiment_name, results, figsize=(20,10)):
    plt.figure(figsize=figsize)
    results_df = exp.map_results_to_df(results)
    a = sns.pointplot(data=results_df,
              kind="point", x="season_test", y="balanced_accuracy", hue="model"
              )
    a.set_title(
        f"{experiment_name}-balanced_accuracy")
    a.legend(bbox_to_anchor=(1.05, 1), loc=2, borderaxespad=0.)

In [None]:
def get_results_df(algorithm_type='clf'):
    if algorithm_type == 'reg':
        return pd.DataFrame(exp.reg_exp_results)
    else:
        return pd.DataFrame(exp.exp_results)

In [None]:
metrics = ['precision', 'balanced_accuracy', 'recall', 'f1', 'roc_auc']

def print_prettier_exp_results(exp_name, metric='roc_auc'):
    ba_df = get_results_df()[['exp_name', 'model',
       f'{metric}_mean', f'{metric}_std']]
    return ba_df[ba_df.exp_name == exp_name].sort_values(by=[f"{metric}_mean"], ascending=False)


reg_metrics = ['mae', 'mse', 'rmse']

def print_prettier_reg_exp_results(exp_name, metric='mse'):
    ba_df = get_results_df('reg')
    return ba_df[ba_df.exp_name == exp_name].sort_values(by=[f"{metric}_mean"], ascending=False)

## Load Dataset

In [None]:
gm_df = gm.load_game_matchup_dataset()

## EDA

In [None]:
eda_df = gm_df

In [None]:
eda_df.info()

In [None]:
eda_df.describe()

In [None]:
eda_df["WIN"] = ["HOME" if x == 1 else "VISITOR" for x in eda_df['HOME_TEAM_WINS']]

In [None]:
eda_df["WIN"].value_counts()

### Pandas Profiling

In [None]:
profile = ProfileReport(eda_df, title='Pandas Profiling Report', pool_size=4,
                        minimal=True,
                        explorative=True,
                           correlations={
             "pearson": {"calculate": True},
             "spearman": {"calculate": True},
             "kendall": {"calculate": True},
             "phi_k": {"calculate": False},
             "cramers": {"calculate": False},
         })
profile

### By Team

In [None]:
last_season = eda_df[eda_df.SEASON == 2018]
last_season.head()

In [None]:
home_wins_df = last_season[["HOME_TEAM_NAME", "HOME_TEAM_WINS"]].groupby(by="HOME_TEAM_NAME") \
.agg({'HOME_TEAM_NAME':'count', 'HOME_TEAM_WINS': 'sum'}) \
.sort_values(by=["HOME_TEAM_WINS"], ascending=False)
home_wins_df["TEAM_LOSS"] = home_wins_df["HOME_TEAM_NAME"] - home_wins_df["HOME_TEAM_WINS"]
home_wins_df.drop(labels=["HOME_TEAM_NAME"], axis=1, inplace=True)
home_wins_df.rename(columns={"HOME_TEAM_WINS": "TEAM_WINS"}, inplace=True)
home_wins_df.index.rename("TEAM_NAME", inplace=True)
home_wins_df

In [None]:
visitor_wins_df = last_season[["VISITOR_TEAM_NAME", "HOME_TEAM_WINS"]].groupby(by="VISITOR_TEAM_NAME") \
.agg({'VISITOR_TEAM_NAME':'count', 'HOME_TEAM_WINS': 'sum'}) \
.sort_values(by=["HOME_TEAM_WINS"], ascending=False)
visitor_wins_df["TEAM_WINS"] = visitor_wins_df["VISITOR_TEAM_NAME"] - visitor_wins_df["HOME_TEAM_WINS"]
visitor_wins_df.rename(columns={"HOME_TEAM_WINS": "TEAM_LOSS"}, inplace=True)
visitor_wins_df.drop(labels=["VISITOR_TEAM_NAME"], axis=1, inplace=True)
visitor_wins_df.index.rename("TEAM_NAME", inplace=True)
#visitor_wins_df = visitor_wins_df[["TEAM_WINS"]]
visitor_wins_df = visitor_wins_df[["TEAM_WINS", "TEAM_LOSS"]]
visitor_wins_df

In [None]:
home_wins_df.combine(visitor_wins_df, lambda s1, s2: s1 + s2).sort_values(by="TEAM_WINS", ascending=False)

In [None]:
mil_df = last_season[(last_season.VISITOR_TEAM_NAME == 'MIL') | (last_season.HOME_TEAM_NAME == 'MIL')]
mil_df['GAME_N'] = range(1, 83,1)
mil_df

In [None]:
#sns.regplot(x=mil_df["GAME_N"], y=mil_df["GAME_N"])
#sns.catplot(data=mil_df[["HOME_TEAM_NAME", "GAME_N", "WIN"]],  x="GAME_N", y="HOME_TEAM_NAME", kind="bar", hue="WIN", palette="Set2")
#sns.displot(data=mil_df, x="GAME_N", hue="WIN", multiple="stack")
#plt.show()


### Scatter plot

## Dataset


In [None]:
gm_df.groupby(by="SEASON").count()["GAME_DATE_EST"]

Podemos observar que no todas las temporadas tiene la misma cantidad de partidos. Esto es debido a la siguientes razones:

- 2011: Los jugadores hicieron una huelga debido a no estar de acuerdo con los salarios de los mismos y el limite salarial de las franquicias.
- 2012: Un partido entre el equipo de Boston e Indiana fue suspedindo el cual despues no fue reprogramado, y al final de la temporada se decidio ya no reprogramarlo debido a que la clasificacion a playoff ya estaba decidida y no afectaba el resultado.

Por tanto se seleccionaran solo las temporadas a partir del 2013(inclusive).

In [None]:
df = gm_df[gm_df.SEASON >= 2013]
seasons_size = len(df.SEASON.unique())
seasons = list(df.SEASON.unique())

## Experiments

### Setup

In [None]:
exp_prefix = ""
exp_group_name = "experiments"
results_total = []
exp.exp_results = []
TARGET = "HOME_TEAM_WINS"
exp_X_columns = model_config.X_COLUMNS
exp_y_columns = [TARGET]


models = exp.get_clf_models()

sscv = utils.SeasonSeriesSplit(df)
df_sscv = sscv.get_df()
X = df_sscv[exp_X_columns]
y = df_sscv['HOME_TEAM_WINS']

#exp.exp_results = utils.deserialize_object(exp_group_name)

### Experiment using 1 season

In [None]:
experiment_name = f"{exp_prefix}1_season"

folds, train_seasons, test_seasons = sscv.split(train_size=1, test_size=1)
params = (experiment_name, models, folds, train_seasons, test_seasons, X, y)
names, results = exp.run_experiment(*params)
results_total.append((experiment_name, results))

print_prettier_exp_results(experiment_name)

- Respecto a la metrica auc_roc se observa lo siguiente:

    - ***SVM***: Fue el algoritmo que alcanzo el mejor promedio.
    - ***XGB***: Obtuvo el segundo promedio mas alto.
    - ***LGB***: Obtuvo el tercer promedio mas alto.

In [None]:
#### Visualize experiments results
plot_results(experiment_name, results, figsize=(20,10))

En el grafico de los resultados del experimento se observa lo siguiente:

    - SVM supero con gran ventaja a los demas algoritmos. El algoritmo XGB fue el que mas cerca estuvo a SVM.
    - Se evidencian los siguientes patrones:
        - Para todos los algoritmos hubo una notable mejoria al ser entrenados con la temporada 2014 para predecir la temporada 2015.
        - Sin embargo en las siguientes validaciones para la temporada 2016 y 2017 nuevamente se evidencia una caida en el rendimiento de todos los algoritmos.
        - Para predecir la temporada 2018 pues este rendimiento mejoro.

### Experiment using StandardScaler

In [None]:
experiment_name = f"{exp_prefix}scaled_data"

num_pipeline = Pipeline([
    ('std_scaler', StandardScaler())
])
preprocessor = ColumnTransformer([
        ('numerical', num_pipeline, model_config.X_NUM_COLS)
    ], remainder='passthrough')
#transformed_data = preprocessor.fit_transform(df)

folds, train_seasons, test_seasons = sscv.split(train_size=1, test_size=1)
params = (experiment_name, models, folds, train_seasons, test_seasons, X, y, preprocessor)
names, results = exp.run_experiment(*params)
results_total.append((experiment_name, results))

print_prettier_exp_results(experiment_name)

- Respecto a la metrica balanced_accuracy se observa lo siguiente:

    - ***XGB***: Fue el algoritmo que alcanzo el mejor promedio.
    - ***RF***: Obtuvo el segundo promedio mas alto.
    - ***LGB***: Obtuvo el tercer promedio mas alto.

In [None]:
plot_results(experiment_name, results, figsize=(20,10))

En el grafico de los resultados del experimento se observa lo siguiente:

    - A pesar de que obtuvo el mejor rendimiento en la primera validacion, el algoritmo SVM empeoro en cada validacion. Cabe señalar tambien que ademas de que cayo empicado arrojo un rendimiento de un 50% para la ultima validacion.
    - Para los demas algoritmos se evidencia un patron en la validacion de predecir al temporada 15 donde para todos fue un mejor rendimiento que para predecir la temporada 14.
    - Para la temporada 16 el rendimiento bajo para todos.
    - Para la temporada 17 el algoritmo KNN presenta una notable mejoria por enciman de los demas algoritmos.
    - Para la ultima temporada el algoritmo XGB fue el que obtuvo el mejor rendimiento.

### Experiment: train: 2s; test: 1s

In [None]:
experiment_name = f"{exp_prefix}2_seasons"

folds, train_seasons, test_seasons = sscv.split(train_size=2, test_size=1)
params = (experiment_name, models, folds, train_seasons, test_seasons, X, y)
names, results = exp.run_experiment(*params)
results_total.append((experiment_name, results))

print_prettier_exp_results(experiment_name)

- Respecto a la metrica balanced_accuracy se observa lo siguiente:

    - ***SVM***: Fue el algoritmo que alcanzo el mejor promedio.
    - ***LGB***: Obtuvo el segundo promedio mas alto.
    - ***XGB***: Obtuvo el tercer promedio mas alto.

In [None]:
plot_results(experiment_name, results, figsize=(20,10))

En el grafico de los resultados del experimento se observa lo siguiente:

    - Claramente SVM fue el algoritmo que mejor rendimiento tuvo en cada una de las validaciones.
    - Se evidencia un patron en el que todos los algoritmos tuvieron una caida de su rendimiento en la temporada 16 y continuo cayendo en el 17, a excepcion de RF que mejoro.
    - Otro patron que se evidencia es que para la temporada 2018 todos los algoritmos mejoraron.


### Experiment: train: 3s; test: 1s

In [None]:
experiment_name = f"{exp_prefix}3_seasons"

folds, train_seasons, test_seasons = sscv.split(train_size=3, test_size=1)
params = (experiment_name, models, folds, train_seasons, test_seasons, X, y)
names, results = exp.run_experiment(*params)
results_total.append((experiment_name, results))

print_prettier_exp_results(experiment_name)

- Respecto a la metrica balanced_accuracy se observa lo siguiente:

    - ***SVM***: Fue el algoritmo que alcanzo el mejor promedio.
    - ***LGB***: Obtuvo el segundo promedio mas alto.
    - ***XGB***: Obtuvo el tercer promedio mas alto.

 Se destaca tambien que estos resultados son muy similares a los del experimento anterior(2s 1s)

In [None]:
plot_results(experiment_name, results, figsize=(20,10))

En el grafico de cada validacion se observa lo siguiente:

    - Nuevamente SVM fue el algoritmo que mejor rendimiento tuvo en cada una de las validaciones.
    - Se evidencia un ligero patron de ascenso para los tres algoritmos con mejor rendimiento, lo cual indica cierta estabilidad en las validaciones de este experimento comparada con los experimentos anteriores.
    - Tambien se evidencia que comparado con los experimentos anteriores, en este el peor rendimiento estuvo en la primera validacion la del 16.

### Experiment train: 3q ; test: 1q

In [None]:
experiment_name = f"{exp_prefix}3q_1q"

folds, train_seasons, test_seasons = sscv.quarter_split(train_size=3, test_size=1)
params = (experiment_name, models, folds, train_seasons, test_seasons, X, y)
names, results = exp.run_experiment(*params)
results_total.append((experiment_name, results))

print_prettier_exp_results(experiment_name)

- Respecto a la metrica balanced_accuracy se observa lo siguiente:

    - ***LGB***: Fue el algoritmo que alcanzo el mejor promedio.
    - ***KNN***: Obtuvo el segundo promedio mas alto.
    - ***SVM***: Obtuvo el tercer promedio mas alto.

 Comparado con el anterior experimento(3s 1s), estos resultados son peores, pero es importante destacar que se hicieron muchisimas mas validaciones que los experimentos anteriores. Ver grafico debajo.

In [None]:
plot_results(experiment_name, results, figsize=(20,10))

En el grafico de cada validacion se observa lo siguiente:

    - SVM fue bastante inestable, tuvo casi igual de picos de buenos rendimientos como caidas de malos rendientos.
    - Se observa un patron, en cada cuarto de temporada 0.25, que corresponde a la mitad(desde 0.25 a 0.5) pues el rendimiento de cada algoritmo tuvo una caida.

### Experiment train: 4q ; test: 2q

In [None]:
experiment_name = f"{exp_prefix}4q_2q"

folds, train_seasons, test_seasons = sscv.quarter_split(train_size=4, test_size=2)
params = (experiment_name, models, folds, train_seasons, test_seasons, X, y)
names, results = exp.run_experiment(*params)
results_total.append((experiment_name, results))

print_prettier_exp_results(experiment_name)

- Respecto a la metrica balanced_accuracy se observa lo siguiente:

    - ***SVM***: Fue el algoritmo que alcanzo el mejor promedio.
    - ***XGB***: Obtuvo el segundo promedio mas alto.
    - ***RF***: Obtuvo el tercer promedio mas alto.


In [None]:
plot_results(experiment_name, results, figsize=(20,10))

En el grafico de cada validacion se observa lo siguiente:

    - SVM fue un poco mas estable que el experimento anterior.
    - Se observa un patron, en cada validacion 0.5-0.75, es decir, que se trata de predecir la segunda mitad de la temporada, usando la primera mitad de la temporada actual y la ultima mitad de la anterior, pues hay una caida en el rendimiento de los algoritmos.

### Experiment remove first 1q ; train: 2q ; test: 1q

En este experimento se eliminara el primer cuarto de cada temporada, y se entrenara el modelo con los 2 siguientes cuartos, y como test 1 cuarto de temporada. La ventana deslisante sera de 1 cuarto.

In [None]:
experiment_name = f"{exp_prefix}r1q_2q_1q"

folds, train_seasons, test_seasons = sscv.quarter_split(train_size=2, test_size=1, skip=[0.25])
params = (experiment_name, models, folds, train_seasons, test_seasons, X, y)
names, results = exp.run_experiment(*params)
results_total.append((experiment_name, results))

print_prettier_exp_results(experiment_name)

- Respecto a la metrica balanced_accuracy se observa lo siguiente:

    - ***KNN***: Fue el algoritmo que alcanzo el mejor promedio.
    - ***LGB***: Obtuvo el segundo promedio mas alto.
    - ***SVM***: Obtuvo el tercer promedio mas alto.


In [None]:
#### Visualize experiments results
plot_results(experiment_name, results, figsize=(20,10))

En el grafico de cada validacion se observa lo siguiente:

    - Se observa un patron, en cada validacion .75, es decir, que se trata de predecir el ultimo cuarto de temporada, pues hay una caida del rendimiento en el caso del algoritmo SVM, sin embargo no es lo mismo para los otros algoritmos, al menos no para todos las validaciones .75.

### Experiments comparison

In [None]:
utils.serialize_object(exp_group_name, exp.exp_results)

In [None]:
exp_df = get_results_df()

In [None]:
ba_df = exp_df[['exp_name', 'model',
       'balanced_accuracy_mean', 'balanced_accuracy_std']]

In [None]:
#show_qgrid(exp_df)
qgrid_widget = qgrid.show_grid(ba_df, show_toolbar=True , grid_options={'forceFitColumns': False, 'defaultColumnWidth': 200})
qgrid_widget

In [None]:
ba_df.sort_values(
    by=["balanced_accuracy_mean"]
    , ascending=False)[:6].reset_index().drop(labels=["index"], axis=1)

Basado en la metrica 'balanced_accuracy_mean' se observa:

- El algoritmo SVM obtuvo el mejor rendimiento para la mayoria de los experimentos. LGB fue el algoritmo siguiente que obtuvo el mejor rendimiento.
- En los experimentos que se obtuvo el mejor rendimiento fueron usando 2 y 3 temporadas para entrenamiento para predecir al siguiente.


#### Plot experiment results

In [None]:
utils.serialize_object("results", exp.exp_results)
utils.serialize_object("results_total", results_total)

#### Balance Accuracy

In [None]:
exp.plot_to_compare_experiments(
    results_total,
    metric="balanced_accuracy",
    figsize=(25, 35),
    use_pointplot=True
)

#### Precision

In [None]:
exp.plot_to_compare_experiments(
    results_total,
    metric="precision",
    figsize=(25, 35),
    use_pointplot=True
)

#### Recall

In [None]:
exp.plot_to_compare_experiments(
    results_total,
    metric="recall",
    figsize=(25, 35),
    use_pointplot=True
)

#### F1

In [None]:
exp.plot_to_compare_experiments(
    results_total,
    metric="f1",
    figsize=(25, 35),
    use_pointplot=True
)

#### ROC AUC

In [None]:
exp.plot_to_compare_experiments(
    results_total,
    metric="roc_auc",
    figsize=(25, 35),
    use_pointplot=True
)

### Tuning model

A partir de los experimentos y basado en las observaciones realizadas trabajaremos de ahora en adelante solo con los modelos: SVM y LGB.

Para el entrenamiento cada modelo utilizaremos las variantes:

- Train: 2 seasons ; Test: 1 season ; Ventana deslizante de: 1 season
- Train: 3 seasons ; Test: 1 season ; Ventana deslizante de: 1 season

#### Setup

In [None]:
from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier
from sklearn.svm import SVC
results_total = []
exp.exp_results = []
experiment_name = f"{exp_prefix}2_season_tunning"
best_models = [
    ("RF", RandomForestClassifier(n_estimators=300,
                                                max_depth=11,
                                                n_jobs=-1,
                                                random_state=0,
                                                criterion='entropy',
                                                max_features=19,
                                                min_samples_leaf=9,
                                 )),
    ('SVM', SVC(kernel='linear', random_state=0,
                              C=63.513891775842986,
                              gamma=76.1465194934807,
                              degree= 0.4300244876201068))
]
folds, train_seasons, test_seasons = sscv.split(train_size=2, test_size=1)
X, y = train.X_y_values(df, exp_X_columns, exp_y_columns)
#params = (experiment_name, best_models, folds, train_seasons, test_seasons, X, y)
#names, results = exp.run_experiment(*params)
#results_total.append((experiment_name, results))

In [None]:
from yellowbrick.style import set_palette
import warnings
import io
from sklearn import base, metrics, model_selection, preprocessing, tree
from yellowbrick.classifier import ROCAUC
import yellowbrick.classifier

set_palette('flatui')
fold_last_season = folds[len(folds)-1:]
name, model = best_models[0]

#### Explore models perfomance

In [None]:


#warnings.filterwarnings('ignore')
fold_last_season = folds[len(folds)-1:]
for name, model in best_models:
    for i, idx_data in enumerate(fold_last_season):
        print(f"Test season: {test_seasons[i]}")
        train_idx, test_idx = idx_data
        X_train, X_test = X[train_idx], X[test_idx]
        y_train, y_test = y[train_idx].ravel(), y[test_idx].ravel()
        y_true = y_test
        fit_info = model.fit(X_train, y_train)

        #with sns.plotting_context('paper'):
        #    fig, ax = plt.subplots(figsize=(2, 2), dpi=150)
        cm_viz = classifier.ConfusionMatrix(model, percent=True)
        cm_viz.fit(X_train, y_train)
        cm_viz.score(X_test, y_test)
        cm_viz.show()
        #cm_viz.poof()
        #with sns.plotting_context('talk'):
            #fig, ax = plt.subplots(figsize=(20, 20), dpi=300)
        plt.figure(figsize=(20, 20), dpi=300)
        fi_viz = features.FeatureImportances(model, labels=exp_X_columns, relative=False)
        fi_viz.fit(X_train, y_train)
        fi_viz.score(X_test, y_test)
        #fi_viz.poof()
        fi_viz.show()

#### ROC AUC

In [None]:
for i, idx_data in enumerate(fold_last_season):
    print(f"Test season: {test_seasons[i]}")
    train_idx, test_idx = idx_data
    X_train, X_test = X[train_idx], X[test_idx]
    y_train, y_test = y[train_idx].ravel(), y[test_idx].ravel()
    y_true = y_test
    fit_info = model.fit(X_train, y_train)
    y_pred = model.predict(X_test)
    roc_auc_score(y_true, y_pred, average='weighted')
    print(f'roc_auc: {roc_auc_score}')
    roc_viz = ROCAUC(model, classes=['LOSS', 'WIN'])
    roc_viz.score(X_test, y_test)
    roc_viz.show()

    roc_viz = classifier.ClassPredictionError(model, classes=['LOSS', 'WIN'])
    roc_viz.score(X_test, y_test)
    roc_viz.show()

#### Hyperopt

In [None]:
v_folds = folds[:-1]
test_fold = folds[-1]
#name, model = best_models[0]

In [None]:
from sklearn.metrics import roc_auc_score
from hyperopt import fmin, tpe, hp, STATUS_OK, Trials
from sklearn.svm import SVC
import lightgbm as lgb
import xgboost as xgb
from sklearn.ensemble import RandomForestClassifier

##### SVM

In [None]:
def hyperopt_cv(params):
    cv_results = {
            "roc_auc": []
        }

    #del params['normalize']
    #del params['scale']

    for train_idx, test_idx in v_folds:
        X[train_idx], X[test_idx] = utils.feature_scaling(X[train_idx], X[test_idx], 5)
        X_train, X_test = X[train_idx], X[test_idx]
        y_train, y_test = y[train_idx].ravel(), y[test_idx].ravel()
        y_true = y_test
        model = SVC(**params)
        fit_info = model.fit(X_train, y_train)
        y_pred = model.predict(X_test)
        roc_auc = roc_auc_score(y_true, y_pred, average='weighted')
        cv_results["roc_auc"].append(roc_auc)

    return np.mean(cv_results["roc_auc"])

space4svm = {
    'C': hp.uniform('C', 0, 100),
    'kernel': hp.choice('kernel', ['linear']),
    'gamma': hp.uniform('gamma', 0, 100),
    'degree': hp.uniform('degree', 0, 6)
    #'scale': hp.choice('scale', [0, 1]),
    #'normalize': hp.choice('normalize', [0, 1])
}

# best: {'C': 63.513891775842986, 'degree': 0.4300244876201068, 'gamma': 76.1465194934807, 'kernel': 0}
def f(params):
    acc = hyperopt_cv(params)
    return {'loss': -acc, 'status': STATUS_OK}
trials = Trials()
best = fmin(f, space4svm, algo=tpe.suggest, max_evals=100, trials=trials)
print("best:", best)

##### RandomForest

In [None]:
def hyperopt_train_test(params):
    cv_results = {
            "roc_auc": []
        }

    #del params['normalize']
    #del params['scale']

    for train_idx, test_idx in v_folds:
        X[train_idx], X[test_idx] = utils.feature_scaling(X[train_idx], X[test_idx], 5)
        X_train, X_test = X[train_idx], X[test_idx]
        y_train, y_test = y[train_idx].ravel(), y[test_idx].ravel()
        y_true = y_test
        model = RandomForestClassifier(**params)
        fit_info = model.fit(X_train, y_train)
        y_pred = model.predict(X_test)
        roc_auc = roc_auc_score(y_true, y_pred, average='weighted')
        cv_results["roc_auc"].append(roc_auc)

    return np.mean(cv_results["roc_auc"])

space4rf = {
    'max_depth': hp.choice('max_depth', range(1,20)),
    'max_features': hp.choice('max_features', range(1,20)),
    'n_estimators': hp.choice('n_estimators', range(100, 500, 50)),
    'criterion': hp.choice('criterion', ["gini", "entropy"]),
    'min_samples_leaf':  hp.choice('min_samples_leaf',  np.arange(1, 20, step=1, dtype=int)),
    #'min_samples_split': None,
    #'max_leaf_nodes': None
    #'scale': hp.choice('scale', [0, 1]),
    #'normalize': hp.choice('normalize', [0, 1])
}
best = 0
def f(params):
    global best
    acc = hyperopt_train_test(params)
    if acc > best:
        best = acc
    print('new best:', best, params)
    return {'loss': -acc, 'status': STATUS_OK}
trials = Trials()
best = fmin(f, space4rf, algo=tpe.suggest, max_evals=300, trials=trials)
print("best:", best)

In [None]:
from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier
import lightgbm as lgb
import xgboost as xgboost

def hyperopt_train_test(params):
    t = params['type']
    del params['type']
    if t == 'RF':
        clf = RandomForestClassifier(**params)
    elif t == 'SVM':
        clf = SVC(**params)
    elif t == 'XGB':
        clf = xgb.XGBClassifier(**params)
    elif t == 'LGB':
        clf = lgb.LGBMClassifier(**params)
    else:
        return 0

    cv_results = {
            "roc_auc": []
        }

    #del params['normalize']
    #del params['scale']

    for train_idx, test_idx in v_folds:
        X[train_idx], X[test_idx] = utils.feature_scaling(X[train_idx], X[test_idx], 5)
        X_train, X_test = X[train_idx], X[test_idx]
        y_train, y_test = y[train_idx].ravel(), y[test_idx].ravel()
        y_true = y_test
        fit_info = clf.fit(X_train, y_train)
        y_pred = clf.predict(X_test)
        roc_auc = roc_auc_score(y_true, y_pred, average='weighted')
        cv_results["roc_auc"].append(roc_auc)

    return np.mean(cv_results["roc_auc"])

space = hp.choice('classifier_type', [
    {
        'type': 'LGB',
        'n_estimators': hp.choice('n_estimators2', range(100, 500, 50)),
        'max_depth': hp.choice('max_depth2', range(1,20)),
        'num_leaves': hp.choice('num_leaves2', np.arange( 30, 150, 1, dtype=int)),
        'reg_alpha': hp.quniform('reg_alpha2', 0.0, 1.0, 0.1),
        'reg_lambda': hp.quniform('reg_lambda2', 0.0, 1.0, 0.1),
        'learning_rate': hp.loguniform('learning_rate2', np.log(0.01), np.log(0.2)),
        'min_child_weight': hp.choice('min_child_weight2', [1e-5, 1e-3, 1e-2, 1e-1, 1, 1e1, 1e2, 1e3, 1e4]),
        'min_child_samples': hp.choice('min_child_samples2', np.arange( 20, 500, 5, dtype=int))
    },
    {
        'type': 'SVM',
        'C': hp.uniform('C', 0, 100),
        'kernel': hp.choice('kernel', ['linear']),
        'gamma': hp.uniform('gamma', 0, 100),
        'degree': hp.uniform('degree', 0, 6)
    },{
        'type': 'XGB',
        'n_estimators': hp.choice('n_estimators1', range(100, 500, 50)),
        'max_depth': hp.choice('max_depth1', range(1,20)),
        #'num_leaves': hp.choice('num_leaves1', np.arange( 30, 150, 1, dtype=int)),
        'reg_alpha': hp.quniform('reg_alpha1', 0.0, 1.0, 0.1),
        'reg_lambda': hp.quniform('reg_lambda1', 0.0, 1.0, 0.1),
        'learning_rate': hp.loguniform('learning_rate1', np.log(0.01), np.log(0.2)),
        'min_child_weight': hp.choice('min_child_weight1', [1e-5, 1e-3, 1e-2, 1e-1, 1, 1e1, 1e2, 1e3, 1e4]),
        #'min_child_samples': hp.choice('min_child_samples1', np.arange( 20, 500, 5, dtype=int)),
    },
#     {
#         'type': 'RF',
#         'max_depth': hp.choice('max_depth', range(1,20)),
#         'max_features': hp.choice('max_features', range(1,20)),
#         'n_estimators': hp.choice('n_estimators', range(100, 500, 50)),
#         'criterion': hp.choice('criterion', ["gini", "entropy"]),
#         'min_samples_leaf':  hp.choice('min_samples_leaf',  np.arange(1, 20, step=1, dtype=int))
#         #'scale': hp.choice('scale', [0, 1]),
#         #'normalize': hp.choice('normalize', [0, 1])
#     }
])
count = 0
best = 0
def f(params):
    global best, count
    count += 1
    acc = hyperopt_train_test(params.copy())
    if acc > best:
        print('new best:', acc, 'using', params['type'])
        best = acc
    if count % 50 == 0:
        print('iters:', count, ', acc:', acc, 'using', params)
    return {'loss': -acc, 'status': STATUS_OK}
trials = Trials()
best = fmin(f, space, algo=tpe.suggest, max_evals=1000, trials=trials)
print('best:', best)