In [14]:
import pandas as pd
import numpy as np
import pickle

from sklearn.neural_network import MLPClassifier
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix, f1_score, accuracy_score

from collections import defaultdict

In [58]:
df_train = pd.read_csv('train_data.csv')
df_test = pd.read_csv('test_data.csv')

In [3]:
X_train = df_train.iloc[:, :-1]
y_train = df_train.iloc[:, -1]
X_test = df_test.iloc[:, :-1]
y_test = df_test.iloc[:, -1]

In [4]:
scaler = MinMaxScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.fit_transform(X_test)

In [8]:
best_models = defaultdict()
arq = open('best_models.txt', 'rb')
best_models = pickle.load(arq)
arq.close()

In [9]:
best_models

defaultdict(None,
            {'models': [['lbfgs', 'logistic', (2,), 0.0005, 600],
              ['lbfgs', 'logistic', (2,), 0.003, 800],
              ['lbfgs', 'logistic', (3, 3), 0.0005, 1000],
              ['lbfgs', 'relu', (1, 8), 0.001, 600],
              ['lbfgs', 'relu', (2,), 0.0005, 800],
              ['lbfgs', 'tanh', (5, 1), 0.001, 1000]],
             'y_preds': [array([2, 1, 2, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 1, 2, 2, 1, 1, 2, 2, 2, 1,
                     1, 2], dtype=int64),
              array([2, 1, 2, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 1, 2, 2, 1, 1, 2, 2, 2, 1,
                     1, 2], dtype=int64),
              array([2, 1, 2, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 1, 2, 2, 1, 1, 2, 2, 1, 1,
                     1, 1], dtype=int64),
              array([2, 1, 2, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 1, 2, 2, 1, 1, 2, 2, 1, 1,
                     1, 1], dtype=int64),
              array([2, 1, 2, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 1, 2, 2, 1, 1, 2, 2, 1, 1,
                     1, 1], 

In [24]:
models = []
for s, a, h, l, e in best_models['models']:
    models.append(MLPClassifier(solver=s, activation=a, hidden_layer_sizes=h, learning_rate_init=l, max_iter=e))

In [54]:
acc = 0
while(acc < 0.95):
    for model in models:
        model.fit(X_train, y_train)
        y_pred = model.predict(X_test)
        acc = accuracy_score(y_pred=y_pred, y_true=y_test)
        print(acc)

0.7916666666666666
0.7916666666666666
0.8333333333333334
0.9166666666666666
0.9166666666666666
0.75
0.75
0.75
0.75
0.625
0.7916666666666666
0.8333333333333334
0.8333333333333334
0.6666666666666666
0.875
0.875
0.7916666666666666
0.75
0.6666666666666666
0.7916666666666666
0.875
0.7916666666666666
0.75
0.7916666666666666
0.8333333333333334
0.8333333333333334
0.5416666666666666
0.6666666666666666
0.8333333333333334
0.7083333333333334
0.8333333333333334
0.8333333333333334
0.7083333333333334
0.625
0.7916666666666666
0.6666666666666666
0.7916666666666666
0.7083333333333334
0.8333333333333334
0.75
0.625
0.7083333333333334
0.75
0.8333333333333334
0.6666666666666666
0.875
0.7916666666666666
0.7916666666666666
0.8333333333333334
0.7916666666666666
0.7916666666666666
0.625
0.75
0.7916666666666666
0.75
0.75
0.7916666666666666
0.9166666666666666
0.7916666666666666
0.7916666666666666
0.75
0.8333333333333334
0.7916666666666666
0.875
0.7916666666666666
0.75
0.7916666666666666
0.8333333333333334
0.83333

0.8333333333333334
0.625
0.9166666666666666
0.7916666666666666
0.8333333333333334
0.7916666666666666
0.75
0.8333333333333334
0.7916666666666666
0.7083333333333334
0.625
0.75
0.8333333333333334
0.5833333333333334
0.625
0.875
0.7083333333333334
0.75
0.625
0.7916666666666666
0.75
0.7916666666666666
0.7083333333333334
0.7083333333333334
0.7916666666666666
0.8333333333333334
0.8333333333333334
0.7916666666666666
0.625
0.7916666666666666
0.5833333333333334
0.5
0.625
0.7916666666666666
0.7916666666666666
0.75
0.7916666666666666
0.5416666666666666
0.5416666666666666
0.75
0.75
0.75
0.875
0.7916666666666666
0.8333333333333334
0.7916666666666666
0.7916666666666666
0.8333333333333334
0.625
0.7916666666666666
0.7916666666666666
0.7083333333333334
0.75
0.8333333333333334
0.8333333333333334
0.625
0.8333333333333334
0.7083333333333334
0.75
0.7916666666666666
0.8333333333333334
0.8333333333333334
0.7916666666666666
0.7916666666666666
0.6666666666666666
0.7083333333333334
0.8333333333333334
0.625
0.6666

In [57]:
y_pred

array([2, 1, 2, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 1, 2, 2, 1, 1, 2, 2, 2, 1,
       1, 2], dtype=int64)

In [69]:
pd.concat([df_test.id, pd.Series(y_pred)], axis=1, keys=['id', 'Classification']).to_csv('output.csv', index=False)