In [1]:
import pandas as pd
import numpy as np
from sklearn.neural_network import MLPClassifier
from sklearn.preprocessing import MinMaxScaler, StandardScaler
from sklearn.metrics import f1_score
from sklearn.model_selection import train_test_split
import pickle

In [2]:
results = pickle.load(open('good_model.sav', 'rb'))

In [3]:
results

{'model': MLPClassifier(activation='logistic', alpha=0.0001, batch_size='auto',
        beta_1=0.9, beta_2=0.999, early_stopping=False, epsilon=1e-08,
        hidden_layer_sizes=(9,), learning_rate='constant',
        learning_rate_init=0.0005, max_iter=800, momentum=0.9,
        nesterovs_momentum=True, power_t=0.5, random_state=None,
        shuffle=True, solver='lbfgs', tol=0.0001, validation_fraction=0.1,
        verbose=False, warm_start=False),
 'y_pred': array([1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 1, 1, 1, 2, 2, 1, 2, 2, 2, 2, 1,
        2, 1], dtype=int64),
 'f1_score': 0.9166666666666666}

In [4]:
model = results['model']

In [5]:
df_data = pd.read_csv('train.csv')

In [6]:
df_data.BMI = df_data.BMI.apply(round, args=[4])
df_data.HOMA = df_data.HOMA.apply(round, args=[4])
df_data.Adiponectin = df_data.Adiponectin.apply(round, args=[4])
df_data.Resistin = df_data.Resistin.apply(round, args=[4])

In [7]:
X = df_data.iloc[:, :-1].drop('id', axis=1)
y = df_data.iloc[:, -1]

In [8]:
scaler = StandardScaler()
X = scaler.fit_transform(X)

In [9]:
f_score = 0
while(f_score < 0.95):
    X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.1)

    model.fit(X_train, y_train)

    y_pred = model.predict(X_val)

    f_score = f1_score(y_pred=y_pred, y_true=y_val)
    print(f_score)

0.6666666666666666
0.6666666666666666
0.8333333333333333
0.4444444444444445
0.6666666666666666
0.46153846153846156
0.5714285714285715
0.6666666666666666
0.4
0.5
0.7142857142857143
0.5714285714285715
0.0
0.5
0.5
0.6666666666666666
0.4
0.4444444444444444
0.8
0.8
0.5
0.9090909090909091
0.5714285714285715
0.25
0.5714285714285715
0.6666666666666666
0.6666666666666665
0.8571428571428571
0.5714285714285715
0.8000000000000002
0.6666666666666665
0.5
0.6666666666666666
0.7272727272727272
0.5454545454545454
0.6666666666666665
0.5
0.6666666666666666
0.888888888888889
0.5454545454545454
0.6666666666666665
0.888888888888889
0.8333333333333333
0.6666666666666666
0.3636363636363636
0.7272727272727272
0.5714285714285715
0.6666666666666666
0.7692307692307692
0.8571428571428571
0.6666666666666665
0.7272727272727272
0.888888888888889
0.7272727272727272
0.5
0.7272727272727272
0.6
0.5
0.7499999999999999
0.5
0.7499999999999999
0.5454545454545454
0.6666666666666665
0.7499999999999999
0.4000000000000001
0.6666

In [10]:
model_best = model
y_pred_best = y_pred
f_score_best = f_score
print(model_best)
print(y_pred_best)
print(f_score_best)

MLPClassifier(activation='logistic', alpha=0.0001, batch_size='auto',
       beta_1=0.9, beta_2=0.999, early_stopping=False, epsilon=1e-08,
       hidden_layer_sizes=(9,), learning_rate='constant',
       learning_rate_init=0.0005, max_iter=800, momentum=0.9,
       nesterovs_momentum=True, power_t=0.5, random_state=None,
       shuffle=True, solver='lbfgs', tol=0.0001, validation_fraction=0.1,
       verbose=False, warm_start=False)
[2 2 2 1 1 1 2 2 2 2]
1.0


In [11]:
df_test = pd.read_csv('test.csv')

In [12]:
df_test

Unnamed: 0,id,Age,BMI,Glucose,Insulin,HOMA,Leptin,Adiponectin,Resistin,MCP.1
0,100,62,22.6562,92,3.482,0.7902,9.8648,11.2362,10.6955,703.973
1,78,29,23.01,82,5.663,1.1454,35.59,26.72,4.58,174.8
2,77,75,25.7,94,8.079,1.8733,65.926,3.7412,4.4968,206.802
3,113,44,27.8876,99,9.208,2.2486,12.6757,5.4782,23.0331,407.206
4,86,75,23.0,83,4.952,1.0138,17.127,11.579,7.0913,318.302
5,84,53,36.7902,101,10.175,2.5349,27.1841,20.03,10.2631,695.754
6,89,49,20.9566,94,12.305,2.8531,11.2406,8.4122,23.1177,573.63
7,56,68,21.0828,102,6.2,1.5599,9.6994,8.5747,13.7424,448.799
8,31,48,31.25,199,12.162,5.9699,18.1314,4.1041,53.6308,1698.44
9,48,43,31.25,103,4.328,1.0996,25.7816,12.719,38.6531,775.322


In [13]:
X_test = df_test.iloc[:,1:]
X_test = scaler.transform(X_test)

In [14]:
y_pred = model_best.predict(X_test)

In [15]:
submission = pd.DataFrame()

In [18]:
submission['id'] = df_test.id
submission['Classification'] = y_pred
submission.to_csv('my_submission.csv', index=False)