In [1]:
import pandas as pd
import numpy as np
from collections import Counter
import matplotlib.pyplot as plt
from keras.models import Sequential
from keras.layers import Dense
from keras.callbacks import EarlyStopping
from keras.wrappers.scikit_learn import KerasClassifier
from keras.optimizers import SGD
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix
from sklearn.metrics import accuracy_score, recall_score, precision_score, f1_score
from sklearn.metrics import roc_auc_score, average_precision_score
from scipy.stats import ks_2samp
from keras.wrappers.scikit_learn import KerasClassifier
from sklearn.svm import SVC
from sklearn.ensemble import GradientBoostingClassifier, RandomForestClassifier, VotingClassifier
%matplotlib inline

  from ._conv import register_converters as _register_converters
Using TensorFlow backend.


In [2]:
X_train_res = pd.read_csv('database/X_train_res.csv').drop(columns=['Unnamed: 0'])
y_train_res = pd.read_csv('database/y_train_res.csv').drop(columns=['Unnamed: 0'])
X_val = pd.read_csv('database/X_val.csv').drop(columns=['INDEX'])
y_val = pd.read_csv('database/y_val.csv', names=['INDEX', 'IND_BOM_1_1']).drop(columns=['INDEX'])
X_test = pd.read_csv('database/X_test.csv').drop(columns=['INDEX'])
y_test = pd.read_csv('database/y_test.csv', names=['INDEX', 'IND_BOM_1_1']).drop(columns=['INDEX'])

<h2>Variáveis e Métodos Auxiliares</h2>

In [3]:
input_dim = len(list(X_train_res)) # Dimensão de entrada do dataset

In [67]:
'''
    * Método para calcular a distribuição acumulada das classes, de 0.0 a 1.0
    * Utilizado para o cálculo do KS
'''
def calc_distr(y_true:pd.DataFrame, y_pred_proba:np.array):
    ac_distr_0 = np.zeros(101)
    ac_distr_1 = np.zeros(101)
    count_classes = y_true['IND_BOM_1_1'].value_counts()
    for i in range(1, 101):
        lim = i/100.0
        ac_classes = y_true[y_pred_proba <= lim]['IND_BOM_1_1'].value_counts()
        ac_distr_0[i] += ac_classes.get(0, 0) 
        ac_distr_1[i] += ac_classes.get(1, 0)
    return (ac_distr_0/count_classes[0], ac_distr_1/count_classes[1])

In [68]:
'''
    * Método para calcular as métricas a serem impressas
'''

def calc_metrics(y_true, y_pred, y_pred_proba):
    cm = confusion_matrix(y_true, y_pred)
    precision = precision_score(y_true, y_pred)
    accuracy = accuracy_score(y_true, y_pred)
    f1 = f1_score(y_true, y_pred)
    recall = recall_score(y_true, y_pred)
    metrics = {
        'cm': cm,
        'precision': precision,
        'accuracy': accuracy,
        'f1': f1,
        'recall': recall
    }
    if not y_pred_proba is None:
        ac_distr0, ac_distr1 = calc_distr(y_true, y_pred_proba)
        ks = ks_2samp(ac_distr0, ac_distr1)
        auroc = roc_auc_score(y_true, y_pred_proba)
        aps = average_precision_score(y_true, y_pred_proba)
        metrics['ks'] = ks[0]
        metrics['auroc'] = auroc
        metrics['aps'] = aps
    return metrics

In [95]:
'''
    * Método para imprimir todas as métricas
'''
def print_metrics(metrics:dict):
    print('Matriz de Confusão:', end='\n\n')
    print(pd.DataFrame(metrics['cm'], columns=['T', 'F'], index=['T', 'F']), end='\n\n')
    print('Área Sob Curva ROC: %.5f'%(metrics['auroc']), end = '\n\n')
    print('KS-Score: %.5f'%(metrics['ks']), end='\n\n')
    print('Precisão Média de Previsão: %.5f'%(metrics['aps']), end='\n\n')
    print('Precisão: %.5f'%(metrics['precision']), end='\n\n')
    print('Acurácia: %.5f'%(metrics['accuracy']), end='\n\n')
    print('Recall: %.5f'%(metrics['recall']), end='\n\n')
    print('F1-Score: %.5f'%(metrics['f1']), end='\n\n')

<h2>Treinando MLPs</h2>
<p>Para o treino de MLPs foram testadas diversas formas de otimizar hiperparâmetros como: learning rate, algoritmo de otimização, número de camadas escondidas, etc. A estimativa do learning rate e do número de camadas escondidas foi feita automaticamente a partir do conjunto de validação.</p>

<h3>O MLP Básico</h3>
<p>O MLP é montado com base na biblioteca Keras e segue uma estrutura básica:</p>
<ul>
    <li>O MLP em si é uma classe Sequential e nela serão adicionadas as camadas de entrada, saída e internas.</li>
    <li>As camadas são uma classe Dense. Passamos para o construtor dessa classe o número de nodes, a função de ativação e, no caso de ser a primeira camada, a dimensão da entrada.</li>
    <li>Antes de treinar o MLP, devemos compilar o mesmo e setar parâmetros como a função de otimização, algumas métricas opcionais como 'accuracy' e a função de perda, que retorna uma métrica para avaliarmos o MLP</li>
    <li>Para treinarmos o modelo utilizaremos a função fit que recebe como parâmetros X sendo as amostras para treinamento, y sendo as classes de cada amostra, batch_size sendo o comprimento do batch utilizado no treinamento, o número de epochs sendo quantas vezes iremos dar entrada com o dataset para o treinamento, validation_data sendo os dados utilizados para validação e callbacks para pararmos o treinamento com certas condições.</li>
</ul>
<p>Para a primeira fase, procuraremos funções de ativação, número de nós na camada de entrada e função de otimização que melhorem o acerto no conjunto de validação</p>

<h3>Estimando Hiperparâmetros</h3>
<ul>
    <li>Função de Ativação</li>
    <li>Função de Otimização</li>
    <li>Camadas escondidas</li>
</ul>

<h4>Número de Neurônios na Camada de Entrada</h4>
<p>Incialmente verificamos se o número de neurônios na camada de entrada influencia muito na qualidade do MLP</p>

<h5>20 Neurônios</h5>

In [93]:
mlp = Sequential()
mlp.add(Dense(20, activation='tanh', input_dim=input_dim)) # Camada de entrada
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val));
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000


In [94]:
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Matriz de Confusão:

       T      F
T  28819  15433
F  31997  52186

Área Sob Curva ROC: 0.68849

KS-Score: 0.16832

Precisão Média de Previsão: 0.79984

Precisão: 0.77177

Acurácia: 0.63071

Recall: 0.61991

F1-Score: 0.68755



<h5>40 Neurônios</h5>

In [99]:
mlp = Sequential()
mlp.add(Dense(40, activation='tanh', input_dim=input_dim)) # Camada de entrada
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Epoch 7/100000
Epoch 8/100000
Epoch 9/100000
Epoch 10/100000


In [100]:
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Matriz de Confusão:

       T      F
T  27008  17244
F  30156  54027

Área Sob Curva ROC: 0.67645

KS-Score: 0.17822

Precisão Média de Previsão: 0.79120

Precisão: 0.75805

Acurácia: 0.63094

Recall: 0.64178

F1-Score: 0.69509



<h5>80 Neurônios</h5>

In [101]:
mlp = Sequential()
mlp.add(Dense(80, activation='tanh', input_dim=input_dim)) # Camada de entrada
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000


In [102]:
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Matriz de Confusão:

       T      F
T  30713  13539
F  35855  48328

Área Sob Curva ROC: 0.68321

KS-Score: 0.16832

Precisão Média de Previsão: 0.79632

Precisão: 0.78116

Acurácia: 0.61542

Recall: 0.57408

F1-Score: 0.66180



<p>Analisando principalmente o KS, vemos que o melhor valor foi encontrado entre 20, 40 e 80 foi 40.</p>

<h4>Função de Ativação na Camada de Entrada</h4>
<p>Para problemas de classificação, as melhores funções de ativação são relu, sigmoid e tanh. Testaremos as 3 na camada de entrada</p>

In [105]:
mlp = Sequential()
mlp.add(Dense(40, activation='sigmoid', input_dim=input_dim)) # Camada de entrada
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Matriz de Confusão:

       T      F
T  28250  16002
F  31085  53098

Área Sob Curva ROC: 0.68657

KS-Score: 0.16832

Precisão Média de Previsão: 0.80036

Precisão: 0.76842

Acurácia: 0.63338

Recall: 0.63074

F1-Score: 0.69281



In [106]:
mlp = Sequential()
mlp.add(Dense(40, activation='relu', input_dim=input_dim)) # Camada de entrada
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Matriz de Confusão:

       T      F
T  23779  20473
F  24781  59402

Área Sob Curva ROC: 0.67655

KS-Score: 0.15842

Precisão Média de Previsão: 0.79258

Precisão: 0.74369

Acurácia: 0.64765

Recall: 0.70563

F1-Score: 0.72416



<p>Modificando as funções de ativação na camada de entrada também não variou muito a perda média. Testamos então na camada de saída.</p>

In [109]:
mlp = Sequential()
mlp.add(Dense(40, activation='sigmoid', input_dim=input_dim)) # Camada de entrada
mlp.add(Dense(1, activation='relu')) # Camada de saída
mlp.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Epoch 7/100000
Epoch 8/100000
Matriz de Confusão:

       T      F
T  29404  14848
F  33292  50891

Área Sob Curva ROC: 0.68439

KS-Score: 0.14851

Precisão Média de Previsão: 0.79565

Precisão: 0.77414

Acurácia: 0.62518

Recall: 0.60453

F1-Score: 0.67890



In [110]:
mlp = Sequential()
mlp.add(Dense(40, activation='sigmoid', input_dim=input_dim)) # Camada de entrada
mlp.add(Dense(1, activation='tanh')) # Camada de saída
mlp.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Epoch 7/100000
Matriz de Confusão:

       T      F
T  23635  20617
F  24536  59647

Área Sob Curva ROC: 0.67785

KS-Score: 0.14851

Precisão Média de Previsão: 0.79552

Precisão: 0.74314

Acurácia: 0.64844

Recall: 0.70854

F1-Score: 0.72543



<p>Os melhores valores de KS foram encontrados quando utilizando sigmoid em ambas as camadas.</p>

<h4>Algoritmo de Otimização</h4>

In [112]:
mlp = Sequential()
mlp.add(Dense(40, activation='sigmoid', input_dim=input_dim)) # Camada de entrada
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adamax', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Epoch 7/100000
Epoch 8/100000
Epoch 9/100000
Matriz de Confusão:

       T      F
T  26973  17279
F  28285  55898

Área Sob Curva ROC: 0.69163

KS-Score: 0.16832

Precisão Média de Previsão: 0.80345

Precisão: 0.76387

Acurácia: 0.64524

Recall: 0.66401

F1-Score: 0.71045



In [113]:
mlp = Sequential()
mlp.add(Dense(40, activation='sigmoid', input_dim=input_dim)) # Camada de entrada
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adadelta', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Epoch 7/100000
Matriz de Confusão:

       T      F
T  26668  17584
F  27968  56215

Área Sob Curva ROC: 0.68948

KS-Score: 0.16832

Precisão Média de Previsão: 0.80166

Precisão: 0.76173

Acurácia: 0.64533

Recall: 0.66777

F1-Score: 0.71166



In [114]:
mlp = Sequential()
mlp.add(Dense(40, activation='sigmoid', input_dim=input_dim)) # Camada de entrada
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Matriz de Confusão:

       T      F
T  31339  12913
F  36753  47430

Área Sob Curva ROC: 0.68871

KS-Score: 0.17822

Precisão Média de Previsão: 0.80183

Precisão: 0.78601

Acurácia: 0.61330

Recall: 0.56342

F1-Score: 0.65635



In [115]:
mlp = Sequential()
mlp.add(Dense(40, activation='sigmoid', input_dim=input_dim)) # Camada de entrada
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='sgd', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Epoch 7/100000
Epoch 8/100000
Epoch 9/100000
Matriz de Confusão:

       T      F
T  28785  15467
F  33449  50734

Área Sob Curva ROC: 0.67332

KS-Score: 0.13861

Precisão Média de Previsão: 0.78566

Precisão: 0.76636

Acurácia: 0.61914

Recall: 0.60266

F1-Score: 0.67473



<p>Ambos algoritmos adamax e adadelta geraram ks semelhante, porém o adamax possui uma melhor aucroc, porém o adam gerou o melhor ks. SGD foi o pior algoritmo de otimização.</p>

<h4>Camadas Escondidas</h4>

In [117]:
hidden_nodes = 30

In [118]:
for hidden_layers in range(6):
    mlp = Sequential()
    mlp.add(Dense(40, activation='sigmoid', input_dim=input_dim)) # Camada de entrada
    for i in range(hidden_layers):
        mlp.add(Dense(hidden_nodes, activation='relu', input_dim=input_dim))
    mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
    mlp.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])
    history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
            callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
    y_pred = mlp.predict_classes(X_test)
    y_pred_proba = mlp.predict(X_test)
    metrics = calc_metrics(y_test, y_pred, y_pred_proba)
    print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Matriz de Confusão:

       T      F
T  29134  15118
F  32139  52044

Área Sob Curva ROC: 0.68977

KS-Score: 0.16832

Precisão Média de Previsão: 0.80174

Precisão: 0.77490

Acurácia: 0.63206

Recall: 0.61822

F1-Score: 0.68775

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Matriz de Confusão:

       T      F
T  25319  18933
F  26148  58035

Área Sob Curva ROC: 0.68471

KS-Score: 0.14851

Precisão Média de Previsão: 0.79777

Precisão: 0.75401

Acurácia: 0.64900

Recall: 0.68939

F1-Score: 0.72026

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Matriz de Confusão:

       T      F
T  26733  17519
F  28153  56030

Área Sob Curva ROC: 0.68906

KS-Score: 0.16832

Precisão Média de Previsão: 0.8

<p>O maior KS foi obtido com 5 camadas escondidas, cada uma com 30 neurônios</p>

In [122]:
mlp = Sequential()
mlp.add(Dense(40, activation='sigmoid', input_dim=input_dim)) # Camada de entrada
for i in range(5):
    mlp.add(Dense(hidden_nodes, activation='relu', input_dim=input_dim))
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adam', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Epoch 7/100000
Epoch 8/100000
Matriz de Confusão:

       T      F
T  20555  23697
F  19407  64776

Área Sob Curva ROC: 0.68549

KS-Score: 0.14851

Precisão Média de Previsão: 0.80018

Precisão: 0.73216

Acurácia: 0.66439

Recall: 0.76947

F1-Score: 0.75035



In [123]:
mlp = Sequential()
mlp.add(Dense(40, activation='sigmoid', input_dim=input_dim)) # Camada de entrada
for i in range(5):
    mlp.add(Dense(hidden_nodes, activation='relu', input_dim=input_dim))
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adam', loss='mean_squared_logarithmic_error', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Matriz de Confusão:

       T      F
T  30939  13313
F  36229  47954

Área Sob Curva ROC: 0.68923

KS-Score: 0.20792

Precisão Média de Previsão: 0.80262

Precisão: 0.78271

Acurácia: 0.61426

Recall: 0.56964

F1-Score: 0.65939



In [127]:
mlp = Sequential()
mlp.add(Dense(40, activation='sigmoid', input_dim=input_dim)) # Camada de entrada
for i in range(5):
    mlp.add(Dense(hidden_nodes, activation='relu', input_dim=input_dim))
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adam', loss='mean_squared_logarithmic_error', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=64, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Epoch 7/100000
Epoch 8/100000
Epoch 9/100000
Epoch 10/100000
Epoch 11/100000
Matriz de Confusão:

       T      F
T  31263  12989
F  36776  47407

Área Sob Curva ROC: 0.68666

KS-Score: 0.18812

Precisão Média de Previsão: 0.80120

Precisão: 0.78494

Acurácia: 0.61253

Recall: 0.56314

F1-Score: 0.65579



<h4>Batch Size</h4>

In [131]:
mlp = Sequential()
mlp.add(Dense(40, activation='sigmoid', input_dim=input_dim)) # Camada de entrada
for i in range(5):
    mlp.add(Dense(hidden_nodes, activation='relu', input_dim=input_dim))
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adam', loss='mean_squared_logarithmic_error', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=32, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
y_pred = mlp.predict_classes(X_test)
y_pred_proba = mlp.predict(X_test)
metrics = calc_metrics(y_test, y_pred, y_pred_proba)
print_metrics(metrics)

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Epoch 7/100000
Epoch 8/100000
Epoch 9/100000
Epoch 10/100000
Epoch 11/100000
Epoch 12/100000
Epoch 13/100000
Epoch 14/100000
Epoch 15/100000
Matriz de Confusão:

       T      F
T  25384  18868
F  26810  57373

Área Sob Curva ROC: 0.68238

KS-Score: 0.15842

Precisão Média de Previsão: 0.79843

Precisão: 0.75252

Acurácia: 0.64435

Recall: 0.68153

F1-Score: 0.71527



In [6]:
opt_hidden_layer = 3
mlp = Sequential()
mlp.add(Dense(30, activation='relu', input_dim=input_dim)) # Camada de entrada
for i in range(opt_hidden_layer):
    mlp.add(Dense(hidden_nodes, activation='relu')) # Camada de entrada
mlp.add(Dense(1, activation='sigmoid')) # Camada de saída
mlp.compile(optimizer='adadelta', loss='binary_crossentropy', metrics=['acc'])
history = mlp.fit(X_train_res, y_train_res, batch_size=32, epochs=100000, 
        callbacks=[EarlyStopping(patience=3)], validation_data=(X_val, y_val))
print('Perda Média: %.2f'%(np.mean(history.history['val_loss'])))

Train on 307646 samples, validate on 26077 samples
Epoch 1/100000
Epoch 2/100000
Epoch 3/100000
Epoch 4/100000
Epoch 5/100000
Epoch 6/100000
Epoch 7/100000
Epoch 8/100000
Epoch 9/100000
Epoch 10/100000
Epoch 11/100000
Epoch 12/100000
Epoch 13/100000
Epoch 14/100000
Perda Média: 0.62


<p>Para o tamanho do batch = 32 obtivemos a menor perda.</p>

In [None]:
test_evaluation = mlp.evaluate(X_test, y_test, batch_size=32)
print("Conjunto de Teste:\n\tPerda: %.3f\n\tAcurácia: %.3f"%(test_evaluation[0],test_evaluation[1]))