# Rede Neural Artificial - Classificação Binária

In [2]:
import pandas as pd
import numpy as np

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import models, layers

In [3]:
tf.__version__

'2.0.0-beta1'

# Importar Dados

In [2]:
X = pd.read_csv("entradas-breast.csv")

In [3]:
X.head(2)

Unnamed: 0,radius_mean,texture_mean,perimeter_mean,area_mean,smoothness_mean,compactness_mean,concavity_mean,concave_points_mean,symmetry_mean,fractal_dimension_mean,...,radius_worst,texture_worst,perimeter_worst,area_worst,smoothness_worst,compactness_worst,concavity_worst,concave_points_worst,symmetry_worst,fractal_dimension_worst
0,17.99,10.38,122.8,1001.0,0.1184,0.2776,0.3001,0.1471,0.2419,0.07871,...,25.38,17.33,184.6,2019.0,0.1622,0.6656,0.7119,0.2654,0.4601,0.1189
1,20.57,17.77,132.9,1326.0,0.08474,0.07864,0.0869,0.07017,0.1812,0.05667,...,24.99,23.41,158.8,1956.0,0.1238,0.1866,0.2416,186.0,275.0,0.08902


In [4]:
y = pd.read_csv("saidas-breast.csv")

In [5]:
y.head(2)

Unnamed: 0,0
0,0
1,0


## Divisão Treino-Teste

In [6]:
from sklearn.model_selection import train_test_split

In [7]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25)

In [8]:
len(X_train)

426

In [9]:
len(X_test)

143

## Modelo Artificial Neural Network (Modelo de 1 camada)

In [10]:
#https://stats.stackexchange.com/questions/207049/neural-network-for-binary-classification-use-1-or-2-output-neurons

# feed forward - Numa rede neural feed forward a informação move-se sempre num sentido, nunca volta atrás.(desde a camada de 
# entrada, para as camadas ocultas, se existirem, até a camada de saida) É uma rede neural onde as conecções entre os nodos não
# formam um ciclos, ao contrario das redes neurais recorrentes.

# Back-Propagation - Algoritmo utilizado no treino(supervisionado) da rede feedforward. São atribuidos pesos aos neuronios da 
# rede e os calculos são efectuados com esses pesos partindo da camada de entrada até a camada de saida. 
# Calcula-se o erro obtido na camada de saida e modificam-se os pesos da iteração anterior partindo da camada de saida até a 
# camada de entrada. Utiliza-se o método da descida do gradiente para encontrar o melhor valor para os pesos.
# De seguida, e com os pesos obtidos na iteração anterior, são efectuados os mesmos calculos. Cada actualização dos pesos
# chama-se de epoca.

# Sequential - A informação move-se da camada de entrada, para a camada oculta e de seguida para a camada de saida.

#Dense - Camadas densas(cada um dos neurónios é ligado com todos os neuronios da camada seguinte) tambem chamada de rede neural
# fully connected

# 1ª Camada Oculta(e definição da camada de entrada) 
# Neuronios: normalmente escolhe-se o número de neuronios igual ao número de variaveis de entrada mais o número de variaveis de saida 
# divididos por 2 ((30+1)/2=16) para começar a modelar a rede. Posteriormente pode-se ajustar para se obter melhores resultados
# Função de Activação: Normalmente escolhe-se a reLu para deep learning porque obtem-se melhores resultados do que com uma
# função sigmoide ou tangente hiperbolica. 
# Kernel initializer: Como se inicializam os pesos.
# input_dim: quantos atributos existem na camada de entrada (neste caso são 30 variaveis de entrada). Este parâmetro só é 
# necessário para a primeira camada oculta. Com este parâmetro activo não é necessário colocar explicitamente a camada de 
# entrada porque na 1ª camada oculta está-se a dizer o numero de neurónios da camada de entrada.

# Camada de Saida
# Neuronios: Igual ao número de saidas possiveis, para classificação binária normalmente utiliza-se 1. Considera-se o resultado 
# obtido ser da classe A se for 0 (<0.5) e 1 (>=0.5) é considerado classe B (no caso de se usar a função sigmoid nesta camada).
# Função de activação: Sigmoid porque é um problema de classificação binário que varia entre 0 e 1, e esta função retorna sempre
# um valor entre 0 e 1.

model = models.Sequential()
model.add(layers.Dense(units=16, activation="relu", kernel_initializer="random_uniform", input_dim=30))
model.add(layers.Dense(units=1, activation="sigmoid"))


### Compilação e Ajuste do modelo ANN

In [11]:
#https://medium.com/ensina-ai/uma-explica%C3%A7%C3%A3o-visual-para-fun%C3%A7%C3%A3o-de-custo-binary-cross-entropy-ou-log-loss-eaee662c396c

# Optimizer: adam é uma optimização da descida do gradiente estócastico (usado para encontrar os melhores valores dos pesos).
# É o que melhor se adapta à maioria dos casos.
# loss = função de perda binary_crossentropy é a mais utilizada para classificação binária. Mede o quão afastada está a previsão
# do seu valor real(0 ou 1) para cada classe e faz a média desses erros(desvios) para obter o custo(loss). Como utiliza o
# logaritmo tem uma penalização maior quando existe uma classificação errada.

model.compile(optimizer="adam", loss="binary_crossentropy", metrics=["binary_accuracy"])

In [15]:
# batch_size
# Se escolher-se 1(Stochastic gradient descent) calcula-se o erro para cada dado e atualiza-se os pesos de seguida.
# Se escolher-se igual ao numero de dados (batch gradient descent) calcula-se o erro para todos os registros e só depois
# é que se actualizam os pesos.
# Se escolher-se um número intermédio(Mini batch gradient descent), por ex. 10, calcula-se o erro para um conjunto de 10 dados 
# e actualizam-se os pesos (Stochastic gradient descent).

# epochs:  Quantas vezes o algoritmo percorre o conjunto de dados de treino totalmente.
# Caso a base de dados de treino tenha 100 dados.
# Stochastic gradient descent:
# 1ª época: Calcula o erro para o 1º registro e actualiza todos os pesos. Calcula o erro para o 2º registro e actualiza todos 
# os pesos.  Calcula o erro para o 3º registro e actualiza todos os pesos.  E assim sucessivamente até aos 100 registros.
# 2ª época: Calcula o erro para o 1º registro e actualiza todos os pesos da 1ª época. Calcula o erro para o 2º registro e 
# actualiza todos os pesos da iteração anterior.  Calcula o erro para o 3º registro e actualiza todos os pesos da iteração 
# anterior.  E assim sucessivamente.
# batch gradient descent:
# 1ª época: Calcula o erro para o 1º registo. Calcula o erro para o seguindo registo. E assim sucessivamente até ter calculado
# o erro para os 100 registro. No fim actualiza todos os pesos.
# 2ª época: Calcula o erro para o 1º registo. Calcula o erro para o seguindo registo. E assim sucessivamente até ter calculado
# o erro para todos os registro. No fim actualiza todos os pesos da 1ª época.
# Mini batch gradient descent (por ex. batch=10):
# 1ª época: Calcula o erro para os 1ºs 10 registros e depois actualiza todos os pesos. Calcula o erro para os 2ºs 10 registros 
# e actualiza todos os pesos.
# 2ª época: Calcula o erro para os 1ºs 10 registros e depois actualiza todos os pesos da 1ª época. Calcula o erro para os 2ºs 
# 10 registros e actualiza todos os pesos da iteração anterior.

# Para um conjunto de dados de treino de 436 registros e batch_size de 6 registros:
# 426/6 = 71 iterações por época. 71 actualizações dos pesos por época

# Ajustar os dados de entrada de treino aos dados de saida de treino para treinar o modelo
model.fit(X_train, y_train, batch_size=1, epochs=2)

Train on 426 samples
Epoch 1/2
Epoch 2/2


<tensorflow.python.keras.callbacks.History at 0x77b7f67438>

In [13]:
# A avalição da binary_accuracy: 0.6385 está a ser feita no conjunto de treino, ou seja, está a fazer o treino e a avaliar no
# mesmo conjunto de dados. A avaliação deve ser feita para um conjunto de dados novos(não treinados).

### Previsão e Avaliação do Modelo ANN

In [14]:
# Prever os dados de teste para avaliar o modelo
predictions = model.predict(X_test)

In [15]:
# Passar os valores para verdadeiro ou falso
predictions = predictions > 0.5

In [16]:
data = pd.DataFrame(index = np.arange(0,143))
data["y_test"] = y_test.set_index(np.arange(0,143))
data["predictions"] = pd.DataFrame(predictions)
data.head()

Unnamed: 0,y_test,predictions
0,0,True
1,0,True
2,0,False
3,0,False
4,1,True


In [17]:
from sklearn.metrics import classification_report, confusion_matrix

In [18]:
#Relatório de classificação
#Ver como o modelo se ajusta para os dados de teste
print(classification_report(y_test, predictions))

              precision    recall  f1-score   support

           0       0.84      0.81      0.83        53
           1       0.89      0.91      0.90        90

   micro avg       0.87      0.87      0.87       143
   macro avg       0.87      0.86      0.86       143
weighted avg       0.87      0.87      0.87       143



In [19]:
confusion = confusion_matrix(y_test,predictions)

In [20]:
#Matriz de confusão
outside_columns = ["Predicted",""]
outside_index = ["Actual",""]
inside = ["Benigno","Maligno"]

hier_columns = list(zip(outside_columns, inside))
hier_columns = pd.MultiIndex.from_tuples(hier_columns)

hier_index = list(zip(outside_index, inside))
hier_index = pd.MultiIndex.from_tuples(hier_index)

pd.DataFrame(confusion, columns=hier_columns, index = hier_index)

Unnamed: 0_level_0,Unnamed: 1_level_0,Predicted,Unnamed: 3_level_0
Unnamed: 0_level_1,Unnamed: 1_level_1,Benigno,Maligno
Actual,Benigno,43,10
,Maligno,8,82


In [21]:
# Com o TensorFlow 2.0
model.evaluate(X_test,y_test)



[0.6338372607096717, 0.8741259]

## Modelo Deep Neural Network (Modelo com mais de 1 camada oculta)

In [62]:
# Modelo com 2 camadas ocultas
# Na segunda camada oculta em geral coloca-se a mesma quantidade de neurónios do que na primeira, mas é necessário fazer testes
# para encontrar a melhor configuração.

# Ao se adicionar mais uma camada nem sempre leva a resultados melhores

model = models.Sequential()
model.add(layers.Dense(units=16, activation="relu", kernel_initializer="random_uniform", input_dim=30))
model.add(layers.Dense(units=16, activation="relu", kernel_initializer="random_uniform"))
model.add(layers.Dense(units=1, activation="sigmoid"))

### Compilação e Ajuste do modelo DNN

In [63]:

# lr: taxa de aprendizagem, serve para se obter o minimo global da função do erro. Com um learning rate grande, o ajustes dos 
# pesos é maior e obtem-se o minimo global mais rapido, mas se for demasiado alto pode acabar por se passar o valor do minimo 
# global e obter-se um valor maior.

# decay: quanto o learning rate é incrementado a cada actualização dos pesos. Por exmplo o lr começa em 0.01 e apos a 1ª 
# actualização dos pesos passa para 0.001. Permite colocar um lr mais alto porque dificilmente se encontra a melhor solução
# nas primeiras iterações. Assim não se corre tanto o risco de se passar o valor minimo global.

# clipvalue: Por defeito os valores dos pesos variam entre -0.5 e 0.5 para não sairem muito do padrão e não fiquem dispersos
# dentro do gradiente tentando encontrar o minimo global.

# caso se chega a valores de pesos menores e maiores do que -0.5 e 0.5(por defeito), esses pesos não são 

optimizer = keras.optimizers.Adam(lr=0.001, decay=0.0001, clipvalue=0.5)

In [24]:
model.compile(optimizer=optimizer, loss="binary_crossentropy", metrics=["binary_accuracy"])

In [25]:
model.fit(X_train, y_train, batch_size=10, epochs=100)

Train on 426 samples
Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100


<tensorflow.python.keras.callbacks.History at 0x5e01042898>

## Visialização dos Pesos da Rede

In [26]:
# Pesos da primeira camada oculta
# 30 entradas
# 16 neuronios na camada

pesos0 = model.layers[0].get_weights()
pesos1 = model.layers[1].get_weights()
pesos2 = model.layers[2].get_weights()

In [27]:
# O comprimento é 2 porque a primeira possição de tamanho de (30,16) tem os pesos da camada de entrada(30 entrada) a camada 
# oculta(16 neuronios).
# na segunda posição, como por defeito a rede neural é criada com bies, foi criado mais um neuronio na camada de entrada.
# Contem os valores dos pesos da ligação desse neuronio àcamada oculta(16 neurónios).

len(pesos0)

2

In [28]:
# O comprimento é 2 porque a primeira possição de tamanho de (16,16) tem os pesos da ligação da 1ª camada oculta(16 neuronios) 
# a 2ª camada oculta(16 neuronios).
# na segunda posição, como por defeito a rede neural é criada com bies, foi criado mais um neuronio na 1ª camada oculta.
# Contem os valores dos pesos da ligação desse neuronio à 2ª camada oculta(16 neurónios).

len(pesos1)

2

In [29]:
# O comprimento é 2 porque a primeira possição de tamanho de (16,1) tem os pesos da ligação da 2ª camada oculta(16 neuronios) 
# a camada de saida(1 neuronio).
# na segunda posição, como por defeito a rede neural é criada com bies, foi criado mais um neuronio na 2ª camada oculta.
# Contem os valores dos pesos da ligação desse neuronio à camada de saida(1 neuronio).

len(pesos2)

2

## Validação Cruzada (K-fold Cross Validation)

In [8]:
# Caso não se queira dividir o dataset num conjunto de dados de treino e de teste. Por exemplo em datasets com conjunto de dados
# dominante, corre-se o risco dessa separação de dados ser feita com o conjunto de treino ou teste a ter apenas dados do 
# tipo dominante. Ou quando se corre o risco de existirem dados importantes para o treino e que apenas ficam no conjunto de 
# de teste. Ou quando o conjunto de dados seja pequeno.

# Neste caso pode-se utilizar o k-fold cross validation.
# Ao utilizar-se o k fold cross validation, está-se a dividir o conjunto de dados em k sub conjuntos e a utilizar-se k-1 para 
# treino e o 1º conjunto para teste. Na segunda iteração o 2º sub conjunto é utilizado para teste e os restantes para treino.
# Este processo é realizado k vezes alternando de forma circular o subconjunto de teste.
# No fim calcula-se a media dos parâmetros(precision, accuracy) obtidos em cada iteração.
# Normalmente utiliza-se k=10.

from tensorflow.keras.wrappers.scikit_learn import KerasClassifier
from sklearn.model_selection import cross_validate

### Criar o modelo

In [65]:
### Criar o modelo de DNN numa função

def model():
    model = models.Sequential()
    model.add(layers.Dense(units=16, activation="relu", kernel_initializer="random_uniform", input_dim=30))
    model.add(layers.Dense(units=16, activation="relu", kernel_initializer="random_uniform"))
    model.add(layers.Dense(units=1, activation="sigmoid"))
    
    optimizer = keras.optimizers.Adam(lr=0.001, decay=0.0001, clipvalue=0.5)
    model.compile(optimizer=optimizer, loss="binary_crossentropy", metrics=["binary_accuracy"])
    return model

In [66]:
model = KerasClassifier(build_fn=model, epochs=100, batch_size=10)

### Cross Validation

In [67]:
# cross validation

scoring = ['precision_weighted', 'recall_weighted', 'f1_weighted']

scores = cross_validate(estimator=model, X=X, y=y, cv=4, scoring="accuracy")

Train on 426 samples
Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100


Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78/100
Epoch 79/100
Epoch 80/100
Epoch 81/100
Epoch 82/100
Epoch 83/100
Epoch 84/100
Epoch 85/100
Epoch 86/100
Epoch 87/100
Epoch 88/100
Epoch 89/100
Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100
Train on 427 samples
Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100

Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100
Train on 427 samples
Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100


Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78/100
Epoch 79/100
Epoch 80/100
Epoch 81/100
Epoch 82/100
Epoch 83/100
Epoch 84/100
Epoch 85/100
Epoch 86/100
Epoch 87/100
Epoch 88/100
Epoch 89/100
Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100


In [68]:
# Valores obtidos para a accuracy atraves de cross validation
scores

{'fit_time': array([9.33485079, 9.43771601, 9.70452857, 8.64002442]),
 'score_time': array([0.05804253, 0.07506919, 0.05303812, 0.05113888]),
 'test_score': array([0.70629371, 0.80985915, 0.83098592, 0.75352113]),
 'train_score': array([0.85211268, 0.82669789, 0.88758782, 0.8501171 ])}

In [69]:
# accuracy média dos sub conjuntos de teste
np.mean(scores["test_score"])

0.7751649758692013

In [70]:
# desvio padrão obtido atraves dos valores da accuracy dos sub conjuntos de teste
# quanto maior este valor maior é a probabilidade de existir overfitting (o modelo não generaliza bem e adapta-se demasiado bem
# aos dados de treino, e quando se utilizam dados novos o modelo não se adapta bem)

np.std(scores["test_score"])

0.04881437118905278

## Overfitting(Dropout)

In [71]:
# underfitting - Ocorre da utilização de um algoritmo demasiado simplificado para o problema em analise. Obtem-se resultados
# maus no conjunto de dados de treino.
# overfitting - ocorre quando se utiliza um algoritmo demasiado complexo para o problema em analise. Obtem-se resultados bons
# no conjunto de treino e maus resultados no conjunto de dados de teste (o modelo adaptou-se bem demais/decorou o conjunto de
# dados de treino e não generaliza bem para conjuntos de dados novos).

# dropout - Ajuda a prevenir o overfitting(que em redes neurais tem grande probabilidade de acontecer devido aos muitos
# parametros que se utilizam).
# Coloca-se zeros em alguns valores/neuronios da camada de entrada de forma aleatoria. Escolhe-se a quantidade/percentagem de 
# neuronios que terão valor zero. Ao se colocar o valor zero estes neuronios não teram influencia no modelo. Normalmente 
# utiliza-se uma percentagem entre 20% a 30%. Se for demasiado elevado(maior que 50%) o modelo pode entrar em underfitting, 
# porque não consegue aprender, pois tem demasiadas entradas que não são consideradas.
# Como se utilizam menos variaveis é mais dificil haver alguma que não tenham sido treinada e que o modelo não consiga prever.

# https://stats.stackexchange.com/questions/299292/dropout-makes-performance-worse

### Criar o modelo com as camadas Dropout

In [72]:
### Criar o modelo de DNN numa função e com o dropout

# 1 - 20% dos neuronios da camada de entrada terão valor zero
# 2 - 20% dos neuronios da 1ª camada oculta terão valor zero

def model():
    model = models.Sequential()
    model.add(layers.Dense(units=16, activation="relu", kernel_initializer="random_uniform", input_dim=30))
    model.add(layers.Dropout(0.2)) 
    model.add(layers.Dense(units=16, activation="relu", kernel_initializer="random_uniform"))
    model.add(layers.Dropout(0.2)) 
    model.add(layers.Dense(units=1, activation="sigmoid"))
    
    optimizer = keras.optimizers.Adam(lr=0.001, decay=0.0001, clipvalue=0.5)
    model.compile(optimizer=optimizer, loss="binary_crossentropy", metrics=["binary_accuracy"])
    return model

In [73]:
model = KerasClassifier(build_fn=model, epochs=100, batch_size=10)

### Cross Validation

In [74]:
# cross validation

scoring = ['precision_weighted', 'recall_weighted', 'f1_weighted']

scores = cross_validate(estimator=model, X=X, y=y, cv=4, scoring="accuracy")

Train on 426 samples
Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100


Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78/100
Epoch 79/100
Epoch 80/100
Epoch 81/100
Epoch 82/100
Epoch 83/100
Epoch 84/100
Epoch 85/100
Epoch 86/100
Epoch 87/100
Epoch 88/100
Epoch 89/100
Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100
Train on 427 samples
Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100

Epoch 90/100
Epoch 91/100
Epoch 92/100
Epoch 93/100
Epoch 94/100
Epoch 95/100
Epoch 96/100
Epoch 97/100
Epoch 98/100
Epoch 99/100
Epoch 100/100
Train on 427 samples
Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100

In [75]:
# Valores obtidos para a accuracy atraves de cross validation
scores

{'fit_time': array([11.6330204 , 11.03969073, 10.57655263, 11.17863917]),
 'score_time': array([0.09374332, 0.09057546, 0.08735466, 0.10421395]),
 'test_score': array([0.67132867, 0.80985915, 0.88028169, 0.84507042]),
 'train_score': array([0.83333333, 0.91334895, 0.89929742, 0.91334895])}

In [76]:
# accuracy média dos sub conjuntos de teste
np.mean(scores["test_score"])

0.8016349847335762

In [77]:
# desvio padrão obtido atraves dos valores da accuracy dos sub conjuntos de teste
# o desvio padrão diminui com o uso do dropout, existe menos variabilidade nos resultados obtidos para o conjunto de teste
np.std(scores["test_score"])

0.07924536866124658

## Ajuste de parâmetros

In [78]:
from sklearn.model_selection import GridSearchCV

### Criar o modelo com as camadas Dropout e com vários valores para os parametros

In [85]:
### Criar o modelo de DNN numa função, com dropout e ajuste de parâmetros

def model(optimizer, loss, kernel_initializer, activation, neurons):
    model = models.Sequential()
    model.add(layers.Dense(units=neurons, activation=activation, kernel_initializer=kernel_initializer, input_dim=30))
    model.add(layers.Dropout(0.2)) 
    model.add(layers.Dense(units=neurons, activation=activation, kernel_initializer=kernel_initializer))
    model.add(layers.Dropout(0.2)) 
    model.add(layers.Dense(units=1, activation="sigmoid"))
    
    model.compile(optimizer=optimizer, loss=loss, metrics=["binary_accuracy"])
    return model

In [86]:
model = KerasClassifier(build_fn=model )

In [87]:
parametros = {'batch_size': [10, 30],
              'epochs': [50, 100],
              'optimizer': ['adam', 'sgd'],
              'loss': ['binary_crossentropy', 'hinge'],
              'kernel_initializer': ['random_uniform', 'normal'],
              'activation': ['relu', 'tanh'],
              'neurons': [16, 8]}

In [88]:
#  Construção da grelha
grid = GridSearchCV(estimator=model, param_grid=parametros, scoring="accuracy", cv=4, refit=True)

In [None]:
# Ajustar o modelo com os parametros escolhidos e para o conjunto de dados total
# Demora cerca de 8 horas a encontrar os melhores parametros
grid.fit(X,y)

Train on 426 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50


Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50


Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 426 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50


Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1

Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 426 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoc

Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoc

Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/

Epoch 50/50
Train on 426 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoc

Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 426 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50


Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoc

Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 426 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoc

Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch

Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/

Train on 426 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50
Train on 427 samples
Epoch 1/50
Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoc

Epoch 46/50
Epoch 47/50
Epoch 48/50
Epoch 49/50
Epoch 50/50


In [None]:
# Os melhores parametros para o modelo
grid.best_params_

In [None]:
# A melhor previsão é obtida com os seguintes hyperparâmetros
grid.best_estimator_

## Classificação de apenas 1 registro (Após o modelo estar pronto para produção)

### Criar o modelo final

In [238]:
# Modelo final
# 8 neurónios e kernel_initializer="normal" porque foram os parametros encontrados atraves da gridsearch que optimizam o modelo.

model = models.Sequential()
model.add(layers.Dense(units=8, activation="relu", kernel_initializer="normal", input_dim=30))
model.add(layers.Dropout(0.2)) 
model.add(layers.Dense(units=8, activation="relu", kernel_initializer="normal"))
model.add(layers.Dropout(0.2)) 
model.add(layers.Dense(units=1, activation="sigmoid"))     

### Compilação e Ajuste do modelo final

In [239]:
model.compile(optimizer="adam", loss="binary_crossentropy", metrics=["binary_accuracy"])

In [240]:
model.fit(X, y, epochs=100, batch_size=10)

Train on 569 samples
Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100


<tensorflow.python.keras.callbacks.History at 0x5f0cfffd30>

### Previsão com o modelo final

In [241]:
# novo entrada de dados para prever
data = np.array([[15.80, 8.34, 118, 900, 0.10, 0.26, 0.08, 0.134, 0.178,
                  0.20, 0.05, 1098, 0.87, 4500, 145.2, 0.005, 0.04, 0.05, 0.015,
                  0.03, 0.007, 23.15, 16.64, 178.5, 2018, 0.14, 0.185,
                  0.84, 158, 0.363]])

In [242]:
# previsão para os novos dados
prediction = model.predict(data)
prediction

array([[1.]], dtype=float32)

In [243]:
prediction = pred > 0.5
prediction

array([[ True]])

## Gravar a Rede Neural

In [244]:
# gravar a rede neural final(já treinada com os melhores parâmetros, pesos e estrutura) para não ser necessário fazer de novo 
# o treino. Assim já não é necessário fazer o treino quando se quer prever um novo registro.

### Criar o modelo final

In [245]:
# Modelo final
# 8 neurónios e kernel_initializer="normal" porque foram os parametros encontrados atraves da gridsearch que optimizam o modelo.

model = models.Sequential()
model.add(layers.Dense(units=8, activation="relu", kernel_initializer="normal", input_dim=30))
model.add(layers.Dropout(0.2)) 
model.add(layers.Dense(units=8, activation="relu", kernel_initializer="normal"))
model.add(layers.Dropout(0.2)) 
model.add(layers.Dense(units=1, activation="sigmoid"))  

### Compilação e Ajuste do modelo final

In [246]:
model.compile(optimizer="adam", loss="binary_crossentropy", metrics=["binary_accuracy"])

In [247]:
model.fit(X, y, epochs=100, batch_size=10)

Train on 569 samples
Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100


<tensorflow.python.keras.callbacks.History at 0x5f10624fd0>

### Gravar o modelo final

In [248]:
model_json = model.to_json()

In [249]:
# gravar o modelo no formato json
with open('model_breast.json', 'w') as json_file:
    json_file.write(model_json)

In [250]:
# Se o h5 não estiver instalado: pip install h5py
# gravar os pesos no formato h5
model.save_weights('weights_breast.h5')

In [251]:
# gravar o modelo no formato h5
model.save('model_breast.h5')

## Carregar o modelo guardado

In [252]:
from tensorflow.keras.models import model_from_json

In [253]:
# carregar o modelo guardado no formato json
arquivo = open('model_breast.json', 'r')
estrutura_rede = arquivo.read()
arquivo.close()

saveModel = model_from_json(estrutura_rede)

In [254]:
# carregar o modelo guardado no formato h5
#saveModel = models.load_model("model_breast.h5")

In [255]:
# carregar os pesos do modelo guardado
saveModel.load_weights("weights_breast.h5")

### Previsão com o modelo final guardado

In [256]:
# nova entrada de dados para prever
data = np.array([[15.80, 8.34, 118, 900, 0.10, 0.26, 0.08, 0.134, 0.178,
                  0.20, 0.05, 1098, 0.87, 4500, 145.2, 0.005, 0.04, 0.05, 0.015,
                  0.03, 0.007, 23.15, 16.64, 178.5, 2018, 0.14, 0.185,
                  0.84, 158, 0.363]])

In [257]:
# previsão para o novo registro de dados
saveModel.predict(data)

array([[0.9995981]], dtype=float32)

In [258]:
prediction = pred > 0.5
prediction

array([[ True]])

### Avaliação do modelo guardado

In [259]:
saveModel.compile(loss='binary_crossentropy', optimizer='adam', metrics=['binary_accuracy'])

In [260]:
saveModel.evaluate(X, y)



[0.17708493674890857, 0.9367311]