# Melhorias na Rede Neural Breast Cancer
#### Implementando algumas melhorias na rede neural criada para obter uma acurácia maior que 90.0%.

### Importando as Bibliotecas Necessárias 

In [1]:
# importando as bibliotecas do python necessárias para construção e análise da rede neural

import pandas as pd
import numpy as np
import keras
from keras.models import Sequential
from keras.layers import Dense, Dropout
from keras.wrappers.scikit_learn import KerasClassifier
from sklearn.model_selection import cross_val_score

Using TensorFlow backend.


### Separando os Atributos Previsores e Meta

In [2]:
# separando os atributos previsores e meta do dataframe
previsores = pd.read_csv('entradas_breast.csv', encoding = 'utf-8', sep = ',')
classe = pd.read_csv('saidas_breast.csv', encoding = 'utf-8', sep = ',')

### Configurando a Rede Neural

In [3]:
# criando a rede neural artificial
def neural_network_config():

  # criando o objeto 'classificador'
  classificador = Sequential()
  # adicionando a primeira rede oculta
  classificador.add(Dense(units = 32, activation = 'relu', 
                          kernel_initializer = 'normal', input_dim = 30))
  # configurando um dropout de 20% nos neurônios que passam da primeira para a segunda camada oculta
  classificador.add(Dropout(0.20))
  # adicionando uma segunda rede oculta
  classificador.add(Dense(units = 16, activation = 'relu', 
                          kernel_initializer = 'normal'))
  # configurando um dropout de 20% nos neurônios que passam da segunda camada oculta para a camada de saída
  classificador.add(Dropout(0.15))
  classificador.add(Dense(units = 8, activation = 'relu', 
                          kernel_initializer = 'normal'))
  # adicionando uma rede de saída
  classificador.add(Dense(units = 1, activation = 'sigmoid'))
  # configurando a função de otimização no ajuste de pesos 'adam'
  otimizador = keras.optimizers.Adam(lr = 0.001, decay = 0.0001, clipvalue = 0.5)
  # ajustando mais parâmetros da rede neural artificial
  classificador.compile(optimizer = otimizador, loss = 'binary_crossentropy', metrics = ['binary_accuracy'])

  # função retorna o classificador configurado
  return classificador

In [4]:
# configurando os parâmetros finais de treinamento da rede neural
classificador = KerasClassifier(build_fn = neural_network_config, epochs = 500, batch_size = 10)

### Validação Cruzada

In [5]:
# adicionando a lista resultados os testes usando a validação cruzada
# será particionado a base de dados 10 vezes
resultados = cross_val_score(estimator = classificador, X = previsores, y = classe, cv = 10,
                             scoring = 'accuracy')

[1;30;43mA saída de streaming foi truncada nas últimas 5000 linhas.[0m
Epoch 2/500
Epoch 3/500
Epoch 4/500
Epoch 5/500
Epoch 6/500
Epoch 7/500
Epoch 8/500
Epoch 9/500
Epoch 10/500
Epoch 11/500
Epoch 12/500
Epoch 13/500
Epoch 14/500
Epoch 15/500
Epoch 16/500
Epoch 17/500
Epoch 18/500
Epoch 19/500
Epoch 20/500
Epoch 21/500
Epoch 22/500
Epoch 23/500
Epoch 24/500
Epoch 25/500
Epoch 26/500
Epoch 27/500
Epoch 28/500
Epoch 29/500
Epoch 30/500
Epoch 31/500
Epoch 32/500
Epoch 33/500
Epoch 34/500
Epoch 35/500
Epoch 36/500
Epoch 37/500
Epoch 38/500
Epoch 39/500
Epoch 40/500
Epoch 41/500
Epoch 42/500
Epoch 43/500
Epoch 44/500
Epoch 45/500
Epoch 46/500
Epoch 47/500
Epoch 48/500
Epoch 49/500
Epoch 50/500
Epoch 51/500
Epoch 52/500
Epoch 53/500
Epoch 54/500
Epoch 55/500
Epoch 56/500
Epoch 57/500
Epoch 58/500
Epoch 59/500
Epoch 60/500
Epoch 61/500
Epoch 62/500
Epoch 63/500
Epoch 64/500
Epoch 65/500
Epoch 66/500
Epoch 67/500
Epoch 68/500
Epoch 69/500
Epoch 70/500
Epoch 71/500
Epoch 72/500
Epoch 73/500

In [6]:
# visualizando os resultados obtidos com a validação cruzada
print(resultados)

[0.80701754 0.89473684 0.94736842 0.8245614  0.92982456 0.87719298
 0.96491228 0.96491228 0.87719298 0.94642857]


Observe que para diferentes particionamentos da base de daods é obtido uma acurácia diferente. Desse modo, o valor médio desses valores tende a indicar uma acurácia mais real do que seria com mais e mais dados a serem usados para classificação.

In [7]:
# obtendo o resultado médio dos testes feitos usando validação cruzada
media = resultados.mean()
print(media)

0.9034147869674184


A acurácia precisa desse algoritmo é 90.34%. Esse valor é o mais real que podemos obter. Para analisar se os dados estão configurados na rede neural artificial de forma consistente, é necessário analisar o desvio padrão entre os dados.

> Observe como o dropout melhorou a qualidade do algoritmo. 

In [8]:
# obtendo o desvio padrão dos resultados obtidos na validação cruzada
desvio = resultados.std()
print(desvio)

0.053855570382535724


Como o desvio entre os valores médios das bases de dados é baixo, descartamos a ocorrência de overfitting na base de dados.


### Alguma Dúvida? Entre em Contato Comigo:

- [Me envie um e-mail](mailto:alysson.barbosa@ee.ufcg.edu.br);