<a href="https://colab.research.google.com/github/EddyGiusepe/Multilayer_Perceptron_MLP_cancer_de_mama/blob/main/Multilayer_Perceptron_(MLP)_cancer_de_mama.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Redes Neurais - Previsão de Câncer de Mama (Benigno/Maligno)


Tipos de [Redes Neurais](https://towardsdatascience.com/the-mostly-complete-chart-of-neural-networks-explained-3fb6f2367464)

![alt text](https://miro.medium.com/max/1250/1*cuTSPlTq0a_327iTPJyD-Q.png)

# Multilayer Perceptron (MLP)

Este é um exemplo que pode ser encontrado [aqui também](https://www.youtube.com/watch?v=YH0HuJd-nj8)

\\

https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html


As Redes Neurais são uma estrutura de aprendizado d máquina que tenta imitar o padrão de aprendizagem de redes neurais biológicas naturais. As redes neurais biológicas têm neurônios interconectados com dendritos que recebem entradas, e com base nessas entradas eles produzem um sinal de saída através de um axônio para outro neurônio. Vamos tentar imitar esse processo através do uso de Redes Neurais Artificiais (RNAs), que apenas nos referiremos como redes neurais a partir de agora. O processo de criação de uma rede neural começa com a forma mais básica, um único ``perceptron``.   


Vamos começar nossa discussão falando sobre o Perceptron! 

Um Perceptron tem uma ou mais entradas, um viés (bias), uma função de ativação e uma única saída. O Perceptron recebe entradas, multiplica essas entradas por algum peso e passa-as para uma função de ativação para produzir uma saída. Há muitas funções de ativação possíveis tais como a função logística, uma função trigonométrica, uma função de step, etc. Também nos certificamos de adicionar um viés para o Perceptron, isso evita problemas onde todas as entradas poderiam ser iguais a zero (significado Nenhum peso multiplicativo teria um efeito). A seguir mostramos um Perceptron: 

![alt text](https://www.kdnuggets.com/wp-content/uploads/perceptron.jpg)

Uma vez que temos a saída podemos compará-lo com um rótulo conhecido e ajustar os pesos de acordo (os pesos normalmente começam com valores de inicialização aleatórios). Continuamos a repetir este processo até termos atingido um número máximo de iterações permitidas ou uma taxa de erro aceitável.


Para criar uma rede neural, simplesmente começamos a adiconar camadas de Perceptrons juntos, criando um modelo de Perceptron multicamada de uma rede neural. Você terá uma camada de entrada que recebe diretamente suas entradas de atributos e uma camada de saída que criará as saídas resultantes. Quaisquer camadas intermediárias são conhecidas como camadas ocultas porque elas não "veem" diretamente as entradas ou saídas do atributo. 



![alt text](https://learnopencv.com/wp-content/uploads/2017/10/mlp-diagram.jpg)

In [3]:
from sklearn.datasets import load_breast_cancer # Nossos Dados
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler # Normalizar, padronizar (melhor desempenho de nosso modelo)


In [4]:
# Objeto = cancer
cancer = load_breast_cancer()

# Nossos Dados está no formato de dicionário

In [5]:
cancer.keys()

dict_keys(['data', 'target', 'target_names', 'DESCR', 'feature_names', 'filename'])

In [6]:
# Descrição completa do dataset 
print(cancer['DESCR'])


.. _breast_cancer_dataset:

Breast cancer wisconsin (diagnostic) dataset
--------------------------------------------

**Data Set Characteristics:**

    :Number of Instances: 569

    :Number of Attributes: 30 numeric, predictive attributes and the class

    :Attribute Information:
        - radius (mean of distances from center to points on the perimeter)
        - texture (standard deviation of gray-scale values)
        - perimeter
        - area
        - smoothness (local variation in radius lengths)
        - compactness (perimeter^2 / area - 1.0)
        - concavity (severity of concave portions of the contour)
        - concave points (number of concave portions of the contour)
        - symmetry 
        - fractal dimension ("coastline approximation" - 1)

        The mean, standard error, and "worst" or largest (mean of the three
        largest values) of these features were computed for each image,
        resulting in 30 features.  For instance, field 3 is Mean Radius, f

In [7]:
cancer['data'].shape

(569, 30)

In [9]:

x = cancer['data']
y = cancer['target']

In [10]:
x_train, x_test, y_train, y_test = train_test_split(x, y)

## Pre-processamento

A rede neural pode ter dificuldade em convergir antes do número máximo de iterações permitidas se os Dados não forem normalizados. O Perceptron de várias camadas é sensível ao dimensionamento dos atributos, por isso é altamente recomendável escalar (padronizar) nossos Dados. Para a normalização dos Dados, vamos usar o ``built-in StandardScaler`` para a padronização. 


In [11]:
# Padronização

scaler = StandardScaler()
scaler.fit(x_train)


StandardScaler(copy=True, with_mean=True, with_std=True)

In [12]:
# Aplicando a padronização aos Dados 

x_train = scaler.transform(x_train)
x_test = scaler.transform(x_test)


## Treinamento do Modelo

Agora treinamos nosso modelo. O ``Scikit Learn`` torna isso incrivelmente fácil, usando objetos estimadores.

nosso estimador (o modelo Multi-Layer Perceptron Classifier) da biblioteca neural_network so Scikit-Learn!

In [13]:
from sklearn.neural_network import MLPClassifier

Em seguida, criamos uma instância do modelo, há uma série de parâmetros que você pode escolher para definir e personalizar, aqui vamos definir apenas o ``hidden_layer_sizes``. Para este parâmetro você passa um tupla que consiste no número de neurônios que você quer em cada camada, onde a entrada n-ésima na tupla representa o número de neurônios na n-ésima camada do modelo **MLP**. Há muitas maneiras de escolher esses números, mas, por simplicidade, escolheremos três camadas com o mesmo número de neurônios que existem no nosso conjunto de Dados:  

In [14]:
# Aqui temos três camadas cada uma com 30 neurônios

mlp = MLPClassifier(hidden_layer_sizes=(30, 30, 30))

Agora que o modelo foi feito podemos ajustar os Dados de treinamento para o nosso modelo, lembre-se que esses dados ...  processados e dimensionados:

In [15]:
mlp.fit(x_train, y_train)

# Aqui veremos no resultado outros HIPERPARÂMETROS 

MLPClassifier(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
              beta_2=0.999, early_stopping=False, epsilon=1e-08,
              hidden_layer_sizes=(30, 30, 30), learning_rate='constant',
              learning_rate_init=0.001, max_fun=15000, max_iter=200,
              momentum=0.9, n_iter_no_change=10, nesterovs_momentum=True,
              power_t=0.5, random_state=None, shuffle=True, solver='adam',
              tol=0.0001, validation_fraction=0.1, verbose=False,
              warm_start=False)

Você pode ver a saída que mostra os valores padrão dos outros parâmetros no modelo. Eu encorajo você a brincar com eles e descobrir quais os efeitos que eles têm em seu modelo! Simbora? Testa outros valores aí ... ok?

## Previsões e avaliação

In [16]:
predictions = mlp.predict(x_test)

Agora podemos usar as métricas construídas pelo ``Scikit-Learn``, como um relatório de classificação e uma matriz de confusão, para avaliar o desempenho do nosso modelo:

In [19]:
 from sklearn.metrics import classification_report, confusion_matrix

In [20]:
print("Matriz de confusão:")
print(confusion_matrix(y_test, predictions))


Matriz de confusão:
[[47  0]
 [ 4 92]]


Parece que somente $4$ tumores foram classificados de forma incorreta, deixando-nos com uma taxa de $98\%$ de precisão. Isso é muito bom considerando as poucas linhas de código que tivemos de escrever. A desvantagem entretanto em usar um modelo ``Multi-layer Perceptron`` é como difícil é interpretar o próprio modelo. Os pesos e vieses não serão facilmente interpretáveis em relaçãoa quais características são importantes para o próprio modelo.


No entanto, se você quiser extrair os pesos e viés (bias) do MLP após o treinamento do seu modelo, você usa seus atributos públicos ``coefs_`` e ``intercepts_``.