# Redes Neurais Artificiais

Uma **Rede Neural Artificial** é um sistema computacional que opera de maneira diferente dos sistemas tradicionais. Seu funcionamento consiste em um conjunto de **neurônios**, que são uma unidade básica que possui **entradas**, **armazenamento** e **saída**, em conjuntamente com um grupo de **pesos** para as entradas.


Figura: Diagrama simplificado de uma rede neural 
![rede_neural_diagrama](https://upload.wikimedia.org/wikipedia/commons/3/3c/Neuralnetwork.png)
Fonte: [Wikipedia - Rede neural artificial](https://pt.wikipedia.org/wiki/Rede_neural_artificial)



Cada *coluna* de neurônios é chamada de **camada**, e uma rede neural pode possuir uma ou mais camadas e a quantidade de neurônios por camada também pode ser variada.

A primeira camada é composta pela **camada de entrada** (*input layer*), enquanto a última camada é a **camada de saída** (*output layer*). As demais camadas intermediárias são chamada de **camadas ocultas** (*hidden layers*).

## Bibliotecas

```py
import numpy as np
import pandas as pd
import os
#Obter dia e hora
from datetime import datetime
#Manipulação de imagens
#from PIL import Image
#Mostrar imagens
from matplotlib.pyplot import imshow
#Permite visualizar as imagens no próprio Jupyter Notebook
%matplotlib inline
```

## Carregando base de dados

Utilizaremos o conjunto de imagens disponível na base de dados [MNIST](http://yann.lecun.com/exdb/mnist/). Consiste em um conjunto de imagens, já padronizadas e rotuladas. Cada imagem possui o tamanho de 28x28 pixels.

```py
print(os.listdir('entrada/'))
```

```py
print('Carregando base de dados...')
loadInicio=datetime.now()
df = pd.read_csv('entrada/train.csv')
loadFim=datetime.now()
print('Tempo para carregar:', loadFim-loadInicio)
```

## Observando a base de dados
**Código**
```py
print(df.info())
```

**Código**
```py
df.head()
```

## Obtendo uma amostra

O código abaixo obtém uma amostra da base de dados e mostra-o como imagem.  
**Código**
```py
amostra = df.sample(1)
rotulo = amostra.iloc[0,0]
imagem = amostra.iloc[:,1:].values.reshape(28,28)
print('Rótulo:', rotulo)
imshow(imagem, cmap='gray')
```

## Normalizando os dados

A normalização de dados consiste em colocar os valores em uma mesma escala. Uma prática comum é definir em 0 o valor mínimo e 1 o valor máximo, definindo os demais valores de maneira proporcional, dentro desta escala.

Para o caso atual, basta apenas dividir todos os valores por 255.
```py
df.iloc[:,1:] /= 255
```

## Separando dados para a rede


x: rótulos das imagens  
y: pixels das imagens  
**Código**
```py
x = df.iloc[:,1:]
y = df.iloc[:,:1]
```

## Dividindo os dados em treino e teste
- treino: 80% dos dados
- teste : 20% dos dados

Código:
```py
from math import ceil

n = x.shape[0]
n_train = ceil(0.8 * n)
n_test = ceil(0.2 * n)

x_train = x[:n_train]
y_train = y[:n_train]

x_test = x[n_train:]
y_test = y[n_train:]

y_train = np.squeeze(y_train)
y_test = np.squeeze(y_test)
```

## Criando a rede

Todos os parâmetros podem ser consultados na [API](https://scikit-learn.org/stable/modules/generated/sklearn.neural_network.MLPClassifier.html) do MLPClassifier.

```py
from sklearn.neural_network import MLPClassifier

mlp_model = MLPClassifier(solver='adam', 
                         hidden_layer_sizes=(1024, 128), 
                         verbose=True,)

print(mlp_model)
```

## Treinando a rede

Treinar a rede consiste em definir quais serão os pesos associados a cada neurônio, que será considerado como entrada para a camada seguinte. Este processo demanda quantidade de processamento.  
**Código**
```py
print('Treinando a rede...')
treinoInicio=datetime.now()
mlp_model.fit(x_train, y_train)
treinoFim=datetime.now()
print('Tempo de treino:',treinoFim-treinoInicio)
```

## Testando a rede

O teste da rede consiste prever os rótulos para os valores separados da base de dados para teste.
```py
pred_mlp =  mlp_model.predict(x_test)
```

## Cálculo da taxa de erro

A taxa de erro é calculada com base na quantidade de acertos 

**Código**
```py
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
from sklearn import metrics

print("Calculando o erro")
print('Erro absoluto médio:', metrics.mean_absolute_error(y_test, pred_mlp))  

```

<!---
```py
from sklearn.metrics import classification_report, confusion_matrix, accuracy_score
from sklearn import metrics

print("Calculando o erro")
print('Erro absoluto médio:', metrics.mean_absolute_error(y_test, pred_mlp))  
print('Erro quadrático médio:', metrics.mean_squared_error(y_test, pred_mlp))  
print('Raiz do erro quadrático médio:', np.sqrt(metrics.mean_squared_error(y_test, pred_mlp))) 
```
--->

## Exercícios

**Exercício**  
Repita a criação, treinamento e teste da rede sem executar a normalização, e observe cada item abaixo, comparando-os com os dados da execução com dados normalizados:
- O número de iterações necessárias para a criação da rede
- O tempo necessário para criar a rede
- O tempo necessário para testar a rede
- A taxa de erro

**Exercício**  
Repita a criação, treinamento e teste da rede, observando a atividade do processador.  

Observe o uso das diversas unidades de processamento nos seguintes passos:
- Normalização dos dados
- Treinamento da rede.
    
O quê pode-se concluir com isso?

**Exercício**  
Repita a criação da rede, incluindo o seguinte parâmetro:
```py
tol=0.00001
```
Treine novamente a rede, e observe:
- Número de iterações
- Tempo de treinamento

O quê pode-se concluir?

**Exercício**  
Repita a criação da rede, modificando o parâmetro `tol`, para o seguintes valores:
```py
tol=0.1
tol=0.01
tol=0.001
tol=0.0001
tol=0.00001
tol=0.000001
tol=0.0000001
tol=0.00000001
tol=0.000000001
```


Para cada valor, observe:
- Número de iterações
- Valor 'loss' a cada iteração
- Tempo de treinamento da rede
- Taxa de erro

**Exercício**  
Elabore gráficos, abordando:
- A relação entre o valor de `tol` e a taxa de erro;
- A relação entre o valor de `tol` e o tempo necessário para o treinamento da rede.

**Exercício**  
Pesquise o que significam os termos *underfitting* e *overfitting*, no contexto de aprendizagem de máquina.

**Exercício**  
Utilizando um aplicativo de edição de imagens, como o Gimp p.ex., desenhe um número em uma imagem e em seguida utilize esse número como entrada para a rede neural.  

**Orientações**  
- Crie uma nova imagem, de tamanho quadrado (500x500 px, p.ex)
- Escreva o número
- Redimensione a imagem para 28x28 px
- Caso necessário, inverta as cores. Fundo preto e escrita branca.
- Converta imagem para o formato de entrada da rede.
- Teste a rede e observe o resultado, se o valor informado pela rede realmente corresponde ao valor escrito.

## Referências


[LEPSEN, L. Rede Neural para classificar dígitos manuscritos com Python e sklearn. Data hackers, 2019](https://medium.com/data-hackers/rede-neural-para-classificar-d%C3%ADgitos-manuscritos-com-python-e-sklearn-84421e45b4fa)

[The MNIST database](http://yann.lecun.com/exdb/mnist/)

[Kaggle. Learn computer vision fundamentals with the famous MNIST data. Kaggle, 2012](https://www.kaggle.com/c/digit-recognizer/data)

