# Rede Neural Artificial com Numpy

Este notebook demonstra como implementar uma rede neural usando apenas o numpy.

## Importar Numpy

In [1]:
import numpy as np
from numpy.random import randn

## Definir os dados de entrada

In [2]:
# Quantidade de exemplos no conjunto de dados
exemplos = 100

# Quantidade de atributos
atributos = 1000

# Quantidade de classes
classes = 10

# Definir o dataset (Dados aleatórios)
X_train, Y_train = randn(exemplos, atributos), randn(exemplos, classes)

## Definir a configuração da RNA (Rede Neural Artificial)

In [3]:
# A dimensão da camada entrada possui tamanho fixo, é a quantidade de atributos no conjunto de dados
D_entrada = atributos

# A dimensão e a quantidade de camadas ocultas possui tamanho variavel
# Para nosso exemplo, utilizaremos uma única camada oculta que possui tamanho 100
D_oculta = 100

# A dimensão da camada de saida também possui tamanho fixo, é a quantidade de classes no conjunto de dados
D_saida = classes

## Inicializar os pesos
É importante inicializar os pesos aleatoriamente, caso contrario, os neurônios da rede não aprenderão diferentes características

In [4]:
# Pesos entre a camada de entrada e camada oculta
w1 = randn(D_entrada, D_oculta)

# Pesos entre a camada oculta e camada de saida
w2 = randn(D_oculta, D_saida)

## Treinamento da rede

### Definir os parametros de treinamento

In [5]:
# Controla quantas iterações serão realizadas na RNA
quantidade_iteracoes = 100

# Taxa de Aprendizado (Learning Rate)
taxa_aprendizado = 2e-4

### Treinar a Rede
Durante o treinamento (cada iteração) a rede neural executa dois passos, o feedfoward e o backpropagation.

Durante o feedforward a rede neural gera uma hipótese de equação, definindo os pesos entre as camadas, que melhor se adequa aos dados.

Logo em seguida, é calculado o erro (custo) desta hipótese.

Após o calculo do erro, entra em cena o backpropagation que ajusta o peso dos deunônios entre as camadas.

Perceba que a cada iteração o erro diminui.

O interessante, é que mesmo com dados aleatórios, a rede neural consegue aprender

In [6]:
print('Iteração\t Erro')
for t in range(quantidade_iteracoes):
    
    # FeedFoward
    h = 1 / (1 + np.exp(-X_train.dot(w1))) # Função sigmoid logística
    Y_Pred = h.dot(w2)
    loss = np.square(Y_Pred-Y_train).sum() # Calculo do custo (norma L2)
    print(t,'\t\t',loss)
    
    # Backpropagation
    grad_y_pred = 2.0 * (Y_Pred-Y_train) # Derivada da L2
    grad_w2 = h.T.dot(grad_y_pred)
    grad_h = grad_y_pred.dot(w2.T)
    grad_w1 = X_train.T.dot(grad_h*h*(1-h))
    
    # Atualiza os pesos
    w1 -= taxa_aprendizado * grad_w1
    w2 -= taxa_aprendizado * grad_w2

Iteração	 Erro
0 		 61235.8121694
1 		 21413.0263181
2 		 18377.9978786
3 		 16703.6894912
4 		 15345.4411748
5 		 14241.2561589
6 		 13355.7314454
7 		 12570.6888948
8 		 11855.8589657
9 		 11232.6203252
10 		 10661.8772904
11 		 10098.792167
12 		 9586.49103472
13 		 9140.69166451
14 		 8761.82256029
15 		 8391.87511067
16 		 8037.31693974
17 		 7733.98037797
18 		 7449.19567106
19 		 7183.37203885
20 		 6921.13488858
21 		 6684.92280154
22 		 6465.29110667
23 		 6265.90498658
24 		 6080.00432082
25 		 5907.20145509
26 		 5742.48887607
27 		 5583.17990296
28 		 5432.06044095
29 		 5288.339027
30 		 5150.53900033
31 		 5021.17281188
32 		 4899.04417325
33 		 4781.22288398
34 		 4667.38908389
35 		 4557.48374494
36 		 4450.05898084
37 		 4342.97120973
38 		 4235.829008
39 		 4133.84201203
40 		 4036.38946325
41 		 3941.19037464
42 		 3847.95802957
43 		 3756.20449662
44 		 3665.90575065
45 		 3578.47265024
46 		 3493.68870293
47 		 3413.70050438
48 		 3335.6204352
49 		 3260.58630127
5