# Redes Neurais

## Backpropagation 

In [1]:
import numpy as np
np.set_printoptions(suppress=True, precision=5)
import math

In [2]:
# Função de ativação Sigmoid
def sigmoid(x):     
    return 1 /(1+(math.e**-x))

# Função derivada da função Sigmoid (para cálculo do gradiente)
def deriv_sigmoid(y):
    return y * (1.0 - y)   

In [3]:
# Learning rate
alpha = .1   

In [4]:
# Gerando dados aleatórios para x e y
# X será o dataset com 3 features (3 atributos)
X = np.array([  [.35,.21,.33],
                [.2,.4,.3],
                [.4,.34,.5],
                [.18,.21,16] ])                

y = np.array([[0],
        [1],
        [1],
        [0]])

In [5]:
# Inicializando randomicamente os vetores de pesos (serão criadas 2 camadas ocultas)
np.random.seed(1)
theta0 = 2*np.random.random((3,4)) - 1
theta1 = 2*np.random.random((4,1)) - 1

In [6]:
theta0

array([[-0.16596,  0.44065, -0.99977, -0.39533],
       [-0.70649, -0.81532, -0.62748, -0.30888],
       [-0.20647,  0.07763, -0.16161,  0.37044]])

In [7]:
theta1

array([[-0.5911 ],
       [ 0.75623],
       [-0.94522],
       [ 0.34094]])

### Passos Realizados pelo Backpropagation

1- Feedforward pass: Inicializamos aleatoriamente os vetores de peso e multiplicamos a entrada com os vetores de peso subsequentes em direção a uma saída final.

2- Cálculo do erro: Calculamos o erro / perda da saída do passo de feedforward.

3- Backpropagation para a última camada oculta (em relação à saída): Calculamos o gradiente desse erro e alteramos os pesos para a direção do gradiente. Fazemos isso multiplicando o vetor de pesos pelos gradientes calculados.

4- Atualiza os pesos até o critério de parada ser atingido (erro mínimo ou número de rodadas de treinamento).

In [8]:
import sys
# Loop for para percorrer a rede neural
# O valor 205000 especifica a quantidade de rounds de treinamento
for iter in range(205000): 
    # Etapa 1: Feedforward 
    input_layer = X
    l1 = sigmoid(np.dot(X, theta0)) # camada 1
    l2 = sigmoid(np.dot(l1,theta1))           # camada 2

    # Etapa 2: Calculando o erro 
    l2_error = y - l2
    
    if (iter% 1000) == 0:
        sys.stderr.write("\rAcurácia da Rede Neural: " + str(np.mean(1-(np.abs(l2_error)))))
        #print ("Acurácia da Rede Neural: " + str(np.mean(1-(np.abs(l2_error)))))
        sys.stderr.flush()
        
    # Etapa 3: Calculando os gradientes de forma vetorizada 
    l2_delta = alpha * (l2_error * deriv_sigmoid(l2)) # alfa = taxa de aprendizagem
    l1_error = l2_delta.dot(theta1.T)
    l1_delta = alpha * (l1_error * deriv_sigmoid(l1))

    # Etapa 4 - Atualiza os vetores de pesos
    theta1 = theta1 + l1.T.dot(l2_delta)
    theta0 = theta0 + X.T.dot(l1_delta)
    
print ("Acurácia Final da Rede Neural: " + str(np.mean(1-(np.abs(l2_error)))))

Acurácia da Rede Neural: 0.98413481991940856

Acurácia Final da Rede Neural: 0.9841874369972228


---