# Dataset

In [1]:
from sklearn.datasets import load_iris

# Carregando dataset de iris
dataset = load_iris()

# Guardando dados de entrada e as saídas desejadas para cada amostra de treinamento
treino = [(x, y) for x, y in zip(dataset.data[:130], dataset.target[:130])]

# Guardando dados de entrada e as saídas desejadas para cada amostra de teste
teste = [(x, y) for x, y in zip(dataset.data[130:], dataset.target[130:])]

# Parâmetros da rede neural

In [2]:
import random
import numpy as np

# Arquiteura da rede neural
n_entrada = 4                # número de entradas na camada de entrada
n_oculta = 20                  # número de neurônios na camada oculta
n_saida = 3                  # número de classes na camada de saídas
n_amostras = len(teste)     # número de amostras

# Ativação, propagação e compração dos resultados

In [3]:
class Network(object):
    def __init__(self, sizes):
        self.num_layers = len(sizes)   # número de camadas da rede
        self.sizes = sizes             # lista com o número de neurônios em cada camada
        
        self.biases = [np.random.randn(y, 1) for y in sizes[1:]] # lista de listas de bias
        self.weights = [np.random.randn(y, x) for x, y in zip(sizes[:-1], sizes[1:])] # lista de listas de pesos

    def training(self, training_data, method_auto, epochs, mini_batch_size, eta, test_data=None):
        training_data = list(training_data)
        n = len(training_data) # número de entradas de treinamento

        if test_data:
            test_data = list(test_data)
            n_test = len(test_data) # número de entradas de teste

        for j in range(epochs):
            random.shuffle(training_data) # embaralha os dados de treinamento
            mini_batches = [training_data[k:k+mini_batch_size] for k in range(0, n, mini_batch_size)] # divide os dados de treinamento em mini lotes
            
            if method_auto == "sgd":
                for mini_batch in mini_batches:
                    self.update_sgd(mini_batch, eta)
            elif method_auto == "pso":
                for mini_batch in mini_batches:
                    self.update_pso(mini_batch)
                    break
            
            if test_data:
                print("Epoch {} : {} / {}".format(j,self.evaluate(test_data),n_test));
            else:
                print("Epoch {} finalizada".format(j))
    
    def update_sgd(self, mini_batch, eta):
        nabla_b = [np.zeros(b.shape) for b in self.biases]
        nabla_w = [np.zeros(w.shape) for w in self.weights]
        
        for x, y in mini_batch:
            delta_nabla_b, delta_nabla_w = self.backprop(x, y) # calcula o gradiente
            nabla_b = [nb+dnb for nb, dnb in zip(nabla_b, delta_nabla_b)]
            nabla_w = [nw+dnw for nw, dnw in zip(nabla_w, delta_nabla_w)] 
        
        self.weights = [w-(eta/len(mini_batch))*nw for w, nw in zip(self.weights, nabla_w)]
        self.biases = [b-(eta/len(mini_batch))*nb for b, nb in zip(self.biases, nabla_b)]

    def backprop(self, x, y):
        nabla_b = [np.zeros(b.shape) for b in self.biases]
        nabla_w = [np.zeros(w.shape) for w in self.weights]

         # Feedforward
        activation = x

        # Lista para armazenar todas as ativações, camada por camada
        activations = [x] 

        # Lista para armazenar todos os vetores z, camada por camada
        zs = [] 

        for b, w in zip(self.biases, self.weights):
            z = np.dot(w, activation)+b
            zs.append(z)
            activation = sigmoid(z)
            activations.append(activation)
        
        # Backward pass
        delta = self.cost_derivative(activations[-1], y) * sigmoid_prime(zs[-1])
        nabla_b[-1] = delta
        nabla_w[-1] = np.dot(delta, activations[-2].transpose())
        
        # Aqui, l = 1 significa a última camada de neurônios, l = 2 é a segunda e assim por diante. 
        for l in range(2, self.num_layers):
            z = zs[-l]
            sp = sigmoid_prime(z)
            delta = np.dot(self.weights[-l+1].transpose(), delta) * sp
            nabla_b[-l] = delta
            nabla_w[-l] = np.dot(delta, activations[-l-1].transpose())
        return (nabla_b, nabla_w)
    
    def cost_derivative(self, output_activations, y):
        """Retorna o vetor das derivadas parciais."""
        return (output_activations-y)

    def evaluate(self, test_data):
        test_results = [(np.argmax(self.feedforward(x)), y) for (x, y) in test_data]
        return sum(int(x == y) for (x, y) in test_results)

    def feedforward(self, a):
        for b, w in zip(self.biases, self.weights):
            a = sigmoid(np.dot(w, a)+b) # ativação da camada com função sigmoid
        return a

In [4]:
# Função de Ativação Sigmóide
def sigmoid(z):
    return 1.0/(1.0+np.exp(-z))

# Função para retornar as derivadas da função Sigmóide
def sigmoid_prime(z):
    return sigmoid(z)*(1-sigmoid(z))

# Execução do treinamento

In [5]:
net = Network([4, 20, 3])
net.training(treino,'sgd', 30, 10, 3.0, test_data=teste)

ValueError: shapes (20,20) and (4,) not aligned: 20 (dim 1) != 4 (dim 0)

# Resultado do treinamento

In [None]:
print("Valor ótimo de minização: ", custo)
print("Pesos otimizados da camada oculta:\n", posicao[:80])
print("Bias otimizados da camada oculta:\n", posicao[80:100])
print("Pesos otimizados da camada de saída:\n", posicao[100:160])
print("Bias otimizados da camada de saída:\n", posicao[160:])

# Avaliação do treinamento e do teste

In [None]:
# Acurácia do treino
print("Acurácia de treino: ", (np.mean(avaliacao(posicao) == y_desejado) * 100))

# Execução e avaliação do teste

In [None]:
# Acurácia do teste
print("Acurácia de teste: ", (np.mean(avaliacao(posicao) == y_desejado) * 100))