# Trabalho - Redes Neurais Artificiais

## Método adotado: Backpropagation

### Rafael Maia e Luís Silva

## Importação das bibliotecas necessárias

In [4]:
import matplotlib.pyplot as plt
from keras.datasets import mnist
import numpy as np
import operator

## Criação do modelo

In [5]:
class BP_Model:
    maxAcuracia = 0 
    def __init__(self, tamEntrada, tamCamadaEscondida, tamSaida, rate=0.1):
        self.dEntrada = tamEntrada
        self.dCamadaEscondida = tamCamadaEscondida
        self.dSaida = tamSaida
        self.wInH = np.random.rand(self.dEntrada, self.dCamadaEscondida)*0.2-0.1
        self.wOutH = np.random.rand(self.dCamadaEscondida, self.dSaida)*0.2-0.1
        self.delta_InH = np.zeros(self.dCamadaEscondida)
        self.delta_OutH = np.zeros(self.dSaida)
        self.learning_rate = rate
        self.custo = 0

    def forward(self, sample):
        ativCamadaOculta = self.tanh(np.dot(sample, self.wInH))
        activCamadaSaida = self.sigmoid(np.dot(ativCamadaOculta, self.wOutH))
        return ativCamadaOculta, activCamadaSaida

    def auxAcao(self, x, y):
        saida = self.forward(x)[1]
        return np.sum((np.array(saida) - np.array(y))**2)*0.5, np.array(saida)-np.array(y)

    def Acao(self, x, y):
        val = 0.
        vec = np.zeros(self.dSaida)
        for i in range(len(x)):
            temp = self.auxAcao(x[i],y[i])
            val += temp[0]
            vec += temp[1]
        return val, vec

    def auxBP(self, x, y):
        custo, custo_vec = self.auxAcao(x, y)
        activHidden, activSaida = self.forward(x)
        deltaSaida = custo_vec * activSaida * (1-activSaida)
        deltaH = np.dot(self.wOutH, deltaSaida) * (1-activHidden**2)
        self.wOutH -= self.learning_rate*deltaSaida*activHidden[:,np.newaxis]
        self.wInH -= self.learning_rate * deltaH * np.array(x)[:,np.newaxis]
        return self.wOutH, self.wInH, custo

    def BP(self, x, y):
        self.custo = 0
        tam = np.arange(len(x))
        np.random.shuffle(tam)
        for i in tam[:100]:
            wOutH, wInH, cost = self.auxBP(x[i], y[i])
            self.custo += cost
        self.custo /= len(x)
        return self.custo

    def Treinamento(self, x, y, x_Teste, y_Teste, epoca=100, print_cost=True):
        for i in range(epoca):
            self.Teste(x_Teste, y_Teste, print_cost)
            self.BP(x, y)
            if print_cost:
                print('Epoca: {}'.format(i+1))
                print('Custo: {}'.format(self.custo))
                print("/-----------------------------------------------/")


    def Teste(self, x, y,print_acuracia=True):
        acuracia = 0
        submission = open("submission.txt","w")
        cont = 1
        for i in range(len(x)):
            saida = self.forward(x[i])[1]
            index, _ = max(enumerate(saida), key = operator.itemgetter(1))
            conteudo = "\n"+str(cont)+","+str(index)
            submission.write(conteudo)
            cont += 1
            if y[i][index] == 1:
                acuracia += 1 
            if acuracia / len(x) > self.maxAcuracia:
                self.maxAcuracia = acuracia / len(x)
        if print_acuracia:
            print('Acuracia: {}'.format(acuracia / len(x)))
        
    def MaxAcuracia(self):
         print('Acuracia maxima: {}'.format(self.maxAcuracia))


    @staticmethod
    def sigmoid(x):
        return 1/(1+np.exp(-x))

    @staticmethod
    def tanh(x):
        return (1-np.exp(-2*x))/(1+np.exp(-2*x))

## Obtenção dos dados

<p>
    Na descrição da atividade e dado como material para treinamento da rede neural, foi disponibilizado um arquivo 'dados.zip', onde iriamos conseguir as imagens para treinar a Rede Neural. Contudo, a biblioteca <b>keras</b> já possui as mesmas imagens disponibilizadas, assim, por questões de praticidade, resolvemos usá-la ao invés do .zip para treinamento e desenvolvimento do trabalho.
</p>

In [3]:
(x_Treinamento, y_Treinamento), (x_Teste, y_Teste) = mnist.load_data()

## Processamento

In [4]:
x_Treinamento = x_Treinamento.reshape(60000, 784)
x_Teste = x_Teste.reshape(10000, 784)

numClasses = 10

x_Treinamento = x_Treinamento.astype('float32')
x_Teste = x_Teste.astype('float32')
x_Treinamento /= 255
x_Teste /= 255

t_Treinamento = np.zeros((y_Treinamento.shape[0], numClasses))
t_Treinamento[np.arange(y_Treinamento.shape[0]), y_Treinamento] = 1
y_Treinamento = t_Treinamento

t_Teste = np.zeros((y_Teste.shape[0], numClasses))
t_Teste[np.arange(y_Teste.shape[0]), y_Teste] = 1
y_Teste = t_Teste

## Definição da camada escondida
O número de neurônios em cada camada é uma questão mais empírica, não existindo regras explícitas para um cálculo ideal. Jeff Heaton, o autor de <b><i>Introduction to Neural Networks for Java</i></b>, sugere três abordagens iniciais, que vamos explicar como exemplo para uma rede contendo 30 neurônios na camada de entrada e 2 neurônios na camada de saída:

* O número de neurônios escondidos deve estar entre o tamanho da camada de entrada e o da camada de saída. Usar o número médio entre as duas camadas é uma boa opção; ou seja, no nosso exemplo, o valor de (30+2)/2 = 16 neurônios.
* O número de neurônios escondidos deve ser 2/3 do tamanho da camada de entrada, mais o tamanho da camada de saída. Assim, a camada escondida no nosso exemplo deve conter 30*2/3+2 = 22 neurônios.
* O número de neurônios escondidos deve ser menor que o dobro do tamanho da camada de entrada. Ou seja, no nosso exemplo, a camada escondida deve conter menos que 60 neurônios.

No nosso caso, o número de neurônios da camada escondida deve ser algo dentro de [397,532].

In [5]:
N_HIDDEN_LAYER_MIN = 397
N_HIDEN_LAYER_MAX = 532

## Exibição dos resultados

In [None]:
best_hidden_layer = {"n": 0, "acuracia": 0}
for n_hidden_layer in range(N_HIDDEN_LAYER_MIN,N_HIDEN_LAYER_MAX, 1):
    rna = BP_Model(784, n_hidden_layer, numClasses)
    if rna.maxAcuracia > best_hidden_layer["acuracia"]:
        best_hidden_layer = {"n": n_hidden_layer, "acuracia": rna.maxAcuracia}
    rna.Treinamento(x_Treinamento, y_Treinamento, x_Teste, y_Teste, print_cost=False)
    print(f"Max acuracia for {n_hidden_layer} nodes on hidden layer is {rna.maxAcuracia}")
print(f"Hidden Layer with best acuracia {str(best_hidden_layer)}")

Max acuracia for 397 nodes on hidden layer is 0.9047
Max acuracia for 398 nodes on hidden layer is 0.9041
Max acuracia for 399 nodes on hidden layer is 0.9063
Max acuracia for 400 nodes on hidden layer is 0.906
Max acuracia for 401 nodes on hidden layer is 0.9053
Max acuracia for 402 nodes on hidden layer is 0.9054
Max acuracia for 403 nodes on hidden layer is 0.9098
Max acuracia for 404 nodes on hidden layer is 0.9054
Max acuracia for 405 nodes on hidden layer is 0.9048
Max acuracia for 406 nodes on hidden layer is 0.903
Max acuracia for 407 nodes on hidden layer is 0.904
Max acuracia for 408 nodes on hidden layer is 0.9056
Max acuracia for 409 nodes on hidden layer is 0.9052
Max acuracia for 410 nodes on hidden layer is 0.9055
Max acuracia for 411 nodes on hidden layer is 0.9031
Max acuracia for 412 nodes on hidden layer is 0.9063
Max acuracia for 413 nodes on hidden layer is 0.9084
Max acuracia for 414 nodes on hidden layer is 0.9085
Max acuracia for 415 nodes on hidden layer is 0.9