# Multilayer Perceptron - XOR

Para execução do código é necessária a importação dos pacotes random, numpy e math, como no bloco executável abaixo.

## Importações

Para execução do código é necessária a importação dos pacotes random e pprint, como no bloco executável abaixo.

In [5]:
import numpy as np
import math
import random


## Funções auxiliares

Abaixo estão as funções auxiliares utilizadas para cálculos.

In [6]:
def sigmoid(valor):
  result = 1.0 / (1.0 + np.exp(-valor))
  return result


def sigmoid_derivada(valor):
  result = valor * (1.0 - valor)
  return result

## Classe MLP

Abaixo está a classe MLP, que representa a rede multilayer. Em seu construtor ela recebe como parâmetro as entradas que serão usadas para treino e inicializa as variáveis da classe, como os pesos das camadas e o tamanho das entradas.

A função $run$ realiza o cálculo dos testes que recebe por parâmetro. Os testes devem ser passados em formato de matriz (cada linha contendo uma lista com dois valores binários).

A função $train$ executa o treinamento. primeiro ela realiza o Foward propagation, utilizando a função sigmoid como função de ativação. Após isso a função realiza o Backward propagation e, por fim, atualiza os valores dos pesos utilizando os termos de correção. Esse processo é repetido $k$ vezes, sendo k um valor passado por parâmetros que representa o número de épocas. Também devem ser passados por parâmetros os inputs de teste e os resultados esperados.

In [7]:
class MLP:
  def __init__(self, inputs):
    self.inputs = inputs

    self.tamanho = len(self.inputs)
    self.tamanho_input = len(self.inputs[0])

    self.pesos_i = np.random.random((self.tamanho_input, self.tamanho))
    self.pesos_h = np.random.random((self.tamanho, 1))

  # Predição
  def run(self, input_run):
    l1_result = sigmoid(np.dot(input_run, self.pesos_i))
    l2_result = sigmoid(np.dot(l1_result, self.pesos_h))
    
    return l2_result


  def train(self, inputs, outputs, k):
    for i in range(k):
      # Foward propagation para todos os testes
      l_inputs = inputs
      l_hidden = sigmoid(np.dot(l_inputs, self.pesos_i))
      l_outputs = sigmoid(np.dot(l_hidden, self.pesos_h))

      # Backward propagation para todos os testes
      l_outputs_err = outputs - l_outputs
      l_outputs_delta  =  np.multiply(l_outputs_err, sigmoid_derivada(l_outputs))

      l_hidden_err = np.dot(l_outputs_delta, self.pesos_h.T)
      l_hidden_delta = np.multiply(l_hidden_err, sigmoid_derivada(l_hidden))

      # Correção dos vaores
      self.pesos_h += np.dot(l_hidden.T, l_outputs_delta)
      self.pesos_i += np.dot(l_inputs.T, l_hidden_delta)

## Função principal

A função principal inicializa as listas para treino com todas possibilidades de casos para o XOR. Feito isso, uma instância de MLP é criada e os treinos são executados.

Após isso, são feitos testes com outras instâncias e seus resultados e acurácia são impressos em tela.

In [8]:
inputs_treino = np.array([[0,0], [0,1], [1,0], [1,1] ])
outputs = np.array([ [0], [1],[1],[0] ])

n = MLP(inputs_treino)
print(n.run(inputs_treino))
n.train(inputs_treino, outputs, 10000)

inputs_testes = np.array([[0,0], [0,1], [1,0], [1,1], [0,0], [0,1], [1,0], [1,1] ])
outputs_esperados = np.array([0, 1, 1, 0, 0, 1, 1, 0])
results = n.run(inputs_testes)

acc = 0.0
for idx, result in enumerate(results):
  if result < 0.5:
    print(inputs_testes[idx][0], " XOR ", inputs_testes[idx][1], " = ", math.floor(result))
    if math.floor(result) == int(outputs_esperados[idx]):
      acc += 1
  else:
    print(inputs_testes[idx][0], " XOR ", inputs_testes[idx][1], " = ", math.ceil(result))
    if math.ceil(result) == int(outputs_esperados[idx]):
      acc += 1

print(acc / len(inputs_testes) * 100, "%")


[[0.70755547]
 [0.74765163]
 [0.73385342]
 [0.76873398]]
0  XOR  0  =  0
0  XOR  1  =  1
1  XOR  0  =  1
1  XOR  1  =  0
0  XOR  0  =  0
0  XOR  1  =  1
1  XOR  0  =  1
1  XOR  1  =  0
100.0 %
