# Perceptron XOR

## Perceptron binário

Definição da classe Perceptron cuja função de ativação é binária (tornando-se o resultado da predição).

In [11]:
class Perceptron(object):
    """Implements a perceptron network"""
    def __init__(self, input_size, lr=1, epochs=100):
        self.W = [0] * (input_size + 1)
        # add one for bias
        self.epochs = epochs
        self.lr = lr

    def activation_fn(self, x):
        #print( " x=", x)
        #funcao binaria
        return 1 if x >= 0 else 0

        #funcao bipolar
        # return 1 if x >= 0 else -1



    def weighted_sum(self, x, w):
        if(len(x) != len(w)):
            raise Exception("List with differents sizes")
        r = 0
        for i in range(len(w)):
            r += x[i] * w[i]
        return r

    def predict(self, x):
        z = self.weighted_sum(self.W, x)
        a = self.activation_fn(z)
        return a

    def fit(self, X, d):
        for _ in range(self.epochs):
            for i in range(len(d)):
                x = [1] + X[i]
                y = self.predict(x)
                e = d[i] - y
                for j  in range(len(self.W)):
                    self.W[j] = self.W[j] + self.lr * e * x[j]


## Classe Network

A classe Network é a responsável pela operação $xor$. Ela foi criada a partir de três perceptrons: $and$, $or$ e $not$. Esses perceptrons são treinados na construção do objeto e, para que possam ser verificadas suas eficiências, são também testados.

Tem-se, além das funções de treinamento das componentes, a função de predição, que recebe dois valores binários como entrada. Essa função realiza a seguinte operação para retornar o resultado do $xor$:

$$
\begin{equation}
      and(not(and(x_{1}, x_{2})), or(x_{1}, x_{2})) \mid x_{1} \in \{0, 1\}, x_{2} \in \{0, 1\}
\end{equation}
$$

Se as predições das componentes $and$, $or$ e $not$ forem corretas, a predição da operação $xor$ também serão corretas.


In [12]:
class Network(object):
    """Implements a perceptron network"""
    def __init__(self):
        self.perceptron_and = self.train_perceptron_and()
        self.perceptron_or = self.train_perceptron_or()
        self.perceptron_not = self.train_perceptron_not()
    
    def train_perceptron_and(self):
        X = [
            [0, 0],
            [0, 1],
            [1, 0],
            [1, 1]
        ]
        d = [0, 0, 0, 1]

        input_size = 2
        perceptron_and = Perceptron(input_size)
        perceptron_and.fit(X, d)
#         print("The W results for AND = ",perceptron_and.W)
        
        testes = [
            [0, 0],
            [0, 1],
            [1, 0],
            [1, 1]
        ]

        print("Teste da componente AND:")
        for t in testes:
            x = [1] + t
            print("\t", x[1], " AND ", x[2], " = ", perceptron_and.predict(x))
        
        return perceptron_and
      
    def train_perceptron_or(self):
        X = [
            [0, 0],
            [0, 1],
            [1, 0],
            [1, 1]
        ]
        d = [0, 1, 1, 1]

        input_size = 2
        perceptron_or = Perceptron(input_size)
        perceptron_or.fit(X, d)
#         print("The W results OR = ",perceptron_or.W)

        
        testes = [
            [0, 0],
            [0, 1],
            [1, 0],
            [1, 1]
        ]

        print("Teste da componente OR:")
        for t in testes:
            x = [1] + t
            print("\t", x[1], " OR ", x[2], " = ", perceptron_or.predict(x))
        
        return perceptron_or
    
    
    def train_perceptron_not(self):
        X = [
                [0],
                [1],
            ]
        d = [1, 0]

        input_size = 1
        perceptron_not = Perceptron(input_size)
        perceptron_not.fit(X, d)
#         print("The W results = ",perceptron_not.W)

        testes = [
            [0],
            [1]
        ]

        print("Teste da componente NOT:")
        for t in testes:
            x = [1] + t
            print("\t NOT", x[1], " = ", perceptron_not.predict(x))
            
        return perceptron_not
      

    def predict(self, first_value, second_value):
        predict_first_and = self.perceptron_and.predict([1, first_value, second_value])
        predict_not = self.perceptron_not.predict([1, predict_first_and])
        predict_or = self.perceptron_or.predict([1, first_value, second_value])
        return self.perceptron_and.predict([1, predict_not, predict_or])
            

## Teste da rede

Após inicializar a rede, é possível testá-la. Inicialmente a rede foi pensada para apenas duas entradas, mas alterando-se o tamanho das instâncias de treino presentes na classe da rede é possível modificar o tamanho da entrada.

Como o treinamento da rede é feito no construtor, podemos diretamente testá-la e isso é feito abaixo (para todas as possibilidades com duas entradas).

Ao fim da execução terá-se imprimido os testes para as componentes e os testes da rede como um todo.

In [13]:
n = Network()

print("-------------------------------XOR-------------------------------")
print("Teste da rede XOR: ")

print("\t 0 XOR 0 = ", n.predict(0, 0))
print("\t 0 XOR 1 = ", n.predict(0, 1))
print("\t 1 XOR 0 = ", n.predict(1, 0))
print("\t 1 XOR 1 = ", n.predict(1, 1))

# print("Digite o primeiro valor do XOR:")
# first_value = int(input())

# print("Digite o segundo valor do XOR:")
# second_value = int(input())

# print(first_value, " XOR ", second_value, " = ", n.predict(first_value, second_value))

Teste da componente AND:
	 0  AND  0  =  0
	 0  AND  1  =  0
	 1  AND  0  =  0
	 1  AND  1  =  1
Teste da componente OR:
	 0  OR  0  =  0
	 0  OR  1  =  1
	 1  OR  0  =  1
	 1  OR  1  =  1
Teste da componente NOT:
	 NOT 0  =  1
	 NOT 1  =  0
-------------------------------XOR-------------------------------
Teste da rede XOR: 
	 0 XOR 0 =  0
	 0 XOR 1 =  1
	 1 XOR 0 =  1
	 1 XOR 1 =  0
