In [1]:
import numpy as np
import math

## Perceptron da simples com sistema de treinamento (TESTE)

In [2]:
# Perceptron simples com treinamento

class Perceptron:
    def __init__(self, weights=None, bias=-1, activation_threshold=0.5, learning_rate=0.1, train_data=None, expected_output=None):
        if weights == None:
            self.weights = np.array([1, 1])
        else:
            self.weights = np.array(weights)
        self.bias = bias
        self.activation_threshold = activation_threshold
        self.learning_rate = learning_rate

        self.train_data = train_data
        self.expected_output = expected_output

        self.current_inputs = np.zeros(2) # Armazena as entradas atuais para atualização dos pesos, resultado de cada forward pass

    def _heaviside(self, x):
        """
        Implementa a função delta de heaviside (famoso degrau)
        Essa é uma função de ativação possível para os nós da rede neural.
        """
        return 1 if x >=  self.activation_threshold else 0

    def _sigmoid(self, x):
        """
        Implementa a função sigmoide
        Essa é uma função de ativação possível para os nós da rede neural.
        """
        return 1/(1 + math.exp(-x))

    def _activation(self, perceptron_output):
        """
        Implementação da função de ativação do perceptron
        Escolha uma das funções de ativação possíveis
        """
        return self._heaviside(perceptron_output)
    
    def _gradient(self, node_input, right_output, computed_output):
        """
        Calcula o gradiente descendente para atualização dos pesos
        """

        erro = right_output - computed_output

        return node_input * erro
    
    def update_weights(self, right_output, computed_output):
        """
        Atualiza os pesos do perceptron, tanto do bia quanto os pesos das entradas
        """

        for w in range(len(self.weights)):
            self.weights[w] = self.weights[w] + self.learning_rate * self._gradient(self.current_inputs[w], right_output, computed_output) # w_atualizado = w_velho + taxa_aprendizado * gradiente


    def train(self, epochs=100):
        """
        Treina o perceptron com os dados de treino fornecidos
        """

        for epoch in range(epochs):
            # Para cada par de dados de treino e saída esperada
            for data, expected in zip(self.train_data, self.expected_output):

                # Calcula a saída do perceptron
                computed_output = self.forward_pass(data)

                # Atualiza os pesos
                self.current_inputs = data

                # Atualiza os pesos
                self.update_weights(expected, computed_output)

                print(f"Epoch {epoch} - Data: {data} - Expected: {expected} - Computed: {computed_output} - Weights: {self.weights}")
            
        # Depois que acabar o treino, imprime os pesos finais os pesos finais
        print(f"Final weights: {self.weights}")
        print(f"Final bias: {self.bias}")

        # Testa o perceptron treinado para cada dado de treino
        for data in self.train_data:
            print(f"Data: {data} - Resultado final: {self.forward_pass(data)}")

    def forward_pass(self, data):
        """
        Implementa a etapa de inferência (feedforward) do perceptron.
        """
        weighted_sum = self.bias + np.dot(self.weights, data)
        return self._activation(weighted_sum)
    


In [3]:

entradas = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])

resultados_esperados = np.array([[0], [0], [0], [1]])

perceptron = Perceptron(weights=[1,1], train_data=entradas, expected_output=resultados_esperados)

perceptron.train()


Epoch 0 - Data: [0 0] - Expected: [0] - Computed: 0 - Weights: [1 1]
Epoch 0 - Data: [0 1] - Expected: [0] - Computed: 0 - Weights: [1 1]
Epoch 0 - Data: [1 0] - Expected: [0] - Computed: 0 - Weights: [1 1]
Epoch 0 - Data: [1 1] - Expected: [1] - Computed: 1 - Weights: [1 1]
Epoch 1 - Data: [0 0] - Expected: [0] - Computed: 0 - Weights: [1 1]
Epoch 1 - Data: [0 1] - Expected: [0] - Computed: 0 - Weights: [1 1]
Epoch 1 - Data: [1 0] - Expected: [0] - Computed: 0 - Weights: [1 1]
Epoch 1 - Data: [1 1] - Expected: [1] - Computed: 1 - Weights: [1 1]
Epoch 2 - Data: [0 0] - Expected: [0] - Computed: 0 - Weights: [1 1]
Epoch 2 - Data: [0 1] - Expected: [0] - Computed: 0 - Weights: [1 1]
Epoch 2 - Data: [1 0] - Expected: [0] - Computed: 0 - Weights: [1 1]
Epoch 2 - Data: [1 1] - Expected: [1] - Computed: 1 - Weights: [1 1]
Epoch 3 - Data: [0 0] - Expected: [0] - Computed: 0 - Weights: [1 1]
Epoch 3 - Data: [0 1] - Expected: [0] - Computed: 0 - Weights: [1 1]
Epoch 3 - Data: [1 0] - Expected: 

  self.weights[w] = self.weights[w] + self.learning_rate * self._gradient(self.current_inputs[w], right_output, computed_output) # w_atualizado = w_velho + taxa_aprendizado * gradiente


## Multilayer Perceptron com backpropagation (MLP)

In [11]:
# Multi-layer perceptron

# Passar o número de camadas escondidas
# Derivada da função de ativação para atualização dos pesos
# Colocar pesos e bias para cada camada
# Colocar retropropagação
# Atualizar pesos e bias para cada camada

class MultiLayerPerceptron:
    def __init__(self, activation_threshold=0.5, learning_rate=0.1, train_data=None, expected_output=None, h_layers=None):

        self.activation_threshold = activation_threshold
        self.learning_rate = learning_rate

        self.train_data = train_data
        self.expected_output = expected_output

        self.h_layers = h_layers

        self.weights = []
        self.biases = []

        for i in range(len(h_layers) -1):
            self.weights.append(np.random.rand(h_layers[i], h_layers[i + 1])) # Pesos entre as camadas
            self.biases.append(np.random.rand(h_layers[i + 1])) # Bias para cada camada

        print(self.weights)
        print(self.biases)

        self.losses = []

    def _sigmoid(self, x):
        """
        Implementa a função sigmoide
        Essa é uma função de ativação possível para os nós da rede neural.
        """
        return 1/(1 + np.exp(-x))
    
    def _sigmoid_derivade(self, x):
        """
        Implementa a derivada da função sigmoide
        """
        return x * (1 - x)

    def _activation(self, perceptron_output):
        """
        Implementação da função de ativação do perceptron
        Escolha uma das funções de ativação possíveis
        """
        return self._sigmoid(perceptron_output)
    
    def _activation_derivade(self, perceptron_output):
        """
        Implementação da derivada da função de ativação do perceptron
        """
        return self._sigmoid_derivade(perceptron_output)
    
    def _gradient(self, node_input, right_output, computed_output):
        """
        Calcula o gradiente descendente para atualização dos pesos
        """

        erro = right_output - computed_output

        return node_input * erro
    

    def forward_pass(self, data):
        """
        Implementa a etapa de inferência (feedforward) do perceptron.
        """

        layer_outputs = [data] # Armazena as ativações de cada camada

        for i in range(len(self.weights)):
            weighted_sum = np.dot(layer_outputs[-1], self.weights[i]) + self.biases[i] # Calcula a soma dos pesos
            activation = self._activation(weighted_sum)
            layer_outputs.append(activation)

        # print(layer_outputs)

        # Minha layer_outputs é uma lista com o input, as ativações de cada camada e a saída final

        return layer_outputs # Retorna as ativações de cada camada

    def backpropagation(self, layer_outputs, expected_output):
        """
        Implementa a etapa de retropropagação do erro
        """
        
        errors = [expected_output - layer_outputs[-1]] # Erro da última camada
        deltas = [errors[-1] * self._activation_derivade(layer_outputs[-1])] # erro * derivada da função de ativação

        for i in range(len(self.weights) - 2, -1, -1): 
            error = np.dot(deltas[-1], self.weights[i + 1].T) # Calcula o erro da camada anterior
            delta = error * self._activation_derivade(layer_outputs[i + 1]) # Calcula o delta da camada anterior
            errors.append(error) # Armazena o erro
            deltas.append(delta) # Armazena o delta

        deltas.reverse() # Inverte a ordem dos deltas para que eles fiquem na ordem correta
 
        for i in range(len(self.weights)):
            self.weights[i] += np.dot(layer_outputs[i].T[:, np.newaxis], deltas[i][:, np.newaxis].T) * self.learning_rate # Pesos = Pesos + taxa_aprendizado * delta * ativação
            self.biases[i] += np.sum(deltas[i], axis=0) * self.learning_rate # Bias = Bias + taxa_aprendizado * delta

    def train(self, epochs=10000):
        """
        Treina o perceptron com os dados de treino fornecidos
        """

        for epoch in range(epochs):
            for data, expected in zip(self.train_data, self.expected_output):
                layer_outputs = self.forward_pass(data)
                self.backpropagation(layer_outputs, expected)

    def predict(self, data):
        layer_outputs = self.forward_pass(data)
        # print(layer_outputs)
        return 1 if layer_outputs[-1] > 0.85 else 0 # Retorna a saída da última camada


In [12]:
entradas = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])

resultados_esperados = np.array([[0], [1], [1], [0]])

mlp = MultiLayerPerceptron(train_data=entradas, expected_output=resultados_esperados, h_layers=[2, 2, 1])

mlp.train()

for data in entradas:
    print(f"Data: {data} - Resultado final: {mlp.predict(data)}")

# Layers = [numero de entradas, numero de neurônios na camada 1, numero de neurônios na camada 2, ..., numero de saídas]

[array([[0.1825385 , 0.20776359],
       [0.93987179, 0.57076089]]), array([[0.97271908],
       [0.81883723]])]
[array([0.17671864, 0.97983147]), array([0.26402073])]
Data: [0 0] - Resultado final: 0
Data: [0 1] - Resultado final: 1
Data: [1 0] - Resultado final: 1
Data: [1 1] - Resultado final: 0


## MLP com Pythorch

In [8]:
import torch 