# Implementação do Perceptron

Foi realizado de acordo com a aula anterior utilizando o svm.SVC, o mesmo modelo de código, sendo agora utilizado o Perceptron.

Foi criada uma classe Perceptron com os métodos:

* O construtor da classe
* fit(self, X, y, learning_rate)
* predict(self, X)
* _activation_fn(self, Z)
* _activation_fn_derivative(self, Z)

O construtor inicializou os atributos utilizados na tarefa.

O método fit realizou o treinamento do perceptron onde tinhamos
X: Matriz de dados
y: Vetor de labels que serão de aprendizado
num_epochs: Vezes que o meu fit será rodado
Foi aplicado um Hot Encode no y, inicializados com valores os pesos e o bias, foi rodado através de uma amostra aleatória dos dados.
O cálculo utilizado para os erros e atualização dos pesos e do bias foi o gradiente.

O método predict realizou a predição dos dados, obtendo o maior valor de saída.

O método _activation_fn foi utilizado como uma ativação através de um sigmoide de função logística.

O método _activation_fn_derivative é um retorno de uma função derivada.

In [252]:
import numpy as np
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

In [260]:
# Criando uma classe perceptron
class Perceptron:
    # Construtor da classe
    def __init__(self, lr = 0.01):
        self._weights = None
        self._b = None
        self._input_size = 0
        self._output_size = 0
        self._lr = lr
        self._num_samples = 0

    def fit(self, X, y, num_epochs = 100):
        '''
        X: Matriz de dados
        y: Vetor de labels que serão de aprendizado
        num_epochs: Vezes que o meu fit será rodado
        
        Neste método será feito o treinamento do perceptron, com os pesos e o erros de classificação
        '''
        # Aplicação do chamado Hot Encode no y
        y = np.zeros((target.shape[0], 3))
        # Número de linhas de X
        self._num_samples = X.shape[0]
        # Número de colunas de X
        self._input_size = X.shape[1]
        # Número de colunas de y
        self._output_size = y.shape[1]
        
        # Inicializando os pesos
        # Inicia os pesos como uma matriz de 0.
        self._weights = np.zeros((self._output_size, self._input_size))
        # Cada neurônio tem o seu bias
        self._b = np.zeros(self._output_size)
        
        # Treinamento
        for i in range(num_epochs):
            # Escolhendo uma amostra aleatória dos dados
            for posi in range(self._num_samples):
                posi = np.random.randint(0, X.shape[0])
                x = X[posi]
                y_expected = y[posi]

                # Calculo do z
                Z = np.dot(self._weights, x) + self._b

                #Calculo da saída dos neurônios
                # Saída vetorial
                y_hat = self._activation_fn(Z)

                # Calculando gradiente
                erro = (y_hat - y_expected)
                activation_derivative = self._activation_fn_derivative(Z)
                
                # Atualizar cada Neurônio o seu peso e o bias
                for j in range(self._output_size):
                    gradient = erro[j] + activation_derivative[j] * x
                    self._weights[j] = self._weights[j] = (self._lr * gradient)
                    self._b[j] = self._b[j] - (self._lr * erro[j] * activation_derivative[j])
    
    # Método de Predição, prevê a saída
    def predict(self, X):
        Z = np.array([ np.dot(self._weights, x) + self._b  for x in X])
        output = self._activation_fn(Z)
        return np.argmax(output, axis=1)
        
    
    def _activation_fn(self, Z):
        # Função Logística - Sigmoide
        return 1.0 / (1.0 + np.e**(-Z))
    
    def _activation_fn_derivative(self, Z):
        # Derivada da Função _activation_fn
        # Inversa da Logística
        derivative_activation = self._activation_fn(Z)
        return derivative_activation * (1 - derivative_activation) 


In [263]:
# Carregando os dados
iris = datasets.load_iris()

X = iris.data
y = iris.target

targets_names = iris.target_names

acc_list = []

# Embaralhar os dados
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33)

# Criando o classificador
clf = Perceptron(lr=0.01)

# Chamando o método fit
clf.fit(X_train, y_train, num_epochs=1000)

# Utilizar o modelo
y_hat = clf.predict(X_test)

acc = accuracy_score(y_test, y_hat)
acc_list.append(acc)
    
print('ACC MEAN: ', np.mean(acc_list))
print('ACC STD: ', np.std(acc_list))

ACC MEAN:  0.3
ACC STD:  0.0
