# Atividade 01 - Implementação do Perceptron

- Implementar uma arquitetura clássica do perceptron para um problema binário (em uma classe do tipo BaseEstimator)
- Testar com uma base de dados binária do módulo datasets do scikit-learn. Ex.: load_breast_cancer

In [1]:
import numpy as np
import pandas as pd
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

In [2]:
# CARREGAMENTO DOS DADOS DO DATASET E SEPARAÇÃO ENTRE TREINO/TESTE
# Entrada: são 30 features numéricas
# Saída: uma variável binária (1 ou 0)

data = load_breast_cancer()

X,y = data.data,data.target
print(f'X.shape: {X.shape}')
print(f'y.shape: {y.shape}')

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33, random_state=42)
print(f'X_train.shape: {X_train.shape}')
print(f'X_test.shape: {X_test.shape}')
print(f'y_train.shape: {y_train.shape}')
print(f'y_test.shape: {y_test.shape}')

X.shape: (569, 30)
y.shape: (569,)
X_train.shape: (381, 30)
X_test.shape: (188, 30)
y_train.shape: (381,)
y_test.shape: (188,)


In [3]:
# CLASSES IfesPerceptron

from sklearn.base import BaseEstimator

class IfesPerceptron(BaseEstimator):
    "Implementa uma rede neural do tipo Perceptron com um neurônio"
    def __init__(self):
        pass

    def funcao_ativacao(self, XWb):
        "A função de ativação é a função degrau (também chamada step ou heaviside)"
        # retorna 0 se x < 0
        # retorna 1 se x >= 0
        return np.heaviside(XWb, 1)
        
    def fit(self, X, y=None):
        "Treina usando uma instancia de cada vez"
        self.numero_instancias = X.shape[0]
        self.numero_features = X.shape[1]
        
        # Taxa de aprendizado
        self.taxa_aprendizado = 0.1
        
        # Matrizes do pesos W
        # Conforme livro do Tariq Rashid, é boa prática iniciar os pesos de forma randômica
        # entre +- 1 / raizquadrada(nos_entrada)
        self.W = np.random.normal(0.0, pow(self.numero_features, -0.5), (1, self.numero_features))
        print(f'Matriz W Inicial ({self.W.shape}): {self.W}')
        
        # Vetor de peso bias b (inicializada sempre como 1)
        self.b = [1]
        print(f'Vetor b: {self.b}')
        
        for instancia in range(self.numero_instancias):
            XWb = np.dot(X[instancia], self.W.T) + self.b
            h_WbX = self.funcao_ativacao(XWb)
            print(f'XW+b: {XWb}')
            print(f'Resultado da função de ativação: {h_WbX}')
            
            # Atualização dos pesos de W
            self.W += self.taxa_aprendizado * (y[instancia] - h_WbX) * X[instancia]
            print(f'Matriz W após instância {instancia}: {self.W}')

    def predict(self, X, y=None):
        "Prediz todas as respostas de X_test usando a matriz de pesos treinada"
        XWb = np.dot(X, self.W.T)
        hWbX = self.funcao_ativacao(XWb)
        return hWbX

In [4]:
# TREINAMENTO E TESTE - IfesPerceptron

clf_ifes_perceptron = IfesPerceptron()
clf_ifes_perceptron.fit(X_train,y_train)
y_pred = clf_ifes_perceptron.predict(X_test,y_test)

Matriz W Inicial ((1, 30)): [[-0.1341711   0.01131006  0.21048153  0.12051914  0.00544687  0.03936258
  -0.11047857 -0.07190169 -0.08440608  0.05606323 -0.23492273 -0.19170325
   0.15154751 -0.11891661 -0.01546864 -0.11191622 -0.03752601  0.25456593
  -0.03190532 -0.2359263   0.36504187 -0.02121553 -0.05745278 -0.00931655
  -0.07969093  0.10890959 -0.14719393  0.09544688  0.11347582  0.31589685]]
Vetor b: [1]
XW+b: [93.37406278]
Resultado da função de ativação: [1.]
Matriz W após instância 0: [[-1.68017110e+00 -1.17768994e+00 -1.00395185e+01 -7.35694809e+01
  -7.12313009e-03  2.38125787e-02 -1.30798571e-01 -8.28716884e-02
  -1.04066081e-01  4.89942315e-02 -2.77012727e-01 -2.57533253e-01
  -1.28952487e-01 -4.58291661e+00 -1.60079383e-02 -1.14237223e-01
  -4.18290149e-02  2.53245933e-01 -3.36973237e-02 -2.36343101e-01
  -1.51395813e+00 -1.72521553e+00 -1.25574528e+01 -1.10209317e+02
  -9.50009348e-02  7.30795881e-02 -2.05493934e-01  7.71768839e-02
   8.13158222e-02  3.05796855e-01]]
XW+b

   5.02975822e-01  4.65999855e-01]]
XW+b: [-13764.2164413]
Resultado da função de ativação: [0.]
Matriz W após instância 132: [[ 1.84894289e+01  3.23503101e+01  1.14422482e+02  2.02680519e+02
   1.87865870e-01  8.72025787e-02 -1.97682171e-01 -1.26551188e-01
   2.45823919e-01  1.98703231e-01 -2.04732727e-01  1.93050675e+00
  -1.43192487e-01 -3.41661166e+01  3.39926171e-03 -8.50045229e-02
   1.81189751e-02  2.70565633e-01  6.38447628e-03 -2.27658981e-01
   1.72848419e+01  3.71767845e+01  9.93845472e+01 -1.42589317e+02
   1.60555065e-01  8.27955881e-02 -3.53800834e-01  5.50288839e-02
   5.02975822e-01  4.65999855e-01]]
XW+b: [45223.4454623]
Resultado da função de ativação: [1.]
Matriz W após instância 133: [[ 1.84894289e+01  3.23503101e+01  1.14422482e+02  2.02680519e+02
   1.87865870e-01  8.72025787e-02 -1.97682171e-01 -1.26551188e-01
   2.45823919e-01  1.98703231e-01 -2.04732727e-01  1.93050675e+00
  -1.43192487e-01 -3.41661166e+01  3.39926171e-03 -8.50045229e-02
   1.81189751e-02  2.70

   6.82485822e-01  5.35096855e-01]]
XW+b: [-115567.4690788]
Resultado da função de ativação: [0.]
Matriz W após instância 188: [[ 2.45156289e+01  4.34713101e+01  1.52612482e+02  1.93580519e+02
   2.62809870e-01  1.48398579e-01 -1.89133171e-01 -1.33564388e-01
   3.80933919e-01  2.54586231e-01 -9.25427273e-02  3.09587675e+00
   1.15780751e+00 -4.15131166e+01  9.35956171e-03 -6.19634229e-02
   4.83505751e-02  2.79147133e-01  2.43744763e-02 -2.22693081e-01
   2.34548419e+01  5.23957845e+01  1.41277547e+02 -2.23209317e+02
   2.57882065e-01  2.39236588e-01 -2.40830834e-01  8.32418839e-02
   7.09735822e-01  5.42330855e-01]]
XW+b: [-89013.71046313]
Resultado da função de ativação: [0.]
Matriz W após instância 189: [[ 2.45156289e+01  4.34713101e+01  1.52612482e+02  1.93580519e+02
   2.62809870e-01  1.48398579e-01 -1.89133171e-01 -1.33564388e-01
   3.80933919e-01  2.54586231e-01 -9.25427273e-02  3.09587675e+00
   1.15780751e+00 -4.15131166e+01  9.35956171e-03 -6.19634229e-02
   4.83505751e-02  2

   1.17523582e+00  6.79915855e-01]]
XW+b: [-28090.30195118]
Resultado da função de ativação: [0.]
Matriz W após instância 346: [[ 4.08120289e+01  7.01263101e+01  2.48534482e+02  2.65660519e+02
   4.47961870e-01  1.31517579e-01 -3.85481471e-01 -2.16770388e-01
   6.91173919e-01  3.87826231e-01 -7.30727273e-02  4.84039675e+00
   2.96807513e-01 -8.10489166e+01  2.10463617e-02 -8.06291229e-02
   1.30166751e-02  2.74749133e-01  5.48244763e-02 -2.21442651e-01
   4.04112419e+01  8.82797845e+01  2.37958547e+02 -2.47769317e+02
   5.07989065e-01  1.43589588e-01 -5.57899134e-01  2.36227839e-02
   1.19895582e+00  6.87157855e-01]]
XW+b: [24928.7409005]
Resultado da função de ativação: [1.]
Matriz W após instância 347: [[ 4.08120289e+01  7.01263101e+01  2.48534482e+02  2.65660519e+02
   4.47961870e-01  1.31517579e-01 -3.85481471e-01 -2.16770388e-01
   6.91173919e-01  3.87826231e-01 -7.30727273e-02  4.84039675e+00
   2.96807513e-01 -8.10489166e+01  2.10463617e-02 -8.06291229e-02
   1.30166751e-02  2.7

In [5]:
# AVALIAÇÃO DOS RESULTADOS

print(f'ACURÁCIA: {accuracy_score(y_pred, y_test)}')

ACURÁCIA: 0.9414893617021277
