O objetivo deste trabalho é implementar o algoritmo de treinamento mediante Aprendizado Supervisionado do neurônio Perceptron de Rosenblatt aplicado em problemas de classificação.

In [2]:
import numpy as np
import matplotlib.pyplot as plt
from Perceptron import Perceptron
from Activations import Degree

# Preparação dos exemplos

In [3]:
examples = 'data/dataAll.txt'
nparray = np.fromfile(examples)
print(f'np array= {nparray} \nshape= {nparray.shape}')

np array= [-363.7884  244.1423    0.     ... -140.147   734.0983    0.    ] 
shape= (3000,)


In [4]:
data = nparray.reshape(1000,3)
data

array([[-363.7884,  244.1423,    0.    ],
       [ 328.7572, -256.7658,    1.    ],
       [-164.9827,  613.2164,    0.    ],
       ...,
       [ 872.4311,  669.1192,    1.    ],
       [ 822.6894, -702.6489,    1.    ],
       [-140.147 ,  734.0983,    0.    ]])

In [5]:
X = data[:, :2]
y = data[:, 2]

print(f'X: {X[:5]}\n')
print(f'Y: {y[:5]}')

X: [[-363.7884  244.1423]
 [ 328.7572 -256.7658]
 [-164.9827  613.2164]
 [ 536.5905  764.9575]
 [ 314.2297  343.8375]]

Y: [0. 1. 0. 0. 0.]


# Treinamento do neurônio

Ao conduzir múltiplas execuções independentes de treinamento, algumas instâncias convergem em poucas épocas, enquanto outras requerem mais iterações. Esse comportamento decorre principalmente de dois fatores: a inicialização aleatória dos pesos e a ordem de apresentação dos exemplos. No caso em questão, a variação resulta sobretudo da primeira causa, pois não há embaralhamento dos dados na etapa de treino.

In [9]:
p= Perceptron()
activation= Degree()
epoch, adjusts = p.fit(X,y, activation)

print(f'\nConvergência em {epoch} épocas')
print(f'{adjusts} ajustes feitos')

Pesos: [ -0.25387625  35.88173014 -24.84799129]
Pesos: [  -0.35387625  -17.77731986 -101.34374129]
Pesos: [ -0.25387625  55.01870014 -65.51418129]
Pesos: [ -0.15387625 137.61740014  14.34164871]
Pesos: [ -0.25387625 143.46316014 -63.95294129]
Pesos: [  -0.35387625  103.45425014 -141.84563129]
Pesos: [ -0.45387625 157.12406014 -92.75336129]
Pesos: [  -0.35387625  104.16400014 -149.62282129]
Pesos: [ -0.45387625 163.72352014 -99.50049129]
Pesos: [  -0.35387625  118.19889014 -165.13642129]
Pesos: [ -0.45387625 208.91475014 -90.42310129]
Pesos: [  -0.35387625  151.13376014 -150.73125129]

Convergência em 2 épocas
12 ajustes feitos


Para fins ilustrativos, a seguir será conduzido um experimento cujo intuito é analisar como se comporta a convergência das instâncias de acordo com as combinações de pesos utilizadas. Serão executadas...

In [None]:
n= 3000 
results= []

for _ in range(n):
    p = Perceptron()
    activation = Degree()
    pesos_iniciais = p.w.copy()
    
    epoch, adjusts = p.fit(X, y, activation)
    
    results.append((*pesos_iniciais, epoch))

results = np.array(results)

Pesos: [ -0.09880444 -57.45103514 -60.61588495]
Pesos: [ -0.19880444 -24.98311514 -39.16304495]
Pesos: [-0.09880444 66.80256486 26.18493505]
Pesos: [ 1.19556379e-03  5.66052049e+01 -5.33884949e+01]
Pesos: [ 1.01195564e-01  6.69538486e+00 -1.04648925e+02]
Pesos: [  0.20119556 103.97074486 -76.99647495]
Pesos: [   0.30119556   61.79536486 -128.35376495]
Pesos: [   0.40119556   89.25895486 -107.49741495]
Pesos: [  0.30119556 138.71977486 -58.60336495]
Pesos: [  0.40119556 124.32847486 -84.50214495]
Pesos: [   0.30119556   96.12101486 -118.08626495]
Pesos: [  0.20119556 166.31475486 -50.86058495]
Pesos: [ 1.01195564e-01  1.43547735e+02 -9.22943749e+01]
Pesos: [   0.20119556   79.25852486 -160.35900495]
Pesos: [   0.30119556  132.36284486 -124.57960495]
Pesos: [   0.40119556   65.68801486 -194.47493495]
Pesos: [   0.50119556  143.66800486 -163.37016495]
Pesos: [   0.60119556  206.56531486 -105.18320495]
Pesos: [   0.70119556  165.05061486 -169.77979495]
Pesos: [   0.60119556  230.00537486 -

In [None]:
plt.figure(figsize=(8, 6))
scatter = plt.scatter(results[:, 1], results[:, 2], c=results[:, 3], cmap='hot', s=50)
plt.xlabel("w1")
plt.ylabel("w2")
plt.title("Épocas até convergência vs Pesos iniciais (w1, w2)")
cbar = plt.colorbar(scatter)
cbar.set_label("Épocas até convergência")
plt.grid(True)
plt.tight_layout()
plt.show()

In [None]:
classe0 = X[y == 0]
classe1 = X[y == 1]

plt.scatter(classe0[:, 0], classe0[:, 1], label='Classe 0', marker='o', color='red')
plt.scatter(classe1[:, 0], classe1[:, 1], label='Classe 1', marker='o', color='blue')

w0, w1, w2 = p.w
x1_pts = np.linspace(X[:, 0].min(), X[:, 0].max(), 100)

if w2 != 0:
    x2_pts = -(w0 + w1 * x1_pts) / w2
    plt.plot(x1_pts, x2_pts, label='Fronteira de decisão', linewidth=2)
else:
    plt.axvline(x=-w0/w1, label='Fronteira de decisão', linewidth=2)

plt.xlabel('x1')
plt.ylabel('x2')
plt.title('Perceptron - Conjunto de dados e fronteira de decisão')
plt.legend()
plt.show()

plt.scatter(X[:, 0], X[:, 1], color='blue')
#Tentativa teste de plotar os dados sem o modelo
plt.xlabel('x1')
plt.ylabel('x2')
plt.title('Distribuição dos dados no plano cartesiano')
plt.show()


