# Aprendizado Supervisionado no Neurônio Perceptron

In [None]:
# Importando as ferramentas

import numpy as np
import matplotlib.pyplot as plt
import random as rd
from sklearn import metrics
import math

##  Parte I– Resolvendo um Problema Linearmente Separável


1. Usar o arquivo dataAll.txt
2. Construir o algoritmo de treinamento do neurônio perceptron.

In [None]:
arq_input = "dataAll.txt"

dataAll = np.fromfile(arq_input, dtype=np.float64)
print("Tipo de dataAll: {}".format(type(dataAll)))
print("Número de elementos em dataAll: {}".format(dataAll.size))
print("\n")


# -1 infers the size of the new dimension from the size of the input array.
dataAll = np.reshape(dataAll, (1000, 1, 3))
print(dataAll[:10]) # Mostrando 10 exemplos

print("\n")
print("Shape de dataAll: {}".format(dataAll.shape))
print("Dimensões de dataAll: {}".format(dataAll.ndim))

Como havia 3000 exemplos anteriormente e agora a matriz tem dimensões (1, 3). 
Então, há 3000/3 = 1000 exemplos em dataAll. Ou seja, (1000, 1, 3).

In [None]:
# Separando em x, y e rotulo 

print("x:")
x = dataAll[:, :, :2]
print(x.shape)
print(x[:10]) # Mostrando os 10 primeiros pontos 
print("\n")

print("y:")
y = dataAll[:,:, 2:]
print(y.shape)
print(y[:10]) # Rótulos dos pontos

Criando o neurônio Perceptron:

In [None]:
class Perceptron:
    """
    A perceptron is a classification model that consists of a set of weights, or scores,
    one for every feature, and a threshold. The perceptron multiplies each weight by its
    corresponding score, and adds them, obtaining a score.
    by Rajwrite Nath on Medium
    
    """

    def __init__(self, threshold, lr, weight_low=-0.5, weight_high=0.5):
        self.threshold = threshold
        self.lr = lr
        self.weights = None
        self.weight_low = weight_low
        self.weight_high = weight_high
        self.scores = None
        self.adjustments = 0
        self.epochs = 0
        self.bias = -1

    def print_weights(self):
        np.set_printoptions()
        print("Weights:{}".format(self.weights))

    def gen_weights(self, low, high, size):
        self.weights = np.random.uniform(low, high, size=size).reshape(-1, 1)

    def step_fn(self, z):
        return np.where(z >= self.threshold, 1, 0)

    def error_fn(self, y_true, y_predicted):
        return y_true - y_predicted

    def predict(self, x_data):
        return self.step_fn(np.dot(x_data, self.weights))

    def fit(self, x_data, y_data):
        
        # Adicionando um bias ao x_data:
        bias = np.full((x_data.shape[0], 1, 1), self.bias)
        x_data = np.concatenate([bias, x_data], axis=2)
        # print(x_data)
        # print(x_data.shape)
        
        # Gerando pesos
        self.gen_weights(self.weight_low, self.weight_high, size=x_data.shape[2])
        # print("Início:")
        # self.print_weights()
        # print(self.weights.shape)
        
        
        y_predicted = self.predict(x_data)
        self.scores = y_predicted  # Atualiza os scores

        # Algoritmo executa até a convergência, supomos que as classes sejam linearmente separáveis
        while not np.all(y_data == self.scores):

            self.epochs += 1  # Não convergiu, vai necessitar de mais 1 época

            # Para os pesos que resultaram em uma predição errada:

            predicoes_incorretas = np.where(y_data != self.scores)[0]

            for i in predicoes_incorretas:
                x_i = x_data[i]
                y_i = y_data[i]
                y_pred = y_predicted[i]

                # Calculando erros
                error = self.error_fn(y_i, y_pred)

                # Relculando pesos
                self.weights += self.lr * error * x_i.T
                self.adjustments += 1

            y_predicted = self.predict(x_data)
            self.scores = y_predicted # Atualiza os scores novamente com base nos ajustes

# Inicializando o neurônio
neuronio_perceptron = Perceptron(threshold=0, lr=0.1)
neuronio_perceptron.fit(x, y)
print("Final: ")
neuronio_perceptron.print_weights()

In [None]:
# Gerando o gráfico

def gen_grafico(data, final_w, title):
    x_1 = data[:,:, :1]
    x_2 = data[:,:, 1:2]
    y = data[:, :, 2:]
    fig, ax = plt.subplots()
    cor = {0: 'red', 1:'blue'}
    for i in range(data.shape[0]):
        plt.plot(x_1[i][0][0], x_2[i][0][0], marker='o', c = cor[y[i][0][0]])
        
    
    x = np.arange(-1000, 1001, 1)
    reta = (final_w[0][0]/final_w[2][0]) - (final_w[1][0]/final_w[2][0]) * x
    plt.plot(x, reta, color='purple', linestyle='--', markersize=0.5)
    ax.legend(cor, loc='center left', bbox_to_anchor=(1, 0.5))
    ax.grid(True)
    ax.set_title(title)
    plt.show()

gen_grafico(dataAll, neuronio_perceptron.weights, "Distribução dos exemplos em dataAll")

# Parte II - Experimentação

In [None]:
from prettytable import PrettyTable

In [None]:
arq1 = "data1.txt"

data1 = np.fromfile(arq1, dtype=np.float64)

print("Tipo de data1: {}".format(type(data1)))
print("Número de elementos em data1: {}".format(data1.size))
print("\n")

data1 = np.reshape(data1, (600, 1, 3))
print(data1[:10])

print("\n")
print("Shape de data1: {}".format(data1.shape))
print("Dimensões de data1: {}".format(data1.ndim))

In [None]:
# Separando em x, y e rotulo 

print("x:")
x = data1[:, :, :2]
print(x.shape)
print(x[:10]) # Mostrando os 10 primeiros pontos 
print("\n")

print("y:")
y = data1[:,:, 2:]
print(y.shape)
print(y[:10]) # Rótulos dos pontos

In [None]:
config = [(0.4, (-100, 100)),
         (0.1, (-100, 100)),
         (0.01, (-100, 100)),
         (0.4, (-0.5, 0.5)),
         (0.1, (-0.5, 0.5)),
         (0.01, (-0.5, 0.5))] # as seis configurações do 

def run_experiment(x, y, config, n_runs=10):
    results = []
    
    for lr, (weight_low, weight_high) in config:
        adjustments = []
        epochs = []
        
        for _ in range (n_runs):
            p = Perceptron(threshold=0, lr=lr, weight_low=weight_low, weight_high=weight_high)
            p.fit(x, y)
            adjustments.append(p.adjustments)
            epochs.append(p.epochs)
            
        media_ajustes = np.mean(adjustments)
        desvio_ajustes = np.std(adjustments)
        menor_epoca = np.min(epochs)

        results.append((lr, (weight_low, weight_high), media_ajustes, desvio_ajustes, menor_epoca))
    
    return results
        

In [None]:
def print_results_table(results):
    table = PrettyTable()
    table.field_names = ["Taxa de Aprendizado", "Intervalo de Pesos", "Quantidade de ajustes", "Menor número de épocas para convergência"]

    for lr, (w_low, w_high), media, desvio, min_epocas in results:
        ajustes_fmt = f"{media:.2f} ± {desvio:.2f}"
        intervalo_fmt = f"({w_low}, {w_high})"
        table.add_row([lr, intervalo_fmt, ajustes_fmt, min_epocas])

    print(table)


In [None]:
results = run_experiment(x, y, config, n_runs=10)
print_results_table(results)

Taxas de aprendizado altas (0.1-0.4) aceleram a convergência (3-15 épocas) mas causam instabilidade, especialmente com pesos iniciais amplos (-100 a 100). Taxas baixas (0.01) são estáveis porém lentas (5-40 épocas), exceto quando combinadas com pesos em escala reduzida (-0.5 a 0.5), que otimizam o treinamento (1.400 ajustes em 5 épocas). A melhor configuração equilibrada é taxa 0.1 com pesos entre -0.5 e 0.5, garantindo convergência rápida (6 épocas) e estável. A escolha da inicialização e taxa de aprendizado é decisiva para um treinamento eficiente.

# Parte III – Validação Holdout em Problema Não-Linearmente Separável

In [None]:
arq_holdout = "dataHoldout.txt"

dataHoldout = np.fromfile(arq_holdout, dtype=np.float64)

print("Tipo de dataHoldout: {}".format(type(dataHoldout)))
print("Número de elementos em dataHoldout: {}".format(dataHoldout.size))
print("\n")

dataHoldout = np.reshape(dataHoldout, (800, 1, 3))
print(dataHoldout[:10])

print("\n")
print("Shape de dataHoldout: {}".format(dataHoldout.shape))
print("Dimensões de dataHoldout: {}".format(dataHoldout.ndim))

In [None]:
def holdout_grafico(data,title):
    x_1 = data[:,:, :1]
    x_2 = data[:,:, 1:2]
    y = data[:, :, 2:]
    fig, ax = plt.subplots()
    cor = { 0: 'red', 1:'blue'}
    for i in range(data.shape[0]):
        plt.plot(x_1[i][0][0], x_2[i][0][0], marker='o', c = cor[y[i][0][0]])
    
    ax.legend(cor, loc='center left', bbox_to_anchor=(1, 0.5))
    ax.set_title(title)
    plt.show()
        
holdout_grafico(dataHoldout,"Gráfico Inicial de Espalhamento")

In [None]:
#Declarando a semente de aleatoriedade
np.random.seed(1)

#Utilização do permutation para embaralhar a array dataHoldout
np.random.permutation(dataHoldout)

#Definição do tamanho do array de treino como 70% do original
training_amount=int(800*0.7)

#Divisão de teste e treino
training_sample=dataHoldout[:(training_amount)]
test_sample=dataHoldout[(training_amount):]

#Análise se as amostras se mantém constantes 
print(training_sample[:10])
print("\n")
print(test_sample[:10])


In [None]:
# Separando em x, y e rotulo de teste e treino

print("x_Treino:")
x_training= training_sample[:, :, :2]
print(x_training.shape)
print(x_training[:5]) # Mostrando os 5 primeiros pontos 
print("\n")

print("y_training:")
y_training = training_sample[:,:, 2:]
print(y_training.shape)
print(y_training[:5]) # Rótulos dos pontos


print("x_Teste:")
x_test= test_sample[:, :, :2]
print(x_test.shape)
print(x_test[:5]) # Mostrando os 5 primeiros pontos 
print("\n")

print("y_test:")
y_test = test_sample[:,:, 2:]
print(y_test.shape)
print(y_test[:5]) # Rótulos dos pontos

In [None]:
class Controled_Perceptron:
    """
    This class works equals to the Perceptron class, but it doesn't stop when the neuron is all trained but when a
    limit of epochs has been passed
 
    """

    def __init__(self, threshold, lr ,limit):
        self.threshold = threshold
        self.lr = lr
        self.weights = None
        self.scores = None
        self.adjustments = 0
        self.epochs = 0
        self.bias = -1
        self.limit=limit

    def print_weights(self):
        np.set_printoptions()
        print("Weights:{}".format(self.weights))

    def gen_weights(self, low, high, size):
        self.weights = np.random.uniform(low, high, size=size).reshape(-1, 1)

    def step_fn(self, z):
        return np.where(z >= self.threshold, 1, 0)

    def error_fn(self, y_true, y_predicted):
        return y_true - y_predicted

    def predict(self, x_data):
        return self.step_fn(np.dot(x_data, self.weights))

    def fit(self, x_data, y_data):
        
        # Adicionando um bias ao x_data:
        bias = np.full((x_data.shape[0], 1, 1), self.bias)
        x_data = np.concatenate([bias, x_data], axis=2)
        print(x_data)
        print(x_data.shape)
        
        # Gerando pesos
        self.gen_weights(-0.5, 0.5, size=x_data.shape[2])
        print("Início:")
        self.print_weights()
        print(self.weights.shape)
        
        
        y_predicted = self.predict(x_data)
        self.scores = y_predicted  # Atualiza os scores

        # Algoritmo executa até a convergência, supomos que as classes sejam linearmente separáveis
        while(self.epochs<=self.limit):

            self.epochs += 1  # Não convergiu, vai necessitar de mais 1 época

            # Para os pesos que resultaram em uma predição errada:

            predicoes_incorretas = np.where(y_data != self.scores)[0]

            for i in predicoes_incorretas:
                x_i = x_data[i]
                y_i = y_data[i]
                y_pred = y_predicted[i]

                # Calculando erros
                error = self.error_fn(y_i, y_pred)

                # Relculando pesos
                self.weights += self.lr * error * x_i.T
                self.adjustments += 1

            y_predicted = self.predict(x_data)
            self.scores = y_predicted # Atualiza os scores novamente com base nos ajustes
            
neuronio_perceptron_holdout = Controled_Perceptron(threshold=0, lr=0.1, limit=100)
neuronio_perceptron_holdout.fit(x_training, y_training)
print("Final: ")
neuronio_perceptron_holdout.print_weights()

In [None]:
def holdout_line_grafico(data,final_w,title):
    x_1 = data[:,:, :1]
    x_2 = data[:,:, 1:2]
    y = data[:, :, 2:]
    fig, ax = plt.subplots()
    cor = { 0: 'red', 1:'blue'}
    for i in range(data.shape[0]):
        plt.plot(x_1[i][0][0], x_2[i][0][0], marker='o', c = cor[y[i][0][0]])
        
    x = np.arange(-1, 3, 1)
    reta = (final_w[0][0]/final_w[2][0]) - (final_w[1][0]/final_w[2][0]) * x
    plt.plot(x, reta, color='purple', linestyle='--', markersize=0.5)
    
    ax.legend(cor, loc='center left', bbox_to_anchor=(1, 0.5))
    ax.set_title(title)
    plt.show()
        
holdout_line_grafico(dataHoldout,neuronio_perceptron_holdout.weights,"Distruibuição de exemplos de dataHoldout")