## Adaptative Linear Neuron Network (Adaline Network)

**Autor:** Guilherme Cadori

**Data:** 17/03/2024


In [1]:
# Importando bibliotecas de trabalho
import numpy as np


In [2]:
# Gerando random seed para fins de repetibilidade
np.random.seed(123)

# Criando uma função para Adaline
def adaline(X, y, alpha=0.6, w1=None, w2=None, epsilon=0.001, max_iters=100):
    
    # Inicializando w aleatóriamente entre -1 e 1
    if w1 is None:
        w1 = np.random.uniform(-1, 1)
    if w2 is None:
        w2 = np.random.uniform(-1, 1)
    
    # Incializando teta = 0 (b = 0)
    teta = 0   
    
    # Inicializando contador de iterações
    iteracao = 1
    
    # Inicializando o erro com um valor elevado
    erro = 0
    
    # Definindo a dimensão m de X para o loop
    m = X.shape[0]
    
    # Inicializando pesos no formato correto
    w = np.array([w1, w2])
    
    # Loop principal de calculo dos valores estimados (y_hat) e ajuste dos parâmetros
    while iteracao < max_iters+1:
        
        # Inicializando o erro para cada iteração
        erro_it = 0
        
        # Calculando y_hat para cada par de entradas da matriz X
        for i in range(m):
            # Calculando y_hat
            y_hat = (X[i] @ w) + teta

            # Atribuindo valores a y_hat de acordo com o limiar de decisão abaixo:
            y_hat = np.where(y_hat > 0, 1, -1)
        
            # Ajuste de pesos por Gradiente Descendente (GD), também conhcido por Regra Delta
            # Cálculo do erro médio (sugerido em aula)
            # Somando o erro para esta amostra à soma total do erro para esta iteração
            erro_it += 1/2 * np.sum(((y[i] - y_hat)**2))
            
            # Ajustando o valor dos parâmetros
            # Ajuste via GD (sugerido em aula)
            if np.any(y_hat != y):
                w = w + alpha * (np.sum(y - y_hat) * X[i])
                teta = teta + alpha * np.sum(y - y_hat)
            else:
                w = w
                teta = teta
                
        # Atualizando o valor do erro
        erro = erro_it
        
        # Verificando critério de parada baseado no erro
        if erro <= epsilon:
            print('Ajuste de parâmetros concluído.\n')
            print(f"Os valores dos parâmetros são: w1={w[0]}, w2={w[1]}, teta={teta}.")

            return
        
        # Apresentando os valores atualizados de w e teta
        print(f"Iteração {iteracao:<5} | Erro: {erro:<5.2f} | w1: {w[0]:<6.2f} w2: {w[1]:<7.2f} | teta: {teta:<7.2f} |")       

        # Atualizando contador de iterações
        iteracao += 1

    # Limite de iterações atingido
    print('\nLimite de iterações alcançado.\n')
    print(f"Erro final de {erro: .2f} após {iteracao-1} iterações.\n")
    print('Os parâmentro finais são:')
    print(f"    w   : {w}")
    print(f"    teta: {teta}")

    return w[0], w[1], teta


### Conjunto de Treinamento

In [3]:
# Criando dados
# Criando x1 e x2 como uma matriz de inputs, na qual coluna 1 = x1 e coluna 2 = x2
X_train = np.array([[0, 1],
                    [0, 2],
                    [1, 1],
                    [1, 2],
                    [1, 3],
                    [2, 2],
                    [2, 3],
                    [3, 2],
                    [4, 1],
                    [4, 3],
                    [0, 3],
                    [2, 0],
                    [2, 1],
                    [3, 0],
                    [3, 1],
                    [3, 3],
                    [4, 0],
                    [4, 2],
                    [5, 0],
                    [5, 1],
                    [5, 2],
                    [5, 3]])

# Criando vetor de alvos
y_train = np.array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1])


In [4]:
# Rodando o algoritmo
w1, w2, teta = adaline(X=X_train, y=y_train, alpha=0.5, max_iters=30)


Iteração 1     | Erro: 22.00 | w1: 11.39  w2: 65.57   | teta: 22.00   |
Iteração 2     | Erro: 18.00 | w1: 0.39   w2: 87.57   | teta: 0.00    |
Iteração 3     | Erro: 14.00 | w1: 33.39  w2: 65.57   | teta: -22.00  |
Iteração 4     | Erro: 18.00 | w1: 22.39  w2: 87.57   | teta: -44.00  |
Iteração 5     | Erro: 18.00 | w1: -10.61 w2: -0.43   | teta: -66.00  |
Iteração 6     | Erro: 24.00 | w1: 22.39  w2: 87.57   | teta: -22.00  |
Iteração 7     | Erro: 20.00 | w1: -76.61 w2: 21.57   | teta: -66.00  |
Iteração 8     | Erro: 20.00 | w1: 22.39  w2: 65.57   | teta: -22.00  |
Iteração 9     | Erro: 20.00 | w1: 11.39  w2: -44.43  | teta: -66.00  |
Iteração 10    | Erro: 26.00 | w1: 44.39  w2: 43.57   | teta: -44.00  |
Iteração 11    | Erro: 22.00 | w1: -76.61 w2: 21.57   | teta: -66.00  |
Iteração 12    | Erro: 20.00 | w1: 22.39  w2: 65.57   | teta: -22.00  |
Iteração 13    | Erro: 20.00 | w1: 11.39  w2: -44.43  | teta: -66.00  |
Iteração 14    | Erro: 26.00 | w1: 44.39  w2: 43.57   | teta: -4

In [5]:
# Conferindo valores retornados pela função
print(f"w1 = {w1}")
print(f"w2 = {w2}")
print(f"teta = {teta}")


w1 = 44.392938371195726
w2 = 43.572278669900754
teta = -44.0


### Conjunto de Teste

In [6]:
# Criando dados
# Criando x1 e x2 como uma matriz de inputs, na qual coluna 1 = x1 e coluna 2 = x2
X = np.array([[0  , 0  ],
              [1  , 0  ],
              [4.5, 0.5],
              [3.5, 1.5],
              [4  , 2.5],
              [1.5, 1.5],
              [2  , 0.5],
              [2.5, 2.5]])

# Criando vetor de alvos
y = np.array([1, -1, -1, 1, 1, 1, -1, 1])


### Gerando estimativas

In [7]:
# Criando função para gerar estimativas
def adaline_predict(X, y, w1, w2, teta):

    # Inicializando o vetor de valores estimados
    y_hat_vector = []

    # Dimensão m de X
    m = X.shape[0]
    
    # Calculando y_hat para cada amostra
    for i in range(m):
        y_hat = X[i, 0] * w1 + X[i, 1] * w2 + teta
        
        # Atribuindo valores a y_hat de acordo com o limiar de decisão abaixo:
        y_hat = np.where(y_hat > 0, 1, -1)
        
        # Adicionando estimativa ao vetor de estimativas
        y_hat_vector.append(y_hat)
    
    # Convertendo o vetor para numpy array
    y_hat_vector = np.array(y_hat_vector)
    
    # Calculando erro
    erro_percent = np.count_nonzero(y_hat != y) / len(y) * 100
    
    print('Estimativas finalizadas')
    print(f"Erro Percentual: {erro_percent}%")
    print(f"Valores Estimados: {y_hat_vector}")
    print(f"Valores Alvo:      {y}")

    return


In [8]:
# Gerando estimativas
adaline_predict(X=X, y=y, w1=w1, w2=w2, teta=teta)


Estimativas finalizadas
Erro Percentual: 37.5%
Valores Estimados: [-1  1  1  1  1  1  1  1]
Valores Alvo:      [ 1 -1 -1  1  1  1 -1  1]


**Fim**