In [None]:
import numpy as np
import os
from mlp import MLP


## O que é uma Rede Neural MLP (Multi-Layer Perceptron)?

Trata-se de um tipo de rede neural artificial composta por várias camadas de neurônios. Cada neurônio em uma camada está conectado a todos os neurônios da camada seguinte. A rede MLP é composta basicamente pelas seguintes camadas:

- **Camada de entrada**: onde os dados entram na rede;
- **Camada(s) oculta(s)**: onde as conexões e transformações dos dados ocorrem através dos pesos e funções de ativação;
- **Camada de saída**: onde a previsão ou classificação é realizada;

A MLP é chamada de *perceptron multicamadas* porque possui uma ou mais camadas ocultas entre a entrada e a saída. Esse tipo de rede é capaz de resolver problemas não-linearmente separáveis, como o problema XOR.

### Algoritmo de Backpropagation

O backpropagation é o algoritmo comumente utilizado para treinar uma rede MLP, que funciona ajustando os pesos da rede de modo a minimizar o erro entre as previsões da rede e os valores reais. O processo de treinamento envolve duas fases principais:

1. **Forward Pass**: Os dados de entrada passam pela rede e produzem uma saída;
2. **Backward Pass**: O erro (diferença entre a saída prevista e a saída real) é propagado de volta pela rede, ajustando os pesos em cada camada para reduzir o erro na próxima iteração.

O ajuste dos pesos é feito utilizando o método do gradiente descendente, que atualiza os pesos proporcionalmente à derivada do erro em relação aos pesos.



## Problema XOR

O problema XOR é um exemplo clássico de problema que não pode ser resolvido por uma rede Perceptron simples, pois não é linearmente separável. Dessa forma, o MLP entra como uma forma de solucionar esse cenário.

### Definição

A função XOR é definida da seguinte forma:

- \( 0 ⊕ 0 = 0 \)
- \( 0 ⊕ 1 = 1 \)
- \( 1 ⊕ 0 = 1 \)
- \( 1 ⊕ 1 = 0 \)

Neste notebook, foi construída e treinada uma rede MLP para aprender a função XOR.


In [None]:
#XOR
X = np.array(
    [
        [0, 0], 
        [0, 1], 
        [1, 0], 
        [1, 1]
    ])

y = np.array([
        [0], # 0 xor 0 = 0
        [1], # 0 xor 1 = 1
        [1], # 1 xor 0 = 1
        [0]  # 1 xor 1 = 0
    ])

In [None]:
print(f"Dimensões de X_train: {X.shape}")
print(f"Dimensões de y_train: {y.shape}")
mlp = MLP(n_inputs=X.shape[1], n_hidden=X.shape[1], n_output=1)
mlp.treino(X, y, epochs=10000, eta=0.1)

In [None]:
for _ in range(len(X)):
    print(f'Input: {X[_]} | Output: {int(mlp.predict(X[_]) > 0.5)} | Expected: {y[_]}')

### Teste com mais de 2 entradas

In [None]:
from helper.load_data import load_data
import os
data_dir = os.path.join(os.getcwd(), '..', 'data', 'XOR')

for file in os.listdir(data_dir):
    print(f"Arquivo: {file}")
    file_path = os.path.join(data_dir, file)
    X, y = load_data(file_path=file_path)

    mlp = MLP(n_inputs=X.shape[1], n_hidden=X.shape[1], n_output=1)
    mlp.treino(X, y, epochs=10000, eta=0.1)

    print(f'Input: {X[_]} | Output: {int(mlp.predict(X[_]) > 0.5)} | Expected: {y[_]}')

## Problema de Auto-associação (Autoencoder)

O problema de auto-associação envolve treinar uma rede neural para mapear padrões de entrada em padrões de saída idênticos. Um exemplo clássico é utilizar matrizes de identidade como entrada e saída. A rede é composta de uma camada oculta com menos neurônios do que a camada de entrada/saída, o que obriga a rede a aprender uma codificação comprimida dos dados.

### Estrutura da Rede

- Para o caso de \(8x8\), usou-se 8 neurônios na camada de entrada, 3 neurônios na camada oculta e 8 neurônios na camada de saída (pois log2(8)=3).
- Para o caso de \(15x15\), usou-se 15 neurônios na entrada, 4 neurônios na camada oculta e 15 neurônios na saída (pois log2(15)≈4).

O objetivo é que a rede aprenda a realizar o mapeamento identidade, comprimindo os dados na camada oculta e depois decodificando-os para restaurar a saída original.

### Algoritmo

Utilizamos o algoritmo de backpropagation para ajustar os pesos da rede de modo a minimizar o erro entre a saída prevista e a saída real (matriz identidade).


In [None]:
caso_encoder = [
    {'N': 8, 'epochs': 10000},
    {'N': 15, 'epochs': 15000},
]

In [None]:
for caso in caso_encoder:
    N = caso['N']
    epochs = caso['epochs']
    
    # Identidade NxN
    X = np.identity(N)
    y = X.copy()

    # Camada escondida Log2(N)
    hidden_size = int(np.log2(N))
    
    # Teinar a rede para o encoder de tamanho N
    mlp = MLP(n_inputs=N, n_hidden=hidden_size, n_output=N)
    mlp.treino(y=X, X=y, epochs=epochs, eta=0.1)
    
    # 'Predict'
    predictions = mlp.predict(X)
    print(f"Predict: Encoder de tamanho N={N}:\n", np.round(predictions, decimals=2))
