In [2]:
import numpy as np

# Função de ativação tanh e sua derivada
def tanh(x):
    return np.tanh(x)

def tanh_derivative(x):
    return 1 - x**2

# Dados de entrada (4 exemplos, 2 características)
X = np.array([[0, 0],
              [0, 1],
              [1, 0],
              [1, 1]])

# Saída esperada
y = np.array([[0], [1], [1], [0]])  # Problema do XOR


# Inicializa pesos aleatórios
np.random.seed(42)
pesos_entrada_oculta = np.random.uniform(-1, 1, (2, 5))  # 2 entradas -> 5 neurônios ocultos
pesos_oculta_saida = np.random.uniform(-1, 1, (5, 1))    # 5 neurônios ocultos -> 1 saída


# Taxa de aprendizado
learning_rate = 0.3

# Treinamento por 20.000 iterações
for epoch in range(20000):
    # Forward Pass
    camada_oculta = tanh(np.dot(X, pesos_entrada_oculta))  # Entrada -> Oculta
    camada_saida = tanh(np.dot(camada_oculta, pesos_oculta_saida))  # Oculta -> Saída

    # Erro
    erro = y - camada_saida

    # Backpropagation
    d_saida = erro * tanh_derivative(camada_saida)  # Gradiente da saída
    erro_oculta = d_saida.dot(pesos_oculta_saida.T)  # Propagação do erro para a camada oculta
    d_oculta = erro_oculta * tanh_derivative(camada_oculta)  # Gradiente da oculta

    # Atualização dos pesos
    pesos_oculta_saida += camada_oculta.T.dot(d_saida) * learning_rate
    pesos_entrada_oculta += X.T.dot(d_oculta) * learning_rate

    # Exibir erro a cada 1000 iterações
    if epoch % 1000 == 0:
        print(f"Erro na época {epoch}: {np.mean(np.abs(erro)):.4f}")

# Teste após treinamento
print("\nSaída final da rede após treinamento:")
print(camada_saida)

Erro na época 0: 0.4965
Erro na época 1000: 0.0092
Erro na época 2000: 0.0062
Erro na época 3000: 0.0050
Erro na época 4000: 0.0043
Erro na época 5000: 0.0038
Erro na época 6000: 0.0034
Erro na época 7000: 0.0032
Erro na época 8000: 0.0029
Erro na época 9000: 0.0028
Erro na época 10000: 0.0026
Erro na época 11000: 0.0025
Erro na época 12000: 0.0024
Erro na época 13000: 0.0023
Erro na época 14000: 0.0022
Erro na época 15000: 0.0021
Erro na época 16000: 0.0020
Erro na época 17000: 0.0020
Erro na época 18000: 0.0019
Erro na época 19000: 0.0019

Saída final da rede após treinamento:
[[0.00000000e+00]
 [9.96359175e-01]
 [9.96417702e-01]
 [2.83999840e-05]]
