In [8]:
import numpy as np

In [9]:
# Generador de datos
def data_generator(board, boards, i):
    if i < 9:
        for value in [1, 0, -1]:  # Posibles valores
            new_board = board.copy()
            new_board[i] = value
            data_generator(new_board, boards, i + 1)
    else:
        boards.append(board)  # Solo añadimos al final de la generación
    return boards

In [10]:
# Función de activación tanh y su derivada
def tanh(x):
    return np.tanh(x)

def tanh_derivative(x):
    return 1 - np.tanh(x)**2

In [11]:
# Inicialización del dataset
input_data = np.array(data_generator([0] * 9, [], 0))
output_data = input_data.copy()  # Sin normalización adicional porque usamos tanh

# Normalización opcional de los datos
input_data = (input_data - np.mean(input_data)) / np.std(input_data)  # Normalización por si es necesario
output_data = (output_data - np.mean(output_data)) / np.std(output_data)

In [12]:

# Parámetros de la red
input_size = 9
hidden_size = 18  # Más neuronas para captar relaciones
output_size = 9
learning_rate = 0.01  # Ajuste más suave
epochs = 10000  # Más iteraciones



In [13]:

# Inicialización de pesos y sesgos
np.random.seed(42)
weights_input_hidden = np.random.uniform(-1, 1, (input_size, hidden_size))
weights_hidden_output = np.random.uniform(-1, 1, (hidden_size, output_size))
bias_hidden = np.random.uniform(-1, 1, (1, hidden_size))
bias_output = np.random.uniform(-1, 1, (1, output_size))



In [14]:
# Entrenamiento
for epoch in range(epochs):
    # Propagación hacia adelante
    hidden_layer_input = np.dot(input_data, weights_input_hidden) + bias_hidden
    hidden_layer_output = tanh(hidden_layer_input)

    output_layer_input = np.dot(hidden_layer_output, weights_hidden_output) + bias_output
    predicted_output = tanh(output_layer_input)

    # Cálculo del error
    error = output_data - predicted_output
    mse = np.mean(np.square(error))

    # Propagación hacia atrás
    d_predicted_output = error * tanh_derivative(predicted_output)
    error_hidden_layer = np.dot(d_predicted_output, weights_hidden_output.T)
    d_hidden_layer = error_hidden_layer * tanh_derivative(hidden_layer_output)

    # Actualización de pesos y sesgos
    weights_hidden_output += np.dot(hidden_layer_output.T, d_predicted_output) * learning_rate
    bias_output += np.sum(d_predicted_output, axis=0, keepdims=True) * learning_rate

    weights_input_hidden += np.dot(input_data.T, d_hidden_layer) * learning_rate
    bias_hidden += np.sum(d_hidden_layer, axis=0, keepdims=True) * learning_rate

    # Opcional: Imprimir el error cada 1000 épocas
    if epoch % 1000 == 0:
        print(f"Epoch {epoch}/{epochs} - MSE: {mse}")

# Opcional: Imprimir el error final
print(f"Error final (MSE): {mse}")


Epoch 0/10000 - MSE: 1.6989785141298104


KeyboardInterrupt: 