### Implementación NN.

In [1]:
import numpy as np

In [2]:
# Función sigmoide.

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

In [3]:
def initialize_parameters(n_x, n_h, ny):
    # n_x: input nodes
    # n_h: hidden layer nodes
    # ny: output nodes

    W1 = np.random.randn(n_h, n_x)
    b1 = np.zeros((n_h, 1))
    W2 = np.random.randn(ny, n_h)
    b2 = np.zeros((ny, 1))

    parameters = {"W1": W1,
                  "b1": b1,
                  "W2": W2,
                  "b2": b2}

    return parameters

In [4]:
def forward_prop(X, parameters):
    # Desempaqueta los parámetros del diccionario
    W1 = parameters["W1"]
    b1 = parameters["b1"]
    W2 = parameters["W2"]
    b2 = parameters["b2"]

    # Realiza la propagación hacia adelante
    Z1 = np.dot(W1, X) + b1
    A1 = np.tanh(Z1)
    Z2 = np.dot(W2, A1) + b2
    A2 = sigmoid(Z2)

    # Guarda los resultados en un diccionario
    cache = {
             "A1": A1,
             "A2": A2}

    return A2, cache

In [5]:
def calculate_cost(A2, Y):
    m = Y.shape[1]  # Número de ejemplos de entrenamiento

    # Calcula el costo
    logprobs = np.multiply(Y, np.log(A2)) + np.multiply(1 - Y, np.log(1 - A2))
    cost = -np.sum(logprobs) / m

    cost = np.squeeze(cost)  # Asegura que el costo sea un número y no una matriz de un solo elemento

    return cost


In [6]:
def backward_prop(X, Y, cache, parameters):
    m = X.shape[1]  # Número de ejemplos de entrenamiento

    # Desempaqueta los parámetros y la cache
    W1 = parameters["W1"]
    W2 = parameters["W2"]
    A1 = cache["A1"]
    A2 = cache["A2"]

    # Calcula los gradientes
    dZ2 = A2 - Y
    dW2 = np.dot(dZ2, A1.T) / m
    db2 = np.sum(dZ2, axis=1, keepdims=True) / m
    dZ1 = np.multiply(W2.T, dZ2) * (1 - np.power(A1, 2))
    dW1 = np.dot(dZ1, X.T) / m
    db1 = np.sum(dZ1, axis=1, keepdims=True) / m

    # Guarda los gradientes en un diccionario
    gradients = {"dW1": dW1,
                 "db1": db1,
                 "dW2": dW2,
                 "db2": db2}

    return gradients


In [7]:
def update_parameters(parameters, grads, learning_rate):
    # Desempaqueta los parámetros y los gradientes
    W1 = parameters["W1"]
    b1 = parameters["b1"]
    W2 = parameters["W2"]
    b2 = parameters["b2"]

    dW1 = grads["dW1"]
    db1 = grads["db1"]
    dW2 = grads["dW2"]
    db2 = grads["db2"]

    # Actualiza los parámetros
    W1 -= learning_rate * dW1
    b1 -= learning_rate * db1
    W2 -= learning_rate * dW2
    b2 -= learning_rate * db2

    # Guarda los parámetros actualizados en un nuevo diccionario
    updated_parameters = {"W1": W1,
                          "b1": b1,
                          "W2": W2,
                          "b2": b2}

    return updated_parameters


In [8]:
def model(X, Y, n_x, n_h, n_y, num_of_iters, learning_rate):
    # Inicializa los parámetros
    parameters = initialize_parameters(n_x, n_h, n_y)

    for i in range(0, num_of_iters+1):
        # Propagación hacia adelante
        A2, cache = forward_prop(X, parameters)

        # Cálculo del costo
        cost = calculate_cost(A2, Y)

        # Retropropagación
        grads = backward_prop(X, Y, cache, parameters)

        # Actualización de los parámetros
        parameters = update_parameters(parameters, grads, learning_rate)

        # Imprime el costo cada 1000 iteraciones
        if i % 100 == 0:
            print("Costo después de la iteración %i: %f" % (i, cost))

    return parameters

In [9]:
def predict(X, parameters):
    # Propagación hacia adelante
    A2, _ = forward_prop(X, parameters)

    yhat = A2
    yhat = np.squeeze(yhat)
    if(yhat >= 0.5):
        y_predict = 1
    else:
        y_predict = 0

    return y_predict

In [10]:
# Main body.
print("Convergencia con cero")
np.random.seed(2)

# The 4 training examples by columns
X = np.array([[0, 0, 1, 1], [0, 1, 0, 1]])

# The outputs of the XOR for every example in X
Y = np.array([[0, 1, 1, 0]])

# No. of training examples
m = X.shape[1]

# Set the hyperparameters
n_x = 2     #No. of neurons in first layer
n_h = 2     #No. of neurons in hidden layer
n_y = 1     #No. of neurons in output layer
num_of_iters = 1000
learning_rate = 0.3

trained_parameters = model(X, Y, n_x, n_h, n_y, num_of_iters, learning_rate)

# Test 2X1 vector to calculate the XOR of its elements. 
# Try (0, 0), (0, 1), (1, 0), (1, 1)
X_test = np.array([[1], [1]])

print(trained_parameters)

y_predict = predict(X_test, trained_parameters)

print('Neural Network prediction for example ({:d}, {:d}) is {:d}'.format(
    X_test[0][0], X_test[1][0], y_predict))

print("Convergencia con números aleatorios")
# Configurar la semilla aleatoria para reproducibilidad
np.random.seed(42)

# The 4 training examples by columns
X = np.random.randint(2, size=(2, 4))

# The outputs of the XOR for every example in X
Y = np.array([[0, 1, 1, 0]])

# No. of training examples
m = X.shape[1]

# Set the hyperparameters
n_x = 2     # No. of neurons in first layer
n_h = 2     # No. of neurons in hidden layer
n_y = 1     # No. of neurons in output layer
num_of_iters = 1000
learning_rate = 0.3

trained_parameters = model(X, Y, n_x, n_h, n_y, num_of_iters, learning_rate)

# Test 2X1 vector to calculate the XOR of its elements. 
# Try (0, 0), (0, 1), (1, 0), (1, 1)
X_test = np.random.randint(2, size=(2, 1))

print("Trained parameters:")
print(trained_parameters)

y_predict = predict(X_test, trained_parameters)

print('Neural Network prediction for example ({:d}, {:d}) is {:d}'.format(
    X_test[0][0], X_test[1][0], int(y_predict)))

Convergencia con números aleatorios
Costo después de la iteración 0: 0.617562
Costo después de la iteración 100: 0.490830
Costo después de la iteración 200: 0.483789
Costo después de la iteración 300: 0.481549
Costo después de la iteración 400: 0.480461
Costo después de la iteración 500: 0.479820
Costo después de la iteración 600: 0.479398
Costo después de la iteración 700: 0.479100
Costo después de la iteración 800: 0.478879
Costo después de la iteración 900: 0.478707
Costo después de la iteración 1000: 0.478571
Trained parameters:
{'W1': array([[-0.89721227, -0.89719585],
       [ 1.78286038,  0.97108229]]), 'b1': array([[ 0.07888425],
       [-0.65654057]]), 'W2': array([[-1.96380786,  2.61708767]]), 'b2': array([[0.96998979]])}
Neural Network prediction for example (1, 1) is 1
