### Implementación NN.

In [51]:
import numpy as np

In [52]:
# Función sigmoide.

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

In [53]:
def initialize_parameters(n_x, n_h, ny):
    # n_x: input nodes
    # n_h: hidden layer nodes
    # ny: output nodes

    W1 = np.random.randn(n_h, n_x)
    b1 = np.zeros((n_h, 1))
    W2 = np.random.randn(ny, n_h)
    b2 = np.zeros((ny, 1))

    parameters = {"W1": W1,
                  "b1": b1,
                  "W2": W2,
                  "b2": b2}

    return parameters

In [54]:
def forward_prop(X, parameters):
    # Desempaqueta los parámetros del diccionario
    W1 = parameters["W1"]
    b1 = parameters["b1"]
    W2 = parameters["W2"]
    b2 = parameters["b2"]

    # Realiza la propagación hacia adelante
    Z1 = np.dot(W1, X) + b1
    A1 = np.tanh(Z1)
    Z2 = np.dot(W2, A1) + b2
    A2 = sigmoid(Z2)

    # Guarda los resultados en un diccionario
    cache = {
             "A1": A1,
             "A2": A2}

    return A2, cache

In [55]:
def calculate_cost(A2, Y):
    m = Y.shape[1]  # Número de ejemplos de entrenamiento

    # Calcula el costo
    logprobs = np.multiply(Y, np.log(A2)) + np.multiply(1 - Y, np.log(1 - A2))
    cost = -np.sum(logprobs) / m

    cost = np.squeeze(cost)  # Asegura que el costo sea un número y no una matriz de un solo elemento

    return cost


In [56]:
def backward_prop(X, Y, cache, parameters):
    m = X.shape[1]  # Número de ejemplos de entrenamiento

    # Desempaqueta los parámetros y la cache
    W1 = parameters["W1"]
    W2 = parameters["W2"]
    A1 = cache["A1"]
    A2 = cache["A2"]

    # Calcula los gradientes
    dZ2 = A2 - Y
    dW2 = np.dot(dZ2, A1.T) / m
    db2 = np.sum(dZ2, axis=1, keepdims=True) / m
    dZ1 = np.dot(W2.T, dZ2) * (1 - np.power(A1, 2))
    dW1 = np.dot(dZ1, X.T) / m
    db1 = np.sum(dZ1, axis=1, keepdims=True) / m

    # Guarda los gradientes en un diccionario
    gradients = {"dW1": dW1,
                 "db1": db1,
                 "dW2": dW2,
                 "db2": db2}

    return gradients


In [57]:
def update_parameters(parameters, grads, learning_rate):
    # Desempaqueta los parámetros y los gradientes
    W1 = parameters["W1"]
    b1 = parameters["b1"]
    W2 = parameters["W2"]
    b2 = parameters["b2"]

    dW1 = grads["dW1"]
    db1 = grads["db1"]
    dW2 = grads["dW2"]
    db2 = grads["db2"]

    # Actualiza los parámetros
    W1 -= learning_rate * dW1
    b1 -= learning_rate * db1
    W2 -= learning_rate * dW2
    b2 -= learning_rate * db2

    # Guarda los parámetros actualizados en un nuevo diccionario
    updated_parameters = {"W1": W1,
                          "b1": b1,
                          "W2": W2,
                          "b2": b2}

    return updated_parameters


In [58]:
def model(X, Y, n_x, n_h, n_y, num_of_iters, learning_rate):
    # Inicializa los parámetros
    parameters = initialize_parameters(n_x, n_h, n_y)

    for i in range(0, num_of_iters):
        # Propagación hacia adelante
        A2, cache = forward_prop(X, parameters)

        # Cálculo del costo
        cost = calculate_cost(A2, Y)

        # Retropropagación
        grads = backward_prop(X, Y, cache, parameters)

        # Actualización de los parámetros
        parameters = update_parameters(parameters, grads, learning_rate)

        # Imprime el costo cada 1000 iteraciones
        if i % 1000 == 0:
            print("Costo después de la iteración %i: %f" % (i, cost))

    return parameters

In [59]:
def predict(X, parameters):
    # Propagación hacia adelante
    A2, _ = forward_prop(X, parameters)

    # Redondea las predicciones a 0 o 1
    predictions = np.round(A2)

    return predictions

In [60]:
# Main body.

# # Haciendo los parámetors.
# parameters = initialize_parameters(5, 4, 2)
# print(parameters)

# X = np.random.randn(5, 10)

# A2, cache = forward_prop(X, parameters)

# # Calculando el A2 y el caché.
# print("A2: ", A2)
# print("Cache: ", cache)
  
# # Calculando el costo.
# cost = calculate_cost(A2, np.random.randn(2, 15))

# print("Costo: ", cost)

X = np.array([ [0, 0, 1, 1], [0, 1, 0, 1]])

A2, cache = forward_prop(X, initialize_parameters(2, 2, 1))

print("A2: ", A2)
print("Cache: ", cache)

cost = calculate_cost(A2, np.array([[0, 1, 1, 0]]))

print("Costo: ", cost)

grads = backward_prop(X, np.array([[0, 1, 1, 0]]), cache, initialize_parameters(2, 2, 1))

print("Gradientes: ", grads)

parameters = update_parameters(initialize_parameters(2, 2, 1), grads, 0.1)

print("Parámetros: ", parameters)

parameters = model(X, np.array([[0, 1, 1, 0]]), 2, 2, 1, 10000, 0.1)

print("Predicciones: ", predict(X, parameters))

A2:  [[0.5        0.1841866  0.70688886 0.25396255]]
Cache:  {'A1': array([[ 0.        , -0.49349726,  0.37107973, -0.14986113],
       [ 0.        ,  0.97556971, -0.49175867,  0.92994958]]), 'A2': array([[0.5       , 0.1841866 , 0.70688886, 0.25396255]])}
Costo:  0.7562035950462909
Gradientes:  {'dW1': array([[ 0.00178284,  0.1464435 ],
       [-0.01697244, -0.00045526]]), 'db1': array([[0.04828414],
       [0.02463562]]), 'dW2': array([[ 0.06394374, -0.10389263]]), 'db2': array([[-0.0887405]])}
Parámetros:  {'W1': array([[-0.90862491,  0.80775446],
       [-0.71390236, -0.42968812]]), 'b1': array([[-0.00482841],
       [-0.00246356]]), 'W2': array([[-1.77096318, -0.6235716 ]]), 'b2': array([[0.00887405]])}
Costo después de la iteración 0: 0.723314
Costo después de la iteración 1000: 0.366672


Costo después de la iteración 2000: 0.355425
Costo después de la iteración 3000: 0.352136
Costo después de la iteración 4000: 0.350597
Costo después de la iteración 5000: 0.349712
Costo después de la iteración 6000: 0.349140
Costo después de la iteración 7000: 0.348741
Costo después de la iteración 8000: 0.348447
Costo después de la iteración 9000: 0.348222
Predicciones:  [[0. 1. 0. 1.]]
