# Gradiente descendiente

En este notebook implementaremos el gradiente descendiente.



In [None]:
# importamos los paquete necesarios
import numpy as np

# cargamos datos de ejemplo
from data_prep import features, targets, features_test, targets_test

n_records, n_features = features.shape
last_loss = None

# En este ejercicio por propósitos de analizar las salidas utilizaremos la misma semilla para los números aleatorios.
np.random.seed(42)

In [None]:
# Definimos algunas funciones necesarias
def sigmoid(x):
    """
    Sigmoide
    """
    return 1 / (1 + np.exp(-x))

## Inicialización de los pesos

En un principio no queremos tener todos los pesos en cero porque esto generaría en la salida una predicción nula. Por lo tanto, asignaremos los pesos iniciales de forma aleatoria y cercanos a cero. Otra recomendación es escalar los valores aleatorios es dependencia del número de entradas del nodo (n).

$$w = rand(1,\frac{1}{\sqrt{n}})$$



In [None]:
# Initialize weights. 
weights = np.random.normal(scale=1 / n_features**.5, size=n_features)


In [None]:
# Probemos la precisión de la red antes del gradiente descendiente
tes_out = sigmoid(np.dot(features_test, weights))
predictions = tes_out > 0.5
accuracy = np.mean(predictions == targets_test)
print("Prediction accuracy: {:.3f}".format(accuracy))

## Hiperparámetros de la red

Los hiperpámetros de la red indican el números de veces que se realiza el gradiente descendiete (épocas-epochs), la taza de aprendizaje (learn rate)


In [None]:
epochs = 1000
learnrate = 0.5

## Gradiente descendiente

En el siguiente código encontrarás la plantilla del gradiente descendiente. Completa el código faltante.

In [None]:
for e in range(epochs):
    del_w = np.zeros(weights.shape)
    # Para todos los renglones de ejemplo, asignar a x la entrada, y a y la salida deseada
    for x, y in zip(features.values, targets):

        # TODO: calcula la predicción de la red
        # Tip: NumPy provides a function that calculates the dot product of two arrays, 
        # which conveniently calculates h for us. 
        # The dot product multiplies two arrays element-wise, 
        # the first element in array 1 is multiplied by the first element in array 2, and so on. 
        # Then, each product is summed.
        output = None

        # TODO: calcula el error
        error = None

        # TODO: calcula el incremento
        delta_w += 0

    # TODO: Actualiza los pesos
    weights += 0

    # Ahora calculemos el error en el conjunto de datos de entrenamiento
    if e % (epochs / 10) == 0:
        out = sigmoid(np.dot(features, weights))
        loss = np.mean((out - targets) ** 2)
        if last_loss and last_loss < loss:
            print("Train loss: ", loss, "  WARNING - Loss Increasing")
        else:
            print("Train loss: ", loss)
        last_loss = loss


## Evaluemos la precisión de la red


In [None]:
# Calculate accuracy on test data
tes_out = sigmoid(np.dot(features_test, weights))
predictions = tes_out > 0.5
accuracy = np.mean(predictions == targets_test)
print("Prediction accuracy: {:.3f}".format(accuracy))