# Gradiente Descendente

En este notebook implementaremos un paso del gradiente descendente.

![gradiente](files/gradient_descent_1n_notebook.png)


In [1]:
# importamos paquetes
import numpy as np

## Definimos la RN

In [2]:
# función de activación
def sigmoid(x):
    return 1/(1+np.exp(-x))

# Derivada de f
def sigmoid_prime(x):
    return sigmoid(x) * (1 - sigmoid(x))

# función h lineal
def function_h(X, W, b):
    return np.dot(W, X) + b

# Salida de la RN
def output_y(X,W,b):
    return sigmoid(function_h(X,W,b))

## Término de error

Escribe una función que calcule el término de error

$$\delta= (y-\hat{y})f' (h) = (y-\hat{y})f' (\sum_i w_i x_i)$$

In [3]:
def error_term(y,W,X,b):
    error = y - output_y(X,W,b)
    delta = error * sigmoid_prime(function_h(X,W,b))
    return delta

## Incremento

Escribe una función para determinar el incremento a uno de los pesos
$$\Delta w_i= \eta \delta x_i$$


In [4]:
def increment(W, X, b, eta, i, y):
    incremento = eta * error_term(y,W,X,b) * X[i]
    return incremento
    

## Ejemplo

Implementemos una red de ejemplo 

In [5]:
# valores de ejemplo
learning_rate = 0.1
x = np.array([1,1])
y = 5

# Initial weights
w = np.array([0.1,0.2])
b = 0

In [6]:
# Calcular la salida de la red
salida = output_y(x, w, b)
print('Salida:', salida)

# Calcula el error residual de la red
residual = y - salida
print('Error:', residual)

# Calcula el incremento de los pesos
incremento = [increment(w, x, b, learning_rate, 0, y), increment(w, x, b, learning_rate, 1, y)]
print('Incremento:', incremento)

# Calcula el nuevo valor del los pesos
n_w = w + incremento
print('Nuevos pesos:', n_w)

# Calcula el nuevo error
n_error = y - output_y(x, n_w, b)
print('Nuevo error:', n_error)


Salida: 0.574442516811659
Error: 4.425557483188341
Incremento: [0.10818643106305684, 0.10818643106305684]
Nuevos pesos: [0.20818643 0.30818643]
Nuevo error: 4.373700770233137
