# Gradiente Descendiente

En este notebook implementaremos un paso del gradiente descendiente


In [1]:
# importamos paquetes
import numpy as np

## Definimos la RN

In [2]:
# función de activación
def sigmoid(x):
    return 1/(1+np.exp(-x))

# Derivada de f
def sigmoid_prime(x):
    return sigmoid(x) * (1 - sigmoid(x))

# función h lineal
def function_h(X, W, b):
    return np.dot(W, X) + b

# Salida de la RN
def function_f(X,W,b):
    return sigmoid(function_h(X,W,b))

## Termino de error

Escribe una función que calcule el término de error

$$\delta= (y-\hat{y})f' (h) = (y-\hat{y})f' (\sum_i w_i x_i)$$

In [3]:
def error_term(y,W,X):
    error = y - function_f(X,W,0)
    return error * sigmoid_prime(function_h(X,W,0))

## Incremento

Escribe una función para determinar el incremento a los pesos

$$\Delta w_i= \eta \delta x_i$$

Recuerda que si hay mas de un peso debes devolver un vector

In [4]:
def increment(X, eta, i, y):
     return eta * error_term(y,W,X) * X[i]

## Ejemplo

Implementemos una red de ejemplo 

In [5]:
# valores de ejemplo
learnrate = 0.5
x = np.array([1, 2])
y = np.array(0.5)

# Initial weights
w = np.array([0.5, -0.5])

In [6]:
# Calcular la salida de la red
nn_output = function_f(x,w,0)

# Calcula el error residual de la red
error = y - function_f(x,w,0)

# TODO: Calcula el incremento de los pesos
del_w = [learnrate * error_term(y,w,x) * x[0], learnrate * error_term(y,w,x) * x[1]]

# TODO: Calcula el nuevo valor del los pesos

In [8]:
print('Neural Network output:')
print(nn_output)
print('Amount of Error:')
print(error)
print('Change in Weights:')
print(del_w)


Neural Network output:
0.3775406687981454
Amount of Error:
0.1224593312018546
Change in Weights:
[0.01438919871308019, 0.02877839742616038]
