# Descenso por gradiente

En este notebook implementaremos un paso del método de descenso por gradiente. Este método nos sirve para encontrar los parámetros de la red de tal forma que la salida se asemeje a el valor objetivo.

![gradiente](https://github.com/irvingvasquez/cv2course_intro_nn/blob/master/files/gradient_descent_1n_notebook.png?raw=1)

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/irvingvasquez/cv2course_intro_nn/blob/master/03_descenso_unpaso.ipynb)

@juan1rving

In [1]:
# importamos paquetes
import numpy as np

## Definimos la red neuronal

In [2]:
# función de activación
def sigmoid(x):
    return 1/(1+np.exp(-x))

# Derivada de f
def sigmoid_prime(x):
    return sigmoid(x) * (1 - sigmoid(x))

# función h lineal
def function_h(X, W, b):
    return np.dot(W, X) + b

# Salida de la RN
def output_y(X,W,b):
    return sigmoid(function_h(X,W,b))

## Término de error

Escribe una función que calcule el término de error

$$\delta= (y-\hat{y})f' (h) = (y-\hat{y})f' (\sum_i w_i x_i)$$

In [3]:
# TODO: implementar el cálculo del término de error
def error_term(y,W,X,b):
    y_est=output_y(X,W,b)
    return (y-y_est)*(sigmoid_prime(y_est))

## Incremento

Escribe una función para determinar el incremento a uno de los pesos
$$\Delta w_i= \eta \delta x_i$$


In [4]:
# TODO: implementar el cálculo del incremento
def increment(W, X, b, eta, i, y):
    return eta*error_term(y,W,X,b)*X[i]    

## Verificar funcionamiento

A continuación implementemos una red de ejemplo y verificaremos que está funcionando almenos un paso del método de descenso por gradiente.

In [7]:
# valores de ejemplo
learning_rate = 0.3
x = np.array([1,1])
y = 5

# Initial weights
w = np.array([0.1,0.2])
b = 0

In [8]:
# Calcular la salida de la red
y_est=output_y(x,w,b)
print('Salida:', y_est)

# Calcula el error residual de la red

print('Error:', y-y_est)

# Calcula el termino de error

print('Termino de error:', error_term(y,w,x,b))


# Calcula el incremento de los pesos

dw0=increment(w, x, b, learning_rate, 0, y)
dw1=increment(w, x, b, learning_rate, 1, y)
print('Incremento w1:', dw0)
print('Incremento w2:', dw1)

# Calcula el nuevo valor del los pesos
w[0]+=dw0
w[1]+=dw1
print('Nuevos pesos:',w)

# Calcula el nuevo error
y_est=output_y(x,w,b)
print('Nuevo error:',y-y_est)


Salida: 0.574442516811659
Error: 4.425557483188341
Termino de error: 1.019911404726894
Incremento w1: 0.3059734214180682
Incremento w2: 0.3059734214180682
Nuevos pesos: [0.40597342 0.50597342]
Nuevo error: 4.28660161824467




Si el nuevo error es menor que el primer error de la red entonces nuesto método de descenso está funcionando.





