# Descenso por gradiente

En este notebook implementaremos un solo paso del método de descenso por gradiente. El método es una técnica de optimización utilizada para encontrar el mínimo de una función de manera iterativa. En el contexto de redes neuronales, se utiliza para minimizar la función de costo, que mide el error entre las predicciones del modelo y los valores reales. El proceso comienza con una estimación inicial para los parámetros del modelo, y luego, en cada paso, ajusta estos parámetros en la dirección opuesta al gradiente de la función de costo, que indica la dirección de mayor aumento. La magnitud del ajuste en cada paso se determina por un parámetro llamado tasa de aprendizaje. El proceso se repite hasta alcanzar un mínimo local o hasta que el cambio en la función de costo entre iteraciones sea insignificante, indicando que el modelo ha convergido a una solución.

![gradiente](files/gradient_descent_1n_notebook.png)

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/irvingvasquez/cv2course_intro_nn/blob/master/03_descenso_unpaso.ipynb)

@juan1rving

In [None]:
# importamos paquetes
import numpy as np

### Definimos la red neuronal

Definiremos una red simple, una sola neurona. Es decir,

$$
\hat{y} = f(\sum w_i \cdot x_i + b)
$$

Y utilizaremos la función sigmoide:

$$
f(h) = \sigma(h)
$$

In [1]:
# función de activación
def sigmoid(x):
    return 1/(1+np.exp(-x))

# Derivada de f
def sigmoid_prime(x):
    return sigmoid(x) * (1 - sigmoid(x))

# función h lineal
def combinacion_lineal (X , W , b):
    h = np.dot(W,X) + b
    return h

# Neurona
def neurona(X,W,b):
    return sigmoid(combinacion_lineal(X,W,b))

### Término de error

Escribe una función que calcule el término de error

$$\delta= (y-\hat{y})f' (h) = (y-\hat{y})f' (\sum_i w_i x_i)$$

In [None]:
# TODO: implementar el cálculo del término de error
def error_term(y,W,X,b):
    pass

### Incremento

Escribe una función para determinar el incremento a uno de los pesos
$$\Delta w_i= \eta \delta x_i$$


In [2]:
# TODO: implementar el cálculo del incremento
def incremento(W, X, b, eta, i, y):
    pass
    

### Verificar funcionamiento

A continuación implementemos una red de ejemplo y verificaremos que está funcionando almenos un paso del método de descenso por gradiente.

In [None]:
# valores de ejemplo
learning_rate = 1.0
x = np.array([1,1])
y = 1.0

# Valores iniciales de los pesos
w = np.array([0.1,0.2])
b = 0

Utiliza las funciones previamente definidas para calcular lo siguiente:

In [None]:
# TODO Calcular la salida de la red
salida = None
print('Salida:', salida)

# TODO Calcula el error residual de la red
residual = None
print('Error:', residual)

# Calcula el incremento de los pesos
incremento = None
print('Incremento:', incremento)

# Calcula el nuevo valor del los pesos
nw = None
print('Nuevos pesos:', nw)

# Calcula el nuevo error
nuevo_error = None
print('Nuevo error:', nuevo_error)


Si el nuevo error es menor que el primer error de la red entonces nuesto método de descenso está funcionando.

Escribe tus conclusiones: 
