Grafica y obten el valor mínimo/máximo de la siguientes funciones ([help](https://colab.research.google.com/drive/1o57iUVzKWifaQ3W3tjmmrw33yk8RlGfp?usp=sharing)):

f(x,y) = x^2+y^6+y^5-y^3

f(x,y) =-50+x^2+y^2

f(x,y) =-abs(x)-y^2

In [1]:
import numpy as np

import plotly.graph_objects as go

In [2]:
def gradient_descent(gradient, start, learn_rate, n_iter):
    vector = start
    for _ in range(n_iter):
        diff = -learn_rate * gradient(vector)
        vector += diff
    return vector


In [3]:
def grad_des_graph(x1:float, x2:float, y1:float, y2:float, resolution:int, function, gradient, start, learn_rate:float, n_iter:int):
    '''
    Fucion que grafica el descenso del gradiente dada una función en dos variables
    Entrada:
        x1: Limite inferior del eje x
        x2: Limite superior del eje x
        y1: Limite inferior del eje y
        y2: Limite superior del eje y
        resolution: Numero de puntos entre los extremos de los ejes
        function: Funcion a graficar
        gradient: Gradiente de la funcion dada
        start: Punto en donde se va a empezar el descenso del gradiente
        learn_rate: Tasa de aprendizaje
        n_iter: Numero de iteraciones
    '''

    #Definimos el espacio en donde se va a graficar
    x = np.linspace(x1, x2, resolution)
    y = np.linspace(y1, y2, resolution)
    X, Y = np.meshgrid(x, y)
    Z = function(X, Y)

    #Graficamos la funcion
    fig = go.Figure(data = go.Surface(z = Z, x = X, y = Y))
    fig.update_traces(contours_z=dict(show=True, usecolormap=True, highlightcolor="limegreen", project_z=True))
    fig.update_layout(scene = dict(
                            xaxis = dict(backgroundcolor="#89EEC6"),
                            yaxis = dict(backgroundcolor="#CA89EE"),
                            zaxis = dict(backgroundcolor="#EEE789")
                            ),
                            width=700,
                            margin=dict(
                            r=10, l=10,
                            b=10, t=30)
                            )
    fig.show()

    #Algoritmo del descenso del gradiente
    min = start
    tracex = []
    tracey = []
    for i in range(n_iter):
            diff = -learn_rate * gradient(min)
            min += diff

            #Guardamos la posicion de cada 10 pasos
            if i%10 == 0:
                tracex.append(min[0])
                tracey.append(min[1])

            if i == n_iter - 1:
                #Redondeamos a tres decimales
                min = min.round(3)

                #Graficamos las curvas de nivel y el movimiento del descenso del gradiente
                fig = go.Figure()
                fig.add_trace(
                    go.Contour(z = Z, x = x, y = y, ncontours=40, showscale=False)
                )

                fig.add_trace(
                    go.Scatter(x = tracex, y = tracey, mode="markers+lines", name="steepest", line=dict(color="#99E5DF")
                    )
                )

                fig.show()
                    
    print(f'El mínimo está en ({min[0], min[1]})')


# Función 1
$$f(x,y) = x^2+y^6+y^5-y^3$$

In [4]:
#Definimos la funcion dada
def f1(x,y):
    return x**2+y**6+y**5-y**3

#Calculamos el gradiente de la funcion
def grad1(vector):
    return np.array([2*vector[0], 6*vector[1]**5 + 5*vector[1]**4 - 3*vector[1]**2])

start1 = np.array([np.random.rand(), np.random.rand()])
grad_des_graph(-1, 1, -1, 1, 100, f1, grad1, start1, 0.01, 600)

El mínimo está en ((0.0, 0.592))


# Funcion 2
$$f(x,y) =-50+x^2+y^2$$

In [5]:
def f2(x,y):
    return -50+x**2+y**2

def grad2(vector):
    return np.array([2*vector[0], 2*vector[1]])	

start2 = np.array([np.random.rand()*10, np.random.rand()*10])

grad_des_graph(-10, 10, -10, 10, 100, f2, grad2, start2, 0.01, 600)

El mínimo está en ((0.0, 0.0))


# Función 3
$$f(x,y) =\mid x\mid - y^2$$

Podemos notar que la derivada parcial respecto a $x$ es una función definida por partes, va a valer 1 en los numero positivos y -1 en los negativos

Como dicha derivada solo toma dos valores y ninguno de ellos es cero, entonces en ningún momento el vector gradiente se va a hacer cero, por lo que no hay ni puntos máximos ni mínimos en la función dada, por lo que el algoritmo del descenso del gradiente no nos va a llevar a un unico punto.

In [6]:
def f3(x,y):
    return np.abs(x) - y**2

#Como la funcion tiene valor absoluto, entonces vamos a calcular dos gradientes y vamos a 
# aplicar el algoritmo dos veces, cuando x es positivo y cuando x es negativo
def grad3_1(vector):
    return np.array([1, -2*vector[1]])	

start3 = np.array([np.random.rand(), np.random.rand()])

grad_des_graph(0, 10, -10, 10, 100, f3, grad3_1, start3, 0.01, 1000)

El mínimo está en ((-9.743, 17302688.085))


Si ponemos la tasa de aprendizaje en $0.01$ entonces el algoritmo del descenso nos lleva a valores de $y$ muy lejanos, pues entre más grande sea $y$ menor será el valor de la función

Por lo tanto, la función no tiene ni máximos ni mínimos locales/globales

Respondan a las siguientes preguntas:

-¿Que sucede si incrementas la tasa de aprendizaje?
Si la tasa de aprendizaje es relativamente chica, el valor final que nos da el algoritmo va a ser cercano al valor inicial, pero si la tasa es mayor que 0.01, entonces el algoritmo nos va a dar un punto el cual tiene un número muy grande en la coordenada $y$ debido a que entre más crece dicho valor, menor será la evaluación en dicho punto

-¿Siempre resulta el mismo punto mínimo/máximo?
No, pues la función no está acotada y no existen máximos/mínimos locales/globales

# Repaso

Escribe un tensor de 4 dimensiones usando numpy, es decir, que al usar tensor.shape de 4 valores (v1,v2,v3,v4)

In [7]:
matriz = np.array([[1, 2,3], [4, 5, 6], [7, 8, 9]])

tensor = np.array([[matriz], [matriz]])

tensor.shape

(2, 1, 3, 3)