# **Optimización de las funciones en dos y tres dimensiones usando el método de descenso por gradiente con condición inicial aleatoria**


## **Descenso por gradiente en dos dimensiones**
Ahora escribimos el método numérico de descenso por gradiente para la función de Rastrigin en dos dimensiones, definida por:

$f(x_{1}, x_{2}) = 20 + x_{1}^2 + x_{2}^2 - 10(\cos(2 \pi x_{1}) + \cos(2 \pi x_{2}))$



In [None]:
import numpy as np

# Definimos la función Rastrigin 2 dimensiones

def rastrigin_2_dim(x,y):
    return 20 + (x)**2 + (y)**2 - 10 * (np.cos(2*np.pi*x) + np.cos(2*np.pi*y))

In [None]:
# Ahora definimos el vector gradiente de la función

def gradiente_rastrigin_2_dim(x,y):
    df_dx = 2*x + 20*np.pi*np.sin(2*np.pi*x)
    df_dy = 2*y + 20*np.pi*np.sin(2*np.pi*y)
    return [df_dx, df_dy]


In [None]:
import numpy as np

# Escribimos el método iterativo en 2d

def desc_grad_2d(grad , x0 , max_iter , tol , lr  ):
    iter = 0
    new_grad = grad(x0[0], x0[1])
    new_point = x0 - lr*np.array(new_grad)
    all_solutions = [x0,new_point]

    #El error es la norma del gradiente actual
    error = np.linalg.norm(np.array(new_grad))

    while(iter < max_iter and error > tol):
        new_grad = grad(new_point[0], new_point[1])
        new_point = new_point - lr*np.array(new_grad)
        error =  np.linalg.norm(np.array(new_grad))
        all_solutions.append(new_point)
        iter+=1

    return (new_point, all_solutions)


Veamos que al invocar la función con parámetros extremos, como máximo de iteraciones igual a 10mil y un error de 10-e9, alcanzamos diferentes soluciones que están más alejadas a la real (0,0) porque la función de Rastrigin está llena de mínimos locales.

In [None]:
import random
# Máximo de iteraciones
iter= 1000
# Tolerancia
toler = 0.00001
# Tasa de aprendizaje
eps= 0.05

ini_x = random.uniform(-5.12, 5.12)
ini_y = random.uniform(-5.12, 5.12)

pto_ini = [ini_x,ini_y]

sol, all_solutions = desc_grad_2d(grad = gradiente_rastrigin_2_dim,x0 =pto_ini,max_iter= iter, tol = toler, lr = eps )

print(f'Número de iteraciones:{iter}')
print(f'Tolerancia soportada:{toler}')
print(f'Tasa de aprendizaje (paso):{eps}')

print(f'Punto inicial aleatorio:{pto_ini}')
print(f'Solución alcanzada: {sol}')
print(f'Número de soluciones obtenidas: {len(all_solutions)}')

Número de iteraciones:1000
Tolerancia soportada:1e-05
Tasa de aprendizaje (paso):0.05
Punto inicial aleatorio:[1.019154273008259, -1.879588372735899]
Solución alcanzada: [-2.32748182 -1.22309218]
Número de soluciones obtenidas: 1002


In [None]:
import matplotlib.pyplot as plt
import imageio
import random
from IPython.display import Video
from moviepy.editor import VideoFileClip


# Seteo los ejes sobre los que voy a trabajar
plt.xlim(-3, 3)
plt.ylim(-3, 3)

# Generamos la nube de puntos sobre la que se generarán las curvas de nivel
x = np.linspace(-3, 3, 100)
y = np.linspace(-3, 3, 100)
x, y = np.meshgrid(x, y)
z = rastrigin_2_dim(x, y)

# Generamos las curva de nivel de la función
plt.contour(x, y, z)

# Etiquetas de los ejes
plt.xlabel('$x_{1} \;  \in \; \mathbb{R}$')
plt.ylabel('$x_{2} \;  \in \; \mathbb{R}$')

# Solucion real
plt.scatter(0, 0, color='blue', label='(0, 0)')

punto_x = pto_ini[0]
punto_y = pto_ini[1]


# Mostrar el gráfico
plt.colorbar(label='Niveles en  $z \; \in \mathbb{R}$')
plt.title(f'Solución 1ra ejecución X{punto_x},{punto_y}')
plt.grid(True)

images = []
# Colors to plot points that are the best solution of each generation so that if points overlap the change is seen
colors = ['red', 'yellow', 'green', 'orange', 'pink']

for punto  in range(0,len(all_solutions),50):

    punto_x = '%.5f'%all_solutions[punto][0]
    punto_y = '%.5f'%all_solutions[punto][1]

    # Se geeneran las etiquetas de cada frame del video y su respectiva generación
    plt.title(f'Solución 1ra ejecución x{punto_x, punto_y}')

    # Graficar la mejor solución de cada generación
    plt.scatter(all_solutions[punto][0], all_solutions[punto][1], color = colors[random.randint(0, 4)])

    # Se guarda cada frame como imagen para luego usar las imagenes guardadas para generar el video
    plt.savefig(f'Solución 1ra ejecución X{punto_x},{punto_y}.png')

    # Se agrega la imagen a la lista de imagenes para luego generar el gif
    images.append(imageio.imread(f'Solución 1ra ejecución X{punto_x},{punto_y}.png'))

# Se genera el gif a partir de la lista de imagenes y se guarda en el sistema de archivos
imageio.mimsave('rosenbrock_contour.gif', images, fps=1000)

# Para no mostrar la figura actual aún
plt.close()

gif_path = 'rosenbrock_contour.gif'

# Convertir GIF a video
clip = VideoFileClip(gif_path)
video_path = 'output.mp4'
clip.write_videofile(video_path, fps=1000, logger=None)

# Mostrar el video
Video(video_path, embed=True)


  images.append(imageio.imread(f'Solución 1ra ejecución X{punto_x},{punto_y}.png'))



Segunda corrida aleatoria:

In [None]:
#Segunda corrida aleatoria

import random
# Máximo de iteraciones
iter= 1000
# Tolerancia
toler = 0.00001
# Tasa de aprendizaje
eps= 0.05

ini_x = random.uniform(-5.12, 5.12)
ini_y = random.uniform(-5.12, 5.12)

pto_ini = [ini_x,ini_y]

sol, all_solutions = desc_grad_2d(grad = gradiente_rastrigin_2_dim,x0 =pto_ini,max_iter= iter, tol = toler, lr = eps )

print(f'Número de iteraciones:{iter}')
print(f'Tolerancia soportada:{toler}')
print(f'Tasa de aprendizaje (paso):{eps}')

print(f'Punto inicial aleatorio:{pto_ini}')
print(f'Solución alcanzada: {sol}')
print(f'Número de soluciones obtenidas: {len(all_solutions)}')

Número de iteraciones:1000
Tolerancia soportada:1e-05
Tasa de aprendizaje (paso):0.05
Punto inicial aleatorio:[0.5076954513885825, 1.370356472290224]
Solución alcanzada: [-1.0091183   0.82266068]
Número de soluciones obtenidas: 1002


In [None]:
import matplotlib.pyplot as plt
import imageio
import random
from IPython.display import Video
from moviepy.editor import VideoFileClip


# Seteo los ejes sobre los que voy a trabajar
plt.xlim(-3, 3)
plt.ylim(-3, 3)

# Generamos la nube de puntos sobre la que se generarán las curvas de nivel
x = np.linspace(-3, 3, 100)
y = np.linspace(-3, 3, 100)
x, y = np.meshgrid(x, y)
z = rastrigin_2_dim(x, y)

# Generamos las curva de nivel de la función
plt.contour(x, y, z)

# Etiquetas de los ejes
plt.xlabel('$x_{1} \;  \in \; \mathbb{R}$')
plt.ylabel('$x_{2} \;  \in \; \mathbb{R}$')

# Solucion real
plt.scatter(0, 0, color='blue', label='(0, 0)')

punto_x = pto_ini[0]
punto_y = pto_ini[1]


# Mostrar el gráfico
plt.colorbar(label='Niveles en  $z \; \in \mathbb{R}$')
plt.title(f'Solución 1ra ejecución X{punto_x},{punto_y}')
plt.grid(True)

images = []
# Colors to plot points that are the best solution of each generation so that if points overlap the change is seen
colors = ['red', 'yellow', 'green', 'orange', 'pink']

for punto  in range(0,len(all_solutions),50):

    punto_x = '%.5f'%all_solutions[punto][0]
    punto_y = '%.5f'%all_solutions[punto][1]

    # Se geeneran las etiquetas de cada frame del video y su respectiva generación
    plt.title(f'Solución 1ra ejecución x{punto_x, punto_y}')

    # Graficar la mejor solución de cada generación
    plt.scatter(all_solutions[punto][0], all_solutions[punto][1], color = colors[random.randint(0, 4)])

    # Se guarda cada frame como imagen para luego usar las imagenes guardadas para generar el video
    plt.savefig(f'Solución 1ra ejecución X{punto_x},{punto_y}.png')

    # Se agrega la imagen a la lista de imagenes para luego generar el gif
    images.append(imageio.imread(f'Solución 1ra ejecución X{punto_x},{punto_y}.png'))

# Se genera el gif a partir de la lista de imagenes y se guarda en el sistema de archivos
imageio.mimsave('rosenbrock_contour.gif', images, fps=1000)

# Para no mostrar la figura actual aún
plt.close()

gif_path = 'rosenbrock_contour.gif'

# Convertir GIF a video
clip = VideoFileClip(gif_path)
video_path = 'output.mp4'
clip.write_videofile(video_path, fps=1000, logger=None)

# Mostrar el video
Video(video_path, embed=True)


  images.append(imageio.imread(f'Solución 1ra ejecución X{punto_x},{punto_y}.png'))



## **Descenso por gradiente en tres dimensiones**

$f(x_{1}, x_{2}, x_{3}) = 30 + x_{1}^2 + x_{2}^2 + x_{3}^2 - 10(\cos(2 \pi x_{1}) + \cos(2 \pi x_{2}) + \cos(2 \pi x_{3}))$



In [None]:
# Función de Rastrigin en 3 dimensiones
def rastrigin_3_dim(x, y, z):
    A = 10
    n = 3
    return A*n + (x**2 - A * np.cos(2 * np.pi * x)) + (y**2 - A * np.cos(2 * np.pi * y)) + (z**2 - A * np.cos(2 * np.pi * z))

In [None]:
# Función de Rastrigin en 3 dimensiones con respecto a y,z
def rastrigin_3_dim_y_z(y, z):
    A = 10
    n = 3
    return A*n + (0 - A * np.cos(2 * np.pi * 0)) + (y**2 - A * np.cos(2 * np.pi * y)) + (z**2 - A * np.cos(2 * np.pi * z))

In [None]:
# Función de Rastrigin en 3 dimensiones con respecto a x,z
def rastrigin_3_dim_x_z(x, z):
    A = 10
    n = 3
    return A*n + (x**2 - A * np.cos(2 * np.pi * x)) + (0 - A * np.cos(2 * np.pi * 0)) + (z**2 - A * np.cos(2 * np.pi * z))

In [None]:
def gradiente_rastrigin_3_dim(x,y,z):
    A = 10
    df_dx = 2 * x + 2 * np.pi * A * np.sin(2 * np.pi * x)
    df_dy = 2 * y + 2 * np.pi * A * np.sin(2 * np.pi * y)
    df_dz = 2 * z + 2 * np.pi * A * np.sin(2 * np.pi * z)
    return [df_dx, df_dy, df_dz]

In [None]:
import numpy as np

# Escribimos el método iterativo en 3d

def desc_grad_3d(grad , x0 , max_iter , tol , lr  ):
    iter = 0
    new_grad = grad(x0[0], x0[1], x0[2])
    new_point = x0 - lr*np.array(new_grad)
    all_solutions = [x0,new_point]

    #El error es la norma del gradiente actual
    error = np.linalg.norm(np.array(new_grad))

    while(iter < max_iter and error > tol):
        new_grad = grad(new_point[0], new_point[1], new_point[2])
        new_point = new_point - lr*np.array(new_grad)
        error =  np.linalg.norm(np.array(new_grad))
        all_solutions.append(new_point)
        iter+=1

    return (new_point, all_solutions)

In [None]:
import random
# Máximo de iteraciones
iter= 1000
# Tolerancia
toler = 0.00001
# Tasa de aprendizaje
eps= 0.05

ini_x = random.uniform(-5.12, 5.12)
ini_y = random.uniform(-5.12, 5.12)
ini_z = random.uniform(-5.12, 5.12)


pto_ini= [ini_x,ini_y, ini_z]

sol, all_solutions = desc_grad_3d(grad = gradiente_rastrigin_3_dim,x0 =pto_ini,max_iter= iter, tol = toler, lr = eps )

print(f'Número de iteraciones:{iter}')
print(f'Tolerancia soportada:{toler}')
print(f'Tasa de aprendizaje (paso):{eps}')

print(f'Punto inicial aleatorio:{pto_ini}')
print(f'Solución alcanzada: {sol}')
print(f'Número de soluciones obtenidas: {len(all_solutions)}')

Número de iteraciones:1000
Tolerancia soportada:1e-05
Tasa de aprendizaje (paso):0.05
Punto inicial aleatorio:[4.985874019085199, -3.3768015360471044, 0.9972242768096944]
Solución alcanzada: [ 5.38799957 -2.5706766   5.18916913]
Número de soluciones obtenidas: 1002


Graficamos con respecto a X1 y X3

In [None]:
import matplotlib.pyplot as plt
import imageio
import random
from IPython.display import Video
from moviepy.editor import VideoFileClip


# Seteo los ejes sobre los que voy a trabajar
plt.xlim(-5.12, 5.12)
plt.ylim(-5.12, 5.12)

# Generamos la nube de puntos sobre la que se generarán las curvas de nivel
x = np.linspace(-5.12, 5.12, 100)
z = np.linspace(-5.12, 5.12, 100)
x, z = np.meshgrid(x, z)
w = rastrigin_3_dim_x_z(x, z)

# Generamos las curva de nivel de la función
plt.contour(x, z, w)

# Etiquetas de los ejes
plt.xlabel('$x_{1} \;  \in \; \mathbb{R}$')
plt.ylabel('$x_{3} \;  \in \; \mathbb{R}$')

# Solucion real
plt.scatter(0, 0, color='blue', label='(0, 0)')

punto_x = pto_ini[0]
punto_y = pto_ini[1]


# Mostrar el gráfico
plt.colorbar(label='Niveles  $\;  \in \mathbb{R}$')
plt.title(f'Solucion 3d respecto X1, X3{punto_x},{punto_y}')
plt.grid(True)

images = []
# Colors to plot points that are the best solution of each generation so that if points overlap the change is seen
colors = ['red', 'yellow', 'green', 'orange', 'pink']

for punto  in range(0,len(all_solutions),100):

    punto_x = '%.5f'%all_solutions[punto][0]
    punto_z = '%.5f'%all_solutions[punto][1]

    # Se generan las etiquetas de cada frame del video y su respectiva generación
    plt.title(f'Solucion 3d respecto X1, X3{punto_x, punto_z}')

    # Graficar la mejor solución de cada generación
    plt.scatter(all_solutions[punto][0], all_solutions[punto][1], color = colors[random.randint(0, 4)])

    # Se guarda cada frame como imagen para luego usar las imagenes guardadas para generar el video
    plt.savefig(f'Solucion 3d respecto X1, X3{punto_x},{punto_y}.png')

    # Se agrega la imagen a la lista de imagenes para luego generar el gif
    images.append(imageio.imread(f'Solucion 3d respecto X1, X3{punto_x},{punto_y}.png'))

# Se genera el gif a partir de la lista de imagenes y se guarda en el sistema de archivos
imageio.mimsave('rosenbrock_contour.gif', images, fps=1000)

# Para no mostrar la figura actual aún
plt.close()


gif_path = 'rosenbrock_contour.gif'

# Convertir GIF a videos
clip = VideoFileClip(gif_path)
video_path = 'output.mp4'
clip.write_videofile(video_path, fps=1000, logger=None)

# Mostrar el video
Video(video_path, embed=True)

  images.append(imageio.imread(f'Solucion 3d respecto X1, X3{punto_x},{punto_y}.png'))



Graficamos con respecto a X2 y X3

In [None]:
import matplotlib.pyplot as plt
import imageio
import random
from IPython.display import Video
from moviepy.editor import VideoFileClip


# Seteo los ejes sobre los que voy a trabajar
plt.xlim(-5.12, 5.12)
plt.ylim(-5.12, 5.12)

# Generamos la nube de puntos sobre la que se generarán las curvas de nivel
x = np.linspace(-5.12, 5.12, 100)
z = np.linspace(-5.12, 5.12, 100)
x, z = np.meshgrid(x, z)
w = rastrigin_3_dim_y_z(x, z)

# Generamos las curva de nivel de la función
plt.contour(x, z, w)

# Etiquetas de los ejes
plt.xlabel('$x_{2} \;  \in \; \mathbb{R}$')
plt.ylabel('$x_{3} \;  \in \; \mathbb{R}$')

# Solucion real
plt.scatter(0, 0, color='blue', label='(0, 0)')

punto_x = pto_ini[0]
punto_y = pto_ini[1]


# Mostrar el gráfico
plt.colorbar(label='Niveles  $\;  \in \mathbb{R}$')
plt.title(f'Solucion 3d respecto X2, X3{punto_x},{punto_y}')
plt.grid(True)

images = []
# Colors to plot points that are the best solution of each generation so that if points overlap the change is seen
colors = ['red', 'yellow', 'green', 'orange', 'pink']

for punto  in range(0,len(all_solutions),100):

    punto_x = '%.5f'%all_solutions[punto][0]
    punto_z = '%.5f'%all_solutions[punto][1]

    # Se generan las etiquetas de cada frame del video y su respectiva generación
    plt.title(f'Solucion 3d respecto X2, X3{punto_x, punto_z}')

    # Graficar la mejor solución de cada generación
    plt.scatter(all_solutions[punto][0], all_solutions[punto][1], color = colors[random.randint(0, 4)])

    # Se guarda cada frame como imagen para luego usar las imagenes guardadas para generar el video
    plt.savefig(f'Solucion 3d respecto X2, X3{punto_x},{punto_y}.png')

    # Se agrega la imagen a la lista de imagenes para luego generar el gif
    images.append(imageio.imread(f'Solucion 3d respecto X2, X3{punto_x},{punto_y}.png'))

# Se genera el gif a partir de la lista de imagenes y se guarda en el sistema de archivos
imageio.mimsave('rosenbrock_contour.gif', images, fps=1000)

# Para no mostrar la figura actual aún
plt.close()


gif_path = 'rosenbrock_contour.gif'

# Convertir GIF a videos
clip = VideoFileClip(gif_path)
video_path = 'output.mp4'
clip.write_videofile(video_path, fps=1000, logger=None)

# Mostrar el video
Video(video_path, embed=True)

  images.append(imageio.imread(f'Solucion 3d respecto X2, X3{punto_x},{punto_y}.png'))

