# Tarea 3

**Autor:** Alejandro Zarate Macias  
**Curso:** Métodos Matemáticos para Análisis de Datos  
**Fecha:** 08 de Septiembre 2025

---

## Introducción

En este notebook se abordan los problemas 3, 6, 7, 8 y 9 de la Tarea 3, relacionados con la optimizacion de multiples funciones y encontrar sus valores minimos o donde la funcion tiende a 0 utilizando el algoritmo de Steepest Descent y diferentes schedulers de learning rate.
El objetivo principal es desarrollar códigos que permitan calcular, analizar y visualizar los resultados de estas optimizaciones.

---

# Problema 3

Escriba un script en Python para generar una matriz simétrica aleatoria $A \in (-0.5, 0.5)^{10 \times 10}$. Use la idea del Problema 2 para encontrar un valor adecuado de $\alpha$ y construir $B$ tal que $B > 0$. Explique por qué la ``estructura interna'' de ambas matrices $A$ y $B$ permanece igual al inspeccionar su espectro.


## Métodos

In [None]:
import numpy as np

# Dimensión de la matriz
n = 10

# Generar matriz aleatoria en (-0.5, 0.5)
A = np.random.uniform(-0.5, 0.5, (n, n))

# Hacerla simétrica
A = (A + A.T) / 2

# Calcular autovalores de A
eigvals_A = np.linalg.eigvalsh(A)

# Encontrar el menor autovalor
lambda_min = np.min(eigvals_A)

# Escoger alpha suficientemente grande
alpha = abs(lambda_min) + 1e-3

# Construir B
B = A + alpha * np.eye(n)

# Verificar positividad
eigvals_B = np.linalg.eigvalsh(B)

## Resultados

In [None]:
print("Matriz A:\n", A)

In [None]:
print("Autovalores de A:", eigvals_A)

In [None]:
print("Matriz B (A + alpha*I):\n", B)

In [None]:
print("Autovalores de B:", eigvals_B)

In [None]:
print("¿B es definida positiva?:", np.all(eigvals_B > 0))

# Problema 6

Implemente en Python el algoritmo de descenso más pronunciado (SD) para las funciones $ (1)-(3) $. Use un paso de longitud fija y el gradiente analítico. Muestre gráficas del número de iteraciones contra el valor de la función.


## Métodos


In [None]:
import numpy as np
import matplotlib.pyplot as plt

In [None]:
class SteepestDescent:
    def __init__(self): ...
    
    def optimize(self, 
                 func, 
                 grad_func, 
                 x0, 
                 lr=0.01,
                 max_iterations=1000,
                 stop_value=None):
        
        x = np.array(x0, dtype=float)
        trayectory = []
        
        for _ in range(max_iterations):
            f_val = func(x)
            trayectory.append(f_val)

            if stop_value and f_val <= stop_value:
                    break

            grad = grad_func(x)
                
            x = x - lr * grad
            
        return x, trayectory
    
    def plot(self, trayectory, title="Descenso Más Pronunciado"):
        plt.figure(figsize=(8, 6))
        plt.plot(trayectory)
        plt.title(title)
        plt.xlabel('Iteraciones')
        plt.ylabel('Valor de la función')
        plt.grid(True)
        plt.show()

In [None]:
def translated_sphere(x):
    c = np.ones(len(x))
    return np.sum((x - c)**2)

def gradient_translated_sphere(x):
    c = np.ones(len(x))
    return 2 * (x - c)

def rosenbrock(x):
    result = 0
    for i in range(len(x) - 1):
        result += 100 * (x[i+1] - x[i]**2)**2 + (1 - x[i])**2
    return result

def gradient_rosenbrock(x):
    grad = np.zeros(len(x))
    for i in range(len(x) - 1):
        grad[i] += -400 * x[i] * (x[i+1] - x[i]**2) - 2 * (1 - x[i])
        grad[i+1] += 200 * (x[i+1] - x[i]**2)
    return grad

def perm(x):
    B = 1
    result = 0
    for k in range(1, len(x) + 1):
        inner_sum = 0
        for i in range(1, len(x) + 1):
            inner_sum += (i + B) * (x[i-1]**k - (1/i)**k)
        result += inner_sum**2
    return result

def gradient_perm(x):
    B = 1
    grad = np.zeros(len(x))
    for j in range(len(x)):
        for k in range(1, len(x) + 1):
            inner_sum = 0
            for i in range(1, len(x) + 1):
                inner_sum += (i + B) * (x[i-1]**k - (1/i)**k)
            grad[j] += 2 * inner_sum * (j + 1 + B) * k * x[j]**(k-1)
    return grad   

## Resultados

In [None]:
n = 5
x0 = [0.5]*n
sd_algorithm = SteepestDescent()

In [None]:
x_sphere, trayectory_sphere = sd_algorithm.optimize(
    func=translated_sphere,
    grad_func=gradient_translated_sphere,
    x0=x0,
    lr=0.01,
    max_iterations=1000,
    stop_value=1e-2
)
print("="*60)
print("FUNCIÓN ESFERA TRASLADADA")
print("="*60)
print("Valor óptimo encontrado:", x_sphere)
print("Valor de la función en el óptimo:", translated_sphere(x_sphere))
print("Número de iteraciones:", len(trayectory_sphere))
print("Gráfica Descenso de la función:")
sd_algorithm.plot(trayectory=trayectory_sphere, title="Descenso Más Pronunciado - Función Esfera Trasladada")

In [None]:
x_rosenbrock, trayectory_rosenbrock = sd_algorithm.optimize(
    func=rosenbrock,
    grad_func=gradient_rosenbrock,
    x0=x0,
    lr=0.001,
    max_iterations=1000,
    stop_value=1e-2
)
print("="*60)
print("FUNCIÓN ROSENBROCK")
print("="*60)
print("Valor óptimo encontrado:", x_rosenbrock)
print("Valor de la función en el óptimo:", rosenbrock(x_rosenbrock))
print("Número de iteraciones:", len(trayectory_rosenbrock))
print("Gráfica Descenso de la función:")
sd_algorithm.plot(trayectory=trayectory_rosenbrock, title="Descenso Más Pronunciado - Función Rosenbrock")

In [None]:
x_perm, trayectory_perm = sd_algorithm.optimize(
    func=perm,
    grad_func=gradient_perm,
    x0=x0,
    lr=0.001,
    max_iterations=1000,
    stop_value=1e-2
)
print("="*60)
print("FUNCIÓN PERM")
print("="*60)
print("Valor óptimo encontrado:", x_perm)
print("Valor de la función en el óptimo:", perm(x_perm))
print("Número de iteraciones:", len(trayectory_perm))
print("Gráfica Descenso de la función:")
sd_algorithm.plot(trayectory=trayectory_perm, title="Descenso Más Pronunciado - Función Perm")

# Problema 7

Mejore su script anterior usando un gradiente numérico en lugar del gradiente analítico. A continuación, resuelva el problema de minimización para las funciones (1)-(3) usando el mismo número de iteraciones que antes. Realice una comparación de las soluciones obtenidas con las del Problema 6.

## Métodos

In [None]:
import numpy as np
import matplotlib.pyplot as plt

In [None]:
class SteepestDescentNumerical:
    def __init__(self): ...
    
    def optimize(self, 
                 func,  
                 x0, 
                 lr=0.01,
                 h=1e-5,
                 max_iterations=1000,
                 stop_value=None):
        
        x = np.array(x0, dtype=float)
        trayectory = []
        
        for _ in range(max_iterations):
            f_val = func(x)
            trayectory.append(f_val)

            if stop_value and f_val <= stop_value:
                    break

            grad = self.numerical_gradient(func, x, h=h)

            x = x - lr * grad
            
        return x, trayectory
    
    def numerical_gradient(self, f, x, h):
        n = len(x)
        grad = np.zeros(n)
        
        for i in range(n):
            x_plus = x.copy()
            x_minus = x.copy()
            
            x_plus[i] += h
            x_minus[i] -= h

            grad[i] = (f(x_plus) - f(x_minus)) / (2*h)

        return grad
    
    def plot(self, trayectory, title="Descenso Más Pronunciado"):
        plt.figure(figsize=(8, 6))
        plt.plot(trayectory)
        plt.title(title)
        plt.xlabel('Iteraciones')
        plt.ylabel('Valor de la función')
        plt.grid(True)
        plt.show()

In [None]:
def translated_sphere(x):
    c = np.ones(len(x))
    return np.sum((x - c)**2)

def rosenbrock(x):
    result = 0
    for i in range(len(x) - 1):
        result += 100 * (x[i+1] - x[i]**2)**2 + (1 - x[i])**2
    return result

def perm(x):
    B = 1
    result = 0
    for k in range(1, len(x) + 1):
        inner_sum = 0
        for i in range(1, len(x) + 1):
            inner_sum += (i + B) * (x[i-1]**k - (1/i)**k)
        result += inner_sum**2
    return result  

## Resultados

In [None]:
n = 5
x0 = [0.5] * n
sd_algorithm = SteepestDescentNumerical()

In [None]:
x_sphere, trayectory_sphere = sd_algorithm.optimize(
    func=translated_sphere,
    x0=x0,
    lr=0.01,
    h=1e-5,
    max_iterations=1000,
    stop_value=1e-2
)
print("="*60)
print("FUNCIÓN ESFERA TRASLADADA")
print("="*60)
print("Valor óptimo encontrado:", x_sphere)
print("Valor de la función en el óptimo:", translated_sphere(x_sphere))
print("Número de iteraciones:", len(trayectory_sphere))
print("Gráfica Descenso de la función:")
sd_algorithm.plot(trayectory=trayectory_sphere, title="Descenso Más Pronunciado - Función Esfera Trasladada")

In [None]:
x_rosenbrock, trayectory_rosenbrock = sd_algorithm.optimize(
    func=rosenbrock,
    x0=x0,
    lr=0.001,
    h=1e-5,
    max_iterations=1000,
    stop_value=1e-2
)
print("="*60)
print("FUNCIÓN ROSENBROCK")
print("="*60)
print("Valor óptimo encontrado:", x_rosenbrock)
print("Valor de la función en el óptimo:", rosenbrock(x_rosenbrock))
print("Número de iteraciones:", len(trayectory_rosenbrock))
print("Gráfica Descenso de la función:")
sd_algorithm.plot(trayectory=trayectory_rosenbrock, title="Descenso Más Pronunciado - Función Rosenbrock")

In [None]:
x_perm, trayectory_perm = sd_algorithm.optimize(
    func=perm,
    x0=x0,
    lr=0.001,
    h=1e-5,
    max_iterations=1000,
    stop_value=1e-2
)
print("="*60)
print("FUNCIÓN PERM")
print("="*60)
print("Valor óptimo encontrado:", x_perm)
print("Valor de la función en el óptimo:", perm(x_perm))
print("Número de iteraciones:", len(trayectory_perm))
print("Gráfica Descenso de la función:")
sd_algorithm.plot(trayectory=trayectory_perm, title="Descenso Más Pronunciado - Función Perm")

# Problema 8

Mejore aún más su script añadiendo longitudes de paso de tipo decreciente lineal, adaptativa e inteligente (i.e.\ condiciones de Armijo o de Wolfe). Puede usar un gradiente analítico o numérico. Use algunas gráficas para comparar los resultados obtenidos con cada una de las cuatro estrategias de longitud de paso.

## Métodos

In [None]:
import numpy as np
import matplotlib.pyplot as plt

In [None]:
class SteepestDescentNumericalLr:
    def __init__(self): ...
    
    def optimize(self, 
                 func,  
                 x0, 
                 lr=0.01,
                 h=1e-5,
                 max_iterations=1000,
                 stop_value=None,
                 lr_schedule_type='fixed'):
        
        x = np.array(x0, dtype=float)
        trayectory = []
        lr_history = []
        initial_lr = lr
        lr_history.append(initial_lr)
        
        for i in range(max_iterations):
            f_val = func(x)
            trayectory.append(f_val)

            if stop_value and f_val <= stop_value:
                    break

            grad = self.numerical_gradient(func, x, h=h)

            lr = self.get_learning_rate(
                schedule_type=lr_schedule_type,
                initial_lr=initial_lr,
                iteration=i,
                max_iterations=max_iterations,
                func=func,
                x=x,
                grad=grad
            )
            lr_history.append(lr)

            x = x - lr * grad

        return x, trayectory, lr_history

    def numerical_gradient(self, f, x, h):
        n = len(x)
        grad = np.zeros(n)
        
        for i in range(n):
            x_plus = x.copy()
            x_minus = x.copy()
            
            x_plus[i] += h
            x_minus[i] -= h

            grad[i] = (f(x_plus) - f(x_minus)) / (2*h)

        return grad
    
    def get_learning_rate(self, schedule_type, initial_lr, iteration, max_iterations, func, x, grad):
        if schedule_type == 'fixed':
            return initial_lr
        elif schedule_type == 'linear_decreasing':
            return self.linear_decreasing_lr(initial_lr, iteration, max_iterations)
        elif schedule_type == 'adaptive':
            return self.adaptive_lr(initial_lr, iteration)
        elif schedule_type == 'intelligent':
            return self.intelligent_lr(func, x, grad, initial_lr)
        else:
            raise ValueError(f"Estrategia de lr desconocida: {schedule_type}")

    def linear_decreasing_lr(self, initial_lr, iteration, max_iterations):
        return initial_lr * (1 - iteration / max_iterations)
    
    def adaptive_lr(self, initial_lr, iteration):
        return initial_lr / (1 + 0.1 * np.sqrt(iteration + 1))

    def intelligent_lr(self, func, x, grad, initial_lr):
        alpha = initial_lr
        c1 = 1e-4
        rho = 0.5
        max_backtracks = 50
        min_alpha = 1e-10
        
        f_x = func(x)
        grad_norm_sq = np.dot(grad, grad)
        
        if grad_norm_sq < 1e-12:
            return min_alpha
        
        directional_derivative = -grad_norm_sq
        backtrack_count = 0
        
        while backtrack_count < max_backtracks and alpha > min_alpha:
            x_new = x - alpha * grad
            f_new = func(x_new)

            if f_new <= f_x + c1 * alpha * directional_derivative:
                break
                
            alpha *= rho
            backtrack_count += 1
        
        return max(alpha, min_alpha)
    
    def plot(self, trayectory, title="Descenso Más Pronunciado"):
        plt.figure(figsize=(8, 6))
        plt.plot(trayectory)
        plt.title(title)
        plt.xlabel('Iteraciones')
        plt.ylabel('Valor de la función')
        plt.grid(True)
        plt.show()

In [None]:
def translated_sphere(x):
    c = np.ones(len(x))
    return np.sum((x - c)**2)

def rosenbrock(x):
    result = 0
    for i in range(len(x) - 1):
        result += 100 * (x[i+1] - x[i]**2)**2 + (1 - x[i])**2
    return result

def perm(x):
    B = 1
    result = 0
    for k in range(1, len(x) + 1):
        inner_sum = 0
        for i in range(1, len(x) + 1):
            inner_sum += (i + B) * (x[i-1]**k - (1/i)**k)
        result += inner_sum**2
    return result  

## Resultados

In [None]:
n = 5
x0 = [0.5] * n
sd_algorithm = SteepestDescentNumericalLr()

In [None]:
print("======= OPTIMIZACIÓN DE LA FUNCIÓN ESFERA TRASLADADA =======")

lr_strategies = {
    'fixed': 0.1, 
    'linear_decreasing': 1, 
    'adaptive': 1, 
    'intelligent': 5
}
lr_names = ["TAMAÑO DE PASO FIJO", 
            "TAMAÑO DE PASO DECRECIENTE LINEALMENTE",
            "TAMAÑO DE PASO ADAPTATIVO", 
            "TAMAÑO DE PASO INTELIGENTE (BACKTRACKING)"]

trayectories = []
lr_histories = []

for schedule, lr, name in zip(lr_strategies.keys(), lr_strategies.values(), lr_names):
    x_sphere, trayectory_sphere, lr_history_sphere = sd_algorithm.optimize(
        func=translated_sphere,
        x0=x0,
        lr=lr,
        h=1e-5,
        max_iterations=1000,
        stop_value=1e-2,
        lr_schedule_type=schedule
    )
    trayectories.append(trayectory_sphere)
    lr_histories.append(lr_history_sphere)
    print("="*60)
    print(name)
    print("="*60)
    print("Valor óptimo encontrado:", x_sphere)
    print("Valor de la función en el óptimo:", translated_sphere(x_sphere))
    print("Número de iteraciones:", len(trayectory_sphere))

print("="*60)
print("Gráfica Descenso de la función:")
fig, axs = plt.subplots(2, 2, figsize=(15, 10))

for ax, history, name in zip(axs.flatten(), trayectories, lr_names):
    ax.plot(history, linewidth=2)
    ax.set_title(name)
    ax.set_xlabel('Iteraciones')
    ax.set_ylabel('Valor de la función')
    ax.grid(True)

plt.suptitle('Función De Esfera Trasladada - Comparación de Estrategias', fontsize=16)
plt.show()

fig, axs = plt.subplots(2, 2, figsize=(15, 10))
for ax, lr_history, name in zip(axs.flatten(), lr_histories, lr_names):
    ax.plot(lr_history, linewidth=2)
    ax.set_title(f"Evolución del Tamaño de Paso - {name}")
    ax.set_xlabel('Iteraciones')
    ax.set_ylabel('Tamaño de Paso (Learning Rate)')
    ax.grid(True)
plt.suptitle('Evolución del Tamaño de Paso - Comparación de Estrategias', fontsize=16)
plt.show()

In [None]:
print("======= OPTIMIZACIÓN DE LA FUNCIÓN DE ROSENBROCK =======")

lr_strategies = {
    'fixed': 0.001, 
    'linear_decreasing': 0.001, 
    'adaptive': 0.001, 
    'intelligent': 2
}
lr_names = ["TAMAÑO DE PASO FIJO", 
            "TAMAÑO DE PASO DECRECIENTE LINEALMENTE",
            "TAMAÑO DE PASO ADAPTATIVO", 
            "TAMAÑO DE PASO INTELIGENTE (BACKTRACKING)"]

trayectories = []
lr_histories = []

for schedule, lr, name in zip(lr_strategies.keys(), lr_strategies.values(), lr_names):
    x_rosenbrock, trayectory_rosenbrock, lr_history_rosenbrock = sd_algorithm.optimize(
        func=rosenbrock,
        x0=x0,
        lr=lr,
        h=1e-5,
        max_iterations=1000,
        stop_value=1e-2,
        lr_schedule_type=schedule
    )
    trayectories.append(trayectory_rosenbrock)
    lr_histories.append(lr_history_rosenbrock)
    print("="*60)
    print(name)
    print("="*60)
    print("Valor óptimo encontrado:", x_rosenbrock)
    print("Valor de la función en el óptimo:", rosenbrock(x_rosenbrock))
    print("Número de iteraciones:", len(trayectory_rosenbrock))

print("="*60)
print("Gráfica Descenso de la función:")
fig, axs = plt.subplots(2, 2, figsize=(15, 10))

for ax, history, name in zip(axs.flatten(), trayectories, lr_names):
    ax.plot(history, linewidth=2)
    ax.set_title(name)
    ax.set_xlabel('Iteraciones')
    ax.set_ylabel('Valor de la función')
    ax.grid(True)

plt.suptitle('Función De Rosenbrock - Comparación de Estrategias', fontsize=16)
plt.show()

fig, axs = plt.subplots(2, 2, figsize=(15, 10))
for ax, lr_history, name in zip(axs.flatten(), lr_histories, lr_names):
    ax.plot(lr_history, linewidth=2)
    ax.set_title(f"Evolución del Tamaño de Paso - {name}")
    ax.set_xlabel('Iteraciones')
    ax.set_ylabel('Tamaño de Paso (Learning Rate)')
    ax.grid(True)

plt.suptitle('Evolución del Tamaño de Paso - Comparación de Estrategias', fontsize=16)
plt.show()

In [None]:
print("======= OPTIMIZACIÓN DE LA FUNCIÓN DE PERM =======")

lr_strategies = {
    'fixed': 0.001, 
    'linear_decreasing': 0.001, 
    'adaptive': 0.001, 
    'intelligent': 0.5
}
lr_names = ["TAMAÑO DE PASO FIJO", 
            "TAMAÑO DE PASO DECRECIENTE LINEALMENTE",
            "TAMAÑO DE PASO ADAPTATIVO", 
            "TAMAÑO DE PASO INTELIGENTE (BACKTRACKING)"]

trayectories = []
lr_histories = []

for schedule, lr, name in zip(lr_strategies.keys(), lr_strategies.values(), lr_names):
    x_perm, trayectory_perm, lr_history_perm = sd_algorithm.optimize(
        func=perm,
        x0=x0,
        lr=lr,
        h=1e-5,
        max_iterations=1000,
        stop_value=1e-2,
        lr_schedule_type=schedule
    )
    trayectories.append(trayectory_perm)
    lr_histories.append(lr_history_perm)
    print("="*60)
    print(name)
    print("="*60)
    print("Valor óptimo encontrado:", x_perm)
    print("Valor de la función en el óptimo:", perm(x_perm))
    print("Número de iteraciones:", len(trayectory_perm))

print("="*60)
print("Gráfica Descenso de la función:")
fig, axs = plt.subplots(2, 2, figsize=(15, 10))

for ax, history, name in zip(axs.flatten(), trayectories, lr_names):
    ax.plot(history, linewidth=2)
    ax.set_title(name)
    ax.set_xlabel('Iteraciones')
    ax.set_ylabel('Valor de la función')
    ax.grid(True)

plt.suptitle('Función De Perm - Comparación de Estrategias', fontsize=16)
plt.show()

fig, axs = plt.subplots(2, 2, figsize=(15, 10))
for ax, lr_history, name in zip(axs.flatten(), lr_histories, lr_names):
    ax.plot(lr_history, linewidth=2)
    ax.set_title(f"Evolución del Tamaño de Paso - {name}")
    ax.set_xlabel('Iteraciones')
    ax.set_ylabel('Tamaño de Paso (Learning Rate)')
    ax.grid(True)

plt.suptitle('Evolución del Tamaño de Paso - Comparación de Estrategias', fontsize=16)
plt.show()

# Problema 9

Considere la siguiente función

\begin{align}
    f(x_1, x_2) = 10^{9}x_1^{2} + x_2^{2}. \tag{4}
\end{align}

Considere $\mathbf{x}_0 = (1.5, 1.5)$ como punto inicial. Resuelva el problema de minimización usando su script de $SD$. ¿Cuántas iteraciones necesita su implementación de $SD$ para alcanzar un valor de la función menor que $1e^{-4}$? A continuación, escale las variables de (4). ¿Cuántas iteraciones necesita su implementación de $SD$ para alcanzar un valor menor que $1e^{-4}$ en esta versión escalada de (4)?

## Métodos

In [None]:
import numpy as np
import matplotlib.pyplot as plt

In [None]:
class SteepestDescentNumericalLr:
    def __init__(self): ...
    
    def optimize(self, 
                 func,  
                 x0, 
                 lr=0.01,
                 h=1e-5,
                 max_iterations=1000,
                 stop_value=None,
                 lr_schedule_type='fixed'):
        
        x = np.array(x0, dtype=float)
        trayectory = []
        lr_history = []
        initial_lr = lr
        lr_history.append(initial_lr)
        
        for i in range(max_iterations):
            f_val = func(x)
            trayectory.append(f_val)

            if stop_value and f_val <= stop_value:
                    break

            grad = self.numerical_gradient(func, x, h=h)

            lr = self.get_learning_rate(
                schedule_type=lr_schedule_type,
                initial_lr=initial_lr,
                iteration=i,
                max_iterations=max_iterations,
                func=func,
                x=x,
                grad=grad
            )
            lr_history.append(lr)

            x = x - lr * grad

        return x, trayectory, lr_history

    def numerical_gradient(self, f, x, h):
        n = len(x)
        grad = np.zeros(n)
        
        for i in range(n):
            x_plus = x.copy()
            x_minus = x.copy()
            
            x_plus[i] += h
            x_minus[i] -= h

            grad[i] = (f(x_plus) - f(x_minus)) / (2*h)

        return grad
    
    def get_learning_rate(self, schedule_type, initial_lr, iteration, max_iterations, func, x, grad):
        if schedule_type == 'fixed':
            return initial_lr
        elif schedule_type == 'linear_decreasing':
            return self.linear_decreasing_lr(initial_lr, iteration, max_iterations)
        elif schedule_type == 'adaptive':
            return self.adaptive_lr(initial_lr, iteration)
        elif schedule_type == 'intelligent':
            return self.intelligent_lr(func, x, grad, initial_lr)
        else:
            raise ValueError(f"Estrategia de lr desconocida: {schedule_type}")

    def linear_decreasing_lr(self, initial_lr, iteration, max_iterations):
        return initial_lr * (1 - iteration / max_iterations)
    
    def adaptive_lr(self, initial_lr, iteration):
        return initial_lr / (1 + 0.1 * np.sqrt(iteration + 1))

    def intelligent_lr(self, func, x, grad, initial_lr):
        alpha = initial_lr
        c1 = 1e-4
        rho = 0.5
        max_backtracks = 50
        min_alpha = 1e-10
        
        f_x = func(x)
        grad_norm_sq = np.dot(grad, grad)
        
        if grad_norm_sq < 1e-12:
            return min_alpha
        
        directional_derivative = -grad_norm_sq
        backtrack_count = 0
        
        while backtrack_count < max_backtracks and alpha > min_alpha:
            x_new = x - alpha * grad
            f_new = func(x_new)

            if f_new <= f_x + c1 * alpha * directional_derivative:
                break
                
            alpha *= rho
            backtrack_count += 1
        
        return max(alpha, min_alpha)
    
    def plot(self, trayectory, title="Descenso Más Pronunciado"):
        plt.figure(figsize=(8, 6))
        plt.plot(trayectory)
        plt.title(title)
        plt.xlabel('Iteraciones')
        plt.ylabel('Valor de la función')
        plt.grid(True)
        plt.show()

In [None]:
def function4(x):
    """10⁹x_1²+x_2²"""
    return 1e9 * x[0]**2 + x[1]**2

# MÉTODO 1: ESCALAR LAS VARIABLES f(Cx, Cy)
# Para equilibrar los coeficientes, necesitamos que ambos sean similares
# Si queremos que ambos coeficientes sean 1, necesitamos:
# C₁² * 10⁹ = 1  =>  C₁ = 1/√(10⁹) = 1/31622.77
# C₂² * 1 = 1     =>  C₂ = 1

import math

def function4_normalized(x):
    C1 = 1.0 / math.sqrt(1e9)
    C2 = 1.0
    x1_scaled = C1 * x[0]
    x2_scaled = C2 * x[1]
    
    return 1e9 * x1_scaled**2 + x2_scaled**2

## Resultados

In [None]:
x0 = [1.5, 1.5]
sd_algorithm = SteepestDescentNumericalLr()

In [None]:
print("======= OPTIMIZACIÓN DE LA FUNCIÓN (4) =======")

lr_strategies = {
    'fixed': 1e-10, 
    'linear_decreasing': 1e-10, 
    'adaptive': 1e-10, 
    'intelligent': 1e-1
}
lr_names = ["TAMAÑO DE PASO FIJO", 
            "TAMAÑO DE PASO DECRECIENTE LINEALMENTE",
            "TAMAÑO DE PASO ADAPTATIVO", 
            "TAMAÑO DE PASO INTELIGENTE (BACKTRACKING)"]

trayectories = []
lr_histories = []

for schedule, lr, name in zip(lr_strategies.keys(), lr_strategies.values(), lr_names):
    x_sphere, trayectory_sphere, lr_history_sphere = sd_algorithm.optimize(
        func=function4,
        x0=x0,
        lr=lr,
        h=1e-5,
        max_iterations=100,
        stop_value=1e-4,
        lr_schedule_type=schedule
    )
    trayectories.append(trayectory_sphere)
    lr_histories.append(lr_history_sphere)
    print("="*60)
    print(name)
    print("="*60)
    print("Valor óptimo encontrado:", x_sphere)
    print("Valor de la función en el óptimo:", function4(x_sphere))
    print("Número de iteraciones:", len(trayectory_sphere))

print("="*60)
print("Gráfica Descenso de la función:")
fig, axs = plt.subplots(2, 2, figsize=(15, 10))

for ax, history, name in zip(axs.flatten(), trayectories, lr_names):
    ax.plot(history, linewidth=2)
    ax.set_title(name)
    ax.set_xlabel('Iteraciones')
    ax.set_ylabel('Valor de la función')
    ax.grid(True)

plt.suptitle('Función (4) - Comparación de Estrategias', fontsize=16)
plt.show()

fig, axs = plt.subplots(2, 2, figsize=(15, 10))
for ax, lr_history, name in zip(axs.flatten(), lr_histories, lr_names):
    ax.plot(lr_history, linewidth=2)
    ax.set_title(f"Evolución del Tamaño de Paso - {name}")
    ax.set_xlabel('Iteraciones')
    ax.set_ylabel('Tamaño de Paso (Learning Rate)')
    ax.grid(True)
plt.suptitle('Evolución del Tamaño de Paso - Comparación de Estrategias', fontsize=16)
plt.show()

In [None]:
print("======= OPTIMIZACIÓN DE LA FUNCIÓN (4) NORMALIZADA =======")

lr_strategies = {
    'fixed': 0.1, 
    'linear_decreasing': 0.1, 
    'adaptive': 0.5, 
    'intelligent': 5
}
lr_names = ["TAMAÑO DE PASO FIJO", 
            "TAMAÑO DE PASO DECRECIENTE LINEALMENTE",
            "TAMAÑO DE PASO ADAPTATIVO", 
            "TAMAÑO DE PASO INTELIGENTE (BACKTRACKING)"]

trayectories = []
lr_histories = []

for schedule, lr, name in zip(lr_strategies.keys(), lr_strategies.values(), lr_names):
    x_sphere, trayectory_sphere, lr_history_sphere = sd_algorithm.optimize(
        func=function4_normalized,
        x0=x0,
        lr=lr,
        h=1e-5,
        max_iterations=100,
        stop_value=1e-4,
        lr_schedule_type=schedule
    )
    trayectories.append(trayectory_sphere)
    lr_histories.append(lr_history_sphere)
    print("="*60)
    print(name)
    print("="*60)
    print("Valor óptimo encontrado:", x_sphere)
    print("Valor de la función en el óptimo:", function4_normalized(x_sphere))
    print("Número de iteraciones:", len(trayectory_sphere))

print("="*60)
print("Gráfica Descenso de la función:")
fig, axs = plt.subplots(2, 2, figsize=(15, 10))

for ax, history, name in zip(axs.flatten(), trayectories, lr_names):
    ax.plot(history, linewidth=2)
    ax.set_title(name)
    ax.set_xlabel('Iteraciones')
    ax.set_ylabel('Valor de la función')
    ax.grid(True)

plt.suptitle('Función (4) Normalizada - Comparación de Estrategias', fontsize=16)
plt.show()

fig, axs = plt.subplots(2, 2, figsize=(15, 10))
for ax, lr_history, name in zip(axs.flatten(), lr_histories, lr_names):
    ax.plot(lr_history, linewidth=2)
    ax.set_title(f"Evolución del Tamaño de Paso - {name}")
    ax.set_xlabel('Iteraciones')
    ax.set_ylabel('Tamaño de Paso (Learning Rate)')
    ax.grid(True)
plt.suptitle('Evolución del Tamaño de Paso - Comparación de Estrategias', fontsize=16)
plt.show()