# FELIPE AVILES ALEJANDRO - 2020330348

# 1

In [6]:
import numpy as np

def quasi_newton(f, grad_f, x0, H0, tol=1e-6, maxiter=100):
    """
    Método de Quasi-Newton para encontrar el mínimo de una función.

    Parámetros:
    f: función a minimizar.
    grad_f: gradiente de la función a minimizar.
    x0: punto inicial.
    H0: matriz de aproximación inicial para la inversa de la hessiana.
    tol: tolerancia de convergencia.
    maxiter: número máximo de iteraciones.

    Retorna:
    x_min: punto que minimiza la función.
    """
    x = x0
    H = H0
    k = 0
    rk_norm = np.linalg.norm(grad_f(x))
    while rk_norm > tol and k < maxiter:
        p = -np.dot(H, grad_f(x))
        alpha = 1
        while f(x + alpha*p) > f(x) + 0.1*alpha*np.dot(grad_f(x).T, p):
            alpha = alpha/2
        s = alpha*p
        x_next = x + s
        y = grad_f(x_next) - grad_f(x)
        rho = 1 / np.dot(y.T, s)
        H = (np.eye(len(x)) - rho * np.dot(s, y.T)).dot(H).dot(np.eye(len(x)) - rho * np.dot(y, s.T)) + rho * np.dot(s, s.T)
        x = x_next
        rk_norm = np.linalg.norm(grad_f(x))
        k += 1
    x_min = x
    return x_min

# Función y gradiente
def f(x):
    return np.exp(x[0]**2) + 2*np.exp(x[1]**2)*x[0]**2 + 4*x[0]*x[1] + 2*x[0]**2 + 4*x[0] - 2*x[1]

def grad_f(x):
    return np.array([2*x[0]*np.exp(x[0]**2) + 4*np.exp(x[1]**2)*x[0] + 4*x[0] + 4,
                     4*x[1]*np.exp(x[1]**2) + 4*np.exp(x[1]**2)*x[0] - 2])

# Punto de partida y matriz de aproximación inicial para la inversa de la hessiana
x0 = np.array([-1.8, 1.3])
H0 = np.eye(len(x0))

# Ejecutar el método
x_min = quasi_newton(f, grad_f, x0, H0)

# Imprimir resultado
print("Punto mínimo:", x_min)
print("Valor mínimo:", f(x_min))




  return np.exp(x[0]**2) + 2*np.exp(x[1]**2)*x[0]**2 + 4*x[0]*x[1] + 2*x[0]**2 + 4*x[0] - 2*x[1]
  rho = 1 / np.dot(y.T, s)
  H = (np.eye(len(x)) - rho * np.dot(s, y.T)).dot(H).dot(np.eye(len(x)) - rho * np.dot(y, s.T)) + rho * np.dot(s, s.T)


Punto mínimo: [nan nan]
Valor mínimo: nan


# 2

In [7]:
import numpy as np
from scipy.optimize import approx_fprime

def f(x):
    return np.exp(x[0]**2) + 2*np.exp(x[1]**2)*x[0]**2 + 4*x[0]*x[1] + 2*x[0]**2 + 4*x[0] - 2*x[1]

def grad_f(x):
    return approx_fprime(x, f, epsilon=1e-6)



def newton_method(f, grad_f, x0, tol=1e-6, maxiter=100):
    x = x0
    for i in range(maxiter):
        # Calcular la dirección de descenso
        H = np.array([[2*np.exp(x[0]**2) + 4*x[0]**2 + 4, 8*x[0]*np.exp(x[1]**2) + 4*x[1] + 4],
                      [8*x[0]*np.exp(x[1]**2) + 4*x[1] + 4, 4*np.exp(x[1]**2)]])
        g = grad_f(x)
        d = -np.linalg.solve(H, g)
        
        # Calcular el tamaño del paso
        alpha = 1.0
        while f(x + alpha*d) > f(x):
            alpha /= 2.0
        
        # Actualizar la solución
        x_new = x + alpha*d
        
        # Comprobar la convergencia
        if np.linalg.norm(x_new - x) < tol:
            break
        
        x = x_new
    
    return x


x0 = np.array([-1.8, 1.3])
x_min = newton_method(f, grad_f, x0)

print("Punto mínimo:", x_min)
print("Valor mínimo:", f(x_min))


Punto mínimo: [-0.1085217   2.02341719]
Valor mínimo: -2.9108042881360623


  return np.exp(x[0]**2) + 2*np.exp(x[1]**2)*x[0]**2 + 4*x[0]*x[1] + 2*x[0]**2 + 4*x[0] - 2*x[1]


# 2.1

In [9]:
import numpy as np

def conjugate_gradient(A, b, x0, tol=1e-5, maxiter=1000):
    x = x0.copy()
    residual = b - np.dot(A, x)
    p = residual
    k = 0
    while np.linalg.norm(residual) > tol and k < maxiter:
        Ap = np.dot(A, p)
        alpha = np.dot(residual.T, residual) / np.dot(np.dot(p.T, A), p)
        x = x + alpha * p
        residual_new = residual - alpha * Ap
        beta = np.dot(residual_new.T, residual_new) / np.dot(residual.T, residual)
        p = residual_new + beta * p
        residual = residual_new
        k += 1
    return x

# Definir la matriz A y el vector b
A = np.array([[-8, 2], [2, -114]])
b = np.array([[-8], [10]])

# Definir el punto de inicio x0
x0 = np.array([[2], [-5]])

x_min = conjugate_gradient(A, b, x0)

print("Punto mínimo:", x_min.T)


Punto mínimo: [[ 0.98237885 -0.07048458]]


In [7]:
import numpy as np

def objective(x, y):
    return -4*x**2 - 57*y**2 + 4*x*y - 8*x + 10*y - 2

def gradient(x, y):
    dx = -8*x + 4*y - 8
    dy = -114*y + 4*x + 10
    return np.array([dx, dy])

def search_direction(x, y, prev_direction, prev_gradient):
    curr_gradient = gradient(x, y)
    if np.all(curr_gradient == 0):
        return prev_direction, curr_gradient
    beta = np.dot(curr_gradient, curr_gradient - prev_gradient) / np.dot(prev_gradient, prev_gradient)
    direction = -curr_gradient + beta * prev_direction
    if np.all(direction == 0):
        return direction, curr_gradient
    return direction, curr_gradient

alpha = 0.001  # Tamaño de paso
x, y = 2/50, -5/50 # Normalizamos los valores iniciales
direction = -gradient(x, y)
iteration = 0
precision = 0.00001
max_iterations = 10000

while np.linalg.norm(gradient(x, y)) > precision and iteration < max_iterations:
    direction, prev_gradient = search_direction(x, y, direction, gradient(x, y))
    x += alpha * direction[0]
    y += alpha * direction[1]
    iteration += 1

    # Si x o y son demasiado grandes, normalizamos nuevamente los valores
    if abs(x) > 100 or abs(y) > 100:
        x /= 100
        y /= 100
        alpha /= 10

x *= 50 # Desnormalizamos el valor de x
y *= 50 # Desnormalizamos el valor de y

print("Punto crítico: ({:.5f}, {:.5f})".format(x, y))
print("Valor de la función objetivo: {:.5f}".format(objective(x, y)))


Punto crítico: (6.08160, -98.64864)
Valor de la función objetivo: -558283.47397


In [12]:
def conjugate_directions(f, grad_f, x0, directions, tol=1e-6, maxiter=1000):
    """
    Encuentra el mínimo de la función `f` utilizando el método de direcciones conjugadas
    con una base de direcciones dadas.
    
    Parámetros:
    - f: la función a minimizar.
    - grad_f: la función gradiente de `f`.
    - x0: punto de partida para el algoritmo.
    - directions: matriz de direcciones conjugadas a utilizar en el método.
    - tol: tolerancia para la convergencia del algoritmo.
    - maxiter: número máximo de iteraciones permitidas.
    
    Retorna:
    - x_min: el punto que minimiza la función `f`.
    """
    x = x0
    residual = grad_f(x)
    k = 0
    d = directions[:,:,0]
    delta = np.dot(d.T, np.dot(f(x), d))
    
    while np.linalg.norm(residual) > tol and k < maxiter:
        alpha = np.dot(residual.T, residual) / delta
        x = x + alpha * d
        prev_residual = residual
        residual = grad_f(x)
        beta = np.dot(residual.T, np.dot(f(x), d)) / delta
        d = residual - beta * d
        delta = np.dot(d.T, np.dot(f(x), d))
        k += 1
    
    return x

print("Punto mínimo:", x_min.T)


Punto mínimo: [[ 0.98237885 -0.07048458]]


In [1]:
import numpy as np
from scipy.optimize import minimize

# Función objetivo
def f(x):
    return np.exp(x[0]**2) + 2*np.exp(x[1]**2)*x[0]**2 + 4*x[0]*x[1] + 2*x[0]**2 + 4*x[0] - 2*x[1]

# Gradiente de la función objetivo
def grad_f(x):
    return np.array([2*x[0]*np.exp(x[0]**2) + 4*np.exp(x[1]**2)*x[0] + 4*x[1] + 4*x[0] - 2,
                     4*x[0]*np.exp(x[1]**2) + 4*x[1] - 2*np.exp(x[1]**2)])

# Hessiano de la función objetivo
def hess_f(x):
    return np.array([[4*np.exp(x[0]**2) + 8*x[0]**2*np.exp(x[0]**2) + 4*np.exp(x[1]**2),
                      8*x[0]*x[1]*np.exp(x[0]**2 + x[1]**2) + 4*x[0]*np.exp(x[1]**2)],
                     [8*x[0]*x[1]*np.exp(x[0]**2 + x[1]**2) + 4*x[0]*np.exp(x[1]**2),
                      4*x[0]**2*np.exp(x[1]**2) + 16*np.exp(x[1]**2) - 4*np.exp(x[1]**2)]])

# Método de Newton
def newton_method(f, grad_f, hess_f, x0, tol=1e-6, maxiter=100):
    x = x0
    for i in range(maxiter):
        grad = grad_f(x)
        hess = hess_f(x)
        d = np.linalg.solve(hess, -grad)
        x = x + d
        if np.linalg.norm(grad) < tol:
            break
    return x

# Método de BFGS
def bfgs_method(f, grad_f, x0, tol=1e-6, maxiter=100):
    x = x0
    H = np.eye(len(x))
    for i in range(maxiter):
        grad = grad_f(x)
        d = -np.dot(H, grad)
        alpha = minimize(lambda a: f(x + a*d), 0).x[0]
        s = alpha * d
        x_new = x + s
        y = grad_f(x_new) - grad
        rho = 1 / np.dot(y, s)
        H_new = (np.eye(len(x)) - rho*np.outer(s, y)) @ H @ (np.eye(len(x)) - rho*np.outer(y, s)) + rho*np.outer(s, s)
        x, H = x_new, H_new
        if np.linalg.norm(s) < tol:
            break
    return x

# Ejemplo de uso
x0 = np.array([-1.8, 1.3])

# Método de Newton
x_min_newton = newton_method(f, grad_f, hess_f, x0, tol=1e-6, maxiter=100)
print("Método de Newton:")
print("Punto mínimo:", x_min_newton)
print("Valor mínimo:", f(x_min_newton))



Método de Newton:
Punto mínimo: [-2.76237204  7.16226719]
Valor mínimo: 2.897768130804401e+23


Punto mínimo: [-0.1085217   2.02341719]
Valor mínimo: -2.9108042881360623


  return np.exp(x[0]**2) + 2*np.exp(x[1]**2)*x[0]**2 + 4*x[0]*x[1] + 2*x[0]**2 + 4*x[0] - 2*x[1]
