In [1]:
import pandas as pd
import jax.numpy as jnp
import matplotlib.pyplot as plt
import sys
import os
from typing import Sequence

sys.path.append(os.path.abspath("../libs"))

from gradient_descendent import gradient_descendent

# Tarefa 1: Otimização unimodal sem restrição

## Parte 1: Otimização analítica

### Problema

Seja a função de custo quadrática dada por: 
$$J(x) = (x - c)^T A (x - c) + b$$
onde $A$ é uma matriz. Encontre analiticamente o ponto $x^* \in \mathbb{R}^2$ que minimize a função de custo.

### Solução

Temos que $\frac{\partial {((x - c)^T A (x - c))}}{\partial x} = (A^T + A)(x - c)$ 

ou 

$\frac{\partial {((x - c)^T A (x - c))}}{\partial x} = 2A(x - c)$ no caso de $A$ ser simétrica.

Portanto, derivando a função de custo e igualando a zero, temos:
$$\frac{\partial J(x)}{\partial x} = (A^T + A)(x - c)$$

$$\frac{\partial J(x)}{\partial x} = (A^T + A)(x - c) = 0$$

$$\frac{\partial J(x)}{\partial x} = (A^T + A)^{-1}(A^T + A)(x - c) = (A^T + A)^{-1} \dot \quad 0$$

$$\frac{\partial J(x)}{\partial x} = I(x - c) = (A^T + A)^{-1} \dot \quad 0$$

$$\frac{\partial J(x)}{\partial x} = x - c = 0$$

$$\frac{\partial J(x)}{\partial x} = x = c$$

## Parte 2: Otimização numérica por gradiente descendente

### Definir a função de custo

In [2]:
def wrapper(A: Sequence[Sequence[float | int]],
            b: float | int,
            c: Sequence[float | int]):
    A_np = jnp.array(A, dtype=jnp.float32)
    b_np = jnp.float32(b)
    c_np = jnp.array(c, dtype=jnp.float32)

    def cost_function(x: jnp.ndarray) -> jnp.ndarray:
        x_np = jnp.array(x, dtype=jnp.float32)
        diff_x_c = x_np - c_np
        return diff_x_c.T @ A_np @ diff_x_c + b_np

    return cost_function

## Calcular o ponto mínimo usando gradiente descendente

In [3]:
A = [[4, 0],
     [1, 2]]
b = 2.0
c = [0, 1]

f = wrapper(A, b, c)

x = [0, 0]
learning_rate = 0.1
max_iter = 100
tolerance = 1e-6


x_values, costs = gradient_descendent(x, f, learning_rate, max_iter, tolerance)
print(f"Ponto mínimo: {x_values[-1]}, ou aproximadamente {jnp.round(x_values[-1], 4)}")

Ponto mínimo: [3.6073224e-08 9.9999982e-01], ou aproximadamente [0. 1.]
