<a href="https://colab.research.google.com/github/tiagosardi/optimizationMethod/blob/main/metodoNewton.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<script src='https://cdnjs.cloudflare.com/ajax/libs/mathjax/2.7.5/MathJax.js?config=TeX-MML-AM_CHTML' async></script>


Método direto para situações em que o valor do gradiente não exista, $$\nexists\nabla \hat{f}(x),$$ vamos estimar o valor do gradiente aplicando: 
$$
\lim_{delta \to 0} \frac{f(x+delta)-f(x)}{delta}
$$

Onde estimaremos numa aproximação curta do valor real do gradiente. Para isso, criaremos uma função quadrática que possa convergir com o mínimo local da função original.

Vamos utilizar o método de Newton. Partiremos da minimização da expansão da série de Taylor. Então, utilizaremos o gradiente igual a zero da função de Taylor:

$$min \hat{f}(x) = f(x_i) + f'(x_i)(x-x_i) + \frac{f''(x_i)}{2!}(x-x_i)^2$$

$$\hat{f}'(x)=0-f'(x_i)-f''(x_i)(x- x_i) = 0$$

$$x = x_i - \frac{f'(x)}{f''(x)}$$

Repare que consigo ir para o mínimo da função quadrática usando um método que estima o gradiente. Se a função for quadrática, conseguiremos convergir em apenas uma iteração.

Portanto, para efetuar as etapas deste processo para uma variável, seguimos a seguinte receita:

1. Escolho um X inicial
2. Escolho a direção da busca $$\tilde{s}=f'(x)$$
3. Atualiza x $$x=x-\frac{1}{f(\tilde{x})}f'(x)$$
4. Ir para 2 até atingir critério de parada

Para várias variáveis, resolveremos utilizando a Hessiana:

$$\tilde{x} = \tilde{x} - H^{-1} \nabla{f}(\tilde{x})$$

Utilizamos a inversa da Hessiana, pois é a maneira algebricamente correta de calcular a ração do vetor gradiente com a hessiana. 
Temos o problema da Hessiana ser singular (determinante 0).


In [18]:
def newton_method(x0,f,grad,H,tol=1e-6):
    
    x = np.array(x0)

    list_x = [x]
    list_fx = [f(x)]

    while np.linalg.norm(grad(x)) > tol:
        
        hinv = np.linalg.inv(H(x))
        g = np.array([grad(x)]).T
        delta = np.matmul(hinv,g)
        x = x - delta.T
        x = x[0]
        
        list_x.append(x)
        list_fx.append(f(x))

        g = grad(x)

    return x,f(x),list_x,list_fx

if __name__ == "__main__":
  

    f = lambda x: (100*(x[1] - x[0]**2)**2 + (x[0]-1)**2) 
    grad = lambda x: [-400*(x[1]-x[0]**2)*x[0] + 2*(x[0]-1), 200*(x[1]-x[0]**2)]
    H = lambda x: [[-400*x[1]+1200*x[0]**2,-400*x[0]],[-400*x[0],200]]
    xs,fs,xlist,fx_list = newton_method([1,-2],f,grad,H)

    print(xs)
    print(xlist)
    

[1. 1.]
[array([ 1, -2]), array([1., 1.])]
