In [80]:
import numpy as np


# <center> Trabalho Final de ALN #

## Nome : Felipe Eduardo dos Santos - 2017021223

# Resolução de sistemas lineares por métodos iterativos

Vamos ver o método do gradiente para aproximar soluções de sistemas do tipo : 

$$Ax=b$$
$$\ A\in\mathbb{R}^{n\times n}$$
$$x,b\in\mathbb{R}^n$$

Onde A é simétrica definida positiva.

## 1. Métodos de Descida

### 1.1 Minimização e solução dos sitema



Começamos analisando a forma quadrática:

$$
J(x) = \frac{1}{2}x^tAx-x^tb
$$
$$
= \frac{1}{2}\sum_{i,j=1}^n a_{ij}x_ix_j - \sum_{i=1}^nb_ix_i
$$

Vamos começar avaliando o gradiente da forma, note que:

$$
\nabla J(x) = (\frac{\partial}{\partial x_1}J(x) ,...\ , \frac{\partial}{\partial x_n}J(x))
$$

<center> E portanto,</center>


$$
\frac{\partial}{\partial x_k}J(x)
= a_{k1}x_1 + ... + a_{kn}x_n - b_k 
$$

$$
\nabla J(x) = Ax-b
$$

Se A é definida positiva, $\nabla J(x)=0$ é ponto de mínimo como demonstrado no livro, logo, minimizar $J(x)$ é encontrar $x$ satisfazendo $Ax=b$.




### 1.2 Espírito dos algoritmos

Algoritmos de descidas baseados em minimizar $J$ consitem em, dar um chute inicial $x^{(0)}$ e gerar uma sequência $\{x^{(n)}\}_{n\in\mathbb{N}}$ de forma que $J(x^{(k+1)})<J(x^{(k)})$ assim eventualmente chegando a um $x^{(k)}$ sulficientemente próximo da solução do sistema.

No caso dado um chute inicial $x^{(0)}$ metodos de descida consistem em encontrar uma direção $p^{(k)}$ e um coeficiente $\alpha_k$ que faça nosso chute ficar cada vez mais próximo fazendo:

$$
x^{(k+1)} = x^{(k)} + \alpha_k p^{(k)}
$$

Pelo teorema 7.4.5 do Livro sabemos que para o $J$ definido temos um alfa exato.

$$
\alpha_k = \frac{(p^{(k)})^t r^{(k)}}{(p^{(k)})^t A p^{(k)}}
$$

$$
r^{(k)} = b-Ax^{(k)}
$$

A escolha da direção a ser seguida caracteriza diversos algoritmos diferentes.

Vamos fazer então uma função que representa um metodo de descida genérico.

In [81]:
def descentAlg(x0, A, b, method, tol=1e-10, maxIter=int(1e5), printIters=True, printSteps=False):

    # Limitamos o numero de iterações
    for _ in range(maxIter):
        if printSteps:
            print(x0)
        # residuo
        r = b - A @ x0

        # Caso o erro for pequeno o suficiente, paramos
        if np.linalg.norm(r) <= tol:
            if printIters:
                print(f"Converged in {_} iterations")
            break
        
        # Escolhemos a direção de descida e
        # calculamos o alpha para andar na linha escolhida
        pk, alpha = method(r, A)

        # Atualizamos nossa aproximação
        x0 = x0 + alpha * pk 

    return x0


### 1.3 Steepest Descent

 A ideia é usar a direção de busca sendo a direção do resíduo, isto é, $p^{(k)}=r^{(k)}$, ou seja, como $r^{(k)} = -\nabla J(x^{(k)})$ estamos descendo na direção mais íngreme, que é dada pelo oposto do gradiente.

 Para isso definiremos nosas funções que escolhem a direção e o alpha

In [82]:

def gradD(r,A):
    # A direção é a do residuo que é o gradiente
    pk = r

    # Alpha portanto se torna
    alpha = (r @ r) / (r @ (A @ r))

    return pk, alpha



### 1.3.1 Exemplos simples

In [83]:
A = np.array([[2,1],
            [1,2]])
            
b = np.array([1,1])

x0_1 = np.array([-543,99])
x0_2 = np.array([0,0])
x0_3 = np.array([-5,3])
x0_4 = np.array([1,-7])


print(descentAlg(x0_1, A, b, gradD))
print(descentAlg(x0_2, A, b, gradD))
print(descentAlg(x0_3, A, b, gradD))
print(descentAlg(x0_4, A, b, gradD))
print(descentAlg(b, A, b, gradD))

Converged in 34 iterations
[0.33333333 0.33333333]
Converged in 1 iterations
[0.33333333 0.33333333]
Converged in 37 iterations
[0.33333333 0.33333333]
Converged in 26 iterations
[0.33333333 0.33333333]
Converged in 1 iterations
[0.33333333 0.33333333]


### 1.4 Gradiente conjugado