# Métodos Iterativos #

### Critérios de parada ###

Antes de implementarmos os métodos iterativos, temos que implementar um método para o critério de parada. No nosso caso, usaremos a _norma infinita_. A norma infinita é dada por:

$$\lVert v \rVert_{\infty} = \max_{1\leq i\leq n}|v_i|$$ 

E a distância entre duas soluções iteradas $x^k$ e $x^{k-1}$ pode ser dada por:

$$ \frac{\lVert x^k - x^{k-1} \rVert_{\infty}}{\lVert x^k\rVert_{\infty}} = \frac{\max\limits_{1\leq i\leq n}|x_i^{k} - x_i^{k-1}|}{\max\limits_{1\leq i\leq n}|x_i^k|} \leq \epsilon$$

Faça uma função para retornar a distância usando a norma infinita de dois vetores:

In [8]:
import numpy as np

In [9]:
from numpy.linalg import inv

In [10]:
#v1=k
#v2=k+1
def normaInfinita(v1,v2):
    norma=np.abs(v2-v1).max()/np.abs(v2).max()
    return norma

## Jacobi ##

Para resolver o método de Jacobi, se deve decompor a matriz $A$ em três matrizes compostas dos seus elementos, $D$ (Diagonal), $E$ (triangular inferior) e $F$ (triangular superior).

De posse destes elementos, deve-se utilizar esta fórmula de iteração:

$$ x^{k+1}=-D^{-1}(E+F)x+D^{-1}b $$

Lembrando que para D ter inversa, nenhum elemento da diagonal principal de A pode ser nulo.

Desta forma, eu posso utilizar a forma matricial acima para computar as respostas. Implemente o método de Jacobi matricial abaixo:

In [11]:
#Não pode ter elemento nulo na diagonal principal

def jacobim(A,b,niter=1000,minimo = 0.000001):
    D=np.zeros((len(A),len(A)))
    E=np.zeros((len(A),len(A)))
    F=np.zeros((len(A),len(A)))
    x=np.zeros(len(b))
    ant=x.copy()
    k=1
    for i in range(len(A)):
        for j in range(len(A)):
            if i == j:
                D[i][j]=1/A[i][j]
            elif i < j:
                F[i][j]=A[i][j]
            else:
                E[i][j]=A[i][j]

    J=(-D).dot(E+F)
    while(k<niter):
        x=J.dot(ant)+D.dot(b)
        if(normaInfinita(ant,x)>minimo):
            ant=x.copy()
        else:
            break
        k+=1

    return x

In [12]:
A=np.array(([10,3,-2],[2,8,-1],[1,1,5]),dtype="float")
b=np.array(([57,20,-4]),dtype="float")
print(A)
print(b)
print(podeJacobi(A))
print(jacobim(A,b,1000,0.000001))



[[10.  3. -2.]
 [ 2.  8. -1.]
 [ 1.  1.  5.]]
[57. 20. -4.]


NameError: name 'x' is not defined







Outra forma de implementar Jacobi é através da fórmula escalar:

$$x_i^{k+1}=\frac{1}{a_{ii}} - \left( \sum\limits_{\substack{j=1 \\ i\neq j}}^{n}{a_{ij}x_j^k+b_i} \right)$$

Implemente a forma escalar do jacobi:

In [15]:
def jacobie(A,b,niter=1000,minimo = 0.000001):
    x=np.zeros(len(b))
    ant=np.zeros(len(b))
    k=1
    while(k<niter):
        for i in range(len(A)):
            som=0
            for j in range(len(A)):
                if i != j:
                    som-=A[i][j]*ant[j]
            x[i]=(1/A[i][i])*(som+b[i])
            
        if(normaInfinita(ant,x)>minimo):
            ant=x.copy()
        else:
            break
        k+=1

    return x

In [16]:
print(A)
print(b)
print(podeJacobi(A))
print(jacobie(A,b,1000,0.000001))
for i in range(len(A)):
    y=[A[i][j] for j in range(len(A)) if i != j]
    print(y)


[[10.  3. -2.]
 [ 2.  8. -1.]
 [ 1.  1.  5.]]
[57. 20. -4.]
False
[ 4.99999964  1.00000022 -1.99999963]
[3.0, -2.0]
[2.0, -1.0]
[1.0, 1.0]


Para o método de Jacobi (e o Gauss-Seidel) convergirem para um resultado correto, elas tem que ter condições de convergência:

- Condição suficiente: Elementos da diagonal principal estritamente dominantes.

$$ |a_{ii}|> \sum\limits_{\substack{j=1 \\ j\neq i}}^{n}{|a_{ij}|,i=1,2,...,n}$$

Esta condição se verdadeira garante a convergência. Contudo, mesmo se ela for falsa o sistema ainda pode convergir.

- Condição necessária: $\rho(M)<1$, sendo $\rho(M)$ o raio espectral, o maior autovalor em módulo.

Faça uma função que verifique se um sistema com uma matriz de coeficientes A pode ser solucionado via jacobi, testando primeiro a condição suficiente e, em caso negativo, testando a condição necessária:

In [13]:
def podeJacobi(A):
    pode=True
    for i in range(len(A)):
        if abs(A[i][i]) > sum([A[i][j] for j in range(len(A)) if i != j]):
            pode=False
    if pode == False:
        (auto,_) = np.linalg.eig(A)
        if max(abs(auto))<1:
            pode=True
    
    return pode

## Gauss-Seidel ##

Função de iteração:

$$ x^{k+1}=D^{-1}(-Ex^{k+1}-Fx^{k}+b)$$

Lembrando que multiplicar por $D^{-1}$ é o mesmo que dividir cada linha pelo elemento da diagonal principal desta linha em A

A forma mais simples de fazer o Gauss Seidel matricialmente é linha a linha (calculando a formula acima pra cada linha da solução X)

Implemente Gauss-Seidel na forma Matricial e na forma escalar (acessando os elementos individualmente das matrizes)

In [12]:
def gaussM(A,b,niter=1000,minimo = 0.000001):
    D=np.zeros((len(A),len(A)))
    E=np.zeros((len(A),len(A)))
    F=np.zeros((len(A),len(A))) 
    x=np.zeros(len(b))
    ant=x.copy()
    k=1
    for i in range(len(A)):
        for j in range(len(A)):
            if i == j:
                D[i][j]=1/A[i][j]
            elif i < j:
                F[i][j]=A[i][j]
            else:
                E[i][j]=A[i][j]
    while(k<niter):
        x=D.dot(-(E.dot(x))-(F.dot(ant))+b)
        if(normaInfinita(ant,x)>minimo):
            ant=x.copy()
        else:
            break
        k+=1
    return x

def gaussE(A,b,niter=1000,minimo = 0.000001):
    x=np.zeros(len(b))
    ant=np.zeros(len(b))
    h=0
    k=1
    for z in range(len(A)):
        x[z]=b[z]/A[z,z]
        
    while(k<niter):
        for i in range(len(A)):
            som=0
            for j in range(len(A)):  
                if i != j:
                    if i == 0:
                        som-=A[i][j]*ant[j]
                    elif i == 1:
                        if h == 0:
                            som-=A[i][j]*x[j]
                            h+=1
                        else:
                            som-=A[i][j]*ant[j]
                    else:
                        som-=A[i][j]*x[j]
                        
            x[i]=(1/A[i][i])*(som+b[i])
            
        if(normaInfinita(ant,x)>minimo):
            ant=x.copy()
        else:
            break
        k+=1
  
    return x

In [13]:
print(podeJacobi(A))
print(gaussM(A,b,1000,0.000001))
print(gaussE(A,b,1000,0.000001))


True
[ 4.99999964  1.00000022 -1.99999963]
[ 5.00000095  1.00000074 -2.00000034]


#### Exercicios ####

1 - Tente resolver todos os sistemas (de M1 a M5) com Jacobi e Gauss-Seidel, tanto na forma matricial quanto na escalar e, nos casos em que o resultado _divergir_, verifique a condição de convergência dos métodos.


In [14]:
M1 = np.array([[1,-3,5,6], [-8,4,-1,0],[3,2,-2,7],[1,2,5,-4]],dtype='float')
b1 = np.array([17,29,-11,7],dtype='float')

M2 = np.array([[-2,3,1,5],[5,1,-1,0],[1,6,3,-1],[4,5,2,8]],dtype='float')
b2 = np.array([2,-1,0,6],dtype='float')

M3 = np.array([[9,-6,3],[-6,29,-7],[3,-7,18]],dtype='float')
b3 = np.array([-3,-8,33],dtype='float')

M4 = np.array([[4,-2,4,10],[-2,2,-1,-7],[4,-1,14,11],[10,-7,11,31]],dtype='float')
b4 = np.array([2,2,-1,-2],dtype='float')

M5 = np.array([[16,-4,4,12],[-4,2,-1,-7],[4,-1,26,13],[12,-7,13,25]],dtype='float') 
b5 = np.array([2,2,-1,-2],dtype='float')

print("Jacobi M M1\n",jacobim(M1,b1))
print("Jacobi M M2\n",jacobim(M2,b2))
print("Jacobi M M3\n",jacobim(M3,b3))
print("Jacobi M M4\n",jacobim(M4,b4))
print("Jacobi M M5\n",jacobim(M5,b5))

print("Jacobi E M1\n",jacobie(M1,b1))
print("Jacobi E M2\n",jacobie(M2,b2))
print("Jacobi E M3\n",jacobie(M3,b3))
print("Jacobi E M4\n",jacobie(M4,b4))
print("Jacobi E M5\n",jacobie(M5,b5),"\n")

print("Verificando a condição do M1",podeJacobi(M1))
print("Verificando a condição do M2",podeJacobi(M2))
print("Verificando a condição do M3",podeJacobi(M3))
print("Verificando a condição do M4",podeJacobi(M4))
print("Verificando a condição do M5",podeJacobi(M5))


Jacobi M M1
 [            -inf             -inf             -inf -9.21749331e+307]
Jacobi M M2
 [             inf             -inf             -inf -1.14211013e+308]
Jacobi M M3
 [-1.00000058e+00  3.45632528e-07  1.99999962e+00]
Jacobi M M4
 [-3.43950664e+286  4.43336511e+286 -1.19755189e+286 -1.30579095e+286]
Jacobi M M5
 [-8.73758712e+225  2.93012976e+226 -4.00170248e+225 -8.57371557e+225]
Jacobi E M1
 [-1.11033912e+308             -inf -2.55942517e+307  1.60953057e+306]
Jacobi E M2
 [ inf -inf -inf -inf]
Jacobi E M3
 [-1.00000058e+00  3.45632528e-07  1.99999962e+00]
Jacobi E M4
 [-3.43950664e+286  4.43336511e+286 -1.19755189e+286 -1.30579095e+286]
Jacobi E M5
 [-8.73758712e+225  2.93012976e+226 -4.00170248e+225 -8.57371557e+225] 

Verificando a condição do M1 False
Verificando a condição do M2 False
Verificando a condição do M3 True
Verificando a condição do M4 False
Verificando a condição do M5 False


  after removing the cwd from sys.path.
  # Remove the CWD from sys.path while we load stuff.


2 - Use todos os métodos (Gauss, LU com pivotação, Choleski, Jacobi e Gauss-Seidel) e marquem o tempo com `%timeit -n1` para o seguinte sistema:

In [15]:
MF = np.random.randint(1,20,(100,100))
bF = np.random.randint(-1000,1000,100)
MF = MF + 0.0
bF = bF + 0.0
print(MF)

[[15.  4.  3. ... 11. 17.  8.]
 [ 6.  4. 15. ...  9. 17. 13.]
 [13. 18. 19. ... 12. 18. 16.]
 ...
 [ 8.  7. 19. ...  8. 17. 11.]
 [11.  6. 10. ...  1. 12.  6.]
 [10.  1. 15. ...  1.  7. 18.]]


In [16]:
def resolveTS(A,b): 
    x = np.zeros(len(A))
    for i in range(len(A)-1,-1,-1):
        x[i] = (b[i] - (A[i][i+1:]*x[i+1:]).sum())/A[i][i]
    return x

def resolveTI(A,b): 
    x = np.zeros(len(b))
    for i in range(len(b)):
        x[i] = (b[i] - (A[i][:i]*x[:i]).sum())/A[i][i]
    return x

def eliminacaoGaussianaSimples(A,b):
    Au = np.zeros(A.shape)
    Ax = np.concatenate((A,b.reshape(len(b),1)),axis=1)
    for i in range(len(Ax)-1):
        Ax[i+1:] -= (Ax[i+1:,i]/Ax[i][i]).reshape((len(Au[i+1:]),1))*Ax[i]
    return resolveTS(Ax[:,:len(b)],Ax[:,len(b)])

def LUpivpar(A):
    bf = A.shape[0]
    L = np.zeros(A.shape)
    U = A.copy()
    P = np.identity(bf)
    for i in range(bf):
        ch = np.argmax(np.abs(U[i:,i])) + i
        U[[i,ch]] = U[[ch,i]]
        L[[i,ch]] = L[[ch,i]]
        P[[i,ch]] = P[[ch,i]]
        L[i][i]=1
        for j in range(i+1,bf):
            ax = U[j][i]/U[i][i]
            L[j][i] = ax
            U[j] -= U[i]*ax
    return L,U,P

def resolveLUpar(L,U,P,b):
    y = resolveTI(L,np.dot(P,b))
    return resolveTS(U,y)

def LUpar(A,b):
    L,U,P = LUparcial(A)
    return resolveLUpar(L,U,P,b)

def geraCholesky(A):
    L = np.zeros((len(A),len(A)))
    for i in range(len(A)):
        for j in range(i,len(A)):
            if i==j:
                L[j][i] = np.sqrt(A[j][i] - sum([L[i][k]**2 for k in range(i)]))
            else:
                L[j][i] = (A[j][i] - sum(L[j][k]*L[i][k] for k in range(i)))/L[i][i]
    return L


def resolveLU(L,U,b):
    y = resolveTI(L,b)
    return resolveTS(U,y)

def cholesky(A,b):
    L = geraCholesky(A)
    return resolveLU(L,L.T,b)

In [17]:
print("Eliminação Gaussiana:")
%timeit -n1 eliminacaoGaussianaSimples(MF,bF)
print("Decomposição LU Parcial:")
%timeit -n1 LUpar(MF,bF)
print("Cholesky:")
%timeit -n1 cholesky(MF,bF)
print("Jacobi:")
%timeit -n1 jacobie(MF,bF)
print("Gauss-Seidel:")
%timeit -n1 gaussE(MF,bF)


Eliminação Gaussiana:
The slowest run took 43.97 times longer than the fastest. This could mean that an intermediate result is being cached.
14.5 ms ± 30.2 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
Decomposição LU Parcial:
The slowest run took 6.10 times longer than the fastest. This could mean that an intermediate result is being cached.
141 ms ± 60.9 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
Cholesky:




193 ms ± 75.3 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
Jacobi:


  # Remove the CWD from sys.path while we load stuff.
  after removing the cwd from sys.path.


756 ms ± 97.7 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
Gauss-Seidel:




113 ms ± 3.85 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
