# Marcos Paulo Lopes #

Nesta aula, iremos implementar métodos para encontrar vetores de solução $x$ para sistemas lineares no formato $Ax=b$.

# Preliminares #

### Resolvendo sistemas triangulares ###

Normalmente, para resolver sistemas lineares, precisamos chegar de alguma forma a sistemas triangulares (inferiores ou superiores). Por que? Porque eles podem ser resolvidos pelo método das substituições retroativas.



$$ x_{i} = \frac{b_{i}-\sum\limits_{j=1}^{i-1}{a_{ij}x_{j}}}{a_{ii}} $$

e

$$ x_{i} = \frac{b_{i}-\sum\limits_{j=i+1}^{n}{a_{ij}x_{j}}}{a_{ii}} $$

Faça duas funções, que recebendo como parâmetro uma matriz $A$ triangular (superior ou inferior) e um vetor $b$, retorne o vetor solução $X$:

In [1]:
import numpy as np

In [2]:
def resolveTS(A,b): #A Triangular Superior
    x = np.zeros(len(A))
    for i in range(len(A)-1,-1,-1):
        x[i] = (b[i] - (A[i][i+1:]*x[i+1:]).sum())/A[i][i]
    return x

def resolveTI(A,b): #A Triangular Inferior
    x = np.zeros(len(b))
    for i in range(len(b)):
        x[i] = (b[i] - (A[i][:i]*x[:i]).sum())/A[i][i]
    return x

### Operações $l$-elementares ###

Fazer operações $l$-elementares com matrizes numpy é bem simples: com `M[i]` você acessa a i-ésima linha:

In [3]:
M = np.random.randint(-10,10,(4,4))
print(M)

print("Subtraindo uma linha por outra multiplicada por uma constante:")
M[2] = M[2] - M[1]*2
print(M)

print("Trocar duas linhas:")

M[[1,3]] = M[[3,1]]
print(M)


[[ -8  -7  -5   9]
 [  9   1  -2  -4]
 [ -6 -10  -2  -9]
 [ -4  -4  -3   1]]
Subtraindo uma linha por outra multiplicada por uma constante:
[[ -8  -7  -5   9]
 [  9   1  -2  -4]
 [-24 -12   2  -1]
 [ -4  -4  -3   1]]
Trocar duas linhas:
[[ -8  -7  -5   9]
 [ -4  -4  -3   1]
 [-24 -12   2  -1]
 [  9   1  -2  -4]]


In [4]:
print("Achar o maior elemento da matriz:")
print(M[1].max())

print("Achar o maior elemento da matriz em módulo:")
print(abs(M[:][2]).max())

# E PARA ACHAR O MAIOR ELEMENTO DE UMA LINHA?
print(M[0][:].max())

Achar o maior elemento da matriz:
1
Achar o maior elemento da matriz em módulo:
24
9


In [5]:
print("Matriz transposta:\n",M[1:3].T)

print("Determinante de M: ",np.linalg.det(M))

print("Autovalores de uma matriz:")

(a,_) = np.linalg.eig(M) 
print(a)

Matriz transposta:
 [[ -4 -24]
 [ -4 -12]
 [ -3   2]
 [  1  -1]]
Determinante de M:  1463.0
Autovalores de uma matriz:
[-21.24874123  12.19547353   0.95638174  -5.90311404]


# Métodos Exatos #

## Eliminação gaussiana ##

Para fazer a eliminação gaussiana deve-se usar os elementos da diagonal principal de A como pivos para zerar os elementos da mesma coluna.

Implemente a eliminação gaussiana simples (sem pivotação parcial):

In [6]:
def eliminacaoGaussianaSimples(A,b):
    Au = np.zeros(A.shape)
    Ax = np.concatenate((A,b.reshape(len(b),1)),axis=1)
    for i in range(len(Ax)-1):
        Ax[i+1:] -= (Ax[i+1:,i]/Ax[i][i]).reshape((len(Au[i+1:]),1))*Ax[i]
        
    return resolveTS(Ax[:,:len(b)],Ax[:,len(b)])

## Decomposição LU ##

A decomposição LU é mais utilizada quando a mesma matriz de coeficientes $A$ é usada para várias soluções diferentes. Por isto, ela pode ser dividida em dois passos:

- Decompor $A$ em $L$ e $U$ 
- Dados $L$, $U$ e $b$, achar a solução X

Faça as duas funções, com a decomposição ainda sem pivotação parcial:

In [7]:
def decompoeLU(A):
    L = np.identity(len(A))
    U = A.copy()
    for i in range(len(A)-1):
        L[i+1:,i] = U[i+1:,i]/U[i][i]
        U[i+1:] -= L[i+1:,i].reshape((len(L[i+1:]),1))*U[i]
    return L,U 

def resolveLU(L,U,b):
    m = resolveTI(L,b)
    r = resolveTS(U,m)
    return r


### Pivotação Parcial ###

Sistemas onde o determinante de uma das submatrizes principais ($A_{1x1},A_{2x2},A_{3x3}...$) é igual a $0$ não podem ser resolvidos com a decomposição LU simples. Nestes casos, deve-se utilizar a pivotação parcial, onde o pivô é escolhido da linha com o maior elemento em módulo.

Contudo, é importante guardar as trocas de linha que foram efetuadas na matriz de permutações $P$. Esta matriz é uma matriz identidade com as linhas trocadas junto com a pivotação. Por exemplo, se na primeira coluna o maior elemento está na linha três, este será o primeiro pivô (a linha 1 será trocada com a 3). Neste caso, na matriz $P$ também se troca estas linhas. No fim do processo:

$PAx = Pb$

$LUx=Pb$

Então basta resolver trocando as linhas de b de através da multiplicação por P. Lembrem que multiplicar matrizes em numpy é:

`p.dot(a)` ou `dot(p,a)`

Implemente uma função que checa se a pivotação parcial é necessária e a decomposição LU com pivotação parcial:

In [8]:
def verificaPivot(A):
    pode=True
    for i in range(len(A)):
        if np.linalg.det(A[:i,:i]) == 0:
            pode=False
    return pode 

def LUpivpar(A):
    bf = A.shape[0]
    L = np.zeros(A.shape)
    U = A.copy()
    P = np.identity(bf)
    for i in range(bf):
        ch = np.argmax(np.abs(U[i:,i])) + i
        U[[i,ch]] = U[[ch,i]]
        L[[i,ch]] = L[[ch,i]]
        P[[i,ch]] = P[[ch,i]]
        L[i][i]=1
        for j in range(i+1,bf):
            ax = U[j][i]/U[i][i]
            L[j][i] = ax
            U[j] -= U[i]*ax
    return L,U,P

def resolveLUpar(L,U,P,b):
    m = resolveTI(L,np.dot(P,b))
    r = resolveTS(U,m)
    return r


#### Exercício ####

Rode e verifique o tempo com `%timeit` da eliminação gaussiana, decomposição LU e LU com pivotação para o sistema abaixo. No caso da LU, calcule o tempo da decomposição e da solução dos sistemas:

In [9]:
#Sistema 1:
print("1º Sistema:")

M1 = np.array([[1,-3,5,6], [-8,4,-1,0],[3,2,-2,7],[1,2,5,-4]],dtype='float')
b1 = np.array([17,29,-11,7],dtype='float')

print('Eliminação de Gauss Simples: \t',end='')
%timeit -n100 eliminacaoGaussianaSimples(M1,b1)
print('Decompor LU:\t ',end='')
%timeit -n100 decompoeLU(M1)
print('Resolvendo LU:\t ',end='')
L,U=decompoeLU(M1)
%timeit -n100 resolveLU(L,U,b1)
print('Decompor LU pivotação parcial/Resolver:',end='')
%timeit -n100 LUpivpar(M1)
print('Resolvendo LU pivparc:',end='')
L,U,P=LUpivpar(M1)
%timeit -n100 resolveLUpar(L,U,P,b1)



#Sistema 2:
print('\n2º Sistema:')

M2 = np.array([[-2,3,1,5],[5,1,-1,0],[1,6,3,-1],[4,5,2,8]],dtype='float')
b2 = np.array([2,-1,0,6],dtype='float')

print('Eliminação de Gauss Simples: \t',end='')
%timeit -n100 eliminacaoGaussianaSimples(M2,b2)
print('Decompor LU:\t ',end='')
%timeit -n100 decompoeLU(M2)
print('Resolvendo LU:\t ',end='')
L,U=decompoeLU(M2)
%timeit -n100 resolveLU(L,U,b2)
print('Decompor LU pivotação parcial/Resolver:',end='')
%timeit -n100 LUpivpar(M2)
print('Resolvendo LU pivparc:',end='')
L,U,P=LUpivpar(M2)
%timeit -n100 resolveLUpar(L,U,P,b2)

1º Sistema:
Eliminação de Gauss Simples: 	56.1 µs ± 13.2 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Decompor LU:	 31 µs ± 4.12 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Resolvendo LU:	 58.7 µs ± 38.7 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Decompor LU pivotação parcial/Resolver:118 µs ± 7.49 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Resolvendo LU pivparc:59.4 µs ± 8.35 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

2º Sistema:
Eliminação de Gauss Simples: 	The slowest run took 5.33 times longer than the fastest. This could mean that an intermediate result is being cached.
103 µs ± 81.9 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Decompor LU:	 33.8 µs ± 6.99 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Resolvendo LU:	 44 µs ± 2.48 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Decompor LU pivotação parcial/Resolver:122 µs ± 13.7 µs per loop (mean ± std. dev. of 7 runs, 100 loops ea

## Cholesky ##

O método de Cholesky só pode ser utilizado quando a matriz for:

- Simétrica (igual a sua transposta)
- Definida positiva: 
    - Todos os elementos da diagonal principal são positivos
    - Todos os autovalores de $A$ são positivos
    - Todas as submatrizes superiores possuem determinante __positivo__.

Se for possível, o método de Cholesky é uma decomposição LU onde $U=L^{T}$, ou seja $LL^{T}x=b$.

Lembrando que na decomposição de Cholesky os elementos da diagonal principal de L são:

$$l_{jj} = \sqrt{a_{jj}-\sum\limits_{k=1}^{j-1}{l_{jk}^2}, j = 1,2,...,n}$$

E os fora da diagonal principal são:

$$ l_{ij} = \frac{a_{ij}-\sum\limits_{k=1}^{j-1}{l_{ik}l_{jk}}}{l_{jj}} $$

Desta forma, faça uma função para determinar se uma matriz pode ser resolvida via Cholesky e uma para encontrar L (para resolver pode-se usar `resolveLU(L,L.T,b)`):

In [10]:
def verificaCholesky(A):
    pode=True
    if (A == A.T).all() and (A.diagonal() > 0).all() and (np.linalg.eig(A)[0] > 0).all() and verificaPivot(A) == True:
        pode=True
    else:
        pode=False
    return pode

def geraCholesky(A):
    L = np.zeros((len(A),len(A)))
    for i in range(len(A)):
        for j in range(i,len(A)):
            if i==j:
                L[j][i] = np.sqrt(A[j][i] - sum([L[i][k]**2 for k in range(i)]))
            else:
                L[j][i] = (A[j][i] - sum(L[j][k]*L[i][k] for k in range(i)))/L[i][i]
    return L


No método de Cholesky, por ser uma matriz simétrica, podemos, ao invés de calcular o determinante normalmente, usar a seguinte definição:

$$ det(A) = det(L)det(L') $$

$$ det(A) = \bigg(\prod_{i=1}^{n}{l_{ii}}\bigg)^2 $$

In [11]:
def detCholesky(M):
    det = 1
    for i in range(len(M)):
        det*=M[i][i]
    det**=2
    return det

#### Exercicios ####

1 - Verifique se os seguintes sistemas podem ser resolvidas via Choleski

2 - Compare o tempo para decomposição LU das que são possíveis com a de Choleski usando `%timeit`

3 - Compare o tempo do calculo do determinante de numpy com o determinante específico para matrizes para choleski

In [12]:
print('3º Sistema:')

M3 = np.array([[9,-6,3],[-6,29,-7],[3,-7,18]],dtype='float')
b3 = np.array([-3,-8,33],dtype='float')

print('Condicao Cholesky:',verificaCholesky(M3))
print('Gera Cholesky:\t ',end='')
%timeit -n100 geraCholesky(M3)
print('Decompor LU: ',end='')
%timeit -n100 decompoeLU(M3)
print('Det. Numpy:    ',end='')
%timeit -n100 np.linalg.det(M3)
print('Det. Cholesky: ',end='')
A=geraCholesky(M3)
%timeit -n100 detCholesky(A)

print('\n4º Sistema:')

M4 = np.array([[4,-2,4,10],[-2,2,-1,-7],[4,-1,14,11],[10,-7,11,31]],dtype='float')
b4 = np.array([2,2,-1,-2],dtype='float')

print('Condicao Cholesky:',verificaCholesky(M4))
print('Gera Cholesky:\t ',end='')
%timeit -n100 geraCholesky(M4)
print('Decompor LU: ',end='')
%timeit -n100 decompoeLU(M4)
print('Det. Numpy:    ',end='')
%timeit -n100 np.linalg.det(M4)
print('Det. Cholesky: ',end='')
A=geraCholesky(M4)
%timeit -n100 detCholesky(A)

print('\n5º Sistema:')

M5 = np.array([[16,-4,4,12],[-4,2,-1,-7],[4,-1,26,13],[12,-7,13,25]],dtype='float') #Nao faz Cholesky
b5 = np.array([2,2,-1,-2],dtype='float')

print('Condicao Cholesky: ',verificaCholesky(M5))

3º Sistema:
Condicao Cholesky: True
Gera Cholesky:	 23.6 µs ± 9.16 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Decompor LU: 24.4 µs ± 7.98 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Det. Numpy:    7.5 µs ± 3.38 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Det. Cholesky: 1.85 µs ± 103 ns per loop (mean ± std. dev. of 7 runs, 100 loops each)

4º Sistema:
Condicao Cholesky: True
Gera Cholesky:	 The slowest run took 6.43 times longer than the fastest. This could mean that an intermediate result is being cached.
60.2 µs ± 61.7 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Decompor LU: 29.7 µs ± 1.99 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Det. Numpy:    7.26 µs ± 2.34 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
Det. Cholesky: 2.13 µs ± 133 ns per loop (mean ± std. dev. of 7 runs, 100 loops each)

5º Sistema:
Condicao Cholesky:  False
