# Fatoração LU

## $ \S 1 $ Matrizes elementares

Uma outra razão para usar a forma matricial do escalonamento é a seguinte:
_Aplicar uma operação elementar a um sistema $ \mathbf{A} \mathbf x =
\mathbf{b} $ corresponde a multiplicar a matriz aumentada $ [\mathbf{A}|
\mathbf{b}] $ à esquerda por uma matriz apropriada._

__Definição:__ A multiplicação à esquerda pelas seguintes matrizes quadradas
$ n \times n $, chamadas de __matrizes elementares__, correspondem respectivamente às
operações elementares $ (S) $, $ (T) $ e $ (M) $:

+  $ (S) $ A operação $ L_{i} \leftarrow L_i - \lambda_{ij} L_j $, para $ i > j $, corresponde à matriz
   $ \mathbf E_{ij}(-\lambda_{ij}) $ que possui todas as entradas nulas exceto pelas da diagonal,
   que são iguais a $ 1 $, e a da posição $ (i,j) $, que é igual a $ -\lambda_{ij} $.
+  $ (T) $ A operação de troca $ L_i \leftrightarrow L_j $ corresponde à
   __matriz-permutação__ $ \mathbf P_{ij} $ obtida a partir de $ I_n $ intercambiando-se
   as linhas $ i $ e $ j $.
+  $ (M) $ A operação $ L_i \leftarrow \mu L_i $
   $ (\mu \ne 0) $ corresponde à matriz diagonal obtida a partir de $ I_n $ (a matriz
   identidade $ n \times n $) fazendo a entrada $ (i,i) $ igual a $ \mu $.

__Exemplo 1:__ As matrizes
$$
	\mathbf E_{21}(-\lambda)=\begin{bmatrix}
	 1 & 0 & 0 \\
	 -\lambda & 1 & 0 \\
	 0 & 0 & 1
	\end{bmatrix},
	\quad
	\mathbf P_{13}=\begin{bmatrix}
	0 & 0 &1 \\
	0 & 1 & 0 \\
	1 & 0 & 0
	\end{bmatrix}
	\quad \text{e} \quad
	\begin{bmatrix}
	 1 & 0 & 0\\
	 0 & \mu & 0\\
	 0 & 0 & 1
	\end{bmatrix}
$$
são elementares de tipos $(S) $, $ (T) $ e $ (M) $, respectivamente. De fato, se 
$$
	\mathbf A=\begin{bmatrix}
		a_1 & a_2 & a_3 \\
		b_1 & b_2 & b_2 \\
		c_1 & c_2 & c_3 
	\end{bmatrix}
$$
é uma matriz $3\times 3$, então
$$
	\mathbf E_{21}(-\lambda)\,\mathbf A=\begin{bmatrix}
		a_1 & a_2 & a_3  \\
		b_1-\lambda a_1 & b_2 -\lambda a_2 & b_3-\lambda a_3 \\
		c_1 & c_2 & c_3  
	\end{bmatrix}
	\quad \text{e} \quad \mathbf P_{13}\, \mathbf A =
	\begin{bmatrix}
		c_1 & c_2 & c_3 \\
		b_1 & b_2 & b_2 \\
		a_1 & a_2 & a_3
	\end{bmatrix}\,,
$$
e similarmente para a terceira matriz elementar. Como não é necessário utilizar
qualquer operação do tipo $ (M) $ para se escalonar um sistema, a partir de agora
vamos considerar apenas matrizes elementares de tipos $ (S) $ e $ (T) $.

Observe que todas as matrizes elementares são invertíveis: Uma matriz de
permutação de linhas é a inversa dela mesma e a matriz inversa de $E_{ij}(-\lambda)$
é $E_{ij}(\lambda)$. Por exemplo:
$$
	\begin{bmatrix}
	 1 & 0 & 0 \\
	 0 & 1 & 0 \\
	0 & -7 & 1 
	\end{bmatrix}	\begin{bmatrix}
	 1 & 0 & 0 \\
	 0 & 1 & 0 \\
	0 & +7 & 1 
	\end{bmatrix}=\begin{bmatrix}
	 1 &0 & 0 \\
	 0 & 1 & 0 \\
	 0 & 0 & 1 
	\end{bmatrix},
$$
ou seja, $E_{32}(+7)E_{32}(-7)=I$.

Uma matriz quadrada é __triangular inferior__ se todas as suas entradas acima da
diagonal são nulas. A definição de matriz __triangular superior__ é análoga.
É fácil verificar que a soma e o produto de matrizes triangules inferiores (resp. superiores)
é do mesmo tipo. Além disto, a inversa de uma matriz triangular inferior (superior) é do mesmo
tipo, desde que esta inversa exista. O determinante de uma matriz triangular é o produto das
suas entradas diagonais. Observe que as matrizes elementares de tipo $ (S) $ são
triangulares inferiores pela exigência que $ j < i $.

📝 Matriz triangulares superiores geralmente são denotadas por $ \mathbf U $ (de
"_upper triangular_"), e matriz triangulares inferiores por $ \mathbf L $ (de
"_lower triangular_").

**Problema 1:** Recorde que uma _permutação_ dos inteiros de $ 1 $ a $ n $ é
simplesmente uma função bijetiva $ \pi \colon \{1,\cdots,n\} \to \{1,\cdots,n\} $.
Podemos denotar de maneira unívoca uma tal permutação pelo vetor
$$
    \big(\pi(1),\pi(2), \cdots, \pi(n)\big) \in \mathbb R^n\,.
$$
Por exemplo, a permutação de $ \{1,2,3\} $ que troca $ 2 $ e $ 3 $ pode ser
denotada pelo vetor $ (1, 3, 2) $. Determine as matrizes de permutação correspondentes
às permutações seguintes:

(a) $ (3, 2, 1) $.

(b) $ (1, 4, 2, 3) $.

## $ \S 2 $ Fatoração LU

Recorde que uma matriz quadrada $ \mathbf A $ é dita **não-singular** se seu
determinante é não-nulo ou, equivalentemente, se ela é invertível.

__Teorema 2.1 (decomposição de Doolittle):__ _Seja $ \mathbf A $ uma matriz
quadrada não-singular $ n\times n $ e suponha que seja possível escalonar $
\mathbf A $ utilizando somente operações elementares do tipo $ (S) $. Então
podemos escrever $ \mathbf A = \mathbf L \mathbf U $, onde $ \mathbf L $ é
triangular inferior com elementos diagonais iguais a $ 1 $ e $ \mathbf U $ é
triangular superior com elementos diagonais não-nulos. Esta fatoração é única.
Além disto:_
* _A matriz $ \mathbf U $ é a matriz resultante do escalonamento de_ $ \mathbf A $.
* *A entrada na posição $ (i, j) $ de $ \mathbf L $ (com $ i > j $) é
  exatamente o coeficiente $ \lambda_{ij} $ da operação elementar
  $ L_i \leftarrow L_i - \lambda_{ij} L_j $ que envolve as linhas $ i $ e $ j $
  no escalonamento*.

Esta fatoração é importante por vários motivos, dentre eles o seguinte:
Se sabemos fatorar $\mathbf A $ como $ \mathbf A = \mathbf L \mathbf U $,
então podemos resolver imediatamente o sistema
$$\mathbf A \mathbf x= \mathbf L \mathbf U \mathbf x = \mathbf b \,. $$
De fato, neste caso a resolução dele se reduz à do par de sistemas:
$$
	\begin{cases}
		\mathbf L\mathbf y= \mathbf b  \\
		\mathbf U \mathbf x= \mathbf y
	\end{cases}\,.
$$
Como $ \mathbf L $ é triangular inferior, o primeiro sistema pode ser resolvido
imediatamente por retro-substituição. Então, uma vez encontrado $ \mathbf
y $, como $ \mathbf U $ é triangular superior, o segundo sistema pode ser
resolvido por substituição progressiva (direta).

📝 A vantagem principal deste método surge quando precisamos resolver um conjunto
de sistemas da forma $ \mathbf A \mathbf x = \mathbf b $ para uma matriz
$ \mathbf A $ fixa mas para vários vetores $ \mathbf b $. Neste caso a resolução
do par de sistemas acima é muito mais eficiente do que a resolução "do zero" do
sistema original para cada valor de $ \mathbf b $.

Como o determinante de uma matriz triangular é simplesmente o produto de suas
entradas diagonais, se $ \mathbf A = \mathbf L \mathbf U $ é a decomposição
de Doolittle de $ \mathbf A $, então 
$$
\det(\mathbf A) = \det(\mathbf U)\,,
$$
já que as entradas diagonais de $ \mathbf L $ são todas iguais a $ 1 $.

⚠ O Teorema 2.1 garante que caso a decomposição de Doolittle de uma matriz $
\mathbf A $ exista, ela é única. Entretanto, a não-singularidade de $ \mathbf A
$ é insuficiente para garantir a existência desta decomposição. De fato, é
possível mostrar que $ \mathbf A $ possui uma fatoração $ LU $ (ou seja, pode
ser escalonada sem troca de linhas) se e somente se cada determinante menor $ k
\times k $ ($ k = 1, 2, \cdots, n $) de $ \mathbf A $ é não-nulo; por definição
estes são os determinantes das matrizes obtidas obtidas das $ k $ primeiras
linhas e $ k $ primeiras colunas de $ \mathbf A $.

__Problema 2:__ Encontre a fatoração $ LU $ da matriz seguinte:
$$
\begin{bmatrix}
  2 & 1 & 0 \\
  0 & 4 & 2 \\
  6 & 3 & 5
\end{bmatrix}
$$

__Problema 3:__ 

(a) Usando a matriz aumentada, resolva o sistema linear $ \mathbf A \mathbf x = \mathbf b $ onde
$$
\mathbf A =
\begin{bmatrix}
  2 & 1 & 1  \\
  -1 & 2 & 2 \\
  0 & 3 & -1
\end{bmatrix} \quad \text{e} \quad
\begin{bmatrix}
3 \\
4 \\
1
\end{bmatrix}
$$

(b) Encontre a decomposição $ LU $ da matriz $ \mathbf A $.

__Problema 4:__ Encontre a decomposição de Doolittle (fatoração $ LU $) da matriz seguinte:
$$
\mathbf A = \begin{bmatrix}
1 & 2 & 3 & 4 \\
2 & 5 & 8 & 11 \\
3 & 7 & 14 & 22 \\
4 & 10 & 20 & 33
\end{bmatrix}\,.
$$

## $ \S 3 $ Implementação da decomposição de Doolittle (fatoração $ LU $)

In [None]:
def row_reduction(A):
    import numpy as np

    n = np.shape(A)[0]
    L = np.eye(n)
    for j in range(0, n - 1):
        if A[j][j] == 0:
            raise ValueError(f"Encountered a zero pivot in the {j}-th step."
                               "The given matrix cannot be row-reduced!")
        for i in range(j + 1, n):
            factor = A[i][j] / A[j][j]
            L[i][j] = factor
            A[i, :] = A[i, :] - factor * A[j, :]
    U = A.copy()
    return U, L

## $ \S 4 $ A fatoração $ PA = LU $

Uma **matriz-permutação** $ \mathbf P $ é uma matriz obtida a partir da matriz
identidade $ n \times n $ permutando-se as linhas desta. A cada permutação
dos inteiros de $ 1 $ a $ n $ está associada uma única matriz-permutação,
e vice-versa. Observe que existem $ n! $ tais permutações. Por exemplo, no caso
em que $ n = 5 $, a permutação $ \pi = (3, 5, 2, 1, 4) $ corresponde à
matriz-permutação $ 5 \times 5 $
$$
\mathbf P = 
\begin{bmatrix}
0 & 0 & 1 & 0 & 0 \\
0 & 0 & 0 & 0 & 1 \\
0 & 1 & 0 & 0 & 0 \\
1 & 0 & 0 & 0 & 0 \\
0 & 0 & 0 & 1 & 0 \\
\end{bmatrix}\,.
$$

__Teorema 4.1 (fatoração $ PA = LU $):__ _Seja $ \mathbf A $ uma matriz quadrada não-singular.
Então existem:_
* _Uma matriz-permutação $ \mathbf P $;_
* _Uma matriz triangular inferior $ \mathbf L $ com elementos diagonais iguais a $ 1 $;_
*  _E uma matriz triangular superior $ \mathbf U $ com elementos diagonais não-nulos;_

_tais que_ $ \mathbf{PA} = \mathbf{LU} $.

Resumidamente, para obter esta fatoração basta escalonar $ \mathbf A $. O
resultado do escalonamento é a matriz triangular superior $ \mathbf U $. A
matriz $ \mathbf P $ codifica as trocas de linha que foram necessárias durante o
escalonamento, e a matriz $ \mathbf L $ registra os coeficientes $ \lambda_{ij}
$ das operações de tipo $ (S) $ realizadas, porém em geral $ \lambda_{ij} $ não
coincide com a entrada $ (i, j) $ de $ \mathbf L $ porque esta última também
é afetada pelas trocas de linha.

📝 A matriz-permutação $ \mathbf P $ que aparece na fatoração
$$
\mathbf P \mathbf A = \mathbf L \mathbf U
$$
de $ \mathbf A $ não é única, em geral. Intuitivamente, isto ocorre porque
durante o escalonamento, temos opção de realizar trocas de linhas mesmo quando
elas não são necessárias. Contudo, uma vez fixada $ \mathbf P $ tal que 
$ \mathbf P \mathbf A $ pode ser escalonada sem trocas de linhas,
as matrizes $ \mathbf L $ e $ \mathbf U $ são univocamente determinadas,
pelo Teorema 2.1.

**Exemplo:** Obtenha uma fatoração $ PA = LU $ da matriz
$$
\begin{bmatrix}
            1 & 2 & -3 & 4 \\
            4 & 8 & 12 & -8 \\
            2 & 3 & 2 & 1 \\
            -3 & -1 & 1 & -4
        \end{bmatrix}
$$


_Solução:_
Começamos com a permutação identidade, a matriz $ \mathbf L $ totalmente vazia e
$ \mathbf U = \mathbf A $:
\begin{equation*}%\label{E:}
    \begin{array}{c | c | c}
        \mathbf P & \mathbf L & \mathbf U \\
        (1, 2, 3, 4) & \begin{bmatrix}
             & \phantom{0} & \phantom{0} & \phantom{0} \\
             & \phantom{0} & \phantom{0} & \phantom{0} \\
             & \phantom{0} & \phantom{0} & \phantom{0} \\
             & \phantom{0} & \phantom{0} & \phantom{0}
        \end{bmatrix}
        & \begin{bmatrix}
            1 & 2 & -3 & 4 \\
            4 & 8 & 12 & -8 \\
            2 & 3 & 2 & 1 \\
            -3 & -1 & 1 & -4
        \end{bmatrix}\,.
    \end{array}
\end{equation*}
Observe que o elemento na posição $ (1, 1) $ de $ \mathbf U $ é não-nulo, logo ele
serve como pivô. Assim, na primeira etapa, realizamos as operações:
\begin{equation*}%\label{E:}
    L_2 \leftarrow L_2 - 4L_1, \quad L_3 \leftarrow L_3 - 2L_1 \quad \text{e}
    \quad L_4 \leftarrow L_4 + 3L_1\,.
\end{equation*}
Preenchendo então a primeira coluna de $ \mathbf L $ com estes coeficientes,
obtemos o resultado parcial:
\begin{equation*}%\label{E:}
    \begin{array}{c | c | c}
        \mathbf P & \mathbf L & \mathbf U \\
        (1, 2, 3, 4) & \begin{bmatrix}
            1 & \phantom{0} & \phantom{0} & \phantom{0} \\
            4 & \phantom{0} & \phantom{0} & \phantom{0} \\
            2 & \phantom{0} & \phantom{0} & \phantom{0} \\
            -3 & \phantom{0} & \phantom{0} & \phantom{0}
        \end{bmatrix}
         & \begin{bmatrix}
             1 & 2 & -3 & 4 \\
             0 & 0 & 24 & -24 \\
             0 & -1 & 8 & -7 \\
             0 & 5 & -8 & 8 
         \end{bmatrix}
    \end{array}
\end{equation*}
Como a entrada na posição $ (2, 2) $ agora é nula, precisamos realizar uma
troca de linhas para continuar o escalonamento, por exemplo a troca:
\begin{equation*}%\label{E:}
    L_2 \longleftrightarrow L_3\,.
\end{equation*}
Realizando a mesma troca de linhas em $ \mathbf L $, obtemos 
\begin{equation*}%\label{E:}
    \begin{array}{c | c | c}
        \mathbf P & \mathbf L & \mathbf U \\
        (1, 3, 2, 4) & \begin{bmatrix}
            1 & \phantom{0} & \phantom{0} & \phantom{0} \\
            2 & \phantom{0} & \phantom{0} & \phantom{0} \\
            4 & \phantom{0} & \phantom{0} & \phantom{0} \\
            -3 & \phantom{0} & \phantom{0} & \phantom{0}
        \end{bmatrix}
         & \begin{bmatrix}
             1 & 2 & -3 & 4 \\
             0 & -1 & 8 & -7 \\
             0 & 0 & 24 & -24 \\
             0 & 5 & -8 & 8 
         \end{bmatrix}
    \end{array}
\end{equation*}
Continuando o escalonamento, realizamos a operação elementar
\begin{equation*}%\label{E:}
    L_4 \leftarrow L_4 + 5L_1
\end{equation*}
para anular o elemento não-nulo abaixo da posição $ (2, 2) $; o outro elemento
abaixo desta posição, na terceira linha, já é nulo. Agora conseguimos
preencher a segunda coluna de $ \mathbf L $:
\begin{equation*}%\label{E:}
    \begin{array}{c | c | c}
        \mathbf P & \mathbf L & \mathbf U \\
        (1, 3, 2, 4) & \begin{bmatrix}
            1 & 0 & \phantom{0} & \phantom{0} \\
            2 & 1 & \phantom{0} & \phantom{0} \\
            4 & 0 & \phantom{0} & \phantom{0} \\
            -3 & -5 & \phantom{0} & \phantom{0}
        \end{bmatrix}
         & \begin{bmatrix}
             1 & 2 & -3 & 4 \\
             0 & -1 & 8 & -7 \\
             0 & 0 & 24 & -24 \\
             0 & 0 & 32 & -27
         \end{bmatrix}
    \end{array}
\end{equation*}
No último passo eliminamos o elemento não-nulo abaixo da
posição $ (3, 3) $ através da operação elementar
\begin{equation*}%\label{E:}
    L_4 \leftarrow L_4 - \frac{4}{3}L_3\,.
\end{equation*}
Com isto conseguimos preencher as duas últimas colunas de $ \mathbf L $ e obter a
forma final de $ \mathbf U $ e $ \mathbf P $: 
\begin{equation*}%\label{E:}
    \begin{array}{c | c | c}
        \mathbf P & \mathbf L & \mathbf U \\
         \underbrace{\begin{bmatrix}
            1 & 0 & 0 & 0 \\
            0 & 0 & 1 & 0 \\
            0 & 1 & 0 & 0 \\
            0 & 0 & 0 & 1 
    \end{bmatrix}}_{\equiv (1, 3, 2, 4)}
               & \begin{bmatrix}
            1 & 0 &     0 &  0 \\
            2 & 1 &   0 &    0 \\
            4 & 0 &   1 &    0 \\
            -3 & -5 & \frac{4}{3} & 1
        \end{bmatrix}
         & \begin{bmatrix}
             1 & 2 & -3 & 4 \\
             0 & -1 & 8 & -7 \\
             0 & 0 & 24 & -24 \\
             0 & 0 & 0 & 5
         \end{bmatrix}
    \end{array}
\end{equation*}
Verifica-se diretamente que de fato $ \mathbf P \mathbf A = \mathbf L \mathbf U $.

__Problema 5:__ Obtenha uma fatoração $ PA = LU $ das matrizes seguintes:

(a)
$$ \mathbf A = 
\begin{bmatrix}
2 & 2 & 2 \\
8 & 8 & 6 \\
1 & 3 & 7
\end{bmatrix}\,.
$$

(b)
$$
\mathbf A = 
\begin{bmatrix}
1 & 5 & 2 \\
0 & 0 & 4 \\
1 & 2 & 3
\end{bmatrix}\,.
$$

(c)
$$ \mathbf A = 
\begin{bmatrix}
0 & 1 & 1 & 2 \\
0 & 2 & 2 & 2 \\
2 & 3 & 2 & 1 \\
-3 & -1 & 1 & -4
\end{bmatrix}\,.
$$