# Escalonamento e fatoração LU

## $ \S 1 $ Introdução

O problema mais fundamental em Álgebra Linear é a resolução de sistemas
lineares. Se o número de equações é maior que o número de incógnitas, então
qualquer perturbação nos coeficientes pode tornar o sistema insolúvel.
Similarmente, se o número de equações é menor que o de indeterminadas,
variações arbitrariamente pequenas das entradas podem ocasionar que o
sistema possua infinitas soluções.

Por causa disto, e como os erros de arredondamento são inerentes aos métodos
numéricos, o tipo mais importante de sistema, e o único que consideraremos aqui,
é aquele em que o número $ n $ de equações é o mesmo que o de variáveis. Na
forma escalar, podemos escrevê-lo como:
\begin{equation*}
\begin{cases}
& a_{11} x_1 &+& a_{12}x_2 &+& \cdots &+& a_{1n}x_n &=& b_1 \\
& a_{21} x_1 &+& a_{22}x_2 &+& \cdots &+& a_{2n}x_n &=& b_2 \\
& \phantom{a_1}\vdots && \vdots && \cdots && \vdots &&\vdots \\
& a_{n1} x_1 &+& a_{n2}x_2 &+& \cdots &+& a_{nn}x_n &=& b_n
\end{cases}
\end{equation*}
Equivalentemente, usando matrizes e vetores:
\begin{equation*}
\begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{bmatrix}
\begin{bmatrix}
x_1 \\
x_2 \\
\vdots \\
x_n
\end{bmatrix} =
\begin{bmatrix}
b_1 \\
b_2 \\
\vdots \\
b_n
\end{bmatrix} \quad \text{ou simplesmente $ \quad \mathbf{A}\mathbf{x} = \mathbf{b} $}.
\end{equation*}
Aqui portanto:
* $ \mathbf A $ é uma matriz $ n \times n $;
* $ \mathbf b $ é uma vetor-coluna $ n \times 1 $;
* O vetor-solução $ \mathbf x $ de dimensões $ n \times 1 $ procurado contém as incógnitas.

📝 Sistemas deste tipo quase sempre possuem solução única.  Mais precisamente, o
conjunto dos pares $ (\mathbf A, \mathbf b) $ em $ \mathbb R^{n^2} \times
\mathbb R^n $ para os quais o sistema _não_ tem solução, ou para os quais a
solução _não_ é única, tem dimensão menor que $ n^2 + n $.  Portanto se um
par deste tipo for escolhido aleatoriamente, com probabilidade $ 1 $ ele
definirá um sistema admitindo solução única. 

## $ \S 2 $ Interpretação geométrica da solução de sistemas $ n \times n $

### $ \S 2.1 $ Interpretação via linhas

Considere o sistema $ 2 \times 2 $ seguinte:
\begin{equation*}\label{E:1}
\begin{array}{rrrrr}
&2x &+ &3y & = &1 \\
&-x &+ &4y & = &-6 \\
\end{array}\tag{1}
\end{equation*}
cuja solução é $ (x, y) = (2, -1) $. Observe que cada uma das duas equações
define uma reta. A solução única corresponde ao ponto onde estas retas
se encontram.

Analogamente, cada equação de um sistema $ 3 \times 3 $ define um plano em $
\mathbb R^3 $, e um vetor satisfaz esta equação se e somente se ele pertence a
este plano. Portanto, a solução do sistema consiste da intersecção dos três
planos.

📝 Mais geralmente, para um sistema $ n \times n $ genérico, cada equação define um
hiperplano (afim) de dimensão $ n - 1 $ (i.e., de codimensão $ n $). A intersecção de
$ k \ge 2 $ destes define um hiperplano de dimensão $ n - k $. Portanto a
solução do sistema é o único ponto pertencente a todos eles.

### $ \S 2.2 $ Interpretação via colunas

Podemos reescrever o sistema \eqref{E:1} na forma
$$
\begin{bmatrix}
2 & 3 \\
-1 & 4
\end{bmatrix}
\begin{bmatrix}
x \\
y
\end{bmatrix}
=
x
\begin{bmatrix}
2 \\
-1
\end{bmatrix}
+y
\begin{bmatrix}
3 \\
4
\end{bmatrix}
=
\begin{bmatrix}
1 \\
-6
\end{bmatrix}
$$
Sob este ponto de vista, procuramos os coeficientes $ x $ e $ y $ que expressam
o vetor à direita como combinação linear dos vetores-coluna da matriz à esquerda.
Novamente, para um sistema genérico, estes vetores-coluna serão linearmente
independentes, portanto estes coeficientes $ x $ e $ y $ serão únicos, e
constituem a solução do sistema.

📝 Vemos desta forma que a _imagem_ da matriz $ \mathbf A $ (vista como
transformação linear $ \mathbb R^n \to \mathbb R^n $)  consiste de todas as
possíveis combinações lineares dos seus vetores-coluna.

📝 No caso geral de um sistema linear $ \mathbf A \mathbf x = \mathbf b $ de
dimensões $ n \times n $, a solução $ (x_1, \cdots,
x_n) $ tem por coordenadas os coeficientes da expressão de $ \mathbf b $ como
combinação linear dos vetores-coluna de $ \mathbf A $. Em particular, existe uma
solução se e somente se os vetores-coluna formam uma base de $ \mathbb R^n $.


**Problema 1:** Usando a interpretação por colunas, mostre que as seguintes condições são equivalentes:
1. O sistema $ \mathbf A \mathbf x = \mathbf b $ tem uma solução para qualquer $ \mathbf b \in \mathbb R^n $.
2. A imagem de $ \mathbf A $ coincide com $ \mathbb R^n $.
3. Os vetores-coluna de $ \mathbf A $ geram $ \mathbb R^n $.
4. Os vetores-coluna de $ \mathbf A $ formam uma base de $ \mathbb R^n $.
5. Os vetores-coluna de $ \mathbf A $ são linearmente independentes.
6. O sistema $ \mathbf A \mathbf x = \mathbf 0 $ tem a única solução $ \mathbf x = \mathbf 0 $.
7. O núcleo de $ \mathbf A $ é igual a $ \{0\} $.
8. O sistema $ \mathbf A \mathbf x = \mathbf b $ tem uma solução _única_ para
   qualquer $ \mathbf b \in \mathbb R^n $.
9. O determinante de $ \mathbf A $ é não-nulo.
10. A matriz $ \mathbf A $ é invertível.

_Solução:_

## $ \S 3 $ Operações elementares e escalonamento

### $ 3.1 $ Resolução de um sistema linear por escalonamento

Considere o seguinte sistema de equações lineares:
$$
\left\{\begin{array}{rrrr}
	2x & {}+{}\phantom{1}y & {}+{}\phantom{1}z & = & \phantom{-}5\\ 
	4x & {}-{}6y &  & = &- 2\\ 
	-2x & {}+{}7y & {}+{}2z & = & \phantom{-}9 
\end{array}\right.,
$$
que pode ser reescrito como $ \mathbf A \mathbf x = \mathbf b $, onde
$$
	\mathbf A=\begin{bmatrix}
	 2 & 1 & 1 \\
	4 &  -6 & 0 \\
	-2 & 7 & 2
	\end{bmatrix},\quad \mathbf x = \begin{bmatrix}
	 x\\
	 y\\
	 z 
	\end{bmatrix}\quad \text{ e }\quad \mathbf b = \begin{bmatrix}
	 5 \\
	 -2 \\
	 9
	\end{bmatrix}.
$$
Podemos resolvê-lo usando __eliminação Gaussiana__, também chamada de __escalonamento__,
_cujo objetivo é obter um sistema equivalente em que a matriz dos coeficientes é triangular
superior_. Para realizar o escalonamento, podemos utilizar três tipos de
movimentos, chamados de __operações elementares__:

1. _Subtração da $ j $-ésima linha (equação), multiplicada por $ \lambda_{ij} $,
   da_ $ i $-_ésima equação, para_ $ i > j $.  Em símbolos,
   $$ L_i \leftarrow L_i - \lambda_{ij} \cdot L_j \qquad (\lambda_{ij} \in \mathbb R,\ i > j)\,; $$
2. _Multiplicação de uma equação por um número não-nulo_. Em símbolos, $$ L_i \leftarrow \mu \cdot L_i \qquad (\mu \ne 0 )\,;$$
3. _Troca de duas equações_. Em símbolos,
  $$ L_i \leftrightarrow L_j \,.$$

⚠️️ Operações de tipo 2 _nunca_ são necessárias para se escalonar uma matriz. Em
geral elas são usadas ao final do escalonamento para tornar o coeficiente
líder de cada linha igual a $ 1 $. Não as utilizaremos na discussão abaixo.

No nosso exemplo, podemos efetuar o escalonamento usando apenas operações do tipo 1:
$$
\begin{alignat*}{5}
	2&x  &{} &+{}& y   &{} +{}& z   &{} ={}& &5\\ 
	4&x  &{} &-{}6&y  &{}   &     &{} ={}& -&2\\ 
	-2&x &{} &+{}7&y  &{} +{}2& z  &{} ={}& &9 
\end{alignat*}
\quad
\underset{L_3 \leftarrow L_3 + L_1}{\xrightarrow{L_2 \leftarrow L_2 - 2L_1}}
\quad
\begin{alignat*}{5}
2&x  &{} &+{}& y  &{} +{}& z   &{} ={}& &5\\ 
&    &{} &-{}8&y  &{} -{}2& z  &{} ={}& -&12\\ 
& &{} &\phantom{+}{}8&y  &{} +{}3& z  &{} ={}& &14 
\end{alignat*}
\quad
\xrightarrow{L_3 \leftarrow L_3 + L_2}
\quad
\begin{alignat*}{5}
2&x  &{} &+{}& y  &{} +{}& z   &{} ={}& &5\\ 
&    &{} &-{}8&y  &{} -{}2& z  &{} ={}& -&12\\ 
& &{} & &  &{} & z  &{} ={}& &2 
\end{alignat*}
$$
Agora a solução pode ser obtida imediatamente através de __retro-substituição__:
* Da terceira equação depreendemos o valor de $ z $;
* Substituindo este valor na segunda, deduzimos o valor de $ y $;
* Substituindo ambos na primeira equação, encontramos $ x $.

No nosso caso, a solução é $ (x, y, z) = (1, 1, 2) $.

### $ 3.2 $ Descrição geral de escalonamento

Uma matriz $ \mathbf U = (a_{ij}) $ de dimensões $ n \times n $ é dita
__escalonada__ se possui as seguintes propriedades:
* As linhas não-nulas vêm antes das linhas nulas. 
* Se $ a_{ij} $ é a primeira entrada não-nula da linha $ i $, então todas as
  entradas $ a_{kj} $ abaixo dela (i.e., com $ i < k $) são-nulas. 
* Se $ i > j $, então o $i$-ésimo pivô se encontra mais à direita que o
  $j$-ésimo pivô. 

Como mencionado antes, o escalonamento busca reduzir o sistema original a um
equivalente em que a matriz dos coeficientes é escalonada.  Considerando um
sistema $ n \times n $ nas variáveis $ x_1, x_2, \cdots, x_n $, o procedimento é
o seguinte:
1. No primeiro estágio começamos efetuando uma troca de linhas
   $ L_1 \leftrightarrow L_i $, caso necessário, de modo que o coeficiente $
   a_{11} $ que multiplica $ x_1 $ na primeira equação passe a ser não-nulo;
   este coeficiente é o __primeiro pivô__.  Então _subtraímos múltiplos da
   primeira linha das linhas abaixo de modo a eliminar o termo envolvendo $ x_1
   $ de cada uma delas_.  Ou seja, efetuamos as operações elementares de tipo $
   1 $ seguintes:
   $$
     L_2 \leftarrow L_2 - \lambda_{21} L_1,\quad L_3 \leftarrow L_3 - \lambda_{31} L_1, \quad \cdots,
     \quad L_n \leftarrow L_n - \lambda_{n1} L_1 \quad \text{para $ \lambda_{ij} = \frac{a_{i1}}{a_{11}} $\,.}
   $$
2. No segundo estágio, se necessário, começamos efetuando uma troca de linhas
   $ L_2 \leftrightarrow L_i $ para algum $ i > 2 $ de modo que o coeficiente que
   $ a_{22} $ que multiplica $ x_2 $ na segunda linha passe a ser não-nulo; este
   coeficiente é o __segundo pivô__. Feito isto, subtraímos múltiplos da segunda
   linha das linhas abaixo de modo a eliminar os termos que envolvem $ x_2 $ de cada
   uma destas, através das operações elementares de tipo $ 1 $ seguintes:
   $$
     L_3 \leftarrow L_3 - \lambda_{32} L_2,\quad L_4 \leftarrow L_4 - \lambda_{42} L_2, \quad \cdots,
     \quad L_n \leftarrow L_n - \lambda_{n2} L_2 \quad \text{para $ \lambda_{ij} = \frac{a_{i2}}{a_{22}} $\,.}
   $$

E assim por diante. No $ k $-ésimo estágio ($ 1 \le k \le n - 1 $), utilizamos
uma operação $ L_k \leftrightarrow L_i $ ($ i > k $) de tipo $ 3 $ para garantir
que $ a_{kk} \ne 0 $, e então utilizamos este $ k $-**ésimo pivô** para limpar
os termos envolvendo $ x_k $ abaixo dele, por meio de operações elementares de
tipo $ 1 $.

📝 Observe que após o $ k $-ésimo estágio, a $ k $-ésima linha não é mais
utilizada nem alterada.

Recapitulando, o primeiro elemento não-nulo da $ i $-ésima
linha de uma matriz escalonada é chamado de $ i $-ésimo __pivô__. Se 
$ \mathbf U $ é escalonada e, além disto, todos os pivôs são iguais a $ 1 $,
dizemos que $ \mathbf U $ está na forma __escalonada reduzida__. 

__Teorema 3.2:__ _Qualquer matriz $ \mathbf A $ $ n \times n $ pode ser escalonada.
O resultado $ \mathbf U $ deste escalonamento_ não _possui linhas nulas se e
somente se $ \mathbf A $ satisfaz qualquer uma das condições listadas no
Problema 1_.

📝 Uma vez que tenhamos escalonado uma matriz, podemos colocá-la na forma
escalonada reduzida efetuando no máximo $ n $ operações de tipo $ 2 $ (uma para
cada linha).


O seguinte resultado geral explica por que o escalonamento não cria nem
destrói soluções.

__Teorema 3.1:__ _Se um sistema (T) de equações lineares é obtido a partir de
outro sistema (S) a partir de escalonamento, então (S) e (T) têm exatamente as
mesmas soluções._

_Prova:_ Observe que:
* Se $ \mathbf x $ é uma solução de um sistema linear qualquer
  e se um outro sistema difere deste pela aplicação de uma única operação
  elementar, então $ \mathbf x $ também satisfaz este último sistema.
* Cada operação elementar admite uma inversa, que é uma operação elementar do mesmo tipo.
  Por exemplo, a inversa de $ L_i \leftarrow L_i - \lambda_{ij}L_j $ é a operação 
  $ L_i \leftarrow L_i + \lambda_{ij} L_j $.

O primeiro ponto (aplicado repetidas vezes) implica que qualquer solução de (S) é solução
de (T). O segundo ponto nos dá a recíproca.
<div style="text-align: right">$ \blacksquare $ </div>

Note que não há necessidade de carregar as variáveis $ x $, $ y $ e $ z $ no
escalonamento, pois os seus nomes não têm qualquer papel durante o processo.
Podemos escrever os movimentos que fizemos no exemplo de maneira mais concisa
usando a __matriz aumentada__ $ [\mathbf A\mid \mathbf b] $:

$$
\begin{alignat*}{5}
\left[\begin{array}{rrr|r}
2 & 1 & 1 & 5 \\
4 & -6 & 0 & -2 \\
-2 & 7 & 2 & 9
\end{array}\right]
\end{alignat*}
\quad
\underset{L_3 \leftarrow L_3 + L_1}{\xrightarrow{L_2 \leftarrow L_2 - 2L_1}}
\quad
\begin{alignat*}{5}
\left[\begin{array}{rrr|r}
2 & 1 & 1 & 5 \\
0 & -8 & -2 & -12 \\
0 & 8 & 3 & 14
\end{array}\right]
\end{alignat*}
\quad
\xrightarrow{L_3 \leftarrow L_3 + L_2}
\quad
\begin{alignat*}{5}
\left[\begin{array}{rrr|r}
2 & 1 & 1 & 5 \\
0 & -8 & -2 & -12 \\
0 & 0 & 1 & 2
\end{array}\right]
\end{alignat*}
$$

__Exemplo 1:__ Resolva o sistema 
$$
\left[\begin{array}{rrr}
0 &3 & -1 \\
2 & 1 & 1 \\
-1 & 2 & 2
\end{array}\right]
\begin{bmatrix}
x \\ y  \\ z
\end{bmatrix}
=
\begin{bmatrix}
1 \\ 3 \\ 4
\end{bmatrix}\,.
$$

_Solução:_ Efetuando o escalonamento na forma escalar:
$$
\begin{alignat*}{5}
	&  &{} &\phantom{+}{}& 3y   &{} -{}& z   &{} ={}& &1\\ 
	2&x  &{} &-{}& y   &{} +{}& z   &{} ={}& &3\\ 
	-&x &{} &+{}& 2y   &{} +{}& 2z  &{} ={}& &4
\end{alignat*}
\quad
\xrightarrow{L_1 \leftrightarrow L_2}
\quad
\begin{alignat*}{5}
	2&x  &{} &-{}& y   &{} +{}& z   &{} ={}& &3\\ 
	& &{} &\phantom{+}{}& 3y   &{} -{}& z   &{} ={}& &1\\ 
	-&x &{} &+{}& 2y   &{} +{}& 2z  &{} ={}& &4
\end{alignat*}
\quad
\xrightarrow{L_3 \leftarrow L_3 + \frac{1}{2}L_1}
\quad
\begin{alignat*}{5}
	2&x  &{} &-{}& y   &{} +{}& z   &{} ={}& &3\\ 
	&  &{} &\phantom{+}{}& 3y   &{} -{}& z   &{} ={}& &1\\ 
	& &{} &\phantom{+}{}& \tfrac{3}{2}y   &{} +{}& \tfrac{5}{2}z  &{} ={}& &\tfrac{11}{2}
\end{alignat*}
\quad
\xrightarrow{L_3 \leftarrow L_3 - \frac{1}{2}L_2}
\quad
\begin{alignat*}{5}
	2&x  &{} &-{}& y   &{} +{}& z   &{} ={}& &3\\ 
	&  &{} &\phantom{+}{}& 3y   &{} -{}& z   &{} ={}& &1\\ 
	& &{} &\phantom{+}{}&   &{} \phantom{+}{}& 3z  &{} ={}& &5
\end{alignat*}
$$
Agora, por retro-substituição, encontramos a solução
$$
(x, y, z) = \frac{1}{9}\big(10, 8, 15\big)\,.
$$

__Problema 2:__ Escalone a matriz aumentada e utilize retro-substituição para
resolver o sistema $ \mathbf A \mathbf x = \mathbf b $, para
$$
	\mathbf A =\begin{bmatrix}
	0 &  1 & 1 \\
	 2 & 4 & 8 \\
	1 & 3 & 6
	\end{bmatrix}\quad \text{ e }\quad \mathbf b=\begin{bmatrix}
	 1 \\
	 10 \\
	 4
	\end{bmatrix}.
$$

_Solução:_

## $ \S 4 $ Matrizes elementares

Uma outra razão para usar a forma matricial do escalonamento é a seguinte:
_Aplicar uma operação elementar a um sistema $ \mathbf{A} \mathbf x =
\mathbf{b} $ corresponde a multiplicar a matriz aumentada $ [\mathbf{A}|
\mathbf{b}] $ à esquerda por uma matriz apropriada._

__Definição:__ A multiplicação à esquerda pelas seguintes matrizes quadradas
$ n \times n $, chamadas de __matrizes elementares__, correspondem respectivamente às
operações elementares $ 1 $, $ 2 $ e $ 3 $ acima:

1. A operação $ L_{i} \leftarrow L_i - \lambda_{ij} L_j $, para $ i > j $, corresponde à matriz
   $ \mathbf E_{ij}(-\lambda_{ij}) $ que possui todas as entradas nulas exceto pelas da diagonal,
   que são iguais a $ 1 $, e a da posição $ (i,j) $, que é igual a $ -\lambda_{ij} $.
2. A operação $ L_i \leftarrow \mu L_i $
   $ (\mu \ne 0) $ corresponde à matriz diagonal obtida a partir de $ I_n $ (a matriz
   identidade $ n \times n $) fazendo a entrada $ (i,i) $ igual a $ \mu $.
3. A operação de troca $ L_i \leftrightarrow L_j $ corresponde à
   __matriz-permutação__ $ \mathbf P_{ij} $ obtida a partir de $ I_n $ intercambiando-se
   as linhas $ i $ e $ j $.

__Exemplo 2:__
$$
	\mathbf E_{21}(-\lambda)=\begin{bmatrix}
	 1 & 0 & 0 \\
	 -\lambda & 1 & 0 \\
	 0 & 0 & 1
	\end{bmatrix},
	\quad
	\begin{bmatrix}
	 1 & 0 & 0\\
	 0 & \lambda & 0\\
	 0 & 0 & 1
	\end{bmatrix}
	\text{ \quad e \quad}
	\mathbf P_{13}=\begin{bmatrix}
	0 & 0 &1 \\
	0 & 1 & 0 \\
	1 & 0 & 0
	\end{bmatrix}
$$
são matrizes elementares dos tipos 1, 2 e 3, respectivamente. De fato, se 
$$
	\mathbf A=\begin{bmatrix}
		a_1 & a_2 & a_3 \\
		b_1 & b_2 & b_2 \\
		c_1 & c_2 & c_3 
	\end{bmatrix}
$$
é uma matriz $3\times 3$ então
$$
	\mathbf E_{21}(-\lambda)\mathbf A=\begin{bmatrix}
		a_1 & a_2 & a_3  \\
		b_1-\lambda a_1 & b_2 -\lambda a_2 & b_3-\lambda a_3 \\
		c_1 & c_2 & c_3  
	\end{bmatrix},\quad \mathbf P_{13}
	\mathbf A = \begin{bmatrix}
		c_1 & c_2 & c_3 \\
		b_1 & b_2 & b_2 \\
		a_1 & a_2 & a_3
	\end{bmatrix}
$$
e similarmente para a última matriz elementar. Como não é necessário utilizar
qualquer operação do tipo 3 para se escalonar um sistema, a partir de agora
vamos considerar apenas matrizes elementares de tipos 1 e 2.

Observe que todas as matrizes elementares são invertíveis: Uma matriz de
permutação de linhas é a inversa dela mesma e a matriz inversa de $E_{ij}(-\lambda)$
é $E_{ij}(\lambda)$. Por exemplo:
$$
	\begin{bmatrix}
	 1 & 0 & 0 \\
	 0 & 1 & 0 \\
	0 & -7 & 1 
	\end{bmatrix}	\begin{bmatrix}
	 1 & 0 & 0 \\
	 0 & 1 & 0 \\
	0 & +7 & 1 
	\end{bmatrix}=\begin{bmatrix}
	 1 &0 & 0 \\
	 0 & 1 & 0 \\
	 0 & 0 & 1 
	\end{bmatrix},
$$
ou seja, $E_{32}(+7)E_{32}(-7)=I$.

Uma matriz quadrada é __triangular inferior__ se todas as suas entradas acima da
diagonal são nulas. A definição de matriz __triangular superior__ é análoga.
É fácil verificar que a soma e o produto de matrizes triangules inferiores (resp. superiores)
é do mesmo tipo. Além disto, a inversa de uma matriz triangular inferior (superior) é do mesmo
tipo, desde que esta inversa exista. O determinante de uma matriz triangular é o produto das
suas entradas diagonais. Observe que as matrizes elementares de tipo $ 1 $ são
triangulares inferiores pela exigência que $ i > j $.

📝 Matriz triangulares superiores geralmente são denotadas por $ \mathbf U $ (de
"_upper triangular_"), e matriz triangulares inferiores por $ \mathbf L $ (de
"_lower triangular_").

## $ \S 5 $ Fatoração LU

__Teorema 5.1:__ _Seja $ \mathbf A $ uma matriz quadrada não-singular
(i.e., invertível) $ n\times n $ e suponha que seja possível escalonar $ \mathbf A $ 
utilizando somente operações elementares do tipo $ 1 $. Então podemos
escrever $ \mathbf A = \mathbf L \mathbf U $, onde $ \mathbf L $ é triangular
inferior com elementos diagonais iguais a $ 1 $ e $ \mathbf U $ é triangular
superior com elementos diagonais não-nulos. Esta fatoração é única. Além disto:_
* _A matriz $ \mathbf U $ é a matriz resultante do escalonamento de_ $ \mathbf A $.
* _A entrada na posição $ (i, j) $ de $ \mathbf L $ (com $ i > j $) é
  exatamente o coeficiente $ \lambda_{ij} $ da operação elementar
  $ L_i \leftarrow L_i - \lambda_{ij} L_j $ que envolve as linhas $ i $ e $ j $
  no escalonamento_.

Esta fatoração é importante por vários motivos, dentre eles o seguinte:
Se sabemos fatorar $\mathbf A $ como $ \mathbf A = \mathbf L \mathbf U $,
então podemos resolver imediatamente o sistema
$$\mathbf A \mathbf x= \mathbf L \mathbf U \mathbf x = \mathbf b \,. $$
De fato, neste caso a resolução do sistema se reduz à do par de sistemas:
$$
	\begin{cases}
		\mathbf L\mathbf y= \mathbf b  \\
		\mathbf U \mathbf x= \mathbf y
	\end{cases}\,.
$$
Como $ \mathbf L $ é triangular inferior, o primeiro sistema pode ser resolvido imediatamente
por retro-substituição. Analogamente, uma vez encontrado $ \mathbf y $, como $
\mathbf U $ é triangular superior, o segundo sistema pode ser resolvido por
substituição progressiva (direta).
