# Escalonamento

## $ \S 1 $ Introdução

O problema mais fundamental em Álgebra Linear é a resolução de sistemas
lineares. Restringiremos nossa atenção a sistemas com mesmo número de
equações que de variáveis. Há várias razões para isto, mas as principais
são as seguintes:

* Um sistema __sobredeterminado__ (i.e., tal que o número de equações é maior
  que o número de incógnitas) quase sempre não possui solução.  E aqueles que
  possuem solução são numericamente instáveis: qualquer perturbação nos
  coeficientes pode tornar o sistema insolúvel. Como os erros de arredondamento
  são inerentes ao sistema de ponto flutuante, é inviável buscar numericamente a 
  solução _exata_ de sistemas deste tipo.
* Um sistema __subdeterminado__ (i.e., tal que o número de equações é menor
  que o de indeterminadas) genérico possui infinitas soluções. E, novamente,
  aqueles que possuem uma única solução são numericamente instáveis.
* Os métodos mais comuns de resolução são mais facilmente formulados e aplicados
  quando o sistema é __quadrado__ (mesmo número de equações que de incógnitas).

Na forma escalar, um sistema quadrado pode ser escrito como:
\begin{equation*}
\begin{cases}
& a_{11} x_1 &+& a_{12}x_2 &+& \cdots &+& a_{1n}x_n &=& b_1 \\
& a_{21} x_1 &+& a_{22}x_2 &+& \cdots &+& a_{2n}x_n &=& b_2 \\
& \phantom{a_1}\vdots && \vdots && \cdots && \vdots &&\vdots \\
& a_{n1} x_1 &+& a_{n2}x_2 &+& \cdots &+& a_{nn}x_n &=& b_n
\end{cases}
\end{equation*}
Equivalentemente, usando matrizes e vetores:
\begin{equation*}
\begin{bmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{n1} & a_{n2} & \cdots & a_{nn}
\end{bmatrix}
\begin{bmatrix}
x_1 \\
x_2 \\
\vdots \\
x_n
\end{bmatrix} =
\begin{bmatrix}
b_1 \\
b_2 \\
\vdots \\
b_n
\end{bmatrix}\ , \quad \text{ou simplesmente $ \quad \mathbf{A}\mathbf{x} = \mathbf{b} $}.
\end{equation*}
Aqui portanto:
* $ \mathbf A $ é uma matriz $ n \times n $;
* $ \mathbf b $ é uma vetor-coluna $ n \times 1 $;
* O vetor-solução $ \mathbf x $ de dimensões $ n \times 1 $ procurado contém as incógnitas.

📝 Sistemas deste tipo quase sempre possuem solução única.  Mais precisamente, o
conjunto dos pares $ (\mathbf A, \mathbf b) $ em $ \mathbb R^{n^2} \times
\mathbb R^n $ para os quais o sistema _não_ tem solução, ou para os quais a
solução _não_ é única, tem dimensão menor que $ n^2 + n $.  Portanto se um
par deste tipo for escolhido aleatoriamente, com probabilidade $ 1 $ ele
definirá um sistema admitindo solução única. 

## $ \S 2 $ Interpretação geométrica da solução de sistemas $ n \times n $

### $ \S 2.1 $ Interpretação via linhas

Considere o sistema $ 2 \times 2 $ seguinte:
\begin{equation*}\label{E:1}
\begin{array}{rrrrr}
&2x &+ &3y & = &1 \\
&-x &+ &4y & = &-6 \\
\end{array}\tag{1}
\end{equation*}
cuja solução é $ (x, y) = (2, -1) $. Observe que cada uma das duas equações
define uma reta. A solução única corresponde ao ponto onde estas retas
se encontram.

Analogamente, cada equação de um sistema $ 3 \times 3 $ define um plano em $
\mathbb R^3 $, e um vetor satisfaz esta equação se e somente se ele pertence a
este plano. Portanto, a solução do sistema consiste da intersecção dos três
planos.

📝 Mais geralmente, para um sistema $ n \times n $ genérico, cada equação define um
hiperplano (afim) de dimensão $ n - 1 $. A intersecção de $ k \ge 2 $ destes
define um hiperplano de dimensão $ n - k $. Portanto a solução do sistema é o
único ponto pertencente a todos eles.

### $ \S 2.2 $ Interpretação via colunas

Podemos reescrever o sistema \eqref{E:1} na forma
$$
\begin{bmatrix}
2 & 3 \\
-1 & 4
\end{bmatrix}
\begin{bmatrix}
x \\
y
\end{bmatrix}
=
x
\begin{bmatrix}
2 \\
-1
\end{bmatrix}
+y
\begin{bmatrix}
3 \\
4
\end{bmatrix}
=
\begin{bmatrix}
1 \\
-6
\end{bmatrix}
$$
Sob este ponto de vista, procuramos os coeficientes $ x $ e $ y $ que expressem
o vetor à direita como combinação linear dos vetores-coluna da matriz à esquerda.
Novamente, para um sistema genérico, estes vetores-coluna serão linearmente
independentes, portanto estes coeficientes $ x $ e $ y $ serão únicos, e
constituem a solução do sistema.

📝 No caso de uma matriz $ n \times n $, a _imagem_ de $ \mathbf A $
(vista como transformação linear $ \mathbb R^n \to \mathbb R^n $)  consiste de
todas as possíveis combinações lineares dos seus vetores-coluna. A solução do
sistema linear $ \mathbf A \mathbf x = \mathbf b $ tem por coordenadas os
coeficientes da expressão de $ \mathbf b $ como combinação linear dos
vetores-coluna de $ \mathbf A $. 

As seguintes condições são equivalentes para uma matriz $ \mathbf A $ de
dimensões $ n \times n $; quando uma delas é satisfeita, dizemos que
$ \mathbf A $ é __não-singular__. 
1. O sistema $ \mathbf A \mathbf x = \mathbf b $ tem uma solução para qualquer $ \mathbf b \in \mathbb R^n $.
2. A imagem de $ \mathbf A $ coincide com $ \mathbb R^n $.
3. Os vetores-coluna de $ \mathbf A $ geram $ \mathbb R^n $.
4. Os vetores-coluna de $ \mathbf A $ formam uma base de $ \mathbb R^n $.
5. O sistema $ \mathbf A \mathbf x = \mathbf b $ tem uma solução _única_ para
   qualquer $ \mathbf b \in \mathbb R^n $.
6. Os vetores-coluna de $ \mathbf A $ são linearmente independentes.
7. O sistema $ \mathbf A \mathbf x = \mathbf 0 $ tem a única solução $ \mathbf x = \mathbf 0 $.
8. O núcleo de $ \mathbf A $ é igual a $ \{0\} $.
9. O determinante de $ \mathbf A $ é não-nulo.
10. A matriz $ \mathbf A $ é invertível.

__Problema 1:__ Usando a interpretação da resolução de sistemas lineares via
combinações lineares dos vetores-coluna, mostre que as condições $ 1 $ a $ 8 $
acima são todas equivalentes. (A equivalência com $ 9 $ e $ 10 $ é mais difícil.)

_Solução:_

📝 Como o determinante de uma matriz $ \mathbf A $ é igual ao de sua transposta
$ \mathbf A^t $, e as linhas (resp. colunas) de $ \mathbf A $ são as colunas
(linhas) de $ \mathbf A^t $, a equivalência das condições listadas permanece
válida se a palavra "linha(s)" é trocada por "coluna(s)" em $ 3 $, $ 4 $ e $ 6 $.

## $ \S 3 $ Eliminação Gaussiana, escalonamento, operações elementares e retro-substituição

Considere o seguinte sistema de equações lineares:
$$
\left\{\begin{array}{rrrr}
	2x & {}+{}\phantom{1}y & {}+{}\phantom{1}z & = & \phantom{-}5\\ 
	4x & {}-{}6y &  & = &- 2\\ 
	-2x & {}+{}7y & {}+{}2z & = & \phantom{-}9 
\end{array}\right.,
$$
que pode ser reescrito como $ \mathbf A \mathbf x = \mathbf b $, onde
$$
	\mathbf A=\begin{bmatrix}
	 2 & 1 & 1 \\
	4 &  -6 & 0 \\
	-2 & 7 & 2
	\end{bmatrix},\quad \mathbf x = \begin{bmatrix}
	 x\\
	 y\\
	 z 
	\end{bmatrix}\quad \text{ e }\quad \mathbf b = \begin{bmatrix}
	 5 \\
	 -2 \\
	 9
	\end{bmatrix}.
$$
Podemos resolvê-lo usando __eliminação Gaussiana__, que consiste de duas
etapas (nesta ordem):
* __Escalonamento__, cujo objetivo é transformar o sistema em outro equivalente
  mais simples.
* __Retro-substituição__, que fornece a solução do sistema escalonado.

Para realizar o escalonamento, podemos utilizar três tipos de movimentos,
conhecidos como __operações elementares__:

1. *Subtração de um múltiplo $ \lambda_{ij} $ da $ j $-ésima linha (equação) da $ i $-ésima equação, para* $ i > j $.
   Em símbolos,
   $$ L_i \leftarrow L_i - \lambda_{ij} \cdot L_j \qquad (\lambda_{ij} \in \mathbb R,\ i > j)\,; $$
2. _Multiplicação de uma equação por um número não-nulo_. Em símbolos, $$ L_i \leftarrow \mu \cdot L_i \qquad (\mu \ne 0 )\,;$$
3. _Troca de duas equações_. Em símbolos,
  $$ L_i \leftrightarrow L_j \,.$$

⚠️️ Operações elementares de tipo $ 2 $ _nunca são necessárias para se
escalonar um sistema_. Em geral elas são usadas ao final do escalonamento para
tornar o coeficiente líder de cada linha igual a $ 1 $. Elas não serão
utilizadas nos exemplos abaixo.


No nosso exemplo, o escalonamento pode ser realizado através de operações
do tipo $ 1 $ apenas:
$$
\left\{\begin{array}{rrrrrrr}
	2x  &+ &y   &+ &z   &= &5\\ 
	4x  &- &6y  &   &    &= &-2\\ 
	-2x &+ &7y  &+ &2z  &= &9 
\end{array}\right.
\quad
\underset{L_3 \leftarrow L_3 + L_1}{\xrightarrow{L_2 \leftarrow L_2 - 2L_1}}
\quad
\left\{\begin{array}{rrrrrrr}
2x  &+ &y  &+ &z   &= &5\\ 
    &- &8y  &- &2z  &= &-12\\ 
    &  &8y  &+ &3z  &= &14 
\end{array}\right.
\quad
\xrightarrow{L_3 \leftarrow L_3 + L_2}
\quad
\left\{\begin{array}{rrrrrrr}
2x  &+ &y  &+ &z   &= &5\\ 
    &- &8y  &- &2z  &= &-12\\ 
    &  &    &  &z   &= &2 
\end{array}\right.
$$
Agora a solução pode ser obtida imediatamente através de __retro-substituição__
(ou _substituição retroativa_):
* Da terceira equação depreendemos o valor de $ z $;
* Substituindo este valor na segunda, deduzimos o valor de $ y $;
* Substituindo ambos na primeira equação, encontramos $ x $.

No nosso caso, a solução é $ (x, y, z) = (1, 1, 2) $. Em geral, na etapa de
retro-substituição:
* Encontramos o valor da última variável $ x_n $ a partir da última equação.
* Progredindo de baixo para cima (i.e., para $ i = n - 1,\, n - 2, \cdots,\, 1) $,
  substituímos os valores das incógnitas já encontrados na $ i $-ésima equação
  para determinar o valor de $ x_i $.

## $ \S 4 $ Descrição geral do escalonamento

Uma matriz $ \mathbf U = (a_{ij}) $ de dimensões $ n \times n $ é dita
__escalonada__ se possui as seguintes propriedades:
* As linhas não-nulas vêm antes das linhas nulas. 
* Se $ i < k $, então a primeira entrada não-nula da linha $ i $ se encontra
  mais à esquerda que a primeira entrada não-nula da linha $ k $.

O escalonamento busca reduzir o sistema original a um
equivalente em que a matriz dos coeficientes é escalonada.  Considerando um
sistema $ n \times n $ nas variáveis $ x_1, x_2, \cdots, x_n $, o procedimento é
o seguinte:
1. No primeiro estágio, começamos efetuando uma troca de linhas
   $ L_1 \leftrightarrow L_k $, caso necessário, de modo que o coeficiente $
   a_{11} $ que multiplica $ x_1 $ na primeira equação passe a ser não-nulo;
   este coeficiente é o __primeiro pivô__. Então _subtraímos múltiplos da
   primeira linha das linhas abaixo de modo a eliminar o termo envolvendo $ x_1
   $ de cada uma delas_.  Ou seja, efetuamos as operações elementares de tipo $
   1 $ seguintes:
   $$
     L_2 \leftarrow L_2 - \lambda_{21} L_1,\quad L_3 \leftarrow L_3 - \lambda_{31} L_1, \quad \cdots,
     \quad L_n \leftarrow L_n - \lambda_{n1} L_1 \quad \text{para $ \lambda_{ij} = \frac{a_{i1}}{a_{11}} \,$.}
   $$
   Aqui $ a_{11} $ denota a entrada _atual_ na posição $ (1, 1) $, i.e., depois
   de efetuada a troca de linhas (caso ele tenha sido necessária).
2. No segundo estágio, se necessário, começamos efetuando uma troca de linhas
   $ L_2 \leftrightarrow L_k $ para algum $ k > 2 $ de modo que o coeficiente 
   $ a_{22} $ que multiplica $ x_2 $ na segunda linha passe a ser não-nulo; este
   coeficiente é o __segundo pivô__. Feito isto, subtraímos múltiplos da segunda
   linha das linhas abaixo de modo a eliminar os termos que envolvem $ x_2 $ de cada
   uma destas, através das operações elementares de tipo $ 1 $ seguintes:
   $$
     L_3 \leftarrow L_3 - \lambda_{32} L_2,\quad L_4 \leftarrow L_4 - \lambda_{42} L_2, \quad \cdots,
     \quad L_n \leftarrow L_n - \lambda_{n2} L_2 \quad \text{para $ \lambda_{ij} = \frac{a_{i2}}{a_{22}} \,$.}
   $$
   Novamente, aqui $ a_{22} $ denota o valor _atual_ da entrada na posição $ (2, 2) $.

E assim por diante. No $ i $-ésimo estágio ($ 1 \le i \le n - 1 $), utilizamos
uma operação $ L_i \leftrightarrow L_k $ ($ i < k $) de tipo $ 3 $ para garantir
que $ a_{ii} \ne 0 $, e então utilizamos este $ i $-**ésimo pivô** para limpar
os termos envolvendo $ x_i $ abaixo dele, por meio de operações elementares de
tipo $ 1 $.

📝 Observe que após o $ i $-ésimo estágio, a $ i $-ésima linha não é mais
utilizada nem alterada.

⚠️️ ️Uma troca de linhas é _necessária_ no $ i $-ésimo estágio se e somente se 
a entrada $ a_{ii} $ atual é nula. Neste caso, _recomenda-se escolher a linha
$ L_k $ que será trocada com $ L_i $ (para $ i < k $) cuja entrada $ a_{ki} $
tem o maior módulo possível dentre todas as linhas abaixo de_ $ L_i $. O
principal motivo é que quando um pivô é pequeno (em módulo), a divisão por ele
pode amplificar erros de arredondamento. 

Usando a estratégia de escalonamento __com pivoteamento parcial__, o intercâmbio
$ L_i \leftrightarrow L_k $ ($ k > i $) no $ i $-ésimo estágio é _sempre_ realizado
de modo a colocar o elemento de maior módulo na posição $ (i, i) $, mesmo que a
entrada $ a_{ii} $ atual seja não-nula. Assim, esta troca de linhas só não
é realizada se $ \vert{a_{ii}}\vert $ já for o máximo dentre
$ \left\{\vert a_{ki}\vert\right\}_{k \ge i} $.

__Exemplo:__ Considere o sistema linear abaixo:
$$
\begin{bmatrix}
0.03 & -58.9 \\
-5.31 & 6.10
\end{bmatrix}
\begin{bmatrix}
x \\
y
\end{bmatrix} 
=
\begin{bmatrix}
59.2 \\
46.7
\end{bmatrix}
$$
Usando escalonamento simples, a troca de linhas $ L_1 \leftrightarrow L_2 $ não
precisa ser feita, porque $ a_{11} = 0.03 \ne 0 $. Mas utilizando escalonamento
com pivoteamento parcial, esta troca seria a primeira operação elementar realizada,
porque $ \vert -5.31 \vert > \vert 0.03 \vert $.


Recapitulando, o primeiro elemento não-nulo da $ i $-ésima
linha de uma matriz escalonada é chamado de $ i $-ésimo __pivô__. Se 
$ \mathbf U $ é escalonada e, além disto, todos os pivôs são iguais a $ 1 $,
dizemos que $ \mathbf U $ está na forma __escalonada reduzida__. 

__Teorema 3.1:__ _Qualquer matriz $ \mathbf A $ $ n \times n $ pode ser escalonada.
O resultado $ \mathbf U $ deste escalonamento_ não _possui linhas nulas se e
somente se $ \mathbf A $ satisfaz qualquer uma das condições listadas na_
$ \S 2.2 $.

Uma vez que tenhamos escalonado uma matriz, podemos colocá-la na forma
escalonada reduzida efetuando no máximo $ n $ operações de tipo $ 2 $ (dividindo
cada linha por seu pivô).

O seguinte resultado geral explica por que o escalonamento não cria nem
destrói soluções.

__Teorema 3.2:__ _Se um sistema (T) de equações lineares é obtido a partir de
outro sistema (S) a partir de escalonamento, então (S) e (T) têm exatamente as
mesmas soluções._

_Prova:_ Observe que:
* Se $ \mathbf x $ é uma solução de um sistema linear qualquer
  e se um outro sistema difere deste pela aplicação de uma única operação
  elementar, então $ \mathbf x $ também satisfaz este último sistema.
* Cada operação elementar admite uma inversa, que é uma operação elementar do mesmo tipo.
  Por exemplo, a inversa de $ L_i \leftarrow L_i - \lambda_{ij}L_j $ é a operação 
  $ L_i \leftarrow L_i + \lambda_{ij} L_j $.

O primeiro ponto (aplicado repetidas vezes) implica que qualquer solução de (S) é solução
de (T). O segundo ponto nos dá a recíproca.
<div style="text-align: right">$ \blacksquare $ </div>

Note que não há necessidade de carregar as variáveis $ x $, $ y $ e $ z $ no
escalonamento, pois os seus nomes não têm qualquer papel durante o processo.
Podemos escrever os movimentos que fizemos no exemplo de maneira mais concisa
usando a __matriz aumentada__ $ [\mathbf A\mid \mathbf b] $:

$$
\left[\begin{array}{rrr|r}
2 & 1 & 1 & 5 \\
4 & -6 & 0 & -2 \\
-2 & 7 & 2 & 9
\end{array}\right]
\quad
\underset{L_3 \leftarrow L_3 + L_1}{\xrightarrow{L_2 \leftarrow L_2 - 2L_1}}
\quad
\left[\begin{array}{rrr|r}
2 & 1 & 1 & 5 \\
0 & -8 & -2 & -12 \\
0 & 8 & 3 & 14
\end{array}\right]
\quad
\xrightarrow{L_3 \leftarrow L_3 + L_2}
\quad
\left[\begin{array}{rrr|r}
2 & 1 & 1 & 5 \\
0 & -8 & -2 & -12 \\
0 & 0 & 1 & 2
\end{array}\right]
$$

📝 Observe que as operações elementares de tipo:
1. Não alteram o determinante.
2. Multiplicam o determinante por $ \mu $.
3. Multiplicam o determinante por $ -1 $.


__Exemplo 1:__ Resolva o sistema 
$$
\left[\begin{array}{rrr}
0 &3 & -1 \\
2 & 1 & 1 \\
-1 & 2 & 2
\end{array}\right]
\begin{bmatrix}
x \\ y  \\ z
\end{bmatrix}
=
\begin{bmatrix}
1 \\ 3 \\ 4
\end{bmatrix}\,.
$$

_Solução:_ Efetuando o escalonamento na forma matricial:
$$
\left[\begin{array}{rrr|r}
	0 & 3 & -1 & 1\\ 
	2 & -1 & 1 & 3\\ 
	-1 & 2 & 2 & 4
	\end{array}\right]
\quad
\xrightarrow{L_1 \leftrightarrow L_2}
\quad
\left[\begin{array}{rrr|r}
	2 & -1 & 1 & 3\\ 
	0 & 3 & -1 & 1\\ 
	-1 & 2 & 2 & 4
	\end{array}\right]
\quad
\xrightarrow{L_3 \leftarrow L_3 + \frac{1}{2}L_1}
\quad
\left[\begin{array}{rrr|r}
	2 & -1 & 1 & 3\\ 
	0 & 3 & -1 & 1\\ 
	0 & \frac{3}{2} & \frac{5}{2} & \frac{11}{2}
	\end{array}\right]
\quad
\xrightarrow{L_3 \leftarrow L_3 - \frac{1}{2}L_2}
\quad
\left[\begin{array}{rrr|r}
	2 & -1 & 1 & 3\\ 
	0 & 3 & -1 & 1\\ 
	0 & 0 & 3 & 5
	\end{array}\right]
$$
Agora, por retro-substituição, encontramos a solução
$$
(x, y, z) = \frac{1}{9}\big(10, 8, 15\big)\,.
$$

__Problema 2:__ Escalone a matriz aumentada e utilize retro-substituição para
resolver o sistema $ \mathbf A \mathbf x = \mathbf b $, para
$$
	\mathbf A =\begin{bmatrix}
	0 &  1 & 1 \\
	 2 & 4 & 8 \\
	1 & 3 & 6
	\end{bmatrix}\quad \text{ e }\quad \mathbf b=\begin{bmatrix}
	 1 \\
	 10 \\
	 4
	\end{bmatrix}.
$$

_Solução:_

## $ \S 5 $ Matrizes elementares

Uma outra razão para usar a forma matricial do escalonamento é a seguinte:
_Aplicar uma operação elementar a um sistema $ \mathbf{A} \mathbf x =
\mathbf{b} $ corresponde a multiplicar a matriz aumentada $ [\mathbf{A}|
\mathbf{b}] $ à esquerda por uma matriz apropriada._

__Definição:__ A multiplicação à esquerda pelas seguintes matrizes quadradas
$ n \times n $, chamadas de __matrizes elementares__, correspondem respectivamente às
operações elementares $ 1 $, $ 2 $ e $ 3 $ acima:

1. A operação $ L_{i} \leftarrow L_i - \lambda_{ij} L_j $, para $ i > j $, corresponde à matriz
   $ \mathbf E_{ij}(-\lambda_{ij}) $ que possui todas as entradas nulas exceto pelas da diagonal,
   que são iguais a $ 1 $, e a da posição $ (i,j) $, que é igual a $ -\lambda_{ij} $.
2. A operação $ L_i \leftarrow \mu L_i $
   $ (\mu \ne 0) $ corresponde à matriz diagonal obtida a partir de $ I_n $ (a matriz
   identidade $ n \times n $) fazendo a entrada $ (i,i) $ igual a $ \mu $.
3. A operação de troca $ L_i \leftrightarrow L_j $ corresponde à
   __matriz-permutação__ $ \mathbf P_{ij} $ obtida a partir de $ I_n $ intercambiando-se
   as linhas $ i $ e $ j $.

__Exemplo 2:__ As matrizes
$$
	\mathbf E_{21}(-\lambda)=\begin{bmatrix}
	 1 & 0 & 0 \\
	 -\lambda & 1 & 0 \\
	 0 & 0 & 1
	\end{bmatrix},
	\quad
	\begin{bmatrix}
	 1 & 0 & 0\\
	 0 & \mu & 0\\
	 0 & 0 & 1
	\end{bmatrix}
	\quad \text{e} \quad
	\mathbf P_{13}=\begin{bmatrix}
	0 & 0 &1 \\
	0 & 1 & 0 \\
	1 & 0 & 0
	\end{bmatrix}
$$
são elementares de tipos $ 1 $, $ 2 $ e $ 3 $, respectivamente. De fato, se 
$$
	\mathbf A=\begin{bmatrix}
		a_1 & a_2 & a_3 \\
		b_1 & b_2 & b_2 \\
		c_1 & c_2 & c_3 
	\end{bmatrix}
$$
é uma matriz $3\times 3$, então
$$
	\mathbf E_{21}(-\lambda)\,\mathbf A=\begin{bmatrix}
		a_1 & a_2 & a_3  \\
		b_1-\lambda a_1 & b_2 -\lambda a_2 & b_3-\lambda a_3 \\
		c_1 & c_2 & c_3  
	\end{bmatrix}
	\quad \text{e} \quad \mathbf P_{13}\, \mathbf A =
	\begin{bmatrix}
		c_1 & c_2 & c_3 \\
		b_1 & b_2 & b_2 \\
		a_1 & a_2 & a_3
	\end{bmatrix}\,,
$$
e similarmente para a segunda matriz elementar. Como não é necessário utilizar
qualquer operação do tipo $ 2 $ para se escalonar um sistema, a partir de agora
vamos considerar apenas matrizes elementares de tipos $ 1 $ e $ 3 $.

Observe que todas as matrizes elementares são invertíveis: Uma matriz de
permutação de linhas é a inversa dela mesma e a matriz inversa de $E_{ij}(-\lambda)$
é $E_{ij}(\lambda)$. Por exemplo:
$$
	\begin{bmatrix}
	 1 & 0 & 0 \\
	 0 & 1 & 0 \\
	0 & -7 & 1 
	\end{bmatrix}	\begin{bmatrix}
	 1 & 0 & 0 \\
	 0 & 1 & 0 \\
	0 & +7 & 1 
	\end{bmatrix}=\begin{bmatrix}
	 1 &0 & 0 \\
	 0 & 1 & 0 \\
	 0 & 0 & 1 
	\end{bmatrix},
$$
ou seja, $E_{32}(+7)E_{32}(-7)=I$.

Uma matriz quadrada é __triangular inferior__ se todas as suas entradas acima da
diagonal são nulas. A definição de matriz __triangular superior__ é análoga.
É fácil verificar que a soma e o produto de matrizes triangules inferiores (resp. superiores)
é do mesmo tipo. Além disto, a inversa de uma matriz triangular inferior (superior) é do mesmo
tipo, desde que esta inversa exista. O determinante de uma matriz triangular é o produto das
suas entradas diagonais. Observe que as matrizes elementares de tipo $ 1 $ são
triangulares inferiores pela exigência que $ i > j $.

📝 Matriz triangulares superiores geralmente são denotadas por $ \mathbf U $ (de
"_upper triangular_"), e matriz triangulares inferiores por $ \mathbf L $ (de
"_lower triangular_").

## $ \S 6 $ Fatoração LU

__Teorema 5.1:__ _Seja $ \mathbf A $ uma matriz quadrada não-singular
(i.e., invertível) $ n\times n $ e suponha que seja possível escalonar $ \mathbf A $ 
utilizando somente operações elementares do tipo $ 1 $. Então podemos
escrever $ \mathbf A = \mathbf L \mathbf U $, onde $ \mathbf L $ é triangular
inferior com elementos diagonais iguais a $ 1 $ e $ \mathbf U $ é triangular
superior com elementos diagonais não-nulos. Esta fatoração é única. Além disto:_
* _A matriz $ \mathbf U $ é a matriz resultante do escalonamento de_ $ \mathbf A $.
* *A entrada na posição $ (i, j) $ de $ \mathbf L $ (com $ i > j $) é
  exatamente o coeficiente $ \lambda_{ij} $ da operação elementar
  $ L_i \leftarrow L_i - \lambda_{ij} L_j $ que envolve as linhas $ i $ e $ j $
  no escalonamento*.

Esta fatoração é importante por vários motivos, dentre eles o seguinte:
Se sabemos fatorar $\mathbf A $ como $ \mathbf A = \mathbf L \mathbf U $,
então podemos resolver imediatamente o sistema
$$\mathbf A \mathbf x= \mathbf L \mathbf U \mathbf x = \mathbf b \,. $$
De fato, neste caso a resolução do sistema se reduz à do par de sistemas:
$$
	\begin{cases}
		\mathbf L\mathbf y= \mathbf b  \\
		\mathbf U \mathbf x= \mathbf y
	\end{cases}\,.
$$
Como $ \mathbf L $ é triangular inferior, o primeiro sistema pode ser resolvido imediatamente
por retro-substituição. Analogamente, uma vez encontrado $ \mathbf y $, como $
\mathbf U $ é triangular superior, o segundo sistema pode ser resolvido por
substituição progressiva (direta).
