![CC-BY-SA](https://mirrors.creativecommons.org/presskit/buttons/88x31/svg/by-sa.svg)
This notebook was created by [Bernardo Freitas Paulo da Costa](http://www.im.ufrj.br/bernardofpc),
and is licensed under Creative Commons BY-SA

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Ortogonalização

Vamos ver uma das ideias mais importantes em espaços vetoriais: produtos internos e vetores ortogonais.
Além das diversas interpretações geométricas que temos com isso,
também obteremos algoritmos numéricos bastante interessantes!

### Exercício

Suponha que temos 2 vetores $u$ e $v$, que linearmente independentes.
- Como calcular um vetor ortogonal a $u$?
- Como calcular um vetor ortogonal a $v$?
- Como calcular uma base ortonormal?

Depois de fazer em $R^2$, veja se as "mesmas" contas funcionam em $R^n$.

In [None]:
def base(u,v):
    """Calcula uma base ortonormal a partir de dois vetores u e v,"""
    ### Resposta aqui


In [None]:
base([0,1], [1,1])

In [None]:
v1, v2 = base([1,2,3], [3,2,1])
print(v1, v2, sep='\n')

In [None]:
np.dot(v1, v2)

# O algoritmo de Gram-Schmidt


Vamos generalizar o que fizemos antes para 3 vetores, e depois $n$ vetores.
O resultado será um método para, a partir de uma base (qualquer!) de $R^n$,
obtermos uma base ortonormal, por indução (o que mais?).

In [None]:
def resto(v, us):
    """Calcula um vetor w, ortogonal a todos os vetores da lista us, que supomos serem ortonormais."""
    ### Resposta aqui


In [None]:
v3 = resto([4,5,1], [v1, v2])
v3

In [None]:
np.dot(v3,v1), np.dot(v3,v2)

### Exercício

Agora, termine Gram-Schmidt:
comece com duas listas de vetores, cuja reunião é uma base de $R^n$,
e onde a segunda lista é, além disso, ortonormal.
Naturalmente, a segunda lista começa vazia, e vai "crescendo" de um em um conforme a outra decresce.

In [None]:
def gram_schmidt(vs, us):
    """Obtem uma base ortonormal para o subespaço gerado pelos vetores das listas vs e us.
    
    Os vetores de us devem ser ortonormais.  Use uma lista vazia para inicializar."""
    ### Resposta aqui


In [None]:
### Resposta aqui


In [None]:
vs = [[1,2,3], [4,3,2], [1,-2,1]]
base = gram_schmidt_rec(vs, [])
base

In [None]:
base = np.array(base)
base

In [None]:
np.matmul(base, base.T)

# Fatoração QR

A fatoração QR está para a fatoração LU como o algoritmo de Gram-Schmidt está para o de Gauss:
ou seja, vamos "guardar" numa matriz extra ($R$)
as operações feitas para ortogonalizar os vetores de $A$
que ficarão armazenados na matriz ortogonal $Q$.

O único detalhe é que (tradicionalmente) vamos olhar para as **colunas** de $A$ como vetores,
e portanto ao fazer operações em colunas o algoritmo aparece "transposto":
o resultado está na matriz da esquerda, e as "operações em colunas" geram uma matriz triangular superior.

## Transformando os vetores

Temos $A = [a_1 \ a_2 \ a_3 \ldots ]$.
Ao realizar Gram-Schmidt, obtemos vetores ortonormais $e_1$, $e_2$, $e_3\ldots$.
O primeiro é apenas a normalização de $a_1$.
O segundo tem a componente na direção de $e_1$ retirada, e depois é normalizado.
E assim por diante.
Olhando (que nem na eliminação) as operações ao contrário, temos:

$$ \def\h<#1,#2>{\left\langle#1,#2\right\rangle}
\begin{align}
a_1 & = \h<a_1,e_1>e_1 && = \beta_1 e_1\\
a_2 & = \h<a_2,e_1>e_1 + \h<a_2,e_2>e_2 && = \gamma _ {2,1} e_1 + \beta_2 e_2 \\
a_3 & = \h<a_3,e_1>e_1 + \h<a_3,e_2>e_2 + \h<a_3,e_3>e_3 && = \gamma _ {3,1} e_1 + \gamma _ {3,2} e_2 + \beta_3 e_3
\end{align}$$

Assim, olhando as colunas, temos:
$$A = \begin{bmatrix} & & \\ a_1 & a_2 & a_3 \\ & & \end{bmatrix}
= \begin{bmatrix} & & \\ e_1 & e_2 & e_3 \\ & & \end{bmatrix}
  \begin{bmatrix}\beta_1 & \gamma _ {2,1} & \gamma _ {3,1} \\ 0 & \beta_2 & \gamma _ {3,2} \\ 0 & 0 & \beta_3\end{bmatrix}
= QR.$$

### Observação
Na verdade, **sempre** podemos decompor um vetor $v$ numa base ortonormal $\{e_i\}$ pela fórmula

$$ v = \sum_i \h<v,e_i>e_i. $$
O que acontece de especial no algoritmo de Gram-Schmidt é que os vetores $e_k$ só dependem dos $a_i$ com $i \le k$,
e portanto o mesmo vale para a volta: os $a_k$ podem ser determinados conhecendo apenas os $e_i$ para $i \le k$.

### Numpy

O algoritmo de fatoração QR é bastante útil, e por isso é possível usá-lo via `numpy.linalg.qr`.

### Exercício

Verifique que a fatoração QR retorna matrizes ortogonais.
Use `rand(n,m)` para produzir algumas matrizes aleatórias.

Qual a diferença de $Q^T Q$ para a matriz identidade da dimensão correspondente?
Como isso se comporta quando a dimensão aumenta?

In [None]:
def graph_qtq(n, ntry=10):
    i = np.identity(n)
    ### Resposta aqui


In [None]:
for i,n in enumerate(np.logspace(1,2,dtype=int,num=6)):
    if i % 2 == 0:
        plt.figure(figsize=(15,4))
    plt.subplot(1,2,(i%2)+1)
    graph_qtq(n)
    plt.title('n = {}'.format(n))

In [None]:
plt.show()