![CC-BY-SA](https://mirrors.creativecommons.org/presskit/buttons/88x31/svg/by-sa.svg)
This notebook was created by [Bernardo Freitas Paulo da Costa](http://www.im.ufrj.br/bernardofpc),
and is licensed under Creative Commons BY-SA

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Autovetores e autovalores

Um autovetor de uma matriz quadrada $A$ é um vetor não nulo $v$ tal que $Av$ seja colinear a $v$.
Em termos mais algébricos, existe um escalar $\lambda$ tal que
$$ Av = \lambda v.$$

Os autovetores fornecem uma nova forma de fatorar a matriz $A$.
Se esta admitir uma base de autovetores (por exemplo, for simétrica!),
podemos formar a _diagonalização_ da matriz $A$,
que é dada pela matriz dos autovetores $V = [v_1, v_2, \ldots, v_n]$
e pela matriz diagonal dos autovalores $D = \text{diag}(\lambda_1, \lambda_2, \ldots, \lambda_n)$:
$$ AV = VD. $$

Quando a matriz $A$ é simétrica, os autovetores são ortogonais entre si.
Isso permite inverter a matriz $V$ com grande facilidade, já que
$V^{T} V = \text{diag}(N_1^2, N_2^2, \ldots, N_n^2)$ onde $N_i$ é a _norma_ do vetor $v_i$.
Em particular, se tivermos o cuidado de tomar autovetores de norma $1$,
a transposta de $V$ será a sua inversa!

## Calculando autovalores

É possível determinar os autovalores de uma matriz através de uma equação polinomial em $\lambda$:
$$ \det(A - \lambda I) = 0. $$

O cálculo "pela definição" do polinômio característico de uma matriz $n \times n$
requer calcular todas as $n!$ permutações.
Isso é muito custoso, e após o quê ainda teríamos que achar as raízes de um polinômio de grau relativamente grande,
o que dará trabalho também para o método de Newton (por exemplo).

Existem métodos mais eficientes para calcular o polinômio característico,
mas não vamos entrar no detalhe agora, pela razão a seguir:

## Autovalores $\not\Rightarrow$ autovalores! 

Uma vez conhecidos os autovalores, podemos resolver o sistema $(A - \lambda_k)v = 0$
(que é **singular**!) e encontrar uma solução não-nula, determinando o autovetor correspondente.

Em geral, calcular raízes de polinômios também se faz por um método iterativo
(quando o grau é maior do que 4, por exemplo),
e haverá um erro (numérico, por exemplo) no valor de $\lambda$
que será aproximado por $\tilde\lambda$.
Assim, é possível que a matriz $A - \tilde\lambda I$ seja inversível,
e que o sistema na verdade só tenha a solução $v = 0$, que não desejamos.
Portanto, é preciso fazer as contas de $(A - \lambda I)v = 0$ levando em conta que
a matriz será "quase-singular" e que isto corresponde à liberdade necessária para achar um autovetor!

Por todas estas razões, vamos fazer ao contrário: começaremos

## Calculando autovetores

Um dos algoritmos mais clássicos de cálculo de autovetores é "multiplicar e normalizar":
tome um vetor "qualquer" $u_0$ e aplique a matriz $A$, obtendo $w_1 = Au_0$.
Normalize $w_1$, ou seja, divida pela sua norma para obter um vetor unitário de mesma direção,
e chame-o de $u_1$.
Repita: $w_2 = Au_1$, e $u_2 = \frac{w_2}{N(w_2)}$.
E assim por diante.
Em geral (isso depende de $u_0$), a sequência dos $u_n$ converge para um autovetor $u$ correspondente
ao autovalor de $A$ de maior módulo.

### Exercício: Convertendo autovetores em autovalores

Se o limite dos $v_n$ é um autovetor tal que $Av = \lambda v$,
como obter uma estimativa de $\lambda$?

###Dê sua resposta aqui


### Exercício

Implemente este algoritmo,
e pense sobre o critério de parada para o mesmo.

In [None]:
norm = np.linalg.norm

In [None]:
def autovetor(A, tol=1e-6):
    n,m = np.shape(A)
    assert n==m, 'A must be square'
    
    u = np.random.rand(n)
    ### Resposta aqui


Use este algoritmo para calcular o "maior" autovalor de algumas matrizes (por exemplo, a matriz de Hilbert!).

In [None]:
np.random.seed(123)
A = np.random.rand(20,20)
### Resposta aqui


Como saber se o vetor que você retornou está perto de um autovetor "de verdade" de $A$?

In [None]:
### Resposta aqui


### Exercício: convergência

Agora, modifique o código de `autovetor` para retornar mais informações.

O objetivo é obter um gráfico da velocidade de convergência como abaixo:

In [None]:
### Resposta aqui

plt.show()

## Análise de convergência

Suponha que o "segundo" autovalor de $A$ seja $\lambda_2$, em módulo menor do que $\lambda_1$.
Isso quer dizer que, para todo vetor $u = \sum c_i v_i$ (onde os $v_i$ são os autovetores de $A$),
temos
$$ Au = \sum \lambda_i c_i v_i. $$
Além disso, note que a normalização poderia ser feita depois:
se definirmos $x_n = A^n u_0$, temos que $u_n = \frac{x_n}{N(x_n)}$.

Cada iteração deste método irá aumentar o peso do coeficiente de $v_1$,
pois ele será multiplicado pelo maior dos números $\lambda_i$,
e temos $A^n u = \sum \lambda_i^n c_i v_i$.
Para ver como o método converge, vamos olhar para o erro, ou seja,
a componente de $u_n$ que não está na direção de $v_1$:
$$ \frac{\sum _ {i > 1} \lambda_i^n c_i v_i}{N(x_n)}. $$
Só que a norma de $x_n$ é determinada principalmente por $c_1 \lambda_1^n$,
que é muito maior do que todos os outros.
Idem, inclusive, para o termo de erro:
a maior contribuição para sua norma vem de $c_2 \lambda_2^n$.
Assim, o erro é $\left| \frac{\lambda_2}{\lambda_1} \right|^n \to 0$.

# Calculando autovetores correspondentes a outros autovalores

Poderíamos calcular o autovetor correspondente ao **menor** autovalor fazendo o contrário:
multiplicamos $u_0$ por $A^{-1}$ sucessivamente, o que **divide** os coeficientes.
Claro, isso só funciona se $A$ não tiver um autovalor igual a zero.

Poderíamos modificar um pouco este procedimento:
chutamos (de alguma forma) que há um autovalor próximo a $z$, um número complexo.
Assim, vamos tentar calcular qual será o autovetor correspondente.
Para isso, veja que $A_z = A - zI$ tem um autovalor bem próximo de zero,
e assim iterando o procedimento acima, temos o autovetor correspondente.

### Exercício

Incorpore a solução de sistemas lineares para implementar a multiplicação por $(A - zI)^{-1}$.
Use a fatoração LU de $(A - zI)$ para tornar a solução mais rápida!

In [None]:
import scipy.linalg
# Para usar scipy.linalg.lu_factor() e scipy.linalg.lu_solve()

In [None]:
def nearest_eigenvalue(A,z, tol=1e-6, nmax=100):
    """ Finds the eigenvalue of  A  nearest to  z (complex). Iterative method. """
    n,m = np.shape(A)
    assert n==m, 'A must be square'

    u = np.random.rand(n)
    ### Resposta aqui


In [None]:
vs, ls = nearest_eigenvalue(A, 1)
### Resposta aqui


In [None]:
len(vs)

In [None]:
vs, ls = nearest_eigenvalue(A, 1+0.1j)
### Resposta aqui


In [None]:
len(vs)

In [None]:
### Resposta aqui


In [None]:
### Resposta aqui
