# Tarefa 08 de Álgebra Linear Computacional

Atividade sobre Métodos de Potência.

* **Aluna:** Bárbara Neves
* **Matrícula:** 507526


### Descrição

Implementar e testar os seguintes métodos:

- `Potência Regular (A, x, eps)`
- `Potência Inverso (A, x, eps)`
- `Potência com Deslocamento (A, x, eps, mu)`

# Imports

In [None]:
import numpy as np
np.set_printoptions(precision=2, suppress=True)

import warnings
warnings.filterwarnings("ignore")

# Autovalores e Autovetores

Neste trabalho, observamos mais de perto o efeito da multiplicação de matrizes. 

Aqui, vemos como valores especiais chamados **autovalores** e vetores correspondentes chamados **autovetores**, podem ser usados ​​para analisar o efeito de uma matriz correspondente.

<center>
  <img width="550" src="https://upload.wikimedia.org/wikipedia/commons/2/25/Mona_Lisa_with_eigenvector.png" />
</center>

Dada uma matriz quadrada (portanto, simétrica) $A_{n \times n}$, um escalar $\lambda$ é chamado de autovalor de $A$ se existir algum vetor $\vec{v}$ diferente de zero em $\mathbb{R}^{n}$ tal que $A\vec{v} = \lambda \vec{v}$. O vetor $\vec{v}$ é então o autovetor associado a $\lambda$. 

A equação acima afirma que quando um autovetor de $A$ é multiplicado por $A$, o resultado é simplesmente um múltiplo do autovetor. Em geral, podem haver vários autovalores associados a uma dada matriz.






# Aproximando Autovalores - Métodos de Potência

**Existem alguns métodos que podem ser usados ​​para aproximar os autovalores de uma matriz $A$**. Embora seja possível encontrar os autovalores exatos para matrizes pequenas, a abordagem é impraticável para matrizes maiores.

Uma maneira direta de calcular autovalores de uma matriz $A_{n \times n}$ é calculando as raízes de um polinômio de grau $n$ associado, conhecido como polinômio característico. 

Por exemplo, suponha uma matriz $A_{2 \times 2}$, dada abaixo.

\\

\begin{gather*} 
  A = \begin{bmatrix}
  a & b \\
  c & d \\
  \end{bmatrix}
\end{gather*}

\\

Os autovalores de $A$ são soluções para a equação quadrática $\lambda^2 − (a + d) \lambda + ad − bc = 0$, que pode ser escrita explicitamente em termos de $a$, $b$, $c$ e $d$ usando a fórmula quadrática. 

> Os desafios com matrizes maiores são que o polinômio é mais difícil de construir e as raízes não podem ser facilmente encontradas com uma fórmula.

Para isso, os métodos iterativos deste trabalho geram uma sequência de vetores $\{\vec{x}^{(1)}, \vec{x}^{(2)}, \vec{x}^{(3)}, \cdots\}$ que se aproximam de um autovetor verdadeiro da matriz em consideração. Uma aproximação do autovalor correspondente pode então ser calculada multiplicando o autovetor aproximado por $A$.

\\

---

\\

### Matriz $A_1$

A matriz exemplo para teste dos Métodos de Potência neste *notebook* foi retirada da seguinte [aula](https://https://www.youtube.com/watch?v=6StS7VjtuGI):

\\

\begin{gather*} 
  A_{1 \; 3 \times 3} = \begin{bmatrix}
  5 & -2 & -2 \\
  -3 & 5 & 0 \\
  23 & -19 & -6
  \end{bmatrix}
\end{gather*}

\\

Essa matriz possui **2 autovetores independentes, com autovalores associados a eles**.

\\

<center>
  <img src="https://drive.google.com/uc?id=1XnvCOP0DwuUW8H2ajRA3-LZBDaiyvP-n" />
</center>

\\

---

\\

### Matriz $A_2$

A matriz exemplo para teste dos Métodos de Potência neste *notebook* foi retirada do seguinte [*link*](https://bvanderlei.github.io/jupyter-guide-to-linear-algebra/Approximating_Eigenvalues.html):

\\

\begin{gather*} 
  A_{2 \; 3 \times 3} = \begin{bmatrix}
  9 & -1 & -3 \\
  0 & 6 & 0 \\
  -6 & 3 & 6
  \end{bmatrix}
\end{gather*}

\\

Essa matriz possui **3 autovetores independentes, com autovalores associados a eles**.

\\

<center>
  <img src="https://drive.google.com/uc?id=13WWijx3FMZbujD50YZ6Flt3Cc39yv6X-" />
</center>

\\

In [None]:
A_1 = np.array([
  [5, -2, -2],
  [-3, 5, 0],
  [23, -19, -6]
], dtype='float32')

A_2 = np.array([
  [9, -1, -3],
  [0, 6, 0],
  [-6, 3, 6]
], dtype='float32')

## Potência Regular: Maior Autovalor

O primeiro algoritmo para aproximar autovalores é conhecido como **Método da Potência Regular**. 

Este método iterativo gera uma sequência de vetores por multiplicação repetida de matrizes. 

Sob condições adequadas, a sequência de vetores se **aproxima do autovetor associado ao autovalor que é maior em valor absoluto (isto é, de maior magnitude)** na matriz.

In [None]:
def normalize(x):
  if len(x.shape) != 1:
    raise ValueError("Argumento inválido: apenas vetores coluna.")
  
  magnitude = abs(x).max()
  x_n = x / x.max()
  return magnitude, x_n

def power_method(A, x, eps=1e-10):
  m = A.shape[0]
  n = A.shape[1]
  relative_error, _ = normalize(x)

  if m != n:
    raise ValueError("Argumento inválido: a matriz de entrada deve ser quadrada.")
  
  while relative_error > eps:
    x_old = x
    x = A@x

    lambda_, x = normalize(x)
    relative_error, _ = normalize(x - x_old)

  return lambda_, x

> O autovetor inicial ($x$) escolhido é o que possui apenas valores 1. 
>
> O critério de parada foi definido como sendo $10^{-11}$.

In [None]:
n = A_1.shape[0]
x = np.ones(n) # x arbitrário inicial

In [None]:
regular_lambda_1, regular_v_1 = power_method(A_1, x)

print("Autovalor de A_1 = {}\nAutovetor de A_1 é aproximadamente = {}".format(regular_lambda_1, regular_v_1))

Autovalor de A_1 = 2.000000000103684
Autovetor de A_1 é aproximadamente = [1.  1.  0.5]


In [None]:
print("A@v ---> {} = lambda * v ---> {}".format(A_1@regular_v_1, regular_lambda_1 * regular_v_1))

A@v ---> [2. 2. 1.] = lambda * v ---> [2. 2. 1.]


In [None]:
regular_lambda_2, regular_v_2 = power_method(A_2, x)

print("Autovalor de A_2 = {}\nAutovetor de A_2 é aproximadamente = {}".format(regular_lambda_2, regular_v_2))

Autovalor de A_2 = 11.999999999607098
Autovetor de A_2 é aproximadamente = [ 1.  0. -1.]


In [None]:
print("A@v ---> {} = lambda * v ---> {}".format(A_2@regular_v_2, regular_lambda_2 * regular_v_2))

A@v ---> [ 12.   0. -12.] = lambda * v ---> [ 12.   0. -12.]


## Potência Inversa: Menor Autovalor

Embora o **Método da Potência Regular** seja fácil de entender e aplicar, ele possui desvantagens. 

- **Desvantagem principal:** o método só se aplica ao maior autovalor. 

No entanto, é possível modificar facilmente o método para aproximar os outros autovalores, como ocorre no **Método da Potência Inversa**, que permite aproximar autovalores que não são os maiores. 

Tudo o que é necessário para fazer a modificação é saber que os autovalores da matriz inversa $A^{-1}$ são recíprocos aos autovalores de $A$. Assim, esse recurso pode ser aproveitado para obter o menor autovalor de $A$. 

Os passos são simples:

1. Em vez de multiplicar $A$ como é feito no Método da Potência, multiplicamos $A^{-1}$;
2. Durante a iteração, encontraremos o menor valor de $\frac{1}{\lambda_1}$ que será o menor valor dos autovetores para $A$.

In [None]:
def inverse_power_method(A, x, eps=1e-10):
  m = A.shape[0]
  n = A.shape[1]

  A_inv = np.linalg.inv(A)
  relative_error, _ = normalize(x)

  if m != n:
    raise ValueError("Argumento inválido: a matriz de entrada deve ser quadrada.")
  
  while relative_error > eps:
    x_old = x
    x = A_inv@x

    lambda_inv, x = normalize(x)

    relative_error, _ = normalize(x - x_old)
    lambda_, _ = normalize(A@x)

  return lambda_inv, lambda_, x

In [None]:
lambda_inv_1, regular_lambda_inv_1, inv_v_1 = inverse_power_method(A_1, x)

print("Autovalor de A_1 = {}\nAutovalor A_1^(-1) = {}\nAutovetor de A_1 é aproximadamente = {}".format(regular_lambda_inv_1, lambda_inv_1, inv_v_1))

Autovalor de A_1 = 0.9999855661909915
Autovalor A_1^(-1) = 1.0000144340173538
Autovetor de A_1 é aproximadamente = [0.8 0.6 1. ]


In [None]:
print("A@v ---> {} = lambda * v ---> {}".format(A_1@inv_v_1, regular_lambda_inv_1 * inv_v_1))

A@v ---> [0.8 0.6 1. ] = lambda * v ---> [0.8 0.6 1. ]


In [None]:
lambda_inv_2, regular_lambda_inv_2, inv_v_2 = inverse_power_method(A_2, x)

print("Autovalor de A_2 = {}\nAutovalor A_2^(-1) = {}\nAutovetor de A_2 é aproximadamente = {}".format(regular_lambda_inv_2, lambda_inv_2, inv_v_2))

Autovalor de A_2 = 2.9999999106257755
Autovalor A_2^(-1) = 0.33333333829674916
Autovetor de A_2 é aproximadamente = [0.5 0.  1. ]


In [None]:
print("A@v ---> {} = lambda * v ---> {}".format(A_2@inv_v_2, regular_lambda_inv_2 * inv_v_2))

A@v ---> [1.5 0.  3. ] = lambda * v ---> [1.5 0.  3. ]


## Potência com Deslocamento

Em alguns casos, precisamos encontrar outros autovalores e autovetores em vez do maior e menor. Uma maneira simples, mas ineficiente, é usar o **Método da Potência com Deslocamento**.

Trata-se de uma variação do Método da Potência Inversa, onde precisamos "deslocar" as entradas diagonais de uma matriz por um escalar $\mu$, onde todos os autovalores da matriz também são deslocados por $\mu$.

Isso é útil porque nos permite agora usar o Método da Potência Inversa para aproximar o autovalor de $A$ que está mais próximo de $\mu$. 

> Por exemplo, se $\mu$ estiver mais próximo de $\lambda_2$, então $| \lambda_2 - \mu | < | \lambda_i - \mu| $ para todos os $i \neq 2$.
> 
> Isso significa que $(\lambda_2 - \mu)$ pode ser aproximado aplicando o Método da Potência Inversa a $(A − \lambda I)$.

In [None]:
def shifted_power_method(A, x, eps=1e-10, mu=1):
  m = A.shape[0]
  n = A.shape[1]
  relative_error, _ = normalize(x)
  
  I = np.eye(n)
  shifted_A = A - (mu * I)

  if m != n:
    raise ValueError("Argumento inválido: a matriz de entrada deve ser quadrada.")
  
  while relative_error > eps:
    x_old = x
    x = lu_solve(shifted_A, x)

    lambda_shifted, x = normalize(x)

    relative_error, _ = normalize(x - x_old)
    lambda_, _ = normalize(A@x)

  return np.sqrt(lambda_), x

### Decomposição LU

Código desenvolvido na [Tarefa 3](https://drive.google.com/file/d/1tQe_99pbQ0H3CsRGKStheHXhL6tUdTaA/view?usp=sharing).

In [None]:
def is_square(A): 
  return all(len(row) == len(A) for row in A)

def forward_substitution(L, b):
    n = L.shape[0]
    
    y = np.zeros_like(b, dtype=np.double);
    y[0] = b[0] / L[0, 0]
    
    for i in range(1, n):
      y[i] = (b[i] - np.dot(L[i, :i], y[:i])) / L[i, i]
        
    return y

def back_substitution(U, y):
    n = U.shape[0]
    
    x = np.zeros_like(y, dtype=np.double);
    x[-1] = y[-1] / U[-1, -1]
    
    for i in range(n - 2, -1, -1):
      x[i] = (y[i] - np.dot(U[i, i:], x[i:])) / U[i, i]
        
    return x

def lu(A):
  n = A.shape[0]
  
  U = A.copy()
  L = np.eye(n, dtype=np.double)

  if not is_square(U):
    raise ValueError('Argumento inválido: a matriz de entrada deve ser quadrada.')

  if any(np.diag(U) == 0):
    raise ZeroDivisionError(('Pivot não suportado! Divisão por zero encontrada.'))
  
  for i in range(n):
    factor = U[i + 1:, i] / U[i, i]
    L[i + 1:, i] = factor
    U[i + 1:] -= factor[:, np.newaxis] * U[i]
      
  return L, U

def lu_solve(A, b):
    L, U = lu(A)
    assert L.shape == U.shape
    
    y = forward_substitution(L, b)
    return back_substitution(U, y)

### Definindo $\mu$

Por exemplo, sabemos que

- usando o **Método da Potência Inversa** determinamos que o menor autovalor de $A$ é $\lambda_n = 1$;
- aplicando o **Método da Potência Regular** diretamente mostramos que o maior autovalor de $A$ é $\lambda_1 = 2$. 

Como o terceiro autovalor deve estar em algum lugar entre esses extremos, definimos $\mu$ para ser exatamente no meio. 

Assim,

In [None]:
# O terceiro autovalor deve estar em algum lugar entre os extremos do maior e do menor autovalor
mu_1 = 0.5
mu_2 = 7.5 # (len(range(3, 14)) + 1)/2

mu_1, mu_2

(0.5, 7.5)

In [None]:
shifted_lambda_1, shifted_v_1 = shifted_power_method(A_1, x, mu=mu_1)

print("Autovalor de A = {}\nAutovetor de A é aproximadamente = {}".format(shifted_lambda_1, shifted_v_1))

Autovalor de A = 0.9999948968075877
Autovetor de A é aproximadamente = [0.8 0.6 1. ]


In [None]:
print("A@v ---> {} = lambda * v ---> {}".format(A_1@shifted_v_1, shifted_lambda_1 * shifted_v_1))

A@v ---> [0.8 0.6 1. ] = lambda * v ---> [0.8 0.6 1. ]


In [None]:
shifted_lambda_2, shifted_v_2 = shifted_power_method(A_2, x, mu=mu_2)

print("Autovalor de A = {}\nAutovetor de A é aproximadamente = {}".format(shifted_lambda_2, shifted_v_2))

Autovalor de A = 5.999999999979936
Autovetor de A é aproximadamente = [3. 6. 1.]


In [None]:
print("A@v ---> {} = lambda * v ---> {}".format(A_2@shifted_v_2, shifted_lambda_2 * shifted_v_2))

A@v ---> [18. 36.  6.] = lambda * v ---> [18. 36.  6.]


<!--- Matrizes simétricas -> $A = A^T$ (definição)

Toda matriz simétrica com coeficientes reais (cujos elementos são reais) os autovalores dela necessariamente são números reais -> Não pode ser número imaginário 

Matrizes simétricas possuem multiplicidade algébrica igual a multiplicidade geométrica -> Os autovalores mesmo repetidos vão ter o número suficiente de autovetores associados a eles

(A, x, eps) -> A = matriz A; x = vetor inicial; eps = tolerância (número que vai servir para o critério de parada)
!-->