In [1]:
import sys
sys.path.append('../')
from IPython.display import Latex
import latexStrings as ls
import numpy as np
import scipy.linalg as linear
import eigenvalues as ev

# Ejercicio 4

Definimos la matriz $A$ como en el ejercicio 1:

In [2]:
A = np.array([[1,1,2],[-1,9,3],[0,-1,3]])
Latex(ls.latexMatrix(A,'A'))

<IPython.core.display.Latex object>

Los eigenvalores y eigenvectores exactos a los que queremos llegar con nuestro método son los siguientes:

In [3]:
[eigenvalues,eigenvectors]=linear.eig(A)
[eigenvalues,eigenvectors]=ev.pairSort(eigenvalues,eigenvectors)

Latex(ls.latexVector(eigenvalues,'\lambda',form='%s') + ls.latexMatrix(eigenvectors,'V',form='%f'))

<IPython.core.display.Latex object>

El método aplicado a $A$ con vector inicial $q_0$ devuelve la aproximación de un eigenpar $(\lambda_j,v_j)$ con $j \in \{1,2,3\}$ en donde $\lambda_j$ es el eigenvalor de la matriz $A$ más cercano al primer shift de Rayleigh, definido como:
$$\rho_j = \frac{q_j^HAq_j}{||q_j||^2}$$

Pues, en escencia, el metodo de la potencia inversa con shift de Rayleigh es una mejora al metodo con shift estatico, tomando como primer shift el shit de Rayleigh y mejorandolo en cada iteracion. Esto lleva a que la convergencia se da hacia:

$$ \{\lambda_j,\vec{v}_j\}, \quad |\frac{1}{\lambda_j-\rho_0}|>|\frac{1}{\lambda_i-\rho_0}| \quad\forall i\neq j \quad i,j \in \{1,2,3\}$$.

Dado que la convergencia del metodo ahora depende del vector inicial, tratemos de buscar vectores distintos que nos lleven a todos los eigenvalores. Tomemos la base canónica como nuestros primeros 3 vectores iniciales:

In [4]:
q1 = np.array([0,1,0])
q2 = np.array([0,0,1])
q3 = np.array([1,0,0])
Latex(ls.latexVector(q1,'q_0^1') + ls.latexVector(q2,'q_0^2')+ls.latexVector(q3,'q_0^3'))

<IPython.core.display.Latex object>

Aplicamos el método de la potencia inversa con shift de Rayleigh a la matriz A tomando a cada uno de los 3 vectores previamente definidos como vector inicial, obteniendo:

In [5]:
[w1,l1,i1] = ev.inversePowerRayleigh(A,q1)
Latex(ls.latexVector(w1,'w_1',form="%f") + '$\sigma_1$ = '+str(l1))

<IPython.core.display.Latex object>

In [6]:
[w2,l2,i2] = ev.inversePowerRayleigh(A,q2)
Latex(ls.latexVector(w2,'w_2',form="%f") + '$\sigma_2$ = '+str(l2))

<IPython.core.display.Latex object>

In [7]:
[w3,l3,i3] = ev.inversePowerRayleigh(A,q3)
Latex(ls.latexVector(w3,'w_3', form="%f") + '$\sigma_3$ = '+str(l3))

<IPython.core.display.Latex object>

En efecto, vemos que los vectores tomados convergen a todos los distintos eigenvalores de $A$. A que se debe esto?

En nuestro ejemplo podemos ver que al tomar la base canónica como nuestros vectores iniciales estamos tomando a los elementos de la diagonal como nuestros shifts de Rayleigh iniciales pues $\overrightarrow{e_j}^tA\overrightarrow{e_j}= a_{jj}$. Observemos mas detalladamente esto:

Tomando $q_0^1 = (0,1,0)$ como vector inicial, nuestro primer shift es $\rho_0^1=a_{22}=9$, y se cumple que:
$$|\frac{1}{8.354544...-9}|>|\frac{1}{1.224671...-9}|>|\frac{1}{3.420783...-9}|\quad \Rightarrow 
|\frac{1}{\lambda_1-9}|>|\frac{1}{\lambda_3-9}|>|\frac{1}{\lambda_2-9}|\quad \Rightarrow \quad|\frac{1}{\lambda_1-\rho_1}|>|\frac{1}{\lambda_i-\rho_1}|\quad\forall i\neq 1$$ por lo que nuestro método de la potencia inversa con shift de Raleigh tomando tomando $q_0^1$ como vector inicial converge a:

In [8]:
Latex(ls.latexVector(w1,'w_1',form="%f") + '$\sigma_1$ = '+str(l1))

<IPython.core.display.Latex object>

Tomando $q_0^2 = (0,0,1)$ como vector inicial, nuestro shift inicial es $\rho_0^2=a_{33}=3$, y se cumple que 
$$|\frac{1}{3.420783...-3}|>|\frac{1}{1.224671...-3}|>|\frac{1}{8.354544......-3}|\quad \Rightarrow |\frac{1}{\lambda_2-3}|>|\frac{1}{\lambda_3-3}|>|\frac{1}{\lambda_1-3}|\quad \Rightarrow \quad|\frac{1}{\lambda_2-\rho_2}|>|\frac{1}{\lambda_i-\rho_2}|\quad\forall i\neq 2$$ por lo que nuestro método de la potencia inversa con shift de Raleigh tomando tomando $q_0^2$ como vector inicial converge a:

In [9]:
Latex(ls.latexVector(w2,'w_2',form="%f") + '$\sigma_2$ = '+str(l2))

<IPython.core.display.Latex object>

Tomando $q_0^3=(1,0,0)$ como vector inicial, nuestro shift inicial es $\rho_0^3=a_{11}=1$, y se cumple que:
$$|\frac{1}{1.224671...-1}|>|\frac{1}{3.420783...-1}|>|\frac{1}{8.354544......-1}|\quad \Rightarrow |\frac{1}{\lambda_3-1}|>|\frac{1}{\lambda_2-1}|>|\frac{1}{\lambda_1-1}|\quad \Rightarrow \quad|\frac{1}{\lambda_3-\rho_3}|>|\frac{1}{\lambda_i-\rho_3}|\quad\forall i\neq 3$$ 
por lo que nuestro método de la potencia inversa con shift de Raleigh tomando tomando $q_0^3$ converge a:

In [10]:
Latex(ls.latexVector(w3,'w_3', form="%f") + '$\sigma_3$ = '+str(l3))

<IPython.core.display.Latex object>

Ahora observemos que la convergencia del método de la potencia inversa con shift de Rayleigh es cuadratica. Primero veamos la aproximación de $\lambda_j$ en cada iteración del método para cada $\overrightarrow {q_0^i}$, y luego restando el eigenvalor correspondiente para ver la diferencia:

In [11]:
aprox=[]
for i in range(1,7):
    [_,sigmai,_] = ev.inversePowerRayleigh(A,q1,1e-14,i)
    aprox.append(sigmai)
Latex(ls.latexList(aprox,'\widetilde{\sigma}_1', form='%s'))

<IPython.core.display.Latex object>

In [12]:
Latex(ls.latexList(abs(aprox-eigenvalues[0]),'|\widetilde{\sigma}_1-\lambda_1|', form='%s'))

<IPython.core.display.Latex object>

In [13]:
aprox=[]
for i in range(1,7):
    [_,sigmai,_] = ev.inversePowerRayleigh(A,q2,1e-15,i)
    aprox.append(sigmai)
Latex(ls.latexList(aprox,'\widetilde{\sigma}_2', form='%s'))

<IPython.core.display.Latex object>

In [14]:
Latex(ls.latexList(abs(aprox-eigenvalues[1]),'|\widetilde{\sigma}_2-\lambda_2|', form='%s'))

<IPython.core.display.Latex object>

In [15]:
aprox=[]
for i in range(1,7):
    [_,sigmai,_] = ev.inversePowerRayleigh(A,q3,1e-14,i)
    aprox.append(sigmai)
Latex(ls.latexList(aprox,'\widetilde{\sigma}_3', form='%s'))

<IPython.core.display.Latex object>

In [16]:
Latex(ls.latexList(abs(aprox-eigenvalues[2]),'|\widetilde{\sigma}_3-\lambda_3|', form='%s'))

<IPython.core.display.Latex object>

Podemos ver que en los 3 casos el número de cifras correctas de la aproximación de $\sigma_j$ con $j\in\{1,2,3\}$ se duplica con cada iteración hasta llegar al valor exacto o a un punto en donde la matriz es casi singular y el método ya no es aplicable computacionalmente por lo tanto comprobamos que el método converge cuadráticamente.