# Eigenvalores de matrices simétricas

En esta sección nos enfocaremos al problema numérico de encontrar $\lambda$ para la que existan soluciones no triviales de  $\mathbf{Ax} = \lambda\mathbf{x}$.

Nuestro punto de partida es la *forma estándar* del problema de eigenvalores 

\begin{equation}
\mathbf{Ax} = \lambda\mathbf{x} \label{eq:eigen1}
\end{equation}

donde $\mathbf{A}$ es una matríz conocida de $n \times n$. El problema es encontrar el escalar $\lambda$ y el vector $\mathbf{x}$.

Podemos reescribirla de la forma

\begin{equation}
(\mathbf{A} - \lambda\mathbf{I})\mathbf{x} = \mathbf{0} \label{eq:eigen2},
\end{equation}

para que sea evidente que estamos resolviendo un sistema de $n$ ecuaciones homogéneas. La solución obvia es la trivial $\mathbf{x} = \mathbf{0}$. Una solución no trivial existe si el determinante de la matríz es nulo, es decir

\begin{equation}
\det({\mathbf{A} - \lambda\mathbf{I}}) = 0. \label{eq:eigen3}
\end{equation}

Si desarrollamos las ecuaciones obtenemos una ecuación polinomial, también conocida como *ecuación característica*
$$
a_0 + a_1\lambda + a_2\lambda^2 + \cdots + a_n\lambda^n = 0
$$

la cual tiene raices $\lambda_i$ con $i=1,2,\ldots ,n$ llamadas *eigenvalores* de la matríz $\mathbf{A}$. Las soluciones $\mathbf{x}_i$ del sistema $(\mathbf{A} - \lambda_i\mathbf{I})\mathbf{x} = \mathbf{0}$, se denominan *eigenvectores*.

Algunas propiedades relevantes son:

1. Todos los eigenvalores de una matríz simétrica son reales;
2. Todos los eigenvalores de una matríz simétrica y positiva definida son reales y positivos;
3. Los eigenvalores de una matríz simétrica son ortonormales, es decir $\mathbf{X}^T\mathbf{X}=\mathbf{I}$;
3. Si los eigenvalores de $\mathbf{A}$ son $\lambda_i$, entonces los eigenvalores de $\mathbf{A}^{-1}$ son $\lambda_i^{-1}$.

Los problemas de eigenvalores que surgen en la Física (análisis de vibraciones y estabilidad), típicamente son con matrices simétricas. En el caso de tener matrices no-simétricas, los eigenvalores serían complejos. 

Los problemas más comunes
1. Las matrices son grandes y dispersas (por ejemplo con estructuras de bandas)
2. Interesan los eigenvalores y unos cuantos eigenvectores

Si los problemas son así, se optimiza la programación de la solución para ahorrar tiempo de cómputo. 


# Método de Jacobi

Es un método iterativo simple y robusto, que extrae *todos* los eigenvalores y eigenvectores de una matríz simétrica pequeña ($n \sim 50$).

Para construir el método, necesitamos revisar transformaciones de similitud, rotaciones y finalmente la diagonalización.

## Transformación de similitud y diagonalización

Consideremos el problema de eigenvalores donde $\mathbf{A}$ es simétrica y apliquemos la transformación:

\begin{equation}
\mathbf{x} = \mathbf{P}\mathbf{x}^\ast \label{eq:eigen4}
\end{equation}

donde $\mathbf{P}$ es una matríz no singular. 

Sustituyendo en la ecuación de eigenvalores y multiplicando por la izquierda por $\mathbf{P}^{-1}$ tenemos que:

\begin{equation}
\mathbf{P}^{-1}\mathbf{APx}^\ast = \lambda \mathbf{P}^{-1} \mathbf{P}\mathbf{x}^\ast \label{eq:eigen5}
\end{equation}

o bién

\begin{equation}
\mathbf{A}^\ast \mathbf{x}^\ast = \lambda \mathbf{x}^\ast \label{eq:eigen6}
\end{equation}

donde $\mathbf{A}^\ast=\mathbf{P}^{-1}\mathbf{AP}$. Debido a que $\lambda$ quedó igual ante la transformación, los eigenvalores de $\mathbf{A}$ también son eigenvalores de $\mathbf{A}^\ast$, las matrices son *similares*.

Las transformaciones de similitud se usan frecuentemente para cambiar un problema de eigenvalores a una forma que sea más fácil de resolver.

Supongamos que encontramos una $\mathbf{P}$ que diagonaliza $\mathbf{A}^\ast$. Las ecuaciones a resolver se vuelven:

\begin{eqnarray*}
\begin{bmatrix}
A_{11}^\ast -\lambda & 0 & \cdots & 0 \\
0 & A_{22}^\ast-\lambda & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & A_{nn}^\ast-\lambda
\end{bmatrix} \begin{bmatrix}
x_1^\ast \\
x_2^\ast \\
\vdots \\
x_n^\ast \end{bmatrix} = \begin{bmatrix}
0 \\
0 \\
\vdots \\
0
\end{bmatrix}
\end{eqnarray*}

Los eigenvectores de $\mathbf{A}$ son:

\begin{equation}
\mathbf{X} = \mathbf{P} \mathbf{X}^\ast = \mathbf{P} \mathbf{I} = \mathbf{P}.
\end{equation}

Por lo tanto, si $\mathbf{P}$ que diagonaliza $\mathbf{A}^\ast$:

1. La matríz de transformación de similitud $\mathbf{P}$ contiene los eigenvectores de $\mathbf{A}$. 
2. Los términos de la diagonal de $\mathbf{A}^\ast$ son los eigenvalores de $\mathbf{A}$.
	


## Rotación de Jacobi


Una transformación de similitud especial es el plano de rotación

\begin{equation}
\mathbf{x} = \mathbf{R}\mathbf{x}^\ast \label{eq:eigen7}
\end{equation}

donde la **matríz de rotación de Jacobi** es

\begin{eqnarray}
	\mathbf{R} = 
	\begin{bmatrix}
	1 & 0 & \cdots & 0 & 0 & 0 & \cdots & 0 & 0 & 0  \\
	0 & 1 & \cdots & 0 & 0 & 0 & \cdots & 0 & 0 & 0  \\
	\vdots & \vdots & \vdots & \vdots &\vdots &\vdots &\vdots &\vdots &\vdots &\vdots \\
	0 & 0 & \cdots & {\color{red}c} & 0 & 0 & \cdots & {\color{red}s} & 0 & 0  \\
	0 & 0 & \cdots & 0 & 1 & 0 & \cdots & 0 & 0 & 0  \\
	0 & 0 & \cdots & 0 & 0 & 1 & \cdots & 0 & 0 & 0  \\
	0 & 0 & \cdots & {\color{red} -s} & 0 & 0 & \cdots & {\color{red} c} & 0 & 0  \\
	\vdots & \vdots & \vdots & \vdots &\vdots &\vdots &\vdots &\vdots &\vdots &\vdots \\		
	0 & 0 & \cdots & 0 & 0 & 0 & \cdots & 0 & 1 & 0  \\
	0 & 0 & \cdots & 0 & 0 & 0 & \cdots & 0 & 0 & 1  \end{bmatrix}
	\end{eqnarray}
    
	
Noten que $\mathbf{R}$ es la matríz identidad modificada con los términos ${\color{red}c} = \cos \theta$ y ${\color{red}s} = \sin \theta$ que aparecen en las intersecciones de las columnas/renglones $k$ y $\ell$, donde $\theta$ es el ángulo de rotación.
    
La matríz de rotación es ortogonal, por lo que

\begin{equation}
\mathbf{R}^{-1} = \mathbf{R}^{T}. \label{eq:eigen8}
\end{equation}

Una consecuencia de ortogonalidad es que la transformación de similitud tiene la característica escencial de una rotación: preserva la magnitud del vector, es decir $|\mathbf{x}| = |\mathbf{x}^\ast|$.

Entonces la transformación de similitud correspondiente al plano de rotación es:

\begin{equation}
\mathbf{A}^\ast = \mathbf{R}^{-1}\mathbf{A}\mathbf{R} =  \mathbf{R}^{T} \mathbf{A} \mathbf{R}.\label{eq:eigen9}
\end{equation}
	
Por lo tanto, la matríz $\mathbf{A}^\ast$:

1. Tiene los mismos eigenvalores que la matríz original $\mathbf{A}$,
2. Gracias a la ortogonalidad de $\mathbf{R}$, $\mathbf{A}^\ast$ es simétrica.

De hecho, la transformación cambia solo los renglones/columnas $k$ y $\ell$ de $\mathbf{A}$ de manera que

\begin{eqnarray}
\label{eq:eigen13}
A_{kk}^\ast &=& c^2A_{kk} + s^2A_{\ell\ell} - 2csA_{k\ell} \nonumber \\
A_{\ell\ell}^\ast &=& c^2A_{\ell\ell} + s^2A_{kk} + 2csA_{k\ell} \nonumber \\
A_{k\ell}^\ast & = & A_{\ell k}^\ast = (c^2-s^2)A_{k\ell} + cs(A_{kk} - A_{\ell\ell}) \\
A_{ki}^\ast & = & A_{ik}^\ast = cA_{ki} - sA_{\ell i}, i\neq k, i\neq\ell \nonumber \\
A_{\ell i}^\ast & = & A_{i \ell}^\ast = cA_{\ell i} + sA_{ki}, i\neq k, i\neq\ell \nonumber
\end{eqnarray}

## Diagonalización de Jacobi


El ángulo $\theta$ en la matríz de rotación de Jacobi puede escogerse para que $ A_{k\ell}^\ast = A_{\ell k}^\ast = 0$. 

De aquí surge la idea: ¿Porqué no diagonalizamos $\mathbf{A}$, iterando a lo largo de todos los términos fuera de la diagonal y los hacemos nulos, uno por uno? Esto es lo que hace el **método de Jacobi.** 

Sólo que hay un problema: la transformación que nulifica términos fuera de la diagonal, tambien deshace (des-nulifica) algunos de los ceros que ya habíamos logrado. 

Afortunadamente, los términos que aparecen fuera de la diagonal, son más pequeños que los que teníamos antes.

## Método de Jacobi para problemas de eigenvalores


Entonces el método de Jacobi, es un método iterativo que aplica de manera repetitiva las rotaciones de Jacobi hasta que poco a poco los términos fuera de la diagonal se van *desvaneciendo*. 

Al final, la matríz de transformación $\mathbf{P}$ es la acumulación de rotaciones individuales

\begin{equation}
\mathbf{P} = \mathbf{R}_1\cdot\mathbf{R}_2\cdot\mathbf{R}_3\cdots
\label{eq:eigen14}
\end{equation}

Las columnas de $\mathbf{P}$ son los eigenvectores de $\mathbf{A}$ y los elementos de la diagonal de $\mathbf{A}^\ast =  \mathbf{P}^{T} \mathbf{A} \mathbf{P}$, son los eigenvalores.

## Rotación de Jacobi

Tenemos que si $\mathbf{A}^\ast_{k \ell} = 0$ entonces;
	
\begin{equation}
\label{eq:eigen13a}
(c^2-s^2)A_{k \ell}+cs(A_{k k}-A_{\ell \ell})=0
\end{equation}
	
Si $\phi = \cot 2\theta$ y $t=\tan\theta$, entonce:
	
\begin{equation}
\phi=\cot 2\theta = \frac{A_{kk}-A_{\ell \ell}}{2 A_{k \ell}}
\label{eq:eigen15}	
\end{equation}
	
para valores muy grandes de $\phi$ y utilizando la identidad trigonométrica $\tan\theta=\sin\theta/\cos\theta=\sqrt{1-\cos^2 \theta}/\cos \theta$ tenemos que:
	
\begin{equation}
t=\frac{1}{2\phi}, ~~~~ c=\frac{1}{\sqrt{1 + t^2}}, ~~~~ s=ct
\label{eq:eigen16}	
\end{equation}
	
por lo que podemos escribir:
	
\begin{equation}
A_{\ell \ell}=A_{k k}+A_{k \ell}\frac{c^2 -s^2}{cs}
\label{eq:eigen13c}
\end{equation}
	
que simplifica las ecuaciones.

\begin{eqnarray}
\label{eq:eigen18}
A_{kk}^\ast &=& A_{kk} - tA_{k\ell} \nonumber \\
A_{\ell\ell}^\ast &=& A_{\ell\ell} + tA_{k\ell} \nonumber \\
A_{k\ell}^\ast & = & A_{\ell k}^\ast = 0 \\
A_{ki}^\ast & = & A_{ik}^\ast = A_{ki} - s(A_{\ell i} + \tau A_{k i}), i\neq k, i\neq\ell \nonumber \\
A_{\ell i}^\ast & = & A_{i \ell}^\ast = A_{\ell i} + s(A_{k i} - \tau A_{\ell i}), i\neq k, i\neq\ell \nonumber
\end{eqnarray}

donde $\tau$ se define como:

\begin{equation}
\tau = \frac{s}{1+c}
\label{eq:eigen19}
\end{equation}

La matriz inicial de transformación $P=1$ y en cada rotacion cambia a $P^\ast = P R$, donde solo se ven afectados las columnas $k$ y $\ell$

\begin{eqnarray}
\label{eq:eigen20}
P_{ik}^\ast & = & P_{i k} - s(P_{i \ell} + \tau P_{i k}) \nonumber \\
P_{i \ell}^\ast & = & P_{i \ell} + s(P_{i k} - \tau P_{i \ell}) \nonumber
\end{eqnarray}

Para reducir el tiempo de ejecución del algoritmo es recomendable intercambiar los renglones y las columnas para eliminar los elementos con un valor por encima del umbral definido. Si sumamos los elementos principales de la diagonal de la matriz $A$

\begin{equation}
S = \sum_{i=1}^{n-1} \sum_{j=i+1}^{n}|A_{ij}|
\label{eq:eigen20a}
\end{equation}
	
si la magnitud $S$ de los  $n(n-1)/2$ elementos fuera de la diagonal es $2S/n(n-1)$, entonces el umbral $\mu$ es:

\begin{equation}
\mu = \frac{0.5 S}{n(n-1)}
\label{eq:eigen20b}
\end{equation}
	
que representa el 25$\%$ de la magnitud de estos elementos.


Entonces el **Método de Jacobi** para problemas de eigenvalores, consiste en: 

1. Calcular el umbral
2. Intercambiar los renglones y las columnas de la matriz $A$, si $|A_{ij}|\geq \mu$
3. Calcular $\phi, t, s, c$ y $\tau$ 
4. Calcular los elementos de la matriz $A$
5. Calcular la transformación de la matriz $P$


# Algoritmo de Jacobi

In [None]:
## Modulo jacobi
'''lam,x = jacobi(a,tol = 1.0e-8).
En este modulo se resuelve el problema de eigenvalores [a]{x} = lam{x}
usando el metodo de Jacobi. La funcion regresa los eigenvalores en el
vector {lam} y los eigenvectores como columnas de la matriz [x].
'''

import numpy as np
import math


def jacobi(a,tol = 1.0e-8): #el usuario da la matriz a[i,j] y la tolerancia
  
  def threshold(a): #funcion que calcula los umbrales
    sum = 0.0
    for i in range(n-1):
      for j in range (i+1,n):
        sum = sum + abs(a[i,j])
    return 0.5*sum/n/(n-1)
    
  def rotate(a,p,k,l): # funcion que rota hasta lograr a[k,l]=0
    aDiff = a[l,l] - a[k,k]
    if abs(a[k,l]) < abs(aDiff)*1.0e-36: t = a[k,l]/aDiff
    else:
      phi = aDiff/(2.0*a[k,l])
      t = 1.0/(abs(phi) + math.sqrt(phi**2 + 1.0))
      if phi < 0.0: t = -t
    c = 1.0/math.sqrt(t**2 + 1.0); s = t*c
    tau = s/(1.0 + c)
    temp = a[k,l]
    a[k,l] = 0.0
    a[k,k] = a[k,k] - t*temp
    a[l,l] = a[l,l] + t*temp
    for i in range(k): # Caso i < k
        temp = a[i,k]
        a[i,k] = temp - s*(a[i,l] + tau*temp)
        a[i,l] = a[i,l] + s*(temp - tau*a[i,l])
    for i in range(k+1,l): # Caso k < i < l
        temp = a[k,i]
        a[k,i] = temp - s*(a[i,l] + tau*a[k,i])
        a[i,l] = a[i,l] + s*(temp - tau*a[i,l])
    for i in range(l+1,n): # Caso i > l
        temp = a[k,i]
        a[k,i] = temp - s*(a[l,i] + tau*temp)
        a[l,i] = a[l,i] + s*(temp - tau*a[l,i])
    for i in range(n): # Actualiza la matriz de transformacion
        temp = p[i,k]
        p[i,k] = temp - s*(p[i,l] + tau*p[i,k])
        p[i,l] = p[i,l] + s*(temp - tau*p[i,l])
                
  n = len(a)
  p = np.identity(n,float)
  for k in range(20):
    mu = threshold(a) # Calcula un nuevo umbral
    for i in range(n-1): # Barrido de la matriz
      for j in range(i+1,n):
          if abs(a[i,j]) >= mu: #criterio de cero
            rotate(a,p,i,j) # rotacion iterativa por toda la matriz
    if mu <= tol: return np.diagonal(a),p #da los resultados con criterio tol
  print('El metodod de Jacobi no converge')      

## modulo error
'''
err(string). Imprime 'texto' y termina el programa.
'''

def err(string):
  print(string)
  input('Press return to exit')
  sys.exit()
  
## modulo swap - ya lo habiamos usado!
def swapRows(v,i,j):
  if len(v.shape) == 1:
      v[i],v[j] = v[j],v[i]
  else:
      v[[i,j],:] = v[[j,i],:]

def swapCols(v,i,j):
      v[:,[i,j]] = v[:,[j,i]]


## modulo ordenJacobi
'''ordenJacobi(lam,x).
Arregla los eigenvalores {lam} y eigenvectores [x]
en orden ascendente de eigenvalores.
'''

def sortJacobi(lam,x):
  n = len(lam)
  for i in range(n-1):
    index = i
    val = lam[i]
    for j in range(i+1,n):
      if lam[j] < val:
        index = j
        val = lam[j]
      if index != i:
        swapRows(lam,i,index)
        swapRows(lam,i,index)
        swapCols(x,i,index)

## modulo choleski - ya lo habiamos usado!

def choleski(a):
    n = len(a)
    for k in range(n):
        try:
            a[k,k] = math.sqrt(a[k,k] - np.dot(a[k,0:k],a[k,0:k]))
        except ValueError:
            error.err('Matrix is not positive definite')
        for i in range(k+1,n):
            a[i,k] = (a[i,k] - np.dot(a[i,0:k],a[k,0:k]))/a[k,k]
    for k in range(1,n): a[0:k,k] = 0.0
    return a

def choleskiSol(L,b):
    n = len(b)
  # Solution of [L]{y} = {b}  
    for k in range(n):
        b[k] = (b[k] - np.dot(L[k,0:k],b[0:k]))/L[k,k]
  # Solution of [L_transpose]{x} = {y}      
    for k in range(n-1,-1,-1):
        b[k] = (b[k] - np.dot(L[k+1:n,k],b[k+1:n]))/L[k,k]
    return b

def stdForm(a,b):

    def invert(L): # Inverts lower triangular matrix L
        n = len(L)
        for j in range(n-1):
            L[j,j] = 1.0/L[j,j]
            for i in range(j+1,n):
                L[i,j] = -np.dot(L[i,j:i],L[j:i,j])/L[i,i]
        L[n-1,n-1] = 1.0/L[n-1,n-1]

    n = len(a)
    L = choleski(b)          
    invert(L)
    h = np.dot(b,np.inner(a,L))
    return h,np.transpose(L)

# Ejemplo 1: 

Resuelve el problema de eigenvalores para el siguente circuito. Determina la frecuencia y la amplitud de la corriente (Ejemplo 9.3 NMIP).

![DIV](fig/eje1.jpg)


In [None]:
A = np.array([[1/3,-1/3,0.0], [1/3, 4/3, -1.0], [ 0.0, -1.0, 2.0]])
B = np.array([[1.0, 0.0, 0.0], [0.0, 1.0, 0.0],[0.0, 0.0, 2.0]])
H,T = stdForm(A,B) # Transform into std. form
lam,Z = jacobi(H) # Z = eigenvecs. of H
X = np.dot(T,Z) # Eigenvecs. of original problem
#sortJacobi(lam,X) # Arrange in ascending order of eigenvecs.
for i in range(3): # Normalize eigenvecs.
    X[:,i] = X[:,i]/math.sqrt(np.dot(X[:,i],X[:,i]))
print('Eigenvalues:\n',lam)
print('Eigenvectors:\n',X)