<p><img alt="DataOwl" width=150 src="http://gwsolutions.cl/Images/dataowl.png", align="left", hspace=0, vspace=5></p>

<h1 align="center">Álgebra Lineal</h1>

<h4 align="center">Ecuaciones lineales de varias variables y su resolución</h4>
<pre><div align="center"> La idea de este notebook es que sirva para iniciarse en conceptos
básicos del Álgebra Lineal y sus métodos de resolución en el
contexto de sistemas de ecuaciones lineales.</div>

## Álgebra Lineal

## 4. Transformaciones lineales

En matemáticas, una función que toma valores en un espacio vectorial real $U$ y devuelve valores en otro espacio vectorial real $V$, $T:U\longrightarrow V$, se dice lineal si

$$\begin{matrix}
(\forall\ \alpha\in\mathbb{R},\ \vec{u}\in U) & T(\alpha\vec{u})=\alpha T(\vec{u})\\
(\forall\ \vec{u},\vec{v}\in U) & T(\vec{u}+\vec{v})=T(\vec{u})+T(\vec{v})
\end{matrix}$$

En el caso de que $U=\mathbb{R}^n$ y $V=\mathbb{R}^m$, las transformaciones lineales son simples sumas y ponderaciones de las componentes de los vectores considerados variables. Por ejemplo, sería una transformación lineal la función $T:\mathbb{R}^3\longrightarrow\mathbb{R}^2$ dada por

$$T\begin{pmatrix}x\\y\\z\end{pmatrix}= \begin{pmatrix}x-y+2z\\z-x\end{pmatrix}$$

Toda transformación lineal entre espacios reales puede representarse como un producto matricial. En el ejemplo anterior, la transformación está dada mediante el producto

$$T\begin{pmatrix}x\\y\\z\end{pmatrix}=\begin{bmatrix}1&-1&2\\-1&0&1\end{bmatrix}\begin{pmatrix}x\\y\\z\end{pmatrix}$$

Notar que la matriz de este ejemplo tiene dimensiones $2\times3$. En general, la matriz resultante tendrá dimensiones $m\times n$. A esta matriz se le llama **matriz representante**, y es sumamente útil conocerla, pues permite condensar bastante información de la transformación en cuestión. Por ejemplo, permite calcular composiciones de transformaciones lineales $T_1:\mathbb{R}^n\longrightarrow\mathbb{R}^m$ y $T_2:\mathbb{R}^m\longrightarrow\mathbb{R}^p$, dada por una función $T_2\circ T_1:\mathbb{R}^n\longrightarrow\mathbb{R}^p$, de forma tal que, si $M_1$ es la matriz representante de $T_1$ y $M_2$ es la matriz representante de $T_2$, entonces la matriz representante de $T_2\circ T_1$ no es más que $M_2\cdot M_1$, el producto usual de matrices.

Lo que nos interesará es analizar algunos resultados válidos para transformaciones lineales en que $U=V=\mathbb{R}^n$, es decir, tales que su matriz representante es una matriz cuadrada de $n\times n$. Para este caso, una transformación lineal siempre representará una dilatación y/o una rotación de un vector. Podemos ver un par de ejemplos de esto.

In [None]:
# Importando las librerías
import matplotlib.colors as mcolors
import matplotlib.pyplot as plt
import numpy as np

In [None]:
def T1(x, y):
    M = np.asarray([[1.5, 0], [0, 1.5]])
    u = np.asarray([[x], [y]])
    return M.dot(u)

def T2(x, y):
    M = np.asarray([[np.sqrt(3) / 2, -0.5], [0.5, np.sqrt(3) / 2]])
    u = np.asarray([[x], [y]])
    return M.dot(u)

def T3(x, y):
    M = np.asarray([[2, 1], [1, -1]])
    u = np.asarray([[x], [y]])
    return M.dot(u)

In [None]:
X = np.zeros((8, 1))
Y = np.zeros((8, 1))
th = np.arange(0, 2 * np.pi, np.pi / 4)

U = np.cos(th)
V = np.sin(th)

T1U = []
T1V = []
T2U = []
T2V = []
T3U = []
T3V = []

for i in range(len(U)):
    u = U[i]
    v = V[i]
    T1uv = T1(u, v)
    T1U.append(float(T1uv[0]))
    T1V.append(float(T1uv[1]))
    T2uv = T2(u, v)
    T2U.append(float(T2uv[0]))
    T2V.append(float(T2uv[1]))
    T3uv = T3(u, v)
    T3U.append(float(T3uv[0]))
    T3V.append(float(T3uv[1]))

T1U = np.asarray(T1U)
T1V = np.asarray(T1V)

T2U = np.asarray(T2U)
T2V = np.asarray(T2V)

T3U = np.asarray(T3U)
T3V = np.asarray(T3V)


In [None]:
fig, ax = plt.subplots(1, 3, figsize=(18,4))

ax[0].axhline(xmin=-10, xmax=10, c='lightgrey', zorder=1)
ax[0].axvline(ymin=-10, ymax=10, c='lightgrey', zorder=2)
ax[0].quiver(X, Y, U, V, color='blue', scale=6, zorder=3, label='Entrada')
ax[0].quiver(X, Y, T1U, T1V, color='red', scale=6, zorder=4, label='Salida')
ax[0].legend()

ax[0].set_xlim((-3, 3))
ax[0].set_ylim((-3, 3))
ax[0].set_xlabel('x')
ax[0].set_ylabel('y')
ax[0].set_title('$T_1(x,y)$')

ax[1].axhline(xmin=-10, xmax=10, c='lightgrey', zorder=1)
ax[1].axvline(ymin=-10, ymax=10, c='lightgrey', zorder=2)
ax[1].quiver(X, Y, U, V, color='blue', scale=6, zorder=3, label='Entrada')
ax[1].quiver(X, Y, T2U, T2V, color='red', scale=6, zorder=4, label='Salida')
ax[1].legend()

ax[1].set_xlim((-3, 3))
ax[1].set_ylim((-3, 3))
ax[1].set_xlabel('x')
ax[1].set_ylabel('y')
ax[1].set_title('$T_2(x,y)$')

ax[2].axhline(xmin=-10, xmax=10, c='lightgrey', zorder=1)
ax[2].axvline(ymin=-10, ymax=10, c='lightgrey', zorder=2)
ax[2].quiver(X, Y, U, V, color='blue', scale=6, zorder=3, label='Entrada')
ax[2].quiver(X, Y, T3U, T3V, color='red', scale=6, zorder=4, label='Salida')
ax[2].legend()

ax[2].set_xlim((-3, 3))
ax[2].set_ylim((-3, 3))
ax[2].set_xlabel('x')
ax[2].set_ylabel('y')
ax[2].set_title('$T_3(x,y)$')

plt.show()

Para ciertas transformaciones lineales, hay vectores que no sufrirán rotación, es decir, conservarán la dirección de su "flecha" (aunque sí pueden presentar dilatación). En ese caso, se dice que tal vector es un **vector propio**, y debe satisfacer la siguiente ecuación:

$$M\vec{u}=\lambda\vec{u}$$

donde $\lambda\in\mathbb{R}$ es un escalar que da cuenta de la dilatación que sufre $\vec{u}$ en la transformación. Dicho valor $\lambda$ es llamado **valor propio** asociado al vector $\vec{u}$. En la práctica, antes de poder determinar un vector propio, es necesario conocer el valor propio, lo cual equivale a resolver la ecuación

$$M\vec{u}=\lambda\vec{u}\ \Longrightarrow\ M\vec{u}-\lambda\vec{u}=\vec{0}\ \Longrightarrow\ M\vec{u}-\lambda\cdot I_n\vec{u}=\vec{0} \Longrightarrow\ (M-\lambda\cdot I_n)\vec{u}=\vec{0}$$

donde $I_n$ representa la matriz identidad de dimensiones $n\times n$. La ecuación anterior tiene dos soluciones posibles: o bien $\vec{u}=\vec{0}$ (lo cual no reviste ningún resultado interesante) o bien $M-\lambda\cdot I_n$ no es invertible, es decir, su determinante es cero. Este determinante define el **polinomio característico** de la matriz, $p(\lambda)$, y los valores propios son las raíces de dicho polinomio, es decir, los valores donde $p(\lambda)=0$. Por lo tanto, una matriz de dimensiones $n\times n$ tiene $n$ valores propios (algunos pueden repetirse o ser números complejos).

Numpy tiene un método integrado para calcular tanto los valores como los vectores propios de una matriz. Una vez que estos son calculados, los vectores propios pueden servir de ejes coordenados para un problema dado, ya que su dirección no cambia con la transformación lineal.

In [None]:
from numpy import linalg as la

In [None]:
M = np.asarray([[1,2,3],[3,2,1],[1,0,-1]])

valsprop, vecsprop = la.eig(M) # los vectores propios son las columnas de vecsprop, no las filas

print(valsprop)
print(vecsprop)

In [None]:
print(M.dot(vecsprop[:,0]))          # M * u
print(valsprop[0] * vecsprop[:,0])   # lambda * u

In [None]:
M3 = np.asarray([[2, 1], [1, -1]])

valsprop3, vecsprop3 = la.eig(M3) # los vectores propios son las columnas de vecsprop, no las filas

print(valsprop3)
print(vecsprop3)

In [None]:
print(M3.dot(vecsprop3[:,0]))          # M * u
print(valsprop3[0] * vecsprop3[:,0])   # lambda * u

In [None]:
X2, Y2 = np.zeros((2, 1))  

vec1 = vecsprop3[:,0]  
vec2 = vecsprop3[:,1]

Uprop = np.asarray([vec1[0], vec2[0]])
Vprop = np.asarray([vec1[1], vec2[1]])

TUprop = np.asarray([valsprop3[0] * vec1[0], valsprop3[1] * vec2[0]])
TVprop = np.asarray([valsprop3[0] * vec1[1], valsprop3[1] * vec2[1]])

fig, ax = plt.subplots()

ax.axhline(xmin=-10, xmax=10, c='lightgrey', zorder=1)
ax.axvline(ymin=-10, ymax=10, c='lightgrey', zorder=2)
ax.quiver(X, Y, U, V, color='blue', scale=6, zorder=3, label='Entrada')
ax.quiver(X, Y, T3U, T3V, color='red', scale=6, zorder=4, label='Salida')
ax.quiver(X2, Y2, Uprop, Vprop, color='green', scale=6, zorder=5, label='Vec. propio')
ax.quiver(X2, Y2, TUprop, TVprop, color='lightgreen', scale=6, zorder=5, label='T(vec. propio)')
ax.legend(loc='upper left')

ax.set_xlim((-3, 3))
ax.set_ylim((-3, 3))
ax.set_xlabel('x')
ax.set_ylabel('y')
ax.set_title('$T_3(x,y)$ y sus vectores propios')

plt.show()

Conocer los valores y vectores propios de una matriz (y, por lo tanto, de una transformación lineal), nos permite resolver algunos problemas relacionados con sistemas dinámicos, procesos de Markov, tratamiento de imágenes, etc. Esto es debido a que la matriz $M$ se podrá descomponer como

$$M=PDP^{-1}$$

donde $P$ es la matriz cuyas columnas son los vectores propios de $M$ y $D$ es la matriz en que la diagonal contiene los valores propios de $M$, en el orden de aparición en $P$. Por ejemplo:

In [None]:
P = vecsprop3
Pinv = la.inv(P)
D = np.diag(valsprop3)

print('P =\n',P)
print('\nD =\n',D)
print('\nPinv =\n',Pinv)
print('\nPDPinv =\n',P.dot(D.dot(Pinv)))
print('\nM3 =\n',M3)

El proceso de identificar las matrices $P$ y $D$ se denomina **diagonalización**. Las matrices en que es posible obtener esta descomposición se denominan **diagonalizables**.

Las matrices diagonalizables son ideales, en el sentido de que las potencias son muy sencillas de calcular (o, equivalentemente, la composición de la transformación lineal consigo misma):

$$\begin{matrix}
M^n &=& M\cdot M\cdot\ldots\cdot M\\
 &=& (PDP^{-1})\cdot(PDP^{-1})\cdot\ldots\cdot(PDP^{-1})\\
 &=& PD(P^{-1}P)D(P^{-1}P)D\cdot\ldots\cdot D(P^{-1}P)DP^{-1}\\
 &=& PDI_nDI_nD\cdot\ldots\cdot DI_nDP^{-1}\\
 &=& PD\cdot D\cdot D\ldots\cdot D\cdot DP^{-1}\\
 &=& PD^{n}P^{-1}
\end{matrix}$$

donde $D^n$ es, simplemente, la matriz en cuya diagonal están las potencias $n$ de los valores propios.

Gran parte de las matrices de interés son diagonalizables. Por ejemplo, todas las matrices invertibles son diagonalizables, al igual que las matrices simétricas. Incluso matrices no invertibles. Sin embargo, no siempre se puede diagonalizar, ya que no siempre se puede tener una matriz $P$ invertible que satisfaga lo anterior. Sin embargo, siempre se puede obtener una generalización de lo anterior, llamada **forma normal de Jordan**, la cual no abordaremos en el curso.

Una transformación diagonalizable posee dos grandes vertientes de estudio: el análisis de componentes principales y la estabilidad de sistemas dinámicos.

Las componentes principales oermiten conocer las direcciones en que el efecto de la transformación es máximo unidireccionalmente, lo que permite definir un sistema coordenado con base en esas direcciones. Esencialmente, es equivalente a determinar los vectores propios.

La estabilidad de sistemas dinámicos es mucho más extensa en estudio. Aquí veremos un ejemplo de sistema sencillo, dado por una ecuación de diferencias discreta. En un futuro veremos una versión continua (un sistema de ecuaciones diferenciales).

Una ecuación de diferencias discreta es una sucesión que se define por recurrencia:

$$x_n=a_1x_{n-1}+a_2x_{n-2}+\ldots+a_kx_{n-k}$$

La ecuación anterior se denomina sistema lineal homogéneo de orden $k$, y para conocer su evolución es necesario conocer los coeficientes $\{a_j\}_{j=1}^k$ y sus $k$ primeros valores iniciales, $x_0,\ x_1,\ldots,\ x_{k-1}$. Para esquematizar mejor la forma de abordar estos problemas, consideraremos un sistema lineal homogéneo de orden $3$:

$$x_n=a_1x_{n-1}+a_2x_{n-2}+a_3x_{n-3}$$

Definimos términos auxiliares de la siguiente forma:

$$\begin{matrix}
x_n &=& a_1x_{n-1}+a_2x_{n-2}+a_3x_{n-3}\\
y_n &=& x_{n-1}\\
z_n &=& x_{n-2}
\end{matrix}\quad \Longrightarrow\quad \begin{matrix}
x_n &=& a_1x_{n-1}+a_2y_{n-1}+a_3z_{n-1}\\
y_n &=& x_{n-1}\\
z_n &=& y_{n-1}
\end{matrix}$$
<br>
<br>
$$\Longrightarrow\ \begin{pmatrix}x_n\\y_n\\z_n\end{pmatrix}=\begin{bmatrix}a_1&a_2&a_3\\1&0&0\\0&1&0\end{bmatrix}\begin{pmatrix}x_{n-1}\\y_{n-1}\\z_{n-1}\end{pmatrix}$$
<br>
<br>
$$\Longrightarrow\ \vec{x}_n=M\cdot\vec{x}_{n-1}$$

Por lo tanto, tendremos que el sistema lineal homogéneo es equivalente a una ecuación matricial, para la cual su valor inicial será $\vec{x}_0=(x_0,x_1,x_2)$. Esto **siempre** puede hacerse, para cualquier orden.

Para el ejemplo anterior, podemos ver su evolución en el tiempo notando que

$$\begin{matrix}
\vec{x}_1 &=& M\cdot\vec{x}_0\\
\vec{x}_2 &=& M\cdot\vec{x}_1 = M\cdot(M\cdot\vec{x}_0) = M^2\cdot\vec{x}_0\\
 &\vdots& \\
\vec{x}_n &=& M^n\cdot\vec{x}_0
\end{matrix}$$

Es claro que, si la matriz es diagonalizable, el sistema puede estudiarse de forma muy sencilla puesto que, en ese caso,

$$\vec{x}_n = PD^nP^{-1}\cdot\vec{x}_0$$

Veamos algunos ejemplos:

**i)** $x_n=x_{n-1}+x_{n-2}\qquad$, $x_0=x_1=1$
<br>
<br>
**ii)** $x_n=x_{n-1}-\frac{1}{2}x_{n-2}+\frac{1}{4}x_{n-3}\qquad$, $x_0=x_1=x_2=1$


In [None]:
Mi = np.array([[1, 1], [1, 0]])

Mii = np.array([[1, -0.5, 0.25], [1, 0, 0], [0, 1, 0]])

def sisti(n):
    x0 = np.array([[1], [1]])
    Mn = la.matrix_power(Mi, n)
    xnyn = Mn.dot(x0)
    return xnyn[0]

def sistii(n):
    x0 =  np.array([[1], [1], [1]])
    Mn = la.matrix_power(Mii, n)
    xnynzn = Mn.dot(x0)
    return xnynzn[0]

In [None]:
n = np.arange(20)
vals = []
for i in n:
    vals.append(sisti(i))
plt.plot(n, vals,'.b')
plt.show()

In [None]:
n = np.arange(200)
vals = []
for i in n:
    vals.append(sistii(i))
plt.plot(n, vals,'.b')
plt.show()

En general, se dice que un sistema lineal homogéneo es estable si todos sus valores propios tienen valor absoluto menor que 1. Si es así, hay un valor $\bar{x}$ en que el sistema alcanza estabilidad o convergencia. En caso de tener alguno mayor, el comportamiento es explosivo. Si se da el caso con igualdad, el sistema es contingente, lo que significa que el comportamiento puede ser oscilatorio, convergente en algún sentido o divergente.

In [None]:
vali, veci = la.eig(Mi)
valii, vecii = la.eig(Mii)

print(np.abs(vali))
print(np.abs(valii))

## Ejercicios

**1.-** Utilice este Notebook como referencia para crear flechas tales que se forme la figura de un cuadrado en el primer cuadrante del plano cartesiano. Aplique a estas flechas las transformaciones definidas arriba ($T_1,\ T_2,\ T_3$) y vea qué figuras resultan. Puede proponer sus propias transformaciones.

Como desafío extra, puede definir una transformación lineal de tres dimensiones, e investigar cómo graficar en 3D utilizando matplotlib (u otra librería que se lo permita).

**2.-** Sea $M$ una matriz diagonalizable. Se sabe entonces que se puede definir la exponencial de una matriz, dada por

$$e^M=\sum_{k=1}^{\infty}\frac{M^k}{k!}$$

Muestre que el resultado está dado por 

$$e^M=Pe^DP^{-1}$$

donde $e^{D}$ es la matriz cuya diagonal tiene la exponencial de los valores propios de $M$. Defina una función que aproxime la exponencial de una matriz (intente hacerla lo más eficiente posible), y compárela con la matriz exponencial que provee la librería Numpy (averigüe cómo se calcula).

**3.-** Considere los siguientes sistemas dinámicos y estudie su estabilidad (es decir, ver si su comportamiento asintótico es explosivo o convergente):

**a)** $x_n=2x_{n-1}+\frac{1}{2}x_{n-2}\qquad$, $x_0=2,\ x_1=1$

**b)** $x_n=x_{n-1}-\frac{1}{2}x_{n-2}\qquad$, $x_0=2,\ x_1=1$

**c)** $x_n=x_{n-1}-x_{n-2}+\alpha x_{n-3}\qquad$, $x_0=2,\ x_1=1,\ x_2=1$

En este último ejercicio, varíe el valor de $\alpha$ entre $0.5$ y $1.5$, y deduzca cómo se comporta el sistema en función de este parámetro.

**4.-** Considere ahora un sistema lineal no-homogéneo de la forma

$$x_n=a_1x_{n-1}+a_2x_{n-2}+a_3x_{n-3}+b$$

Como ejemplo, en econometría, esto permite incluir factores no predichos en un modelo, como el cambio de preferencias en un grupo de compradores (variable exógena). Deduzca cómo sería su formulación matricial, y si hay un valor de estabilidad $\bar{x}$, qué valor debería tener éste.