# CLASE 1.3: Descomposiciones matriciales

## Introducción.
En las secciones anteriores estudiamos algunas formas de manipular y obtener ciertas métricas para los vectores, proyecciones de esos vectores con respecto a determinados subespacios vectoriales y transformaciones lineales. Las aplicaciones y transformaciones que permiten operar con vectores pueden ser convenientemente descritas por medio de matrices. Además, la mayoría de los conjuntos de datos *bien comportados* que podemos encontrar en el mundo real vienen especificados en estructuras que pueden ser arregladas y/o representadas igualmente por medio de matrices. Por ejemplo, las filas de estos conjuntos de datos suelen representar **registros** u **observaciones** (como personas, fechas, unidades, entre otras) y las columnas suelen representar diferentes **atributos** para cada fila (como edad, altura, propiedades extensivas de algún fenómeno o el valor de alguna variable en el tiempo). En esta sección, presentaremos tres aspectos relativos a las matrices: Cómo **resumirlas**, como **descomponerlas** y como utilizar tales descomposiciones para construir **aproximaciones** para determinadas matrices.

A diferencia de la sección anterior, en ésta volveremos a escribir algo de código, a fin de corresponder algunos conceptos esenciales con librerías tales como <font color='purple'>Numpy</font> o <font color='purple'>Scipy</font>. No será demasiado código, pero sí el suficiente para darle algo de sentido práctico a los conceptos que desarrollaremos desde la perspectiva computacional.

## Determinantes.

### Un interludio previo.
El concepto de determinante corresponde a otro de los elementos más importantes del álgebra lineal. Corresponde a un objeto matemático que es importante en el análisis y solución de sistemas de ecuaciones lineales (los mismos que vimos en el inicio de la [clase 1.1](https://github.com/rquezadac/udd_data_science_lectures/blob/main/PARTE%20I%20-%20Fundamentos%20matem%C3%A1ticos%20elementales/clase_1_1.ipynb)) y que puede expresarse por medio de una función, denominada como **función determinante**, y que permite aplicar cualquier matriz cuadrada de orden $n$ en el cuerpo $\mathbb{K}$ donde sus elementos están definidos. Dicha función, para una matriz $\mathbf{A}\in \mathbb{K}^{n\times n}$, se denota como $\det(\mathbf{A})=|\mathbf{A}|$, y es tal que $\left| \  \cdot \  \right|  :\mathbb{K}^{n} \times \mathbb{K}^{n} \longrightarrow \mathbb{K}$, pudiéndose escribir el determinante de la matriz $\mathbf{A}$ como

$$\mathbf{A} =\left\{ a_{ij}\in \mathbb{K} \right\}  =\left( \begin{matrix}a_{11}&a_{12}&\cdots &a_{1n}\\ a_{21}&a_{22}&\cdots &a_{2n}\\ \vdots &\vdots &\ddots &\vdots \\ a_{n1}&a_{n2}&\cdots &a_{nn}\end{matrix} \right)  \in \mathbb{K}^{n\times n} \wedge \det \left( \mathbf{A} \right)  =\left| \begin{matrix}a_{11}&a_{12}&\cdots &a_{1n}\\ a_{21}&a_{22}&\cdots &a_{2n}\\ \vdots &\vdots &\ddots &\vdots \\ a_{n1}&a_{n2}&\cdots &a_{nn}\end{matrix} \right|  \in \mathbb{K}$$
<p style="text-align: right;">$(3.1)$</p>

**Ejemplo 3.1:** Comenzaremos a motivar el estudio de los determinantes explorando la posibilidad de que una matriz cuadrada, digamos $\mathbf{A}\in \mathbb{R}^{n\times n}$, sea **invertible**. Para los casos de menor dimensión, ya conocemos los casos que aseguran que $\mathbf{A}$ cumpla con esta condición. Por ejemplo, si $\mathbf{A}\in \mathbb{R}^{1\times 1}$ (es decir, $\mathbf{A}$ es un escalar), sabemos que $\mathbf{A}=a\ \Longrightarrow \mathbf{A}^{-1}=1/a$, lo que implica que $\mathbf{A}$ tiene una inversa siempre que $a\neq 0$. Para el caso de matrices de $2\times 2$, sabemos que la inversa $\mathbf{A}^{-1}$ cumple con la condición de que $\mathbf{A}\mathbf{A}^{-1}=\mathbf{I}_{2}$. De esta manera, podemos escribir

$$\mathbf{A} =\left( \begin{matrix}a_{11}&a_{12}\\ a_{21}&a_{22}\end{matrix} \right)  \Longrightarrow \mathbf{A} \mathbf{A}^{-1} =\mathbf{I}_{2} \Longleftrightarrow \mathbf{A}^{-1} =\frac{1}{a_{11}a_{22}-a_{12}a_{21}} \left( \begin{matrix}a_{22}&-a_{12}\\ -a_{21}&a_{11}\end{matrix} \right)$$
<p style="text-align: right;">$(3.2)$</p>

Por lo tanto, $\mathbf{A}$ es invertible si y sólo si $a_{11}a_{22}-a_{12}a_{21}\neq 0$. Para matrices de $2\times 2$, dicha cantidad corresponde al **determinante** de la matriz respectiva. De esta manera, para la matriz $\mathbf{A} =\left\{ a_{ij}\right\}  \in \mathbb{R}^{2\times 2}$, su determinante se define como

$$\det \left( \mathbf{A} \right)  =\det \left( \begin{matrix}a_{11}&a_{12}\\ a_{21}&a_{22}\end{matrix} \right)  =\left| \begin{matrix}a_{11}&a_{12}\\ a_{21}&a_{22}\end{matrix} \right|  =a_{11}a_{22}-a_{12}a_{21}$$
<p style="text-align: right;">$(3.3)$</p>
◼︎

El ejemplo (3.1) permite establecer un hecho que puede ser generalizado a conjuntos de mayor dimensión: Una matriz es invertible siempre que su determinante no sea nulo. Formalicemos este hecho mediante un teorema.

**<font color='crimson'>Teorema 3.1 – Existencia de matriz inversa:</font>** *Sea $\mathbf{A}\in \mathbb{K}^{n\times n}$ una matriz cuadrada con elementos en el cuerpo $\mathbb{K}$. Entonces $\mathbf{A}$ se dirá **invertible** o **no singular** (es decir, existe la matriz inversa $\mathbf{A}^{-1}$) si y solo si $\det(\mathbf{A})\neq 0$.*
◆

Ya disponemos de una expresión cerrada que permite calcular el determinante de cualquier matriz de dimensión $2\times 2$. Sin embargo, no es tan sencillo generalizar dicho cálculo para dimensiones superiores. Por ejemplo, para el caso de matrices de $3\times 3$, es común el cálculo de sus determinantes mediante la llamada regla de Sarrus:

$$\det \left( \begin{matrix}a_{11}&a_{12}&a_{13}\\ a_{21}&a_{22}&a_{23}\\ a_{31}&a_{32}&a_{33}\end{matrix} \right)  =a_{11}a_{22}a_{33}+a_{21}a_{32}a_{13}+a_{31}a_{12}a_{23}-a_{31}a_{22}a_{13}-a_{11}a_{32}a_{23}-a_{21}a_{12}a_{33}$$
<p style="text-align: right;">$(3.4)$</p>

Si bien, en un principio, la regla de Sarrus parece una fórmula complicada de entender, ésta no es más que un recurso mnemotécnico, ya que los triples productos involucrados en la fórmula y sus signos guardan relación con las diagonales (y subdiagonales) presentes en la matriz correspondiente, como se observa en el esquema de la Fig. (3.1)

<p style="text-align: center;"><img src="figures/fig_3_1.png" width="650"></p>
<p style="text-align: center;">Fig. (3.1): Esquema que ilustra cómo opera la regla de Sarrus</p>

Recordemos que, al resolver sistemas de ecuaciones lineales, nuestro objetivo era transformar la matriz ampliada de un sistema en una tal que sólo tuviera elementos no nulos en su región superior derecha (matriz triangular superior), aunque también es posible operar para llegar al caso opuesto, donde la matriz resultante tenga elementos no nulos en su región inferior izquierda (matriz triangular inferior). Este tipo de matrices fueron formalizadas previamente en la definición (1.7).

Para una matriz triangular, digamos $\mathbf{A}\in \mathbb{K}^{n\times n}$, definimos su determinante como

$$\det \left( \mathbf{A} \right)  =\prod^{n}_{i=1} a_{ii}$$
<p style="text-align: right;">$(3.5)$</p>

Donde $a_{ii}$ es el correspondiente elemento relativo a la diagonal principal de la matriz $\mathbf{A}$.

### Interpretación geométrica del determinante.
Si una matriz $\mathbf{A}\in \mathbb{R}^{n\times n}$ tiene elementos $a_{ij}\in \mathbb{R}$, entonces puede ser utilizada para representar dos transformaciones lineales. Una que aplica la base canónica de $\mathbb{R}^{n}$ a las filas de $\mathbf{A}$, y otra que aplica la misma base a las columnas de $\mathbf{A}$. Cualquiera sea el caso, si la matriz $\mathbf{A}$ es de $2\times 2$las imágenes de cada uno de los vectores de la base canónica de $\mathbb{R}^{2}$ forman un paralelógramo que representa la imagen del cuadrado unitario bajo la transformación lineal respectiva, y cuyos vértices se corresponden con combinaciones de los elementos de $\mathbf{A}$, como se observa en la Fig. (3.2a).

Si $\mathbf{A} =\left\{ {}a_{ij}\right\}  \in \mathbb{R}^{2\times 2}$ es la matriz que conforma los vértices del paralelógramo en la Fig. (3.2a), se tendrá que el área encerrada por el mismo será igual a $\det \left( \mathbf{A} \right)  =a_{11}a_{22}-a_{12}a_{21}$. Para mostrar este resultado, podemos considerar que los elementos de la matriz $\mathbf{A}$ corresponden a vectores que representan los vértices del paralelógramo. Si uno de los vértices es el origen del sistema de coordenadas, los vectores $\mathbf{a} =\left( a_{11},a_{12}\right)$ y $\mathbf{b} =\left( a_{21},a_{22}\right)$ serán los vértices más cercanos al origen, mientras que el vértice opuesto será igual a la suma $\mathbf{a} +\mathbf{b} =\left( a_{11}+a_{21},a_{12}+a_{22}\right)$. El área del paralelógramo puede expresarse igualmente como $\left\Vert \mathbf{a} \right\Vert  \left\Vert \mathbf{b} \right\Vert  \mathrm{sen} \left( \theta \right)$, donde $\theta$ es el ángulo formado por los vectores $\mathbf{a}$ y $\mathbf{b}$. Si consideramos la proyección ortogonal del vector $\mathbf{a}$ sobre $\mathbf{b}$ (que llamamos $\pi_{\mathbf{b}}(\mathbf{a})$), podemos escribir

$$\mathrm{Area} =\left\Vert \mathbf{a} \right\Vert  \left\Vert \mathbf{b} \right\Vert  \mathrm{sen} \left( \theta \right)  =\left\Vert \pi_{\mathbf{b} } \left( \mathbf{a} \right)  \right\Vert  \left\Vert \mathbf{b} \right\Vert  \cos \left( \frac{\pi }{2} -\theta \right)  =a_{11}a_{12}-a_{12}a_{21}=\det \left( \mathbf{A} \right)$$
<p style="text-align: right;">$(3.6)$</p>

La interpretación geométrica anterior puede extenderse al caso de matrices de $3\times 3$, considerando en este caso un paralelepípedo generado por las submatrices columna que generan la matriz completa $\mathbf{A} =\left\{ a_{ij}\right\}  \in \mathbb{R}^{3\times 3}$. Si tales submatrices son representadas como $\mathbf{r}_{1}$, $\mathbf{r}_{2}$ y $\mathbf{r}_{3}$, entonces el volumen del paralelepípedo es igual a $V=\det \left( \left( \mathbf{r}_{1} ,\mathbf{r}_{2} ,\mathbf{r}_{3} \right)  \right)  =\det \left( \mathbf{A} \right)$, tal y como se ilustra en la Fig (3.2b).

<p style="text-align: center;"><img src="figures/fig_3_2.png" width="900"></p>
<p style="text-align: center;">Fig. (3.2): (a) Esquema que muestra cómo el determinante de una matriz de $2\times 2$ permite transformar un cuadrado unitario en un paralelógramo cuyos vértices son las productos que componen dicho determinante y su área será igual al valor de tal determinante; (b) Misma transformación para el caso de una matriz de $3\times 3$. En este caso, la transformación se aplica sobre un paralelepípedo, obteniéndose un trapezoedro cuyo volumen es igual al correspondiente determinante</p>

### Propiedades de los determinantes.
El cálculo de un determinante para una matriz arbitraria $\mathbf{A} =\left\{ a_{ij}\right\}  \in \mathbb{R}^{n\times n}$ requiere de un algoritmo generalizado para poder resolver los casos en los cuales $n>3$. Existen varios procedimientos para ello, siendo indudablemente el más popular el **método de Laplace**, que definiremos a continuación.

**<font color='blue'>Definición 3.1 – Determinante:</font>** Sea $\mathbf{A} =\left\{ a_{ij}\right\}  \in \mathbb{R}^{n\times n}$. Definimos el **determinante** de la matriz $\mathbf{A}$ como

1. Respecto a la columna $j$: $\det \left( \mathbf{A} \right)  =\sum^{n}_{k=1} \left( -1\right)^{k+j}  a_{kj}\det \left( \mathbf{A}_{kj} \right)$.
2. Respecto a la fila $j$: $\det \left( \mathbf{A} \right)  =\sum^{n}_{k=1} \left( -1\right)^{k+j}  a_{jk}\det \left( \mathbf{A}_{jk} \right)$.

En la fórmulas anteriores, conocidas en la práctica como **expansiones de Laplace**, $\mathbf{A}_{jk}$ corresponde a la submatriz resultante de eliminar de $\mathbf{A}$ la fila $j$ y la columna $k$ y se denomina como **menor complementario** en la posición $(j, k)$, mientras que el número real $\triangle_{jk} =\left( -1\right)^{k+j}  a_{jk}$ es llamado **cofactor** asociado al $jk$-ésimo elemento de la matriz $\mathbf{A}$.

Resulta sencillo darnos cuenta de que, si bien las expansiones de Laplace nos permiten obtener una fórmula cerrada para el cálculo del determinante de cualquier matriz cuadrada, su tiempo de ejecución y complejidad computacional escala enormemente con la dimensión de la matriz para la cual queremos calcular su determinante. Por esa razón, en términos algebraicos, es mejor considerar ciertas propiedades que se desprenden directamente de la definición que hemos ido construyendo del determinante a fin de disponer de métodos más efectivos para su cálculo en dimensiones superiores (considerando, además, las transformaciones elementales sobre matrices que hemos aprendido previamente). Vamos, por tanto, a desarrollar tales propiedades:

- **(P1) – Invariancia ante la transposición:** Si $\mathbf{A} =\left\{ a_{{}ij}\right\}  \in \mathbb{R}^{n\times n}$, entonces, de la definición (3.1), se tiene que $\det(\mathbf{A})=\det(\mathbf{A}^{\top})$, ya que $\det \left( \mathbf{A} \right)  =\sum^{n}_{k=1} \triangle_{jk} \det \left( \mathbf{A}_{jk} \right)  =\sum^{n}_{s=1} \triangle_{sj} \det \left( \mathbf{A}_{sj} \right)$.
- **(P2) – Columna o fila nula:** Si $\mathbf{A} =\left\{ a_{{}ij}\right\}  \in \mathbb{R}^{n\times n}$ posee una columna o fila nula (conformada únicamente por elementos iguales a cero), entonces $\det(\mathbf{A})=0$.
- **(P3) – Determinante de un producto de matrices:** Si $\mathbf{A},\mathbf{B}\in \mathbb{R}^{n\times n}$, entonces $\det(\mathbf{A}\mathbf{B})=\det(\mathbf{A})\det(\mathbf{B})$.
- **(P4) – Determinante de la matriz inversa:** Si $\mathbf{A} =\left\{ a_{{}ij}\right\}  \in \mathbb{R}^{n\times n}$ es una matriz no singular, entonces $\det \left( \mathbf{A}^{-1} \right)  =1/\det \left( \mathbf{A} \right)$.
- **(P5) – Invariancia ante operaciones elementales:** Cualquier matriz $\mathbf{A}\in \mathbb{R}^{n\times n}$ mantiene el valor de su determinante, aunque hayamos operado sobre ella mediante cualquier de las transformaciones elementales vistas en la [clase 1.1](https://github.com/rquezadac/udd_data_science_lectures/blob/main/PARTE%20I%20-%20Fundamentos%20matem%C3%A1ticos%20elementales/clase_1_1.ipynb).
- **(P6) – Escalamiento del determinante:** Sea $\mathbf{A} =\left\{ a_{ij}\right\}  \in \mathbb{R}^{n\times n}$ y $\lambda \in \mathhb{R}$. Entonces $\det \left( \lambda \mathbf{A} \right)  =\lambda^{n} \det \left( \mathbf{A} \right)$.
- **(P7) – Columna o fila repetida:** Si una matriz $\mathbf{A} =\left\{ a_{ij}\right\}  \in \mathbb{R}^{n\times n}$ tiene columnas o filas repetidas (o, más general, linealmente dependientes), entonces $\det(\mathbf{A})=0$. Esta propiedad generaliza **(P2)** y establece que toda matriz $\mathbf{A}$ no singular tiene rango completo.

**Ejemplo 3.2:** Calcularemos el determinante de la matriz $\mathbf{A}\in \mathbb{R}^{5\times 5}$, definida como

$$\mathbf{A} =\left( \begin{matrix}0&1&0&1&0\\ -1&a&0&0&0\\ 0&0&a&0&0\\ -1&0&0&a&0\\ 0&0&0&0&a\end{matrix} \right)$$
<p style="text-align: right;">$(3.7)$</p>

En efecto, aplicando la definición (3.1) y transformaciones elementales,

$$\begin{array}{rcl}\det \left( \begin{matrix}0&1&0&1&0\\ -1&a&0&0&0\\ 0&0&a&0&0\\ -1&0&0&a&0\\ 0&0&0&0&a\end{matrix} \right)  &\overbrace{=}^{\mathrm{definicion} } &\underbrace{a}_{\mathrm{cofactor} \  \triangle_{55} } \det \left( \begin{matrix}0&1&0&1\\ -1&a&0&0\\ 0&0&a&0\\ -1&0&0&a\end{matrix} \right)  \\ &\overbrace{=}^{F_{42}\left( -1\right)  } &a\det \left( \begin{matrix}0&1&0&1\\ -1&a&0&0\\ 0&0&a&0\\ 0&-a&0&a\end{matrix} \right)  \\ &\overbrace{=}^{\mathrm{definicion} } &\underbrace{1}_{\mathrm{cofactor} \  \triangle_{21} } \cdot a\det \left( \begin{matrix}1&0&1\\ 0&a&0\\ -a&0&a\end{matrix} \right)  \\ &\overbrace{=}^{\mathrm{definicion} } &a^{2}\det \left( \begin{matrix}1&1\\ -a&a\end{matrix} \right)  \overbrace{=}^{\mathrm{definicion} } 2a^{3}\end{array}$$
<p style="text-align: right;">$(3.8)$</p>
◼︎

**Ejemplo 3.3 – Los determinantes en <font color='purple'>Numpy</font>:** En librerías de Python especializadas en el uso de arreglos vectorizados, como <font color='purple'>Numpy</font>, es razonable esperar que existan rutinas prefabricadas para el cálculo de determinantes. En particular, podemos usar la función `det()`, del módulo de álgebra lineal `numpy.linalg()` para calcular el determinante de cualquier matriz expresada por medio de un arreglo bidimensional. Por ejemplo, si consideramos la matriz $\mathbf{A}\in \mathbb{R}^{5\times 5}$, definida como

$$\mathbf{A} =\left( \begin{matrix}0&-1&2&-1&0\\ 3&-1&2&2&0\\ 6&-1&0&0&9\\ 0&1&4&-5&9\\ 2&2&-4&5&-3\end{matrix} \right)$$
<p style="text-align: right;">$(3.9)$</p>

Podemos calcular su determinante fácilmente en <font color='purple'>Numpy</font> definiendo, primeramente, un arreglo bidimensional, digamos `A`, donde almacenamos esta matriz:

In [1]:
import numpy as np

In [2]:
# Definimos el arreglo en cuestión.
A = np.array([
    [0, -1, 2, -1, 0],
    [3, -1, 2, 2, 0],
    [6, -1, 0, 0, 9],
    [0, 1, 4, -5, 9],
    [2, 2, -4, 5, -3],
])

Y luego aplicando la función `np.linalg.det()` para calcular su determinante:

In [3]:
# Calculamos el determinante de A (redondeado a 3 decimales).
np.around(np.linalg.det(A), 3)

-162.0

Vemos pues que no fue nada difícil calcular el determinante de una matriz de $5\times 5$ en <font color='purple'>Numpy</font>. Sin embargo, tal y como comentamos previamente, el cálculo de determinantes corresponde a un esfuerzo computacional ostensiblemente grande y que escala enormemente a medida que aumentan las dimensiones de las matrices de interés. Incluso trabajando con una librería muy eficiente como <font color='purple'>Numpy</font>, los tiempos de ejecución pueden verse muy afectados. Para ejemplificar aquello, consideraremos el cálculo de los determinantes de cuatro matrices $\mathbf{A}\in \mathbb{R}^{10\times 10}$, $\mathbf{B}\in \mathbb{R}^{100\times 100}$, $\mathbf{C}\in \mathbb{R}^{1000\times 1000}$ y $\mathbf{D}\in \mathbb{R}^{10000\times 10000}$, las que representaremos mediante los arreglos bidimensionales `A`, `B`, `C` y `D`, y que estarán compuestas por números reales uniformemente distribuidos entre 0 y 1:

In [4]:
# Definimos una semilla aleatoria fija.
rng = np.random.default_rng(42)

In [5]:
# Definimos algunas matrices de distintos tamaños.
A = rng.random(size=(10, 10))
B = rng.random(size=(100, 100))
C = rng.random(size=(1000, 1000))
D = rng.random(size=(10000, 10000))

Vamos a estimar el tiempo de ejecución asociado al cálculo de los determinantes de estas matrices, a fin de observar qué tal escala con respecto al incremento en dimensionalidad de las mismas. Notemos que cada matriz es 10 veces más grande que su antecesora:

In [None]:
%timeit np.linalg.det(A)
%timeit np.linalg.det(B)
%timeit np.linalg.det(C)
%timeit np.linalg.det(D)

7.27 µs ± 63.6 ns per loop (mean ± std. dev. of 7 runs, 100,000 loops each)
89.6 µs ± 329 ns per loop (mean ± std. dev. of 7 runs, 10,000 loops each)


  r = _umath_linalg.det(a, signature=signature)


Podemos observar que el cálculo del determinante de `B` tiene un tiempo de ejecución 12 veces mayor que el cálculo del determinante de `A`. El cálculo del determinante de `C` tiene un tiempo de ejecución de aproximadamente unas 82 veces superior al del cálculo del determinante de `B` (y, por extensión, 1038 veces más lento que el cálculo del determinante de `A`). Y el cálculo del determinante de `D` tiene un tiempo de ejecución aproximadamente unas 445 veces más lento que el cálculo del determinante de `C` (y, por extensión... ¡es más de 36000 veces más lento que el cálculo del determinante de `B`, y más de 460000 veces más lento que el cálculo del determinante de `A`!). Esto definitivamente nos hará pensarlo dos veces antes de calcular determinantes en el mundo real, donde resulta común vernos enfrentados a bases de datos con cientos de miles de registros. ◼︎ 

**Ejemplo 3.4:** Vamos a demostrar que

$$\det \left( \begin{matrix}1&1&1\\ x&y&z\\ x^{2}&y^{2}&z^{2}\end{matrix} \right)  =\left( x-y\right)  \left( y-z\right)  \left( z-x\right)$$
<p style="text-align: right;">$(3.10)$</p>

En efecto, utilizando transformaciones elementales, propiedades de los determinantes y la definición (3.1), tenemos que

$$\begin{array}{rcl}\det \left( \begin{matrix}1&1&1\\ x&y&z\\ x^{2}&y^{2}&z^{2}\end{matrix} \right)  &\overbrace{=}^{F_{21}\left( -x\right)  } &\det \left( \begin{matrix}1&1&1\\ 0&y-x&z-x\\ x^{2}&y^{2}&z^{2}\end{matrix} \right)  \\ &\overbrace{=}^{F_{31}\left( -x^{2}\right)  } &\det \left( \begin{matrix}1&1&1\\ 0&y-x&z-x\\ 0&y^{2}-x^{2}&z^{2}-x^{2}\end{matrix} \right)  \\ &\overbrace{=}^{\mathrm{definicion} } &\det \left( \begin{matrix}y-x&z-x\\ y^{2}-x^{2}&z^{2}-x^{2}\end{matrix} \right)  \\ &=&\left( y-z\right)  \left( z^{2}-x^{2}\right)  -\left( z-x\right)  \left( y^{2}-x^{2}\right)  \\ &=&\left( y-x\right)  \left( z-x\right)  \left( z+x-y+x\right)  \\ &=&\left( y-x\right)  \left( z-x\right)  \left( z-y\right)  \\ &=&\left( x-y\right)  \left( y-z\right)  \left( z-x\right)  \end{array}$$
<p style="text-align: right;">$(3.11)$</p>

Tal como queríamos demostrar. ◼︎

**Ejemplo 3.5:** Vamos a determinar todos los valores de $a\in \mathbb{R}$ tales que

$$\det \left( \begin{matrix}1&a&a^{2}&\left( a^{3}+6\right)  \\ 1&1&1&\left( 1+6a\right)  \\ 1&2&4&\left( 8+3a\right)  \\ 1&3&9&\left( 27+2a\right)  \end{matrix} \right)  =0$$
<p style="text-align: right;">$(3.12)$</p>

En efecto,

$$\begin{array}{rcl}\det \left( \begin{matrix}1&a&a^{2}&\left( a^{3}+6\right)  \\ 1&1&1&\left( 1+6a\right)  \\ 1&2&4&\left( 8+3a\right)  \\ 1&3&9&\left( 27+2a\right)  \end{matrix} \right)  &\overbrace{=}^{\begin{array}{c}F_{21}\left( -1\right)  \\ F_{31}\left( -1\right)  \\ F_{41}\left( -1\right)  \end{array} } &\det \left( \begin{matrix}1&a&a^{2}&\left( a^{3}+6\right)  \\ 0&\left( 1-a\right)  &\left( 1-a^{2}\right)  &\left( 1-a^{3}+6\left( a-1\right)  \right)  \\ 0&\left( 2-a\right)  &\left( 4-a^{2}\right)  &\left( 8-a^{3}+3a-6\right)  \\ 0&\left( 3-a\right)  &\left( 9-a^{2}\right)  &\left( 27-a^{3}+2a-6\right)  \end{matrix} \right)  \\ &\overbrace{=}^{\mathrm{definicion} } &\det \left( \begin{matrix}\left( 1-a\right)  &\left( 1-a^{2}\right)  &\left( 1-a^{3}+6\left( a-1\right)  \right)  \\ \left( 2-a\right)  &\left( 4-a^{2}\right)  &\left( 8-a^{3}+3a-6\right)  \\ \left( 3-a\right)  &\left( 9-a^{2}\right)  &\left( 27-a^{3}+2a-6\right)  \end{matrix} \right)  \\ &=&\det \left( \begin{matrix}\left( 1-a\right)  &\left( 1-a^{2}\right)  &\left[ \left( 1-a\right)  \left( a^{2}+a+1\right)  +6\left( a-1\right)  \right]  \\ \left( 2-a\right)  &\left( 4-a^{2}\right)  &\left[ \left( 2-a\right)  \left( a^{2}+2a+4\right)  +3\left( a-2\right)  \right]  \\ \left( 3-a\right)  &\left( 9-a^{2}\right)  &\left[ \left( 3-a\right)  \left( a^{2}+3a+9\right)  +2\left( a-3\right)  \right]  \end{matrix} \right)  \end{array}$$
<p style="text-align: right;">$(3.13)$</p>

Es claro, conforme el desarrollo anterior, que el determinante se anula cuando $a=1$, $a=2$ o $a=3$. Para $a\neq 1$, $a\neq 2$ y $a\neq 3$, proseguimos con el desarrollo del determinante, con lo cual,

$$\begin{array}{rcl}\det \left( \begin{matrix}1&a&a^{2}&\left( a^{3}+6\right)  \\ 1&1&1&\left( 1+6a\right)  \\ 1&2&4&\left( 8+3a\right)  \\ 1&3&9&\left( 27+2a\right)  \end{matrix} \right)  &\overbrace{=}^{\mathrm{propiedades} } &\left( 1-a\right)  \left( 2-a\right)  \left( 3-a\right)  \det \left( \begin{matrix}1&\left( 1+a\right)  &\left( a^{2}+a-5\right)  \\ 1&\left( 2+a\right)  &\left( a^{2}+2a+1\right)  \\ 1&\left( 3+a\right)  &\left( a^{2}+3a+7\right)  \end{matrix} \right)  \\ &\overbrace{=}^{\begin{array}{c}F_{21}\left( -1\right)  \\ F_{31}\left( -1\right)  \end{array} } &\left( 1-a\right)  \left( 2-a\right)  \left( 3-a\right)  \det \left( \begin{matrix}1&\left( 1+a\right)  &\left( a^{2}+a-5\right)  \\ 0&1&\left( a+6\right)  \\ 0&2&\left( a+6\right)  \end{matrix} \right)  \\ &=&2\left( 1-a\right)  \left( 2-a\right)  \left( 3-a\right)  \det \left( \begin{matrix}1&\left( 1+a\right)  &\left( a^{2}+a-5\right)  \\ 0&1&\left( a+6\right)  \\ 0&1&\left( a+6\right)  \end{matrix} \right)  \\ &=&0\end{array}$$
<p style="text-align: right;">$(3.14)$</p>

Luego tenemos que $\det(\mathbf{A})=0$ para todo $a\in \mathbb{R}$. ◼︎

## Diagonalización de matrices.
Una vez estudiado el concepto de determinante, vamos a ocuparnos de un problema más general y que consiste en saber cuando, para una transformación lineal del tipo $T:\mathbb{R}^{n}\longrightarrow \mathbb{R}^{n}$, es posible encontrar una base $\alpha$ con respecto a la cual la matriz asociada $\mathbf{A}=[T]_{\alpha}^{\alpha}$ sea de tipo **diagonal**. De manera equivalente, queremos determinar las condiciones para las cuales una matriz $\mathbf{A}\in \mathbb{R}^{n\times n}$ puede *descomponerse* de la forma

$$\mathbf{A} =\mathbf{P} \mathbf{D} \mathbf{P}^{-1}$$
<p style="text-align: right;">$(3.15)$</p>

Donde $\mathbf{D}\in \mathbb{R}^{n\times n}$ es una matriz diagonal.

Este problema de naturaleza puramente algebraica tiene una cantidad significativa de aplicaciones en otras ramas de las matemáticas, como en ecuaciones diferenciales, estadística y, por supuesto, en machine learning. Puntualmente, la diagonalización es un procedimiento esencial en la derivación de la descomposición de matrices en **valores singulares** y que, a su vez, constituye la base del **análisis de componentes principales**, uno de los modelos de aprendizaje no supervisado más utilizados para la reducción de la dimensión de conjuntos de datos con un elevado número de variables, sin perder una cantidad significativa de información. Tal vez el teorema más importante de esta subsección es el que dice que toda matriz simétrica puede representarse mediante la expresión (3.15).

Para comenzar con el estudio de la diagonalización de matrices, primero introduciremos algunos conceptos y resultados esenciales.

**<font color='blue'>Definición 3.2 – Autovalores y autovectores:</font>** Sea $V$ un $\mathbb{K}$-espacio vectorial y $T:V\longrightarrow V$ una transformación lineal. Diremos que $v\in V$ es un **autovector o vector propio** de $T$ si se cumplen las siguientes condiciones:

- **(C1):** $v\in O_{V}$.
- **(C2):** Existe un escalar $\lambda \in \mathbb{K}$ tal que $T(v)=\lambda v$.