# Matemática para Ciencia de los Datos - Matrices

-Profesor: Luis Alexánder Calvo Valverde.

- Documento base: Saúl Calderón, Žiga Emeršič, Ángel García, Blaž Meden, Felipe Meza, Martín Solís, Juan Esquivel, Mauro Méndez, Manuel Zumbado.

# Matrices
El álgebra lineal facilita la expresión de múltiples operaciones, como por ejemplo las operaciones en ecuaciones lineales, como el siguiente sistema:

\begin{array}{c}
4x_{1}-5x_{2}=-13\\
-2x_{1}+3x_{2}=9
\end{array}


El sistema de ecuaciones anterior tiene igual número de ecuaciones y variables.

En notación matricial, el sistema de ecuaciones anterior se expresa de la siguiente forma: 

\begin{equation}
A\,\vec{x}=b
\end{equation}

con 

\begin{equation}
A=\begin{bmatrix}4 & -5\\
-2 & 3
\end{bmatrix},\qquad b=\begin{bmatrix}-13\\
9
\end{bmatrix}
\end{equation}


En el material del curso se utilizará la siguiente notación:


- Con $A\in\mathbb{R}^{m\times n}$ se define una matriz con $m$ filas
y $n$ columnas, donde en este caso todas las entradas de $A$ son
números reales.

- Con $\vec{x}\in\mathbb{R}^{n\times1}=\mathbb{R}^{n}$ se denota un
vector con $n$ entradas. Por convención, un vector $n$ dimensional
se define como una matriz de $n$ filas y $1$ columna, conocido como
el **vector columna**: 

\begin{equation}
\overrightarrow{x}=\begin{bmatrix}x_{1}\\
x_{2}\\
\vdots\\
x_{n}
\end{bmatrix}
\end{equation}

y el elemento $i$ del vector se denota como $x_{i}$. Un vector fila se define entonces de la siguiente forma (usando la definición de la transpuesta): 

\begin{equation}
\overrightarrow{x}^{T}=\begin{bmatrix}x_{1} & x_{2} & \ldots & x_{n}\end{bmatrix}
\end{equation}

- Para denotar los elementos de una matriz se usa la notación $a_{i,j}$
($A_{ij}$, $A_{i,j}$,$A\left(i,j\right)$, etc) para denotar una
entrada de la matriz $A$ en la fila $i$ y la columna $j$:


\begin{equation}
A=\begin{bmatrix}a_{1,1} & a_{1,2} & \ldots & a_{1,n}\\
a_{2,1} & a_{2,2} & \ldots & a_{2,n}\\
\vdots & \vdots & \ddots & \vdots\\
a_{m,1} & a_{m,2} &  & a_{m,n}
\end{bmatrix}
\end{equation}

y se define la columna $j$ de la matriz $A$ con $a_{j}$ o $A_{:,j}$,
de modo que la matriz $A$ está definida en términos de vectores columna
por:

\begin{equation}
A=\begin{bmatrix}| & | & \ldots & |\\
\overrightarrow{a}_{:,1} & \overrightarrow{a}_{:,2} & \ldots & \overrightarrow{a}_{:,n}\\
| & | & \ldots & |
\end{bmatrix}
\end{equation}

y se define la fila $i$ de tal matriz como $\vec{a}_{i,:}^{T}$ o $A_{i,:}$, por lo que en términos de tales vectores fila la matriz $A$ se expresa como:

\begin{equation}
A=\begin{bmatrix}- & \vec{a}_{1,:}^{T} & -\\
- & \vec{a}_{2,:}^{T} & -\\
 & \vdots\\
- & \vec{a}_{m,:}^{T} & -
\end{bmatrix}
\end{equation}

**Nota:** - $A$ es una matriz cuadrada cuando $A\in\mathbb{R}^{n\times n}$, igual cantidad de filas que de columnas.

In [0]:
# Si no tiene instalado pytorch hay que hacerlo
!pip install torch

###############################################################################
import torch as torch
import math 
import numpy as np
from matplotlib import pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from matplotlib import cm
###############################################################################


In [0]:
A = torch.tensor([ [1. , 2. , 3. ], [4. , 5. , 6. ] , [7. , 8. , 9.]])
print( A )

## La matriz identidad y diagonal

La matriz identidad, definida como una matriz cuadrada $I\in\mathbb{R}^{n\times n}$ y está formada por una diagonal de unos, y el resto de entradas de la matriz está en cero: 


\begin{equation}
I_{i,j}=\begin{cases}
1 & i=j\\
0 & i\neq j
\end{cases}
\end{equation}

y es el neutro de la multiplicación matricial, por lo que para toda $A\in\mathbb{R}^{m\times n}$ se tiene que: 

\begin{equation}
A\,I=A
\end{equation}

la matriz identidad es un caso particular de una matriz diagonal, donde todos los elementos no diagonales son 0, lo que se denota como: $D=\textrm{diag}\left(d_{1},d_{2},\ldots,d_{n}\right)$ con: 

\begin{equation}
D_{i,j}=\begin{cases}
d_{i} & i=j\\
0 & i\neq j
\end{cases}
\end{equation}

por lo que entonces $I=\textrm{diag}\left(1,1,\ldots,1\right)$.

In [0]:
A = torch.tensor([ [1. , 2. , 3. ], [4. , 5. , 6. ] , [7. , 8. , 9.]])
print( A )
I = torch.eye(3)
print( I )
D = torch.diag(A)
print( D )
r = torch.mm( A, I )
print( r )

## La matriz transpuesta

La transpuesta de una matriz es el resultado de cambiar las filas a columnas. Sea una matriz $A\in\mathbb{R}^{m\times n}$, su transpuesta se escribe como $A^{T}\in\mathbb{R}^{n\times m}$ y sus entradas están dadas por: 

\begin{equation}
\left(A^{T}\right)_{i,j}=A_{j,i}.
\end{equation}

Las siguientes son propiedades de la transpuesta: 

- $\left(A^{T}\right)^{T}=A$
- $\left(AB\right)^{T}=B^{T}A^{T}$
- $\left(A+B\right)^{T}=A^{T}+B^{T}$.

In [0]:
A = torch.tensor([ [1. , 2. , 3. ], [4. , 5. , 6. ] , [7. , 8. , 9.]])
print( A )
T = torch.t(A)
print( T )

# otro modo
A = torch.tensor([ [1. , 2. , 3. ], [4. , 5. , 6. ] , [7. , 8. , 9.]])
T = A.transpose(0, 1)
print(T)

## Matrices simétricas

Una matriz cuadrada $A\in\mathbb{R}^{n\times n}$ es simétrica si $A=A^{T}$ y es anti simétrica si $A=-A^{T}$, Para toda matriz $A\in\mathbb{R}^{n\times n}$ es fácil demostrar que la matriz $A+A^{T}$ es simétrica y la matriz $A-A^{T}$ es anti-simétrica, por lo que se puede seguir que cualquier matriz cuadrada puede expresarse en términos de una matriz simétrica y anti-simétrica:
    
\begin{equation}
A=\frac{1}{2}\left(A+A^{T}\right)+\frac{1}{2}\left(A-A^{T}\right).
\end{equation}

Se define entonces el conjunto de matrices simétricas de dimensiones $n\times n$ como $\mathbb{S}^{n}$ por lo que $A\in\mathbb{S}^{n}$ si es simétrica. Las matrices simétricas son muy frecuentes en el reconocimiento de patrones, y presentan una serie de propiedades muy útiles que veremos más adelante. 

In [0]:
A = torch.tensor([ [1. , 2. , 3. ], [2. , 3. , 3. ] , [1. , 2. , 3.]])
print( A )
T = torch.t(A)
print( T )
print( torch.equal( A, T))

A = torch.tensor([ [1. , 2. , 3. ], [2. , 5. , 0. ] , [3. , 0. , 5.]])
print( A )
T = torch.t(A)
print( T )
print( torch.equal( A, T))


## La traza de una matriz

La traza de una matriz cuadrada $A\in\mathbb{R}^{n\times n}$ denotada como $\textrm{tr}\left(A\right)$ es la suma de los elementos en la diagonal de una matriz: 

\begin{equation}
\textrm{tr}\left(A\right)=\sum_{i=1}^{n}A_{i,i}
\end{equation}

La traza tiene las siguientes propiedades:

- $\textrm{tr}\left(A\right)=\textrm{tr}\left(A^{T}\right)$
- Superposición $\textrm{tr}\left(A+B\right)=\textrm{tr}\left(A\right)+\textrm{tr}\left(B\right)$
- Homogeneidad: Sea $t\in\mathbb{R}$, $\textrm{tr}\left(t\,A\right)=t\,\textrm{tr}\left(A\right)$
- Para $A$ y $B$ cuadradas, se tiene que $\textrm{tr}\left(A\,B\right)=\textrm{tr}\left(B\,A\right)$


In [0]:
A = torch.tensor([ [1. , 2. , 3. ], [2. , 3. , 3. ] , [1. , 2. , 3.]])
print( A )
Tr = torch.trace(A)
print( Tr )

In [0]:
A = torch.tensor([ [1. , 2. , 3. ], [4. , 5. , 6. ]  ] )
B = torch.tensor([ [7. , 8. ], [9. , 1. ] , [2. , 4.] ] )
C = torch.mm( A, B)
print( C )
print( C.shape[0], C.shape[1])


### Producto vector-vector, producto punto

Sean dos vectores $\overrightarrow{x},\overrightarrow{y}\in\mathbb{R}^{n}$ el **producto interno** o producto punto se puede definir, en términos del producto entre tales vectores de la siguiente forma:

\begin{equation}
\overrightarrow{x}\cdot\overrightarrow{y}=\overrightarrow{x}^{T}\:\overrightarrow{y}\in\mathbb{R}^{1}=\begin{bmatrix}x_{1} & x_{2} & \cdots & x_{n}\end{bmatrix}\begin{bmatrix}v_{1}\\
v_{2}\\
\vdots\\
v_{n}
\end{bmatrix}=\sum_{i=1}^{n}x_{i}\:y_{i}
\end{equation}

Observe entonces que el producto interno es un caso especial de la multiplicación de matrices, y que además, siempre se cumple que: 

\begin{equation}
\overrightarrow{x}^{T}\overrightarrow{y}=\overrightarrow{y}^{T}\overrightarrow{x}.
\end{equation}



### Producto vector-vector o producto externo

El **producto externo** en cambio, está dado para dos vectores $\overrightarrow{x}\in\mathbb{R}^{m\times1}$, $\overrightarrow{y}\in\mathbb{R}^{1\times n}$ (no necesariamente de la misma dimensionalidad) se define como: 

\begin{equation}
\overrightarrow{x} \odot \overrightarrow{y}=\vec{x}\:\vec{y}^{T}\in\mathbb{R}^{m\times n}=\begin{bmatrix}x_{1}\\
x_{2}\\
\vdots\\
x_{m}
\end{bmatrix}\begin{bmatrix}y_{1} & y_{2} & \cdots & y_{n}\end{bmatrix}=\begin{bmatrix}x_{1}y_{1} & x_{1}y_{2} & \cdots & x_{1}y_{n}\\
x_{2}y_{1} & x_{2}y_{2} & \cdots & x_{2}y_{n}\\
\vdots & \vdots & \ddots & \vdots\\
x_{m}y_{1} & x_{m}y_{2} & \cdots & x_{m}y_{n}
\end{bmatrix}
\end{equation}


El producto externo permite, por ejemplo, crear una matriz $A\in\mathbb{R}^{m\times n}$ cuyas columnas sean igual a un vector $x\in\mathbb{R}^{m}$ usando un vector unitario $\overrightarrow{1}\in\mathbb{R}^{n}$, como sigue:

\begin{equation}
\overrightarrow{x}\,\overrightarrow{1}^{T}=\begin{bmatrix}x_{1}\\
x_{2}\\
\vdots\\
x_{m}
\end{bmatrix}\begin{bmatrix}1 & 1 & \cdots & 1\end{bmatrix}=\begin{bmatrix}| & | &  & |\\
\vec{x} & \vec{x} & \cdots & \vec{x}\\
| & | &  & |
\end{bmatrix}
\end{equation}



In [0]:
# producto interno
A = torch.tensor([ 1. , 2.,  3.  ])
B = torch.tensor([ 4. , 5. , 6.  ])
r = torch.dot( A, B)
print( r )

# producto externo
r = torch.ger( A, torch.t(B) )
print( r )


### Producto matriz-vector

Sea una matriz $A\in\mathbb{R}^{m\times n}$ y un vector (columna) $\overrightarrow{x}\in\mathbb{R}^{n\times1}$ su producto es el vector $\overrightarrow{y}\in\mathbb{R}^{m\times1}$ . 

Si se escribe a la matriz $A$ por filas, entonces se puede expresar a $A\,\overrightarrow{x}$ como: 

\begin{equation}
\vec{y}=A\,\overrightarrow{x}=\begin{bmatrix}- & \vec{a}_{1,:}^{T} & -\\
- & \vec{a}_{2,:}^{T} & -\\
 & \vdots\\
- & \vec{a}_{m,:}^{T} & -
\end{bmatrix}\,\overrightarrow{x}=\begin{bmatrix}- & \vec{a}_{1,:}^{T} & -\\
- & \vec{a}_{2,:}^{T} & -\\
 & \vdots\\
- & \vec{a}_{m,:}^{T} & -
\end{bmatrix}\,\begin{bmatrix}x_{1}\\
x_{2}\\
\vdots\\
x_{n}
\end{bmatrix}=\begin{bmatrix}\vec{a}_{1,:}^{T}\:\vec{x}\\
\vec{a}_{2,:}^{T}\:\vec{x}\\
\vdots\\
\vec{a}_{m,:}^{T}\:\vec{x}
\end{bmatrix}
\end{equation}

En otras palabras, la fila $i$ de $y$ , $y_{i}$ es igual al producto interno de la fila $b_{i}$ con el vector $\overrightarrow{x}$.

Alternativamente, si se escribe la matriz $A$ en forma de columnas, el producto matriz-vector se puede expresar como:

\begin{equation}
\overrightarrow{y}=A\,\overrightarrow{x}=\begin{bmatrix}| & | & \ldots & |\\
\vec{a}_{:,1} & \vec{a}_{:,2} & \ldots & \vec{a}_{:,n}\\
| & | & \ldots & |
\end{bmatrix}\,\begin{bmatrix}x_{1}\\
x_{2}\\
\vdots\\
x_{n}
\end{bmatrix}=\left[\vec{a}_{:,1}\right]x_{1}+\left[\vec{a}_{:,2}\right]x_{2}+\ldots+\left[\vec{a}_{:,n}\right]x_{n}.
\end{equation}

ello es fácilmente corroborable si hacemos la multiplicación de sus transpuestas:

\begin{equation}
\overrightarrow{y}^{T}=\vec{x}^{T}\,A^{T}=\begin{bmatrix}x_{1} & x_{2} & \cdots & x_{n}\end{bmatrix}\,\begin{bmatrix}- & \vec{a}_{:,1}^{T} & -\\
- & \vec{a}_{:,2}^{T} & -\\
 & \vdots\\
- & \vec{a}_{:,n}^{T} & -
\end{bmatrix}=x_{1}\left[\vec{a}_{:,1}^{T}\right]+x_{2}\left[\vec{a}_{:,1}^{T}\right]+\ldots+x_{n}\left[\vec{a}_{:,n}^{T}\right].
\end{equation}

Lo anterior representa el hecho de que el vector $\overrightarrow{y}$ es una **combinación lineal** de las columnas de la matriz **$A$**, donde los coeficientes están definidos en el vector $\overrightarrow{x}$.

In [0]:
A = torch.tensor([ [1. , 2. , 3. ], [4. , 5. , 6. ] , [7. , 8. , 9.]])
x = torch.tensor( [ 2. , 3. , 4.] ) 
y = torch.mv( A ,  x )
print( y )

### Producto matriz-matriz

El producto matriz-matriz en general de dos matrices $A\in\mathbb{R}^{m\times n}$ y $B\in\mathbb{R}^{n\times p}$ dado por $C\in\mathbb{R}^{m\times p}$ se puede definir en términos de las filas y columnas, **donde para cada entrada $C_{i,j}$ el producto interno de la fila** $i$ de $A$ y la **columna $j$ de** $B$, simbólicamente esto se expresa como sigue: 

\begin{equation}
C=A\,B=\begin{bmatrix}- & \vec{a}_{1,:}^{T} & -\\
- & \vec{a}_{2,:}^{T} & -\\
 & \vdots\\
- & \vec{a}_{m,:}^{T} & -
\end{bmatrix}\,\begin{bmatrix}| & | & \ldots & |\\
\vec{b}_{1,:} & \vec{b}_{2,:} & \ldots & \vec{b}_{p,:}\\
| & | & \ldots & |
\end{bmatrix}=\begin{bmatrix}\vec{a}_{1,:}^{T}\vec{b}_{1,:} & \vec{a}_{1,:}^{T}\vec{b}_{2,:} & \cdots & \vec{a}_{1,:}^{T}\vec{b}_{p,:}\\
\vec{a}_{2,:}^{T}\vec{b}_{1,:} & \vec{a}_{2,:}^{T}\vec{b}_{2,:} & \cdots & \vec{a}_{2,:}^{T}\vec{b}_{p,:}\\
\vdots & \vdots & \ddots & \vdots\\
\vec{a}_{m,:}^{T}\vec{b}_{1,:} & \vec{a'}_{m}^{T}\vec{b}_{2,:} & \cdots & \vec{a}_{m,:}^{T}\vec{b}_{p,:}
\end{bmatrix}
\end{equation}

\begin{equation}
C=A\,B=\begin{bmatrix}| & | & \ldots & |\\
A\vec{b}_{1,:} & A\vec{b}_{2,:} & \ldots & A\vec{b}_{p,:}\\
| & | & \ldots & |
\end{bmatrix}
\end{equation}

La última igualdad representa el hecho de que la columna $j$ de la matriz $C$ es una combinación lineal de los vectores columna de la matriz $A$ con los coeficientes definidos por el vector columna $\vec{b}_{j,:}$. 

Las siguientes son propiedades fácilmente corroborables para el producto matricial: 

- Asociatividad: $\left(A\,B\right)C=A\left(B\,C\right)$.
- Distributividad: $A\left(B+C\right)=A\,B+A\,C$.
- No conmutatividad: $A\,B\neq B\,A$.


In [0]:
A = torch.tensor([ [1. , 2. , 3. ], [4. , 5. , 6. ]  ] )
B = torch.tensor([ [7. , 8. ], [9. , 1. ] , [2. , 4.] ] )
C = torch.mm( A, B)
print( C )
print( C.shape[0], C.shape[1])

## Independencia lineal y el rango de una matriz

Un conjunto de vectores $\left\{ \vec{x}_{1},\vec{x}_{2},\ldots,\vec{x}_{n}\right\} \in\mathbb{R}^{m}$ se dice que es linealmente independiente, si ningún vector de tal conjunto puede ser representado como una combinación lineal del resto de vectores. De lo contrario, si uno de los vectores en tal conjunto puede ser representado como una combinación lineal del resto de vectores, entonces los vectores son **linealmente dependientes**, lo que se expresa como: 

\begin{equation}
\vec{x}_{j}=\sum_{i=1}^{n-1}\alpha_{i}\vec{x}_{i}
\end{equation}

para cualquier conjunto de valores escalares $\alpha_{1},\ldots,\alpha_{n-1}\in\mathbb{R}$ se dice que el vector $\vec{x}_{j}\in\mathbb{R}^{m}$ es linealmente dependiente de los vectores $\vec{x}_{i}$. 

El **rango de columnas** de la matriz $A\in\mathbb{R}^{m\times n}$ corresponde a la cantidad más grande de columnas en la matriz $A$ linealmente independientes, de manera similar, el **rango de filas** se refiere a la cantidad más grande de filas en tal matriz linealmente independientes.

Para cualquier matriz $A\in\mathbb{R}^{m\times n}$ se puede comprobar que el rango de filas y el de columnas es el mismo, por lo que entonces la cantidad de filas y columnas linealmente independiente se le refiere con el **rango**:

$\textrm{rango}\left(A\right),$con las siguientes propiedades:
    
- $\forall A\in\mathbb{R}^{m\times n}$, $\textrm{rango}\left(A\right)\leq\min\left(m,n\right)$, y si $\textrm{rango}\left(A\right)=\textrm{min}\left(m,n\right)$ se dice que $A$ de **rango completo*.
- $\textrm{rango}\left(A\right)\leq\textrm{rango}\left(A^{T}\right)$
- $\textrm{rango}\left(A\,B\right)\leq\min\left(\textrm{rango}\left(A\right),\textrm{rango}\left(B\right)\right)$
- $\textrm{rango}\left(A+B\right)\leq\textrm{rango}\left(A\right)+\textrm{rango}\left(B\right)$

Ejemplo: 

Observe la siguiente matriz: 

\begin{equation}
\begin{bmatrix}1 & 2 & -1 & 3 & -2\\
2 & 1 & 0 & 1 & 1\\
2 & 4 & -2 & 6 & -4\\
0 & 0 & 0 & 0 & 0\\
5 & 4 & -1 & 5 & 0
\end{bmatrix}
\end{equation}

Fácilmente puede notarse que la fila $f_{3}=2f_{1}$ y además que $f_{5}=2f_{2}+f_{1}$, y que dado que la fila $f_{4}$ es nula, entonces puede ser expresada en términos de cualquier otra fila en una combinación  lineal.

In [0]:
rango = torch.matrix_rank( torch.eye(15) )
print("rango de la matriz ", rango)


## La matriz inversa

La inversa de la matriz cuadrada $A\in\mathbb{R}^{n\times n}$ se denota como $A^{-1}$ es la única matriz que cumple lo siguiente:

\begin{equation}
A^{-1}A=I=A\,A^{-1}
\end{equation}

Nótese que no todas las matrices tienen inversas, por ejemplo las matrices no cuadradas no tienen inversas por definición, e incluso, pueden existir matrices cuadradas sin inversas.

- Se dice que $A$ es una matriz **invertible** o no singular si $A^{-1}$ existe, si la matriz $A$ presenta **rango completo**.
- Si la matriz $A^{-1}$ no existe, se dice que la matriz es **no invertible** o singular.

Las siguientes son las propiedades de la inversa, asumiendo que $A,B\in\mathbb{R}^{n\times n}$ son no-singulares:

- $\left(A^{-1}\right)^{-1}=A$.
- $\left(A\,B\right)^{-1}=B^{-1}A^{-1}$.
- $\left(A^{-1}\right)^{T}=\left(A^{T}\right)^{-1}$


In [0]:
# Invertible
A = torch.tensor([ [1. , 2. ], [3. , 4. ] ])
print( A )
Ai = torch.inverse( A ) 
print( Ai )
sorpresa = torch.mm(A, Ai)
print( sorpresa )
# por capacidad de representación no siempre es cero exacto
print( sorpresa.sum())

# singular - no invertible
A = torch.tensor([ [3. , 2. ], [6. , 4. ] ])
print( A )
try:
  nd = torch.inverse( A )
  print("Invertible")
except:
  print("Singular")


## Matrices ortogonales y ortonormales

Anteriormente se mencionó que dos vectores $\vec{x},\vec{y}\in\mathbb{R}^{n}$ son ortogonales si $\vec{x}^{T}\vec{y}=0$. Se dice que un vector $\vec{x}\in\mathbb{R}^{n}$ es normalizado si $\left\Vert \vec{x}\right\Vert _{2}=1$.

Una matriz cuadrada $U\in\mathbb{R}^{n\times n}$ es **ortogonal** si todas las columnas son ortogonales entre ellas. 

Si además, todos los vectores están normalizados, se dice que la matriz es **ortonormal**.

Las siguientes son propiedades de las matrices ortogonales: 
    
- Para toda matriz ortogormal $U\in\mathbb{R}^{n\times n}$ , se cumple que: $U^{T}U=I=U\,U^{T}$ y sabiendo que $U\,U^{-1}=I$ se arriba a que $U^{T}=U^{-1}$. Si $U\in\mathbb{R}^{m\times n}$ y $n<m$ pero sus columnas son ortonormales, entonces se cumple que $U^{T}U=I$ pero $U\,U^{T}\neq I$.
- Para toda matriz ortogonal $U\in\mathbb{R}^{n\times n}$ y vector $\vec{x}\in\mathbb{R}^{n}$, se cumple que el operar el vector con una matriz ortogonal, la norma euclidiana no cambia: 

\begin{equation}
\left\Vert U\,\vec{x}\right\Vert _{2}=\left\Vert \vec{x}\right\Vert _{2}
\end{equation}


In [0]:
# ortogonal
U = torch.tensor([ [0. , -1.] , [1. , 0. ]])
print("U ", U )
ut = torch.transpose( U, 0, 1)
print("Ut  ", ut )
r = torch.mm( U, ut)
print(" r  ",  r )
print("I ", torch.eye(2))

# ver inversa
uinv = torch.inverse(U)
print("inversa  ", uinv )

# ortonormal
U = torch.tensor( [ [1., 0., 0.], [0., 1., 0.] , [0., 0., 1.] ] ) 
ut = torch.transpose( U, 0, 1)
r = torch.mm( U, ut)
print( r )
print("normas ")
print( torch.norm(U[:,0]))
print( torch.norm(U[:,1]))
print( torch.norm(U[:,2]))
# es ortonormal

## Pseudo inversa  de una matriz (de Moore-Penrose)


La pseudo inversa de Moore-Penrose es una matriz que puede actuar como un reemplazo parcial de la matriz inversa en los casos en que no existe. Esta matriz se usa con frecuencia para resolver un sistema de ecuaciones lineales cuando el sistema no tiene una solución única o tiene muchas soluciones.

Para cualquier matriz A, la pseudo inversa B existe, es única y tiene las mismas dimensiones que A. Si A es cuadrada y no singular, entonces pinv (A) es simplemente una forma costosa de calcular inv (A). Sin embargo, si A no es cuadrada, o es cuadrada y singular, entonces inv (A) no existe. 


La siguiente es una propiedad importante;

1. $ \left(A^{T}A\right)^{-1}A^{T}\approx A^{+} $

2.  $\left(A^{T}A\right)^{+}A^{T}=A^{+}$

In [0]:
    
#pseudo inverse of invertible matrix  
print("C matrix")
print(C)
C = torch.tensor([ [1. , 2. ], [3. , 4. ] , [5. , 6.] ] )
try:
  C.inverse()
  print("Éxito en la inversa de C")
except:
  print("Falló la inversa de C")
Cpinv = C.pinverse()
print("Pseudo inverted C", Cpinv)
I = C.mm(Cpinv)
print("C * Cpinv ", I)

