# Clase 03 de mayo de 2023 #

## Módulo II. Estadística y Probabilidad con Python ##

**Calificación**:
- Examen **90%**
- Participación **10%**  

**1 o 2 descansos de 10 minutos**.   

**Ejercicios, dudas y comentarios**: andres.garcia@itam.mx

Tareas (opcionales) para practicar lo realizado en clase  
Puntos extra al realizar tareas y kahoot $ \rightarrow $ Si juntan **3 puntos** exentan el examen

## Conceptos básicos de álgebra lineal #

In [None]:
import numpy as np
import matplotlib.pyplot as plt

### Escalares
Nos referimos a un escalar como un único número. Al trabajar con un escalar haremos referencia a la clase de elementos al cuál pertenece por medio de la notación

$$
    a \in D
$$

Donde $a$ es el escalar y $D$ el conjunto al cuál pertenece.  

En python, al declarar
$$
 a \in \mathbb{R}
$$

Sería equivalente a tener una variable `a` de tipo `float`

### Vectores

Un vector es un arreglo ordenado de elementos, todos de la misma clase de elementos. Denotaremos matemáticamente un vector $\bf x$ en negrillas y la i-ésima entrada del vector por medio de $x_i$

$$
{\bf x} = \begin{bmatrix} 
x_1 \\
x_2 \\
\vdots \\
x_N
\end{bmatrix}
$$

Equivalente a un escalar, al declarar un vector denotaremos el conjunto al cual pertenece y los elementos dentro de este. Por ejemplo, si declaramoos el siguiente vector

$$
    {\bf x} \in \mathbb{R}^5
$$

Estaríamos diciendo que $\bf x$ tiene 5 elementos, cada uno de ellos números reales. En Python, esta representación estaría dada por un numpy array de 5 elementos, cada uno de ellos números flotantes

**Inicializar arrays numpy**

In [None]:
x = np.array([3.4, 1.4, 0.5, 10.4, 0.0])
x

In [None]:
x2 = np.arange(10)
x2

In [None]:
x3 = np.ones(5)
x3

In [None]:
x4 = np.zeros(8)
x4

In [None]:
# Vector columna
x_col = np.array([ [0], [1], [2]])

# Vector fila
x_fila = np.array([0, 1, 2, 1])

print(x_col,"\n")
print(x_fila)

In [None]:
# Transpuesta
x_col.T

Geométricamente, podemos pensar un vector como una flecha que apunta desde el origen hasta una coordenada dada en un espacio $n$-dimensional

In [None]:
# Para mostrar las graficas dentro del notebook sin tener que poner
# plt.show()
%matplotlib inline

In [None]:
x = np.array([1, 2])
y = np.array([4.5, 0.5])

plt.arrow(0, 0, 1, 2, width=0.05, length_includes_head=True,
          color="tab:blue", )
plt.arrow(0, 0, 4.5, 0.5, width=0.05, length_includes_head=True,
          color="tab:red")
plt.xlim(0, 5)
plt.ylim(0, 3)
plt.title(r"Dos vectores en $\mathbb{R}^2$", fontsize=17)
plt.grid()

In [None]:
x = np.array([1, 2])
y = np.array([2.5, 0.5])

print("Suma vectores (numpy):", x+y)

plt.arrow(0, 0, *x, width=0.05, length_includes_head=True,
          color="tab:blue", )
plt.arrow(*y, *x, width=0.05, length_includes_head=True,
          color="tab:blue", )
plt.arrow(0, 0, *y, width=0.05, length_includes_head=True,
          color="tab:red")
plt.arrow(0, 0, *(x+y), width=0.05, length_includes_head=True,
          color="tab:orange")
plt.xlim(0, 5)
plt.ylim(0, 5)
plt.title(r"Suma de vectores", fontsize=17)
plt.grid()

In [None]:
x = np.array([1, 2])

print("Multiplicacion escalares (numpy):", 2*x)

plt.arrow(0, 0, *(2*x), width=0.05, length_includes_head=True,
          color="tab:green")
plt.arrow(0, 0, *x, width=0.05, length_includes_head=True,
          color="tab:blue", )
plt.xlim(0, 5)
plt.ylim(0, 5)
plt.title(r"Multiplicacion por un escalar ($2\cdot\vec{v}$)", fontsize=17)
plt.grid()
plt.show()

**Producto Punto**  
$x\cdot y=\sum x_i y_i$

In [None]:
x = np.array([5,1,3])
y = np.array([9,0,1])

# Producto punto
np.dot(x,y)

In [None]:
# Operaciones vectores
print('Suma elemento a elemento:', x + y)
print('Multiplicacion elemento a elemento:', x * y)
print('\nExisten varias formas de calcular el producto punto:')
print('Producto punto 1:', np.sum(x * y))
print('Producto punto 2:', np.dot(x,y))
print('Producto punto 3 : ', np.inner(x,y))
print('Producto punto 4: ', x@y)

In [None]:
# Multiplicar 4 matrices: A B C D
np.dot(A, np.dot(B, np.dot( C, D)))

A @ B @ C @ D 

**Producto Punto (Ángulo entre dos vectores):**  
$v\cdot w=\lVert v \rVert_2 \lVert w \rVert_2 \cos \theta$

**Norma $L_p$ de un vector** <br>

En álgebra lineal, la norma $L_p$ se refiere a una medida de la magnitud de un vector o matriz en un espacio vectorial. La norma $L_p$ de un vector $v$ se define formalmente como:

Sea $\mathbf{v}$ un vector con elementos $v_{i}$ con $v_{i} \in \mathbb{R} \, \forall i  \, \in \mathbb{N}$. La norma $L_{p}$ de un vector, denotada por $||\mathbf{v}||_{p}$ es dada por 

$$ ||\mathbf{v}||_{p} = (\sum |v_i|^p)^{1/p} $$

Donde $v_1, v_2, ..., v_n$ son las coordenadas del vector $\mathbf{v}$, y $p \in \mathbb{R}^{+}$.

En la práctica, las normas $L_p$ se utilizan para medir la "distancia" entre dos vectores o para establecer umbrales de error en la solución de sistemas de ecuaciones lineales. En particular, la norma $L_2$ (también conocida como norma euclidiana) es muy común en aplicaciones de probabilidad y esatistica. En general, cuanto mayor es el valor de $p$, más "importancia" se le da a los componentes más grandes del vector. 

El siguiente grafico muestra las regiones generadas por las diferentes normas $L_p$ calculadas utilizando los vectores que generan el circulo unitario.

![Normas Lp](img/LpNorms.jpg)

De momento nos concentraremos en estudiar los casos $p=2$ (norma euclideana) y $p=\infty$ (norma máxima), respectivamente:

$$ ||\mathbf{v}||_{2} = (\sum |v_i|^2)^{1/2} $$
$$ ||\mathbf{v}||_{\infty} = \text{max}(v_{1}, v_{2}, ... ,v_{n}) $$

**Transformaciones lineales** <br>
Una transformación lineal es una función que transforma un vector en otro vector, de tal manera que se preservan la suma y la multiplicación por un escalar. Formalmente, una transformación lineal $f$ es una función que satisface las siguientes propiedades:

- $\forall \, u, v \in f^{-1}, \, f(u + v) = f(u) + f(v)$.

- $\forall \, a \in \mathbb{R} \wedge v \in V, \, f(av) = a f(v)$

In [None]:
# Definimos 2 vectores arbitrariamente
x = np.array([1,2])
y = np.array([3,4])

# Definimos 2 escalares arbitrariamente
a = 2
b = 3

# Definimos una función LINEAL
def f_lineal(vector):
    return vector / 2
# Y otra no lineal
def f_nonlinear(vector):
    return vector**2

print('Función lineal')
print( f_lineal(2*x+3*y) )
print( a*(f_lineal(x))+b*f_lineal(y) )
print()
print('Función No lineal')
print( f_nonlinear(2*x+3*y) )
print( a*(f_nonlinear(x))+b*f_nonlinear(y) )

### Dependencia e independencia lineal ###

Una colección de tamaño $n$ de vectores $\vec{v_i}$ es linealmente independiente si:  
$\beta_1\vec{v_1}+...+\beta_n\vec{v_n}=0$  
solo se cumple cuando todas las $\beta$ son iguales a 0.

In [None]:
x = np.array([0,1])
y = np.array([0,2])

v_zero = np.array([0,0])

In [None]:
0*x + 0*y

In [None]:
(-2)*x + (1)*y

Para dos vectores $x$ e $y$ y dos escalares $a$ y $b$, $F$ es una **transformación lineal** si:  
$F(ax+by)=aF(x)+bF(y)$

In [None]:
x = np.array([1,2])
y = np.array([3,4])

a = 2
b = 3
# Saquemos el valor negativo de nuestro vector
def f(vector):
    return -1*vector

print(f(2*x+3*y))
print(a*(f(x))+b*f(y))

### Ejercicios ###
1. Calcula el valor promedio de un vector usando el producto punto
2. Calcula el valor presente de una serie de flujos anuales de \$100 por 15 años suponiendo una tasa anual constante del 8% (anualidad vencida).
3. La distancia entre dos vectores $x$ e $y$ está dada por $\lVert x-y \rVert_2$. Escribe una función que encuentre el vecino más cercano de un vector entre una lista de vectores.
4. Crea una función que tome como entrada dos vectores de las mismas dimensiones y una tolerancia positiva y cercana a 0. El resultado debe ser True si el angulo entre los dos vectores menos pi/2 es menor que la tolerancia. En caso contrario regresar False.  
5. Crea una función que tome como entrada dos strings y una tolerancia positiva y cercana a 0. A partir de las strings deberás construir dos vectores, en los que el primer elemento será el número de 'a' en el string, el segundo de 'b' y así sucesivamente. El output debe ser 1 si el ángulo entre los dos vectores es menor a la tolerancia.

### Matrices

Una matriz $\bf X$ es un arreglo bi-dimensional de números (equivalente a un numpy array con `ndim == 2`). Denotaremos la $(i, j)$-ésima entrada de una matriz $\bf X$ por medio de $X_{i,j}$.

$$
{\bf X} = \begin{bmatrix}
x_{1,1} & x_{1,2} & \ldots & x_{1,M} \\
x_{1,1} & x_{1,2} & \ldots & x_{2,M} \\
\vdots & \vdots & \vdots & \vdots \\
x_{N,1} & x_{N,2} & \ldots & x_{N,M}
\end{bmatrix}
$$

A fin de hacer la notación más compacta, declararemos una matriz $\bf A$ con $N$ filas y $M$ columnas como

$$
    {\bf A} \in \mathbb{R}^{N\times M}
$$

* De una manera geométrica, una matriz representa una _transformación lineal_ de un espacio en $\mathbb{R}^n$. Un ejemplo visual de esto se puede encontrar [aquí](https://www.geogebra.org/m/YCZa8TAH).

**Algunas matrices particulares**
1. Una matriz ${\bf A} \in \mathbb{R}^{n\times n}$ es conocida como una matriz cuadrada
2. Denotamos la matriz identidad $\bf I\in \mathbb{R}^{n\times n}$ como una matriz cuadrada tal que $I_{i,j} = \mathbb{1}_{i=j}$
3. Matemáticamente, expresamos un vector como un vector columna, es decir, ${\bf a} \in \mathbb{R}^{n\times 1}$.

In [None]:
np.array([
    [1,2,3],
    [4,5,6],
    [7,8,9]
])

In [None]:
np.ones((5,10))

In [None]:
a = np.matrix('1 2; 3 4')
a

In [None]:
a = np.arange(20)
a

In [None]:
a = a.reshape(4,5)
a

In [None]:
np.identity(5)

**Propiedades de matrices en numpy**

In [None]:
# Dimensiones de la matriz
a.shape

In [None]:
# Numero de elementos
a.size

In [None]:
# Tipo de datos
a.dtype

**Selección de elementos de una matriz**

In [None]:
x = a
x

In [None]:
x[1,0] # fila 1, columna 0

In [None]:
x[1] # fila 1

In [None]:
x[1][0] # fila 1, columna 0

In [None]:
# Todos los elementos de la primera columna
x[:,0]

In [None]:
# Todos los elementos de la primera fila
x[0,:]

In [None]:
x[0]

**Operaciones**

In [None]:
x

In [None]:
# Transpuesta matriz
x.T

In [None]:
# Multiplicaciones por un escalar
5 * x

In [None]:
# Suma de matrices
y = np.ones((4,5))
print(y)
x + y

In [None]:
# Multiplicacion elemento a elemento
y = np.zeros((4,5))
x * y

**Multiplicación de matrices**
![image-2.png](attachment:image-2.png)
![image-3.png](attachment:image-3.png)

In [None]:
x

In [None]:
y = np.ones((5,4))
y

In [None]:
x @ y

In [None]:
np.dot(x, y)

### Ejercicios ###
1. Haz un ejemplo en el que verifiques que para las matrices se cumple la propiedad: $A(B+C)=AB+AC$.
2. Implementa la multiplicación de una matriz de 2x4 y una matriz de 4x3.

**Determinante**

In [None]:
A = np.arange(1,5).reshape((2,2))
np.linalg.det(A)

**Inversa de una matriz**: Es análogo a la inversa de un número.  
N es la inversa de la matriz M si:  
$M\cdot N=I$

In [None]:
np.linalg.inv(A)

In [None]:
A @ np.linalg.inv(A)

In [None]:
# Si el determinante de una matriz es 0 quiere decir que la matriz es singular (no tiene inversa)
X = np.array([
    [0, 1, 0],
    [0, 0, 0],
    [1, 0, 1]
])
X

In [None]:
np.linalg.det(X)

In [None]:
# Debe dar error!
np.linalg.inv(X)

**Rango**: El rango de una matriz A de m x n es el número de columnas o filas linealmente independientes.

In [None]:
X

In [None]:
np.linalg.matrix_rank(X)

In [None]:
Y = np.random.random((3,3))
Y

In [None]:
np.linalg.matrix_rank(Y)

### Ejercicios ###
1. Una matriz de rotación de 2 dimensiones está definida como:  
$R=\begin{bmatrix}
\cos{\theta} & -\sin{\theta}\\
\sin{\theta} & \cos{\theta}
\end{bmatrix}$  
Utiliza una matriz de rotación para rotar el vector (1,1) en 90°.

2. La convolución de un vector $a$ de tamaño n y un vector $b$ de tamaño m es el vector $c$ denotado por $a\ast b$ con elementos:  
$c_k=\sum_{i+j=k+1}a_i b_j, k=1,..,n+m-1$  
$ c_1 = a_1b_1 $  
$ c_2 = a_1b_2 + a_2b_1 $  
$ c_3 = a_2b_2 + a_1b_3 + a_3b_1 $

En el caso de matrices se puede generalizar, si $A$ es una matriz de m x n y $B$ es una matriz de p x q entonces $C$ será la matriz de (m+p-1)x(n+q-1) con la convolución
![image.png](attachment:image.png)
Escribe un programa que realice convoluciones de matrices