# **SESIÓN 01**
# **INTRODUCCIÓN AL ÁLGEBRA LINEAL**
## **ESPECIALIZACIÓN: MATEMÁTICA Y ESTADÍSTICA PARA CIENCIA DE DATOS**
## **MÓDULO 1: FUNDAMENTOS MATEMÁTICOS PARA CIENCIAS DE DATOS**

### **Docente**: Mg. Leonel Heredia Altamirano

# **SECCIÓN 1: MATRICES**

# **I.- Especificación de matrices**

Se desea declarar la siguiente matriz: 
$$A=\begin{pmatrix}6&5&4&1.2\\ 6&4&7&7\\ 8&2.5&1.15&6\\ 4&5&7&3\end{pmatrix}$$

In [None]:
import numpy as np
np.set_printoptions(formatter={'float': lambda x: "{0:0.4f}".format(x)})

A = np.array([[6, 5, 4, 1.2],
              [6, 4, 7, 7],
              [8, 2.5, 1.15, 6],
              [4, 5, 7, 3]])
print("La matriz A es: ")
print(A)

Para una matriz de orden 2 $\times$ 3:
$$B=\begin{pmatrix}5&\sqrt{7}&e^2\\ 7&-\frac{1}{7}&6\end{pmatrix}$$

In [None]:
B = np.array([[5, np.sqrt(7), np.exp(2)],
              [7, -1/7, 6]])
print("La matriz B es: ")
print(B)

Para un vector columna (matriz con una columna):
$$C=\begin{pmatrix}8\\ \sqrt[5]{6}\\ \frac{1}{2}\\ -7\\ 4\\ 3.5\\ ln15\end{pmatrix}$$

In [1]:
C = np.array([[8], 
              [6**(1/5)], 
              [1/2], 
              [-7], 
              [4], 
              [3.5], 
              [np.log(15)]])
print("La matriz C es: ")
print(C)

NameError: name 'np' is not defined

Para un vector fila (matriz con una fila):
$$D=\begin{pmatrix}\sqrt{21}&\sqrt[7]{20}&\frac{1}{\sqrt[9]{3}}&ln8&7.361&e^{-6}&\frac{1}{2}&3\end{pmatrix}$$

In [None]:
D = np.array([[np.sqrt(21), 
               20**(1/7), 
               3**(-1/9), 
               np.log(8), 
               7.361, 
               np.exp(-6), 
               1/2, 
               3]])

print("La matriz D es: ")
print(D)

# **II.- Matrices especiales**

## **a) Matriz cuadrada**

Crear una matriz cuadrada de orden 6 con números aleatorios

In [None]:
import pandas as pd
np.random.seed(123)
A = np.random.randn(6, 6)
A = pd.DataFrame(A)
print(A)

## **b) Matriz diagonal**

Crear una matriz diagonal de orden 4 con números aleatorios con distribución $N(\mu=6,\sigma=1.75)$

In [None]:
np.random.seed(123)
random_numbers = np.random.normal(6, 1.75, 4)
C = np.diag(random_numbers)
C = pd.DataFrame(C)
print(C)

## **c) Matriz Identidad**

Crear una matriz identidad de orden 5

In [None]:
D = np.eye(5)
print(D)

## **d) Matriz nula**

Crear una matriz nula de orden 15 $\times$ 7

In [None]:
E= np.zeros((15, 7))
print(E)

## **e) Matriz triangular superior**

Crear una matriz triangular superior de orden 5

In [None]:
triangular_upper_matrix = np.triu(np.random.rand(5, 5))
G = pd.DataFrame(triangular_upper_matrix)
print(G)

## **f) Matriz triangular inferior**

Crear una matriz triangular inferior de orden 5

In [None]:
triangular_lower_matrix = np.tril(np.random.rand(5, 5))
G = pd.DataFrame(triangular_lower_matrix)
print(G)

## **g) Matriz transpuesta**

Si creamos una matriz de orden 3 $\times$ 6

In [None]:
np.random.seed(123)
A = np.random.normal(3, 0.2, size=(3, 6))
A = pd.DataFrame(A)
print(A)

La transpuesta es:

In [None]:
print(A.T)

### **Propiedades**

In [None]:
# Definir el tamaño de la matriz (ejemplo: 5x5)
n = 6

# Generar matrices aleatorias A y B con decimales entre -10 y 10
A = np.random.uniform(-10, 10, (n, n))
print("===============================")
print("Matriz A")
print("===============================")
print(A)

B = np.random.uniform(-10, 10, (n, n))
print("Matriz B")
print("===============================")
print(B)

# Crear un escalar aleatorio λ con decimales
lamb = np.random.uniform(1, 10)
print("El escalar es: ", lamb)

In [None]:
# Propiedad 1: (A⁻¹)ᵗ = (Aᵗ)⁻¹ (Solo si A es invertible)
if np.linalg.det(A) != 0:
    A_inv_T = np.linalg.inv(A).T
    A_T_inv = np.linalg.inv(A.T)
    print("Propiedad 1:", np.allclose(A_inv_T, A_T_inv))
else:
    print("Propiedad 1: No se puede calcular porque A no es invertible")

print("============================")
print("(A⁻¹)ᵗ")
print("============================")
print(A_inv_T)

print("============================")
print("(Aᵗ)⁻¹")
print("============================")
print(A_T_inv)

In [None]:
# Propiedad 2: (A + B)ᵗ = Aᵗ + Bᵗ
sum_T = (A + B).T
T_sum = A.T + B.T
print("Propiedad 2:", np.allclose(sum_T, T_sum))

print("============================")
print("(A + B)ᵗ")
print("============================")
print(sum_T)

print("============================")
print("Aᵗ + Bᵗ")
print("============================")
print(T_sum)

In [None]:
# Propiedad 3: (λA)ᵗ = λ Aᵗ
scalar_T = (lamb * A).T
T_scalar = lamb * A.T
print("Propiedad 3:", np.allclose(scalar_T, T_scalar))

print("============================")
print("(λA)ᵗ")
print("============================")
print(scalar_T)

print("============================")
print("λ Aᵗ")
print("============================")
print(T_scalar)

In [None]:
# Propiedad 4: (AB)ᵗ = Bᵗ Aᵗ
AB_T = (A @ B).T
T_B_T_A = B.T @ A.T
print("Propiedad 4:", np.allclose(AB_T, T_B_T_A))

print("============================")
print("(AB)ᵗ")
print("============================")
print(AB_T)

print("============================")
print("Bᵗ Aᵗ")
print("============================")
print(T_B_T_A)

## h) Traza de una matriz

In [None]:
A = np.random.normal(size=(7, 7))
A = pd.DataFrame(A)
print(A)

In [None]:
# Calcular la traza de la matriz
trace = np.trace(A)
print("Traza de la matriz:", trace)

In [None]:
import numpy as np

# Semilla para reproducibilidad
np.random.seed(42)

# Matrices aleatorias de 4x4 con valores enteros entre -10 y 10
A = np.random.randint(-10, 11, (4, 4))
B = np.random.randint(-10, 11, (4, 4))
C = np.random.randint(-10, 11, (4, 4))
alpha = 5

print("Matriz A:\n", A)
print("Matriz B:\n", B)
print("Matriz C:\n", C)
print()

In [None]:
# 1. Linealidad
print("Propiedad 1: Linealidad")
print("tr(A + B):", np.trace(A + B))
print("tr(A) + tr(B):", np.trace(A) + np.trace(B))
print("tr(alpha * A):", np.trace(alpha * A))
print("alpha * tr(A):", alpha * np.trace(A))
print()

In [None]:
# 2. Invariancia bajo transposición
print("Propiedad 2: Invariancia bajo transposición")
print("tr(A):", np.trace(A))
print("tr(A.T):", np.trace(A.T))
print()

In [None]:
# 3. Relación con el producto de matrices
print("Propiedad 3: tr(AB) = tr(BA)")
AB = A @ B
BA = B @ A
print("tr(AB):", np.trace(AB))
print("tr(BA):", np.trace(BA))
print()

In [None]:
# 4. Propiedad cíclica
print("Propiedad 4: Ciclidad de la traza")
ABC = A @ B @ C
BCA = B @ C @ A
CAB = C @ A @ B
print("tr(ABC):", np.trace(ABC))
print("tr(BCA):", np.trace(BCA))
print("tr(CAB):", np.trace(CAB))
print()

In [None]:
# 5. Matriz diagonal
print("Propiedad 5: Matriz diagonal")
D = np.diag(np.random.randint(1, 21, 4))
print("Matriz diagonal D:\n", D)
print("tr(D):", np.trace(D))
print("Suma de los elementos diagonales:", np.sum(np.diag(D)))

# **IV.- Suma de matrices**

Se crean 2 matrices de orden 6 $\times$ 5 : 

In [None]:
A = np.random.randn(6, 5)
print("Matriz A:")
print(A)

In [None]:
B = np.random.normal(5, 2, size=(6, 5))
print("\nMatriz B:")
print(B)

La suma de matrices se define como: 

In [None]:
print("Suma de matrices: ")
print(A+B)

# **V.- Producto de un escalar por una matriz**

Se define una matriz de orden 8 $\times$ 5:

In [None]:
C = np.random.normal(size=(8, 5))
C = pd.DataFrame(C)
print("\nMatriz C:")
print(C)

Si se desea calcular: $\sqrt{7}\left[C\right]_{8\times 5}$

In [None]:
print("Matriz resultado: ")
print(np.sqrt(7)*C)

In [None]:
print("¿Son iguales?: ", np.allclose(C[0:0],np.sqrt(7)*C[0:0]))

Si se definen dos matrices de orden 7 $\times$ 4:

In [None]:
A = np.random.uniform(10, 21, size=(7, 4))
print("Matriz A:")
print(A)

In [None]:
B = np.random.uniform(14, 26, size=(7, 4))
print("\nMatriz B:")
print(B)

Se desea calcular la matriz: $P=2.35\cdot A+ln13\cdot B$

In [None]:
print(2.35*A)

In [None]:
print(np.log(13)*B)

In [None]:
P = 2.35*A+np.log(13)*B
print("Matriz resultado: ")
print(P)

Se desea calcular la matriz: $Q = \sqrt{33}\cdot A + \frac{17}{\ln 8}\cdot B$

In [None]:
print(np.sqrt(33)*A)

In [None]:
print((17)/(np.log(8))*B)

In [None]:
Q = np.sqrt(33)*A + (17)/(np.log(8))*B
print("Matriz resultado: ")
print(Q)

# **VI.- Multiplicación de matrices**

Se define dos matrices y se requiere calcular: $A_{5\times 6}\times B_{6\times 3}$

In [None]:
A = np.random.uniform(1, 3, size=(5, 6))
print("Matriz A:")
print(A)

In [None]:
B = np.random.uniform(2, 9, size=(6, 3))
print("\nMatriz B:")
print(B)

In [None]:
print("El producto A y B")
print(np.dot(A,B))

Si se desea calcular: $\frac{1}{2}\cdot A\times e^3\cdot B$

In [None]:
print(1/2*A)

In [None]:
print(np.exp(3)*B)

In [None]:
R = np.dot(1/2*A, np.exp(3)*B)
print("Matriz resultado:")
print(R)

# **VII.- Determinante de una matriz**

Se crea una matriz cuadrada de orden 6 $\times$ 6:

In [None]:
np.random.seed(123)
A = np.random.uniform(1, 10, size=(6, 6))
print("Matriz A:")
print(A)

La determinante es: 

In [None]:
print("El determinante de la matriz es: ", np.linalg.det(A))

Por ejemplo, se declara la siguiente matriz B:
$$B=\begin{pmatrix}3&\sqrt{11}&e^{-2}&5\\ \frac{1}{16}&1.1&0&2^e\\ 5&\frac{1}{log18}&1&2\\ 4&-1&0&7\end{pmatrix}$$

In [None]:
B=np.array([[3,np.sqrt(11),np.exp(-2),5],[1/16,1.1,0,2**(np.exp(1))],
      [5,1/(np.log10(18)),1,2],[4,-1,0,7]])
print("Matriz B: ")
print(B)

In [None]:
print("El determinante de la matriz B es:",np.linalg.det(B))

Por ejemplo, se declara la matriz C: 
$$C=\begin{pmatrix}\frac{1}{28}&\sqrt{7}&\frac{1}{\sqrt{11}}&e^{\sqrt{8}}&cos\left(5\right)\\ sen\left(20\right)&7&6.25&ln10&4\\ 1&2&e&10&7\\ 6.75&4^e&\sqrt[3]{11}&1&0\\ 3&3.25&\sqrt[5]{10}&20&7\end{pmatrix}$$

In [None]:
import math

C=np.array([[1/28, math.sqrt(7), 1/(math.sqrt(11)), math.exp(math.sqrt(8)), math.cos(5)],
[math.sin(20),7,6.25,math.log(10),4], [1,2,math.exp(1),10,7],
[6.75,4**math.exp(1),11**(1/3),1,0],[3,3.25,10**(1/5),20,7]])
print("Matriz C:")
print(C)

In [None]:
print("El determinante de la matriz C es:",np.linalg.det(C))

# **VIII.- Rango de una matriz**

Se crea una matriz cuadrada de orden 5 $\times$ 5:

In [None]:
np.random.seed(123)
A = np.random.uniform(10, 36, size=(5, 5))
print("Matriz A:")
print(A)

In [None]:
print("El rango de A es:", np.linalg.matrix_rank(A))

In [None]:
print("El rango de B es:", np.linalg.matrix_rank(B))
print("El rango de C es:", np.linalg.matrix_rank(C))

# **IX.- Inversa de una matriz**

In [None]:
print("La inversa de A es:")
print(np.linalg.inv(A))

In [None]:
print("La inversa de B es:")
print(np.linalg.inv(B))

In [None]:
print("La inversa de C es:")
print(np.linalg.inv(C))

# **SECCIÓN 2: SISTEMAS DE ECUACIONES LINEALES**

## **Ejercicio 01**

Hallar la solución del siguiente sistema:
$$\left\{
			\begin{array}{ll}
				x+3y-z=0 \\
				3x-4y+z=2 \\
				2x+2y+z=13
			\end{array}
			\right.$$

In [None]:
#MÉTODO DE CRAMER
# Definir la matriz de coeficientes A y el vector de términos independientes B
A = np.array([[1, 3, -1],
              [3, -4, 1],
              [2, 2, 1]])

B = np.array([0, 2, 13])

# Resolver el sistema de ecuaciones lineales
solucion = np.linalg.solve(A, B)

# Imprimir la solución
print("La solución del sistema es:")
print(f"x = {solucion[0]}")
print(f"y = {solucion[1]}")
print(f"z = {solucion[2]}")

## **Ejercicio 02**

Hallar la solución del siguiente sistema:
$$\left\{
		\begin{array}{ll}
			x+y+2z+3w=1 \\
			3x-y-z-2w=-4 \\
			2x+3y-z-w=-6 \\
			x+2y-3z-w=-4
		\end{array}
		\right.$$

In [None]:
#MÉTODO DE CRAMER
# Definir la matriz de coeficientes A y el vector de términos independientes B
A = np.array([[1, 1, 2, 3],
              [3, -1, -1, -2],
              [2, 3, -1, -1],
              [1, 2, -3, -1]])

B = np.array([1, -4, -6, -4])

# Resolver el sistema de ecuaciones lineales
solucion = np.linalg.solve(A, B)

# Imprimir la solución
print("La solución del sistema es:")
print(f"x = {solucion[0]}")
print(f"y = {solucion[1]}")
print(f"z = {solucion[2]}")
print(f"w = {solucion[3]}")

## **Ejercicio 03**

Hallar la solución del siguiente sistema:
$$\left\{
		\begin{array}{ll}
			2x+y+z+w+u=2 \\
			x+2y+z+w+u=0 \\
			x+y+3z+w+u=3 \\
			x+y+z+4w+u=-2 \\
			x+y+z+w+5u=5
		\end{array}
		\right.$$

In [None]:
#MÉTODO DE CRAMER
# Definir la matriz de coeficientes A y el vector de términos independientes B
A = np.array([[2, 1, 1, 1, 1],
              [1, 2, 1, 1, 1],
              [1, 1, 3, 1, 1],
              [1, 1, 1, 4, 1],
              [1, 1, 1, 1, 5]])

B = np.array([2, 0, 3, -2, 5])

# Resolver el sistema de ecuaciones lineales
solucion = np.linalg.solve(A, B)

# Imprimir la solución
print("La solución del sistema es:")
print(f"x = {solucion[0]}")
print(f"y = {solucion[1]}")
print(f"z = {solucion[2]}")
print(f"w = {solucion[3]}")
print(f"u = {solucion[4]}")

## **Ejercicio 04**

Hallar la solución del siguiente sistema:
$$\begin{pmatrix}1&\frac{2}{5}&\frac{1}{7}&log\left(\frac{3}{11}\right)&\frac{17}{16}&\frac{1}{7}\\ \frac{2}{3}&\frac{4}{5}&\frac{7}{11}&\frac{3}{22}&\sqrt{11}&2\\ 0&3&1&4&\frac{4}{9}&\frac{11}{12}\\ \frac{3}{11}&\frac{4}{19}&\frac{7}{19}&\frac{4}{89}&\frac{19}{173}&\sqrt{91}\\ \frac{3}{\sqrt{41}}&\frac{7}{11}&log\left(\frac{1}{11}\right)&5&6&7\\ 3&4&7&\frac{1}{17}&4&\frac{1}{7}\end{pmatrix}\begin{pmatrix}x\\ y\\ z\\ w\\ a\\ b\end{pmatrix}=\begin{pmatrix}\frac{8}{9}\\ \frac{7}{13}\\ \sqrt{\frac{23}{21}}\\ \sqrt{3}\\ \frac{18}{111}\\ \frac{4}{3}\end{pmatrix}$$

In [None]:
import numpy as np
import sympy as sp

# Definir los elementos de la matriz A y el vector B usando sympy
A = sp.Matrix([
    [1, 2/5, 1/7, sp.log(3/11), 17/16, 1/7],
    [2/3, 4/5, 7/11, 3/22, sp.sqrt(11), 2],
    [0, 3, 1, 4, 4/9, 11/12],
    [3/11, 4/19, 7/19, 4/89, 19/173, sp.sqrt(91)],
    [3/sp.sqrt(41), 7/11, sp.log(1/11), 5, 6, 7],
    [3, 4, 7, 1/17, 4, 1/7]
])

B = sp.Matrix([
    8/9,
    7/13,
    sp.sqrt(23/21),
    sp.sqrt(3),
    18/111,
    4/3
])

# Calcular la inversa de A
A_inv = A.inv()

# Calcular la solución
solution = A_inv * B

# Mostrar la solución en formato numérico
numeric_solution = solution.evalf()
print("La solución del sistema es:")
for var, value in zip(['x', 'y', 'z', 'w', 'a', 'b'], numeric_solution):
    print(f"{var} = {value}")

# **SECCIÓN 3: APLICACIONES DE MATRICES**

## Ejercicio 01

Se presenta el siguiente sistema de ecuaciones lineales que relaciona las variables en entidades financieras respecto al saldo final de operaciones de un año en particular:
- **GO**: Gasto operativo (miles de dólares)
- **LIQ**: Liquidez corriente (miles de dólares)
- **MOR**: Morosidad de principal cartera de clientes (miles de clientes)
- **PAC**: Pasivo corriente (miles de dólares)
- **ACC**: Activo corriente (miles de dólares)
- **PAT**: Patrimonio neto (miles de dólares)
- **CCP**: Cuentas por pagar a proveedores (miles de dólares)

El sistema, representado de manera matricial, se presenta a continuación: 
$$\begin{pmatrix} 
    0.176&	0.118&	0.673&	0.534&	0.177&	0.034&	0.178 \\
    0.796&	0.247&	0.031&	0.672&	0.944&	0.111&	0.736 \\
    0.337&	0.184&	0.088&	0.911&	0.210&	0.958&	0.444 \\
    0.386&	0.597&	0.492&	0.821&	0.493&	0.758&	0.441 \\
    0.178&	0.863&	0.952&	0.336&	0.585&	0.290&	0.139 \\
    0.509&	0.230&  0.687&	0.877&	0.149&	0.460&	0.709 \\
    0.423&	0.451&	0.826&	0.963&	0.040&	0.213&  0.667 \\
   \end{pmatrix} \begin{pmatrix} GO \\ LIQ \\ MOR \\ PAC \\ ACC \\ PAT \\ CCP  \end{pmatrix} = \begin{pmatrix} 0.831 \\
0.143 \\
0.724 \\
0.941 \\
0.922 \\
0.222 \\
0.468 \\
   \end{pmatrix}$$
Determine la solución del sistema

In [None]:
# Definir la matriz de coeficientes A
A = np.array([
    [0.176, 0.118, 0.673, 0.534, 0.177, 0.034, 0.178],
    [0.796, 0.247, 0.031, 0.672, 0.944, 0.111, 0.736],
    [0.337, 0.184, 0.088, 0.911, 0.210, 0.958, 0.444],
    [0.386, 0.597, 0.492, 0.821, 0.493, 0.758, 0.441],
    [0.178, 0.863, 0.952, 0.336, 0.585, 0.290, 0.139],
    [0.509, 0.230, 0.687, 0.877, 0.149, 0.460, 0.709],
    [0.423, 0.451, 0.826, 0.963, 0.040, 0.213, 0.667]
])

# Definir el vector de constantes b
b = np.array([0.831, 0.143, 0.724, 0.941, 0.922, 0.222, 0.468])

In [None]:
# Mostrar la solución en formato numérico
# Calcular la inversa de A
A_inv = np.linalg.inv(A)

# Calcular la solución
solution = np.dot(A_inv,b)

numeric_solution = solution
print("La solución del sistema es:")
for var, value in zip(['GO', 'LIQ', 'MOR', 'PAC', 'ACC', 'PAT', 'CCP'], numeric_solution):
    print(f"{var} = {value}")

## Ejercicio 02

Supongamos que tienes un portafolio con cinco activos financieros. Se te proporciona la siguiente información:

**Rendimientos esperados:** Un vector que contiene el rendimiento esperado de cada activo.
$$R= \begin{pmatrix}0.08 \\ 0.12 \\ 0.10 \\ 0.14 \\ 0.09 \end{pmatrix}$$

**Matriz de varianza-covarianza:** 
$$\Sigma= \begin{pmatrix}0.04 & 0.002 & 0.001 & 0.003 & 0.002 \\
0.002 & 0.03 & 0.0025 & 0.002 & 0.001 \\
0.001 & 0.0025 & 0.02 & 0.0015 & 0.001 \\
0.003 & 0.002 & 0.0015 & 0.025 & 0.002 \\
0.002 & 0.001 & 0.001 & 0.002 & 0.015 \end{pmatrix}$$

**Pesos del portafolio:** 
$$W= \begin{pmatrix}0.20 \\ 0.25 \\ 0.15 \\ 0.30 \\ 0.10 \end{pmatrix}$$

Hallar el rendimiento esperado y la varianza del portafolio

**RENDIMIENTO ESPERADO**
$$R_p= w^{T}R$$

In [None]:
# Datos
R = np.array([0.08, 0.12, 0.10, 0.14, 0.09])
w = np.array([0.20, 0.25, 0.15, 0.30, 0.10])

# Rendimiento esperado del portafolio
R_p = np.dot(w, R)

print(f"Rendimiento esperado del portafolio: {R_p:.4f}")

**VARIANZA DEL PORTAFOLIO**
$$\sigma^2_p = w^T\Sigma w$$

In [None]:
# Matriz de varianza-covarianza
Sigma = np.array([                
    [0.04, 0.002, 0.001, 0.003, 0.002],
    [0.002, 0.03, 0.0025, 0.002, 0.001],
    [0.001, 0.0025, 0.02, 0.0015, 0.001],
    [0.003, 0.002, 0.0015, 0.025, 0.002],
    [0.002, 0.001, 0.001, 0.002, 0.015]
])

# Varianza del portafolio
sigma_p_squared = np.dot(w.T, np.dot(Sigma, w))

# Desviación estándar del portafolio
sigma_p = np.sqrt(sigma_p_squared)

print(f"Varianza del portafolio: {sigma_p_squared:.4f}")
print(f"Desviación estándar del portafolio: {sigma_p:.4f}")

### **Caso de aplicación con datos reales**

Un inversionista desea construir un portafolio óptimo utilizando 10 acciones del S&P 500. Su objetivo es minimizar el riesgo (desviación estándar del portafolio) dado un nivel de rendimiento esperado. Las 10 acciones que usaremos como ejemplo son:
- Apple (AAPL)
- Microsoft (MSFT)
- Google (GOOGL)
- Amazon (AMZN)
- Tesla (TSLA)
- Meta (META)
- Nvidia (NVDA)
- JPMorgan Chase (JPM)
- Johnson & Johnson (JNJ)
- Procter & Gamble (PG)

In [None]:
import numpy as np
import pandas as pd
import yfinance as yf
import scipy.optimize as sco
import matplotlib.pyplot as plt

# 1. Definir las acciones y el periodo de análisis
tickers = ["AAPL", "MSFT", "GOOGL", "AMZN", "TSLA", "META", "NVDA", "JPM", "JNJ", "PG"]
start_date = "2017-01-01"
end_date = "2024-12-31"

# 2. Descargar datos de Yahoo Finance
data = yf.download(tickers, start=start_date, end=end_date)["Close"]

In [None]:
# Gráfico de evolución de los precios ajustados
plt.figure(figsize=(12, 6))

for ticker in tickers:
    plt.plot(data.index, data[ticker], label=ticker)

plt.xlabel("Fecha")
plt.ylabel("Precio Ajustado ($)")
plt.title("Evolución de los Precios Ajustados de las Acciones")
plt.legend(loc="upper left", fontsize=8)
plt.grid(False)

plt.show()

In [None]:
# 3. Calcular rendimientos logarítmicos
returns = np.log(data / data.shift(1)).dropna()
returns

In [None]:
# Gráfico de rendimientos logarítmicos
plt.figure(figsize=(12, 6))

for ticker in tickers:
    plt.plot(returns.index, returns[ticker], label=ticker, alpha=0.7)

plt.xlabel("Fecha")
plt.ylabel("Rendimiento Logarítmico")
plt.title("Evolución de los Rendimientos Logarítmicos de las Acciones")
plt.legend(loc="upper right", fontsize=8)
plt.axhline(y=0, color="black", linestyle="--", linewidth=1)  # Línea base en 0
plt.grid(False)

plt.show()

In [None]:
# 4. Cálculo de los rendimientos esperados y matriz de covarianza
expected_returns = returns.mean()  # Rendimiento anualizado
expected_returns

In [None]:
cov_matrix = returns.cov()  # Matriz de covarianza anualizada
cov_matrix

In [None]:
# 5. Función de minimización de la varianza del portafolio
def portfolio_volatility(weights, cov_matrix):
    return np.sqrt(weights.T @ cov_matrix @ weights)  # σ_p = sqrt(W' * Σ * W)

In [None]:
# 6. Restricciones y optimización del portafolio de mínima varianza
num_assets = len(tickers)
init_guess = np.ones(num_assets) / num_assets  # Pesos iniciales (iguales)
bounds = [(0, 1) for _ in range(num_assets)]  # Cada peso entre 0 y 1
constraints = [{"type": "eq", "fun": lambda w: np.sum(w) - 1}]  # Suma de pesos = 1

# Optimización para minimizar la varianza
opt_results = sco.minimize(portfolio_volatility, init_guess, args=(cov_matrix,), 
                           method="SLSQP", bounds=bounds, constraints=constraints)

In [None]:
# 7. Resultados óptimos
optimal_weights = opt_results.x
min_variance = portfolio_volatility(optimal_weights, cov_matrix)

In [None]:
# 8. Mostrar resultados
print("\nPesos Óptimos del Portafolio de Mínima Varianza:")
for ticker, weight in zip(tickers, optimal_weights):
    print(f"{ticker}: {weight:.4f}")

print(f"\nDesviación estándar del portafolio óptimo: {min_variance:.4%}")

In [None]:
# 9. Gráfico de distribución de pesos
plt.figure(figsize=(10, 5))
plt.bar(tickers, optimal_weights, color="skyblue")
plt.xlabel("Acciones")
plt.ylabel("Peso en el portafolio")
plt.title("Distribución de Pesos en el Portafolio Óptimo")
plt.xticks(rotation=45)
plt.show()

## Ejercicio 03

Estimar a través del método de mínimos cuadrados la estimación del modelo lineal-
$$\beta = (X^TX)^{-1}X^TY$$

In [None]:
#GENERACIÓN DE VARIABLES ALEATORIOS
# Número de datos a generar
n_samples = 350

# Generar valores aleatorios para las variables independientes
INFLACION = np.random.normal(loc=2, scale=0.5, size=n_samples)  # Inflación en porcentaje
DESEMPLEO = np.random.normal(loc=7, scale=1, size=n_samples)    # Tasa de desempleo en porcentaje
INTERES = np.random.normal(loc=3, scale=1.75, size=n_samples)   # Tasa de interés en porcentaje
GASTO_PUBLICO = np.random.normal(loc=100, scale=20, size=n_samples)  # Gasto público en miles de dólares

# Generar términos de error aleatorios
ALEATORIO = np.random.normal(loc=0, scale=0.5, size=n_samples)  # Error con distribución normal

# Calcular PIB usando la ecuación proporcionada
PIB = (0.251197 - 0.0759 * INFLACION - 0.5524 * DESEMPLEO
       - 0.1865 * INTERES + 0.0977 * GASTO_PUBLICO + ALEATORIO)

# Crear un DataFrame con los datos generados
data = pd.DataFrame({
    'PIB': PIB,
    'INFLACION': INFLACION,
    'DESEMPLEO': DESEMPLEO,
    'INTERES': INTERES,
    'GASTO_PUBLICO': GASTO_PUBLICO
})

# Mostrar las primeras filas del DataFrame
print(data.head())

In [None]:
# 2.- Estimación del vector de parámetros estimados
# -- Calculando el tamaño de muestra
n = len(data)

# -- Diseñando la matriz X
ind = data[['INFLACION', 'DESEMPLEO', 'INTERES', 'GASTO_PUBLICO']].values
constante = np.ones(n)
X = np.column_stack((constante, ind))

# -- Diseñando la matriz Y
Y = data['PIB'].values

# -- Cálculo de beta
X_transpose_X_inv = np.linalg.inv(X.T @ X)
beta = X_transpose_X_inv @ X.T @ Y

numeric_solution = beta
print("La solución del sistema es:")
for var, value in zip(['BO', 'B1', 'B2', 'B3', 'B4'], numeric_solution):
    print(f"{var} = {value}")

In [None]:
# 3.- Cálculo del error estándar
# -- Cálculo de los valores ajustados
y_hat = X @ beta

# -- Estimación del sigma cuadrado
mu2 = np.sum((Y - y_hat) ** 2)
sigma2 = mu2 / (n - X.shape[1])
print("Sigma2:", sigma2)

In [None]:
# -- Hallar la matriz de covarianzas
matriz_cov = sigma2 * X_transpose_X_inv
print("Matriz de covarianzas:\n", matriz_cov)

In [None]:
# -- Cálculo del error estándar
ee_b = np.sqrt(np.diag(matriz_cov))
print("Error estándar de beta0:", ee_b[0])
print("Error estándar de beta1:", ee_b[1])
print("Error estándar de beta2:", ee_b[2])
print("Error estándar de beta3:", ee_b[3])
print("Error estándar de beta4:", ee_b[4])

In [None]:
# 4.- Cálculo del coeficiente R2
# -- Cálculo de SCE
SCR = mu2
print("SCE:", SCR)

In [None]:
# -- Cálculo de SCR
y_media = np.mean(Y)
SCE = np.sum((y_hat - y_media) ** 2)
print("SCE:", SCE)

In [None]:
# -- Cálculo de SCT
SCT = SCE + SCR
print("SCT:", SCT)

In [None]:
# -- Cálculo del indicador
R2 = 1 - SCR / SCT
print("R2:", R2)

In [None]:
# 5.- Gráfica de dispersión entre variables
# a) Matriz de correlación
correlation_matrix = data[['PIB','INFLACION', 'DESEMPLEO', 'INTERES', 'GASTO_PUBLICO']].corr()
print("Matriz de correlación:\n", correlation_matrix)

In [None]:
import matplotlib.pyplot as plt 

# Gráficos de dispersión con líneas de ajuste
fig, axs = plt.subplots(2, 2, figsize=(14, 10))

variables = ['INFLACION', 'DESEMPLEO', 'INTERES', 'GASTO_PUBLICO']
for i, var in enumerate(variables):
    ax = axs[i // 2, i % 2]
    ax.scatter(data[var], data['PIB'], color="blue")
    # Ajuste de línea
    coef = np.polyfit(data[var], data['PIB'], 1)
    poly = np.poly1d(coef)
    ax.plot(data[var], poly(data[var]), color="red", linewidth=3)
    ax.set_xlabel(var)
    ax.set_ylabel('PIB')

plt.tight_layout()
plt.show()

In [None]:
import statsmodels.api as sm

# Ajustar el modelo de regresión
X = data[['INFLACION', 'DESEMPLEO', 'INTERES', 'GASTO_PUBLICO']]
Y = data['PIB']

# Agregar una constante a la matriz de predictores
X = sm.add_constant(X)

# Crear el modelo de regresión
model = sm.OLS(Y, X).fit()

# Mostrar los resultados del resumen del modelo
print(model.summary())

# **SECCIÓN 3: VECTORES**

Un vector de largo $n$ es una secuencia (o array, o tupla) de $n$ números. La solemos escribir como $x = (x_1, \dots, x_n)$ o $x = [x_1, \ldots, x_n]$. En Python, un vector puede ser representado con una simple lista, o con un array de Numpy; siendo preferible utilizar esta última opción.

In [None]:
import random

# Vector como lista de Python
v1 = [random.random() for _ in range(5)]
print("v1 =", v1)

In [None]:
# Vectores con numpy
v2 = np.ones(8) # vector de solo unos.
v2

In [None]:
v3 = np.array([1, 3, 5,11/7,np.sqrt(22)]) # pasando una lista a las arrays de numpy
v3

In [None]:
v4 = np.arange(1, 10) # utilizando la funcion arange de numpy
v4

Tradicionalmente, los vectores son representados visualmente como flechas que parten desde el origen hacia un punto. Por ejemplo, si quisiéramos representar gráficamente a los vectores $v_1 = [2, 4]$, $v_2 = [-3, 3]$ y $v_3 = [-4, -3.5]$, podríamos hacerlo de la siguiente manera.


In [None]:
import matplotlib.pyplot as plt
from warnings import filterwarnings

%matplotlib inline
filterwarnings('ignore') # Ignorar warnings

In [None]:
def move_spines():
    fix, ax = plt.subplots()
    for spine in ["left", "bottom"]:
        ax.spines[spine].set_position("zero")
    
    for spine in ["right", "top"]:
        ax.spines[spine].set_color("none")
    
    return ax

def vect_fig(): 
    ax = move_spines()
    
    ax.set_xlim(-5, 5)
    ax.set_ylim(-5, 5)
    ax.grid()
    vecs = [[2, 4], [-3, 3], [-4, -3.5]] # lista de vectores
    for v in vecs:
        ax.annotate(" ", xy=v, xytext=[0, 0],
                   arrowprops=dict(facecolor="blue",
                                  shrink=0,
                                  alpha=0.7,
                                  width=0.5))
        ax.text(1.1 * v[0], 1.1 * v[1], v)

In [None]:
vect_fig() # crea el gráfico

Las operaciones más comunes que utilizamos cuando trabajamos con vectores son la suma, la resta y la multiplicación por escalares.

Cuando sumamos dos vectores, vamos sumando elemento por elemento de cada vector. $$x + y = \begin{bmatrix}
x_1 \\
x_2 \\
\vdots \\
x_n
\end{bmatrix}
+ \begin{bmatrix}
y_1 \\
y_2 \\
\vdots \\
y_n
\end{bmatrix}
:=
\begin{bmatrix}
x_1 + y_1 \\
x_2 + y_2 \\
\vdots \\
x_n + y_n
\end{bmatrix}$$

In [None]:
# Definir los vectores
x = np.array([1, 3, 5, 11/7, np.sqrt(22), 1/21, np.log(33)])
y = np.array([random.random() for _ in range(7)])  # Convertimos a np.array para facilitar la suma

# Sumar los vectores
suma = x + y

# Imprimir los resultados con formato mejorado
print("Vector X:")
print(np.round(x, 4))  # Redondeo para mejor visualización
print("\nVector Y:")
print(np.round(y, 4))
print("\nX + Y:")
print(np.round(suma, 4))

In [None]:
v1 = np.array([0,0,2,7])
v2 = np.array([0,0,3,5])

v1_aux = np.array([v1[2],v1[3],v2[2],v2[3]])
v1v2 = np.array([0,0,5,12])

In [None]:
import seaborn as sns

plt.quiver([v1[0], v1_aux[0], v1v2[0]],
           [v1[1], v1_aux[1], v1v2[1]],
           [v1[2], v1_aux[2], v1v2[2]],
           [v1[3], v1_aux[3], v1v2[3]],
           angles='xy', scale_units='xy', scale=1,
           color=sns.color_palette())

plt.xlim(-0.5,6)
plt.ylim(-0.5,15)

De forma similar funciona la operación de resta.
$$x - y = \begin{bmatrix}
x_1 \\
x_2 \\
\vdots \\
x_n
\end{bmatrix}
- \begin{bmatrix}
y_1 \\
y_2 \\
\vdots \\
y_n
\end{bmatrix}
:=
\begin{bmatrix}
x_1 - y_1 \\
x_2 - y_2 \\
\vdots \\
x_n - y_n
\end{bmatrix}$$

In [None]:
# Operación de resta
resta = x - y

# Imprimir los resultados con formato mejorado
print("Vector X:")
print(np.round(x, 4))  # Redondeo para mejor visualización
print("\nVector Y:")
print(np.round(y, 4))
print("\nX - Y:")
print(np.round(resta, 4))

La multiplicación por escalares es una operación que toma a un número $\gamma$, y a un vector $\mathbf{x}$, y produce un nuevo vector donde cada elemento del vector $\mathbf{x}$ es multiplicado por el número $\gamma$.
$$\gamma \mathbf{x} := \begin{bmatrix}
\gamma x_1 \\
\gamma x_2 \\
\vdots \\
\gamma x_n
\end{bmatrix}
$$

Evaluar los siguientes vectores: 
$$A=\frac{1}{17}X, \hspace{2mm} B=\sqrt{17}Y, \hspace{2mm} C=\frac{1}{32}X - e^{-5}Y$$

In [None]:
# Definir los nuevos vectores
A = (1/17) * x
B = np.sqrt(17) * y
C = (1/32) * x - np.exp(-5) * y

# Imprimir los resultados con formato mejorado
print("Vector A:")
print(np.round(A, 4))  # Redondeo para mejor visualización
print("\nVector B:")
print(np.round(B, 4))
print("\nVector C:")
print(np.round(C, 4))

In [None]:
v1 = np.array([2,5])
v2 = np.array([3,2])
v1v2 = 2*v1 + 1*v2
v1v2

In [None]:
def graficarVectores(vecs, cols, alpha=1):

  plt.figure()
  plt.axvline(x=0, color='grey', zorder=0)
  plt.axhline(y=0, color='grey', zorder=0)

  for i in range(len(vecs)):
    x = np.concatenate([[0,0], vecs[i]])
    plt.quiver([x[0]],
               [x[1]],
               [x[2]],
               [x[3]],
               angles='xy', scale_units='xy', scale=1, color=cols[i], alpha=alpha)

In [None]:
graficarVectores([v1, v2, v1v2], ['orange', 'blue', 'red'])
plt.xlim(-1,8)
plt.ylim(-1,12)

El producto escalar de dos vectores se define como la suma de los productos de sus elementos, y se representa matemáticamente como $\langle \mathbf{x}, \mathbf{y} \rangle$ o $\mathbf{x}' \mathbf{y}$, donde $\mathbf{x}$ e $\mathbf{y}$ son dos vectores.
$$\langle \mathbf{x}, \mathbf{y} \rangle := \sum_{i=1}^{n} x_i y_i$$

In [None]:
# Calculando el producto escalar de los vectores x e y
x @ y

In [None]:
#Otras formas de calcular el producto interno
f1=sum(x * y)
f2=np.dot(x, y)
print("Primera forma: ",f1)
print("Segunda forma: ",f2)

Todo producto escalar induce una norma sobre el espacio en el que está definido, de la siguiente manera: $$\|\mathbf{x}\| := \sqrt{\langle \mathbf{x}, \mathbf{x} \rangle} := \left( \sum_{i=1}^{n} x_i^2 \right)^{1/2}
$$

In [None]:
#Calculando la norma de X
np.linalg.norm(x)

In [None]:
# otra forma de calcular la norma de x
np.sqrt(x @ x)

### **APLICACIÓN**

Supongamos que queremos recomendar películas a un usuario basado en sus preferencias. Podemos representar cada película con un vector que contiene características como:
- Género Acción (1 si es de acción, 0 si no)
- Género Comedia (1 si es comedia, 0 si no)
- Duración (en minutos)
- Puntuación de IMDb (de 0 a 10)
- Número de votos en IMDb
- Popularidad (escala 0-100)
- Presupuesto en millones de dólares
- Ingresos en millones de dólares

Si un usuario tiene preferencias representadas un determinado vector de preferencias, Podemos calcular la similitud del coseno entre $U$ y cada película $P_i$, lo que nos dirá cuál es la película más parecida a los gustos del usuario.

In [None]:
# Fijar la semilla para reproducibilidad
np.random.seed(42)

# Generar 50 películas con 8 características
num_peliculas = 50
genero_accion = np.random.choice([0, 1], size=num_peliculas)  # 0 o 1
genero_comedia = np.random.choice([0, 1], size=num_peliculas)  # 0 o 1
duracion = np.random.randint(80, 180, size=num_peliculas)  # Duración entre 80 y 180 min
imdb = np.random.uniform(4.0, 10.0, size=num_peliculas)  # Puntuación entre 4 y 10
votos_imdb = np.random.randint(1000, 1500000, size=num_peliculas)  # Votos entre 1,000 y 1,500,000
popularidad = np.random.uniform(0, 100, size=num_peliculas)  # Popularidad de 0 a 100
presupuesto = np.random.uniform(1, 300, size=num_peliculas)  # Presupuesto entre 1 y 300 millones
ingresos = np.random.uniform(10, 2000, size=num_peliculas)  # Ingresos entre 10 y 2000 millones

In [None]:
# Crear la matriz de características
peliculas = np.column_stack([genero_accion, genero_comedia, duracion, imdb, votos_imdb, popularidad, presupuesto, ingresos])
datos = pd.DataFrame(peliculas,columns=['Acción', 'Comedia', 'Duración', 'IMDb', 'Votos IMDb', 'Popularidad', 'Presupuesto', 'Ingresos'])
datos

In [None]:
# Definir el vector de usuario U con los mismos rangos
U = np.array([
    np.random.choice([0, 1]),  # Género Acción
    np.random.choice([0, 1]),  # Género Comedia
    np.random.randint(60, 120),  # Duración
    np.random.uniform(4.0, 7.0),  # IMDb
    np.random.randint(1000, 1500),  # Votos IMDb
    np.random.uniform(0, 55),  # Popularidad
    np.random.uniform(1, 100),  # Presupuesto
    np.random.uniform(10, 100)  # Ingresos
])
U

In [None]:
# Función para calcular la similitud del coseno
def cosine_similarity(a, b):
    return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))

In [None]:
# Calcular la similitud del coseno entre U y cada película
similitudes = np.array([cosine_similarity(U, pelicula) for pelicula in peliculas])

# Crear un DataFrame para visualizar los resultados
df = pd.DataFrame(peliculas, columns=['Acción', 'Comedia', 'Duración', 'IMDb', 'Votos IMDb', 'Popularidad', 'Presupuesto', 'Ingresos'])
df['Similitud'] = similitudes

# Ordenar por similitud (de mayor a menor)
df_sorted = df.sort_values(by="Similitud", ascending=False)

# Mostrar las 5 películas más cercanas
print("🎬 5 películas más cercanas al usuario:")
df_sorted.head(5)

# **SECCIÓN 4: VECTORES Y VALORES PROPIOS**

## **Polinomio característico**

Son esenciales para la Geometría los conceptos o elementos que permanecen invariantes bajo una transformación, pues mediante ellos es posible entender mejor el efecto de ésta. En el caso de las transformaciones lineales de un espacio vectorial en sí mismo, es importante determinar las direcciones que permanecen invariantes, es decir, aquellos subespacios de dimensión 1 cuyos elementos se transforman en otros pertenecientes al mismo subespacio.

**Definición** Si $T: V \rightarrow V$ es una transformación lineal, decimos que
$v \in V$ es un *vector propio* de $T$ si su transformado es múltiplo del
vector, es decir, si para algún $\lambda \in \mathbb{R}$ se tiene que
    $$T(v) = \lambda v$$
El escalar $\lambda$ se denomina *valor propio* de T.

**Observación.** Como cualquier transformación lineal lleva al vector cero en el
vector cero, este vector es vector propio de cualquier transformación lineal,
por eso lo interesante es determinar los vectores propios no cero de una transformación lineal.

En general no es tan sencillo entender el efecto geométrico de una cierta
transformación lineal; para esos casos existe un instrumento algebraico que
mecaniza la obtención de los elementos invariantes mediante la determinación
de los valores y vectores característicos. El procedimiento es el siguiente:

Sabemos que, dada $T: V \rightarrow V$ lineal y fijada una base en $V$, existe una única matriz $M_T$ que al muliplicar por la izquierda al vector columna formado con las coordenadas de un vector $v$ en términos de esa base, produce el vector columna transformado del vector dado; en el caso de un vector propio, ese transformado debe ser $\lambda v$:
$$M_{T}v = \lambda v,$$
que también puede escribirse como
$$M_{T}v - \lambda v = 0,$$
y si denotamos por $I$ la matriz identidad, podemos introducirla en el segundo
sumando del lado izquierdo así:
$$M_{T}v - \lambda I v = 0.$$
Por la propiedad distributiva del producto de matrices, el lado izquierdo
puede escribirse en la forma
$$(M_{T} - \lambda I) v = 0.$$

Ahora, esta ecuación matricial para $v$ admite soluciones no triviales si y solamente si el determinante de la matriz $M_{T} - \lambda I$ es cero. Como el determinante es una expresión polinomial en las entradas de la correspondiente matriz se tiene la siguiente definición.

**Definición.** El polinomio característico de $T$ es
    $$p(\lambda) := \det(M_{T} - \lambda I). \qquad (1)$$

Por definición, las raíces del polinomio característico son los valores propios de $T$.

In [None]:
import sympy as sym

# Implementación de la función
def matriz_de(transformacion):
    transformacion = sym.sympify(transformacion)
    Matriz = sym.Matrix([])
    for key in transformacion:
        Matriz = Matriz.col_insert(key.index(1), sym.Matrix(transformacion[key]))
    return Matriz

In [None]:
def polinomio_caracteristico(transformacion):
    MT = matriz_de(transformacion) # Cálculo de la matriz de 'transformacion'
    nn = len(tuple(transformacion.keys())[0]) # Dimensión de R^n
    identidad = sym.eye(nn) # Crear la matriz identidad de tamaño n x n
    MT_menos_XI = MT - (sym.sympify('X'))*identidad # MT - X*I, en este caso usamos la leta X en vez de \lambda
    return sym.factor(MT_menos_XI.det()) # Utilizamos la función factor() para factorizar lo mejor posible una expresión 'simbólica'

**Ejemplo 1.** Calcule el polinomio característico de la transformación lineal $T: \mathbb{R}^2 \rightarrow \mathbb{R}^2$ definida por 

$$T(x, y) = x(2, 1)+y(3, 4).$$

El primer paso consiste en saber cómo actúa la transformación $T$
en la base canónica de $\mathbb{R}^2$ para poder construir la matriz $M_T$ asociada a la transformación:
$$T(1, 0) = (2, 1) \quad \text{y} \quad T(0, 1) = (3, 4).$$

Con esta información ya podemos calcular el polinomio característico de $T$:

In [None]:
T1 = {(1,0): (2,1), (0,1): (3,4)}
polinomio_caracteristico(T1)

Esto nos dice que:
$$p(\lambda) = (\lambda - 5)(\lambda - 1).$$

**Ejemplo 2.** Calcule el polinomio característico de la transformación lineal $T: \mathbb{R}^2 \rightarrow \mathbb{R}^2$ definida por 

$$T(x, y) = x(3, 4) + y(2, 1).$$

La actuación de $T$ en la base canónica de $\mathbb{R}^{2}$ es dada por
$$T(1, 0) = (3, 4) \quad \text{y} \quad T(0, 1) = (2, 1).$$

Con esto ya podemos calcular el polinomio característico de $T$:

In [None]:
T2 = {(1,0): (3,4), (0,1): (2,1)}
polinomio_caracteristico(T2)

Esto nos dice que:
$$p(\lambda) = (\lambda - 5)(\lambda + 1).$$

**Ejemplo 3.** Calcule el polinomio característico de la transformación lineal $T: \mathbb{R}^3 \rightarrow \mathbb{R}^3$ que determina una reflexión respecto al plano $YZ$, dada por

$$T(1, 0, 0) = (-1, 0, 0), \quad T(0, 1, 0) = (0, 1, 0) \text{y} \quad T(0, 0, 1) = (0, 0, 1):$$

In [None]:
T3 = {(1,0,0): (-1,0,0), (0,1,0): (0,1,0), (0,0,1): (0,0,1)}
polinomio_caracteristico(T3)

Esto nos dice que:
$$p(\lambda) = -(\lambda - 1)^2(\lambda + 1).$$

**Ejemplo 4.** Calcule el polinomio característico de la transformación ortogonal de orden 3 correspondiente a la reflexión respecto al plano $x + y + z = 0$, dada por

$$T(1, 0, 0) = (1/3, -2/3, -2/3), \quad T(0, 1, 0) = (-2/3, 1/3, -2/3) \quad  \text{y} \quad T(0, 0, 1) = (-2/3, -2/3, 1/3):$$

In [None]:
T4 = {(1,0,0): (1/3,-2/3,-2/3), (0,1,0): (-2/3,1/3,-2/3), (0,0,1): (-2/3,-2/3,1/3)}
polinomio_caracteristico(T4)

## **Valores propios**

Ya que tenemos una función para calcular el polinomio característico de una transformación lineal lo siguiente es buscar una manera de determinar sus raices, es decir, los *valores propios* de la correspondiente transformación lineal. Esto se puede hacer de diferentes maneras mediante funciones que Python, en particular `SymPy`, nos provee. Para nuestros propósitos utilizaremos la función `solve()` de `SymPy` para implementar una función que retorne los valores propios de una transformación lineal. 

In [None]:
def valores_propios(transformacion):
    return sym.solve(polinomio_caracteristico(transformacion), sym.sympify('X'))

**Ejemplo 1.1** Para la transformación lineal $T: \mathbb{R}^2 \rightarrow \mathbb{R}^2$ definida por 

$$T(x, y) = x(2, 1)+y(3, 4),$$
o equivalentemente, por

$$T(1, 0) = (2, 1) \quad \text{y} \quad T(0, 1) = (3, 4),$$

tenemos que el polinomio característico es
$$p(\lambda) = (\lambda - 5)(\lambda - 1).$$

Es inmediato que los valores propios, raíces de este polinomio, son

$$\lambda_{1} = 1, \qquad \lambda_{2} = 5.$$

Lo cual coincide con el resultado de la siguiente celda:

In [None]:
T1 = {(1,0): (2,1), (0,1): (3,4)}
valores_propios(T1)

**Ejemplo 2.1** Para la transformación lineal $T: \mathbb{R}^2 \rightarrow \mathbb{R}^2$ definida por 

$$T(1, 0) = (3, 4) \quad \text{y} \quad T(0, 1) = (2, 1),$$

tenemos que el polinomio característico es
$$p(\lambda) = (\lambda - 5)(\lambda + 1).$$

Es inmediato que los valores propios de $T$ son

$$\lambda_{1} = -1, \qquad \lambda_{2} = 5.$$

Lo cual coincide con el resultado de la siguiente celda:

In [None]:
T2 = {(1,0): (3,4), (0,1): (2,1)}
valores_propios(T2)

**Ejemplo 3.1** Para la transformación lineal $T: \mathbb{R}^3 \rightarrow \mathbb{R}^3$ que determina una reflexión respecto al plano $YZ$, dada por

$$T(1, 0, 0) = (-1, 0, 0), \quad T(0, 1, 0) = (0, 1, 0) \text{y} \quad T(0, 0, 1) = (0, 0, 1):$$

tenemos que el polinomio característico es
$$p(\lambda) = -(\lambda - 1)^2(\lambda + 1).$$

Es inmediato que los valores propios de $T$ son

$$\lambda_{1} = -1, \qquad \lambda_{2} = \lambda_{3} = 1.$$

Lo cual coincide con el resultado de la siguiente celda:

In [None]:
T3 = {(1,0,0): (-1,0,0), (0,1,0): (0,1,0), (0,0,1): (0,0,1)}
valores_propios(T3)

In [None]:
# Definir una matriz
A = np.array([[4, 1],
              [2, 3]])

# Calcular los valores propios y los vectores propios
eigenvalues, eigenvectors = np.linalg.eig(A)

print("Valores propios:", eigenvalues)

In [None]:
B = np.random.randn(3, 3)
# Calcular los valores propios y los vectores propios
eigenvalues, eigenvectors = np.linalg.eig(B)

print("Valores propios:", eigenvalues)

In [None]:
C = np.random.normal(3, 0.2, size=(4, 4))
# Calcular los valores propios y los vectores propios
eigenvalues, eigenvectors = np.linalg.eig(C)

print("Valores propios:")
print(eigenvalues)

## **Vectores propios**

Finalmente, una vez determinados los valores propios de una transformación lineal lo siguiente es calcular los vectores propios asociados. Para esto recurriremos nuevamente a la función `solve()` de `SymPy`.

In [None]:
def vectores_propios(transformacion):
    MT = matriz_de(transformacion) # Cálculo de la matriz de 'transformacion'
    nn = len(tuple(transformacion.keys())[0]) # Dimensión de R^n
    identidad = sym.eye(nn) # Crear la matriz identidad de tamaño n x n
    vv = sym.symbols(f'v1:{nn + 1}') # Crear vector 'arbitrario'
    vv_vector = sym.Matrix(vv) # Convertir vv a una matriz 'simbólica'
    vect_prop = dict() # Un diccionario vacío para guardar los valores propios y los correspondientes vectores propios
    val_prop = valores_propios(transformacion)
    for X in val_prop: # Para cada valor propio hacer:
        MT_menos_XI = MT - sym.sympify(X)*identidad # MT - X*I, en este caso usamos la leta X en vez de \lambda
        MT_menos_XI_vv = MT_menos_XI * vv_vector # Producto de MT - X*I por el vector v, esto es, (MT - X*I)v
        vect_prop[f'X = {X}'] = sym.solve(MT_menos_XI_vv, vv) # Resolver el sistema dado por la ecuación (MT - X*I)v = 0
    return vect_prop

**Ejemplo 1.1.1** Para la transformación lineal $T: \mathbb{R}^2 \rightarrow \mathbb{R}^2$ definida por 

$$T(1, 0) = (2, 1) \quad \text{y} \quad T(0, 1) = (3, 4),$$

tenemos que los valores propios son

$$\lambda_{1} = 1, \qquad \lambda_{2} = 5.$$

Los respectivos vectores propios están determinados por:

In [None]:
T1 = {(1,0): (2,1), (0,1): (3,4)}
vectores_propios(T1)

Lo que nos dice que:
> Para $\lambda_{1} = 1$ se tiene la familia de vectores propios
    $$v = (-3v_2, v_2) = (v_1,-\tfrac{1}{3}v_1).$$

> Para $\lambda_{1} = 5$ se tiene la familia de vectores propios
    $$v = (v_1,v_1).$$

**Ejemplo 2.1.1** Para la transformación lineal $T: \mathbb{R}^2 \rightarrow \mathbb{R}^2$ definida por 

$$T(1, 0) = (3, 4) \quad \text{y} \quad T(0, 1) = (2, 1),$$

tenemos que los valores propios son

$$\lambda_{1} = -1, \qquad \lambda_{2} = 5.$$

Los respectivos vectores propios están determinados por:

In [None]:
T2 = {(1,0): (3,4), (0,1): (2,1)}
vectores_propios(T2)

Lo que nos dice que:
> Para $\lambda_{1} = -1$ se tiene la familia de vectores propios
    $$v = (-\tfrac{1}{2}v_2, v_2) = (v_1,-2v_1).$$

> Para $\lambda_{1} = 5$ se tiene la familia de vectores propios
    $$v = (v_1,v_1).$$

**Ejemplo 3.1.1** Para la transformación lineal $T: \mathbb{R}^2 \rightarrow \mathbb{R}^2$ definida por 

$$T(1, 0, 0) = (-1, 0, 0), \quad T(0, 1, 0) = (0, 1, 0) \text{y} \quad T(0, 0, 1) = (0, 0, 1):$$

tenemos que los valores propios son

$$\lambda_{1} = -1, \qquad \lambda_{2} = \lambda_{3} = 1.$$

Los respectivos vectores propios están determinados por:

In [None]:
T3 = {(1,0,0): (-1,0,0), (0,1,0): (0,1,0), (0,0,1): (0,0,1)}
vectores_propios(T3)

Lo que nos dice que:
> Para $\lambda_{1} = -1$ se tiene la familia de vectores propios
    $$v = (v_1,0,0).$$

> Para $\lambda_{1} = 5$ se tiene la familia de vectores propios
    $$v = (0,v_2,v_3).$$

In [None]:
A = np.array([[4, 1],
              [2, 3]])

# Calcular los valores propios y los vectores propios
eigenvalues, eigenvectors = np.linalg.eig(A)

print("Valores propios:")
print(eigenvalues)
print(" ")
print("Vectores propios: ")
print(eigenvectors)

In [None]:
B = np.random.uniform(low=0, high=14, size=(5, 5))
B = (B+B.T)/2

# Calcular los valores propios y los vectores propios
eigenvalues, eigenvectors = np.linalg.eig(B)

print("Valores propios:")
print(eigenvalues)
print(" ")
print("Vectores propios: ")
print(eigenvectors)

In [None]:
C = np.random.normal(3, 0.2, size=(6, 6))
C = (C+C.T)/2

# Calcular los valores propios y los vectores propios
eigenvalues, eigenvectors = np.linalg.eig(C)

print("Valores propios:")
print(eigenvalues)
print(" ")
print("Vectores propios: ")
print(eigenvectors)

### **APLICACIÓN CON DATOS FINANCIEROS**

In [None]:
import yfinance as yf
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.decomposition import PCA

In [None]:
# Definir los tickers de 20 activos
tickers = [
    'AAPL', 'GOOG', 'AMZN', 'MSFT', 'TSLA', 'META', 'NVDA', 'SPY', 'IBM', 'CSCO', 
    'NFLX', 'AMD', 'WMT', 'BA', 'DIS', 'PYPL', 'V', 'GS', 'KO', 'PEP'
]

# Descargar los datos de Yahoo Finance
datos = yf.download(tickers, start='2017-01-01', end='2023-01-01')['Close']
datos

In [None]:
# Graficar los datos de las 20 acciones
plt.figure(figsize=(14, 7))
for ticker in tickers:
    plt.plot(datos.index, datos[ticker], label=ticker)

plt.title('Precios Ajustados de Cierre de 20 Acciones (2017-2023)')
plt.xlabel('Fecha')
plt.ylabel('Precio Ajustado de Cierre')
plt.legend(loc='upper left', bbox_to_anchor=(1, 1), ncol=1)
plt.grid(False)
plt.tight_layout()
plt.show()

In [None]:
# Calcular los rendimientos diarios de cada activo
rendimientos = datos.pct_change().dropna()
rendimientos

In [None]:
# Graficar los rendimientos diarios de cada activo
plt.figure(figsize=(14, 7))
for ticker in tickers:
    plt.plot(rendimientos.index, rendimientos[ticker], label=ticker)

plt.title('Rendimientos Diarios de 20 Acciones (2017-2023)')
plt.xlabel('Fecha')
plt.ylabel('Rendimiento Diario')
plt.legend(loc='upper left', bbox_to_anchor=(1, 1), ncol=1)
plt.grid(False)
plt.tight_layout()
plt.show()

In [None]:
# Paso 1: Calcular la matriz de correlación
matriz_correlacion = rendimientos.corr()
matriz_correlacion

In [None]:
# Crear el heatmap
plt.figure(figsize=(12, 8))
cax = plt.imshow(matriz_correlacion, cmap='coolwarm', interpolation='nearest')
plt.xticks(np.arange(len(tickers)), tickers, rotation=90)
plt.yticks(np.arange(len(tickers)), tickers)
plt.colorbar(cax)

for i in range(len(tickers)):
    for j in range(len(tickers)):
        plt.text(j, i, f'{matriz_correlacion.iloc[i, j]:.2f}', ha='center', va='center', color='black', fontsize=10)

plt.title('Matriz de Correlación de Rendimientos Diarios (2017-2023)', fontsize=16)
plt.tight_layout()
plt.grid(False)
plt.show()

In [None]:
# Paso 2: Aplicar PCA (Análisis de Componentes Principales)
pca = PCA()
pca.fit(matriz_correlacion)

In [None]:
# Paso 3: Obtener los valores propios (varianza explicada) y los vectores propios
valores_propios = pca.explained_variance_
vectores_propios = pca.components_

In [None]:
# Paso 4: Visualizar la varianza explicada por cada componente
plt.figure(figsize=(10, 6))
plt.bar(range(1, len(valores_propios) + 1), valores_propios, alpha=0.7, align='center', label='Varianza Explicada')
plt.ylabel('Varianza Explicada')
plt.xlabel('Componentes Principales')
plt.title('Varianza Explicada por cada Componente Principal (PCA)')
plt.show()

In [None]:
# Paso 5: Imprimir los resultados
print("Valores propios (varianza explicada por cada componente):")
print(valores_propios)

In [None]:
print("\nVectores propios (combinaciones lineales de activos):")
print(vectores_propios)

In [None]:
# Paso 6: Mostrar los 5 primeros activos con mayor peso en el primer componente principal
# Esto es útil para entender qué activos están dominando el riesgo de la cartera
primer_componente = vectores_propios[0]
activos_primer_componente = pd.DataFrame({'Activo': tickers, 'Peso en Componente 1': primer_componente})
activos_primer_componente = activos_primer_componente.sort_values(by='Peso en Componente 1', ascending=False)
print("\nActivos más relevantes en el primer componente principal:")
print(activos_primer_componente.head())

**El análisis de los vectores y valores propios en el contexto de la cartera revela que el primer componente principal, que captura la mayor parte de la varianza del rendimiento de la cartera, está dominado por activos como CSCO (Cisco) y DIS (Disney), los cuales tienen los mayores pesos. Esto indica que estos activos explican en gran medida el comportamiento general del riesgo de la cartera, lo que sugiere que la volatilidad y las fluctuaciones de la cartera están fuertemente influenciadas por ellos. Los valores propios asociados reflejan la magnitud de esta influencia, y los activos con los mayores valores propios son los que tienen un impacto más significativo en el riesgo global de la cartera.**

In [None]:
# Mostrar los 5 primeros activos con mayor peso en el segundo componente principal
segundo_componente = vectores_propios[1]
activos_segundo_componente = pd.DataFrame({'Activo': tickers, 'Peso en Componente 2': segundo_componente})
activos_segundo_componente = activos_segundo_componente.sort_values(by='Peso en Componente 2', ascending=False)
print("\nActivos más relevantes en el segundo componente principal:")
print(activos_segundo_componente.head())

**El segundo componente principal muestra que los activos más relevantes son CSCO (Cisco), IBM, KO (Coca-Cola), SPY (ETF del S&P 500) y V (Visa), con pesos relativamente altos en dicho componente. Esto sugiere que este grupo de activos está asociado con otro patrón de riesgo diferente al capturado por el primer componente. Específicamente, estos activos podrían estar correlacionados entre sí en términos de comportamiento de precios, lo que implica que son sensibles a factores comunes del mercado, como el sector tecnológico (CSCO y IBM), el sector de consumo (KO), y el mercado en general (SPY y V).**

In [None]:
# Mostrar los 5 primeros activos con mayor peso en el tercer componente principal
tercer_componente = vectores_propios[2]
activos_tercer_componente = pd.DataFrame({'Activo': tickers, 'Peso en Componente 3': tercer_componente})
activos_tercer_componente = activos_tercer_componente.sort_values(by='Peso en Componente 3', ascending=False)
print("\nActivos más relevantes en el tercer componente principal:")
print(activos_tercer_componente.head())

**El tercer componente principal destaca a MSFT (Microsoft), SPY (ETF del S&P 500), META (Meta Platforms), GS (Goldman Sachs) y KO (Coca-Cola), con pesos significativos en dicho componente. Este componente refleja un patrón de riesgo que parece estar asociado a las grandes tecnológicas (MSFT y META), el mercado general (SPY), el sector financiero (GS) y el consumo (KO). La presencia destacada de Microsoft y Meta sugiere una relación fuerte con el rendimiento de las acciones tecnológicas, mientras que SPY indica sensibilidad a los movimientos del mercado en general. El peso de Goldman Sachs sugiere que el componente también captura influencias macroeconómicas y financieras, mientras que el menor peso de KO refleja una menor influencia del sector de consumo en este componente específico**

# **SECCIÓN 5: FACTORIZACIÓN DE MATRICES**

## **Factorización LU**

La factorización LU descompone una matriz cuadrada \( A \) en el producto de dos matrices, \( L \) y \( U \), donde:
$$A= L \cdot U$$
- \( L \) es una matriz triangular inferior con unos en su diagonal principal.
- \( U \) es una matriz triangular superior.

**Procedimiento**
1. Se realiza la descomposición de \( A \) en dos matrices: \( L \) (triangular inferior) y \( U \) (triangular superior), de manera que, al multiplicarlas, se obtenga la matriz original.
2. La matriz \( L \) tiene valores en su diagonal principal iguales a 1.
3. La matriz \( U \) tiene todos los valores debajo de la diagonal principal iguales a 0.

La factorización LU se usa principalmente para resolver sistemas de ecuaciones lineales de la forma \( A \cdot x = b \). Si se conoce la factorización \( A = L \cdot U \), el sistema puede resolverse en dos pasos:
- Resuelve $L \cdot y = b$ para \( y \) mediante sustitución hacia adelante.
- Luego resuelve $U \cdot x = y $ para \( x \) mediante sustitución hacia atrás.

In [None]:
# Creación de la matroz A
np.random.seed(124)
A = np.random.normal(5,2, size=(5, 5))
print(A)

In [None]:
import scipy.linalg as la

#Factorización LU
P, L, U = la.lu(A)

In [None]:
# Matriz triangular inferior
L

In [None]:
# Matriz triangular superior
U

In [None]:
# A = LU
L @ U

### **APLICACIÓN**

Hallar la solución del siguiente sistema:
$$\begin{pmatrix}1&\frac{2}{5}&\frac{1}{7}&log\left(\frac{3}{11}\right)&\frac{17}{16}&\frac{1}{7}\\ \frac{2}{3}&\frac{4}{5}&\frac{7}{11}&\frac{3}{22}&\sqrt{11}&2\\ 0&3&1&4&\frac{4}{9}&\frac{11}{12}\\ \frac{3}{11}&\frac{4}{19}&\frac{7}{19}&\frac{4}{89}&\frac{19}{173}&\sqrt{91}\\ \frac{3}{\sqrt{41}}&\frac{7}{11}&log\left(\frac{1}{11}\right)&5&6&7\\ 3&4&7&\frac{1}{17}&4&\frac{1}{7}\end{pmatrix}\begin{pmatrix}x\\ y\\ z\\ w\\ a\\ b\end{pmatrix}=\begin{pmatrix}\frac{8}{9}\\ \frac{7}{13}\\ \sqrt{\frac{23}{21}}\\ \sqrt{3}\\ \frac{18}{111}\\ \frac{4}{3}\end{pmatrix}$$

In [None]:
import numpy as np
import scipy.linalg as la

# Definir la matriz A y el vector b
A = np.array([[1, 2/5, 1/7, np.log(3/11), 17/16, 1/7],
              [2/3, 4/5, 7/11, 3/22, np.sqrt(11), 2],
              [0, 3, 1, 4, 4/9, 11/12],
              [3/11, 4/19, 7/19, 4/89, 19/173, np.sqrt(91)],
              [3/np.sqrt(41), 7/11, np.log(1/11), 5, 6, 7],
              [3, 4, 7, 1/17, 4, 1/7]])

b = np.array([8/9, 7/13, np.sqrt(23/21), np.sqrt(3), 18/111, 4/3])

# Método de descomposición LU usando SciPy
P, L, U = la.lu(A)
y = np.linalg.solve(L, np.dot(P.T, b))  # Resolución para y
x_LU = np.linalg.solve(U, y)  # Resolución para x

# Método de la inversa de la matriz
A_inv = np.linalg.inv(A)
x_inversa = np.dot(A_inv, b)

# Comprobación de las soluciones
comprobacion_LU = np.dot(A, x_LU)
comprobacion_inversa = np.dot(A, x_inversa)

# Imprimir las soluciones y comparaciones
print("\nSolución usando LU:")
print(f"x = {x_LU[0]}, y = {x_LU[1]}, z = {x_LU[2]}, w = {x_LU[3]}, a = {x_LU[4]}, b = {x_LU[5]}")

print("\nSolución usando la inversa de la matriz:")
print(f"x = {x_inversa[0]}, y = {x_inversa[1]}, z = {x_inversa[2]}, w = {x_inversa[3]}, a = {x_inversa[4]}, b = {x_inversa[5]}")

print("\nComprobación con LU:", comprobacion_LU)
print("Comprobación con Inversa:", comprobacion_inversa)

## **Factorización QR**

La descomposición o factorización QR consiste en la descomposición de una matriz como producto de una matriz ortogonal ($Q^T \cdot Q = I$) por una matriz triangular superior. la factorización QR es ampliamente utilizada en las finanzas cuantitativas como base para la solución del problema de los mínimos cuadrados lineales, que a su vez se utiliza para el análisis de regresión estadística.

La factorización QR descompone una matriz \( A \) en el producto de una matriz ortogonal \( Q \) y una matriz triangular superior \( R \). Es decir, se tiene que:
$$A = QR$$
- \( A \) es una matriz de tamaño $ m \times n$,
- \( Q \) es una matriz ortogonal o unitaria de tamaño $ m \times m$, tal que $Q^T Q = I$ (donde \( I \) es la matriz identidad),
- \( R \) es una matriz triangular superior de tamaño $ m \times n$, es decir, tiene ceros debajo de la diagonal principal.

La factorización QR se utiliza principalmente para resolver sistemas de ecuaciones lineales de la forma $Ax = b$. Tras realizar la factorización QR, el sistema se transforma en:
$$Ax = b \quad \text{se convierte en} \quad QRx = b$$

Multiplicando ambos lados por $Q^T$, se obtiene:
$$Rx = Q^T b$$
Dado que R es triangular superior, este sistema es fácil de resolver mediante sustitución hacia atrás.

In [None]:
# Ejemplo factorización QR
Q, R = la.qr(A)

In [None]:
# Matriz A
A

In [None]:
# Matriz ortogonal Q
Q

In [None]:
# Matriz triangular superior R
R

In [None]:
# A = QR
Q @ R

### **APLICACIÓN**

Hallar la solución del siguiente sistema:
$$\begin{pmatrix}1&\frac{2}{5}&\frac{1}{7}&log\left(\frac{3}{11}\right)&\frac{17}{16}&\frac{1}{7}\\ \frac{2}{3}&\frac{4}{5}&\frac{7}{11}&\frac{3}{22}&\sqrt{11}&2\\ 0&3&1&4&\frac{4}{9}&\frac{11}{12}\\ \frac{3}{11}&\frac{4}{19}&\frac{7}{19}&\frac{4}{89}&\frac{19}{173}&\sqrt{91}\\ \frac{3}{\sqrt{41}}&\frac{7}{11}&log\left(\frac{1}{11}\right)&5&6&7\\ 3&4&7&\frac{1}{17}&4&\frac{1}{7}\end{pmatrix}\begin{pmatrix}x\\ y\\ z\\ w\\ a\\ b\end{pmatrix}=\begin{pmatrix}\frac{8}{9}\\ \frac{7}{13}\\ \sqrt{\frac{23}{21}}\\ \sqrt{3}\\ \frac{18}{111}\\ \frac{4}{3}\end{pmatrix}$$

In [None]:
import numpy as np
import scipy.linalg as la

# Definir la matriz A y el vector b
A = np.array([[1, 2/5, 1/7, np.log(3/11), 17/16, 1/7],
              [2/3, 4/5, 7/11, 3/22, np.sqrt(11), 2],
              [0, 3, 1, 4, 4/9, 11/12],
              [3/11, 4/19, 7/19, 4/89, 19/173, np.sqrt(91)],
              [3/np.sqrt(41), 7/11, np.log(1/11), 5, 6, 7],
              [3, 4, 7, 1/17, 4, 1/7]])

b = np.array([8/9, 7/13, np.sqrt(23/21), np.sqrt(3), 18/111, 4/3])

# Método de descomposición QR usando SciPy
Q, R = la.qr(A)

# Resolver el sistema Rx = Q^T b
Q_T_b = np.dot(Q.T, b)
x_QR = np.linalg.solve(R, Q_T_b)

# Comprobación de la solución
comprobacion_QR = np.dot(A, x_QR)

# Imprimir la solución y la comprobación
print("\nSolución usando el método QR:")
print(f"x = {x_QR[0]}, y = {x_QR[1]}, z = {x_QR[2]}, w = {x_QR[3]}, a = {x_QR[4]}, b = {x_QR[5]}")

print("\nComprobación con QR:", comprobacion_QR)

## **Descomposición en Valores Singulares (SVD)**

La Descomposición en Valores Singulares (SVD) es una técnica matemática que descompone una matriz en tres matrices más simples. Es muy útil en muchas áreas de las matemáticas y la computación, como el análisis de datos, la compresión de imágenes, la reducción de dimensionalidad, y la resolución de sistemas de ecuaciones.

$$A=U \Sigma V^T$$

El SVD y el PCA son herramientas ampliamente utilizadas, por ejemplo, en el análisis de imágenes médicas para la reducción de dimensionalidad, la construcción de modelos, y la comprensión y exploración de datos. Tienen aplicaciones en prácticamente todas las áreas de la ciencia, machine learning, procesamiento de imágenes, ingeniería, genética, computación cognitiva, química, meteorología, y redes neuronales, sólo por nombrar algunas; en dónde nos encontramos con grandes conjuntos de datos. El propósito del análisis de componentes principales PCA es derivar un número relativamente pequeño de combinaciones lineales no correlacionadas (componentes principales) de una conjunto de variables aleatorias de media cero mientras que conserva la mayor cantidad de información de las variables originales como sea posible. Entre los objetivos del PCA podemos encontrar los siguientes:
- Reducción de dimensionalidad.
- Determinación de combinaciones lineales de variables.
- Selección de características o features: la elección de las variables más útiles.
- Visualización de datos multidimensionales.
- Identificación de las variables subyacentes.
- Identificación grupos de objetos o de valores atípicos.

In [None]:
import numpy as np

# Crear una matriz de 7x7 con números aleatorios
A = np.random.rand(7, 7)

# Realizar la descomposición SVD
U, Sigma, Vt = np.linalg.svd(A)

# Mostrar los resultados
print("Matriz A (Original):")
print(A)

print("\nMatriz U (Vectores singulares izquierdos):")
print(U)

print("\nValores singulares (Sigma):")
print(Sigma)

print("\nMatriz V^T (Vectores singulares derechos):")
print(Vt)

In [None]:
# Convertir Sigma en una matriz diagonal
Sigma_matrix = np.diag(Sigma)

# Reconstruir la matriz A a partir de la descomposición
A_reconstruida = np.dot(U, np.dot(Sigma_matrix, Vt))

print("\nMatriz A reconstruida a partir de SVD:")
print(A_reconstruida)

# Verificar si la reconstrucción es igual a la matriz original
print("\n¿La matriz reconstruida es igual a la matriz original?")
print(np.allclose(A, A_reconstruida))

### **APLICACIÓN**

Para aplicar la descomposición en valores singulares (SVD) a un portafolio de inversiones con 15 activos, podemos usar la misma idea de análisis de componentes principales (PCA), pero en este caso, cada "serie de tiempo" corresponderá a los rendimientos de los activos financieros (acciones, bonos, etc.) durante un periodo determinado. SVD nos ayudará a analizar cómo se relacionan los rendimientos de los activos y a reducir la dimensionalidad de los datos para extraer los patrones subyacentes.

Se extraerá datos históricos de 15 activos de Yahoo Finance, calculamos sus rendimientos y luego aplicamos SVD para reducir la dimensionalidad de los datos y analizar las principales fuentes de variabilidad en el portafolio.

In [None]:
import yfinance as yf
import numpy as np
import matplotlib.pyplot as plt

# Definir los símbolos de los 15 activos (puedes elegir otros si lo prefieres)
activos = ['AAPL', 'GOOG', 'MSFT', 'AMZN', 'TSLA', 'META', 'NVDA', 'SPY', 'BRK-B', 'BABA', 'INTC', 'V', 'NFLX', 'WMT', 'DIS']

# Descargar los datos históricos de los precios de cierre ajustados
datos = yf.download(activos, start='2020-01-01', end='2023-12-31')['Close']
datos

In [None]:
# Calcular los rendimientos diarios (logaritmos de las variaciones de los precios)
rendimientos = np.log(datos / datos.shift(1)).dropna()
rendimientos

In [None]:
# Realizar la descomposición SVD
U, Sigma, Vt = np.linalg.svd(rendimientos, full_matrices=False)

# Calcular la varianza explicada por cada componente
explained_variance = (Sigma**2) / np.sum(Sigma**2)

# Visualización de los resultados
plt.figure(figsize=(12, 8))
plt.subplot(2, 2, 1)
plt.plot(U[:, 0], label='Componente 1')
plt.plot(U[:, 1], label='Componente 2')
plt.plot(U[:, 2], label='Componente 3')
plt.title('Primeras 3 Componentes Principales')
plt.legend()

In [None]:
# Gráficamos la varianza explicada por cada componente
plt.bar(range(1, len(explained_variance)+1), explained_variance)
plt.title('Varianza Explicada por Componente')
plt.xlabel('Componente')
plt.ylabel('Varianza Explicada')

In [None]:
# Ver la varianza explicada por cada componente
explained_variance = (Sigma**2) / np.sum(Sigma**2)
print("\nVarianza explicada por cada componente:")
for i, var in enumerate(explained_variance):
    print(f"Componente {i+1}: {var:.4f}")


In [None]:
# Proyección de los rendimientos originales en los primeros 2 componentes principales
rendimientos_reducidos = np.dot(U[:, :2], np.diag(Sigma[:2]))
plt.plot(rendimientos_reducidos)
plt.title('Proyección de los Rendimientos en los 2 Primeros Componentes')

plt.tight_layout()
plt.show()

In [None]:
# Analizar la relación entre los activos y los componentes
componente_1 = Vt[0, :]  # El primer componente
componente_2 = Vt[1, :]  # El segundo componente

print("\nRelación de las acciones con el Componente 1:")
for i, valor in enumerate(componente_1):
    print(f"{activos[i]}: {valor}")

print("\nRelación de las acciones con el Componente 2:")
for i, valor in enumerate(componente_2):
    print(f"{activos[i]}: {valor}")

El Componente 1 es el primer vector singular, y está relacionado con el patrón más importante que explica la varianza en los rendimientos de las acciones. Las relaciones de las acciones con este componente reflejan cómo cada acción contribuye al riesgo común o factor de mercado. Las acciones que tienen un valor grande (en valor absoluto) en el Componente 1 están fuertemente correlacionadas con este factor común.

Por ejemplo, las acciones con valores grandes en el Componente 1 incluyen:
- APL (Apple): 0.2417
- GOG (Google): 0.2526
- NVDA (Nvidia): 0.2448

Estas acciones parecen estar fuertemente correlacionadas con el primer componente, lo que sugiere que estas acciones tienen un comportamiento similar o responden de manera similar a un factor común, como puede ser el rendimiento del mercado tecnológico o el riesgo general del mercado.

El Componente 2 está relacionado con un segundo patrón subyacente que, aunque es menos importante que el Componente 1, sigue explicando una parte significativa de la variabilidad en los rendimientos de las acciones. Las relaciones de las acciones con el Componente 2 reflejan cómo las variaciones de los precios de las acciones están asociadas con otro tipo de riesgo o patrón, que podría estar relacionado con factores sectoriales específicos.

Por ejemplo, el Componente 2 tiene relaciones negativas significativas con muchas acciones, como:
- GOOG (Google): -0.1044
- AAPL (Apple): -0.0720
- NVDA (Nvidia): -0.1683
- WMT (Walmart): -0.1034

Sin embargo, NFLX (Netflix) tiene una relación positiva muy alta de 0.8775 con el Componente 2, lo que sugiere que su comportamiento es muy diferente de las otras acciones en este componente. En otras palabras, Netflix puede estar reaccionando a un factores específicos del sector (como cambios en el consumo de medios) que no afectan a otras acciones en el mismo grado.