# 1.1.5.1: Descomposici√≥n de Valor Singular (SVD)

## Objetivos de Aprendizaje

Al completar este notebook, ser√°s capaz de:

- **Explicar** la SVD como la descomposici√≥n de **cualquier** matriz $A$ en $U \Sigma V^T$.
- **Interpretar** geom√©tricamente cada componente: Rotaci√≥n ($V^T$), Escalamiento ($\Sigma$), y Rotaci√≥n ($U$).
- **Utilizar** la SVD para construir **aproximaciones de rango reducido** para la compresi√≥n de datos.
- **Resolver** problemas de m√≠nimos cuadrados de forma robusta usando la **Pseudo-inversa**, derivada de la SVD.
- **Conectar** expl√≠citamente la SVD con el **An√°lisis de Componentes Principales (PCA)**, entendiendo por qu√© es el m√©todo num√©ricamente preferido.

In [None]:
# --- Celda de Configuraci√≥n (Oculta) ---
%display latex
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from scipy import datasets # Para la imagen de ejemplo

def plot_svd_transformation(matrix):
    t = np.linspace(0, 2*np.pi, 100)
    circle = np.vstack((np.cos(t), np.sin(t)))
    U, s, Vt = np.linalg.svd(matrix)
    S = np.diag(s)
    # Asegurarse que las matrices tengan las dimensiones correctas para 2D
    if U.shape[0] > 2:
        U = U[:, :2]
    if Vt.shape[0] > 2:
        Vt = Vt[:2, :]
    if S.shape[0] > 2:
        S = S[:2, :2]
        
    step1 = Vt @ circle
    step2 = S @ step1
    step3 = U @ step2
    
    fig, axs = plt.subplots(1, 4, figsize=(22, 5.5))
    titles = ['1. Original', '2. Rotaci√≥n por $V^T$', '3. Escalamiento por $\Sigma$', '4. Rotaci√≥n por U (Final)']
    data = [circle, step1, step2, step3]
    
    for i, ax in enumerate(axs):
        ax.plot(data[i][0, :], data[i][1, :], lw=3)
        ax.set_title(titles[i], fontsize=14)
        ax.axis('equal'); ax.grid(True)
        ax.axhline(0, color='black', lw=0.5); ax.axvline(0, color='black', lw=0.5)
        
    plt.suptitle('Descomposici√≥n Geom√©trica de una Transformaci√≥n v√≠a SVD', fontsize=18, y=1.02)
    plt.show()

--- 
## ‚öôÔ∏è El Arsenal de Datasets: Nuestra Fuente de Ejercicios

La SVD es la "navaja suiza" del √°lgebra lineal. Para explorarla, necesitamos datasets que nos permitan ver sus superpoderes: compresi√≥n, soluci√≥n de sistemas y su conexi√≥n con PCA. Usaremos im√°genes, datos de estudiantes y matrices con propiedades especiales.

In [None]:
# === CONFIGURACI√ìN DE DATASETS ===
from src.data_generation.create_student_performance import create_student_performance_data
from src.data_generation.create_edge_cases import create_edge_cases
from src.data_generation.create_special_matrices import create_special_matrices

# Configuraci√≥n centralizada de aleatoriedad para REPRODUCIBILIDAD
rng = np.random.default_rng(seed=42)

# === Generaci√≥n de Datasets y Matrices para este Notebook ===

# üí° CONTEXTO PEDAG√ìGICO: Hilo Conductor (Aplicaci√≥n a PCA)
# La conexi√≥n entre SVD y PCA es uno de los resultados m√°s importantes. Usaremos
# nuestros datos de estudiantes para demostrar que la SVD de la matriz de datos nos da
# directamente los componentes principales, de una forma m√°s estable que la eigendescomposici√≥n.
datos_estudiantes = create_student_performance_data(rng, simplified=True, n_samples=200)

# üí° CONTEXTO PEDAG√ìGICO: Compresi√≥n de Datos
# Una imagen es solo una matriz de valores de p√≠xeles. Esto la convierte en el ejemplo
# perfecto para visualizar la aproximaci√≥n de rango reducido, la base de la compresi√≥n.
imagen_mapache = datasets.face(gray=True)

# üí° CONTEXTO PEDAG√ìGICO: M√≠nimos Cuadrados Robusto
# Usaremos un dataset con multicolinealidad para demostrar c√≥mo la pseudo-inversa,
# calculada con SVD, puede resolver problemas de m√≠nimos cuadrados donde las Ecuaciones Normales fallan.
datos_multicolineales = create_edge_cases(rng, case_type='multicollinear', n_samples=50)

print("Datasets y matrices generados y listos para usar.")

## 1. La Gran Intuici√≥n: Toda Matriz es Rotaci√≥n, Escalamiento y Rotaci√≥n

La Descomposici√≥n de Valor Singular (SVD) es posiblemente el teorema m√°s importante del √°lgebra lineal aplicada. Afirma que **cualquier** matriz $A$ de $m \times n$ (incluso no cuadrada) puede ser factorizada en el producto de tres matrices con interpretaciones geom√©tricas muy claras:
$$ A = U \Sigma V^T $$

- **$V^T$ (Primera Rotaci√≥n):** Una matriz **ortogonal** ($n \times n$) que rota el espacio de entrada sin cambiar longitudes ni √°ngulos. Alinea los ejes del espacio de entrada con los ejes principales de la transformaci√≥n.
- **$\Sigma$ (Escalamiento):** Una matriz **diagonal** ($m \times n$) que estira o encoge el espacio a lo largo de los ejes rotados. Sus elementos diagonales $\sigma_i$ son los **valores singulares** de A, y est√°n ordenados de mayor a menor ($\sigma_1 \ge \sigma_2 \ge \dots \ge 0$).
- **$U$ (Segunda Rotaci√≥n):** Otra matriz **ortogonal** ($m \times m$) que rota el espacio de salida resultante a su orientaci√≥n final.

La SVD nos da un desglose completo de la "receta" de cualquier transformaci√≥n lineal: una rotaci√≥n, un escalamiento puro a lo largo de ejes perpendiculares, y una rotaci√≥n final.

### Ejemplo Demostrativo 1: Visualizaci√≥n Geom√©trica de la SVD

In [None]:
# 1. DATOS: Una matriz de transformaci√≥n 2x2 simple.
A = np.array([[3, 0], [2, 2]])

# 2. APLICACI√ìN Y VISUALIZACI√ìN
# La funci√≥n de ayuda `plot_svd_transformation` calcula la SVD y aplica cada paso
# a un c√≠rculo unitario para que podamos ver la descomposici√≥n de la acci√≥n.
plot_svd_transformation(A)

## 2. Aplicaci√≥n 1: Aproximaci√≥n de Rango Reducido (Compresi√≥n)

Los valores singulares en $\Sigma$ est√°n ordenados por "importancia". El primer valor singular, $\sigma_1$, captura la direcci√≥n de mayor acci√≥n de la matriz. Al quedarnos solo con los `k` valores singulares m√°s grandes, podemos reconstruir una matriz $A_k = U_k \Sigma_k V_k^T$ que es la **mejor aproximaci√≥n posible de rango `k`** a la matriz original.

Esto es la base matem√°tica de la **compresi√≥n con p√©rdida** (como en JPEG), el **filtrado de ruido** en datos, y los **sistemas de recomendaci√≥n** (donde se aproxima la matriz gigante de usuario-√≠tem).

### Ejemplo Demostrativo 2: Compresi√≥n de Imagen

In [None]:
# 1. DATOS: Una imagen es solo una matriz de valores de p√≠xeles.
img = imagen_mapache

# 2. APLICACI√ìN: Calculamos la SVD de la matriz de la imagen.
U, s, Vt = np.linalg.svd(img)
Sigma = np.diag(s) # Construimos la matriz diagonal Sigma

print(f"Dimensiones originales: U:{U.shape}, s:{s.shape}, Vt:{Vt.shape}")

# 3. RECONSTRUCCI√ìN Y VISUALIZACI√ìN: Reconstruimos la imagen usando diferentes n√∫meros de valores singulares (k).
fig, axs = plt.subplots(1, 5, figsize=(25, 5))
ranks = [5, 20, 50, 100, len(s)]

for i, k in enumerate(ranks):
    # Tomamos las primeras k columnas de U, k valores singulares, y k filas de Vt
    A_k = U[:, :k] @ Sigma[:k, :k] @ Vt[:k, :]
    
    # Calculamos el ratio de compresi√≥n (aproximado)
    original_size = img.shape[0] * img.shape[1]
    compressed_size = U[:, :k].size + s[:k].size + Vt[:k, :].size
    ratio = compressed_size / original_size * 100
    
    axs[i].imshow(A_k, cmap='gray')
    title = f'Original' if k == len(s) else f'Rango k = {k}'
    axs[i].set_title(f'{title}\n({ratio:.1f}% del tama√±o)')
    axs[i].axis('off')

plt.suptitle('Compresi√≥n de Imagen usando SVD de Rango Reducido', fontsize=18, y=1.02); plt.show()

## 3. Aplicaci√≥n 2: La Pseudoinversa y M√≠nimos Cuadrados

Cuando resolvimos $X\vec{\beta}=\vec{y}$ con las Ecuaciones Normales, necesit√°bamos que $X^T X$ fuera invertible. Pero, ¬øqu√© pasa si hay multicolinealidad perfecta y $X^T X$ es singular? La SVD nos da una soluci√≥n m√°s general y num√©ricamente estable: la **pseudoinversa de Moore-Penrose**.

La pseudoinversa de $A = U \Sigma V^T$ se calcula como $ A^+ = V \Sigma^+ U^T $, donde $\Sigma^+$ se obtiene de $\Sigma$ tomando el rec√≠proco ($1/\sigma_i$) de los valores singulares **no nulos**.

La soluci√≥n de m√≠nimos cuadrados de norma m√≠nima para $A\vec{x}=\vec{b}$ es simplemente:
$$ \hat{x} = A^+ \vec{b} $$
Este m√©todo es el m√°s robusto para resolver regresiones lineales, y es lo que funciones como `np.linalg.lstsq` usan internamente.

### Ejemplo Demostrativo 3: SVD para Regresi√≥n Robusta

In [None]:
# 1. DATOS: Usamos el dataset con multicolinealidad perfecta.
X_raw = datos_multicolineales[['x1', 'x2', 'x3']].values
X = np.c_[np.ones(X_raw.shape[0]), X_raw] # A√±adimos intercepto
y = datos_multicolineales['y'].values

# 2. APLICACI√ìN: Resolvemos usando la pseudoinversa.
X_plus = np.linalg.pinv(X) # Calculamos la pseudoinversa
beta_hat = X_plus @ y

# 3. INTERPRETACI√ìN
print("Matriz X (con multicolinealidad perfecta):")
print(X[:5])
print(f"\nN√∫mero de Condici√≥n de X·µÄX: {np.linalg.cond(X.T @ X):.2e} (Extremadamente alto)")
print("\nLas Ecuaciones Normales fallar√≠an aqu√≠.")
print(f"\nSoluci√≥n de M√≠nimos Cuadrados v√≠a Pseudoinversa (SVD):")
print(f"Œ≤_hat = {np.round(beta_hat, 4)}")
print("\nLa SVD encuentra una soluci√≥n estable y de norma m√≠nima incluso en casos de dependencia lineal perfecta.")

## 4. Conexi√≥n Final: SVD y PCA

La conexi√≥n entre SVD y PCA es profunda y elegante. Mientras que PCA se define a trav√©s de la eigendescomposici√≥n de la matriz de covarianza, resulta que la SVD de la matriz de datos (centrada) nos da los mismos resultados de una forma num√©ricamente m√°s estable.

- Las **columnas de $V$** (los vectores singulares derechos) son los **Componentes Principales** (los eigenvectores de la matriz de covarianza).
- Los **valores singulares ($s$) al cuadrado** son proporcionales a los **eigenvalores** de la matriz de covarianza (la varianza explicada por cada componente).

---
## 5. Ejercicios Guiados con Scaffolding (8+)
Rellena las partes marcadas con `# COMPLETAR` para afianzar tu comprensi√≥n.

### === EJERCICIO GUIADO 1: Descomponiendo una Matriz ===

In [None]:
# DATOS
A = np.array([[1, 2, 3], [4, 5, 6]])

# TODO: Calcula la SVD de A.
# PISTA: Usa np.linalg.svd().
U, s, Vt = # COMPLETAR

# VERIFICACI√ìN
assert U.shape == (2, 2)
assert s.shape == (2,)
assert Vt.shape == (3, 3)
print("‚úÖ ¬°SVD calculada correctamente!")
print(f"Forma de U: {U.shape}")
print(f"Valores singulares s: {s}")
print(f"Forma de V·µÄ: {Vt.shape}")

### === EJERCICIO GUIADO 2: Reconstruyendo desde SVD ===

In [None]:
# DATOS: Los componentes U, s, Vt del ejercicio anterior.
A = np.array([[1, 2, 3], [4, 5, 6]])
U, s, Vt = np.linalg.svd(A)

# Para reconstruir, Sigma (Œ£) debe tener la misma forma que A.
# TODO 1: Crea una matriz de ceros con la forma de A.
Sigma = # COMPLETAR

# TODO 2: Rellena la diagonal de Sigma con los valores singulares 's'.
# PISTA: Sigma[:A.shape[1], :A.shape[1]] = np.diag(s)
# COMPLETAR

# TODO 3: Reconstruye A multiplicando U @ Sigma @ Vt.
A_reconstruida = # COMPLETAR

# VERIFICACI√ìN
assert np.allclose(A, A_reconstruida)
print("‚úÖ ¬°Matriz reconstruida con √©xito!")
print(np.round(A_reconstruida, 2))

### === EJERCICIO GUIADO 3: Aproximaci√≥n de Rango 1 ===

In [None]:
# DATOS: U, s, Vt de la matriz A.
A = np.array([[1, 2, 3], [4, 5, 6]])
U, s, Vt = np.linalg.svd(A)
k = 1 # Rango de la aproximaci√≥n

# TODO 1: Selecciona las primeras 'k' columnas de U.
Uk = # COMPLETAR

# TODO 2: Selecciona los primeros 'k' valores singulares y ponlos en una matriz diagonal.
Sk = # COMPLETAR

# TODO 3: Selecciona las primeras 'k' filas de Vt.
Vtk = # COMPLETAR

# TODO 4: Calcula la aproximaci√≥n de rango k.
A_k = # COMPLETAR

assert A_k.shape == A.shape
print(f"‚úÖ Aproximaci√≥n de Rango {k} calculada:")
print(np.round(A_k, 2))

### === EJERCICIO GUIADO 4: Resolver OLS con Pseudoinversa ===

In [None]:
# DATOS: Matriz de dise√±o X y vector y del Hilo Conductor.
X_feature = datos_estudiantes[['horas_estudio']].values
X = np.c_[np.ones(X_feature.shape[0]), X_feature]
y = datos_estudiantes['calificacion_examen'].values

# TODO 1: Calcula la pseudoinversa de X.
# PISTA: Usa np.linalg.pinv().
X_plus = # COMPLETAR

# TODO 2: Calcula la soluci√≥n de m√≠nimos cuadrados beta_hat.
beta_hat = # COMPLETAR

# VERIFICACI√ìN
beta_lstsq, _, _, _ = np.linalg.lstsq(X, y, rcond=None)
assert np.allclose(beta_hat, beta_lstsq)
print("‚úÖ ¬°OLS resuelto con pseudoinversa!")
print(f"Œ≤_hat = {np.round(beta_hat, 2)}")

--- 
# 5. Banco de Ejercicios Pr√°cticos (30+)
Ahora te toca a ti. Resuelve estos ejercicios para consolidar tu conocimiento.

### Parte A: C√°lculo y Aproximaci√≥n

**A1 (üü¢ F√°cil):** Calcula la SVD de $A = \begin{pmatrix} 3 & 0 \\ 0 & -2 \end{pmatrix}$. ¬øQu√© son U, s y Vt en este caso simple?

**A2 (üü¢ F√°cil):** Calcula la SVD de la matriz de rotaci√≥n $R = \begin{pmatrix} 0 & -1 \\ 1 & 0 \end{pmatrix}$. ¬øQu√© valores singulares obtienes? ¬øTiene sentido?

**A3 (üü° Medio):** Dada la matriz $M = \begin{pmatrix} 1 & 1 & 0 \\ 0 & 1 & 1 \end{pmatrix}$, calcula su SVD y su mejor aproximaci√≥n de rango 1.

**A4 (üü° Medio):** Genera una matriz aleatoria de 100x50. Calcula su SVD y luego reconstr√∫yela usando solo los 10 valores singulares m√°s grandes.

**A5 (üî¥ Reto):** La norma de Frobenius de una matriz es $\|A\|_F = \sqrt{\sum_{i,j} A_{ij}^2}$. Tambi√©n es igual a la ra√≠z cuadrada de la suma de los cuadrados de sus valores singulares. Genera una matriz 5x3 aleatoria y verifica esta propiedad.

### Parte B: Aplicaciones (Pseudoinversa y PCA)

**B1 (üü¢ F√°cil):** Usa `np.linalg.pinv` para calcular la pseudoinversa de $A = \begin{pmatrix} 1 \\ 2 \end{pmatrix}$ (un vector columna).

**B2 (üü° Medio):** Usa `np.linalg.pinv` para calcular la pseudoinversa de la matriz singular $S = \begin{pmatrix} 1 & 2 \\ 2 & 4 \end{pmatrix}$.

**B3 (üü° Medio):** Resuelve el problema de regresi√≥n simple para `datos_estudiantes` usando la pseudoinversa y verifica que los coeficientes coinciden con los de `lstsq`.

**B4 (üî¥ Reto):** Resuelve la regresi√≥n m√∫ltiple para el dataset `datos_multicolineales` usando la pseudoinversa. Compara tus coeficientes $\beta$ con los que obtendr√≠as de `lstsq`.

**B5 (üî¥ Reto):** Toma los datos de estudiantes centrados del Ejemplo 3. Proyecta los datos sobre el primer componente principal (la primera columna de V, o `Vt.T[:, 0]`). El resultado es la "coordenada" de cada estudiante a lo largo del eje m√°s importante. Haz un histograma de estas coordenadas.

---

## ‚úÖ Mini-Quiz de Autoevaluaci√≥n

*Responde estas preguntas para verificar tu comprensi√≥n.*

1. ¬øCu√°les son las tres matrices que componen la SVD de una matriz A y qu√© representa geom√©tricamente cada una?
2. ¬øPara qu√© tipo de problemas de regresi√≥n es la pseudoinversa (calculada v√≠a SVD) particularmente √∫til?
3. ¬øQu√© componentes de la SVD de una matriz de datos (centrada) corresponden a los Componentes Principales de PCA?
4. Verdadero o Falso: La SVD solo se puede aplicar a matrices cuadradas.

## üöÄ Pr√≥ximos Pasos (Cierre del √Årea 1.1)

**¬°Felicidades, has llegado a la cima del √Ålgebra Lineal aplicada!** Con la SVD, tienes la herramienta m√°s poderosa y robusta para analizar y manipular matrices. Has conectado todos los puntos, desde la definici√≥n de un vector hasta la implementaci√≥n de PCA usando SVD, demostrando c√≥mo la teor√≠a abstracta potencia las aplicaciones m√°s importantes de la ciencia de datos.

- **Siguiente Parada:** **√Årea 1.2: C√°lculo**. Cambiaremos de marcha para explorar la matem√°tica del cambio. Descubriremos c√≥mo las derivadas nos permiten encontrar la "pendiente" en espacios de alta dimensi√≥n, una idea fundamental para entrenar y optimizar casi todos los modelos de Machine Learning mediante algoritmos como el Descenso de Gradiente.