# Сингулярне розкладання (SVD) - Візуалізація

## Що таке SVD?

Singular Value Decomposition (SVD) - це метод розкладання матриці A на три матриці:

$$A = U \Sigma V^T$$

де:
- **U** - ліва сингулярна матриця (ортонормовані стовпці)
- **Σ** (сигма) - діагональна матриця з сингулярними значеннями
- **V^T** - транспонована права сингулярна матриця (ортонормовані рядки)

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import matplotlib.patches as patches
from matplotlib.patches import FancyBboxPatch

# Налаштування для кращого відображення
plt.rcParams['figure.figsize'] = (16, 10)
plt.rcParams['font.size'] = 12

## Крок 1: Створюємо початкову матрицю A

Створимо просту матрицю 4×4 для демонстрації SVD розкладання.

In [None]:
# Створюємо матрицю A (4x4)
A = np.array([
    [4, 0, 0, 0],
    [3, 3, 0, 0],
    [2, 2, 2, 0],
    [1, 1, 1, 1]
], dtype=float)

print("Матриця A:")
print(A)
print(f"\nРозмір: {A.shape}")

## Крок 2: Виконуємо SVD розкладання

На цьому етапі ми розкладаємо матрицю A на три складові:
- **U**: містить ліві сингулярні вектори (базис для простору стовпців)
- **Σ**: містить сингулярні значення (масштабні коефіцієнти)
- **V^T**: містить праві сингулярні вектори (базис для простору рядків)

In [None]:
# Виконуємо SVD
U, sigma, Vt = np.linalg.svd(A)

# Створюємо діагональну матрицю Σ
Sigma = np.zeros_like(A)
np.fill_diagonal(Sigma, sigma)

print("U (ліва сингулярна матриця):")
print(U)
print(f"\nРозмір U: {U.shape}")

print("\n" + "="*50)
print("\nΣ (діагональна матриця сингулярних значень):")
print(Sigma)
print(f"\nСингулярні значення: {sigma}")
print(f"Розмір Σ: {Sigma.shape}")

print("\n" + "="*50)
print("\nV^T (транспонована права сингулярна матриця):")
print(Vt)
print(f"\nРозмір V^T: {Vt.shape}")

## Крок 3: Візуалізація SVD розкладання

Тепер візуалізуємо як матриця A розкладається на три матриці.

In [None]:
def draw_matrix(ax, data, title, color_map='viridis', labels=None):
    """Малює матрицю з кольоровим кодуванням"""
    im = ax.imshow(data, cmap=color_map, aspect='auto', vmin=-1, vmax=np.max(data))
    ax.set_title(title, fontsize=14, fontweight='bold')
    
    # Додаємо значення в клітинки
    for i in range(data.shape[0]):
        for j in range(data.shape[1]):
            text = ax.text(j, i, f'{data[i, j]:.2f}',
                          ha="center", va="center", color="white", fontsize=10)
    
    if labels:
        ax.set_xlabel(labels)
    
    ax.set_xticks(range(data.shape[1]))
    ax.set_yticks(range(data.shape[0]))
    return im

# Створюємо фігуру для візуалізації
fig, axes = plt.subplots(1, 5, figsize=(20, 4))

# Матриця A
draw_matrix(axes[0], A, 'A\n(4×4)', 'gray')

# Знак рівності
axes[1].text(0.5, 0.5, '=', fontsize=40, ha='center', va='center', transform=axes[1].transAxes)
axes[1].axis('off')

# Матриця U
draw_matrix(axes[2], U, 'U\n(4×4)', 'Blues')

# Матриця Σ
draw_matrix(axes[3], Sigma, 'Σ\n(4×4)', 'Oranges')

# Матриця V^T
draw_matrix(axes[4], Vt, 'V^T\n(4×4)', 'Greens')

plt.tight_layout()
plt.savefig('/home/claude/svd_decomposition.png', dpi=150, bbox_inches='tight')
plt.show()

print("\n✓ SVD розкладання виконано успішно!")

## Крок 4: Перевірка правильності розкладання

Перевіримо, що U × Σ × V^T дійсно дорівнює A.

In [None]:
# Відновлюємо матрицю A
A_reconstructed = U @ Sigma @ Vt

print("Відновлена матриця A (U × Σ × V^T):")
print(A_reconstructed)

print("\nОригінальна матриця A:")
print(A)

print("\nРізниця (похибка):")
print(A - A_reconstructed)

print(f"\nМаксимальна похибка: {np.max(np.abs(A - A_reconstructed)):.2e}")

## Крок 5: Розкладання на ранг-1 компоненти

SVD дозволяє представити матрицю як суму ранг-1 матриць. Кожна компонента це:

$$A = \sigma_1 u_1 v_1^T + \sigma_2 u_2 v_2^T + \sigma_3 u_3 v_3^T + \sigma_4 u_4 v_4^T$$

де:
- σᵢ - сингулярне значення (важливість компоненти)
- uᵢ - i-й стовпець матриці U
- vᵢᵀ - i-й рядок матриці V^T

In [None]:
# Розкладаємо на ранг-1 компоненти
fig, axes = plt.subplots(1, 4, figsize=(20, 5))

for i in range(4):
    # Створюємо ранг-1 матрицю: σᵢ × uᵢ × vᵢᵀ
    rank1_component = sigma[i] * np.outer(U[:, i], Vt[i, :])
    
    im = axes[i].imshow(rank1_component, cmap='RdBu_r', aspect='auto', 
                        vmin=-np.max(np.abs(rank1_component)), 
                        vmax=np.max(np.abs(rank1_component)))
    axes[i].set_title(f'Компонента {i+1}\nσ_{i+1} = {sigma[i]:.2f}', 
                      fontsize=14, fontweight='bold')
    
    # Додаємо значення
    for row in range(4):
        for col in range(4):
            axes[i].text(col, row, f'{rank1_component[row, col]:.2f}',
                        ha="center", va="center", color="black", fontsize=9)
    
    axes[i].set_xticks(range(4))
    axes[i].set_yticks(range(4))
    plt.colorbar(im, ax=axes[i], fraction=0.046, pad=0.04)

plt.tight_layout()
plt.savefig('/home/claude/svd_rank1_components.png', dpi=150, bbox_inches='tight')
plt.show()

print("\nСингулярні значення (важливість кожної компоненти):")
for i, s in enumerate(sigma):
    percentage = (s / np.sum(sigma)) * 100
    print(f"σ_{i+1} = {s:.4f} ({percentage:.1f}% від загальної енергії)")

## Крок 6: Кумулятивна сума компонент

Показуємо як послідовне додавання компонент наближає оригінальну матрицю.

In [None]:
fig, axes = plt.subplots(1, 5, figsize=(22, 4))

# Перша компонента
cumulative = np.zeros_like(A)

for i in range(4):
    rank1_component = sigma[i] * np.outer(U[:, i], Vt[i, :])
    cumulative += rank1_component
    
    im = axes[i].imshow(cumulative, cmap='gray', aspect='auto', vmin=0, vmax=np.max(A))
    axes[i].set_title(f'Сума перших {i+1} компонент', fontsize=12, fontweight='bold')
    
    for row in range(4):
        for col in range(4):
            axes[i].text(col, row, f'{cumulative[row, col]:.1f}',
                        ha="center", va="center", color="white", fontsize=9)
    
    axes[i].set_xticks(range(4))
    axes[i].set_yticks(range(4))

# Оригінальна матриця
im = axes[4].imshow(A, cmap='gray', aspect='auto', vmin=0, vmax=np.max(A))
axes[4].set_title('Оригінал A', fontsize=12, fontweight='bold')
for row in range(4):
    for col in range(4):
        axes[4].text(col, row, f'{A[row, col]:.1f}',
                    ha="center", va="center", color="white", fontsize=9)
axes[4].set_xticks(range(4))
axes[4].set_yticks(range(4))

plt.tight_layout()
plt.savefig('/home/claude/svd_cumulative.png', dpi=150, bbox_inches='tight')
plt.show()

## Крок 7: Апроксимація низького рангу

Одна з найважливіших властивостей SVD - можливість наближення матриці використовуючи тільки найважливіші компоненти.

In [None]:
# Апроксимація різними рангами
fig, axes = plt.subplots(2, 3, figsize=(15, 10))
axes = axes.flatten()

ranks = [1, 2, 3, 4]

for idx, k in enumerate(ranks):
    # Апроксимація рангу k
    Sigma_k = Sigma.copy()
    Sigma_k[:, k:] = 0  # Обнуляємо менші сингулярні значення
    Sigma_k[k:, :] = 0
    
    A_k = U @ Sigma_k @ Vt
    
    im = axes[idx].imshow(A_k, cmap='gray', aspect='auto', vmin=0, vmax=np.max(A))
    axes[idx].set_title(f'Апроксимація рангу {k}\nПохибка: {np.linalg.norm(A - A_k):.2f}', 
                        fontsize=12, fontweight='bold')
    
    for row in range(4):
        for col in range(4):
            axes[idx].text(col, row, f'{A_k[row, col]:.1f}',
                          ha="center", va="center", color="white", fontsize=10)
    
    axes[idx].set_xticks(range(4))
    axes[idx].set_yticks(range(4))
    plt.colorbar(im, ax=axes[idx], fraction=0.046, pad=0.04)

# Оригінал
im = axes[4].imshow(A, cmap='gray', aspect='auto', vmin=0, vmax=np.max(A))
axes[4].set_title('Оригінальна матриця A', fontsize=12, fontweight='bold')
for row in range(4):
    for col in range(4):
        axes[4].text(col, row, f'{A[row, col]:.1f}',
                    ha="center", va="center", color="white", fontsize=10)
axes[4].set_xticks(range(4))
axes[4].set_yticks(range(4))
plt.colorbar(im, ax=axes[4], fraction=0.046, pad=0.04)

# Приховуємо останню комірку
axes[5].axis('off')

plt.tight_layout()
plt.savefig('/home/claude/svd_approximations.png', dpi=150, bbox_inches='tight')
plt.show()

## Крок 8: Практичне застосування - стиснення зображення

Створимо просте зображення і покажемо як SVD може його стиснути.

In [None]:
# Створюємо тестове зображення 20x20
image = np.zeros((20, 20))

# Додаємо круг
center = (10, 10)
for i in range(20):
    for j in range(20):
        distance = np.sqrt((i - center[0])**2 + (j - center[1])**2)
        if distance < 7:
            image[i, j] = 255 - distance * 20

# SVD зображення
U_img, sigma_img, Vt_img = np.linalg.svd(image)

# Відображаємо різні рівні стиснення
fig, axes = plt.subplots(2, 4, figsize=(16, 8))
axes = axes.flatten()

ranks = [1, 2, 3, 5, 7, 10, 15, 20]

for idx, k in enumerate(ranks):
    # Реконструкція з k компонентами
    Sigma_k = np.zeros((k, k))
    np.fill_diagonal(Sigma_k, sigma_img[:k])
    
    img_reconstructed = U_img[:, :k] @ Sigma_k @ Vt_img[:k, :]
    
    axes[idx].imshow(img_reconstructed, cmap='gray')
    axes[idx].set_title(f'Ранг {k}\n({(k*2*20/(20*20)*100):.1f}% пам\'яті)', fontsize=11)
    axes[idx].axis('off')

plt.tight_layout()
plt.savefig('/home/claude/svd_image_compression.png', dpi=150, bbox_inches='tight')
plt.show()

print("\nСтиснення зображення:")
print(f"Оригінальний розмір: {20*20} значень")
for k in [1, 5, 10, 15]:
    compressed_size = k * (20 + 20 + 1)  # U стовпці + V рядки + sigma
    ratio = compressed_size / (20*20) * 100
    print(f"Ранг {k:2d}: {compressed_size:4d} значень ({ratio:.1f}% від оригіналу)")

## Крок 9: Властивості SVD

Перевіримо важливі властивості сингулярних векторів.

In [None]:
print("=" * 60)
print("ВЛАСТИВОСТІ МАТРИЦІ U (ортонормовані стовпці)")
print("=" * 60)

# Перевірка ортонормованості U
UtU = U.T @ U
print("\nU^T × U (повинна бути одиничною матрицею):")
print(np.round(UtU, 4))

print("\n" + "=" * 60)
print("ВЛАСТИВОСТІ МАТРИЦІ V (ортонормовані рядки V^T)")
print("=" * 60)

# Перевірка ортонормованості V
VtV = Vt.T @ Vt
print("\nV × V^T (повинна бути одиничною матрицею):")
print(np.round(VtV, 4))

print("\n" + "=" * 60)
print("ЕНЕРГІЯ СИНГУЛЯРНИХ ЗНАЧЕНЬ")
print("=" * 60)

# Розподіл енергії
energy = sigma**2
energy_percent = (energy / np.sum(energy)) * 100
cumulative_energy = np.cumsum(energy_percent)

print("\nРозподіл енергії по компонентам:")
for i in range(len(sigma)):
    print(f"Компонента {i+1}: {energy_percent[i]:6.2f}% | Кумулятивно: {cumulative_energy[i]:6.2f}%")

## Підсумок

### Що ми дізналися про SVD:

1. **Розкладання**: Будь-яку матрицю A можна розкласти на три матриці: U, Σ, і V^T

2. **Ортогональність**: Стовпці U і рядки V^T ортонормовані (взаємно перпендикулярні одиничні вектори)

3. **Сингулярні значення**: Діагональні елементи Σ показують "важливість" кожної компоненти

4. **Ранг-1 розкладання**: Матрицю можна представити як суму простіших ранг-1 матриць

5. **Апроксимація**: Можна використовувати тільки найважливіші компоненти для наближення

6. **Застосування**: 
   - Стиснення даних та зображень
   - Зменшення розмірності
   - Видалення шуму
   - Рекомендаційні системи
   - Латентний семантичний аналіз

### Формула:
$$A = U \Sigma V^T = \sum_{i=1}^{r} \sigma_i u_i v_i^T$$

де r - ранг матриці A.