Лекция 9:
* Сингулярное разложение
* Простой итерационный алгоритм сингулярного разложения 
* Метод Якоби

# Сингулярное разложение: 

Теорема : 
Пусть дана матрица $A$ размера $m$ на $n$. Тогда существуют такие ортнормированные базисы $e^k$  и $q^l$ и положительные числа $\sigma_1 \geq \sigma_2\geq ...\geq \sigma_r$ и $0\geq r \geq min(n, m)$ такие, что:

$Ae^k = \begin{cases}\sigma_k q^k, k\leq r\\ 0, k > r \end{cases}$.

Числа $\sigma$ называются сингулярными числами, а базисы называются сингуляными базисами. Тут $r$ - ранг матрицы $A$.

Докажем :

Матрица $A^* A$ - самосопряжена и неотрицательно определена. Все её собственные числа неотрицательны, и есть базис собственных векторов $e^k$. Тогда:

$A*Ax =\sigma_k^2 xe^k, k = 1, 2, ..., n$

Будем считать, что все сигма упорядочены по убыванию. Положим $z^k =Ae^k$ и заметим: 
$(z^p, z^q) = (Ae^p, Ae^q) = \sigma_p^2(e^p, e^q)$, откуда:

$(z^p, z^q) = \begin{cases}0, p\neq q\\ \sigma_p^2, p = q \end{cases}$

Следовательно векторы $q^k =\sigma_p^{-1}Ae^k$ образуют ортнормированную систему в пространстве $\mathbb{C}^m$. ЧТД.

Рассмотрим в матричном виде:

$M = U\Sigma V^*$, где $\Sigma$ - матрица размера $m$ на $n$, на диагонали которой лежат сингулярный числа, а все остальные элементы нулевые. Матрицы $U, V$ состоят из левых и правых сингулярных векторов соответсвенно.
* Левые сингулярные вектора - собственные вектора матрицы $MM^*$
* Правые сингулярные вектора - собственные вектора матрицы $M^*M$

Применение сингулярного разложения:
* Полярное разложение
* Решение СЛАУ
* Приближение матрицей меньшего ранга
* Сокращение объема памяти изображений без существенных потерь качества 

# Простой итерационный алгоритм

Основная процедура — поиск наилучшего приближения произвольной $ m \times n$  матрицы $X=(x_{ij})$ матрицей вида $b \otimes a = (b_i a_j)$ (где b — m-мерный вектор, а a — n-мерный вектор) методом наименьших квадратов:


$F(b, a) = \frac{1}{2}\sum_{i=1}^m \sum_{j=1}^n (x_{ij} - b_i a_j )^2 \to \min$


Решение этой задачи дается последовательными итерациями по явным формулам. При фиксированном векторе $a=(a_j)$  значения $b=(b_i)$ , доставляющие минимум форме $F(b, a)$ , однозначно и явно определяются из равенств $\partial F/ \partial b_i = 0$ :

$\frac{\partial F}{\partial b_i}$ $= - \sum_{j=1}^n (x_{ij} - b_i a_j )a_j = 0$; $b_i = \frac{\sum_{j=1}^n x_{ij}  a_j}{\sum_{j=1}^n a_j^2 } $. 


Аналогично, при фиксированном векторе $b =(b_ i)$  определяются значения $a=(a_j)$ :

$a_j = \frac{\sum_{i=1}^m b_i x_{ij} }{\sum_{i =1}^m b_i ^2 } $. 


B качестве начального приближения вектора $a$ возьмем случайный вектор единичной длины, вычисляем вектор $b$, далее для этого вектора $b$ вычисляем вектор $a$ и т. д. Каждый шаг уменьшает значение $F(b, a)$ . В качестве критерия остановки используется малость относительного уменьшения значения минимизируемого функционала $F(b, a)$  за шаг итерации $(\Delta F / F )$ или малость самого значения $F$.

В результате для матрицы $X=(x_{ij})$ получили наилучшее приближение матрицей $P_1$ вида $b^1 \otimes a^1 = (b_i^1  a_j^1)$ (здесь верхним индексом обозначен номер итерации). Далее, из матрицы $X$ вычитаем полученную матрицу $P_1$, и для полученной матрицы уклонений $X_1=X-P_1$ вновь ищем наилучшее приближение $P_2 $этого же вида и т. д., пока, например, норма $X_k$ не станет достаточно малой. В результате получили итерационную процедуру разложения матрицы X в виде суммы матриц ранга 1, то есть $X=P_1+P_2+... +P_q $ $(P_l = b^l \otimes a^l) $ . Полагаем  $\sigma_l = \|a^l\| \|b^l\|$ и нормируем векторы  $a^l \, , \, b^l: a^l:= a^l/ \| a^l\|; \, \, b^l:= b^l/ \| b^l\| $. В результате получена аппроксимация сингулярных чисел $ \sigma_l$  и сингулярных векторов (правых —  $a^l$ и левых — $b^l$).

К достоинствам этого алгоритма относится его исключительная простота и возможность почти без изменений перенести его на данные с пробелами, а также взвешенные данные.

Существуют различные модификации базового алгоритма, улучшающие точность и устойчивость. Например, векторы главных компонент $a^l$ при разных $l$ должны быть ортогональны «по построению», однако при большом числе итерации (большая размерность, много компонент) малые отклонения от ортогональности накапливаются и может потребоваться специальная коррекция $a^l$ на каждом шаге, обеспечивающая его ортогональность ранее найденным главным компонентам.

# Метод Якоби (вращений)

На каждом шаге вычисляется вращение Якоби $J$, с помощью которого матрица $G^\top G$ неявно пересчитывается в $J^\top G^\top GJ$; вращение выбрано так, чтобы пара внедиагональных элементов из $G^\top G$ обратилась в нули в матрице $J^\top G^\top GJ$. При этом ни $G^\top G$, ни $J^\top G^\top GJ$ не вычисляются в явном виде; вместо них вычисляется матрица $GJ$. Поэтому алгоритм называется методом односторонних вращений.

Пусть $a_{ij}$ - элемент, расположенный в i-ой строке и j-ом столбце матрицы $G^\top G$.

$τ=(a_{jj}−a_{kk})/(2⋅a_{jk})$

$t=\frac{sign(τ)}{|\tau| + \sqrt{1 + \tau^2}}$. При $τ=0$ считаем $sign(τ)=1$, то есть $θ=\frac{\pi}{4}$.

$c=\frac{1}{\sqrt{1 + t^2}}$, где $c=cosθ$

$s=c⋅t$, где $s=sinθ$

$G=G⋅R(j,k,θ)$

$J=J⋅R(j,k,θ)$

Здесь $R(j,k,θ)$ — матрица вращений Якоби, которая имеет следующий вид:




Одностороннее вращение Якоби в координатной плоскости $i,j$ вычисляется в том случае, если элемент $a_{ij}$ удовлетворяет условию: $|a_{ij}| ≥ε\sqrt{a_{ii}a_{jj}}$.