### 特異値分解の詳細
$ \mathbf{A}^T \mathbf{A} = \mathbf{V} \mathbf{\Sigma}^T \mathbf{\Sigma} \mathbf{V}^T = \mathbf{V}
\begin{bmatrix}
\sigma_1^2 & 0 & \cdots & 0 \\
0 & \sigma_2^2 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & \sigma_n^2
\end{bmatrix}
\mathbf{V}^T $

ここで、$\sigma_i$ は特異値です。行列の特異値分解は、特異値が対角要素に並ぶ形で、行列の特性を解析するのに使われます。

特異値分解の結果、行列 $\mathbf{A}$ の固有値の平方根で表される特異値を使って行列の範囲とランクを決定することができます。

### 特異値分解 (SVD) の詳細

特異値分解 (Singular Value Decomposition, SVD) では、行列 $\mathbf{A}$ を次のように分解します：
$ \mathbf{A} = \mathbf{U} \mathbf{\Sigma} \mathbf{V}^T $

ここで、$\mathbf{U}$ と $\mathbf{V}$ は直交行列、$\mathbf{\Sigma}$ は特異値を対角成分とする対角行列です。

- **$\mathbf{U}$**: 左特異ベクトル (Left singular vectors)  
- **$\mathbf{V}$**: 右特異ベクトル (Right singular vectors)  
- 特異値が非ゼロであるベクトルの数は、行列 $\mathbf{A}$ のランクに等しい。
$ \text{rank}(\mathbf{A}) = \text{rank}(\mathbf{A}^T \mathbf{A}) = \text{rank}(\mathbf{A} \mathbf{A}^T) $

### 特異値分解の構造

例えば、行列 $\mathbf{A}$ を次の形で表すと、
$ \mathbf{A} =
\begin{bmatrix}
\mathbf{v}_1 & \mathbf{v}_2 & \ldots
\end{bmatrix}
=
\begin{bmatrix}
\mathbf{u}_1 & \mathbf{u}_2 & \ldots
\end{bmatrix}
\begin{bmatrix}
\sigma_1 & 0 & \ldots \\
0 & \sigma_2 & \ldots \\
\vdots & \vdots & \ddots
\end{bmatrix} $

特異値の変換は次のようになります：
$ \mathbf{A} \mathbf{v}_1 = \sigma_1 \mathbf{u}_1, \quad \mathbf{A} \mathbf{v}_2 = \sigma_2 \mathbf{u}_2 $

#### 行列の変換の順序

入力 $\mathbf{x}$ はまず $\mathbf{V}^T$ で変換され、次に $\mathbf{\Sigma}$ を介してスケーリングされ、最後に $\mathbf{U}$ で出力されます：
$ \mathbf{x} \to \mathbf{A} \to \mathbf{U} \mathbf{\Sigma} \mathbf{V}^T \mathbf{x} $

この順序で変換され、特異値がゼロでない部分だけが変換に寄与します。

---

### 特異値と行列の行列式

行列 $\mathbf{U}$ が直交行列である場合、その行列式は次のように1になります：
$ \text{det}(\mathbf{U} \mathbf{U}^T) = \text{det}(\mathbf{I}) = 1 $

特異値の例として、$\mathbf{U} \mathbf{x} = \lambda \mathbf{x}$ を考えると、
$ \mathbf{x}^T \mathbf{U}^T \mathbf{U} \mathbf{x} = \lambda^2 \mathbf{x}^T \mathbf{x}, \quad \lambda = \pm 1 $

---

### 具体例

次に、行列 $\mathbf{A}$ の具体例を考えます：
$ \mathbf{A} =
\begin{bmatrix}
2 & 2
\end{bmatrix}
=
\begin{bmatrix}
\frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2}
\end{bmatrix}
\begin{bmatrix}
3 & 0 \\
0 & 1
\end{bmatrix}
\begin{bmatrix}
\frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2}
\end{bmatrix} $

この分解により、行列 $\mathbf{A}$ の性質が視覚的に理解しやすくなり、特異値が行列のスケーリングの強度を示すことが分かります。

---

特異値分解は、行列のランク、範囲、カーネルの構造を明確にし、さまざまな応用、特に信号処理やデータ圧縮において重要な役割を果たします。

### データ圧縮と特異値分解 (SVD)

特異値分解 (SVD) は、正方行列でなくても非対称行列にも適用可能なデータ圧縮手法です。
$ \mathbf{A} = \mathbf{U} \mathbf{\Sigma} \mathbf{V}^T $

- $\mathbf{U}$: 左特異ベクトル
- $\mathbf{\Sigma}$: 特異値の対角行列
- $\mathbf{V}$: 右特異ベクトル

例えば、$100 \times 200$ 行列の例：
$ \mathbf{A} = [\mathbf{u}_1, \mathbf{u}_2, \ldots]
\begin{bmatrix}
\sigma_1 & 0 & \ldots \\
0 & \sigma_2 & \ldots \\
\vdots & \vdots & \ddots
\end{bmatrix}
[\mathbf{v}_1^T, \mathbf{v}_2^T, \ldots] $

#### データ圧縮の具体例

次のような形でデータを分解できます：
$ \mathbf{A} = \sigma_1 \mathbf{u}_1 \mathbf{v}_1^T + \sigma_2 \mathbf{u}_2 \mathbf{v}_2^T + \ldots $

特異値の大きい順に並べて、主要な成分を保つことによりデータの次元を縮小できます。例えば、20,000個のデータを60次元に圧縮することができます。

---

### 主成分分析 (PCA: Principal Component Analysis)

主成分分析 (PCA) では、データの分散を最大化する方向を見つけます。PCAでは、次の最適化問題を解きます：
$ \max_u u^T \mathbf{R} u $

ここで、$\mathbf{R}$ は共分散行列です：
$ \mathbf{R} = \frac{1}{N} \sum_i d_i d_i^T = \frac{1}{N} \mathbf{D} \mathbf{D}^T $

行列 $\mathbf{A}^T \mathbf{A} = \mathbf{U} \mathbf{\Sigma} \mathbf{V}^T \mathbf{\Sigma} \mathbf{U}^T = \mathbf{U} \mathbf{\Sigma}^2 \mathbf{U}^T$ において、$\mathbf{A}$ の左特異ベクトルは主成分ベクトルに対応し、特異値は分散の大きさを示します。

---

