### 1. 介绍

- **LLE基本描述**：LLE（局部线性嵌入）假设数据$i$是可以用其$K$个近邻的样本点线性表示的，即存在系数$W_{ij}$使得$y_i = \sum_{j=1}^{N}W_{ij}y_j$。LLE的目标是找到一个低维表示$Y$，使得在低维空间中的重构误差最小，是非线性降维。
  
- **LLE的优化目标**：设$W_{i,j}$是由高维数据点$x_i$的$K$个近邻点$x_j$用权重约束和最小二乘法得到的权重，而目标函数则是令低维空间中的重构误差最小，即：
    $$ \min_{Y} \sum_{i=1}^{N} \left\| y_i - \sum_{j=1}^{N} W_{ij}y_j \right\|^2 $$

- **目标函数的几何意义**：对于每个数据点$y_i$，找到其$K$个近邻点$y_j$，使得$y_i$可以由$y_j$线性表示，即$y_i$在低维空间中的重构误差最小。

- **缺点**：
  - 稀疏时效果不好
  - 参数敏感
  - 噪声敏感
  - 局部结构敏感

### 2. 算法流程

#### A. 求权重矩阵W

1. 对于每个数据点$x_i$，找到其$K$个近邻点$x_j$，设位于集合$\mathcal{N}_i$中。

2. 优化目标函数
    $$ \min_{W_i} \left\| x_i - \sum_{j=1}^{K} W_{ij}x_j \right\|^2 $$
    $$s.t. \begin{cases} \sum_{j=1}^{N}W_{ij}=1 \\\forall x_j \notin \mathcal{N}_i,\quad W_{ij}=0 \end{cases}$$
    
    可以用类似最小二乘法求解出权重$W_{ij}$，使得$x_i$可以由$x_j$线性表示

#### B. 求解目标函数

从原始目标函数推导出矩阵 $ M $ 的过程如下：
##### 1. 原始目标函数
我们从以下目标函数开始：
$$
\min_{Y} \sum_{i=1}^{N} \left\| y_i - \sum_{j=1}^{N} W_{ij}y_j \right\|^2
$$
这个目标函数的目的是在低维空间中保持每个数据点 $ y_i $ 与其邻居点的线性关系 $ W_{ij} $。
##### 2. 展开目标函数
首先，我们将目标函数展开：
$$
\sum_{i=1}^{N} \left\| y_i - \sum_{j=1}^{N} W_{ij}y_j \right\|^2
= \sum_{i=1}^{N} \left( y_i - \sum_{j=1}^{N} W_{ij}y_j \right)^T \left( y_i - \sum_{j=1}^{N} W_{ij}y_j \right)
$$
##### 3. 矩阵形式
将上述表达式转换成矩阵形式。<mark>令 Y 为一个含零向量的扩展定义的n×n矩阵</mark>，其中第 $ i $ 行表示数据点 $ y_i $：
$$
\sum_{i=1}^{N} \left( y_i - \sum_{j=1}^{N} W_{ij}y_j \right)^T \left( y_i - \sum_{j=1}^{N} W_{ij}y_j \right)
= \text{Tr} \left[ \left( Y - WY \right)^T \left( Y - WY \right) \right]
$$
其中，$\text{Tr}(\cdot)$ 表示矩阵的迹（trace）。
##### 4. 化简目标函数
我们进一步化简上述表达式：
$$
\text{Tr} \left[ \left( Y - WY \right)^T \left( Y - WY \right) \right]
= \text{Tr} \left[ Y^T (I - W)^T (I - W) Y \right]
$$
##### 5. 定义矩阵 $ M $
将上式中的矩阵部分定义为矩阵 $ M $：
$$
M = (I - W)^T (I - W)
$$
因此目标函数可以简化为：
$$
\min_{Y} \text{Tr} \left( Y^T M Y \right)
$$
##### 6. 总结
通过以上步骤，从原始目标函数
$$
\min_{Y} \sum_{i=1}^{N} \left\| y_i - \sum_{j=1}^{N} W_{ij}y_j \right\|^2
$$
我们推导出了矩阵 $ M $：
$$
M = (I - W)^T (I - W)
$$
特征值分解求$Y$,即求解以下式子即可：
$$
M Y = \Lambda Y
$$