# 练习1：图像向量空间与“零均值图像”子空间

## 场景
把一张 $8\times 8$ 的灰度小图拉平成向量 $\mathbf{x}\in\mathbb{R}^{64}$。  
令整空间 $\mathcal{V}=\mathbb{R}^{64}$。定义集合
$$
\mathcal{U}=\{\mathbf{x}\in\mathbb{R}^{64}\mid \mathbf{1}^\top \mathbf{x}=0\},
$$

即所有 **像素和为 0（零均值）** 的图像向量。

### 任务
1. **证明**：$\mathcal{U}$ 是 $\mathcal{V}$ 的一个子空间。  
2. 用 **Python** 随机生成几张“图像”向量，数值上**验证**子空间的封闭性（加法、数乘）。  
3. 随机取三张零均值图像 $\mathbf{x}_1,\mathbf{x}_2,\mathbf{x}_3\in\mathcal{U}$，判断它们是否**线性无关**。  
4. 给定任意图像向量 $\mathbf{y}\in\mathbb{R}^{64}$，写出其在 $\mathcal{U}$ 上的**正交投影**（也就是去均值），并用代码实现。  

---



## 提示 1：证明子空间
- 子空间必须满足三个条件：  
  1. **非空**（至少包含零向量）；  
  2. **加法封闭**；  
  3. **数乘封闭**。  
- 可以直接代入 $\mathbf{1}^\top \mathbf{x}=0$ 来检验。  

---

## 提示 2：Python 验证封闭性
- 用 `numpy` 生成随机向量，再减去均值得到“零均值向量”。  
- 用 `.sum()` 检查是不是接近 0（浮点误差允许 `1e-15` 量级）。  
- 分别验证：  
  - 两个零均值向量相加，结果是否还是零均值；  
  - 一个零均值向量乘以常数，结果是否还是零均值。  

---

## 提示 3：线性无关性
- 将多个零均值向量拼成矩阵 `A = [x1, x2, x3]`。  
- 用 `np.linalg.matrix_rank(A)` 计算秩。  
- 判断标准：  
  - $\mathrm{rank}(A) = 3 \;\Rightarrow\;$ 三个向量线性无关；  
  - $\mathrm{rank}(A) < 3 \;\Rightarrow\;$ 三个向量线性相关。  

---

## 提示 4：正交投影（去均值）
- 思考：$\mathcal{U}$ 是所有“零均值向量”的集合。  
- 对任意 $\mathbf{y}$，要找它在 $\mathcal{U}$ 中的投影，就是“减去均值部分”。  
- 公式：
  $$
  \mathrm{Proj}_{\mathcal{U}}(\mathbf{y}) = \mathbf{y} - \frac{\sum_i y_i}{64}\cdot \mathbf{1}
  $$
- 编程思路：`projU_y = y - y.mean()`。  
- 应用场景：这是**去 DC 分量**，在信号处理、图像分析里很常见，比如人脸识别前的图像标准化。



---




# 练习2：多项式空间与子空间

## 场景说明
次数不超过 2 的所有实系数多项式构成向量空间：
$$
\mathcal{V}=\{\,a_0+a_1x+a_2x^2\mid a_i\in\mathbb{R}\,\}.
$$

考虑子集：
$$
\mathcal{U}=\{\,p(x)\in\mathcal{V}\mid p(1)=0\,\}.
$$

**任务：**
1) 证明 $\mathcal{V}$ 是向量空间。  
2) 证明（或证否）$\mathcal{U}$ 是 $\mathcal{V}$ 的子空间。  
3) 在 Python 中构造若干多项式，验证它们是否属于 $\mathcal{U}$（即 $p(1)=0$）。  
4) 将这些多项式写成系数向量，组成矩阵，计算秩以判断线性独立性。  

---


In [None]:
# === Python: 构造与检验 ===
import numpy as np

# 定义几个多项式（np.poly1d 的系数从高次到低次）
p1 = np.poly1d([1, -1])      # p1(x) = x - 1
p2 = np.poly1d([1, 0, -1])   # p2(x) = x^2 - 1
p3 = np.poly1d([2, -2, 0])   # p3(x) = 2x^2 - 2x

#补充代码#

# 将多项式写成“系数向量”（统一到 2 次：a2, a1, a0）
# p1 = 0*x^2 + 1*x + (-1)   -> [0, 1, -1]
# p2 = 1*x^2 + 0*x + (-1)   -> [1, 0, -1]
# p3 = 2*x^2 + (-2)*x + 0   -> [2, -2, 0]

#补充代码#

# 计算秩以判断线性独立性（行向量或列向量都可以，用 rank 不变）

#b补充代码#


# 练习3：偶函数与奇函数子空间（选做）

---

## 场景说明
在函数空间 $\mathbb{R}[x]$（所有实系数多项式的集合）中，我们定义：

- **偶函数子空间**：
  $$
  \mathcal{U}_{\text{even}} = \{ p(x) \in \mathbb{R}[x] \mid p(-x) = p(x) \}
  $$
  例如 $x^2, x^4+3, 2x^6 - 5$ 都在其中。

- **奇函数子空间**：
  $$
  \mathcal{U}_{\text{odd}} = \{ p(x) \in \mathbb{R}[x] \mid p(-x) = -p(x) \}
 $$
  例如 $x, 3x^3-2x, 5x^5$ 都在其中。

---

## 任务
1. **证明子空间**：说明 $\mathcal{U}_{\text{even}}$ 和 $\mathcal{U}_{\text{odd}}$ 都是 $\mathbb{R}[x]$ 的子空间。  
2. **验证性质**：任意多项式 $p(x)$ 可以唯一写成
   $$
   p(x) = p_{\text{even}}(x) + p_{\text{odd}}(x),
   $$
   其中 $p_{\text{even}} \in \mathcal{U}_{\text{even}}, p_{\text{odd}} \in \mathcal{U}_{\text{odd}}$。  
   👉 即函数空间 = 偶子空间 $\oplus$ 奇子空间。  
3. **Python 实践**：  
   - 定义几个多项式，用 `p(-x)` 检查它是偶函数还是奇函数；  
   - 写一个函数，把任意多项式分解为偶部分和奇部分；  
   - 验证结果。  



---

## 思考提示

---

## 任务 1：证明子空间

- 子空间必须满足三个条件：  
  1. **包含零向量**（零多项式必须在其中）；  
  2. **加法封闭**（两个函数相加仍然在其中）；  
  3. **数乘封闭**（任意数乘结果仍然在其中）。  

- 偶函数子空间：  
  - 零函数 $0(x)$ 满足 $0(-x)=0(x)$。  
  - 若 $p(-x)=p(x)$、$q(-x)=q(x)$，则  
    $$
    (p+q)(-x)=p(-x)+q(-x)=p(x)+q(x)=(p+q)(x)。
    $$
  - 若 $p(-x)=p(x)$，则  
    $$
    (\lambda p)(-x)=\lambda p(-x)=\lambda p(x)=(\lambda p)(x)。
    $$


👉 逐条验证三个条件，即可得出这两个集合都是子空间。

---

## 任务 2：分解唯一性

- 定义分解公式（为什么可以这样写？）：  
  $$
  p_{\text{even}}(x)=\frac{p(x)+p(-x)}{2},\qquad
  p_{\text{odd}}(x)=\frac{p(x)-p(-x)}{2}.
  $$

- 验证偶性：  
  $$
  p_{\text{even}}(-x)=\tfrac{p(-x)+p(x)}{2}=p_{\text{even}}(x)。
  $$

- 验证奇性：  
  $$
  p_{\text{odd}}(-x)=\tfrac{p(-x)-p(x)}{2}=-p_{\text{odd}}(x)。
  $$

- 验证还原：  
  $$
  p_{\text{even}}(x)+p_{\text{odd}}(x)=p(x)。
  $$

- 思考唯一性：  
  - 如果 $p=u_{\text{even}}+u_{\text{odd}}=v_{\text{even}}+v_{\text{odd}}$，  
    那么 $(u_{\text{even}}-v_{\text{even}})=(v_{\text{odd}}-u_{\text{odd}})$。  
  - 左边是偶函数，右边是奇函数，唯一可能是零函数。  
  - 所以分解是唯一的。  

---

## 任务3

1. **多项式表示**  
   - 使用 `numpy.poly1d` 定义多项式，例如  
     ```python
     p = np.poly1d([1, -2, 3])  # p(x) = x^2 - 2x + 3
     ```
   - 系数顺序是“最高次到常数项”。

2. **检查偶/奇性质**  
   - 取一组对称点：`x = np.linspace(-3, 3, 7)`。  
   - 检查是否为偶函数：比较 `p(-x)` 与 `p(x)`。  
   - 检查是否为奇函数：比较 `p(-x)` 与 `-p(x)`。  
   - 用 `np.allclose(a, b)` 判断两个数组是否近似相等，避免浮点误差。  
     - **解释**：`np.allclose(a, b)` 返回 `True` 表示 $a_i \approx b_i$ 对所有元素成立。  

3. **分解为偶部分和奇部分**  
   - 利用公式：  
     $$
     p_{\text{even}}(x)=\frac{p(x)+p(-x)}{2},\qquad
     p_{\text{odd}}(x)=\frac{p(x)-p(-x)}{2}.
     $$
   - 可以写一个函数，输入 `poly`，输出 `p_even` 和 `p_odd`。  
   - 方法一：用公式直接计算；  
   - 方法二：根据幂次的奇偶性拆分系数。  

4. **验证分解**  
   - 检查 $p(x)=p_{\text{even}}(x)+p_{\text{odd}}(x)$ 是否成立；  
   - 检查 $p_{\text{even}}(-x)=p_{\text{even}}(x)$ 是否成立；  
   - 检查 $p_{\text{odd}}(-x)=-p_{\text{odd}}(x)$ 是否成立。  

👉 这样可以直观验证“任意多项式 = 偶部分 + 奇部分”的结论。

  


# 练习4：文档特征向量与线性独立性

---

## 场景说明
在自然语言处理 (NLP) 中，我们常常用向量来表示文档或句子。  
假设我们用一个非常简化的方式：用 **3 维向量** 表示“某文档里出现的词频”。  

例如：  
- 维度 1：出现了多少次“篮球” 🏀  
- 维度 2：出现了多少次“蔡徐坤” 🎤  
- 维度 3：出现了多少次“音乐” 🎵  

于是，每篇文档都可以看成 $\mathbb{R}^3$ 里的一个向量。

---

## 任务
1. 随机生成 3 个文档向量（每个向量有 3 个分量）。  
2. 把这 3 个向量拼成矩阵 $A$。  
3. 使用 `numpy.linalg.matrix_rank` 判断它们是否线性独立。  
4. 如果它们线性相关，请找出一条关系式（即某个向量能由其他向量表示）。  

---

## Python 验证


In [None]:
import numpy as np

# 三个文档向量（词频统计）
doc1 = np.array([3, 5, 2])   # 篮球3, 蔡徐坤5, 音乐2
doc2 = np.array([6,10,4])    # 篮球6, 蔡徐坤10, 音乐4
doc3 = np.array([1, 0, 7])   # 篮球1, 蔡徐坤0,  音乐7

# 构造矩阵 A

#补充代码#

# 判断线性独立性

#补充代码#



---

## 思考提示
- 注意观察 `doc1` 和 `doc2`，它们是否存在关系？  
- 如果存在比例关系，那么这两个文档向量没有“新信息”，说明它们线性相关。  
- 在实际 NLP 应用里，这意味着：有些文档虽然看起来不同，但在向量表示上可能**冗余**。  

---


# 练习5：图像向量与线性独立性

---

## 场景说明
在图像处理中，每张灰度图片都可以展平成一个向量。  
假设我们有三张 $4\times 4$ 的小图片，把它们拉平成 $\mathbb{R}^{16}$ 里的向量。  

- 如果三张图片线性无关 → 它们包含不同的“信息维度”；  
- 如果三张图片线性相关 → 至少有一张可以由另外两张线性组合得到，说明信息冗余。  

---

## 任务
1. 生成三张 $4\times 4$ 的随机灰度图像（用 `numpy.random`）。  
2. 把它们 reshape 成 16 维向量，并组成矩阵 $A$。  
3. 用 `numpy.linalg.matrix_rank` 判断是否线性独立。  
4. 尝试构造一个线性相关的例子（例如把一张图设为另一张图的线性组合），再用 rank 验证。

---

## Python 验证


In [None]:
import numpy as np

rng = np.random.default_rng(42)

# 三张 4x4 图像
img1 = rng.integers(0, 256, size=(4,4))
img2 = rng.integers(0, 256, size=(4,4))
img3 = rng.integers(0, 256, size=(4,4))

# 展平成向量

#补充代码#

# 拼接成矩阵 A

#补充代码#

# 人为制造线性相关：让 img3 = 2*img1 + 3*img2

#补充代码#
