# 量子测量与动态特征选择

[4.9](./4-9.ipynb) 中用GMPS的单点纠缠熵定义特征所含的信息量大小，从而刻画其重要程度，实现特征选择。显然，该方法仅考虑了用于训练GMPS样本特征的共性。但是在很多情况下，不同的样本所对应的不同特征是有区别的。例如，当我们在黑板上写字时，重要的特征应该是所写的字本身，那么重要的特征应取决于具体的书写，GMPS的单点纠缠熵显然是不能实现这点的。

本节内容：基于“量子系统冯诺伊曼熵的取值与测量算符的选择相关”这一基本原理，通过量子特征映射定义量子测量，计算该测量导致的生成式量子态单点纠缠熵的变化量，来刻画该测量获得的关于其他特征的信息增量，从而实现一种“动态”的特征选择。

关键概念：
* 背景 (Background)
* 信息区 (Informative Area)
* 关键性少数 (Critical Minority)

> 例子：考虑在黑板上进行书写：如果要求仅在黑板的中间某个子区域进行书写，那么对于所有样本，该子区域之外的像素值不会发生变化（黑色），这个区间被称为背景。有用的信息（文字）出现在中间进行书写的子区域，我们将其称之为信息区。文字笔画对应的位置，则被称为关键性少数

## 例子：移动的黑色像素

![moving_black_box_a](./images/moving_black_box_a.png)

> 由两张图像构成的数据集，每个图像仅包含三个像素，取值分别是“白、白、黑 (0,0,1)”与“白、黑、白 (0,1,0)”

![moving_black_box_b](./images/moving_black_box_b.png)
> 由三张图像构成的数据集，每个图像仅包含三个像素，取值分别是(0,0,0,1)、(0,0,1,0)与 (0,1,0,0)

* 第 0 号位置的像素取值不变，满足“背景”的定义
* 黑色像素在后两/三个位置移动，因此这两个位置应为信息区
* 黑色像素所在的位置应为关键性少数

对于(a)，懒惰态满足：$|\psi\rangle = \frac{1}{\sqrt{2}}|0\rangle(|01\rangle + |10\rangle)$

易得，单点纠缠熵满足：$S_0 = 0$（背景），$S_1 = S_2 = \ln2$（信息区）

对比MNIST数据集的单点纠缠熵：背景处于图像边缘，靠中心的位置为信息区

### 单点纠缠熵的变化量

依据具体像素取值对懒惰态进行投影测量，并计算单点纠缠熵的变化量

考虑对第 $l'$ 个量子位进行测量，测量前后单点纠缠熵的变化总量为

$$\langle\delta S\rangle(x_{l'}) = \sum_{i=0}^{L-1}(\tilde{S}_i - S_i)$$

其中，$x_{l'}$ 为测量第 $l'$ 个量子位的坍缩结果，$\tilde{S}_i$ 为测量后第 $i$ 个量子位的单点纠缠熵，$L$ 为量子比特数。

> 在物理实验中，因为量子坍塌不一定会产生 $x_{l'}$ 态，所以我们要做后选择，也就是制备多个量子态，选出塌缩成 $x_{l'}$ 的量子态继续实验

> 注：由于是投影测量，被测量的第$l'$个量子位的单点纠缠熵必变为0。

以图片 a 为例

![moving_black_box_a](./images/moving_black_box_a.png)

考虑对**位置0**的量子位进行投影测量：测量后无论得到什么样的坍缩结果，剩余两个比特位都构成一个2比特最大纠缠态 $\frac{1}{\sqrt{2}}(|01\rangle + |10\rangle)$，测量后的单点纠缠熵仍为 $S'_0 = 0$ 与 $S'_1 = S'_2 = \ln2$，因此我们有 $\langle\delta S\rangle(x_0) = 0$。

考虑对**位置1**的量子位进行投影测量，坍缩结果为**0**(a 中第一张图)：剩余两个比特位都构成直积态 $|01\rangle$，测量后的单点纠缠熵为 $S'_0 = S'_1 = S'_2 = 0$，因此我们有 $\langle\delta S\rangle(x_0) = -2 \ln 2$。

考虑对**位置2**的量子位进行投影测量，坍缩结果为**1**(a 中第一张图)：剩余两个比特位都构成直积态 $|00\rangle$，测量后的单点纠缠熵为 $S'_0 = S'_1 = S'_2 = 0$，因此我们有 $\langle\delta S\rangle(x_0) = -2 \ln 2$。

讨论：虽然我们一开始认为黑色像素应该为关键性少数，但是对于第0号样本而言，白色像素 $x_1$ 与黑色像素 $x_2$ 得到的 $\langle\delta S\rangle(x_1)$ 相等，因此无法通过该量区分出关键性少数。这里的问题在于，在信息区内部，黑、白像素的数量相等，因此无法将黑色像素视作关键性少数。

以图片 b 为例

![moving_black_box_b](./images/moving_black_box_b.png)

懒惰态满足：$|\psi\rangle = \frac{1}{\sqrt{3}}|0\rangle(|001\rangle + |010\rangle + |100\rangle)$

单点纠缠熵：$S_0 = 0$ (背景)，$S_1 = S_2 = S_3 = \ln 3 - \frac{2}{3}\ln 2 \approx 0.6365$ (信息区)

考虑对位置0的量子位进行投影测量，坍缩结果为0：剩余三个比特位都构成直积态$\frac{1}{\sqrt{3}}(|001\rangle + |010\rangle + |100\rangle)$，测量后的单点纠缠熵显然不变，有$\langle\delta S\rangle(x_0) = 0$。

考虑对位置1或2的量子位进行投影测量，坍缩结果为0 (b 中第一张图)：其余3个量子位所处的态为$\frac{1}{\sqrt{2}}|0\rangle(|01\rangle + |10\rangle)$，单点纠缠熵分别为$S'_0 = 0$, $S'_2 = S'_3 = \ln 2$，因此有$\langle\delta S\rangle(x_1 = 0) = \langle\delta S\rangle(x_2 = 0) = 2\ln 2 - 3(\ln 3 - \frac{2}{3}\ln 2) = 4\ln 2 - 3\ln 3 \approx -0.5232$。

考虑对位置3的量子位进行投影测量，坍缩结果为1 (b 中第一张图)：其余3个量子位所处的态为$|000\rangle$，单点纠缠熵分别为$S'_0 = S'_1 = S'_2 = 0$，因此有$\langle\delta S\rangle(x_3 = 1) = 2\ln 2 - 3\ln 3 \approx -1.910$，变化量远大于位置1或2测量导致的变换量。

小结：
* 考虑后选择出第一张图的坍缩结果，有
  
  $\langle \delta S \rangle(x_0) = 0$ (背景)

  $\langle \delta S \rangle(x_1 = 0) = \langle \delta S \rangle(x_2 = 0) \approx -0.5232$ (信息区)

  $\langle \delta S \rangle(x_3 = 1) \approx -1.910$ (信息区中的关键性少数)

* 计算易得，对于该例子，在信息区中的任一位置的测量满足
  
  $\langle \delta S \rangle(x_l = 0) = 4 \ln 2 - 3 \ln 3 \approx -0.5232$

  $\langle \delta S \rangle(x_l = 1) = 2 \ln 2 - 3 \ln 3 \approx -1.910$

  黑色像素为关键性少数。
* $\langle\delta S\rangle(x_{l'})$ 在这三张图片中都能够识别出各自的背景、信息区以及关键性少数