### 聚类GAN: 对抗生成网络中潜在聚类空间

### 摘要
对抗生成网络在无监督学习中已经获得了显著的成果。而聚类是无监督学习中一个重要的问题。我们可以利用GAN的潜在反向映射空间去聚类。但是我们证明了聚类结构在GAN的潜在空间不是保持不变的。 在这篇文章中提出一个新的机制clusterGAN。  
  
**通过从一个one-hot编码变量和一个连续潜在变量的混合变量中采样潜在变量。再联合训练一个逆网络（将数据投影到潜在空间），和特定的聚类损失函数，就可以再潜在空间中实现聚类了**    
  
实验结果显示，尽管鉴别器从未接触过这类向量，但GANs可以保留跨类别的潜在空间插值。   

 
### 引言
###### 1、1 动机
表示学习能够使机器学习模型破译数据中潜在的语义和找出隐藏的关键元素变量。这些强大的表示能够在不同的任务中传递知识。但是是什么因素决定了一种表示比另一种表示更好呢？  经过一些研究在不依赖于目标任务的通用优先级中，那些表现良好的表征有一些共同的特点。  
  
聚类在无监督学习中得到了广泛的研究，有各种各样的方法寻求有效的算法、特点问题的度量问题，验证问题等。  
  
尽管聚类任务的主要焦点是把原始数据进行分类。但是研究已经表明了：如果聚类是在降维的同时获得的，那么聚类的结果将会更好。而实际上真实数据也来自低维流形。  
  
**在最近一段时间，许多无监督学习任务的研究成果是由深度生成模型驱动，其中最突出的两个成果就是1、变分自编码器（VAE）。2、对抗生成网络（GAN）。
生成模型本身的流行取决于这些模型捕捉高维概率分布、缺失数据插补和处理多模态输出的能力。GAN和VAE的目标都是匹配真实数据分布，同时提供从潜在空间z到输入空间x的映射。**  
  
**GAN性质：  
GAN的潜在空间不仅提供了降维，而且产生了新颖的应用。  
潜在空间的扰动可以生成对抗性的样本，这些对抗性的样本可以用来产生健壮的分类。  
使用GAN的压缩感知依赖于找到一组潜在的向量，这组向量能够使重构误差最小。  
GAN训练最吸引人的结果之一是在潜在空间内插值。  
简单向量的算术性质表现为向量的操作会导致生成语义的变化  
GAN和传统的降维技术相比是缺乏可解释性**
  
    
<br>  

$\color{red}{ 使用GAN聚类的动机：}$  
$\color{red}{GAN提供了一种手段来理解：在潜在空间中从一种类型向另一种类型变化时，高维特征的改变。 }$   
$\color{red}{这种变化的关键因素有：聚类，可解释性，插值能力；  利用这些关键因素可以进行聚类 。  }$  
$\color{red}{这些变化的内在因素就是我们使用GAN进行聚类的重要动机。“我们能否设计一种在潜在空间进行聚类的GAN训练方法？”}$    
  
<br>  

###### 1、2  相关工作
深度网络用于降维工作是从自编码器变体开始的（如堆栈式去噪自编码器，稀疏自编码器，deep CCA）。  
  
深度无监督子空间聚类的结构：也建立在（ 编码器-解码器）框架的基础上。  
最近的一些工作已经解决了在自编码器上实现联合聚类和降维的问题。解决方法是初始化聚类中心并把它嵌入到堆栈式自编码器内。然后使用交替优化的方法提升聚类，并且在真实数据集上报告最新的结果。这种方法在聚类精度和聚类速度上都提高了不少。 **最著名的算法是DEC ， DCN**   
  
有趣的是变分自编码器并没有明确的聚类目标。但是通过改进可以达到聚类的目的。又因为GAN在生成高可信样本方面表现得自编码器好。所以我们直觉上觉得GAN强大的潜在表征空间也能提供优异的聚类性能。  
  
在文献[4]的开创性工作中，研究了GAN潜在空间中的可解释表征学习。作者训练一个GAN，在损失函数中添加一个附加项，目标是，最大化生成器的随机噪声变量子集和产生的输出之间的互信息。   
  
InfoGAN的关键目标是创建可解释的和分离的潜在变量。 虽然InfoGAN确实使用了离散的潜在变量，但它并不是专门为聚类而设计的。 在本文中，证明了他们提出的体系结构在聚类方面优于InfoGAN。  
  
**另一个重要的生成模型家族V-AE，还有额外的优势， 即推断网，编码器。这使得通过合适的算法设计能让从x到z的映射能够保持聚类结构。**  
  
不幸的是，在GANs中不存在这样的推理机制，更不用说潜在空间中存在聚类的可能性。  
  
为了弥补V-AE和GAN之间的差距，各种方法，如对抗学习推理（ALI）[8]、双向生成对抗网络（BiGAN）[7]都引入了一个推理网络，该网络被训练成匹配编码器E和解码器G网络学习的（x，z）的联合分布。  
  
  
##### 1.3 作者的主要工作  
  
  要解决的问题：GAN潜在空间聚类问题。  
    
我们发现：即使GAN的潜在变量保留了观测数据的信息。但是基于潜在分布的潜在样本被平滑的分散，导致没有观测到聚类簇。   
  
作者提出了三种算法思想：来弥补这种情况。    
  
1、利用离散潜在变量的和连续潜在变量的混合，在潜在空间中创建一个非光滑的几何。  
  
2、由于问题是非凸的，作者提出了一种新的适应离散连续混合的反向传播算法，以及一个显式的逆映射网络来获得给定数据点的潜在变量。  
  
3、作者提出，将GAN网络与有特定聚类损失函数的逆映射网络一起联合训练。 目的是让投影空间中的几何距离来反应变量的几何距离。  
    
    
我们比较了ClusterGAN和其他可能的基于GAN的聚类算法，比如InfoGAN，以及对不同数据集的多个聚类标准。这都说明ClusterGAN对于聚类任务的优越性能。  
  
我们证明ClusterGAN在不同的类（使用ong-hot潜在变量编码）之间惊人地保持了良好的插值，即使鉴别器从未接触过这样的样本。  
  
该公式具有足够的通用性，可以提供一个元框架，在GAN训练中加入聚类的附加属性。  
  
<br>  
  
### 先验的  离散-连续  潜在变量  

#### 2.1背景  
  
  
