## 自动编码器
> 自动编码器是可以有效学习输入数据隐藏表示特征的神经网络.我们将其特征成为_coding_._coding_通常比输入数据的维度小很多,所以可以用来对数据进行维度降维处理.
这是一种非监督的学习方式.

输入数据:可以是图片,矩阵数值数据等形式.
约束:在训练自动编码器过程中,我们可以对其_coding_进行限制,比如说,限制其维度;或者我们可以在输入数据中加入噪音,使其重构原数据.这里加噪音的作用主要使其自动编码器更具鲁棒性,更好的挖掘该数据集的隐藏表现特征_coding_

在本文中,我们将探索自动编码器的原理,可以添加何种类型的约束,如何用tensorflow实现.



## 通俗理解
自动编码器将输入数据强制转换成一个有效的隐层表示,然后输入的时候希望和输入越接近越好!
![自动编码器](../resources/images/autoencoder_1.png)

自动编码器分为两部分:
- 编码器:将输入数据转换成_coding_.
- 解码器:将_coding_转换成输出数据.

通常,编码器和解码器都可以使用多层神经网络(MLP)构成.

## 1.实现一个简单的线性自动编码器
使用线性激活函数,损失函数为Mean Squared Error(MSE).

In [1]:
import tensorflow as tf
from tensorflow.contrib.layers import fully_connected

In [2]:
n_inputs = 784 #
n_hidden = 2 # 2D inputs
n_outputs = n_inputs

learning_rate = 0.01

In [3]:
X = tf.placeholder(tf.float32,shape=[None,n_inputs])
hidden = fully_connected(X,n_hidden,activation_fn=None) #None 表示这里使用线性
outputs = fully_connected(hidden,n_outputs,activation_fn=None)

In [4]:
#重构误差--MSE
re_loss = tf.reduce_mean(tf.square(outputs-X))

In [5]:
#优化器
optimizer = tf.train.AdamOptimizer(learning_rate)
training_op = optimizer.minimize(re_loss)

In [6]:
#初始化所有变量
init = tf.global_variables_initializer()

In [None]:
# 加载数据集  这里使用minist数据集
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

Extracting MNIST_data/train-images-idx3-ubyte.gz
Extracting MNIST_data/train-labels-idx1-ubyte.gz
Extracting MNIST_data/t10k-images-idx3-ubyte.gz
Extracting MNIST_data/t10k-labels-idx1-ubyte.gz


In [None]:
n_iterations = 200
coding_dim = n_hidden
batch_size = 256
with tf.Session() as sess:
    sess.run(init)
    total_batch = int(mnist.train.num_examples/batch_size)
    for _ in range(n_iterations):
        for _ in range(total_batch):
            batch_xs, batch_ys = mnist.train.next_batch(batch_size)
            training_op.run(feed_dict={X:batch_xs})
#     coding_val = coding.eval(feed_dict:{X:mnist.test.images[:10]})
    

## 堆叠自动编码器(Stacked Autoencoder)
自动编码器可以有多个隐藏层,增加多个隐藏层可以帮助自动编码器学习更加复杂的_coding_.!
![堆叠自动编码器](../resources/images/stackedAE.png)

### Tensorflow 实现
使用一个深层的MLP进行堆叠自动编码器的实现.使用ELU的激活函数.
现在还是以MNIST为例.

In [None]:
n_inputs,n_outputs = 28*28,28*28
n_hidden_1 = 1000
n_hidden_2 = 500
n_hidden_3 = 256

learning_rate = 0.01
l2_reg = 10e-5

In [None]:
X = tf.placeholder(tf.float32,shape=(None,n_inputs))
with tf.contrib.framework.arg_scope(
        [fully_connected],
        activation_fn = tf.nn.elu,
        )