# TensorFlow Dropout

<img src="../../../sources/img/NeuralNetworkIntro/tensorflow/dropout-node.jpeg" />

<center> 图 1：来自论文 "Dropout: A Simple Way to Prevent Neural Networks from Overfitting" </center>
<center> (https://www.cs.toronto.edu/~hinton/absps/JMLRdropout.pdf) </center>

`Dropout` 是一个`降低过拟合`的`正则化技术`。它在网络中暂时的丢弃一些单元（[神经元](https://en.wikipedia.org/wiki/Artificial_neuron)），以及与它们的前后相连的所有节点。图 1 是 `dropout` 的工作示意图。

`TensorFlow` 提供了一个 `tf.nn.dropout()` 函数，你可以用来实现 `dropout`。

让我们来看一个 `tf.nn.dropout()` 的使用例子。


```
keep_prob = tf.placeholder(tf.float32) # probability to keep units

hidden_layer = tf.add(tf.matmul(features, weights[0]), biases[0])
hidden_layer = tf.nn.relu(hidden_layer)
hidden_layer = tf.nn.dropout(hidden_layer, keep_prob)

logits = tf.add(tf.matmul(hidden_layer, weights[1]), biases[1])
```

上面的代码展示了如何在神经网络中应用 `dropout`。

`tf.nn.dropout()` 函数有两个参数：

`hidden_layer`：你要应用 `dropout` 的 `tensor`
`keep_prob`：任何一个给定单元的留存率（没有被丢弃的单元）
`keep_prob` 可以让你调整丢弃单元的数量。为了补偿被丢弃的单元，`tf.nn.dropout()` 把所有保留下来的单元`（没有被丢弃的单元）* 1/keep_prob`

在训练时，一个好的 `keep_prob` 初始值是0.5。

在测试时，把 `keep_prob` 值设为 `1.0` ，这样保留所有的单元，最大化模型的能力。


## 练习1

下面的代码，哪里出问题了？

语法没问题，但是测试准确率很低。


In [None]:
...

keep_prob = tf.placeholder(tf.float32) # probability to keep units

hidden_layer = tf.add(tf.matmul(features, weights[0]), biases[0])
hidden_layer = tf.nn.relu(hidden_layer)
hidden_layer = tf.nn.dropout(hidden_layer, keep_prob)

logits = tf.add(tf.matmul(hidden_layer, weights[1]), biases[1])

...

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())

    for epoch_i in range(epochs):
        for batch_i in range(batches):
            ....

            sess.run(optimizer, feed_dict={
                features: batch_features,
                labels: batch_labels,
                keep_prob: 0.5})

    validation_accuracy = sess.run(accuracy, feed_dict={
        features: test_features,
        labels: test_labels,
        keep_prob: 0.5})

## 上面代码错在哪里？

- `Dropout` 与 `Batching` 不能同时使用
- `keep_prob` 设为 `0.5` 太低了
- 在测试准确率的时候不应该传值给 `keep_prob`
- `keep_prob` 在评估验证时应该设置为 `1.0`


## 练习 2

这个练习的代码来自 `ReLU` 的练习，应用一个 `dropout` 层。用 `ReLU` 层和 `dropout` 层构建一个模型，`keep_prob` 值设为 `0.5`。打印这个模型的 `logits`。

注意: 由于 `dropout` 会随机丢弃单元，每次运行代码输出会有所不同。


In [4]:
# Solution is available in the other "solution.py" tab
import tensorflow as tf

hidden_layer_weights = [
    [0.1, 0.2, 0.4],
    [0.4, 0.6, 0.6],
    [0.5, 0.9, 0.1],
    [0.8, 0.2, 0.8]]
out_weights = [
    [0.1, 0.6],
    [0.2, 0.1],
    [0.7, 0.9]]

# Weights and biases
weights = [
    tf.Variable(hidden_layer_weights),
    tf.Variable(out_weights)]
biases = [
    tf.Variable(tf.zeros(3)),
    tf.Variable(tf.zeros(2))]

# Input
features = tf.Variable([[0.0, 2.0, 3.0, 4.0], [0.1, 0.2, 0.3, 0.4], [11.0, 12.0, 13.0, 14.0]])

# TODO: Create Model with Dropout
keep_prob = tf.placeholder(tf.float32)

hidden_layer = tf.add(tf.matmul(features, weights[0]), biases[0])
hidden_layer = tf.nn.relu(hidden_layer)
hidden_layer = tf.nn.dropout(hidden_layer, keep_prob)

logits = tf.add(tf.matmul(hidden_layer, weights[1]), biases[1])

# TODO: Print logits from a session
with tf.Session() as session:
    session.run(tf.global_variables_initializer())
    print(session.run(logits, feed_dict={keep_prob: 0.5}))


[[  7.67999935  15.05999947]
 [  0.11200001   0.67200011]
 [ 33.74000168  43.38000107]]
