# 丢弃法（Dropout）--- 使用Gluon

本章介绍如何使用``Gluon``在训练和测试深度学习模型中使用丢弃法 (Dropout)。


## 定义模型并添加丢弃层

有了`Gluon`，我们模型的定义工作变得简单了许多。我们只需要在全连接层后添加`gluon.nn.Dropout`层并指定元素丢弃概率。一般情况下，我们推荐把
更靠近输入层的元素丢弃概率设的更小一点。这个试验中，我们把第一层全连接后的元素丢弃概率设为 $0.2$，把第二层全连接后的元素丢弃概率设为$0.5$。

In [1]:
from mxnet.gluon import nn

net = nn.Sequential()
drop_prob1 = 0.2
drop_prob2 = 0.5

with net.name_scope():
    net.add(nn.Flatten())
    # 第一层全连接。
    net.add(nn.Dense(256, activation="relu"))
    # 在第一层全连接后添加丢弃层。
    net.add(nn.Dropout(drop_prob1))
    # 第二层全连接。
    net.add(nn.Dense(256, activation="relu"))
    # 在第二层全连接后添加丢弃层。
    net.add(nn.Dropout(drop_prob2))
    net.add(nn.Dense(10))
net.initialize()

  from ._conv import register_converters as _register_converters
  import OpenSSL.SSL


## 读取数据并训练

这跟之前没什么不同。

In [4]:
from mxnet import nd
from mxnet import gluon

batch_size = 256
root = 'E:/Data/MXNet/fashion_mnist'

def transform(data, label):
    return data.astype('float32')/255, label.astype('float32')
mnist_train = gluon.data.vision.FashionMNIST(train=True, transform=transform, root= root)
mnist_test = gluon.data.vision.FashionMNIST(train=False, transform=transform, root= root)

train_data = gluon.data.DataLoader(mnist_train, batch_size, shuffle=True)
test_data = gluon.data.DataLoader(mnist_test, batch_size, shuffle=False)

from mxnet import autograd
def accuracy(output, label):
    return nd.mean(output.argmax(axis=1)==label).asscalar()

def evaluate_accuracy(data_iterator, net):
    acc = 0.
    for data, label in data_iterator:
        output = net(data)
        acc += accuracy(output, label)
    return acc / len(data_iterator)

softmax_cross_entropy = gluon.loss.SoftmaxCrossEntropyLoss()
trainer = gluon.Trainer(net.collect_params(), 
                        'sgd', {'learning_rate': 0.5})


learning_rate = .5

for epoch in range(10):
    train_loss = 0.
    train_acc = 0.
    for data, label in train_data:
        with autograd.record():
            output = net(data)
            loss = softmax_cross_entropy(output, label)
        loss.backward()
        trainer.step(batch_size)

        train_loss += nd.mean(loss).asscalar()
        train_acc += accuracy(output, label)

    test_acc = evaluate_accuracy(test_data, net)
    print("Epoch %d. Loss: %f, Train acc %f, Test acc %f" % (
        epoch, train_loss/len(train_data),
        train_acc/len(train_data), test_acc))

  label = np.fromstring(fin.read(), dtype=np.uint8).astype(np.int32)
  data = np.fromstring(fin.read(), dtype=np.uint8)


Epoch 0. Loss: 0.809707, Train acc 0.700416, Test acc 0.822168
Epoch 1. Loss: 0.509004, Train acc 0.812988, Test acc 0.814160
Epoch 2. Loss: 0.448460, Train acc 0.836237, Test acc 0.861621
Epoch 3. Loss: 0.416817, Train acc 0.846177, Test acc 0.865625
Epoch 4. Loss: 0.391886, Train acc 0.854566, Test acc 0.867480
Epoch 5. Loss: 0.376736, Train acc 0.861098, Test acc 0.874512
Epoch 6. Loss: 0.359503, Train acc 0.868312, Test acc 0.873926
Epoch 7. Loss: 0.348973, Train acc 0.872069, Test acc 0.877637
Epoch 8. Loss: 0.340112, Train acc 0.874845, Test acc 0.879590
Epoch 9. Loss: 0.331384, Train acc 0.877000, Test acc 0.875195


## 结论

通过`Gluon`我们可以更方便地构造多层神经网络并使用丢弃法。

## 练习

- 尝试不同元素丢弃概率参数组合，看看结果有什么不同。

**吐槽和讨论欢迎点**[这里](https://discuss.gluon.ai/t/topic/1279)