# 再次使用Gluon来实现一个softmax回归模型

In [1]:
# 导包

%matplotlib inline
import d2lzh as d2l
from mxnet import gluon, init
from mxnet.gluon import loss as gloss, nn
from mxnet.gluon import data as gdata
from mxnet import autograd, nd
import sys
import time

In [2]:
# 训练数据
mnist_train = gdata.vision.FashionMNIST(train=True)
# 测试数据
mnist_test = gdata.vision.FashionMNIST(train=False)

def load_data_fashion_mnist(batch_size):
    transformer = gdata.vision.transforms.ToTensor()
    if sys.platform.startswith('win'):
        num_workers = 0  # 0表示不用额外的进程来加速读取数据
    else:
        num_workers = 4

    train_iter = gdata.DataLoader(mnist_train.transform_first(transformer),
                                batch_size, shuffle=True,
                                num_workers=num_workers)
    test_iter = gdata.DataLoader(mnist_test.transform_first(transformer),
                                batch_size, shuffle=False,
                                num_workers=num_workers)
    return train_iter, test_iter

# 读取数据

batch_size = 256
train_iter, test_iter = load_data_fashion_mnist(batch_size)

In [3]:
# 定义和初始化模型
# softmax回归的输出层是一个全连接层。
# 因此，我们添加一个输出个数为10的全连接层。
# 使用均值为0、标准差为0.01的正态分布随机初始化模型的权重参数。
net = nn.Sequential()
net.add(nn.Dense(10))
net.initialize(init.Normal(sigma=0.01))

In [4]:
# softmax和交叉熵损失函数
# Gluon提供了一个包括softmax运算和交叉熵损失计算的函数。它的数值稳定性更好。
loss = gloss.SoftmaxCrossEntropyLoss()

In [5]:
# 定义优化算法
# 'sgd' 小批量随机梯度下降
trainer = gluon.Trainer(net.collect_params(), 'sgd', {'learning_rate': 0.1})

In [6]:
# 训练模型
num_epochs = 5
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, None,
              None, trainer)

epoch 1, loss 0.7897, train acc 0.746, test acc 0.806
epoch 2, loss 0.5738, train acc 0.811, test acc 0.823
epoch 3, loss 0.5296, train acc 0.824, test acc 0.826
epoch 4, loss 0.5057, train acc 0.829, test acc 0.834
epoch 5, loss 0.4898, train acc 0.835, test acc 0.837


## 总结

- Gluon提供的函数往往具有更好的数值稳定性。

- 可以使用Gluon更简洁地实现softmax回归。