# 多层感知机的简洁实现

下面我们使用Gluon来实现上一节中的多层感知机。首先导入所需的包或模块。

In [1]:
import d2lzh as d2l
from mxnet import gluon, init
from mxnet.gluon import loss as gloss, nn
import tensorflow as tf
tf.keras.backend.clear_session()

## 定义模型

和softmax回归唯一的不同在于，我们多加了一个全连接层作为隐藏层。它的隐藏单元个数为256，并使用ReLU函数作为激活函数。

In [None]:
net = nn.Sequential()
net.add(nn.Dense(256, activation='relu'),
        nn.Dense(10))
net.initialize(init.Normal(sigma=0.01))

model = tf.keras.Sequential()
model.add(tf.keras.layers.Flatten(input_shape=(28, 28)))
model.add(tf.keras.layers.Dense(256, activation='relu', kernel_initializer=tf.random_normal_initializer(0., 0.01)))
model.add(tf.keras.layers.Dense(10, activation='softmax', kernel_initializer=tf.random_normal_initializer(0., 0.01)))
model.summary()

## 读取数据并训练模型

我们使用与[“softmax回归的简洁实现”](softmax-regression-gluon.ipynb)一节中训练softmax回归几乎相同的步骤来读取数据并训练模型。

In [None]:
batch_size = 256
train_iter, test_iter = d2l.load_data_fashion_mnist(batch_size)

loss = gloss.SoftmaxCrossEntropyLoss()
trainer = gluon.Trainer(net.collect_params(), 'sgd', {'learning_rate': 0.5})
num_epochs = 5
d2l.train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, None,
              None, trainer)

In [None]:
train, test = tf.keras.datasets.fashion_mnist.load_data()
images, labels = train
images = images.astype('float32')
x_test, y_test = test
x_test = x_test.astype('float32')
images = images/255.0
labels = labels.astype('int32')
x_test = x_test/255.0
y_test = y_test.astype('int32')
fmnist_train_ds = tf.data.Dataset.from_tensor_slices((images, labels))
fmnist_train_ds = fmnist_train_ds.shuffle(5000).batch(batch_size)

optimizer = tf.keras.optimizers.SGD(learning_rate=0.5)
loss_fn = tf.keras.losses.SparseCategoricalCrossentropy()
model.compile(optimizer=optimizer,
              loss=loss_fn,
              metrics=['accuracy'])
tensorboard_cbk = tf.keras.callbacks.TensorBoard(log_dir='/data0/users/baopeng/tensorboard_logs')
model.fit(fmnist_train_ds, epochs=num_epochs, callbacks=[tensorboard_cbk])
model.evaluate(x_test,  y_test, verbose=2)


## 小结

* 通过Gluon可以更简洁地实现多层感知机。

## 练习

* 尝试多加入几个隐藏层，对比上一节中从零开始的实现。
* 使用其他的激活函数，看看对结果的影响。



## 扫码直达[讨论区](https://discuss.gluon.ai/t/topic/738)

![](../img/qr_mlp-gluon.svg)