
# 线性回归简洁实现

- 生成数据集
- 读取数据集
- 初始化模型参数
- 定义模型
- 定义损失函数
- 定义优化算法
- 训练模型

In [None]:
# 导包
%matplotlib inline
import d2lzh as d2l
from mxnet.gluon import data as gdata
import sys
import time


In [None]:

# 获取数据集

## 通过Gluon的data包来下载FashionMNIST数据集
mnist_train = gdata.vision.FashionMNIST(train=True)
mnist_test = gdata.vision.FashionMNIST(train=False)

len(mnist_train),len(mnist_test)

feature,label = mnist_train[0]
feature.shape,feature.dtype

label,type(label),label.dtype

## Fashion-MNIST中⼀共包括了10个类别，分别为t-shirt（T恤）、trouser（裤⼦）、pullover（套衫）、dress（连⾐裙）、coat（外套）、sandal（凉鞋）、shirt（衬衫）、sneaker（运动鞋）、bag（包）和ankleboot（短靴）。

## 将数值标签转换成文本标签
def get_fashion_mnist_labels(labels):
    text_labels = ['t-shirt', 'trouser', 'pullover', 'dress', 'coat', 'sandal', 'shirt', 'sneaker', 'bag', 'ankle boot']
    return [text_labels[int(i)] for i in labels]

## 在一行里画出多张图像和对应标签的函数
def show_fashion_mnist(images,labels):
    d2l.use_svg_display()
    # 这里的_表示我们忽略(不使用)的变量
    _,figs = d2l.plt.subplots(1,len(images),figsize=(12,12))
    for f,img,lbl in zip(figs,images,labels):
        f.imshow(img.reshape(28,28)).asnumpy()
        f.set_title(lbl)
        f.axes.get_xaxis().set_visible(False)
        f.axes.get_yaxis().set_visible(False)
        
## 查看训练数据集中前9个样本的图像内容和文本标签
X,y = mnist_train[0:9]
show_fashion_mnist(X,get_fashion_mnist_labels(y))



In [None]:
# 读取小批量

batch_size = 256
transformer = gdata.vision.transforms.ToTensor()
if sys.platform.startswith('win'):
    num_workers = 0
else:
    num_workers = 4

train_iter = gdata.DataLoader(mnist_train.transform_first(transformer),batch_size,shuffle=True,num_workers=num_workers)

test_iter = gdata.DataLoader(mnist_test.transform_first(transformer),batch_size,shuffle=False,num_workers=num_workers)

start = time.time()
for X,y in train_iter:
    continue
'%.2f sec' % (time.time() - start)
