使用torchvision包，主要包含以下几个部分：  
1. torchvision.datasets：一些加载数据的函数及常用的数据集接口；
2. torchvision.models：包含常用的模型结构（含预训练模型），如AlexNet、VGG、ResNet等；
3. torchvision.transforms：常用的图片变换，例如裁剪、旋转等；
4. torchvision.utils：其他一些有用的方法。

# 3.5.1 获取数据集

In [1]:
import torch
import torchvision
import torchvision.transforms as transforms
import matplotlib.pyplot as plt
import time
import sys
from IPython import display
%matplotlib inline
# sys.path.append("..")
# import d2lzh_pytorch as d2l

使用torchvision.datasets下载这个数据集，指定参数 transform=transform.ToTensor()使所有数据转换为 Tensor，不进行转化则返回PIL图片。
transform.ToTensor()将尺寸为（HxWxC）且数据位于[0,255]的PIL图片或者数据类型为 np.uint8的NumPy数组转换为尺寸为（CxHxW）且数据类型为torch.float32且位于[0.0,1.0]的Tensor

In [2]:
mnist_train = torchvision.datasets.FashionMNIST(root='~/Datasets/FashionMNIST',train=True, download=True, transform=transforms.ToTensor())
mnist_test = torchvision.datasets.FashionMNIST(root='~/Datasets/FashionMNIST',train=False, download=True, transform=transforms.ToTensor())

  return torch.from_numpy(parsed.astype(m[2], copy=False)).view(*s)


上面的mnist_train和mnist_test都是torch.utils.data.Datasets的子类，可以用len获取该数据集的大小，可以用下标获取具体一个样本

In [3]:
print(type(mnist_train))
print(len(mnist_train), len(mnist_test))

<class 'torchvision.datasets.mnist.FashionMNIST'>
60000 10000


In [4]:
feature, label = mnist_train[0]
print(feature.shape, label) # channel x height x width

torch.Size([1, 28, 28]) 9


In [6]:
print("以下将数值标签转成相应的文本标签")

def get_fashion_mnist_labels(labels):
    text_labels = ['t-shirt', 'trouser', 'pullover', 'dress', 'coat',
                   'sandal', 'shirt', 'sneaker', 'bag', 'ankle boot']
    return [text_labels[int(i)] for i in labels]

# 定义一个可以在一行画出多张图像和对应标签的函数
def use_svg_display():
    display.set_matplotlib_formats('svg')

def show_fashion_mnist(images, labels):
    #use_svg_display()
    
    _, figs= plt.subplots(1, len(images), figsize=(12, 12))
    for f, img, lbl in zip(figs, images, labels):
        f.imshow(img.view((28,28)).numpy())
        f.set_title(lbl)
        f.axes.get_xaxis().set_visible(False)
        f.axes.get_yaxis().set_visible(False)
    plt.show()

    
X, y = [], []
for i in range(10):
    X.append(mnist_train[i][0])
    y.append(mnist_train[i][1])
#show_fashion_mnist(X, get_fashion_mnist_labels(y))
print(X[0].shape)

以下将数值标签转成相应的文本标签
torch.Size([1, 28, 28])


# 3.5.2 读取小批量
mnist_train是torch.utils.data.Dataset的子类，所以可以传入torch.utils.data.DataLoader来创建一个读取小批量数据样本的DataLoader的实例。\\
pytorch的DataLoader允许使用多进程来加速数据读取。这里通过参数num_workers来设置 4个进程读取数据

In [12]:
batch_size = 256
if sys.platform.startswith('win'):
    num_workers = 0  # 0表示不用额外的进程来加速读取数据
else:
    num_workers = 4
    
train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True, num_workers=num_workers)
train_iter = torch.utils.data.DataLoader(mnist_train, batch_size=batch_size, shuffle=True, num_workers=num_workers)

In [13]:
start = time.time()
for X, y in train_iter:
    continue
print('%.2f sec' %(time.time() - start))

6.98 sec
