# 猫狗大战

本节使用的数据集来自 Kaggle 网站上的“Dogs vs. Cats ” 竞赛项目。在这个数据集的训练数据集中一共有 25000 张猫和狗的图片，其中包含 12500 张猫的图片和 12500 张狗的图片。在测试数据集中有12500 张图片，不过其中的猫狗图片是无序混杂的，而且没有对应的标签。这些数据集将被用于对模型进行训练和对参数进行优化，以及在最后对模型的泛化能力进行验证。

在本实践中我们分别从训练数据集的猫和狗的图片中各抽出 2500 张图片组成一个具有5000 张图片的验证数据集。 我们也可以将验证数据集看作考试中的模拟训练测试，将测试数据集看作考试中的最终测试，通过两个结果看测试的整体能力，但是测试数据集最后会有绝对的主导作用。不过本节使用的测试数据集是没有标签的，而且本节旨在证明迁移学习比传统的训练高效，所以暂吋不使用在数据集中提供的测试数据集，我们进行的只是模型对验证数据集的准确性的横向比较。

新建一个名为 DogsVSCats 的文件夹，在该文什夹下面新建一个名为 train和一个名为valid 的子文件夹，在子文件夹下面再分别新建一个名为cat 的文件夹和一个名为dog 的文件夹，最后将数据集中对应部分的数据放到对应名字的文件夹中，之后就可以进行数据的载入了。

目录结构如下：
![image-2.png](attachment:image-2.png)

## 1、数据预览

In [None]:
import torch
import torchvision
from torchvision import datasets,models,transforms
import os
import matplotlib.pyplot as plt
import time
from torch.autograd import Variable

In [None]:
data_dir="DogsVSCats"
data_transform={x:transforms.Compose([transforms.Resize([64,64]),
                                     transforms.ToTensor()])
               for x in ["train","valid"]}
image_datasets={x: datasets.ImageFolder(root=os.path.join(data_dir,x),
                                       transform=data_transform[x])
               for x in ["train","valid"]}
dataloader={x:torch.utils.data.DataLoader(dataset=image_datasets[x],
                                         batch_size=16,
                                         shuffle=True)
           for x in ["train","valid"]}

 在进行数据的载入时我们使用 torch.transforms 中的 Resize类将原始图片的大小统一缩放至 64×64。在以上代码中对数据的变换和导入都使用了字典的形式，因为我们需要分别对训练数据集和验证数据集的数据载入方法进行简单定义，所以使用字典可以简化代码，也方便之后进行相应的调用和操作。 os.path.join 就是来自之前提到的 os 包的方法，它的作用是将输入参数中的两个名字拼接成一个完整的文件路径。

In [None]:
#获取一批次的数据进行预览和分析
X_example,y_example=next(iter(dataloader["train"]))
print(X_example.shape)
print(y_example)

 y_example 也是Tensor 数据类型的变量，不过其中的元素全部是0和1,这是因为在进行数据装载时己经对 dog 文件夹和 cat 文件夹下的内容进行了独热编码 （One-Hot Encoding)，所以这时的0和1不仅是每张图片的标签，还分别对应猫的图片和狗的图片。我们可以做一个简单的打印输出，来验证这个独热编码的对应关系

In [None]:
index_classes=image_datasets["train"].class_to_idx
print(index_classes)

这样就很明显了，猫的图片标签和狗的图片标签被独热编码后分别被数字化了，相较于使用文字作为图片的标签而言，使用0 和1也可以让之后的计算方便很多。不过，为了增加之后绘制的图像标签的可识别性，将原始标签的结果存储在名为example_clasces 的变量中。

In [None]:
example_classes=image_datasets["train"].classes
print(example_classes)

In [None]:
img=torchvision.utils.make_grid(X_example)  #将多张图片组合成一张图片
img=img.numpy().transpose([1,2,0])
print([example_classes[i] for i in y_example])
plt.imshow(img)
plt.show()