# QTA 招新笔试

## 题目概述

CIFAR-10 数据集由 10 个类的 60000 个 32x32 彩色图像组成，每个类有 6000 个图像。有 50000 个训练图像和 10000 个测试图像。数据集分为 5 个训练批次和 1 个测试批次，每个批次有 10000 个图像。

与 MNIST 数据集中目比， CIFAR-10 有以下特点：

1. CIFAR-10 是 3 通道的彩色 RGB 图像，而 MNIST 是1通道的灰度图像。
2. CIFAR-10 的图片尺寸为 32 × 32 ，而 MNIST 的图片尺寸为 28 × 28 ，比 MNIST 稍大。
3. 相比于手写字符， CIFAR-10 是现实世界中真实的物体，不仅噪声很大，而且物体的比例、特征都不尽相同。

## 题目要求

使用常见的深度学习框架（Tensorflow/PyTorch）搭建一个基于 CIFAR-10 的分类模型，要求对模型进行训练并记录下训练集与测试集上的 loss 和 acc 结果。

注：所构建模型在数据自带的测试集上的分类准确率至少达到 80%。

## 数据链接

[CIFAR-10](https://pytorch.org/docs/0.3.0/torchvision/datasets.html#cifar)

## 编程作答

### 数据集获取

In [None]:
import torch
from torch.utils.data import DataLoader
from torchvision import transforms
from torchvision.datasets import CIFAR10

# Normalization transform
__transformer = transforms.Compose(
    [
        transforms.ToTensor(),
        transforms.Normalize(
            mean=[0.485, 0.456, 0.406],
            std=[0.229, 0.224, 0.225]
        )
    ]
)

# Get CIFAR-10 dataset
train_data = CIFAR10(root='./data', train=True, download=True, transform=__transformer)
train_loader = DataLoader(train_data, batch_size=128, shuffle=True, num_workers=4)

test_data = CIFAR10(root='./data', train=False, download=True, transform=__transformer)
test_loader = DataLoader(test_data, batch_size=128, shuffle=False, num_workers=4)

classes = ('plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

### 获取加速设备

In [None]:
device = torch.device("cpu")

if torch.cuda.is_available():
    device = torch.device("cuda:0")
elif torch.backends.mps.is_available():
    device = torch.device("mps")

print("Device:", device)

### 模型构建

In [None]:
from model import DenseNet121
from torch.optim.lr_scheduler import MultiStepLR

model = DenseNet121().to(device)
optimizer = torch.optim.SGD(model.parameters(), lr=0.1)
scheduler = MultiStepLR(optimizer, milestones=[50,75], gamma=0.1)
loss_func = torch.nn.CrossEntropyLoss()

### 模型训练

In [None]:
from trainer import Trainer

trainer = Trainer(model, optimizer, loss_func, device, train_loader, test_loader, scheduler, epochs=100)
train_acc_list, test_acc_list = trainer.train()

### 指标可视化

In [None]:
import numpy as np
import matplotlib.pyplot as plt

plt.plot(np.arange(len(train_acc_list)), train_acc_list, label="train acc")
plt.plot(np.arange(len(test_acc_list)), test_acc_list, label="test acc")

plt.legend() #显示图例
plt.xlabel('epoches')
plt.title('Model(DenseNet121) accuracy')

plt.show()