In [None]:
'''
基于经典网络架构训练图像分类模型

1。数据预处理部分
2。网络模块设置
3。网络模型保存与测试
'''

In [1]:
import os
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
import torch
import torch.optim as optim
import torchvision
from torchvision import transforms, models, datasets
import imageio
import time
import warnings
warnings.filterwarnings("ignore")
import random
import sys
import copy
import json
from PIL import Image

data_dir = './flower_data/'
train_dir = data_dir +'/train'
valid_dir = data_dir + '/vaid'



In [2]:
'''
1.1制作好数据源
 - data_transforms中指定了所有图像预处理操作
 - ImageFolder假设所有文件都按文件夹保存好，每个文件夹下面存储同一类别的图片，文件夹的名字就是分类的名字
'''
data_transforms = {
    'train': #训练集 - 数据增强
        transforms.Compose([
            transforms.Resize([96,96]), #将data中的图片数据大小统一:正方形
            transforms.RandomRotation(45), #数据增强data augmentation：增加模型数据和多样性，随机旋转，-45到45度之间随机选,将同一张图片旋转，可以得到不同角度的图片，从而使数据量增加
            transforms.CenterCrop(64), #数据增强data augmentation：增加模型数据和多样性，从中心开始裁剪 -> 64 * 64是实际数据进行训练的输入大小
            transforms.RandomHorizontalFlip(p=0.5), #随机水平翻转， 选择一个概率
            transforms.RandomVerticalFlip(p=0.5), #
            transforms.ColorJitter(brightness=0.2, contrast=0.1, saturation=0.1, hue=0.1),
            transforms.RandomGrayscale(p=0.025),
            transforms.ToTensor(),
            transforms.Normalize([0.485, 0.456, 0.406],[0.229, 0.224,0.225]), #标准化操作：通过 x-μ/σ，对RGB3个通道的值进行标准化 - μ[0.485(R), 0.456(G), 0.406(B)]，σ[0.229(R), 0.224(G),0.225](B)
        ]),
    'valid':#验证集：不需要做数据增强
        transforms.Compose([
            transforms.Resize([64,64]), ##验证数据的大小要跟训练数据一致，
            transforms.ToTensor(),
            transforms.Normalize([0.485, 0.456, 0.406],[0.229, 0.224,0.225]),
        ])
}

In [5]:
batch_size = 128
image_datasets = {x: datasets.ImageFolder(os.path.join(data_dir, x), data_transforms[x]) for x in ['train', 'valid']}
dataloaders = {x: torch.utils.data.DataLoader(image_datasets[x], batch_size=batch_size, shuffle=True) for x in ['train','valid']}
dataset_sizes = {x: len(image_datasets[x]) for x in ['train','valid']}
class_names = image_datasets['train'].classes #分类的名字，目录【1 - 101】

In [6]:
with open('category_number_to_name.json','r') as f:
    category_number_to_name = json.load(f)

In [7]:
category_number_to_name

{'21': 'fire lily',
 '3': 'canterbury bells',
 '45': 'bolero deep blue',
 '1': 'pink primrose',
 '34': 'mexican aster',
 '27': 'prince of wales feathers',
 '7': 'moon orchid',
 '16': 'globe-flower',
 '25': 'grape hyacinth',
 '26': 'corn poppy',
 '79': 'toad lily',
 '39': 'siam tulip',
 '24': 'red ginger',
 '67': 'spring crocus',
 '35': 'alpine sea holly',
 '32': 'garden phlox',
 '10': 'globe thistle',
 '6': 'tiger lily',
 '93': 'ball moss',
 '33': 'love in the mist',
 '9': 'monkshood',
 '102': 'blackberry lily',
 '14': 'spear thistle',
 '19': 'balloon flower',
 '100': 'blanket flower',
 '13': 'king protea',
 '49': 'oxeye daisy',
 '15': 'yellow iris',
 '61': 'cautleya spicata',
 '31': 'carnation',
 '64': 'silverbush',
 '68': 'bearded iris',
 '63': 'black-eyed susan',
 '69': 'windflower',
 '62': 'japanese anemone',
 '20': 'giant white arum lily',
 '38': 'great masterwort',
 '4': 'sweet pea',
 '86': 'tree mallow',
 '101': 'trumpet creeper',
 '42': 'daffodil',
 '22': 'pincushion flower',
 

In [8]:
'''
加载和下载models中提供的模型，并且直接用训练的好权重当做初始化参数
 - 第一次执行需要下载，可能会比较慢，也可以下载下来直接导入
 - 现经典模型，好处1： 不用自己定义每一层的网络
              好处2： 不用验证自己定义每层网络的好坏
              好处3：经典模型的每层网络都是设计好，并且验证过的。

迁移学习（Transfer Learning)是一种机器学习方法，其核心思想是将一个领域（源域）学到的知识应用到另一个领域（目标任务域）的学习中去，
即使这两个领域的数据特征空间或分布存在

'''
model_name = 'resnet'  #特征提取器模型 - 要选择：['resnet','alexnet','vgg','squeezenet','densenet','inception']
feature_extract = True

train_on_gpu = torch.cuda.is_available()
if not train_on_gpu:
    print('CUDA is not available')
else:
    print('CUDA is available!')

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

CUDA is not available


In [9]:
model_ft = models.resnet18()
model_ft #看看现成模型的网络结构 

ResNet(
  (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
  (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (relu): ReLU(inplace=True)
  (maxpool): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
  (layer1): Sequential(
    (0): BasicBlock(
      (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
    )
    (1): BasicBlock(
      (conv1): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
  

In [None]:
'''
对于现成模型的参数要不要更新 param.requires_grad = True/False;
 - 更不更新自己定
'''
def set_parameter_requires_grad(model, feature_extracting):
    if feature_extracting:
        for param in model.parameters():
            param.requires_grad = False;