从本次课程开始，我们进入分类任务的实战课程，这次项目中以基于图片的性别分类为例来进行分析。主要工作包括以下几个部分：数据处理和加载，模型定义，模型训练及测试，结果可视化等部分。其中数据的加载和处理以及模型的定义都已经完成，这里我们直接调用相应的接口实现。课程主要分析网络模型训练测试及可视化等工作。

1、数据处理和加载<br>
&emsp;&ensp;我们数据集一共包含4000张图片，其中3600张作为训练集，400张作为测试集,图片大小为178×218。下面让我们来看一下照片的效果
![male.371.jpg](attachment:male.371.jpg)![female.6.jpg](attachment:female.6.jpg)

&emsp;&ensp;图片处理工作主要包括：我们选取上面图片中心的110×110部分，然后缩放到256×256大小，最后再转化成我们之前熟悉的Tensor形式。我们将图片处理过程打包成一个类，之后我们就可以直接调用。下面让我们来测试一下图片处理功能是否正常。

2、模型的定义<br>
&ensp;&emsp;我们已经实现了经典的ResNet34和自己设计的神经网络模型。主要包括卷积层，池化层，激活函数层，全连接层以及损失函数层，其中损失函数采用了交叉熵损失函数。我们也提供了接口，在使用时直接调用接口即可。下面为我们设计的神经网络模型。![Network.png](attachment:Network.png)

3、模型训练及测试<br>
&emsp;&ensp;在完成数据的处理及加载和模型的定义后，我们就可以用训练集数据对网络模型进行训练和测试了，本部分主要完成这些工作。<br>
&emsp;3.1 神经网络参数配置<br>
&emsp;&ensp;在上次课的学习中我们知道，神经网络可以优化学习率、迭代次数等参数。但是每次手动修改比较麻烦，这里我们将配置文件打包成一个类，来简化参数配置过程。

In [7]:
#本模块实现参数配置
class DefaultConfig(object):
    # 配置python环境
    env = 'default'  
    # 使用的模型，这里采用ResNet34网络结构
    model = 'ResNet34' 
    # 制定训练集，测试集和可视化集图片路经
    train_data_root = './data/train/'  
    test_data_root = './data/test1' 
    visualize_data_root = './data/visualize'
    # 加载预训练的模型的路径，为None代表不加载
    load_model_path = None  
    # 设定训练中批处理大小，GPU模式，打印日志信息频率
    batch_size = 16  # batch size
    use_gpu = True  # user GPU or not
    num_workers = 4  # how many workers for loading data
    print_freq = 20  # print info every N batch
    # 设定日志文件路经和结果文件路经
    debug_file = '/tmp/debug'  # if os.path.exists(debug_file): enter ipdb
    result_file = 'result.csv'
    # 设定最大迭代次数，学习率大小，学习率衰减系数
    max_epoch = 5
    lr = 0.001  
    lr_decay = 0.5  
    weight_decay = 0e-5  # 损失函数
# 如果手动输入了上述参数，那么会调用下面函数修改对应的参数值
def parse(self, kwargs):
    # 采用遍历的方式对字典kwargs更新 config参数
    for k, v in kwargs.items():
        # 如果输入属性不匹配，放弃修改
        if not hasattr(self, k):
            warnings.warn("Warning: opt has not attribut %s" % k)
        setattr(self, k, v)
    # 如果找到对应的属性参数，修改对应参数值
    print('user config:')
    for k, v in self.__class__.__dict__.items():
        if not k.startswith('__'):
            print(k, getattr(self, k))
# 测试我们的配置函数是否正常
DefaultConfig.parse = parse
opt = DefaultConfig()

&emsp;&ensp;经过上述配置以后，我们就可以通过调用上面的接口来直接利用上面的参数配置网络模型。

&emsp;3.2、网络模型训练<br>
&emsp;&ensp;本部分主要实现模型训练过程，包括数据集加载，网络模型定义，网络模型配置，模型训练和模型性能测试等部分

&emsp;&ensp;（1）导入对应上面提到的配置文件类、数据集处理类和相关torch库

In [13]:
# 导入上面定义好的配置文件，命名为opt
from config import opt
# 导入定义好的网路模型
import models
# 导入数据集处理模块DogCat
from data.dataset import DogCat
# 下面导入深度学习用到的库
import torch as t
import torchvision
from torch.utils.data import DataLoader
from torch.autograd import Variable
# 下面导入性能测试及可视化相关库
from torchnet import meter
from tqdm import tqdm
import matplotlib.pyplot as plt

&emsp;&ensp;（2）配置网络模型，这里主要是加载我们搭建好的网络模型，需要传入网络模型路经

In [14]:
model = getattr(models, opt.model)()
if opt.load_model_path:
    model.load(opt.load_model_path)

&emsp;&ensp;（3）配置GPU模式。如果我们有GPU就可以采用GPU模式训练模型。

In [15]:
if opt.use_gpu: model.cuda()

&emsp;&ensp;（4）数据集加载，这里需要指定我们训练集和验证的路径，在制定之后对数据集图片进行处理，之后打包送到网络中。

In [16]:
train_data = DogCat(opt.train_data_root,train=True)
val_data = DogCat(opt.train_data_root,train=False)
# 对数据集图片打包处理，送到网络中进行训练
train_dataloader = DataLoader(train_data,opt.batch_size,
                        shuffle=False,num_workers=opt.num_workers)
val_dataloader = DataLoader(val_data,opt.batch_size,
                        shuffle=False,num_workers=opt.num_workers)



&emsp;&ensp;（4）设定损失函数和优化器，因为是回归问题我们采用交叉熵损失，优化器指定为Adam方法。

In [18]:
criterion = t.nn.CrossEntropyLoss()
lr = opt.lr
optimizer = t.optim.Adam(model.parameters(),lr = lr,weight_decay = opt.weight_decay)

&emsp;&ensp;（5）设定性能指标参数，这里采用了meter库，主要用到了loss和混淆矩阵。

In [19]:
# 设定了平均误差参数
loss_meter = meter.AverageValueMeter()
# 设定了混淆矩阵，作为计算二分类准确率依据
confusion_matrix = meter.ConfusionMeter(2)
previous_loss = 1e100

&emsp;&ensp;（5）迭代训练过程，在每次训练过程中计算预测值、损失大小、采用Adam方法更新参数。

In [22]:
for epoch in range(500):
    print("start training")
    # 初始化性能指标参数
    loss_meter.reset()
    confusion_matrix.reset()
    # 开始迭代训练过程，每个epoch中要对整个训练集数据遍历训练一次
    for ii,(data,label) in tqdm(enumerate(train_dataloader)):
        print("label is {}".format(label))
        # train model 
        # 将输入和输出均转换为Variable,可以自动求导
        input = Variable(data)
        target = Variable(label)
        # 根据是否采用GPU模式进行不同的训练
        if opt.use_gpu:
            input = input.cuda()
            target = target.cuda()
        # 优化器置0
        optimizer.zero_grad()
        # 将输入数据送到网络中，计算输出
        score = model(input)
        # 根据预测输出和label计算损失
        loss = criterion(score,target)
        # 反向传播
        loss.backward()
        # 优化器更新参数
        optimizer.step()
        # 更新统计信息
        loss_meter.add(loss.data[0])
        confusion_matrix.add(score.data, target.data)
        # 输出每个Epoch中的Loss信息
    print("Epoch is :{},Loss is {}".format(epoch,loss))
    # 输出但前的learning rate.
    print("Now learning rate is {}".format(lr))

&emsp;&ensp;（6）模型保存。经过大量训练以后，我们得到了最佳的模型，我们需要将这个模型保存下来，方便以后直接调用模型进行预测。

In [None]:
model.save()

&emsp;&emsp;为了方便以后的调用，这里我们封装为一个整体函数命名为train（）如下：

In [None]:
def train(**kwargs):
    # 导入相关库
    from config import opt
    import models
    from data.dataset import DogCat
    import torch as t
    import torchvision
    from torch.utils.data import DataLoader
    from torch.autograd import Variable
    from torchnet import meter
    from tqdm import tqdm
    import matplotlib.pyplot as plt
    model = getattr(models, opt.model)()
    if opt.load_model_path:
        model.load(opt.load_model_path)
    if opt.use_gpu: model.cuda()
    train_data = DogCat(opt.train_data_root,train=True)
    val_data = DogCat(opt.train_data_root,train=False)
    # 对数据集图片打包处理，送到网络中进行训练
    train_dataloader = DataLoader(train_data,opt.batch_size,
                        shuffle=False,num_workers=opt.num_workers)
    val_dataloader = DataLoader(val_data,opt.batch_size,
                        shuffle=False,num_workers=opt.num_workers)
    criterion = t.nn.CrossEntropyLoss()
    lr = opt.lr
    optimizer = t.optim.Adam(model.parameters(),lr = lr,weight_decay = opt.weight_decay)
    loss_meter = meter.AverageValueMeter()
    confusion_matrix = meter.ConfusionMeter(2)
    previous_loss = 1e100
    for epoch in range(500):
    print("start training")
    # 初始化性能指标参数
    loss_meter.reset()
    confusion_matrix.reset()
    # 开始迭代训练过程，每个epoch中要对整个训练集数据遍历训练一次
    for ii,(data,label) in tqdm(enumerate(train_dataloader)):
        print("label is {}".format(label))
        # train model 
        # 将输入和输出均转换为Variable,可以自动求导
        input = Variable(data)
        target = Variable(label)
        # 根据是否采用GPU模式进行不同的训练
        if opt.use_gpu:
            input = input.cuda()
            target = target.cuda()
        # 优化器置0
        optimizer.zero_grad()
        # 将输入数据送到网络中，计算输出
        score = model(input)
        # 根据预测输出和label计算损失
        loss = criterion(score,target)
        # 反向传播
        loss.backward()
        # 优化器更新参数
        optimizer.step()
    
        # 更新统计信息
        loss_meter.add(loss.data[0])
        confusion_matrix.add(score.data, target.data)
        # 输出每个Epoch中的Loss信息
    print("Epoch is :{},Loss is {}".format(epoch,loss))
    # 输出但前的learning rate.
    print("Now learning rate is {}".format(lr))

&emsp;&ensp;现在让我们测试一下训练过程是否正常。

In [None]:
train()

&emsp;3.2、模型测试<br>
&emsp;&ensp;经过上述模型训练以后，我们可以得到一个训练好的模型，默认会保存在当前目录的checkpoints下。我们需要验证经过训练的模型是否达到我们性能要求，需要进行模型测试，通过加载模型，对测试集图片进行预测，然后将预测结果和图片的真实label进行比对，最终可以得到该模型下的预测准确率，可以作为评价指标。由于这里代码和上面的代码有一定相似性，这里我们就不在单独测试每行的功能，我们这次直接将测试功能封装成一个函数。

In [7]:
def test():
    # 导入上面定义好的配置文件，命名为opt
    from config import opt
    # 导入定义好的网路模型
    import models
    # 导入数据集处理模块DogCat
    from data.dataset import DogCat
    # 下面导入深度学习用到的库
    import torch as t
    import torchvision
    from torch.utils.data import DataLoader
    from torch.autograd import Variable
    from torchnet import meter
    from tqdm import tqdm
    import matplotlib.pyplot as plt
    # 选择网络模型
    model = getattr(models, opt.model)().eval()
    # 加载网络模型参数
    if opt.load_model_path:
        opt.load_model_path = 'checkpoints/resnet34_0822_06:38:22.pth'
        model.load(opt.load_model_path)
    # 设定GPU模式
    if opt.use_gpu: model.cuda()

    # 加载测试集数据
    train_data = DogCat(opt.test_data_root,test=True)
    # 打包测试集数据送到网络中进行训练
    test_dataloader = DataLoader(train_data,batch_size=opt.batch_size,shuffle=True,num_workers=opt.num_workers)
    # 计算测试正确的图片数
    results = []
    # 对测试集中的图片进行预测
    for ii,(data,path) in tqdm(enumerate(test_dataloader)):
        # 将输入数据转换为Tensor形式
        input = t.autograd.Variable(data,volatile = True)
        # 转换GPU模式
        if opt.use_gpu: input = input.cuda()
        # 输入网络得到预测结果
        score = model(input)
        # 输出网络计算结果
        print("score is :{}".format(score))
        probability = t.nn.functional.softmax(score)[:,0].data.tolist()
        # 预测的标签
        label = score.max(dim = 1)[1].data.tolist()
        batch_results = [(path_,probability_) for path_,probability_ in zip(path,probability) ]
        # 统计结果
        results += batch_results
    # 将预测结果写道文件中，主要调用write_csv文件
    write_csv(results,opt.result_file)
    return results

&emsp;&ensp;在上述函数中，我们用到了write_csv（）函数，主要是将预测结果写道csv文件中。该函数实现如下：

In [8]:
def write_csv(results,file_name):
    # 导入csv库函数
    import csv
    # 打开文件开始读写，主要写入id和label数据。
    with open(file_name,'w') as f:
        writer = csv.writer(f)
        writer.writerow(['id','label'])
        writer.writerows(results)
    

&emsp;&ensp;测试一下函数功能是否正常。

In [10]:
test()

&emsp;3.3、模型可视化<br>
&emsp;&ensp;上面的测试是针对于整个测试集的图片，通过对比预测结果和真实label计算准确率，作为模型评估好坏。这里我们再研究一下，如果将我们的预测结果可视化。通过将图片输入到神经网络中，直接在图片上展示预测结果。

In [11]:
#coding:utf8
from config import opt
import os
import torch as t
import models
from data.dataset import DogCat
from torch.utils.data import DataLoader
from torch.autograd import Variable
from torchnet import meter
from utils.visualize import Visualizer as vis
from tqdm import tqdm
import torchvision
import matplotlib.pyplot as plt

def Visualize(**kwargs):
    # 选择网络模型
    model = getattr(models, opt.model)().eval()
    # 加载网络模型参数
    if opt.load_model_path:
        opt.load_model_path = 'checkpoints/resnet34_0822_06:38:22.pth'
        model.load(opt.load_model_path)
    # 设定GPU模式
    if opt.use_gpu: model.cuda()
    # 加载可视化数据集数据
    test_data = DogCat(opt.visualize_data_root, test=True)
    # 打包测试集数据送到网络中进行训练
    test_dataloader = DataLoader(test_data, batch_size=opt.batch_size, shuffle=True, num_workers=opt.num_workers)
    results = []zzzzzzzz
    for ii, (data, path) in tqdm(enumerate(test_dataloader)):
        # 将输入数据转换为Tensor形式
        input = t.autograd.Variable(data, volatile=True)
        # 将输入图片进行显示
        imgs = input
        if opt.use_gpu: input = input.cuda()  
        score = model(input)
        label = score.max(dim=1)[1].data.tolist()
        # 输出预测结果
        print("Label is {}".format(label))
        # 批量装载数据
        img = torchvision.utils.make_grid(imgs)
        # Tensor转化为图片数据并显示
        # 以下代码实现转换通道、均值和方差
        img = img.numpy().transpose(1, 2, 0)
        std = [0.5, 0.5, 0.5]
        mean = [0.5, 0.5, 0.5]
        img = img * std + mean
        plt.imshow(img)
        plt.show()

In [13]:
Visualize()