train_and_validation/train_with_dp.py

import torch
from torch.utils.data import TensorDataset
import numpy as np
import torch.nn.functional as F


#这里实际上做的也是小批量梯度下降，在裁剪上是逐样本，为了更好的控制DPSGD，这边的train_loader我们希望只有一个batch就好，多个也可以
def train_dynamic_add_noise(model, train_loader, optimizer):
    model.train()
    train_loss = 0.0
    aa=0
    train_acc=0.
    i=0
    for id,(data, target) in enumerate(train_loader):
        optimizer.zero_accum_grad()  # 梯度清空
        for iid,(X_microbatch, y_microbatch) in enumerate(TensorDataset(data, target)):  #这里相当于逐样本
            optimizer.zero_microbatch_grad()
            output = model(torch.unsqueeze(X_microbatch.to(torch.float32), 0))    #这要是这里要做升维

            loss = F.cross_entropy(output, torch.unsqueeze(y_microbatch.to(torch.long), 0))

            loss.backward()         #梯度求导，这边求出梯度
            optimizer.microbatch_step()  # 这个step做的是每个样本的梯度裁剪和梯度累加的操作
        optimizer.step_dp()  # 这个做的是梯度加噪和梯度平均更新下降的操作

    return train_loss, train_acc  # 返回平均损失和平均准确率

def train_dynamic_add_noise_split_vector(model, train_loader, optimizer):
    model.train()
    train_loss = 0.0
    aa=0
    train_acc=0.
    i=0
    for id,(data, target) in enumerate(train_loader):
        optimizer.zero_accum_grad()  # 梯度清空
        for iid,(X_microbatch, y_microbatch) in enumerate(TensorDataset(data, target)):  #这里相当于逐样本
            optimizer.zero_microbatch_grad()
            output = model(torch.unsqueeze(X_microbatch.to(torch.float32), 0))    #这要是这里要做升维

            loss = F.cross_entropy(output, torch.unsqueeze(y_microbatch.to(torch.long), 0))

            loss.backward()         #梯度求导，这边求出梯度
            optimizer.microbatch_step()  # 这个step做的是每个样本的梯度裁剪和梯度累加的操作
        optimizer.step_dp_split_vector()  # 这个做的是梯度加噪和梯度平均更新下降的操作


    return train_loss, train_acc  # 返回平均损失和平均准确率