# 载入各种包

In [261]:
import torch  #1.5.1+cuda9.2
from torchvision import datasets,transforms  #torchvision 0.6.1 +cuda9.2
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision.utils import save_image
import os,time
device = torch.device("cuda:0"if torch.cuda.is_available() else "cpu")

# 创建generate网络（生成器）

In [262]:
class generate(nn.Module):
    def __init__(self):
        super(generate,self).__init__()
        self.fc1=nn.Linear(100,256)
        self.bn1=nn.BatchNorm1d(256)
        self.lfc1=nn.Linear(10,256)
        self.lbn1=nn.BatchNorm1d(256)
        self.fc2=nn.Linear(512,512)
        self.bn2=nn.BatchNorm1d(512)
        self.fc3=nn.Linear(512,1024)
        self.bn3=nn.BatchNorm1d(1024)
        self.fc4=nn.Linear(1024,784)
    def forward(self,input,label):
        x=F.relu(self.bn1(self.fc1(input)))    #改成leaky_relu效果更好，可以试着一下
        y=F.relu(self.lbn1(self.lfc1(label)))
        x=torch.cat([x,y],1)
        x=F.relu(self.bn2(self.fc2(x)))
        x=F.relu(self.bn3(self.fc3(x)))
        x=torch.tanh(self.fc4(x))
        return x
    #对线性层的参数进行初始化
    def weight_init(self,mean,std):
        for i in self._modules:
            if isinstance(i,nn.Linear):
                i.weight.data.normal_(mean,std)
                i.bias.data.zero_()#后面带下划线表示就在原先的i上更改
        

In [263]:
G=generate() #创建生成器

In [264]:
G.to(device)#如果有GPU，把G放到GPU上运行，没有就放到CPU上运行
G.weight_init(0,0.02)#初始化权重

# 创建discriminator网络（判别器）

In [265]:
class discriminator(nn.Module):
    def __init__(self):
        super(discriminator,self).__init__()
        self.fc1 = nn.Linear(784,1024)
        self.lfc1=nn.Linear(10,1024)
        self.fc2=nn.Linear(2048,512)
        self.bn2=nn.BatchNorm1d(512)
        self.fc3 = nn.Linear(512,256)
        self.bn3 = nn.BatchNorm1d(256)
        self.fc4=nn.Linear(512,1)
    def forward(self,input,label):
        x=F.leaky_relu(self.fc1(input),0.2)
        y=F.leaky_relu(self.lfc1(label),0.2)
        x=torch.cat([x,y],1)
        x=F.leaky_relu(self.bn2(self.fc2(x)),0.2)
        #x=F.leaky_relu(self.bn3(self.fc3(x)),0.2)
        x=torch.sigmoid(self.fc4(x))
        return x
    def weight_init(self,mean,std):
        for i in self._modules:
            if isinstance(i,nn.Linear):
                i.weight.data.normal_(mean,std)
                i.bias.data.zero_()#后面带下划线表示就在原先的i上更改

In [266]:
D=discriminator() #创建判别器
D.to(device)   #依情况放到CPU或者GPU上
D.weight_init(0,0.2) #对其参数进行初始化
batch_size=128

# 对抗训练过程准备

## 获得训练数据

In [267]:
transform = transforms.Compose([
    
    transforms.ToTensor(), #把一个PIL图像或者numpy数组转换为tensor进行下面的数据增强操作
    transforms.Normalize(mean=[0.5],std=[0.5])
])
train_loader=torch.utils.data.DataLoader(
    datasets.MNIST('data',train=True,download=True,transform=transform),batch_size=batch_size,shuffle=True
)


## 制造一些带标签的假数据，用来输入到训练好的generate中看效果

In [268]:
noise=torch.rand(100,100)
tmp_noise_label=torch.zeros(10,1)
for i in range(9):
    temp=torch.ones(10,1)+i
    tmp_noise_label=torch.cat([tmp_noise_label,temp],0)   #(100,10)
noise_label=torch.zeros(100,10)
noise_label.scatter_(1,tmp_noise_label.type(torch.LongTensor),1)
noise=noise.to(device)
noise_label=noise_label.to(device)

## 定义一个函数，用来将假数据通过generate生成的图片保存起来。

In [269]:
def save_result(path="./result.jpg"):
    G.eval()#将生成器调成eval模式
    generated=G(noise,noise_label)#将之前的假数据输入生成fake图像
    G.train()#将生成器模式复原
    a=generated.view(generated.size(0),1,28,28)
    print(a.size())
    save_image(a,path)

## 设置训练参数，给网络选择合适的优化器，选择合适的损失函数

In [270]:
batch_size=128
lr=0.0002
train_epoch=20
print(G.parameters())

<generator object Module.parameters at 0x7f0f054226d0>


In [271]:
optiG=optim.Adam(G.parameters(),lr=lr,betas=(0.5,0.999))#给G选择Adam作为优化器
optiD=optim.Adam(D.parameters(),lr=lr,betas=(0.5,0.999))#给D选择Adam作为优化器
loss=nn.BCELoss() #选择二分类交叉熵损失作为损失函数，因为最后的损失都是判别器的效果来看的。即分的准不准确


## 生成一些文件夹用来保存实验结果

In [272]:
if not os.path.isdir("result"):
    os.mkdir("result")

In [273]:
print(optiG.param_groups[0]['lr'])

0.0002


# 正式开始训练

In [276]:
print("开始训练！")
start_time=time.time()
for epoch in range(train_epoch):
    D_losses=[]
    G_losses=[]
    epoch_start_time=time.time()
    #前期让学习率大一些，训练到一定epoch，减小lr，再更加精细的训练，可以提高训练速度
    if epoch==30:
        optiG.param_groups[0]['lr']/=10
        optiD.param_groups[0]['lr']/=10
        print("将学习率降至："+str(optiG.param_groups[0]['lr']))
    for x_,y_ in train_loader:
        D.zero_grad()#将所有模型参数的梯度置为0，如果不进行会将梯度累计一起计算，等于是batch增大了，加大对GPU的负担
        minibatch=x_.size()[0]#求出每个batchsize的大小
        ##################训练判别器###############
        ##-------------------------对真实样本经过判别器之后的LOSS-----------------------########
        y_real_=torch.ones(minibatch,1)
        y_label_=torch.zeros(minibatch,10)
        y_label_.scatter_(1,y_.view(minibatch,1),1) #label的one-hot编码
        #print(y_label_)
        x_=x_.view(-1,28*28)  ##代表的是图片
        ###将上面的变量放到GPU上去
        y_real_, y_label_,x_=y_real_.to(device),y_label_.to(device),x_.to(device)
        #计算判别器对于真实样本的损失
        D_result=D(x_,y_label_)
        D_real_loss=loss(D_result,y_real_)
        #-------------------------------------------------------------------------------------
        ##-----------------------------对生成器生成的数据来求判别器的LOSS---------------###########
        y_fake_=torch.zeros(minibatch,1)  #判别器用于判断的标签
        z_=torch.rand(minibatch,100)#生成噪声
        y_=(torch.rand(minibatch,1)*10).type(torch.LongTensor)#生成0-9的整数标签留给后面的scatter_使用
        y_label_=torch.zeros(minibatch,10)
        y_label_.scatter_(1,y_.view(minibatch,1),1)
        #print(y_label_)
        ####将上面的变量放到GPU上去
        z_,y_label_,y_fake_=z_.to(device),y_label_.to(device),y_fake_.to(device)
        ##生成器生成图像
        G_result=G(z_,y_label_)
        #计算判别器对于虚假样本的损失
        D_result=D(G_result,y_label_)     
        D_fake_loss=loss(D_result,y_fake_)    #降低损失，即让判别器把虚假样本判别成虚假的    
        ##-------------------------------------------------------------------------#########
        ###一起反向传播
        D_train_loss=D_real_loss+D_fake_loss
        D_train_loss.backward()
        optiD.step()
        D_losses.append(D_train_loss.item())   #判别器的损失get
        ##########训练生成器
        
        G.zero_grad()
        y_real_=torch.ones(minibatch,1)
        z_=torch.rand(minibatch,100)#生成噪声
        y_=(torch.rand(minibatch,1)*10).type(torch.LongTensor)#生成0-9的整数标签留给后面的scatter_使用
        y_label_=torch.zeros(minibatch,10)
        y_label_.scatter_(1,y_.view(minibatch,1),1)
        #print(y_label_)
        z_,y_label_,y_real_=z_.to(device),y_label_.to(device),y_real_.to(device)
        G_result=G(z_,y_label_)
        D_result=D(G_result,y_label_)
        G_train_loss=loss(D_result,y_real_)    #降低损失，让判别器把虚假样本判成真样本
        G_train_loss.backward()
        optiG.step()
        G_losses.append(G_train_loss.item())
    #打印每一个epoch的生成器和判别器平均损失

    print("第%d个epoch： G的损失:%.2f, D的损失:%.2f" % (epoch,sum(G_losses)/len(G_losses),sum(D_losses)/len(D_losses)))
    #保存效果图
    pathName="./result/"+str(epoch)+".png"
    save_result(pathName)  
    epoch_time=time.time()-epoch_start_time
    print("此epoch耗时为：%.2f s" %(epoch_time))
end_time=time.time()
dura = end_time-start_time              
print("训练总耗时为：%.2f s" %(dura))
#保存网络模型
torch.save(G.state_dict(),"./G.pkl")
torch.save(D.state_dict(),"./D.pkl")

开始训练！
第0个epoch： G的损失:0.88, D的损失:1.22
torch.Size([100, 1, 28, 28])
此epoch耗时为：27.73 s
第1个epoch： G的损失:0.89, D的损失:1.23
torch.Size([100, 1, 28, 28])
此epoch耗时为：28.39 s
第2个epoch： G的损失:0.86, D的损失:1.22
torch.Size([100, 1, 28, 28])
此epoch耗时为：28.33 s
第3个epoch： G的损失:0.87, D的损失:1.22
torch.Size([100, 1, 28, 28])
此epoch耗时为：28.72 s
第4个epoch： G的损失:0.87, D的损失:1.24
torch.Size([100, 1, 28, 28])
此epoch耗时为：26.23 s
第5个epoch： G的损失:0.87, D的损失:1.25
torch.Size([100, 1, 28, 28])
此epoch耗时为：21.86 s
第6个epoch： G的损失:0.87, D的损失:1.24
torch.Size([100, 1, 28, 28])
此epoch耗时为：26.81 s
第7个epoch： G的损失:0.86, D的损失:1.24
torch.Size([100, 1, 28, 28])
此epoch耗时为：29.11 s
第8个epoch： G的损失:0.88, D的损失:1.24
torch.Size([100, 1, 28, 28])
此epoch耗时为：28.85 s
第9个epoch： G的损失:0.86, D的损失:1.23
torch.Size([100, 1, 28, 28])
此epoch耗时为：29.37 s
第10个epoch： G的损失:0.87, D的损失:1.25
torch.Size([100, 1, 28, 28])
此epoch耗时为：27.60 s
第11个epoch： G的损失:0.88, D的损失:1.25
torch.Size([100, 1, 28, 28])
此epoch耗时为：28.64 s
第12个epoch： G的损失:0.88, D的损失:1.24
torch.Size([100, 1, 28, 

# 把生成的图像给做成gif展示出来

In [277]:

from PIL import Image
imgs=[]
for i in range(train_epoch):
        imgpath="./result/"+str(i)+".png"
        imgs.append(Image.open(imgpath))
imgs[0].save("./result.gif",save_all=True,append_images=imgs,duration=300)
