In [2]:
import  torch
import  torch.nn as  nn
import  torch.nn.functional  as  F
import  torch.optim  as  optim
import  numpy  as  np
import  matplotlib.pyplot  as  plt
import  torchvision
from  torchvision  import  transforms
from torchvision.transforms import ToTensor

In [3]:
torch.__version__

'2.0.0+cu117'

# 数据准备

In [4]:
#对数据归一化  (-1,1)
transform=transforms.Compose([
    transforms.ToTensor(),  
    transforms.Normalize(0.5,0.5)
])

In [5]:
#加载内置数据集
train_ds=torchvision.datasets.MNIST('data',
                                      train=True,
                                      transform=transform,
                                      download=True                                   
                                     )


In [6]:
dataloader=torch.utils.data.DataLoader(train_ds,batch_size=64,shuffle=True)

In [7]:
imgs,_=next(iter(dataloader))

In [8]:
imgs.shape

torch.Size([64, 1, 28, 28])

# 定义生成器

In [None]:
#输入是长度为100的噪声（正态分布随机数）
#输出长度为（1，28，28）的图片
#注：在生成对抗网络（GAN）中，噪声是一个随机向量或随机数据，通常被称为潜在空间向量（latent space vector）或噪声向量（noise vector）。

In [9]:
class  Generator(nn.Module):
    def  __init__(self):
        super(Generator,self).__init__()
        self.main=nn.Sequential(
                                nn.Linear(100,256),
                                nn.ReLU(),
                                nn.Linear(256,512),
                                nn.ReLU(),
                                nn.Linear(512,28*28),
                                nn.Tanh()
        )
    def  forward(self,x):    #表示长度为100的noise输入
        img=self.main(x)
        img=img.view(-1,28,28)
        return  x

# 定义判别器

In [None]:
#输入为(1,28,28)的图片  输出为二分类的概率值，输出使用sigmoid激活0-1
#BCEloss计算交叉熵损失

# nn.LeakyReLU  f(x): x>0输出 0，如果x<0,输出 a*x a表示一个很小的斜率，比如0.1
#判别器中一般推荐使用

In [10]:
class  Discriminator(nn.Module):
    def  __init__(self):
        super(Discriminator,self).__init__()
        self.main=nn.Sequential(
                                nn.Linear(28*28,512),
                                nn.LeakyReLU(),
                                nn.Linear(512,256),
                                nn.ReLU(),
                                nn.Linear(256,1),
                                nn.Sigmoid()
        )
    def  forward(self,x):
        x=x.view(-1,28*28)
        x=self.main(x)
        return  x 
        

# 初始化模型、优化器及损失计算函数

In [11]:
device='cuda' if torch.cuda.is_available() else  'cpu'

In [12]:
gen = Generator().to(device)
dis=Discriminator().to(device)

In [13]:
d_optim=torch.optim.Adam(dis.parameters(),lr=0.0001)
g_optim=torch.optim.Adam(gen.parameters(),lr=0.0001)

In [14]:
loss_fn=torch.nn.BCELoss()

#  绘图函数

In [15]:
def  gen_img_plot(model,epoch,test_input):
    prediction = np.squeeze(model(test_input).detach().cpu().numpy())
    fig=plt.figure(figsize=(4,4))
    for  i  in  range(16):
        plt.subplot(4,4,i+1)
        plt.imshow((prediction[i]+1)/2)#生成器原有范围是[-1,1],现在要将其放到[0,1]
        plt.axis('off')
    plt.show()        
        

In [16]:
test_input=torch.randn(16,100,device=device)#注：device不可省

# GAN的训练

In [17]:
D_loss=[]
G_loss=[]

In [None]:
#训练循环
for  epoch  in  range(20):
    d_epoch_loss=0
    g_epoch_loss=0
    count = len(dataloader)
    for  step,(img,_)  in  enumerate(dataloader):
        img=img.to(device)
        size=img.size(0)
        random_noise=torch.randn(size,100,device)
        #判别器损失的构建和优化
        d_optim.zero_grad()
        real_output=dis(img) #对判别器输入真实图片,real_output对真实图片的预测结果
        d_real_loss=loss_fn(real_output,
                            torch.ones_like(real_output),
                            device=device)   #判别器在真实图像上的损失(d_real_loss)
        d_real_loss.backward()

        gen_img=gen(random_noise)
        #注（重要）：此时是优化判别器，无需优化生成器，所以此处需要detach()来截断梯度
        fake_output=dis(gen_img.detach())     #判别器输入生成的图片，fake_output对生成图片的预测
        d_fake_loss=loss_fn(fake_output,
                           torch.zeros_like(fake_output),
                           device=device)   #判别器在生成图像上的损失(d_fake_loss)
        d_fake_loss.backward()
        
        d_loss=d_real_loss+d_fake_loss#总的判别器损失为真实图像上的损失加生成图像上的损失
        
        d_optim.step()
        
        #生成器损失的构建和优化
        
        g_optim.zero_grad()#将生成器所有的梯度归0
        
        fake_output=dis(gen_img)
        g_loss=loss_fn(fake_output,
                       torch.ones_like(fake_output),
                       device=device      
                        )#作为生成器，我们希望fake_output被判定为1
        g_loss.backward()
        g_optim.step()
        
        #对每个epoch的loss进行累加
        with  torch.no_grad():
            d_epoch_loss+=d_loss
            g_epoch_loss+=g_loss
            