In [2]:
# 导入本节所需要的模块
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import hiddenlayer as hl
from sklearn.manifold import TSNE
from sklearn.svm import SVC
from sklearn.decomposition import PCA
from sklearn.metrics import classification_report,accuracy_score
import torch
from torch import nn
import torch.nn.functional as F
import torch.utils.data as Data
import torch.optim as optim
from torchvision import transforms
from torchvision.datasets import MNIST
from torchvision.utils import make_grid


In [1]:
# 使用手写体数据，准备训练数据集
train_data=MNIST(
    root="./data/MNIST",# 数据的路径
    trian=True,# 只使用训练数据集
    transform=transforms.ToTensor(),
    download=False
)
# 将图像数据转化为向量数据
train_data_x=train_data.data.type(torch.FloatTensor)/225.0
train_data_x=train_data_x.reshape(train_data_x.shape[0],-1)
train_data_y=train_data.targets
# 定义一个数据加载器
train_loader=Data.DataLoader(
    dataset=train_data_x,# 使用的数据集
    batch_size=64,# 批处理样本大小
    shuffle=True,# 每次迭代之前打乱数据
    num_workers=2,# 使用两个进程
)
# 对测试数据集进行导入
test_data=MNIST(
    root="./data/MNIST",# 数据的路径
    train=False,# 只使用训练数据集
    transform=transforms.ToTensor(),
    download=False
)
# 为测试数据添加一个通道维度，获取测试数据的X和Y
test_data_x=test_data.data.type(torch.FloatTensor)/225.0
test_data_x=test_data_x.reshape(test_data_x.shape[0],-1)
test_data_y=test_data.targets
print("训练数据集:",train_data_x.shape)
print("测试数据集:",test_data_x.shape)

NameError: name 'MNIST' is not defined

In [None]:
# 可视化一个batch的图像内容，获得一个batch的数据
for step,b_x in enumerate(train_loader):
    if step>0:
        break
# 可视化一个batch的图像
im=make_grid(b_x.reshape((-1,1,28,28)))
im=im.data.numpy().transpose((1,2,0))
plt.figure()
plt.imshow(im)
plt.axis("off")
plt.show()


In [None]:

class EnDecoder(nn.Module):
    def __init__(self):
        super(EnDecoder,self).__init__()
        # 定义一个Encoder
        self.Encoder=nn.Sequential(
            nn.Linear(784,512),
            nn.Tanh(),
            nn.Linear(512,256),
            nn.Tanh(),
            nn.Linear(256,128),
            nn.Tanh(),
            nn.Linear(128,3),
            nn.Tanh(),
        )
        # 定义Decoder
        self.Decoder=nn.Sequential(
            nn.Linear(3,128),
            nn.Tanh(),
            nn.Linear(128,256),
            nn.Tanh(),
            nn.Linear(256,512),
            nn.Tanh(),
            nn.Linear(512,784),
            nn.Sigmoid(),
        )
    # 定义网络的前向传播途径
    def forward(self,x):
        encoder=self.Encoder(x)
        decoder=self.Decoder(encoder)
        return encoder,decoder

In [None]:
# 输出网络结构
edmodel=EnDecoder()

In [None]:
# 定义优化器
optimizer=torch.optim.Adam(edmodel.parameters(),lr=0.0003)
loss_func=nn.MSELoss()
# 记录训练过程中的指标
histroy1=hl.History()
# 使用Canvas进行可视化
canvasl=hl.Canvas()
train_num=0
val_num=0
# 对模型进行迭代训练，对所有的数据进行训练epoch轮
for epoch in range(10):
    train_loss_epoch=0
    # 对训练数据的加载器进行迭代计算
    for step,b_x in enumerate(train_loader):
        # 使用每个batch进行训练模型
        _,output=edmodel(b_x) # 在训练batch上的输出
        loss=loss_func(output,b_x) # 均方根误差
        optimizer.zero_grad() # 每个迭代步的梯度初始化为0
        loss.backward() # 损失的后向传播，计算梯度
        optimizer.step() # 使用梯度进行优化
        train_loss_epoch+=loss.item()
        train_num=train_num+b_x.size(0)
    # 计算一个epoch的损失
    train_loss=train_loss_epoch/train_num
    # 保存每个epoch上的输出loss
    histroy1.log(epoch,train_loss=train_loss)
    # 可视化网络训练过程
    with canvasl:
        canvasl.draw_plot(histroy1["train_loss"])



In [None]:
# 预测测试集钱100张图像的输出
edmodel.eval()
_,test_decoder=edmodel(test_data_x[0:100,:])
# 可视化原始的图像
plt.figure(figsize=(6,6))
for ii in range(test_decoder.shape[0]):
    plt.subplot(10,10,ii+1)
    im=test_data_x[ii,:]
    im=im.data.numpy().reshape(28,28)
    plt.imshow(im,cmap=plt.cm.gray)
    plt.axis("off")
plt.show()
# 可视化编码后的图像
plt.figure(figsize=(6,6))
for ii in range(test_decoder.shape[0]):
    plt.subplot(10,10,ii+1)
    im=test_decoder[ii,:]
    im=im.data.numpy().reshape(28,28)
    plt.imshow(im,cmap=plt.cm.gray)
    plt.axis("off")
plt.show()


In [None]:
# 获取前500个样本的自编码后的特征，并对数据进行可视化
edmodel.eval()
TEST_num=500
test_encoder,_=edmodel(test_data_x[0:TEST_num,:])
print("test_encoder.shape:",test_encoder.shape)

In [None]:
%config InlineBackend.print_figure_kwargs={'bbox_inches':None}
# 将三个维度的特征进行可视化
test_encoder_arr=test_encoder.data.numpy()
fig=plt.figure(figsize=(12,8))
ax1=Axes3D(fig)
X=test_encoder_arr[:,0]
Y=test_encoder_arr[:,1]
Z=test_encoder_arr[:,2]
ax1.set_xlim([min(X),max(X)])
ax1.set_ylim([min(Y),max(Y)])
ax1.set_zlim([min(Z),max(Z)])
for ii in range(test_encoder.shape[0]):
    text=test_data_y.data.numpy()[ii]
    ax1.text(X[ii],Y[ii,],Z[ii],str(text),fontsize=8,
    bbox=dict(boxstyle="round",facecolor=plt.cm.Setl(text),alpha=0.7))
plt.show()


In [None]:
# 自编码后的特征训练集和测试集
train_ed_x,_=edmodel(train_data_x)
train_ed_x=train_ed_x.data.numpy()
train_y=train_data_y.data.numpy()
test_ed_x,_=edmodel(test_data_x)
test_ed_x=test_ed_x.data.numpy()
test_y=test_data_y.data.numpy()


In [None]:
# PCA降维获得的训练集合测试集的前三个主成分
pcamodel=PCA(n_components=3,random_state=10)
train_pca_x=pcamodel.fit_transform(train_data_x.data.numpy())
test_pca_x=pcamodel.transform(test_data_x.data.numpy())
print(train_pca_x.shape)


In [None]:
# 使用自编码器搭建分类器，训练和预测
encodersvc=SVC(kernel="rbf",random_state=123)
encodersvc.fit(train_ed_x,train_y)
edsvc_pre=encodersvc.predict(test_ed_x)
print(classification_report(test_y,edsvc_pre))
print("模型精度",accuracy_score(test_y,edsvc_pre))


In [None]:
# 使用PCA降维数据建立分类器，训练和预测
pcasvc=SVC(kernel="rbf",random_state=123)
pcasvc.fit(train_pca_x,train_y)
pcasvc_pre=pcasvc.predict(test_pca_x)
print(classification_report(test_y,pcasvc_pre))
print("模型精度",accuracy_score(test_y,pcasvc_pre))