In [1]:
import torch
import numpy as np
import torch.nn as nn
import torch.nn.functional as F
from PIL import Image
from torchvision import transforms
from torchvision import models,datasets
torch.__version__

'1.1.0'

# 4.2.2 使用Tensorboard在 PyTorch 中进行可视化 

##  Tensorboard 简介
Tensorboard是tensorflow内置的一个可视化工具，它通过将tensorflow程序输出的日志文件的信息可视化使得tensorflow程序的理解、调试和优化更加简单高效。
Tensorboard的可视化依赖于tensorflow程序运行输出的日志文件，因而tensorboard和tensorflow程序在不同的进程中运行。
TensorBoard给我们提供了极其方便而强大的可视化环境。它可以帮助我们理解整个神经网络的学习过程、数据的分布、性能瓶颈等等。

tensorboard虽然是tensorflow内置的可视化工具，但是他们跑在不同的进程中，所以Github上已经有大神将tensorboard应用到Pytorch中 [链接在这里]( https://github.com/lanpa/tensorboardX)

##  Tensorboard 安装
首先需要安装tensorboard

`pip install tensorboard`

然后再安装tensorboardx

`pip install tensorboardx`

安装完成后与 visdom一样执行独立的命令
`tensorboard --logdir logs` 即可启动，默认的端口是 6006,在浏览器中打开 `http://localhost:6006/` 即可看到web页面。

这里要说明的是 微软的Edge浏览器css会无法加载，使用chrome正常显示

##  页面
与visdom不同，tensorboard针对不同的类型人为的区分多个标签，每一个标签页面代表不同的类型。
下面我们根据不同的页面功能做个简单的介绍，更多详细内容请参考官网
### SCALAR
对标量数据进行汇总和记录，通常用来可视化训练过程中随着迭代次数准确率(val acc)、损失值(train/test loss)、学习率(learning rate)、每一层的权重和偏置的统计量(mean、std、max/min)等的变化曲线
### IMAGES
可视化当前轮训练使用的训练/测试图片或者 feature maps
### GRAPHS
可视化计算图的结构及计算图上的信息，通常用来展示网络的结构
### HISTOGRAMS
可视化张量的取值分布，记录变量的直方图(统计张量随着迭代轮数的变化情况）
###  PROJECTOR
全称Embedding Projector 高维向量进行可视化

##  使用
在使用前请先去确认执行`tensorboard --logdir logs` 并保证 `http://localhost:6006/` 页面能够正常打开

### 图像展示
首先介绍比较简单的功能，查看我们训练集和数据集中的图像，这里我们使用现成的图像作为展示。这里使用wikipedia上的一张猫的图片[这里](https://en.wikipedia.org/wiki/Cat#/media/File:Felis_silvestris_catus_lying_on_rice_straw.jpg)

引入 tensorboardX 包

In [3]:
# from tensorboardX import SummaryWriter


from torch.utils.tensorboard import SummaryWriter

# Writer will output to ./runs/ directory by default
# writer = SummaryWriter()

# transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
# trainset = datasets.MNIST('mnist_train', train=True, download=True, transform=transform)
# trainloader = torch.utils.data.DataLoader(trainset, batch_size=64, shuffle=True)
# model = torchvision.models.resnet50(False)
# # Have ResNet model take in grayscale rather than RGB
# model.conv1 = torch.nn.Conv2d(1, 64, kernel_size=7, stride=2, padding=3, bias=False)
# images, labels = next(iter(trainloader))

# grid = torchvision.utils.make_grid(images)
# writer.add_image('images', grid, 0)
# writer.add_graph(model, images)
# writer.close()

In [5]:
cat_img = Image.open('./1280px-Felis_silvestris_catus_lying_on_rice_straw.jpg')
cat_img.size

(1280, 853)

这是一张1280x853的图，我们先把她变成224x224的图片，因为后面要使用的是vgg16

In [6]:
transform_224 = transforms.Compose([
        transforms.Resize(224), # 这里要说明下 Scale 已经过期了，使用Resize
        transforms.CenterCrop(224),
        transforms.ToTensor(),
    ])
cat_img_224=transform_224(cat_img)

将图片展示在tebsorboard中：

In [10]:
writer = SummaryWriter(log_dir='./logs', comment='cat image') # 这里的logs要与--logdir的参数一样
writer.add_image("cat",cat_img_224)
writer.close()# 执行close立即刷新，否则将每120秒自动刷新

浏览器访问 `http://localhost:6006/#images` 即可看到猫的图片 
### 更新损失函数
更新损失函数和训练批次我们与visdom一样使用模拟展示，这里用到的是tensorboard的SCALAR页面

In [11]:
x = torch.FloatTensor([100])
y = torch.FloatTensor([500])

for epoch in range(100):
    x /= 1.5
    y /= 1.5
    loss = y - x
    with SummaryWriter(log_dir='./logs', comment='train') as writer: #可以直接使用python的with语法，自动调用close方法
        writer.add_histogram('his/x', x, epoch)
        writer.add_histogram('his/y', y, epoch)
        writer.add_scalar('data/x', x, epoch)
        writer.add_scalar('data/y', y, epoch)
        writer.add_scalar('data/loss', loss, epoch)
        writer.add_scalars('data/data_group', {'x': x,
                                                 'y': y,
                                                 'loss': loss}, epoch)

        

浏览器访问 `http://localhost:6006/#scalars` 即可看到图形
### 使用PROJECTOR对高维向量可视化
PROJECTOR的的原理是通过PCA，T-SNE等方法将高维向量投影到三维坐标系（降维度）。Embedding Projector从模型运行过程中保存的checkpoint文件中读取数据，默认使用主成分分析法（PCA）将高维数据投影到3D空间中，也可以通过设置设置选择T-SNE投影方法，这里做一个简单的展示。

我们还是用第三章的mnist代码

In [12]:
BATCH_SIZE=512 
EPOCHS=20 
train_loader = torch.utils.data.DataLoader(
        datasets.MNIST('data', train=True, download=True, 
                       transform=transforms.Compose([
                           transforms.ToTensor(),
                           transforms.Normalize((0.1307,), (0.3081,))
                       ])),
        batch_size=BATCH_SIZE, shuffle=True)

Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to data\MNIST\raw\train-images-idx3-ubyte.gz


100%|██████████████████████████████████████████████████████████████████████████████████▉| 9912320/9912422 [05:17<00:00, 31346.17it/s]

Extracting data\MNIST\raw\train-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz to data\MNIST\raw\train-labels-idx1-ubyte.gz



0it [00:00, ?it/s]
  0%|                                                                                                      | 0/28881 [00:00<?, ?it/s]
 57%|█████████████████████████████████████████████████▎                                     | 16384/28881 [00:00<00:00, 64413.80it/s]
32768it [00:02, 25795.64it/s]                                                                                                        

Extracting data\MNIST\raw\train-labels-idx1-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz to data\MNIST\raw\t10k-images-idx3-ubyte.gz




0it [00:00, ?it/s]

  0%|                                                                                                    | 0/1648877 [00:00<?, ?it/s]

  1%|▊                                                                                    | 16384/1648877 [00:00<00:24, 67883.16it/s]

  1%|█▎                                                                                   | 24576/1648877 [00:00<00:30, 52616.20it/s]

  3%|██▌                                                                                  | 49152/1648877 [00:01<00:25, 61676.24it/s]

  4%|███▍                                                                                 | 65536/1648877 [00:01<00:31, 50570.89it/s]

  5%|████▋                                                                                | 90112/1648877 [00:01<00:25, 60038.01it/s]

  6%|█████                                                                                | 98304/1648877 [00:02<00:43, 35501.76it/s]

  7%|██████▎                     

 94%|█████████████████████████████████████████████████████████████████████████████▉     | 1548288/1648877 [00:34<00:02, 33589.28it/s]

 94%|██████████████████████████████████████████████████████████████████████████████▎    | 1556480/1648877 [00:34<00:02, 34078.65it/s]

 95%|██████████████████████████████████████████████████████████████████████████████▊    | 1564672/1648877 [00:35<00:02, 34965.77it/s]

 95%|███████████████████████████████████████████████████████████████████████████████▏   | 1572864/1648877 [00:35<00:02, 35124.28it/s]

 96%|███████████████████████████████████████████████████████████████████████████████▉   | 1589248/1648877 [00:35<00:01, 30791.64it/s]

 97%|████████████████████████████████████████████████████████████████████████████████▊  | 1605632/1648877 [00:36<00:01, 35191.20it/s]

 98%|█████████████████████████████████████████████████████████████████████████████████▏ | 1613824/1648877 [00:36<00:00, 35311.11it/s]

 98%|██████████████████████████████████████████████████

Extracting data\MNIST\raw\t10k-images-idx3-ubyte.gz
Downloading http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz to data\MNIST\raw\t10k-labels-idx1-ubyte.gz





0it [00:00, ?it/s]


  0%|                                                                                                       | 0/4542 [00:00<?, ?it/s]


8192it [00:00, 15404.10it/s]                                                                                                         

Extracting data\MNIST\raw\t10k-labels-idx1-ubyte.gz
Processing...
Done!


In [13]:
class ConvNet(nn.Module):
    def __init__(self):
        super().__init__()
        # 1,28x28
        self.conv1=nn.Conv2d(1,10,5) # 10, 24x24
        self.conv2=nn.Conv2d(10,20,3) # 128, 10x10
        self.fc1 = nn.Linear(20*10*10,500)
        self.fc2 = nn.Linear(500,10)
    def forward(self,x):
        in_size = x.size(0)
        out = self.conv1(x) #24
        out = F.relu(out)
        out = F.max_pool2d(out, 2, 2)  #12
        out = self.conv2(out) #10
        out = F.relu(out)
        out = out.view(in_size,-1)
        out = self.fc1(out)
        out = F.relu(out)
        out = self.fc2(out)
        out = F.log_softmax(out,dim=1)
        return out
model = ConvNet()
optimizer = torch.optim.Adam(model.parameters())

In [14]:
def train(model, train_loader, optimizer, epoch):
    n_iter=0
    model.train()
    for batch_idx, (data, target) in enumerate(train_loader):
        optimizer.zero_grad()
        output = model(data)
        loss = F.nll_loss(output, target)
        loss.backward()
        optimizer.step()
        if(batch_idx+1)%30 == 0: 
            n_iter=n_iter+1
            print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
                epoch, batch_idx * len(data), len(train_loader.dataset),
                100. * batch_idx / len(train_loader), loss.item()))
            #主要增加了一下内容
            out = torch.cat((output.data, torch.ones(len(output), 1)), 1) # 因为是投影到3D的空间，所以我们只需要3个维度
            with SummaryWriter(log_dir='./logs', comment='mnist') as writer: 
                #使用add_embedding方法进行可视化展示
                writer.add_embedding(
                    out,
                    metadata=target.data,
                    label_img=data.data,
                    global_step=n_iter)

这里节省时间，只训练一次

In [15]:
train(model, train_loader, optimizer, 0)



打开 `http://localhost:6006/#projector` 即可看到效果。

### 绘制网络结构
在pytorch中我们可以使用print直接打印出网络的结构，但是这种方法可视化效果不好，这里使用tensorboard的GRAPHS来实现网络结构的可视化。
由于pytorch使用的是动态图计算，所以我们这里要手动进行一次前向的传播.

使用Pytorch已经构建好的模型进行展示

In [16]:
vgg16 = models.vgg16(pretrained=True) # 这里下载预训练好的模型
print(vgg16) # 打印一下这个模型

Downloading: "https://download.pytorch.org/models/vgg16-397923af.pth" to C:\Users\beidongjiedeguang/.cache\torch\checkpoints\vgg16-397923af.pth



  0%|                                                                                                  | 0/553433881 [00:00<?, ?it/s]


  0%|                                                                                  | 49152/553433881 [00:00<21:46, 423411.08it/s]


  0%|                                                                                 | 155648/553433881 [00:00<17:56, 514096.45it/s]


  0%|                                                                                 | 327680/553433881 [00:00<14:15, 646661.00it/s]


  0%|                                                                                 | 704512/553433881 [00:00<10:43, 858924.87it/s]


  0%|▏                                                                              | 1179648/553433881 [00:00<08:06, 1135471.92it/s]


  0%|▏                               

 13%|██████████▏                                                                   | 72065024/553433881 [00:14<01:29, 5365957.32it/s]


 13%|██████████▏                                                                   | 72605696/553433881 [00:14<01:31, 5249504.94it/s]


 13%|██████████▎                                                                   | 73138176/553433881 [00:14<01:31, 5271638.96it/s]


 13%|██████████▍                                                                   | 73670656/553433881 [00:14<01:30, 5286714.75it/s]


 13%|██████████▍                                                                   | 74244096/553433881 [00:14<01:29, 5382529.69it/s]


 14%|██████████▌                                                                   | 74784768/553433881 [00:14<01:29, 5355649.77it/s]


 14%|██████████▌                                                                   | 75341824/553433881 [00:14<01:28, 5394773.84it/s]


 14%|██████████▋                                

 26%|███████████████████▊                                                         | 142761984/553433881 [00:28<01:17, 5282285.86it/s]


 26%|███████████████████▉                                                         | 143327232/553433881 [00:28<01:17, 5313029.39it/s]


 26%|████████████████████                                                         | 143859712/553433881 [00:28<01:17, 5270728.92it/s]


 26%|████████████████████                                                         | 144416768/553433881 [00:28<01:16, 5348938.15it/s]


 26%|████████████████████▏                                                        | 144973824/553433881 [00:28<01:16, 5316258.43it/s]


 26%|████████████████████▏                                                        | 145506304/553433881 [00:29<01:28, 4624586.42it/s]


 26%|████████████████████▎                                                        | 145989632/553433881 [00:29<01:38, 4120665.61it/s]


 26%|████████████████████▎                      

 38%|█████████████████████████████▍                                               | 211238912/553433881 [00:42<01:24, 4067681.09it/s]


 38%|█████████████████████████████▍                                               | 211730432/553433881 [00:42<01:21, 4185734.67it/s]


 38%|█████████████████████████████▌                                               | 212287488/553433881 [00:42<01:15, 4519048.90it/s]


 38%|█████████████████████████████▌                                               | 212811776/553433881 [00:42<01:13, 4650958.43it/s]


 39%|█████████████████████████████▋                                               | 213417984/553433881 [00:43<01:08, 4941533.38it/s]


 39%|█████████████████████████████▊                                               | 214040576/553433881 [00:43<01:05, 5181820.23it/s]


 39%|█████████████████████████████▊                                               | 214646784/553433881 [00:43<01:04, 5256678.52it/s]


 39%|█████████████████████████████▉             

 51%|███████████████████████████████████████▏                                     | 281460736/553433881 [00:56<00:51, 5329252.77it/s]


 51%|███████████████████████████████████████▏                                     | 282034176/553433881 [00:56<00:50, 5333123.50it/s]


 51%|███████████████████████████████████████▎                                     | 282574848/553433881 [00:56<00:51, 5305039.30it/s]


 51%|███████████████████████████████████████▍                                     | 283213824/553433881 [00:56<00:48, 5576157.41it/s]


 51%|███████████████████████████████████████▍                                     | 283779072/553433881 [00:56<00:48, 5584764.76it/s]


 51%|███████████████████████████████████████▌                                     | 284344320/553433881 [00:56<00:48, 5602752.25it/s]


 51%|███████████████████████████████████████▋                                     | 284909568/553433881 [00:56<00:48, 5511048.34it/s]


 52%|███████████████████████████████████████▋   

 64%|█████████████████████████████████████████████████                            | 352436224/553433881 [01:09<00:38, 5250750.59it/s]


 64%|█████████████████████████████████████████████████                            | 353050624/553433881 [01:09<00:36, 5449557.08it/s]


 64%|█████████████████████████████████████████████████▏                           | 353615872/553433881 [01:09<00:36, 5477559.61it/s]


 64%|█████████████████████████████████████████████████▎                           | 354205696/553433881 [01:09<00:36, 5515219.56it/s]


 64%|█████████████████████████████████████████████████▎                           | 354762752/553433881 [01:09<00:39, 5088355.98it/s]


 64%|█████████████████████████████████████████████████▍                           | 355409920/553433881 [01:10<00:36, 5436205.48it/s]


 64%|█████████████████████████████████████████████████▌                           | 355966976/553433881 [01:10<00:37, 5268733.15it/s]


 64%|███████████████████████████████████████████

 76%|██████████████████████████████████████████████████████████▋                  | 422223872/553433881 [01:24<00:40, 3277211.87it/s]


 76%|██████████████████████████████████████████████████████████▊                  | 422813696/553433881 [01:24<00:34, 3775962.63it/s]


 76%|██████████████████████████████████████████████████████████▉                  | 423313408/553433881 [01:24<00:32, 4045921.02it/s]


 77%|██████████████████████████████████████████████████████████▉                  | 423862272/553433881 [01:24<00:29, 4386435.11it/s]


 77%|███████████████████████████████████████████████████████████                  | 424443904/553433881 [01:24<00:27, 4697744.50it/s]


 77%|███████████████████████████████████████████████████████████▏                 | 424976384/553433881 [01:24<00:31, 4110191.93it/s]


 77%|███████████████████████████████████████████████████████████▏                 | 425541632/553433881 [01:24<00:28, 4435655.76it/s]


 77%|███████████████████████████████████████████

 89%|████████████████████████████████████████████████████████████████████▍        | 491675648/553433881 [01:38<00:11, 5263328.93it/s]


 89%|████████████████████████████████████████████████████████████████████▍        | 492322816/553433881 [01:38<00:11, 5365171.89it/s]


 89%|████████████████████████████████████████████████████████████████████▌        | 492871680/553433881 [01:38<00:11, 5151050.86it/s]


 89%|████████████████████████████████████████████████████████████████████▋        | 493395968/553433881 [01:39<00:18, 3325960.49it/s]


 89%|████████████████████████████████████████████████████████████████████▊        | 494993408/553433881 [01:39<00:13, 4317492.06it/s]


 90%|████████████████████████████████████████████████████████████████████▉        | 495714304/553433881 [01:39<00:12, 4756435.33it/s]


 90%|█████████████████████████████████████████████████████████████████████        | 496410624/553433881 [01:39<00:12, 4733727.35it/s]


 90%|███████████████████████████████████████████

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (17): Conv2d

在前向传播前，先要把图片做一些调整

In [17]:
transform_2 = transforms.Compose([
    transforms.Resize(224), 
    transforms.CenterCrop((224,224)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406],
                                std=[0.229, 0.224, 0.225])
])

使用上一张猫的图片进行前向传播

In [18]:
vgg16_input=transform_2(cat_img)[np.newaxis]# 因为pytorch的是分批次进行的，所以我们这里建立一个批次为1的数据集
vgg16_input.shape

torch.Size([1, 3, 224, 224])

开始前向传播，打印输出值

In [19]:
out = vgg16(vgg16_input)
_, preds = torch.max(out.data, 1)
label=preds.numpy()[0]
label

282

将结构图在tensorboard进行展示

In [23]:
with SummaryWriter(log_dir='./logs', comment='vgg16') as writer:
    writer.add_graph(vgg16, vgg16_input)

打开tensorboard找到graphs就可以看到vgg模型具体的架构了