## torch.utils.tensorboard模块

主要使用 **@O `torch.utils.tensorboard.writer`** 对象进行操作

### 🔵`SummaryWriter`

#### 🔹`SummaryWriter(log_dir = None， comment = ''， purge_step = None， max_queue = 10， flush_secs = 120， filename_suffix = '')`

- **_@param `log_dir (str)`_**<br>
保存目录的位置。默认为`runs/CURRENT_DATETIME_HOSTNAME`，每次运行后都会更改。使用分层的文件夹结构，便于轻松比较不同的运行。例如，为每一个新实验传入 ‘runs/exp1’, ‘runs/exp2’ 等，以便在它们之间进行比较

- _@param `comment (str)`_<br>
添加到默认 log_dir 的注释后缀。如果已分配 log_dir，则此参数无效

- **_@param `purge_step (int)`_**<br>
当日志在步骤T+X 崩溃并在步骤T 重启时，任何 global_step 大于或等于T 的事件都将被清除，并从 TensorBoard 中隐藏

- _@param `max_queue (int)`_<br>
在其中一个‘add’调用强制将事件和摘要刷新到磁盘之前，等待处理的事件和摘要的队列大小
    > 用于批量写入磁盘，当达到max_queue时才会写入磁盘，所以有时候不强制调用`writer.close()`就会导致数据不被写入磁盘

- _@param `flush_secs (int)`_<br>
每隔多少秒刷新等待处理的事件和摘要到磁盘。默认为每两分钟一次

- _@param `filename_suffix (str)`_<br>
添加到 log_dir 目录中所有事件文件名的后缀

使用举例：

---

In [None]:
from torch.utils.tensorboard import SummaryWriter

# create a summary writer with automatically generated folder name.
writer = SummaryWriter()
# folder location: runs/May04_22-14-54_s-MacBook-Pro.local/

# create a summary writer using the specified folder name.
writer = SummaryWriter("my_experiment")
# folder location: my_experiment

# create a summary writer with comment appended.
writer = SummaryWriter(comment="LR_0.1_BATCH_16")
# folder location: runs/May04_22-14-54_s-MacBook-Pro.localLR_0.1_BATCH_16/

##### 🔺`add_scalar(tag, scalar_value, global_step=None, walltime=None, new_style=False, double_precision=False)`

- **_@param `tag (str)`_**<br>
数据标识符(标签)

- **_@param `scalar_value`_**<br>
要保存的值

- **_@param `global_step(int)`_**<br>
要记录的全局步骤值

- **_@param `walltime(float)`_**<br>
可选的覆盖默认的 walltime（time.time()）值，即当前时间，可以手动设置时间戳，即事件发生后的经过的秒数

- **_@param `new_style (boolean)`_**<br>
是否使用新样式(默认True)

使用举例：

---

In [None]:
from torch.utils.tensorboard import SummaryWriter
writer = SummaryWriter()
x = range(100)
for i in x:
    writer.add_scalar('y=2x', i * 2, i)
writer.close()

##### 🔺`add_scalars(main_tag, tag_scalar_dict, global_step=None, walltime=None)`
用于批量添加数据
- **_@param `main_tag (str)`_**<br>
父tag名称

- **_@param `tag_scalar_dict (dict)`_**<br>
key-value键值对组成子标签

- **_@param `global_step (int)`_**<br>
- **_@param `walltime (float)`_**<br>

使用举例:

---

In [None]:
from torch.utils.tensorboard import SummaryWriter
writer = SummaryWriter()
r = 5
for i in range(100):
    writer.add_scalars('run_14h', {'xsinx':i*np.sin(i/r),
                                    'xcosx':i*np.cos(i/r),
                                    'tanx': np.tan(i/r)}, i)
writer.close()
# This call adds three values to the same scalar plot with the tag
# 'run_14h' in TensorBoard's scalar section.

##### 🔺`add_histogram(tag, values, global_step=None, bins='tensorflow', walltime=None, max_bins=None)`
向摘要中添加一个直方图
- **_@param `tag (str)`_**<br>
- **_@param `values`_**<br>
- **_@param `global_step (int)`_**<br>
- **_@param `bins (str)`_**<br>
直方图类型，通常有如下类型 {‘tensorflow’,’auto’, ‘fd’, …}。这决定了如何制作分箱子。可以在以下链接中找到其他选项[直方图类型](https://docs.scipy.org/doc/numpy/reference/generated/numpy.histogram.html)

- **_@param `walltime (float)`_**<br>
- **_@param ``_**<br>

使用举例:

---

In [None]:
from torch.utils.tensorboard import SummaryWriter
import numpy as np
writer = SummaryWriter()
for i in range(10):
    x = np.random.random(1000)
    writer.add_histogram('distribution centers', x + i, i)
writer.close()

##### 🔺`add_image(tag, img_tensor, global_step=None, walltime=None, dataformats='CHW')`
添加图片

- **_@param `tag (str)`_**<br>
- **_@param `img_tensor`_**<br>
图像张量，通常是$(3,H,W)$，其中3是RGB三个颜色，当然也接受(1,H,W)或者(H,W,3)，于是就需要指定类型`CHW,HWC,HW`
- **_@param `global_step (int)`_**<br>
- **_@param `walltime (float)`_**<br>
- **_@param `dataformats (str)`_**<br>
图像张量类型，通常是`CHW, HWC, HW, WH`

使用举例:

---

In [None]:
from torch.utils.tensorboard import SummaryWriter
import numpy as np
img = np.zeros((3, 100, 100))
img[0] = np.arange(0, 10000).reshape(100, 100) / 10000
img[1] = 1 - np.arange(0, 10000).reshape(100, 100) / 10000

img_HWC = np.zeros((100, 100, 3))
img_HWC[:, :, 0] = np.arange(0, 10000).reshape(100, 100) / 10000
img_HWC[:, :, 1] = 1 - np.arange(0, 10000).reshape(100, 100) / 10000

writer = SummaryWriter()
writer.add_image('my_image', img, 0)

# If you have non-default dimension setting, set the dataformats argument.
writer.add_image('my_image_HWC', img_HWC, 0, dataformats='HWC')
writer.close()

##### 🔺`add_images(tag, img_tensor, global_step=None, walltime=None, dataformats='NCHW')`
批量添加图像张量
- **_@param `tag (str)`_**<br>
- **_@param `img_tensor `_**<br>
这里的图像张量默认为$(N,3,H,W)$
- **_@param `global_step (int)`_**<br>
- **_@param `walltime (float)`_**<br>

使用举例:

---

In [None]:
from torch.utils.tensorboard import SummaryWriter
import numpy as np

img_batch = np.zeros((16, 3, 100, 100))
for i in range(16):
    img_batch[i, 0] = np.arange(0, 10000).reshape(100, 100) / 10000 / 16 * i
    img_batch[i, 1] = (1 - np.arange(0, 10000).reshape(100, 100) / 10000) / 16 * i

writer = SummaryWriter()
writer.add_images('my_image_batch', img_batch, 0)
writer.close()

##### 🔺`add_figure(tag, figure, global_step=None, close=True, walltime=None)`
用于添加matplotlib figure对象，要用时候再记 
[官方手册](https://pytorch.org/docs/stable/tensorboard.html#torch.utils.tensorboard.writer.SummaryWriter.add_figure)

- **_@param ``_**<br>
---

##### 🔺`add_video(tag, vid_tensor, global_step=None, fps=4, walltime=None)`
用于添加视频，要用时候再记 
[官方手册](https://pytorch.org/docs/stable/tensorboard.html#torch.utils.tensorboard.writer.SummaryWriter.add_video)

- **_@param ``_**<br>
---

##### 🔺`add_video(tag, vid_tensor, global_step=None, fps=4, walltime=None)`
用于添加音频，要用时候再记 
[官方手册](https://pytorch.org/docs/stable/tensorboard.html#torch.utils.tensorboard.writer.SummaryWriter.add_video)

- **_@param ``_**<br>
---

##### 🔺`add_text(tag, text_string, global_step=None, walltime=None)`
用于添加文本信息
- **_@param `tag (str)`_**<br>
- **_@param `text_string (str)`_**<br>
实际保存的String字符串
- **_@param `global_step (int)`_**<br>
- **_@param `walltime (float)`_**<br>

使用举例:
```python
writer.add_text('lstm', 'This is an lstm', 0)
writer.add_text('rnn', 'This is an rnn', 10)
```
---

##### 🔺`add_embedding(mat, metadata=None, label_img=None, global_step=None, tag='default', metadata_header=None)`

添加嵌入式投影仪数据，用于可视化高维数据在低维空间中的表示(将特征向量映射到三维中)
- **_@param `mat (torch.Tensor or numpy.ndarray)`_**<br>
    一个矩阵，其中每一行都是数据点的特征向量
    > mat.shape应该为$(N,D)$，其中N为个数，D为维度

- **_@param `metadata (list)`_**<br>
    一个标签列表，每个元素都会被转换为字符串

- **_@param `label_img`_**<br>
    与每个数据点对应的图像
    > label_img:$(N,C,H,W)$，注意图像是可选参数，可有可无因为这个只是对应于mat特征矩阵的"标签"

- **_@param `global_step (int)`_**<br>
    要记录的全局步骤值
- **_@param `tag (str)`_**<br>
    嵌入的名称

使用举例:
可以看到图像有十分美丽的三维结构：

---

In [None]:
import keyword
import torch
meta = []
while len(meta)<100:
    meta = meta+keyword.kwlist # get some strings
meta = meta[:100]

for i, v in enumerate(meta):
    meta[i] = v+str(i)

label_img = torch.rand(100, 3, 10, 32)
for i in range(100):
    label_img[i]*=i/100.0

writer.add_embedding(torch.randn(100, 5), metadata=meta, label_img=label_img)
writer.add_embedding(torch.randn(100, 5), label_img=label_img)
writer.add_embedding(torch.randn(100, 5), metadata=meta)

##### 🔺`add_pr_curve(tag, labels, predictions, global_step=None, num_thresholds=127, weights=None, walltime=None)`

用于添加精确率-召回率曲线的函数。这个函数允许你跟踪模型在不同置信度阈值下的精确率和召回率，从而更好地评估和调整模型:
- **_@param `tag (str)`_**<br>
- **_@param `labels (torch.Tensor, numpy.ndarray, or string/blobname) `_**<br>
真实的标签，应该是一个形状为 [batch_size] 的数组，其中包含值 0 或 1

- **_@param `predictions (torch.Tensor, numpy.ndarray, or string/blobname)`_**<br>
模型的预测置信度，应该是一个形状为 [batch_size] 的数组，其中的值在 0 和 1 之间

- **_@param `global_step (int)`_**<br>
- **_@param `num_thresholds (int)`_**<br>
 要使用的阈值数量。默认是 127
- **_@param `walltime (float)`_**<br>

使用举例:

---

附录：精确率-召回率 & 置信域
1. **精确率-召回率 (Precision-Recall)**

- **精确率 (Precision)**: 在所有被模型预测为正例的样本中，真正是正例的比例。
  $$\text{精确率} = \frac{\text{真正例 (TP)}}{\text{真正例 (TP) + 假正例 (FP)}}$$

- **召回率 (Recall)**: 在所有真正的正例样本中，被模型正确预测为正例的比例。
  $$\text{召回率} = \frac{\text{真正例 (TP)}}{\text{真正例 (TP) + 假负例 (FN)}}$$

这两个指标通常用于评估模型在正例预测上的性能，尤其是在类别不平衡的情况下

2. **当你想要对比模型在不同的置信度阈值下的性能时**
在很多机器学习模型中，特别是分类任务，模型为每个样本输出一个置信度分数，这个分数表示该样本属于某一类的概率。通常，我们会设置一个阈值（如0.5），当置信度分数高于这个阈值时，我们判断样本为正例，否则为负例。

但是，这个阈值是可以调整的。根据不同的应用场景，我们可能需要更高的精确率或召回率。例如，当我们希望尽量避免假阳性时，我们可能会提高阈值以获得更高的精确率，但这可能会牺牲召回率

通过绘制精确率-召回率曲线，我们可以很容易地看到模型在不同置信度阈值下的性能，从而帮助我们选择最佳的阈值


In [None]:
from torch.utils.tensorboard import SummaryWriter
import numpy as np
labels = np.random.randint(2, size=100)  # binary label
predictions = np.random.rand(100)
writer = SummaryWriter()
writer.add_pr_curve('pr_curve', labels, predictions, 0)
writer.close()

##### 🔺`add_custom_scalars(layout)`
创建一个特殊的图表，通过在“标量”中收集图表标签。
> 注意，每个SummaryWriter()对象只能调用此函数一次--因为它只为 tensorboard 提供元数据!!**所以该函数可以在训练循环之前或之后调用**

- **_@param `layout (dict) `_**<br>
1. {类别名称: 图表}其中图表也是一个字典:如上就有两个类别(台湾&美国)，一共三个图表(台股,道琼斯,纳斯达克)
2. {图表名称: [属性列表]}属性列表:<br>
第一个元素是图表的类型（Multiline或Margin之一）<br>
第二个元素是一个列表，其中包含你在add_scalar函数中使用的标签，这些标签将被收集到新图表中

使用举例:
> 注意add_custom_scalars是针对已有日志进行的分析，相当于就提供了一个比较的框架，仅此而已

---

In [None]:
from torch.utils.tensorboard import SummaryWriter
import numpy as np
writer = SummaryWriter()

for n_iter in range(100):
    writer.add_scalar('Loss/train', np.random.random(), n_iter)
    writer.add_scalar('Loss/test', np.random.random(), n_iter)
    writer.add_scalar('Accuracy/train', np.random.random(), n_iter)
    writer.add_scalar('Accuracy/test', np.random.random(), n_iter)

layout = {
    'Loss': {
        'Train vs. Test': ['Multiline', ['Loss/train', 'Loss/test']]
    },
    'Accuracy': {
        'Train vs. Test': ['Multiline', ['Accuracy/train', 'Accuracy/test']]
    }
}

writer.add_custom_scalars(layout)

In [4]:
from torch.utils.tensorboard import SummaryWriter
import numpy as np
writer = SummaryWriter()

layout = {'台湾':{'台股':['Multiline',['台股/0050', '台股/2330']]},
          '美国':{'道琼斯':['Margin',   ['道琼斯/aaa', '道琼斯/bbb', '道琼斯/ccc']],
                 '纳斯达克':['Margin',   ['纳斯达克/aaa', '纳斯达克/bbb', '纳斯达克/ccc']]}}

writer.add_custom_scalars(layout)

##### 🔺`add_mesh(tag, vertices, colors=None, faces=None, config_dict=None, global_step=None, walltime=None)`
(图形学/三维渲染)将网格或3D点云添加到TensorBoard。这个可视化基于Three.js，所以它允许用户与渲染的对象进行交互。除了基本的定义，如顶点、面之外，用户还可以提供相机参数、光照条件等

[详细信息](https://threejs.org/docs/index.html#manual/en/introduction/Creating-a-scene)
- **_@param `tag (str)`_**<br>
- **_@param `vertices (torch.Tensor)`_**<br>
顶点的3D坐标列表
- **_@param `colors (torch.Tensor)`_**<br>
每个顶点的颜色
- **_@param `faces (torch.Tensor) `_**<br>
每个三角形内的顶点索引(可选)
- **_@param `config_dict`_**<br>
带有ThreeJS类名和配置的字典
- **_@param `global_step (int)`_**<br>
- **_@param `walltime (float)`_**<br>

shape:
- **vertices**: $(B, N, 3)$。 $(批次大小, 顶点数量, 通道数)$
- **colors**: $(B, N, 3)$。对于 uint8 类型，值应该在 [0,255] 范围内；对于 float 类型，值应该在 [0,1] 范围内
- **faces**: $(B, N, 3)$。对于 uint8 类型，值应该在 [0, 顶点数量] 范围内

使用举例:

---

In [None]:
from torch.utils.tensorboard import SummaryWriter
vertices_tensor = torch.as_tensor([
    [1, 1, 1],
    [-1, -1, 1],
    [1, -1, -1],
    [-1, 1, -1],
], dtype=torch.float).unsqueeze(0)
colors_tensor = torch.as_tensor([
    [255, 0, 0],
    [0, 255, 0],
    [0, 0, 255],
    [255, 0, 255],
], dtype=torch.int).unsqueeze(0)
faces_tensor = torch.as_tensor([
    [0, 2, 3],
    [0, 3, 1],
    [0, 1, 2],
    [1, 3, 2],
], dtype=torch.int).unsqueeze(0)

writer = SummaryWriter()
writer.add_mesh('my_mesh', vertices=vertices_tensor, colors=colors_tensor, faces=faces_tensor)

writer.close()

##### 🔺`add_hparams(hparam_dict, metric_dict, hparam_domain_discrete=None, run_name=None)`

添加一组超参数比较

- **_@param `hparam_dict (dict)`_**<br>
字典中的每一个键值对是超参数的名称及其对应的值。该值的类型可以是bool、string、float、int或None之一

- **_@param `metric_dict (dict)`_**<br>
字典中的每一个键值对是指标的名称及其对应的值。注意，这里使用的键在tensorboard记录中应该是唯一的。否则，您通过add_scalar添加的值将会在hparam插件中显示。在大多数情况下，这是不希望的

- **_@param `hparam_domain_discrete`_**<br>
（可选[Dict[str, List[Any]]]）一个包含超参数名称和它们可以持有的所有离散值的字典

- **_@param `run_name (str)`_**<br>
运行的名称，作为日志目录的一部分包含在内。如果未指定，将使用当前的时间戳

使用举例:

---

In [5]:
from torch.utils.tensorboard import SummaryWriter
with SummaryWriter() as w:
    for i in range(5):
        w.add_hparams({'lr': 0.1*i, 'bsize': i}, #这里lr / bsize是超参数
                      {'hparam/accuracy': 10*i, 'hparam/loss': 10*i})
        