### Training metrics

用于训练fastai模型的度量标准只是获取输入和目标张量的函数，并返回一些感兴趣的度量标准用于训练。 您可以通过定义该类型的函数并将其传递给metrics参数中的Learner来编写自己的度量标准，或者使用以下预定义函数之一。

In [2]:
from fastai.basics import *

### 预定义指标

<b>accuracy</b>

`accuracy(input:Tensor, targs:Tensor) → Rank0Tensor`

输入为`bs` * `n_classes`时，使用targs计算精度。

警告：此度量标准用于对属于单个类的对象进行分类。

In [3]:
preds = tensor([0.4, 0.6], [0.3, 0.7], [0.2, 0.8], [0.6, 0.4], [0.9, 0.1]) # bs = 5, n = 2
ys = tensor([1], [0], [1], [0], [1])
accuracy(preds, ys)

tensor(0.6000)

<b>accuracy_thresh</b>

`accuracy_thresh(y_pred:Tensor, y_true:Tensor, thresh:float=0.5, sigmoid:bool=True) → Rank0Tensor`

当y_pred和y_true的大小相同时，计算准确性。

在可能应用sigmoid之后将预测与thresh进行比较。 然后我们计算与目标匹配的数字。

`注意：此函数适用于单热编码目标（通常在多分类问题中）。`

In [4]:
preds = tensor([0.4, 0.6], [0.3, 0.7], [0.2, 0.8], [0.6, 0.4], [0.9, 0.1])
ys = tensor([0, 1], [1, 0], [0, 1], [1, 0], [0, 1]) 
accuracy_thresh(preds, ys, thresh=0.65, sigmoid=False)

tensor(0.4000)

<b>top_k_accuracy</b>

`top_k_accuracy(input:Tensor, targs:Tensor, k:int=5) → Rank0Tensor`

计算Top-k精度（目标在前k个预测中）。

<b>dice</b>

`dice(input:Tensor, targs:Tensor, iou:bool=False, eps:float=1e-08) → Rank0Tensor`

二进制目标的骰子系数度量。 如果iou = True，则返回iou metric，classic是分段问题。

$$dice = \frac{2(TP)}{2(TP) + FP + FN}$$
其中TP，FP和FN是真阳性，假阳性和假阴性的数量。

In [6]:
preds = tensor([0.4, 0.6], [0.3, 0.7], [0.2, 0.8], [0.6, 0.4], [0.9, 0.1])
ys = tensor([1], [0], [1], [0], [1])
dice(preds, ys) # TP = 2, FP = 1, FN = 1

tensor(0.6667)

<b>error_rate</b>

`error_rate(input:Tensor, targs:Tensor) → Rank0Tensor`

1 - accuracy

<b>mean_squared_error</b>

`mean_squared_error(pred:Tensor, targ:Tensor) → Rank0Tensor`

pred和targ之间的均方误差。

<b>mean_absolute_error</b>

`mean_absolute_error(pred:Tensor, targ:Tensor) → Rank0Tensor`

pred和targ之间的平均绝对误差。

<b>mean_squared_logarithmic_error</b>

`mean_squared_logarithmic_error(pred:Tensor, targ:Tensor) → Rank0Tensor`

pred和targ之间的平均对数误差。

<b>exp_rmspe</b>

`exp_rmspe(pred:Tensor, targ:Tensor) → Rank0Tensor`

Exp和pred之间的RMSE。

<b>root_mean_squared_error</b>

`root_mean_squared_error(pred:Tensor, targ:Tensor) → Rank0Tensor`

pred和targ之间的均方根误差。

<b>fbeta</b>

`fbeta(y_pred:Tensor, y_true:Tensor, thresh:float=0.2, beta:float=2, eps:float=1e-09, sigmoid:bool=True) → Rank0Tensor`

计算preds和目标之间的f_beta

beta确定应用的fbeta的值，eps用于数值稳定性。 如果sigmoid = True，则在将它们与阈值进行比较然后与目标进行比较之前，将sigmoid应用于预测。 有关fbeta分数的详细信息，请参阅F1得分维基百科页面。

$${F_\beta} = (1+\beta^2)\frac{precision \cdot recall}{(\beta^2 \cdot precision) + recall}$$

In [7]:
preds = tensor([0.6, 0.8, 0.2, 0.4, 0.9]).view(1, 5) # TP =2, FP = 1, FN = 1
ys = tensor([1, 0, 0, 1, 1]).view(1, 5)
fbeta(preds, ys, thresh=0.5, sigmoid=False)

tensor(0.6667)

`注意：此函数适用于单热编码目标（通常在多分类问题中）。`

<b>explained_variance</b>

`explained_variance(pred:Tensor, targ:Tensor) → Rank0Tensor`

解释pred和targ之间的差异。

$$ Explained \ Variance = 1 - \frac{Var( targ - pred )}{Var( targ )}$$

In [10]:
preds = tensor([0.10, .20, .30, .40, .50])
ys = tensor([0.12, .17, .25, .44, .56]) # predictions are close to the truth
explained_variance(preds, ys)

tensor(0.9374)

<b>r2_score</b>

`r2_score(pred:Tensor, targ:Tensor) → Rank0Tensor`

pred和targ之间的R2得分（确定系数）。

$$ {R^2} = 1 - \frac{\sum( targ - pred )^2}{\sum( targ - \overline{targ})^2}$$
其中 $\overline{targ}$ 是targ张量的平均值。

In [12]:
r2_score(preds, ys)

tensor(0.9351)

以下度量标准是类，在将它们传递给学习者时不要忘记实例化它们。

<b>class RMSE</b>

`RMSE() :: RegMetrics`

计算均方根误差。

<b>class ExpRMSPE</b>

`ExpRMSPE() :: RegMetrics`

计算均方根误差的指数。

<b>class Precision</b>

`Precision(average:Optional[str]='binary', pos_label:int=1, eps:float=1e-09) :: CMScores`

计算精度。

<b>class Recall</b>

`Recall(average:Optional[str]='binary', pos_label:int=1, eps:float=1e-09) :: CMScores`

计算召回。

<b>class FBeta</b>

`FBeta(average:Optional[str]='binary', pos_label:int=1, eps:float=1e-09, beta:float=2) :: CMScores`

计算Fbeta分数。

<b>class R2Score</b>

`R2Score() :: RegMetrics`

计算R2分数（确定系数）。

<b>class ExplainedVariance</b>

`ExplainedVariance() :: RegMetrics`

计算解释的方差。

<b>class MatthewsCorreff</b>

`MatthewsCorreff() :: ConfusionMatrix`

Computes the Matthews correlation coefficient.

Ref.: https://github.com/scikit-learn/scikit-learn/blob/bac89c2/sklearn/metrics/classification.py

<b>class KappaScore</b>

`KappaScore(weights:Optional[str]=None) :: ConfusionMatrix`
        
计算协议的比率（Cohens Kappa）。

Ref.: https://github.com/scikit-learn/scikit-learn/blob/bac89c2/sklearn/metrics/classification.py
        
`KappaScore`支持ConfusionMatrix中非对角线单元格的线性和二次权重，此外还有默认的未加权计算，将所有误分类视为等权重。 将KappaScore的权重属性保留为None将返回未加权的Kappa分数。 将权重更新为“线性”意味着非对角线的ConfusionMatrix元素与它们距对角线的距离成线性比例加权; “二次”表示权重与它们与对角线的距离成比例的平方。 指定线性或二次权重（如果使用），首先创建度量的实例，然后更新权重属性，类似如下：

```python
kappa = KappaScore()
kappa.weights = "quadratic"
learn = cnn_learner(data, model, metrics=[error_rate, kappa])
```

<b>class ConfusionMatrix</b>

`ConfusionMatrix() :: Callback`

计算混淆矩阵。

<b>class MultiLabelFbeta</b>

`MultiLabelFbeta(learn, beta=2, eps=1e-15, thresh=0.3, sigmoid=True, average='micro') :: LearnerCallback`

计算多标签分类的fbeta分数

MultiLabelFbeta实现了mutlilabel分类fbeta得分，类似于scikit-learn's作为LearnerCallback。 平均期权：["micro", "macro", "weighted", "none"]。 旨在与1和0的单热编码目标一起使用。

### Creating your own metric
创建新指标可以像创建新功能一样简单。如果您的度量标准是数据集中元素总数的平均值，那么只需编写将在批处理中计算它的函数（将pred和targ作为参数）。然后将自动对批次进行平均（考虑不同的尺寸）。

有时，指标不是简单的平均值。例如，如果我们以精度为例，我们必须将真阳性的数量除以我们为该类所做的预测数量。这不是我们在数据集中的元素数量的平均值，我们只考虑那些我们对特定事物做出正面预测的那些。计算每个批次的精确度，然后对它们求平均值将产生可能接近实际值的结果，但不会完全正确（并且它实际上取决于您如何处理0正面预测的特殊情况）。

这就是为什么在fastai中，每个指标都被实现为回调。如果传递常规函数，库会将其转换为名为AverageCallback的正确回调。回调指标仅在验证阶段调用，且仅适用于以下事件：
* `on_epoch_begin`（用于初始化）
* `on_batch_begin`（如果我们需要查看输入/目标并可能修改它们）
* `on_batch_end`（分析最后的结果并更新我们的计算）
* `on_epoch_end`（包含应添加到last_metrics的最终结果）

例如，以下代码是AverageMetric回调的精确实现，它将函数（如准确性）转换为度量回调。

In [15]:
class AverageMetric(Callback):
    "Wrap a `func` in a callback for metrics computation."
    def __init__(self, func):
        # If it's a partial, use func.func
        name = getattr(func,'func',func).__name__
        self.func, self.name = func, name

    def on_epoch_begin(self, **kwargs):
        "Set the inner value to 0."
        self.val, self.count = 0.,0

    def on_batch_end(self, last_output, last_target, **kwargs):
        "Update metric computation with `last_output` and `last_target`."
        if not is_listy(last_target): last_target=[last_target]
        self.count += last_target[0].size(0)
        val = self.func(last_output, *last_target)
        self.val += last_target[0].size(0) * val.detach().cpu()

    def on_epoch_end(self, last_metrics, **kwargs):
        "Set the final result in `last_metrics`."
        return add_metrics(last_metrics, self.val/self.count)

这里add_metrics是一个便利函数，它将为我们返回正确的字典：

`{'last_metrics': last_metrics + [self.val/self.count]}`

这是另一个适当计算给定类的精度的示例。

In [16]:
class Precision(Callback):
    
    def on_epoch_begin(self, **kwargs):
        self.correct, self.total = 0, 0
    
    def on_batch_end(self, last_output, last_target, **kwargs):
        preds = last_output.argmax(1)
        self.correct += ((preds==0) * (last_target==0)).float().sum()
        self.total += (preds==0).float().sum()
    
    def on_epoch_end(self, last_metrics, **kwargs):
        return add_metrics(last_metrics, self.correct/self.total)

以下自定义回调类示例测量每个时期内的峰值RAM使用情况：

In [17]:
import tracemalloc
class TraceMallocMetric(Callback):
    def __init__(self):
        super().__init__()
        self.name = "peak RAM"

    def on_epoch_begin(self, **kwargs):
        tracemalloc.start()
        
    def on_epoch_end(self, last_metrics, **kwargs):
        current, peak =  tracemalloc.get_traced_memory()
        tracemalloc.stop()
        return add_metrics(last_metrics, torch.tensor(peak))

要部署它，您需要在metrics参数中传递此自定义指标的实例：

```python
learn = cnn_learner(data, model, metrics=[accuracy, TraceMallocMetric()])
learn.fit_one_cycle(3, max_lr=1e-2)
```

然后输出变为：

```output
Total time: 00:54
epoch   train_loss  valid_loss  accuracy    peak RAM
   1    0.333352    0.084342    0.973800    2395541.000000
   2    0.096196    0.038386    0.988300    2342145.000000
   3    0.048722    0.029234    0.990200    2342680.000000
```
如前所述，将metrics参数与自定义指标类一起使用时，它可以访问的回调系统的阶段数量有限，它只能返回一个数值，因为您可以看到其输出被硬编码为具有6个精度点 在输出中，即使数字是int。

为了克服这些限制，应该使用回调类。

例如，以下类：

* 使用不适用于度量标准类的阶段
* 它报告3列，而不是只有一列
* 它的列报告是int而不是浮点数


In [18]:
import tracemalloc
class TraceMallocMultiColMetric(LearnerCallback):
    _order=-20 # Needs to run before the recorder
    def __init__(self, learn):
        super().__init__(learn)
        self.train_max = 0

    def on_train_begin(self, **kwargs):
        self.learn.recorder.add_metric_names(['used', 'max_used', 'peak'])
            
    def on_batch_end(self, train, **kwargs):
        # track max memory usage during the train phase
        if train:
            current, peak =  tracemalloc.get_traced_memory()
            self.train_max = max(self.train_max, current)
        
    def on_epoch_begin(self, **kwargs):
        tracemalloc.start()

    def on_epoch_end(self, last_metrics, **kwargs):
        current, peak =  tracemalloc.get_traced_memory()
        tracemalloc.stop()
        return add_metrics(last_metrics, [current, self.train_max, peak])

注意，它是LearnerCallback的子类，而不是Callback，因为前者提供了后者不具备的额外功能。

另外_order = -20是至关重要的 - 如果没有它，将不会添加自定义列 - 它告诉回调系统在记录器系统之前运行此回调。

要部署它，您需要在callback_fns参数中传递该类的名称（而不是实例！）。 这是因为学习对象尚不存在，并且需要实例化TraceMallocMultiColMetric。 一旦创建了学习对象，系统就会自动为我们完成。

```python
learn = cnn_learner(data, model, metrics=[accuracy], callback_fns=TraceMallocMultiColMetric)
learn.fit_one_cycle(3, max_lr=1e-2)
```
然后输出变为：

```python
Total time: 00:53
epoch   train_loss valid_loss   accuracy     used   max_used   peak
    1   0.321233    0.068252    0.978600    156504  2408404   2419891 
    2   0.093551    0.032776    0.988500     79343  2408404   2348085
    3   0.047178    0.025307    0.992100     79568  2408404   2342754
```

另一种方法是使用learn.callbacks.append，这次我们需要使用我们现在拥有的学习对象来实例化TraceMallocMultiColMetric，因为它是在创建后者后调用的：

```python
learn = cnn_learner(data, model, metrics=[accuracy])
learn.callbacks.append(TraceMallocMultiColMetric(learn))
learn.fit_one_cycle(3, max_lr=1e-2)
```
在学习对象中配置自定义指标会将它们设置为在将来的所有fit-family调用中运行。 但是，如果您只想为一次调用配置它，可以直接在fit或fit_one_cycle中配置它：

```python
learn = cnn_learner(data, model, metrics=[accuracy])
learn.fit_one_cycle(3, max_lr=1e-2, callbacks=TraceMallocMultiColMetric(learn))
```

并强调差异：

* callback_fns参数需要一个类名或列表
* callbacks参数需要一个类的实例或它们的列表
* learn.callbacks.append期望一个类的单个实例
有关更多示例，请查看fastai代码库及其测试套件，查找继承Callback，LearnerCallback和这两者的子类的类。

最后，虽然上面的示例都添加了指标，但这不是必需的。 回调可以执行任何需要的操作，并且不需要将其结果添加到度量标准打印输出中。
