# 4.3. O modelo de classificação básica

Esta seção fornece uma classe base para modelos de classificação para simplificar o código futuro.

In [1]:
import torch
from d2l import torch as d2l

# 4.3.1. The Classifier Class

In [3]:
class Classifier(d2l.Module):  #@save
    """The base class of classification models."""
    def validation_step(self, batch):
        Y_hat = self(*batch[:-1])
        self.plot('loss', self.loss(Y_hat, batch[-1]), train=False)
        self.plot('acc', self.accuracy(Y_hat, batch[-1]), train=False)

Por padrão, usamos um otimizador estocástico de descida de gradiente, operando em minilotes, assim como fizemos no contexto de regressão linear.

In [4]:
@d2l.add_to_class(d2l.Module)  #@save
def configure_optimizers(self):
    return torch.optim.SGD(self.parameters(), lr=self.lr)

# 4.3.2. Accuracy (Precisão)

Dada a distribuição de probabilidade prevista y_hat, normalmente escolhemos a classe com a maior probabilidade prevista sempre que devemos produzir uma previsão difícil. 

Quando as previsões são consistentes com o rótulo class y, elas estão corretas. A precisão da classificação é a fração de todas as previsões corretas. Embora possa ser difícil otimizar a precisão diretamente (não é diferenciável), muitas vezes é a medida de desempenho que mais nos preocupa. Muitas vezes é a quantidade relevante nos benchmarks. 

In [5]:
@d2l.add_to_class(Classifier)  #@save
def accuracy(self, Y_hat, Y, averaged=True):
    """Compute the number of correct predictions."""
    Y_hat = Y_hat.reshape((-1, Y_hat.shape[-1]))
    preds = Y_hat.argmax(axis=1).type(Y.dtype)
    compare = (preds == Y.reshape(-1)).type(torch.float32)
    return compare.mean() if averaged else compare

A classificação é um problema suficientemente comum que justifica suas próprias funções de conveniência. De importância central na classificação é a precisão (accuracy)  do classificador