# 从回归到多类分类

## 从回归到多类分类

### 回归
- 单连续数值输出
- 自然区间R
- 跟真实值的区别作为损失

### 分类
- 通常多个输出
- 输出i是预测为第i类的置信度

## 从回归到多分类 - 均方损失
- 对类别进行一位有效编码 $$y = [y_1,y_2,...,y_n]^T$$
$$y_i = \begin{cases} 1 &{if \quad i = y} \\ 0 &{otherwise}\end{cases}$$
- 使用均方损失训练
- 最大值为预测 $\widehat{y} = argmax O_i$

## 从回归到多类分类 - 无校验比例
- 需要更置信的识别正确类（大余量）
$$O_y-O_i >= \Delta(y,i)$$

## 从回归到多类分类 - 校验比例
- 输出匹配概率（非负，和为1）
$$\widehat{y} = softmax(O)$$
$$\widehat{y} = \frac{exp(o_i)}{\sum_k{exp(o_k)}}$$
- 概率$y$和$\widehat{y}$的区别作为损失

## softmax和交叉熵损失
- 交叉熵常用来衡量两个概率的区别$H(p,q) = \sum\limits_i{-p_ilog(q_i}$
- 将它作为损失 $l()y,\widehat{y} = -\sum\limits_i{log\widehat{y}_i} = -log\widehat{y}_y$
- 其梯度是真实概率和预测概率的区别$$\partial _{o_i}{l(y,\widehat{y})} = softmax(o)_i - y_i$$

## 总结
- softmax回归是一个多类分类模型
- 使用Softmax操作子得到每个类的预测置信度
- 使用交叉熵来衡量预测和标号的区别

# 图像分类数据集

MINIST数据集是图像分类中广泛使用的数据集之一，但作为基准数据集过于简单。我们将使用类似但更加复杂的Fashion-MNIST 数据集

In [4]:
%matplotlib inline
import torch
import torchvision
from torch.utils import data
from torchvision import transforms
from d2l import torch as d2l

d2l.use_svg_display()

trans = transforms.ToTensor()
mnist_train = torchvision.datasets.FashionMNIST(root='./data',train = True, transform=trans,download=True)
mnist_test = torchvision.datasets.FashionMNIST(root='./data', train = False, transform=trans,download=True)
len(mnist_train),len(mnist_test)

(60000, 10000)

In [6]:
mnist_train[0][0].shape

torch.Size([1, 28, 28])

In [None]:
def get_fashion_mnist_labels(labels):
     text_labels = ['t-shirt', 'trouser', 'pullover', 'dress', 'coat',
                   'sandal', 'shirt', 'sneaker', 'bag', 'ankle boot']
    return [text_labels[int(i)] for i in labels]

def show_image(imgs, num_rows, num_cols, titles = None, scale=1.5):
    figsize = (num_cols*scale, num_rows*scale)
    _, axes = 