# Softmax Regression

Softmax Regression是逻辑回归的一种，用于进行分类问题。和Sigmoid Regression相比，Softmax可以进行多元分类，而Sigmoid只能进行二元分类。Softmax Regression有多个输出，区别于线性回归中只有一个输出，每个输出表示该样本分类到这个类中的概率。$o_i$表示样本分类到$i$的概率。

![Softmax layer](../Images/softmax.png)

## Softmax Regression步骤

- 有$m * n$大小的特征，$m * k$大小的标签，将其分为k类
- 使用Softmax函数得到样本关于每个类的预测值：对于一个n维特征$\vec{x} = \begin{bmatrix} x_1 & x_2 & ... & x_n\end{bmatrix}$，有大小为$n * k$的权重矩阵$\vec{w}$和大小为$1 * k$的偏差$b$，得到$\vec{z} = \vec{x} \cdot \vec{w} + \vec{b}$，$\vec{z} = \begin{bmatrix} z_1 & z_2 & ... & z_k\end{bmatrix}$，对$z_i$进行Softmax归一化：$\hat{y_i} = \frac{e^{z_i}}{\sum_{i=1}^{k}{e^{z_i}}$
- 使用交叉熵 (Cross-Entropy Loss) 得到预测与标签的区别：$loss = -\sum_{i=1}^{k}{y_i \log{\hat{y_i}}}$

导入一些需要用的库。

In [9]:
import torch
import torchvision
from torch.utils import data
from torchvision import transforms

使用 `transforms.ToTensor` 函数将PIL格式的图片转换为tensor格式并完成归一化，将所有数据都编程0～1浮点数范围，便于快速进行梯度下降。PyTorch中默认加载的图像数据是PIL (Python Imaging Library) 格式，但是训练神经网络需要tensor格式的数据。

使用 `torchvision.datasets.FashionMNIST` 下载数据集，`root` 表示存储路径，`train` 表示是否为训练集，`download` 表示是否存储到本地，返回的结果是一个Dataset对象。 

In [10]:
# 将PIL格式的图像转换为tensor格式并完成数值归一化，便于后续使用torchvision进行训练
trans = transforms.ToTensor()

# 从框架中下载训练、测试数据集存储到本地，路径为: ../../Data
trainset = torchvision.datasets.FashionMNIST(root='../../Data', train=True, download=True, transform=trans)
testset = torchvision.datasets.FashionMNIST(root='../../Data', train=False, download=True, transform=trans)

看看训练集和测试集数据是什么情况。

In [17]:
print(trainset)
print(testset)

# 第一个数值表示通道数，第二、三个数值表示高度和宽度
print(trainset[0][0].shape)

Dataset FashionMNIST
    Number of datapoints: 60000
    Root location: ../../Data
    Split: Train
    StandardTransform
Transform: ToTensor()
Dataset FashionMNIST
    Number of datapoints: 10000
    Root location: ../../Data
    Split: Test
    StandardTransform
Transform: ToTensor()
torch.Size([1, 28, 28])
