# PyTorch Fashion
1. Prepare Dataset
    - use tool (talk later)
2. Design model using class
    - inherit from nn.Model
3. Construct loss and optimizer
    - using PyTorch APi
4. Training cycle + test
    - forward   -->损失
    - backward  -->梯度
    - update    -->梯度下降法更新权重



## Tensor：
### 内容
Pytorch的基本单元，可以存放数据，维度不限；
每一单元含有两部分内容：权值（Data）和梯度（Gard）
<img height="120" src="Picture/Tensor.png" width="120"/>
### 属性
|             属性              | 属性值                                                                                                            |
|:---------------------------:|:---------------------------------------------------------------------------------------------------------------|
|          **data**           | 该 tensor 的值                                                                                                    |
|        required_grad        | 该 tensor 是否连接在计算图（computational graph）上，即是否计算梯度                                                                |
|          **grad**           | 如果 required_grad 是 True，则这个属性存储了反向传播时该 tensor 积累的梯度（tensor）                                                    |
|           grad_fn           | 该 tensor 计算梯度的函数                                                                                               |
|           is_leaf           | 在计算图中两种情况下 is_leaf 是 True：模型需要更新的参数 W 和模型的输入 x。is_leaf 和 required_grad 都是 True，该 tensor 才会将计算图中的梯度积累到 grad 属性中 |

### 运算过程
每一次Tensor运算都会生成一个动态的运算图
前向计算时构建计算图，梯度是反向传播时计算，为了节省显存反向传播完计算图被释放。
<img height="250" src="Picture/Tensor_ operation.png" width="400"/>

______

## torch.nn
### .**Linea**r(in_features,out_features,bias)
- in_features: size of each input sample
- out_features: size of each output sample
    - size：输入（出）样本的维度（特征数量，列数）
- bias: 是否需要偏置量
    - If set to"False", the layer will not learn an additive bias.
    - Default: "True"
    <img height="220" src="Picture/LinearFuncation.png" width="400"/>
### .MSELoss()
* size_average (bool, optional): 是否求均值，默认True
* reduce (bool, optional):是否求和降维，默认True
## torch.optim
### .SGD
* params: (_params_t) 权重,常见输入：model.parameters()保存的是Weights和Bais参数的值
* lr: (float) 学习率
* momentum: (float) 冲量
* dampening: (float)
* weight_decay:(float) W^TW
* nesterov:(bool)

## Class
 __init\_\_:初始化class的时候用，给初始值附值
 __call\_\_:对实例对象可以像调用普通函数那样

In [None]:
class Foobar:
    def __int__(self):
        # 初始化class的时候用，给初始值附值
        pass

    def __call__(self, *args, **kwargs):
        """
        对实例对象可以像调用普通函数那样
        :param args:传入普通值，并以元组形式存放
        :param kwargs:传入关键值，并以字典形式存放
        :return:
        """

        pass


## 逻辑斯蒂回归
### ——分类问题
**常用Sigmoid函数**
<img height="220" src="Picture/Sigmoid.png" width="400"/>
**常规模型与逻辑斯蒂模型**
线性回归后增加一步分类（Sigmoid函数）
<img height="200" src="Picture/Model4Affine&Logistic.png" width="400"/>
**常规模型与逻辑斯蒂损失函数**
由传统的MSE转为BCE
<img height="200" src="Picture/LossFunction4Affine&amp;Logistic.png" width="400"/>
**逻辑斯蒂模型**
<img height="220" src="Picture/LogisticsModel.png" width="400"/>
<img height="220" src="Picture/MiniBatch.png" width="400"/>

## Mini batch
- **【epoch】**:
    - One forward pass and one backward pass of all then training examples.
- **【Batch-size】**:
    - The number of training examples in one of forward backward pass
- **【interation】**:
    - Number of passes,each pass using [batch size] number of examples




## 数据集加载
### ——Dataset and Dataloader
1、DataSet 是抽象类，不能实例化对象，主要是用于构造我们的数据集

2、DataLoader 需要获取DataSet提供的索引[i]和len;用来帮助我们加载数据，比如说做shuffle(提高数据集的随机性)，batch_size,能拿出Mini-Batch进行训练。它帮我们自动完成这些工作。DataLoader可实例化对象。DataLoader is a class to help us loading data in Pytorch.

dataloader:
<img height="250" src="Picture/Dataloader.png" width="400"/>
<img height="250" src="Picture/DiabetesDataset.png" width="400"/>

In [None]:
import torch
import numpy as np
from torch.utils.data import Dataset
from torch.utils.data import DataLoader


class DiabetesDataset(Dataset):
    #   Dataset是一个抽象函数，不能直接实例化，所以我们要创建一个自己类，继承Dataset
    def __int__(self, path):
        # 初始化函数，之后我们可以提供数据集路径进行数据的加载
        xy=np.loadtxt(path)
        pass

    def __getitem__(self, item):
        # 帮助我们通过索引找到某个样本
        pass

    def __len__(self):
        # 帮助我们返回数据集大小
        pass


filepath = None
dataset = DiabetesDataset(filepath)
train_loader = DataLoader(
    dataset=dataset,  # 传递数据集
    batch_size=32,  # 小批量的容量
    shuffle=True,  # 是否打乱训练
    num_workers=2  # 是否并行计算，并行块2
)

### enumerate()
enumerate在字典上是枚举、列举的意思
**enumerate参数(可遍历/可迭代的对象(如列表、字符串),索引开始数）**
enumerate多用于在for循环中得到计数，利用它可以同时获得索引和值，即需要index和value值的时候可以使用enumerate
enumerate()返回的是一个enumerate对象


# 多分类问题
## 函数
**softmax函数**：$$
\text{Softmax}(x_{i}) = \frac{\exp(x_i)}{\sum_j \exp(x_j)}
$$
**NLLL损失函数**
$$
        \ell(x, y) = L = \{l_1,\dots,l_N\}^\top, \quad
        \\l_n = - w_{y_n} x_{n,y_n}, \quad
        w_{c} = \text{weight}[c] \cdot \mathbb{1}\{c \not= \text{ignore\_index}\}
$$
**交叉熵损失函数**（Softmax+NLLLoss）
<img height="200" src="Picture/CrossEntropyLoss.png" width="400"/>
批注：CrossEntropyLoss包括激活项，使用时不用softmax激活

## Design Model for mnist
<img height="200" src="Picture/DesignModel4Mnist.png" width="400"/>
