## torch.nn.Linear(in_features, out_features, bias=True)

对输入数据做线性变换: $y = Ax + b$

### 参数

- in_features: 每个输入样本的大小
- out_features: 每个输出样本的大小
- bias: 若设置为 `False` , 这层不会学习偏置. 默认值: `True`

### 形状

- 输入: $(N,in\_features)$
- 输出: $(N,out\_features)$

### 变量

- weight: 形状为 $(out\_features \times in\_features)$ 的模块中可学习的权值
- bias: 形状为 $(out\_features)$ 的模块中可学习的偏置

In [26]:
import torch
from torch import nn

# 定义一个线性变换函数
# 这里定义的是 : y = a1*x1 + a2*x2 + b 
# 写成矩阵的形式是 : y = AX + b
linear_func = nn.Linear(2, 1)

# 创建数据
test_data = torch.tensor(data = [1.,2.], requires_grad = True)
print('weight:',linear_func.weight)
print('bias:',linear_func.bias)
print('result:',linear_func(test_data))

# 用于验证计算结果的线性函数
def cul_linear_func(weight, bias, data):
    return torch.matmul(weight,data) + bias

# 验证计算结果
print("AX + b :",cul_linear_func(linear_func.weight, linear_func.bias, test_data))

weight: Parameter containing:
tensor([[ 0.4176, -0.6099]], requires_grad=True)
bias: Parameter containing:
tensor([0.2748], requires_grad=True)
result: tensor([-0.5274], grad_fn=<ViewBackward0>)
AX + b : tensor([-0.5274], grad_fn=<AddBackward0>)


## torch.nn.Sequential(* args) 

一个时序容器。`Modules` 会以他们传入的顺序被添加到容器中。当然，也可以传入一个 `OrderedDict`。

为了更容易的理解如何使用Sequential, 下面给出了一个例子:
```python
# Example of using Sequential
model = nn.Sequential(
          nn.Conv2d(1,20,5),
          nn.ReLU(),
          nn.Conv2d(20,64,5),
          nn.ReLU()
        )

# Example of using Sequential with OrderedDict
model = nn.Sequential(OrderedDict([
          ('conv1', nn.Conv2d(1,20,5)),
          ('relu1', nn.ReLU()),
          ('conv2', nn.Conv2d(20,64,5)),
          ('relu2', nn.ReLU())
        ]))
```

In [None]:
# 定义一个序列神经网络
net = nn.Sequential(nn.Linear(2, 1))
print('net:',net)

## torch.utils.data.Dataset

表示Dataset的抽象类。

## torch.utils.data.TensorDataset(data_tensor, target_tensor)

包装数据和目标张量的数据集。

### 参数

- data_tensor (Tensor): 包含样本数据
- target_tensor (Tensor): 包含样本目标(标签)

In [55]:
import random
from torch.utils import data

data_size = 15
data_arrays = [torch.randn([data_size,2]),torch.rand([data_size,1])]
print(data_arrays)
# 包装数据和目标张量的数据集。
dataset = data.TensorDataset(*data_arrays)
print('dataset:',dataset)

[tensor([[-0.8382, -0.1563],
        [ 1.2722, -0.6555],
        [ 1.7141,  1.3628],
        [ 0.5672, -0.0469],
        [ 0.6672,  0.1248],
        [-1.8532,  1.1633],
        [ 0.2173, -2.0434],
        [ 0.9799,  0.7882],
        [-0.7779,  0.6886],
        [-0.6617,  0.4478],
        [ 0.3305,  1.1990],
        [ 0.6805,  0.0282],
        [ 0.5383,  1.0910],
        [ 0.2652,  1.4928],
        [ 0.6297,  0.2372]]), tensor([[0.1005],
        [0.4190],
        [0.0409],
        [0.6879],
        [0.5952],
        [0.1580],
        [0.3335],
        [0.6755],
        [0.8154],
        [0.2125],
        [0.1730],
        [0.3605],
        [0.1416],
        [0.3048],
        [0.6986]])]
dataset: <torch.utils.data.dataset.TensorDataset object at 0x0000023559712600>


## torch.utils.data.DataLoader(dataset, batch_size=1, shuffle=False, sampler=None, num_workers=0, collate_fn=<function default_collate>, pin_memory=False, drop_last=False)

数据加载器。组合数据集和采样器，并在数据集上提供单进程或多进程迭代器。

### 参数
- dataset (Dataset): 加载数据的数据集。
- batch_size (int, optional): 每个batch加载多少个样本(默认: `1`)。
- shuffle (bool, optional): 设置为 `True` 时会在每个epoch重新打乱数据(默认: `False`).
- sampler (Sampler, optional): 定义从数据集中提取样本的策略。如果指定，则忽略shuffle参数。
- num_workers (int, optional): 用多少个子进程加载数据。`0` 表示数据将在主进程中加载(默认: `0`)
- collate_fn (callable, optional):
- pin_memory (bool, optional):
- drop_last (bool, optional): 如果数据集大小不能被 `batch_size` 整除，则设置为 `True` 后可删除最后一个不完整的batch。如果设为 `False` 并且数据集的大小不能被 `batch_size` 整除，则最后一个batch将更小。(默认: `False`)

In [56]:
data_iter = data.DataLoader(dataset, batch_size = 5, shuffle=True)
print(next(iter(data_iter)))

[tensor([[0.2652, 1.4928],
        [1.7141, 1.3628],
        [0.6672, 0.1248],
        [0.9799, 0.7882],
        [0.5383, 1.0910]]), tensor([[0.3048],
        [0.0409],
        [0.5952],
        [0.6755],
        [0.1416]])]
