# Lib库解

In [9]:
import numpy as np
import torch as tor
from torch.utils import data as tor_u_data
from d2l import torch as d2l_tor
from torch import nn as tor_nn

导个库先

## d2l

### synthetic(weight, bias, 数据量)

In [3]:
weight  = tor.tensor([2, 3.4])
bias    = 5

featrues, labels = d2l_tor.synthetic_data(weight, bias, 1000)
featrues.shape, labels.shape

(torch.Size([1000, 2]), torch.Size([1000, 1]))

- 函数名称：synthetic
- 函数作用：用于仿真数据
- 函数输入：weight【系数项，要有X的】 bias【常数项】 number【生成数据的数量】
- 函数输出：featrues【生成的X】，labels【生成的y值】
- 函数依赖：无

## from torch.utils import data

这个里面有许多都是关于数据处理的

### TensorDataset(*(数据变量名列表))

In [4]:
dataset = tor_u_data.TensorDataset(*(featrues, labels))

- 函数名称：TensorDataset
- 函数作用：将数据转化为torch.utils 的 data类中可操作的张量数据
- 函数输入：*(数据列表) 【数据列表含有所有的array组（多个array）】
- 函数输出：转化成功的torch.utils 的 data 类的数据
- 函数依赖：无

### DataLoader

In [11]:
batch_size = 10 # 池化的单池内数据数量

data_batch = tor_u_data.DataLoader(dataset, batch_size, shuffle=True)

- 函数名称：DataLoader
- 函数作用：用于对数据进行池化装载(池化就是数据切小段)
- 函数输入：dataset 数据集(被转化过) batch_size 池化单池数据量 shuffle 是否洗牌(打乱顺序)属性
- 函数输出：池化后的的数据块(返回的是地址)
- 函数依赖：无

## from torch import nn

注意，这是一个专门用于 **n**erual **n**etwork 的库，里面有各种模型和一些方法

### Sequential(模型组合表(前后))

In [13]:
net = tor_nn.Sequential(tor_nn.Linear(2,1))

- 函数名称：Sequential
- 函数作用：存放模型的容器，在这里面放一张表，表就是机器学习执行的顺序
- 函数输入：模型表
- 函数输出：一个网络
- 函数依赖：无

- 函数名称：Linear
- 函数作用：创建一个线性模型
- 函数输入：输入的数据列数，输出数据需要的页数
- 函数输出：网络
- 函数依赖：无

#### weight与bias元素

In [16]:
net[0].weight.data.fill_(0)
net[0].bias.data.fill_(1)

tensor([1.])

##### **weight**
weight是net中的一个成员元素，是用于作为系数的，其中它还有一个成员叫data，这就十分的显而易见了，就是数据，之后操作方式依照python一贯的套娃就好了，操作方式就像tensor样
##### **bias**
就是常数，其余同上

### MSELoss()

In [None]:
loss = tor_nn.MSELoss()

- 函数名称：MSELoss
- 函数作用：创建 $L_2$ 范数(平方范数)的随时函数计算方法
- 函数输入：无
- 函数输出：网络(计算可以照着对象输出)
- 函数依赖：无

### optim.SGD(parameter(), learn_rate)

In [14]:
trainer = tor.optim.SGD(net.parameters(), lr=0.03) # optim 就是optimizer 优化器

- 函数名称：optim.SGD
- 函数作用：创建随机梯度下降的优化方法
- 函数输入：parameter()【net，由tor_nn模块搞的网络模型】 learn_rate 学习率
- 函数输出：创建的优化器(与模型网络绑定)
- 函数依赖：无

### train.step()

In [15]:
trainer.step()

- 函数名称：.step()
- 函数作用：优化器执行一步
- 函数输入：无
- 函数输出：无(但优化的数据已经自动跟新到了net中)
- 函数依赖：torch.optim

### train.zero_grad()

In [17]:
trainer.zero_grad()

- 函数名称：.zero_grad()
- 函数作用：优化器梯度清零(防止累加，torch不会自动清零)
- 函数输入：无
- 函数输出：无(但优化的数据已经自动跟新到了net中)
- 函数依赖：torch.optim

## 原生Python

### next && iter

In [12]:
def load_array(data_arrays, batch_size, is_train = True):
    """构造一个PyTorch数据迭代器"""
    dataset = tor_u_data.TensorDataset(*data_arrays)                    # 将数据据转化为适合torch.utils.data进行操作的类型
    return tor_u_data.DataLoader(dataset, batch_size, shuffle=is_train) # 是一个装载器，其实就是进行之前那个洗牌操作，搞池化的操作

batch_size = 10
data_iter = load_array((featrues, labels), batch_size)

next(iter(data_iter))                                                   # next是返回下一个迭代对象，而iter是生成迭代对象

[tensor([[ 4.8602e-01, -1.0630e+00],
         [-4.8836e-01,  1.9515e-01],
         [-1.9996e+00, -5.6600e-01],
         [-1.1154e-01, -1.2552e-03],
         [-2.1708e-01, -5.8709e-03],
         [ 1.2893e+00,  5.3370e-01],
         [ 8.1679e-01, -1.4658e-01],
         [ 9.2891e-01,  1.8506e+00],
         [ 5.2304e-01,  4.7185e-01],
         [ 1.6753e+00,  3.5857e-01]]),
 tensor([[ 2.3626],
         [ 4.6845],
         [-0.9200],
         [ 4.7597],
         [ 4.5520],
         [ 9.3836],
         [ 6.1381],
         [13.1415],
         [ 7.6403],
         [ 9.5652]])]

- 函数名称：next()
- 函数作用：返回在带有迭代的元素的的输入的，返回下一个迭代对象
- 函数输入：带有迭代的数据
- 函数输出：下一个迭代的数据
- 函数依赖：带有迭代的玩意

- 函数名称：iter()
- 函数作用：用于产生迭代结果
- 函数输入：带有迭代的数据
- 函数输出：迭代的数据当前的数值
- 函数依赖：带有迭代能力的变量

## 实操详情

[实操详情请见实操笔记](operator_linear_regression-easy.ipynb)