In [1]:
import torch

- torch.utils.data模块提供了有关数据处理的工具
- torch.nn模块定义了大量神经网络的层
- torch.nn.init模块定义了各种初始化方法
- torch.optim模块提供了模型参数初始化的各种方法。

### 学习率的调整

```
optimizer =optim.SGD([
    # 如果对某个参数不指定学习率，就使用最外层的默认学习率
    {'params': net.subnet1.parameters()}, # lr=0.03
    {'params': net.subnet2.parameters(), 'lr': 0.01}
], lr=0.03)
```
有时候我们不想让学习率固定成一个常数，那如何调整学习率呢？主要有两种做法。一种是修改optimizer.param_groups中对应的学习率，另一种是更简单也是较为推荐的做法——新建优化器，由于optimizer十分轻量级，构建开销很小，故而可以构建新的optimizer。但是后者对于使用动量的优化器（如Adam），会丢失动量等状态信息，可能会造成损失函数的收敛出现震荡等情况。

```
# 调整学习率
for param_group in optimizer.param_groups:
    param_group['lr'] *= 0.1 # 学习率为之前的0.1倍
```

### 定义模型

In [20]:
# 写法一
net = torch.nn.Sequential(
    torch.nn.Linear(2, 1)
)

# 写法二
net = torch.nn.Sequential()
net.add_module('linear', torch.nn.Linear(2, 1))
# net.add_module ......

# 写法三
from collections import OrderedDict
net = torch.nn.Sequential(OrderedDict([
    ('linear', torch.nn.Linear(2, 1))
    # ......
]))

print(net)

Sequential(
  (linear): Linear(in_features=2, out_features=1, bias=True)
)


### 参数的相关

net[0] 这样根据下标访问子模块的写法只有当 net 是个 ModuleList 或者 Sequential 实例时才可以

In [2]:
class LinearNet(torch.nn.Module):
    def __init__(self):
        super(LinearNet, self).__init__()
        self.linear = torch.nn.Linear(in_features=2, out_features=1, bias=True)
    
    def forward(self, x):
        return self.linear(x)

net = LinearNet()

In [3]:
## 初始化参数
torch.nn.init.normal_(net.linear.weight, 0., 0.1)
torch.nn.init.constant_(net.linear.bias, 0.)

## 查看参数
for param in net.parameters():
    print(param)
    

Parameter containing:
tensor([[0.0266, 0.0058]], requires_grad=True)
Parameter containing:
tensor([0.], requires_grad=True)


In [17]:
net = torch.nn.Sequential(
    torch.nn.Linear(2, 1)
)

print(net)
print(net[0])
print(net[0].weight, net[0].bias)
print(list(net[0].parameters()))


Sequential(
  (0): Linear(in_features=2, out_features=1, bias=True)
)
Linear(in_features=2, out_features=1, bias=True)
Parameter containing:
tensor([[-0.7035,  0.5380]], requires_grad=True) Parameter containing:
tensor([0.3234], requires_grad=True)
[Parameter containing:
tensor([[-0.7035,  0.5380]], requires_grad=True), Parameter containing:
tensor([0.3234], requires_grad=True)]


### 其它

注意：torch.nn仅支持输入一个batch的样本不支持单个样本输入，如果只有单个样本，可使用input.unsqueeze(0)来添加一维。

In [25]:
print(torch.tensor([1.,2.]))
print(torch.tensor([1.,2.]).unsqueeze(0))

tensor([1., 2.])
tensor([[1., 2.]])
