在3.3节（线性回归的简洁实现）中，我们通过init模块来初始化模型的参数。我们也介绍了访问模型参数的简单方法。本节将深入讲解如何访问和初始化模型参数，以及如何在多个层之间共享同一份模型参数。

我们先定义一个与上一节中相同的含单隐藏层的多层感知机。我们依然使用默认方式初始化它的参数，并做一次前向计算。与之前不同的是，在这里我们从nn中导入了init模块，它包含了多种模型初始化方法。

In [1]:
import torch
from torch import nn
from torch.nn import init

net = nn.Sequential(nn.Linear(4,3),nn.ReLU(),nn.Linear(3,1))
print(net)

Sequential(
  (0): Linear(in_features=4, out_features=3, bias=True)
  (1): ReLU()
  (2): Linear(in_features=3, out_features=1, bias=True)
)


In [2]:
X = torch.rand(2,4)
X

tensor([[0.6033, 0.6407, 0.8348, 0.3469],
        [0.6867, 0.7993, 0.6766, 0.2185]])

In [3]:
Y = net(X).sum()
Y

tensor(-0.0958, grad_fn=<SumBackward0>)

## 访问模型参数

回忆一下上一节中提到的`Sequential`类与`Module`类的继承关系。对于`Sequential`实例中含模型参数的层，我们可以通过`Module`类的`parameters()`或者`named_parameters`方法来访问所有参数（以迭代器的形式返回），后者除了返回参数Tensor外还会返回其名字。下面，访问多层感知机net的所有参数：

In [6]:
print(type(net.parameters()))

<class 'generator'>


In [8]:
print(type(net.named_parameters()))

<class 'generator'>


In [10]:
for name,param in net.named_parameters():
    print(name,param.size())

0.weight torch.Size([3, 4])
0.bias torch.Size([3])
2.weight torch.Size([1, 3])
2.bias torch.Size([1])


可见返回的名字自动加上了层数的索引作为前缀。 我们再来访问net中单层的参数。对于使用Sequential类构造的神经网络，我们可以通过方括号[]来访问网络的任一层。索引0表示隐藏层为Sequential实例最先添加的层。

In [12]:
for name,param in net[0].named_parameters():
    print(name,param.size(),type(param))

weight torch.Size([3, 4]) <class 'torch.nn.parameter.Parameter'>
bias torch.Size([3]) <class 'torch.nn.parameter.Parameter'>


In [13]:
for name,param in net[1].named_parameters():
    print(name,param.size(),type(param))

为什么就没有[1]层了？？？

In [14]:
for name,param in net[2].named_parameters():
    print(name,param.size(),type(param))

weight torch.Size([1, 3]) <class 'torch.nn.parameter.Parameter'>
bias torch.Size([1]) <class 'torch.nn.parameter.Parameter'>
