In [2]:
import torch
from torch import nn
from torchvision import models
from IPython.display import Image

## basics

$$
y=xA^T+b
$$

- fan in fan out （扇入扇出）
    - 刻画 parameter（weights）的 shape；
    - 以 `nn.Linear` 为例

In [3]:
Image(url='./imgs/linear.png', width=400)

In [4]:
Image(url='./imgs/fan_in_fan_out.png', width=400)

## parameters，modules

- 返回的都是 generator（因为深度学习的 layer 较多，且会返回 weights）
    - 所以是逐个取的，不是一次性全部加载到内存里边；
- `m.parameters()` 与 `m.named_parameters()` 
    - 长度一致，只是 `m.named_parameters()` 多了 layer name 的属性值返回
- `m.named_parameters()` 与 `m.named_modules()`
    - `named_modules` 是 module 或者叫 layer 粒度，而不是 weight/bias 粒度；
    - `named_modules` 先整体 (`[0]`) 再细节，因为大的是module，小的也是module

## test

In [3]:
model = models.resnet34()

In [4]:
len(list(model.parameters()))

110

In [5]:
len(list(model.named_parameters()))

110

In [6]:
len(list(model.named_modules()))

116

In [15]:
# list(model.named_modules())[0]

In [16]:
list(model.named_modules())[1]

('conv1',
 Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False))

In [19]:
list(model.named_parameters())[

('conv1.weight',
 Parameter containing:
 tensor([[[[-3.8716e-02,  1.9200e-02, -3.3659e-02,  ...,  4.3175e-03,
             7.5653e-04,  2.6480e-02],
           [-2.1792e-02,  6.7750e-02,  4.2615e-03,  ...,  3.4774e-03,
             2.3442e-02,  7.0887e-02],
           [-1.7107e-02, -5.7436e-03,  3.3052e-02,  ...,  4.5731e-02,
            -2.2160e-02,  1.0530e-02],
           ...,
           [ 1.8977e-02, -7.4217e-04,  1.2923e-02,  ..., -6.1437e-03,
             2.6563e-02, -1.2856e-02],
           [ 2.0856e-02, -9.5018e-03, -1.7576e-02,  ..., -1.0873e-02,
            -5.1608e-02,  3.8118e-03],
           [ 3.9641e-02,  1.1401e-02, -4.7437e-02,  ...,  3.3843e-02,
            -4.7512e-02, -4.9724e-03]],
 
          [[-2.7384e-02, -2.0644e-03, -2.2485e-02,  ..., -6.0075e-02,
            -2.1598e-02, -2.9929e-02],
           [ 3.5728e-03, -5.4750e-02,  2.4817e-03,  ..., -6.1871e-02,
             2.5705e-02,  2.5756e-02],
           [-3.3757e-02,  5.1204e-02, -4.5487e-04,  ..., -8.7942e-03,