## hook 函数

### 一、register_forward_hook

如果随机的初始化每个层，那么就无法测试出自己获取的输入输出是不是forward中的输入输出了，所以需要将每一层的权重和偏置设置为可识别的值（比如全部初始化为1）。网络包含两层（Linear有需要求导的参数被称为一个层，而ReLU没有需要求导的参数不被称作一层），__init__()中调用initialize函数对所有层进行初始化。

In [9]:
import torch
import torch.nn as nn


class TestForHook(nn.Module):
    def __init__(self):
        super().__init__()

        self.linear_1 = nn.Linear(in_features=2, out_features=2)
        self.linear_2 = nn.Linear(in_features=2, out_features=1)
        self.relu = nn.ReLU()
        self.relu6 = nn.ReLU6()
        self.initialize()

    def forward(self, x):
        linear_1 = self.linear_1(x)
        linear_2 = self.linear_2(linear_1)
        relu = self.relu(linear_2)
        relu_6 = self.relu6(relu)
        layers_in = (x, linear_1, linear_2)
        layers_out = (linear_1, linear_2, relu)
        return relu_6, layers_in, layers_out

    def initialize(self):
        """ 定义特殊的初始化，用于验证是不是获取了权重"""
        self.linear_1.weight = torch.nn.Parameter(torch.FloatTensor([[1, 1], [1, 1]]))
        self.linear_1.bias = torch.nn.Parameter(torch.FloatTensor([1, 1]))
        self.linear_2.weight = torch.nn.Parameter(torch.FloatTensor([[1, 1]]))
        self.linear_2.bias = torch.nn.Parameter(torch.FloatTensor([1]))
        return True

hook（）函数是register_forward_hook()函数必须提供的参数，好处是“用户可以自行决定拦截了中间信息之后要做什么！”，比如自己想单纯的记录网络的输入输出（也可以进行修改等更加复杂的操作）。首先定义几个容器用于记录：

In [10]:
# 1：定义用于获取网络各层输入输出tensor的容器
# 并定义module_name用于记录相应的module名字
module_name = []
features_in_hook = []               ## 用于保存 hook 得到的 fea_in
features_out_hook = []              ## 用于保存 hook 得到的 fea_out

hook函数需要三个参数，这三个参数是系统传给hook函数的，自己不能修改这三个参数：

In [11]:
# 2：hook函数负责将获取的输入输出添加到feature列表中
# 并提供相应的module名字

# features_in_hook 储存了注册的hook层中的输入特征
# features_out_hook 储存了注册的hook层中的输出特征
def hook(module, fea_in, fea_out):
    print("hooker working")
    print('module.__class__：',module.__class__)
    module_name.append(module.__class__)
    print('fea_in：',fea_in)
    print('fea_out：',fea_out)
    print('\n')
    features_in_hook.append(fea_in)
    features_out_hook.append(fea_out)
    return None

In [12]:
# 3：定义全部是1的输入
x = torch.FloatTensor([[0.1, 0.1], [0.1, 0.1]])

注册钩子必须在forward（）函数被执行之前，也就是定义网络进行计算之前就要注册，下面的代码对网络除去ReLU6以外的层都进行了注册（也可以选定某些层进行注册）：

In [13]:
# 4:注册钩子可以对某些层单独进行,以下对不是 nn.ReLU6 的层全部注册了hook.
# 以后只要进行前项传播操作，hook 函数都会将 fea_in 和 fea_out 保存到 features_in_hook 和 features_out_hook 中
net = TestForHook()
net_chilren = net.children()
for child in net_chilren:
    if not isinstance(child, nn.ReLU6):
        child.register_forward_hook(hook=hook)

## list(net_chilren)
## Linear(in_features=2, out_features=2, bias=True)
## Linear(in_features=2, out_features=1, bias=True)
## ReLU()
## ReLU6()

In [14]:
# 5:测试网络输出
out, features_in_forward, features_out_forward = net(x)
print("*"*5+"forward return features"+"*"*5)
print('features_in_forward：',features_in_forward)
print('features_out_forward：',features_out_forward)
print("*"*5+"forward return features"+"*"*5)

hooker working
module.__class__： <class 'torch.nn.modules.linear.Linear'>
fea_in： (tensor([[0.1000, 0.1000],
        [0.1000, 0.1000]]),)
fea_out： tensor([[1.2000, 1.2000],
        [1.2000, 1.2000]], grad_fn=<AddmmBackward>)


hooker working
module.__class__： <class 'torch.nn.modules.linear.Linear'>
fea_in： (tensor([[1.2000, 1.2000],
        [1.2000, 1.2000]], grad_fn=<AddmmBackward>),)
fea_out： tensor([[3.4000],
        [3.4000]], grad_fn=<AddmmBackward>)


hooker working
module.__class__： <class 'torch.nn.modules.activation.ReLU'>
fea_in： (tensor([[3.4000],
        [3.4000]], grad_fn=<AddmmBackward>),)
fea_out： tensor([[3.4000],
        [3.4000]], grad_fn=<ReluBackward0>)


*****forward return features*****
features_in_forward： (tensor([[0.1000, 0.1000],
        [0.1000, 0.1000]]), tensor([[1.2000, 1.2000],
        [1.2000, 1.2000]], grad_fn=<AddmmBackward>), tensor([[3.4000],
        [3.4000]], grad_fn=<AddmmBackward>))
features_out_forward： (tensor([[1.2000, 1.2000],
        [1.200

In [15]:
# 6:测试features_in是不是存储了输入
## 在上面的代码中指定了前三层的hook，features_in_hook 是该层的输入特征，features_out_hook 是该层的输出特征。
## 可以看到进行forward之后，最后返回的所有层的forward值和hook层勾出来的值是一样的。

print("*"*5+"hook record features"+"*"*5)
print(features_in_hook)
print(features_out_hook)
print(module_name)
print("*"*5+"hook record features"+"*"*5)

*****hook record features*****
[(tensor([[0.1000, 0.1000],
        [0.1000, 0.1000]]),), (tensor([[1.2000, 1.2000],
        [1.2000, 1.2000]], grad_fn=<AddmmBackward>),), (tensor([[3.4000],
        [3.4000]], grad_fn=<AddmmBackward>),)]
[tensor([[1.2000, 1.2000],
        [1.2000, 1.2000]], grad_fn=<AddmmBackward>), tensor([[3.4000],
        [3.4000]], grad_fn=<AddmmBackward>), tensor([[3.4000],
        [3.4000]], grad_fn=<ReluBackward0>)]
[<class 'torch.nn.modules.linear.Linear'>, <class 'torch.nn.modules.linear.Linear'>, <class 'torch.nn.modules.activation.ReLU'>]
*****hook record features*****


In [16]:
# 7：测试forward返回的feautes_in是不是和hook记录的一致
print("sub result")
for forward_return, hook_record in zip(features_in_forward, features_in_hook):
    print(forward_return-hook_record[0])

sub result
tensor([[0., 0.],
        [0., 0.]])
tensor([[0., 0.],
        [0., 0.]], grad_fn=<SubBackward0>)
tensor([[0.],
        [0.]], grad_fn=<SubBackward0>)
