In [7]:
import torch
import torch.nn as nn
from torchvision import models

#读取pytorch自带的resnet-101模型,因为使用了预训练模型，所以会自动下载模型参数
# model=models.inception_v3(pretrained=True)
model=models.resnet101(pretrained=True)

#对于模型的每个权重，使其不进行反向传播，即固定参数
for param in model.parameters():
    param.requires_grad = False
#但是参数全部固定了，也没法进行学习，所以我们不固定最后一层，即全连接层fc
for param in model.fc.parameters():
    param.requires_grad = True


如果想修改最后一层的话，可以这么修改：

In [9]:
class_num = 200 #假设要分类数目是200
channel_in = model.fc.in_features#获取fc层的输入通道数
#然后把resnet-101的fc层替换成300类别的fc层
model.fc = nn.Linear(channel_in,class_num)


也可以删除最后一层或者几层

In [11]:
#这里[:-1]代表删除最后一层
new_model = nn.Sequential(*list(model.children())[:-1])
#或删除最后两层
# new_model = nn.Sequential(*list(model.children())[:-2])

In [12]:
print(new_model)

Sequential(
  (0): BasicConv2d(
    (conv): Conv2d(3, 32, kernel_size=(3, 3), stride=(2, 2), bias=False)
    (bn): BatchNorm2d(32, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
  )
  (1): BasicConv2d(
    (conv): Conv2d(32, 32, kernel_size=(3, 3), stride=(1, 1), bias=False)
    (bn): BatchNorm2d(32, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
  )
  (2): BasicConv2d(
    (conv): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
    (bn): BatchNorm2d(64, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
  )
  (3): BasicConv2d(
    (conv): Conv2d(64, 80, kernel_size=(1, 1), stride=(1, 1), bias=False)
    (bn): BatchNorm2d(80, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
  )
  (4): BasicConv2d(
    (conv): Conv2d(80, 192, kernel_size=(3, 3), stride=(1, 1), bias=False)
    (bn): BatchNorm2d(192, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
  )
  (5): InceptionA(
    (branch1

In [13]:
print(model)

Inception3(
  (Conv2d_1a_3x3): BasicConv2d(
    (conv): Conv2d(3, 32, kernel_size=(3, 3), stride=(2, 2), bias=False)
    (bn): BatchNorm2d(32, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
  )
  (Conv2d_2a_3x3): BasicConv2d(
    (conv): Conv2d(32, 32, kernel_size=(3, 3), stride=(1, 1), bias=False)
    (bn): BatchNorm2d(32, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
  )
  (Conv2d_2b_3x3): BasicConv2d(
    (conv): Conv2d(32, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
    (bn): BatchNorm2d(64, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
  )
  (Conv2d_3b_1x1): BasicConv2d(
    (conv): Conv2d(64, 80, kernel_size=(1, 1), stride=(1, 1), bias=False)
    (bn): BatchNorm2d(80, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
  )
  (Conv2d_4a_3x3): BasicConv2d(
    (conv): Conv2d(80, 192, kernel_size=(3, 3), stride=(1, 1), bias=False)
    (bn): BatchNorm2d(192, eps=0.001, momentum=0.1, affine=True, t

当然删除了最后几层，可能还要添加，可以直接把以上代码写入新的网络里，然后再在forward代码块中添加，这个比较基础，就不详说了  
这个时候是如果按常规训练模型的方法直接使用optimizer的话会出错误的，如：  
```python optimizer = torch.optim.SGD(model.parameters(), lr=0.1)```


这是因为optimizer的输入参数parameters必须都是可以修改、反向传播的，即requires_grad=True,但是我们刚才已经固定了除了最后一层的所有参数，所以会出错。   
解决方法是optimizer中只输入需要反向传播的参数：

In [None]:
#filter()函数过滤掉parameters中requires_grad=Fasle的参数
optimizer = torch.optim.SGD(
                        filter(lambda p: p.requires_grad, model.parameters()),#重要的是这一句
                        lr=0.1)

这样就可以进行正常的训练了。

这里引申一下：接下来的代码是如何输出网络模型的卷积方式以及权重数值

In [14]:
for child in model.children():
    print(child)#打印网络模型的卷积方式
    for param in child.parameters():#打印权重数值
        print(param)

BasicConv2d(
  (conv): Conv2d(3, 32, kernel_size=(3, 3), stride=(2, 2), bias=False)
  (bn): BatchNorm2d(32, eps=0.001, momentum=0.1, affine=True, track_running_stats=True)
)
Parameter containing:
tensor([[[[-2.1029e-01, -3.4410e-01, -3.4441e-02],
          [-1.4202e-01, -2.5197e-01, -2.8017e-02],
          [ 7.3572e-02,  1.8322e-02,  3.8061e-02]],

         [[ 1.4173e-01,  1.5935e-01,  5.0583e-02],
          [ 8.2847e-02,  8.5434e-02,  1.8575e-02],
          [ 2.8347e-02,  1.4404e-02,  5.0797e-02]],

         [[ 9.9930e-02,  2.3008e-01, -3.2706e-02],
          [ 7.2042e-02,  1.6623e-01, -1.1707e-02],
          [-1.0266e-01, -2.4414e-02, -8.7630e-02]]],


        [[[-1.9065e-02,  1.5943e-02, -9.4593e-03],
          [ 1.0550e-02,  6.5924e-02,  7.6922e-03],
          [-1.3280e-02, -6.2760e-03, -3.8059e-02]],

         [[-2.2683e-03, -1.4157e-02, -6.7113e-03],
          [ 5.3325e-03,  1.9378e-02,  4.7322e-03],
          [-1.9187e-03, -7.0038e-03, -2.0332e-03]],

         [[-1.2567e-03,  3.

Parameter containing:
tensor([-0.7732,  0.2245, -0.2731,  0.7342, -0.4171, -0.2605,  0.1635, -0.3400,
         0.3636,  0.6646, -0.8291, -0.2504,  0.3280, -0.6893, -0.4431,  1.9609,
         1.6015, -0.3887, -0.2470, -0.4489, -0.6964, -0.2491, -0.3509, -0.5418,
        -0.1736,  0.3194, -0.3913, -0.4207, -0.3766,  0.7027, -0.7364,  0.7995,
        -0.5551, -0.4989, -0.6217, -0.3517, -0.3424, -0.3499, -0.2004,  1.1926,
        -0.0537, -0.5031, -0.3141,  0.2309,  0.1222, -1.3655, -0.5432, -0.2452,
        -1.2982, -1.2227, -0.2801,  0.1656, -1.0515,  1.3529, -0.6327, -0.5380,
        -1.1467, -1.3881, -0.7537, -0.3105,  0.1428, -0.1363, -1.0433, -0.6364,
        -0.2605, -0.4598, -1.2254, -0.1852, -0.3040,  0.9235, -0.5432, -0.4446,
        -0.6684,  1.5332, -1.1253,  0.7192, -0.8707, -0.4411, -0.1179, -0.3754,
        -0.3487, -0.3754, -0.6686, -0.4085, -0.7717, -0.7942, -0.4408, -0.9729,
        -1.2503, -0.7729, -1.0066, -0.2983,  1.7227, -0.5036, -0.3285,  1.7456])
Parameter contain

Parameter containing:
tensor([-0.6210, -0.4091, -0.4595, -0.4522, -0.4682, -0.8338, -0.8174, -0.6259,
        -0.5611, -0.4036, -0.6810, -0.5754, -0.7463, -0.5327, -0.2185, -0.5802,
        -0.4393, -0.8646, -0.5531, -0.5518, -0.6405, -0.5910, -0.4856, -0.5741,
         0.2439, -0.3566, -0.4012, -0.5956, -0.7458, -0.4115, -0.6277, -0.6823,
        -0.8226, -0.3751, -0.7458, -0.5585, -0.6411, -0.8033, -0.1867, -0.9527,
        -0.8280, -0.8258, -0.4633, -0.5689, -0.5672, -0.5957, -0.1673, -0.4208,
        -0.6381, -0.6792, -0.8441, -0.8740, -0.5630, -0.7891, -1.0927, -0.4656,
        -0.3523, -0.7949, -0.3799, -0.4494, -0.9166, -0.4510, -0.3816, -0.6102,
        -0.6624, -0.1897, -0.4317, -0.6245, -0.4958, -0.4025, -0.5994, -1.2096,
        -0.4413, -0.4480, -0.7870, -0.6092, -0.4295, -0.4093, -0.7823, -0.3930,
        -0.6762, -0.7033, -0.0499, -0.6558, -0.5051, -0.5935, -1.4898, -0.2242,
        -0.4993, -0.6067, -0.2714,  0.0559, -0.8527, -0.6377, -0.6616, -0.6780,
        -0.4788, -

          [ 2.3485e-02]]]])
Parameter containing:
tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])
Parameter containing:
tensor([-0.4218, -0.2022, -0.9000, -0.0526, -0.4249, -0.4934, -0.4666,  1.5203,
        -0.6087, -0.7975, -0.1513, -0.0792, -0.8700, -0.0578, -0.7655, -0.0621,
        -0.5358,  0.3520, -1.0087, -0.6262, -0.6893, -0

Parameter containing:
tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])
Parameter containing:
tensor([-0.6169, -0.6853, -1.0270, -0.7634, -0.3263, -0.8476, -0.8579, -0.7735,
        -0.5887, -0

Parameter containing:
tensor([ 0.1126,  0.4006,  0.3551,  0.3814,  0.2760,  0.3865,  0.2420,  0.1764,
         0.2312,  0.3308,  0.4672,  0.2291,  0.3555,  0.4063,  0.2778,  0.2775,
         0.1772,  0.2339,  0.3711,  0.5950,  0.2838,  0.3539,  0.5350,  0.1207,
         0.4288,  0.3089,  0.2970,  0.3174,  0.2854,  0.3146,  0.1542,  0.2883,
         0.3578,  0.4054,  0.3500,  0.1568, -0.1251,  0.3301,  0.3997,  0.2891,
         0.2818,  0.3258,  0.3331,  0.3357,  0.3815,  0.2650,  0.1975,  0.2817,
         0.2700,  0.3161,  0.4397,  0.2592,  0.3863,  0.2711,  0.3771,  0.4450,
         0.2575,  0.2923,  0.3225,  0.2766,  0.2464,  0.2917,  0.4393,  0.3908,
         0.2175,  0.5008,  0.4587,  0.3918,  0.4694,  0.3608,  0.4128,  0.2752,
         0.1869,  0.3507,  0.2318,  0.3723,  0.4038,  0.3487,  0.2665,  0.3253,
         0.3325,  0.4761,  0.3399,  0.2793,  0.3712,  0.3339,  0.3305,  0.2170,
         0.4057,  0.2140,  0.2573,  0.3821,  0.2299,  0.2217,  0.3374,  0.2727,
         0.0628,  

         [[ 5.0633e-02,  2.7697e-02,  5.5093e-02]]]])
Parameter containing:
tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 

Parameter containing:
tensor([-0.9093, -0.9395, -0.9283, -0.8574, -0.9728, -0.9019, -0.8983, -0.8165,
        -0.7395, -0.9055, -1.0063, -0.5914, -0.9536, -0.8377, -0.8795, -0.9201,
        -0.7170, -0.7749, -1.0015, -0.8413, -0.7112, -0.8673, -1.1099, -1.0025,
        -0.9579, -0.9725, -0.9038, -0.9006, -0.8014, -0.7371, -0.8088, -0.9450,
        -1.0425, -0.8007, -0.8331, -0.8293, -0.9447, -0.8447, -0.8459, -1.0307,
        -0.9387, -0.8940, -1.0319, -0.8301, -0.6497, -0.9036, -0.9546, -0.8135,
        -0.7319, -0.7915, -0.7136, -0.9259, -0.8511, -0.8155, -0.8387, -0.9349,
        -0.8363, -0.6839, -0.8588, -0.9669, -0.8868, -0.9400, -0.9941, -0.8686,
        -0.8597, -0.9473, -1.1715, -0.8787, -0.6931, -0.7981, -0.9080, -0.9041,
        -0.7646, -0.8971, -0.7701, -0.6684, -0.8667, -0.6970, -0.9040, -0.8573,
        -0.6947, -0.8911, -0.8862, -0.8599, -0.8595, -0.9427, -0.9684, -0.8168,
        -0.8950, -0.9416, -0.8471, -0.9073, -0.8259, -0.8545, -0.9026, -1.0243,
        -0.8640, -

         [[-0.0129]]]])
Parameter containing:
tensor([1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.,
        1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])
Parameter containing:
tensor([ 2.6121e-02,  2.6375e-02, -1.0253e-02,  9.2580e-03, -4.5947e-03,
  