在`torchvision.models`中可以找到预定义的模型

In [1]:
from torchvision import models

查看实际的模型

In [2]:
dir(models)

['AlexNet',
 'AlexNet_Weights',
 'ConvNeXt',
 'ConvNeXt_Base_Weights',
 'ConvNeXt_Large_Weights',
 'ConvNeXt_Small_Weights',
 'ConvNeXt_Tiny_Weights',
 'DenseNet',
 'DenseNet121_Weights',
 'DenseNet161_Weights',
 'DenseNet169_Weights',
 'DenseNet201_Weights',
 'EfficientNet',
 'EfficientNet_B0_Weights',
 'EfficientNet_B1_Weights',
 'EfficientNet_B2_Weights',
 'EfficientNet_B3_Weights',
 'EfficientNet_B4_Weights',
 'EfficientNet_B5_Weights',
 'EfficientNet_B6_Weights',
 'EfficientNet_B7_Weights',
 'EfficientNet_V2_L_Weights',
 'EfficientNet_V2_M_Weights',
 'EfficientNet_V2_S_Weights',
 'GoogLeNet',
 'GoogLeNetOutputs',
 'GoogLeNet_Weights',
 'Inception3',
 'InceptionOutputs',
 'Inception_V3_Weights',
 'MNASNet',
 'MNASNet0_5_Weights',
 'MNASNet0_75_Weights',
 'MNASNet1_0_Weights',
 'MNASNet1_3_Weights',
 'MaxVit',
 'MaxVit_T_Weights',
 'MobileNetV2',
 'MobileNetV3',
 'MobileNet_V2_Weights',
 'MobileNet_V3_Large_Weights',
 'MobileNet_V3_Small_Weights',
 'RegNet',
 'RegNet_X_16GF_Weights'

# AlexNet
初始化一个`AlexNet`模型：

In [3]:
alexnet = models.AlexNet()

此时，`alexnet`是一个可以运行`AlexNet`架构的对象。`alexnet`仅是一个不透明的对象，可以向函数一样调用它。通过向`alexnet`提供一些精确的输入数据，我们将在网络中运行一个正向传播。也就是说，输入将经过一组神经元，其输出将被传递给下一组神经元，直到的到最后的输出。实际上，如果我们有一个真实类型的`input`对象，我们可以使用`ouputs=alexnet(input)`运行正向传播。

但是如果我们这么做，我们将通过整个网络传输数据，而产生的数据就只是一对垃圾数据，因为网络没有初始化他的权重。网络本身是一块白板，或者说随机的白板，我们现在要做的就是要么从头开始训练它，要么加载之前训练好的权重。

为此，我们回到`models`模块。我们已经知道首字母大写的名称对应实现了许多流行模型的 Python 类，而首字母小写的名称是指用预定义的层和单元数实例化的函数，可以选择性的下载和加载预先训练好的权重。

# ResNet
现在我们将使用`resnet101`来实例化一个具有101层的卷积神经网络，我们将传递一个参数，指示函数下载`resnet101`在`ImageNet`数据集上训练好的权重。

In [4]:
resnet = models.resnet101(pretrained=True)

Downloading: "https://download.pytorch.org/models/resnet101-63fe2227.pth" to /Users/wangjunfeng/.cache/torch/hub/checkpoints/resnet101-63fe2227.pth
100%|█████████████████████████████████████████████████████████████████████████████████████████████| 171M/171M [00:10<00:00, 17.2MB/s]


看一下`resnet101`是长什么样子的

In [5]:
resnet

ResNet(
  (conv1): Conv2d(3, 64, kernel_size=(7, 7), stride=(2, 2), padding=(3, 3), bias=False)
  (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
  (relu): ReLU(inplace=True)
  (maxpool): MaxPool2d(kernel_size=3, stride=2, padding=1, dilation=1, ceil_mode=False)
  (layer1): Sequential(
    (0): Bottleneck(
      (conv1): Conv2d(64, 64, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn1): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1), bias=False)
      (bn2): BatchNorm2d(64, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (conv3): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 1), bias=False)
      (bn3): BatchNorm2d(256, eps=1e-05, momentum=0.1, affine=True, track_running_stats=True)
      (relu): ReLU(inplace=True)
      (downsample): Sequential(
        (0): Conv2d(64, 256, kernel_size=(1, 1), stride=(1, 

可以看到，这里有很多模块，每行都是一个，它们是独立的操作，是构建神经网络的模块。在其他深度学习框架中也被称为层。

