In [2]:
import torch
import numpy as np
from torch import nn,optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
import torch.nn.functional as F
import time

  from .autonotebook import tqdm as notebook_tqdm


In [52]:
def addtensor(tensor1, tensor2):
    # 计算两个张量各维度的差值
    diff_dim = tensor1.dim() - tensor2.dim()

# 在较小的张量上添加维度，以便与较大的张量匹配
    for _ in range(diff_dim):
        tensor2 = tensor2.unsqueeze(-1)

# 动态生成与较大张量相同大小的零张量
    padding = torch.zeros_like(tensor1)

# 将较小张量的值填充到零张量中
    padding[:tensor2.size(0), :tensor2.size(1), :tensor2.size(2)] = tensor2

# 相加两个张量
    result = tensor1 + padding
    return result

    

RuntimeError: The size of tensor a (2) must match the size of tensor b (3) at non-singleton dimension 0

RuntimeError: The expanded size of the tensor (2) must match the existing size (3) at non-singleton dimension 0.  Target sizes: [2, 2, 1].  Tensor sizes: [3, 2, 1]

In [58]:
#训练集
train_dataset = datasets.MNIST(root = './', train = True, transform=transforms.ToTensor(),
                              download = True)


test_dataset = datasets.MNIST(root = './', train = False, transform=transforms.ToTensor(),
                              download = True)


In [59]:
#批次大小
batch_size = 64

#装载训练集
train_loader = DataLoader(train_dataset, batch_size = batch_size,
                         shuffle=True)
#装载测试集
test_loader = DataLoader(test_dataset, batch_size = batch_size,
                         shuffle=True)

In [60]:
for i,data in enumerate(train_loader):
    inputs, labels = data
    print(inputs.shape)
    print(labels.shape)
    break

torch.Size([64, 1, 28, 28])
torch.Size([64])


![image.png](attachment:1a0f48ba-f195-4e1b-b678-8594c2e83102.png)

In [61]:
(28 - 3 + 2*2)/1 + 1

30.0

In [81]:
#定义网络结构
class Net(nn.Module):
    def __init__(self):
        super().__init__()

        #定义卷积层
        #卷积是提取特征，池化是压缩特征
        #conv的参数含义：1： 输入通道数 32： 输出通道数也就是特征图数量也就是卷积核的个数  5： 卷积核的大小  1： 步长： 2 padding
        self.conv1 = nn.Sequential(nn.Conv2d(1, 32, 5, 1, 2), nn.ReLU(), nn.MaxPool2d(2,2))
        self.conv2 = nn.Sequential(nn.Conv2d(32, 64, 5, 1, 2), nn.ReLU(), nn.MaxPool2d(2,2))
        self.fc1 = nn.Sequential(nn.Linear(64 * 7 * 7, 1000), nn.ReLU())
        self.fc2 = nn.Sequential(nn.Linear(1000, 10), nn.Softmax(dim=-1))

    def forward(self, x):
        x1 = self.conv1(x)
        # print(x1.shape)
        x2 = self.conv2(x1)
        # print(x2.shape)
        pad = nn.ZeroPad2d(padding=(5, 5, 5, 5))
        desired_size = 64
        pad_size = desired_size - x1.size(1)

# 使用 pad 函数在第二个维度上进行填充
        x1 = F.pad(x1, (0, 0, 0, 0, 0, pad_size, 0, 0), mode='constant', value=0)
        x = nn.MaxPool2d(2, 2)(x1) + x2

        x = x.view(x.size()[0], -1)
        #([64,1,28,28])-> (64,784) 在全连接层做计算的时候只能是两维的数据
        x = self.fc1(x)
        out = self.fc2(x)
        return out

In [82]:
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
LR = 0.001
#定义模型
model = Net()
model.to(device) 
#定义损失函数
cross_loss = nn.CrossEntropyLoss()
#定义优化器
optimizer = optim.Adam(model.parameters(),LR)

In [83]:
def train():
    for i, batch in enumerate(train_loader):
        #获得一个批次的数据和标签
        inputs, labels = batch
        inputs = inputs.to(device)
        labels = labels.to(device)
        #获得模型预测结果
        out = model(inputs)
        #交叉熵代价函数out(batch, C(类别的数量))，labels(batch)
        
        
        #计算loss
        loss = cross_loss(out, labels)

        #清除梯度
        optimizer.zero_grad()

        #计算梯度
        loss.backward()

        #修改权值
        optimizer.step()

def test():
    correct = 0
    for i, batch in enumerate(test_loader):
        #获得一个批次的数据和标签
        inputs, labels = batch
        inputs = inputs.to(device)
        labels = labels.to(device)
        #获得模型预测结果
        out = model(inputs)
        #获得最大值，以及最大值所在的位置
        _,predicted = torch.max(out, 1)
        #预测正确的数量
        correct += (predicted == labels).sum()
    print("正确率为：{}".format(correct.item()/len(test_dataset)))
        

In [84]:

# 开始计时
start_time = time.time()
for epoch in range(100):
    print('epoch:', epoch)
    train()
    test()
end_time = time.time()
print(end_time - start_time)

epoch: 0
正确率为：0.8744
epoch: 1
正确率为：0.9763
epoch: 2
正确率为：0.9861
epoch: 3
正确率为：0.9831
epoch: 4
正确率为：0.9861
epoch: 5
正确率为：0.9809
epoch: 6
正确率为：0.9837
epoch: 7
正确率为：0.9851
epoch: 8
正确率为：0.9886
epoch: 9
正确率为：0.9884
epoch: 10
正确率为：0.9801
epoch: 11
正确率为：0.9869
epoch: 12
正确率为：0.9863
epoch: 13
正确率为：0.9851
epoch: 14
正确率为：0.9859
epoch: 15
正确率为：0.9852
epoch: 16
正确率为：0.983
epoch: 17
正确率为：0.9878
epoch: 18
正确率为：0.9883
epoch: 19
正确率为：0.9866
epoch: 20
正确率为：0.9878
epoch: 21
正确率为：0.9821
epoch: 22
正确率为：0.9885
epoch: 23
正确率为：0.9801
epoch: 24
正确率为：0.9855
epoch: 25
正确率为：0.9886
epoch: 26
正确率为：0.975
epoch: 27
正确率为：0.9833
epoch: 28
正确率为：0.9874
epoch: 29
正确率为：0.983
epoch: 30
正确率为：0.9867
epoch: 31
正确率为：0.976
epoch: 32
正确率为：0.9779
epoch: 33
正确率为：0.9865
epoch: 34
正确率为：0.9904
epoch: 35
正确率为：0.984
epoch: 36
正确率为：0.9788
epoch: 37
正确率为：0.979
epoch: 38
正确率为：0.9839
epoch: 39
正确率为：0.9895
epoch: 40
正确率为：0.9849
epoch: 41
正确率为：0.9864
epoch: 42
正确率为：0.9861
epoch: 43
正确率为：0.9887
epoch: 44
正确率为：0.9814
epoch: 45
正确率为：0.9837
epoc

In [85]:

import torch.nn.functional as F

# 创建一个大小为 [64, 32, 14, 14] 的张量
original_tensor = torch.randn(1, 2, 3, 4)
print(original_tensor)
# 想要将大小为 32 的维度扩展为 64
desired_size = 4


# 计算需要填充的大小
pad_size = desired_size - original_tensor.size(1)

# 使用 pad 函数在第二个维度上进行填充
padded_tensor = F.pad(original_tensor, (0, 0, 0, 0, 0, pad_size, 0, 0), mode='constant', value=0)
print(padded_tensor)
print(padded_tensor.size())

tensor([[[[ 1.0813,  1.1629,  1.1445,  0.6028],
          [ 1.5265,  1.0058,  1.3815, -0.4492],
          [-1.4899, -0.3393, -1.5091, -1.5856]],

         [[-1.2626,  0.6650, -0.2153, -0.3445],
          [ 1.6187, -1.1472,  0.1937, -1.4056],
          [-0.7207, -0.3699,  1.9699,  0.1547]]]])
tensor([[[[ 1.0813,  1.1629,  1.1445,  0.6028],
          [ 1.5265,  1.0058,  1.3815, -0.4492],
          [-1.4899, -0.3393, -1.5091, -1.5856]],

         [[-1.2626,  0.6650, -0.2153, -0.3445],
          [ 1.6187, -1.1472,  0.1937, -1.4056],
          [-0.7207, -0.3699,  1.9699,  0.1547]],

         [[ 0.0000,  0.0000,  0.0000,  0.0000],
          [ 0.0000,  0.0000,  0.0000,  0.0000],
          [ 0.0000,  0.0000,  0.0000,  0.0000]],

         [[ 0.0000,  0.0000,  0.0000,  0.0000],
          [ 0.0000,  0.0000,  0.0000,  0.0000],
          [ 0.0000,  0.0000,  0.0000,  0.0000]]]])
torch.Size([1, 4, 3, 4])


In [83]:
123445 * 125689

15515678605

In [None]:
84.22844743728638