# pytorch入门第一步

## 1、tensor

tensor 是高维向量，以下通过几个例子理解tensor

In [1]:
# 创建一个空的tensor
import torch as t
x = t.Tensor(5,3)

In [2]:
x

tensor([[9.9184e-39, 9.0000e-39, 1.0561e-38],
        [1.0653e-38, 4.1327e-39, 8.9082e-39],
        [9.8265e-39, 9.4592e-39, 1.0561e-38],
        [1.0653e-38, 1.0469e-38, 9.5510e-39],
        [9.1837e-39, 1.0561e-38, 1.0469e-38]])

In [3]:
# 为这个空的tensor赋值
x = t.rand(5,3)
x

tensor([[0.1164, 0.1933, 0.2574],
        [0.7859, 0.9826, 0.8999],
        [0.5901, 0.3190, 0.5984],
        [0.7702, 0.0878, 0.6523],
        [0.0921, 0.6700, 0.8237]])

In [4]:
print(x.size())# 查看tensor的形状

torch.Size([5, 3])


In [5]:
#查看行数
print(x.size()[0])

#查看列数
print(x.size(1))

5
3


In [6]:
#定义另一个tensor
y = t.rand(5,3)
y

tensor([[0.8965, 0.3191, 0.2819],
        [0.0410, 0.0182, 0.0821],
        [0.3496, 0.7055, 0.0169],
        [0.9357, 0.1216, 0.3955],
        [0.3384, 0.7187, 0.8725]])

In [7]:
#基本加减法运算
x + y

tensor([[1.0129, 0.5125, 0.5393],
        [0.8269, 1.0008, 0.9820],
        [0.9397, 1.0246, 0.6153],
        [1.7059, 0.2094, 1.0478],
        [0.4304, 1.3887, 1.6962]])

In [8]:
#另外一种形式的加法
t.add(x,y)

tensor([[1.0129, 0.5125, 0.5393],
        [0.8269, 1.0008, 0.9820],
        [0.9397, 1.0246, 0.6153],
        [1.7059, 0.2094, 1.0478],
        [0.4304, 1.3887, 1.6962]])

In [9]:
#第三种形式的加法

#预先分配好空间
result = t.Tensor(5,3)
t.add(x,y,out = result)
result

tensor([[1.0129, 0.5125, 0.5393],
        [0.8269, 1.0008, 0.9820],
        [0.9397, 1.0246, 0.6153],
        [1.7059, 0.2094, 1.0478],
        [0.4304, 1.3887, 1.6962]])

In [10]:
print('原始的x:',x)

#还有一种是
x.add(y)
print('第一次加法的x:',x)

#这一种的加法，也就是方法名带下划线的加法，是会将得到的值重新写入到x中，改变x原来的值
x.add_(y)
print('第二次加法的x:',x)

原始的x: tensor([[0.1164, 0.1933, 0.2574],
        [0.7859, 0.9826, 0.8999],
        [0.5901, 0.3190, 0.5984],
        [0.7702, 0.0878, 0.6523],
        [0.0921, 0.6700, 0.8237]])
第一次加法的x: tensor([[0.1164, 0.1933, 0.2574],
        [0.7859, 0.9826, 0.8999],
        [0.5901, 0.3190, 0.5984],
        [0.7702, 0.0878, 0.6523],
        [0.0921, 0.6700, 0.8237]])
第二次加法的x: tensor([[1.0129, 0.5125, 0.5393],
        [0.8269, 1.0008, 0.9820],
        [0.9397, 1.0246, 0.6153],
        [1.7059, 0.2094, 1.0478],
        [0.4304, 1.3887, 1.6962]])


# 2、Tensor和numpy之间的互相操作

In [11]:
#定义一个新的tensor
a = t.ones(5)
a

tensor([1., 1., 1., 1., 1.])

In [12]:
#将a转换成numpy形式
b = a.numpy()
b

array([1., 1., 1., 1., 1.], dtype=float32)

In [14]:
import numpy as np
#用numpy 定义一个新的array
a = np.ones(5)
print(a)

#将numpy形式的array转成tensor
b = t.from_numpy(a)
print(b)


[1. 1. 1. 1. 1.]
tensor([1., 1., 1., 1., 1.], dtype=torch.float64)


### tensor 和 numpy之间共享内存

In [15]:
#采用 _ 形式的方法，改变自身
print('原来的a:',a)
print('原来的b:',b)

#这里仅用b改变自身，但是由于tensor 和 numpy共享内存，所以另一个由a转成b的b改变了，原来的a 也将随之改变
b.add_(1)
print('加1之后的a:',a)
print('加1之后的b:',b)

原来的a: [1. 1. 1. 1. 1.]
原来的b: tensor([1., 1., 1., 1., 1.], dtype=torch.float64)
加1之后的a: [2. 2. 2. 2. 2.]
加1之后的b: tensor([2., 2., 2., 2., 2.], dtype=torch.float64)


### tensor使用.cuda()形式来转成gpu计算

In [16]:
if t.cuda.is_available():
    print('本电脑支持gpu运算')
    x = x.cuda()
    y = y.cuda()
    x + y

gpu支持


## 3、Autograd()自动微分

In [1]:
import torch as t
from torch.autograd import Variable

In [2]:
#定义一个Variable 单位矩阵
x = Variable(t.ones(2,2),requires_grad = True)
x

tensor([[1., 1.],
        [1., 1.]], requires_grad=True)

In [3]:
#对单位矩阵进行求和运算，得到的还是Variable形式
y = x.sum()
y

tensor(4., grad_fn=<SumBackward0>)

In [4]:
#这个
y.grad_fn

<SumBackward0 at 0x1c39126bcc0>

In [5]:
#可以把y看作是一个定义在x上的函数表达式，这里对y进行反向传播梯度计算
y.backward()

In [6]:
#然后将x的值带入进去，得到最终的梯度导数
x.grad

tensor([[1., 1.],
        [1., 1.]])

In [7]:
#反向传播的梯度是累加的，每次在训练神经网络时候需要对梯度进行清零
print('第二次再次计算梯度：')
y.backward()
x.grad

tensor([[2., 2.],
        [2., 2.]])

In [8]:
print('第三次再次计算梯度：')
y.backward()
x.grad

第三次再次计算梯度：


tensor([[3., 3.],
        [3., 3.]])

In [9]:
#重新改变x.grad的值，也就是之前求的x的梯度的data
x.grad.data.zero_()

tensor([[0., 0.],
        [0., 0.]])

### Variable和Tensor之间有接口，可以相互转换

In [23]:
#定义一个Variable
x = Variable(t.ones(4,5),requires_grad = True)#这里相当于将tensor转换成Variable
#定义一个在x上的函数
y = t.mean(x)

print(x)
#求导
y.backward()
print('x_grad:')
x.grad

x_tensor_cos = t.mean(x.data)
print(y)
print(x_tensor_cos)

tensor([[1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.]], requires_grad=True)
x_grad:
tensor(1., grad_fn=<MeanBackward0>)
tensor(1.)


## 4、神经网络

In [24]:
import torch.nn as nn
import torch.nn.functional as F

In [26]:
#搭建一个简单的神经网络
class Net(nn.Module):
    def __init__(self):
        super(Net,self).__init__()
        
        #定义卷积层，这里的参数和keras里面的参数不一致，1表示输入通道，6表示输出通道，5表示5*5的卷积核
        self.conv1 = nn.Conv2d(1,6,5)
        self.conv2 = nn.Conv2d(6,16,5)
        
        #定义全连接层，16*5*5，将前面的卷积层得到的图像进行拉平
        self.fc1 = nn.Linear(16*5*5, 120)
        self.fc2 = nn.Linear(120,84)
        self.fc3 = nn.Linear(84,10)
        
    def forward(self ,x):
        #第一次计算，卷积+激活函数
        x = F.max_pool2d(F.relu(self.conv1(x)),(2,2))
        x = F.max_pool2d(F.relu(self.conv2(x)),2)
        
        #全连接层
        x = x.view(x.size()[0],-1)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

net = Net()
print(net)

Net(
  (conv1): Conv2d(1, 6, kernel_size=(5, 5), stride=(1, 1))
  (conv2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))
  (fc1): Linear(in_features=400, out_features=120, bias=True)
  (fc2): Linear(in_features=120, out_features=84, bias=True)
  (fc3): Linear(in_features=84, out_features=10, bias=True)
)


In [29]:
#返回学习参数
params = list(net.parameters())
print(len(params))

10


In [31]:
for name,parameters in net.named_parameters():
    print(name,':',parameters.size())

conv1.weight : torch.Size([6, 1, 5, 5])
conv1.bias : torch.Size([6])
conv2.weight : torch.Size([16, 6, 5, 5])
conv2.bias : torch.Size([16])
fc1.weight : torch.Size([120, 400])
fc1.bias : torch.Size([120])
fc2.weight : torch.Size([84, 120])
fc2.bias : torch.Size([84])
fc3.weight : torch.Size([10, 84])
fc3.bias : torch.Size([10])


### 只有Variable有自动求导的功能，tensor需要提前封装成Variable

In [34]:
#这个input可以看作是一张黑白的32*32的单张图像数据
input = Variable(t.randn(1,1,32,32))
print(input)

#将数据丢入神经网络中，得到一个长度为10的数组，其中长度10表示我们之前定义的需要预测10个数字
out = net(input)
out.size()

tensor([[[[ 0.6061,  0.2402, -0.9197,  ...,  0.6496,  0.4290,  0.0495],
          [ 0.2581, -0.6281,  0.9362,  ..., -1.1375,  0.7761,  1.0967],
          [-0.8418,  0.0965, -0.5410,  ...,  0.4317, -0.9814, -0.2231],
          ...,
          [ 0.9971, -1.4284,  0.4164,  ..., -0.9707,  0.5338,  0.6664],
          [-0.9284,  1.2209, -0.5715,  ..., -1.0020,  0.1953,  0.1462],
          [ 0.6149, -0.0157,  1.7840,  ...,  0.1128, -0.6761, -0.3168]]]])


torch.Size([1, 10])

In [35]:
net.zero_grad()
out.backward(Variable(t.ones(1,10)))

In [42]:
output = net(input)
print('预测值:',output)
target = Variable(t.arange(0,10,1.))
print('真实值:',target)

#定义损失函数
criterion = nn.MSELoss()
loss = criterion(output,target)

print('计算得到的均方差误差为：')
loss


预测值: tensor([[-0.1325, -0.0593,  0.0214, -0.0895,  0.0529, -0.0673,  0.0426, -0.0554,
          0.1026, -0.0714]], grad_fn=<AddmmBackward>)
真实值: tensor([0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])


  return F.mse_loss(input, target, reduction=self.reduction)


计算得到的均方差误差为：


tensor(28.5785, grad_fn=<MseLossBackward>)

In [39]:
#将网络中的梯度清零
net.zero_grad()

#第一层卷积层的输出有6个通道，查看第一层卷积中的偏差值
print('反向传播之前的conv1.bais的梯度')
print(net.conv1.bias.grad)
loss.backward()

print('反向传播之后的conv1.bais的梯度')
print(net.conv1.bias.grad)


反向传播之前的conv1.bais的梯度
tensor([0., 0., 0., 0., 0., 0.])
反向传播之后的conv1.bais的梯度
tensor([ 0.0605, -0.0511, -0.0184, -0.0131,  0.0552,  0.0260])


## 5、优化器

In [43]:
import torch.optim as optim 

In [44]:
optimizer = optim.SGD(net.parameters(),lr = 0.01)

#训练过程中梯度清零
optimizer.zero_grad()
output = net(input)
loss = criterion(output,target)

#反向传播计算梯度，利用得到的梯度，再选择优化器，相当于人在一个山坡上，梯度相当于计算得到了这个坡度，但是还是需要人去选择怎么走
loss.backward()
optimizer.step()

  return F.mse_loss(input, target, reduction=self.reduction)


## 以上便是关于pytorch入门级的一些常用的方法和怎么实现一个神经网络