### Tensor 张量

In [25]:
import pandas as pd
import torch
import numpy as np

In [26]:
#  torch.Tensor 默认的是 torch.FloatTensor 数据类型
a = torch.Tensor([[2,3],[4,8],[7,9]])
print(f'a is:\n{a}')

a is:
tensor([[2., 3.],
        [4., 8.],
        [7., 9.]])


In [27]:
print(a.size())

torch.Size([3, 2])


In [28]:
# 自定义数据类型(64位整数)
b = torch.LongTensor([[2,3],[4,8],[7,9]])
print(b)

tensor([[2, 3],
        [4, 8],
        [7, 9]])


In [29]:
# 全是0的Tensor
c = torch.zeros((3,2))
print(c)

tensor([[0., 0.],
        [0., 0.],
        [0., 0.]])


In [30]:
# 正态分布作为随机值
d = torch.randn((3,2))
print(d)

tensor([[-1.3333, -0.0922],
        [ 0.8387,  0.6334],
        [-0.1649,  0.3342]])


In [31]:
# 可以像 numpy 一样通过索引的方式取得其中的元素，同时也可以改变它的值
print(a)

tensor([[2., 3.],
        [4., 8.],
        [7., 9.]])


In [32]:
a[0,1] = 100
print(a)

tensor([[  2., 100.],
        [  4.,   8.],
        [  7.,   9.]])


In [33]:
# Tensor numpy 相互转换
numpy_b = b.numpy()
print(b)
print(numpy_b)

tensor([[2, 3],
        [4, 8],
        [7, 9]])
[[2 3]
 [4 8]
 [7 9]]


In [34]:
e = np.array([[2,3],[4,5]])
torch_e = torch.from_numpy(e)
print(torch_e)

tensor([[2, 3],
        [4, 5]], dtype=torch.int32)


In [35]:
# 将e转换为float tensor
print(torch_e.float())

tensor([[2., 3.],
        [4., 5.]])


In [36]:
# 判断是否支持GPU
print(torch.cuda.is_available())

True


In [37]:
# 将tensor a 放到gpu 上只需：
a.cuda()

tensor([[  2., 100.],
        [  4.,   8.],
        [  7.,   9.]], device='cuda:0')

### Variable
- 构建variable. 要注意得传入一个参数 requires_grad=True ,表示是否对这个变量求梯度，默认的是 False 

- 在 numpy 里面没有,神经网络计算中特有的一个概念
- 就是variable提供了自动求导的功能
- 神经网络在做运算的时候需要先构造一个计算图谱， 然后在里面进行前向传播和反向传播
- Variable 和 Tensor 本质上没有区别，不过 Variable 会被放入一个汁算图中，然后进 行前向传播，反向传播，自动求导
- Variable 是在 torch.autograd.Variable 中
- 想让一个 tensor a 变成 Variable，只需要 Variable(a) 就可以

- variable属性
    - data: 可以取出 Variable 里面的 tensor 数值
    - grad: 是这个 Variabel 的反向传播梯度
    - grad_fn: 得到这个 Variable 的操作,比如通过加减还是乘除来得到的




In [38]:
import torch.autograd.variable as va

In [47]:
# 创建Variable
x = va(torch.Tensor([1]),requires_grad = True)
w = va(torch.Tensor([2]),requires_grad = True)
b = va(torch.Tensor([3]),requires_grad = True)

  return torch.tensor(*args, **kwargs)


In [49]:
# build a computational graph
y = w * x + b

In [50]:
# compute gradients
# 自动求导
y.backward()

In [42]:
# print out the gradients
# 通过 x.grad 可以得到 x 的梯度
print(x.grad)
print(w.grad)
print(b.grad)

tensor([2.])
tensor([1.])
tensor([1.])


In [43]:
# 矩阵求导
x = torch.randn(3)
print(x)
x = va(x,requires_grad=True)
y = x ** 2
print(y)

tensor([-1.2049,  0.5051, -0.7025])
tensor([1.4519, 0.2551, 0.4936], grad_fn=<PowBackward0>)


  return torch.tensor(*args, **kwargs)


In [44]:
#  y.backward(torch.FloatTensor [1，1， 1 ]) 这样得到的 结果就是它们每个分量的梯度
#  y.backward(torch.FloatTensor( [1， 0.1 ， 0. 01] )) ，这样得到的梯度就是它们原本的梯度分别乘上 1 ， 0.1 和 0.01
y.backward(torch.FloatTensor([1,1,1]))
print(x.grad)

tensor([-2.4099,  1.0102, -1.4051])


### 数据集（Dataset）
在处理任何机器学习问题之前都需要数据读取，并进行预处理，Pytorch 提供了很多工具使得读取和处理很容易

- torch.utils.data.Dataset 是代表这一数据的抽象类
- 可以自定义你的数 据类继承和重写这个抽象类，非常简单，只需要定义 len一和_getitem一这两个 函数

In [45]:
# import torch.utils.data.dataset as Da
class myDataset(Dataset):
    def __init__(self,csv_file,txt_file,root_dir,other_file):
        self.csv_data = pd.read_csv(csv_file)
        with open(txt_file,'r') as f:
            data_list = f.readlines()
        self.txt_data = data_list
        self.root_dir = root_dir
        
    def __len__(self):
        return len(self.csv_data)
    
    def __getitem__(self,idx):
        data = (self.csv_data[idx],self.txt_data[idx])
        return data
# 通过上面的方式可以通过迭代的方式来获取数据

NameError: name 'Dataset' is not defined

In [None]:
# torchvision 包中有关于计算机视觉的数据读取类 ImageFolder，主要功能是处理图片，并且要求图片存放形式

nn.Module(模组）

In [None]:
class net_name(nn.Module):
    def __init__(self,other_arguments):
        super(net_name,self).__init__()
        self.conv1 = nn.Conv2d(in_channels,out_channels,kernel_size)
        # other network layer
    def forward(self,x):
        x = self.conv1(x)
        return x