In [10]:
import torch as t
import numpy as np

一般 ML/DL 一开始都需要数据预处理，将原始数据变成张量。

而且可以利用 `t.cuda()` 将张量复制到 `GPU` 上运算

接下来提到的都是 `pytorch` 提供的张量类。

# 三个属性，可以知晓

同时两个张量之间的运算，要保持 `dtype，device` 一致。

不过在 1.3 已经可以整形和浮点型运算了。还是看文档靠谱

In [27]:
print(t.device('cuda:0'))
print(t1.layout)
print(t1.dtype)

cuda:0
torch.strided
torch.float32


# 用 data 创建张量

用 python 的 list 也可以创阿金，但是用 numpy.ndarray 偏多。

In [29]:
data = np.array([1, 2, 3])
type(data)

numpy.ndarray

In [30]:
t1 = t.Tensor(data) # 构造函数
t2 = t.tensor(data) # 工厂方法函数
t3 = t.as_tensor(data) # 工厂方法函数
t4 = t.from_numpy(data) # 工厂方法函数
print(t1)
print(t2)
print(t3)
print(t4)

tensor([1., 2., 3.])
tensor([1, 2, 3], dtype=torch.int32)
tensor([1, 2, 3], dtype=torch.int32)
tensor([1, 2, 3], dtype=torch.int32)


# 不用 data 创建

In [33]:
t.eye(2) #创建对角矩阵，

tensor([[1., 0.],
        [0., 1.]])

In [35]:
t.zeros(2, 2) # 创建 0 矩阵，参数为每个轴上的长度
t.zeros([2, 2])

tensor([[0., 0.],
        [0., 0.]])

In [37]:
t.rand(2, 2)

tensor([[0.9643, 0.1530],
        [0.3676, 0.7016]])

In [14]:
t.ones(2, 2)

tensor([[1., 1.],
        [1., 1.]])

`pytorch` 的 `dtype` 会根据操作系统不同而有不同的默认 `dtype`

# 张量创建的四种方法的区别

## t.Tensor(), t.tensor()

In [45]:
t1 = t.Tensor(data) # 构造函数
t2 = t.tensor(data) # 工厂方法函数
t3 = t.as_tensor(data) # 工厂方法函数
t4 = t.from_numpy(data) # 工厂方法函数
print(t1)
print(t2)
print(t3)
print(t4)
print(t.get_default_dtype()) # 获得默认 dtype

tensor([1., 2., 3.])
tensor([1, 2, 3], dtype=torch.int32)
tensor([1, 2, 3], dtype=torch.int32)
tensor([1, 2, 3], dtype=torch.int32)
torch.float32


`Tensor` 是构造方法，得到的张量会根据默认 `dtype`,也指定不了 `dtype`。

而 `t.tensor` 等其他创建方法都是工厂方法，得到的张量的数据类型根据传入的 `data` 数据类型而定。

相比之下可能工厂方法的创建方法更灵活。

## 共享内存与拷贝内存

In [47]:
print('old', data)
data[0] = 0
data[1] = 0
data[2] = 0
print('new', data)
print(t1)
print(t2)
print(t3)
print(t4)

old [1 2 3]
new [0 0 0]
tensor([1., 2., 3.])
tensor([1, 2, 3], dtype=torch.int32)
tensor([0, 0, 0], dtype=torch.int32)
tensor([0, 0, 0], dtype=torch.int32)


修改了源头数据，`as_tensor,from_numpy` 方式创建的张量的数据也被修改。

说明他们俩，都和源数据共享内存。

而 `Tensor, tensor` 方式都是拷贝内存。 

共享内存方式程序执行效率更高。但程序不复杂的时候没有必要利用这个特性。

In [49]:
l = [1, 2, 3]
t5 = t.as_tensor(l)
print(t5)
l[0] = 0
print(l)
print(t5)

tensor([1, 2, 3])
[0, 2, 3]
tensor([1, 2, 3])


`as_tensor` 方法对 `numpy.ndarray` 共享内存，不对 `python` 内建数据类型共享。例如上述例子 `list`

当然还要注意，`numpy.ndarray` 是在 CPU 上工作，如果 `as_tensor` 在 `GPU` 上，需要将 `numpy.ndarray` 拷贝到 `GPU`

所以一般说来最好的创建方式是 `tensor` 省去共享内存方式时，需要注意的数据变动，而且数据类型可以控制。