In [None]:
import torch
torch.__version__

In [None]:
torch.cuda.is_available()

# Numpy

In [None]:
# Numpy提供多维度的数组对象，以及针对数组对象的各种快速操作，例如排序、变换、选择等
import numpy as np

## 基本操作 

### 数组创建

In [None]:
# 创建一维、二维和三维数组
arr_1_d = np.asarray([1])
print("arr_1_d=", arr_1_d)
print(arr_1_d[0])

arr_2_d = np.asarray([[1, 2], [3, 4]])
print("arr_2_d=", arr_2_d)
print(arr_2_d[0][0])

arr_3_d = np.asanyarray([[[1], [2]], [[3], [4]], [[5], [6]]])
print("arr_3_d=", arr_3_d)
print(arr_3_d[0][0][0])

# 0、1数组
arr_ones = np.ones(shape=(2,3), dtype='float')
print("arr_ones=", arr_ones)

arr_zeros = np.zeros(shape=(1,2,3), dtype='int')
print("arr_zeros=", arr_zeros)

# np.array() 属于深拷贝，np.asarray() 则是浅拷贝
copy_arr = np.array(arr_1_d)
copy_arr[0] = 100
print(copy_arr[0])
print(arr_1_d[0])

In [None]:
# 其他数组创建方式
arr_arange = np.arange(0, 10, 2)
print(arr_arange)

arr_linspace = np.linspace(start=0, stop=10, num=30)
print(arr_linspace)

### 数组基本属性

In [None]:
# 数组维度
print(arr_1_d.ndim)
print(arr_2_d.ndim)

# 数组的形状
print(arr_1_d.shape)
print(arr_2_d.shape)

# 元素总数
print(arr_1_d.size)
print(arr_2_d.size)

# 数组所属的数据类型
print(arr_2_d.dtype)

In [None]:
# 数组的轴
test_axis = np.random.randint(10, size=(4,3,2))
print(test_axis)

###  数组基本操作

In [None]:
# 数组的操作
print(np.sum(test_axis, axis=0))
print(np.max(test_axis, axis=0))
print(np.min(test_axis, axis=0))
print(np.mean(test_axis, axis=0))
print(np.argmin(test_axis, axis=0))

## 深度学习相关操作 

| 函数名     | 关键功能     | 使用要点     |
| -------- | -------- | -------- |
| view() | 浅拷贝，用来获取与原数组共享数据的数组 | 只共享数据，无法共享形状；例如原数组1*6，新数组可以是2*3|
| copy() | 深度拷贝 | 不共享数据，修改新数组不会影响原数组 |
| concatenate() | 多个数组拼接 | 注意沿着哪个轴进行 |
| argmax() | 返回具有最大值的索引 |  |
| argsort() | 对原数组排序，返回对应的索引 |  |

### 图片数据加载 

In [None]:
from PIL import Image
im = Image.open('.\source\jikeshijian_logo.png')
im.size

In [None]:
import numpy as np
im_pillow = np.asarray(im)
im_pillow.shape

In [None]:
"""
R、G、B三通道显示图片
"""
im_pillow_c1 = im_pillow[:, :, 0]
im_pillow_c2 = im_pillow[:, :, 1]
im_pillow_c3 = im_pillow[:, :, 2]

# 二维变三维
im_pillow_c1 = im_pillow_c1[:, :, np.newaxis]
im_pillow_c2 = im_pillow_c2[:, :, np.newaxis]
im_pillow_c3 = im_pillow_c3[:, :, np.newaxis]

zeros = np.zeros((im_pillow.shape[0], im_pillow.shape[1], 1))

im_pillow_c1_3ch = np.concatenate((im_pillow_c1, zeros, zeros), axis=2)
im_pillow_c2_3ch = np.concatenate((zeros,im_pillow_c2, zeros), axis=2)
im_pillow_c3_3ch = np.concatenate((zeros, zeros, im_pillow_c3), axis=2)

# 绘图
from matplotlib import pyplot as plt
plt.subplot(2, 2, 1)
plt.title('Origin Image')
plt.imshow(im_pillow)
plt.axis('off')

plt.subplot(2, 2, 2)
plt.title('Red Channel')
plt.imshow(im_pillow_c1_3ch.astype(np.uint8))

plt.subplot(2, 2, 3)
plt.title('Green Channel')
plt.imshow(im_pillow_c2_3ch.astype(np.uint8))

plt.subplot(2, 2, 4)
plt.title('Blue Channel')
plt.imshow(im_pillow_c3_3ch.astype(np.uint8))

In [None]:
"""
R、G、B三通道显示图片，方法二
"""
from PIL import Image
import numpy as np
im=Image.open('.\source\jikeshijian_logo.png').convert('RGB')
print(im.size)
print(type(im))
im_pillow=np.array(im)
 
im_pillow_1_3ch=np.array(im)
im_pillow_1_3ch[:, :, 1:]=0 
print(im_pillow_1_3ch.shape)
 
im_pillow_2_3ch=np.array(im)
im_pillow_2_3ch[:, :, [0,2]]=0
print(im_pillow_2_3ch.shape)
 
im_pillow_3_3ch=np.array(im)
im_pillow_3_3ch[:, :, :2]=0
print(im_pillow_3_3ch.shape)
 
from matplotlib import pyplot as plt
plt.subplot(2, 2, 1)
plt.title('Origin Image')
plt.imshow(im_pillow)
plt.axis('off')
plt.subplot(2, 2, 2)
plt.title('Red Channel')
plt.imshow(im_pillow_1_3ch.astype(np.uint8))
plt.axis('off')
plt.subplot(2, 2, 3)
plt.title('Green Channel')
plt.imshow(im_pillow_2_3ch.astype(np.uint8))
plt.axis('off')
plt.subplot(2, 2, 4)
plt.title('Blue Channel')
plt.imshow(im_pillow_3_3ch.astype(np.uint8))
plt.axis('off')
plt.savefig('./rgb_pillow.png', dpi=150)

### 模型评估

In [None]:
probs = np.array([0.075, 0.15, 0.075, 0.15, 0.0, 0.05, 0.05, 0.2, 0.25])
# np.argsort 对原数组进行从小到大的排序，返回的是对应元素在原数组中的索引
probs_idx_sort = np.argsort(-probs) #注意，加了负号，是按降序排序
print(probs_idx_sort)
print(probs_idx_sort[:3])
max_idx = np.argmax(probs)
print(max_idx)

# Tensor用法

## 创建

**直接创建**

torch.tensor(data, dtype=None, device=None,requires_grad=False)

data：就是要传入模型的数据。PyTorch 支持通过list、 tuple、numpy array、scalar 等多种类型进行数据传入，并转换为 tensor。

dtype：它声明了你需要返回一个怎样类型的 Tensor，具体类型可以参考前面表格里列举的 Tensor 的 8 种类型。

device：这个参数指定了数据要返回到的设备，目前暂时不需要关注，缺省即可。

requires_grad，用于说明当前量是否需要在计算中保留对应的梯度信息。在 PyTorch 中，只有当一个 Tensor 设置 requires_grad 为 True 的情况下，才会对这个 Tensor 以及由这个 Tensor 计算出来的其他 Tensor 进行求导，然后将导数值存在Tensor 的 grad 属性中，便于优化器来更新参数。所以，你需要注意的是，把 requires_grad 设置成 true 或者 false 要灵活处理。如果是训练过程就要设置为 true，目的是方便求导、更新参数。而到了验证或者测试过程，我们的目的是检查当前模型的泛化能力，那就要把 requires_grad 设置成 Fasle，避免这个参数根据 loss 自动更新。

**从Numpy中创建**

torch.from_numpy(ndarry)

创建零矩阵 Tensor：零矩阵顾名思义，就是所有的元素都为 0 的矩阵。
torch.zeros(*size, dtype=None...)
size 定义输出张量形状的整数序列，其它参数暂时忽略

创建单位矩阵 Tensor：单位矩阵是指主对角线上的元素都为 1 的矩阵
torch.eye(size, dtype=None...)

创建全一矩阵 Tensor：全一矩阵顾名思义，就是所有的元素都为 1 的矩阵
torch.ones(size, dtype=None...)

创建随机矩阵 Tensor：在 PyTorch 中有几种较为经常使用的随机矩阵创建方式，分别如下
torch.rand(size)
torch.randn(size)
torch.normal(size, mean, std)
torch.randint(low, high, size）

torch.rand 用于生成数据类型为浮点型且维度指定的随机 Tensor，随机生成的浮点数据在 0~1 区间均匀分布。
torch.randn 用于生成数据类型为浮点型且维度指定的随机 Tensor，随机生成的浮点数的取值满足均值为 0、方差为 1 的标准正态分布。
torch.normal 用于生成数据类型为浮点型且维度指定的随机 Tensor，可以指定均值和标准差。
torch.randint 用于生成随机整数的 Tensor，其内部填充的是在[low,high) 均匀生成的随机整数。

## 转换

In [None]:
# Int 与 Tensor转换
a = torch.Tensor(1)
b = a.item()
print(a)
print(b)

In [None]:
# list 与 tensor 的转换
a = [1, 2, 3]
b = torch.Tensor(a)
c = b.numpy().tolist()
print("a:{}".format(a))
print("b:{}".format(b))
print("c:{}".format(c))

In [None]:
# NumPy 与 Tensor 的转换
import numpy as np
import torch
a=np.array((2,2))
b=torch.Tensor(a)
c=np.array(b)
print("a:{}".format(a))
print("b:{}".format(b))
print("c:{}".format(c))

In [None]:
# CPU 与 GPU 的 Tensor 之间的转换
CPU->GPU: data.cuda()
GPU->CPU: data.cpu()

## 常见操作

In [None]:
# 获取形状
import torch
a=torch.zeros(2, 3, 5)
print(a.shape)
print(a.size())
# 元素数量
print(a.numel())

In [None]:
# 矩阵转秩 (维度转换）

# permute 函数可以对任意高维矩阵进行转置
import torch
x = torch.rand(2,3,5)
print("x变换前的形状:{}".format(x.shape))
x = x.permute(2,1,0)
print("x变换后的形状:{}".format(x.shape))

# transpose函数，不同于 permute，它每次只能转换两个维度，或者说交换两个维度的数据
import torch
x = torch.rand(2,3,5)
print("x变换前的形状:{}".format(x.shape))
x = x.transpose(1,0)
print("x变换后的形状:{}".format(x.shape))

In [None]:
# 形状变换

# view
import torch
x = torch.randn(4, 4)
print("x变形前的形状:{}".format(x.shape))
x = x.view(2,8)
print("x变形后的形状:{}".format(x.shape))
x = x.permute(1,0)
print("x维度转换后的形状:{}".format(x.shape))
x=x.view(4, 4)

"""
结合代码可以看到，利用 permute，我们将第 0 和第 1 维度的数据进行了变换，得到了[8, 2]形状的 Tensor，在这个新 Tensor 上进行 view 操作，忽然就报错了，为什么呢？

原因一：permute会让数据不连续

原因二：view 不能处理内存不连续 Tensor 的结构。

"""

In [None]:
# reshape（可以处理不连续数据，接着上面案例写）
# reshape 相当于进行了两步操作，先把 Tensor 在内存中捋顺了，然后再进行 view 操作。

import torch
x = torch.randn(4, 4)
print("x变形前的形状:{}".format(x.shape))
x = x.view(2,8)
print("x变形后的形状:{}".format(x.shape))
x = x.permute(1,0)
print("x维度转换后的形状:{}".format(x.shape))
x=x.reshape(4, 4)
print("x reshape变形后的形状:{}".format(x.shape))

In [None]:
# 增减维度（在numpy讲解中有提到过，对应的是newaxis）

# squeeze()
# 如果 dim 指定的维度的值为 1，则将该维度删除，若指定的维度值不为 1，则返回原来的 Tensor
# 核心：这样的效果就是数据不会少，只是降维，从立体变成了平面。如果有一维他不是1个行/1个列/1个通道，从数据看就不是一个平面了，不好降维。

import torch
x = torch.rand(2,1,3)
print(x.shape)
y = x.squeeze(1)
print(y.shape)
z = y.squeeze(1)
print(z.shape)

In [None]:
# unsqueeze()：这个函数主要是对数据维度进行扩充。给指定位置加上维数为 1 的维度，同样结合代码例子来看看
import torch
x = torch.rand(2,1,3)
print(x.shape)
y = x.unsqueeze(2)
print(y.shape)

## Tensor连接

在项目开发中，深度学习某一层神经元的数据可能有多个不同的来源，那么就需要将数据进行组合，这个组合的操作，我们称之为连接。

In [None]:
"""
cat--在已有的维度上进行连接
cat 是 concatnate的意思，也就是拼接、联系的意思。
第一个参数是tensors：它很好理解，就是若干个我们准备进行拼接的 Tensor。
第二个参数是dim：指定在哪个维度上进行拼接。通俗讲假如有2个盒子，合并之后是想要改变它的宽度还是高度/厚度。
torch.cat(tensors, dim = 0, out = None)

"""

In [None]:
import torch
A=torch.ones(3,3)       # 3行3列
B=2*torch.ones(3,3)     # 3行3列
print(A)
print(B)


# 测试dim=0(0维，代表的是行的方向
C=torch.cat((A,B),0)
print(C.shape)
print(C)


# 测试dim=1（1维，代表列的方向）
D=torch.cat((A,B),1)
print(D.shape)
print(D)

In [None]:
import torch
A=torch.ones(2,2,2)
B=2*torch.ones(2,2,2)
print(A.shape)
print(B.shape)

# 测试dim=0(0维，代表的是行的方向，盒子的高度方向)
C=torch.cat((A,B),0)
print(C.shape)
print(C)


In [None]:
"""
stack--增加新的维度进行连接
torch.stack(inputs, dim=0)
解释：inputs 表示需要拼接的 Tensor，dim 表示新建立维度的方向
"""

In [None]:
A=torch.arange(0,4)
B=torch.arange(5,9)
print(A)
print(B)

# 测试dim=0(0维，代表的是行的方向)
C=torch.stack((A,B),0)
print(C)

# 测试dim=1(1维，代表的是列的方向)
D=torch.stack((A,B),1)
print(D.shape)
print(D)

"""
结论：从1维向量，变成2维矩阵；其实是先把向量变成矩阵再合并；不是变成了1行8列，而是4行2列。dim=x维度，潜在告诉向量数据怎么预排列。 同理对于2维变成3维。

"""

## Tensor 切分

切分操作有很多种，下面介绍其中三种类型：chunk、split、unbind

In [None]:
"""
chunk --chunk 的作用就是将 Tensor 按照声明的 dim，切成几个块
torch.chunk(input, chunks, dim=0)
input：它表示要做 chunk 操作的 Tensor。
chunks：它代表将要被划分的块的数量，而不是每组的数量。请注意，chunks 必须是整型。
dim：按照哪个维度来进行 chunk。
"""

In [None]:
import torch
A=torch.tensor([1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17])
B = torch.chunk(A, 4, 0)
print(B)

A=torch.ones(4,4)
B = torch.chunk(A, 2, 0)
print(B[0])
print(B[1])

In [None]:
"""
split --作用就是将 Tensor 按照声明的 dim切块，预先给定每块大小
torch.split(tensor, split_size_or_sections, dim=0)

tensor：也就是待切分的 Tensor
split_size_or_sections：当它为整数时，表示将 tensor 按照每块大小为这个整数的数值来切割；当这个参数为列表时，则表示将此 tensor 切成和列表中元素一样大小的块。
dim：定义了要按哪个维度切分

"""

In [None]:
import torch
A=torch.rand(5,4)
print(A)
B=torch.split(A, 2, 0)
print(B)

A=torch.rand(5,4)
print(A)
B=torch.split(A,(2,3),0)
print(B)

In [None]:
"""
unbind --降维切分
torch.unbind(input, dim=0)
"""

In [None]:
import torch
A=torch.arange(0,16).view(4,4)
print(A)
b=torch.unbind(A, 0)
print(b)

A=torch.arange(0,16).view(4,4)
print(A)
b=torch.unbind(A, 1)
print(b)

## Tensor索引

索引操作有很多方式，有提供好现成 API 的，也有用户自行定制的操作，其中最常用的两个操作就是 index_select 和 masked_select

In [None]:
"""
index_select --基于给定的索引来进行数据提取
torch.index_select(tensor, dim, index)
index：是 torch.Tensor 类型
"""

In [None]:
import torch
A=torch.arange(0,16).view(4,4)
print('A',A)
B=torch.index_select(A,0,torch.tensor([1,3]))
print('B',B)
C=torch.index_select(A,1,torch.tensor([0,3]))
print('C',C)

In [None]:
"""
masked_select --通过一些判断条件来进行选择
torch.masked_select(input, mask, out=None) 
input: 表示待处理的 Tensor。
mask: 代表掩码张量，也就是满足条件的特征掩码。这里你需要注意的是，mask 须跟 input 张量有相同数量的元素数目，但形状或维度不需要相同
"""

In [None]:
import torch
A=torch.rand(5)
print(A)

B=A>0.3
print(B)

C=torch.masked_select(A, B)
print(C)

In [None]:
A=torch.rand(5)
C=torch.masked_select(A, A>0.3)
print('A',A)
print('C',C)

## 总结

Tensor 之间的连接操作：cat(已有维度)，stack(新增维度)

Tensor 内部的切分操作: chunck(输入要切几块)，split(输入每块有几个元素)，unbind（降维）

Tensor基于索引或者筛选条件的数据选择操作:index_select,maked_select