# numpy和pytorch基本操作

## 查看维度（形状）
与numpy的np.shape()类似，torch通过.shape和.size()查看维度

In [36]:
import torch
import numpy as np
a = torch.tensor([[1, 2, 3], [4, 5, 6]])
print(a.shape)
print(a.size())
print(np.shape(a))

torch.Size([2, 3])
torch.Size([2, 3])
torch.Size([2, 3])


In [34]:
# 另外，还可以获取其中的某一维度
print(a.shape[0])
print(a.shape[1])
print(a.size(0))
print(a.size(1))

2
3
2
3


## numpy拼接

In [25]:
# append 可以拼接两个数组、或数组和值，但是效率低一些
import numpy as np
a = np.array([[1,2,3],[3,2,1]])
b = np.array([[1,2,3], [4,5,6]])
print(np.append(a,b))
print('\n')
print(np.append(a,b,axis=0 ))
print('\n')
print(np.append(a,b,axis=1 ))

[1 2 3 3 2 1 1 2 3 4 5 6]


[[1 2 3]
 [3 2 1]
 [1 2 3]
 [4 5 6]]


[[1 2 3 1 2 3]
 [3 2 1 4 5 6]]


In [29]:
# concatenate 只能拼接维度相同的数组（可以是多个），但是大规模效率更高
print(np.concatenate((a,b)))
print('\n')
print(np.concatenate((a,b),axis=0) )
print('\n')
print(np.concatenate((a,b),axis=1) )

[[1 2 3]
 [3 2 1]
 [1 2 3]
 [4 5 6]]


[[1 2 3]
 [3 2 1]
 [1 2 3]
 [4 5 6]]


[[1 2 3 1 2 3]
 [3 2 1 4 5 6]]


In [32]:
# stack 加维度的拼接
# 此处省略hstack, vstack与dstack
print( np.stack((a, b)),'\n' )# 默认增加一个维度
print( np.stack((a, b), axis=1),'\n' )
print( np.stack((a, b), axis=2) )

[[[1 2 3]
  [3 2 1]]

 [[1 2 3]
  [4 5 6]]] 

[[[1 2 3]
  [1 2 3]]

 [[3 2 1]
  [4 5 6]]] 

[[[1 1]
  [2 2]
  [3 3]]

 [[3 4]
  [2 5]
  [1 6]]]


## Tensor拼接
常用的方法有
1. torch.cat
2. torch.stack
3. dstack、hstack、vstack、row_stack、column_stack

### cat方法
torch.cat(tensors, dim=0, `*`, out=None) -> Tensor
在指定的维度dim（默认是0）上面进行拼接

In [9]:
# 低维拼接
import torch
ones = torch.ones(4, 5)
zeros = torch.zeros(4, 5)
print(torch.cat((ones, zeros), dim=0))# 沿着dim=0拼接，dim1不变
print(torch.cat((ones, zeros), dim=1))# 沿着dim=1拼接，dim0不变
print(torch.cat((ones, zeros), dim=2))# 不存在这个维度

tensor([[1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [1., 1., 1., 1., 1.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.],
        [0., 0., 0., 0., 0.]])
tensor([[1., 1., 1., 1., 1., 0., 0., 0., 0., 0.],
        [1., 1., 1., 1., 1., 0., 0., 0., 0., 0.],
        [1., 1., 1., 1., 1., 0., 0., 0., 0., 0.],
        [1., 1., 1., 1., 1., 0., 0., 0., 0., 0.]])


IndexError: Dimension out of range (expected to be in range of [-2, 1], but got 2)

In [10]:
# 高维度拼接
ones = torch.ones(2, 3, 4, 5)
zeros = torch.zeros(2, 3, 4, 5)
cat1 = torch.cat((ones, zeros), dim=0)
print(cat1.shape)
cat2 = torch.cat((ones, zeros), dim=1)
print(cat2.shape)
cat3 = torch.cat((ones, zeros), dim=2)
print(cat3.shape)

torch.Size([4, 3, 4, 5])
torch.Size([2, 6, 4, 5])
torch.Size([2, 3, 8, 5])


### stack方法
torch.stack(tensors, dim=0, *, out=None) → Tensor


In [12]:
a = torch.arange(0, 16).reshape(1, 2, 8)
b = torch.arange(0, 16).reshape(1, 2, 8)
print(a.shape)
print(b.shape)
c1 = torch.stack((a, b))
print(c1.shape)
a1 = torch.unsqueeze(a, dim=0)
b1 = torch.unsqueeze(b, dim=0)
c2 = torch.cat((a1, b1))
print(c2.shape)

torch.Size([1, 2, 8])
torch.Size([1, 2, 8])
torch.Size([2, 1, 2, 8])
torch.Size([2, 1, 2, 8])


### dstack、hstack、vstack、row_stack、column_stack

torch.dstack(tensors, *, out=None) → Tensor

torch.hstack(tensors, *, out=None) → Tensor

torch.vstack(tensors, *, out=None) → Tensor

torch.row_stack(tensors, *, out=None) → Tensor

torch.column_stack(tensors, *, out=None) → Tensor

这些拼接函数主要针对三维张量。即一个张量维度表示为行(Rows/horizontal)、列(Columns/virtical)和深度(Depth)时

In [13]:
import torch

COLUMNS = 5
ROWS = 10
DEPTH = 8

a1 = torch.arange(0, COLUMNS * ROWS * DEPTH).reshape(ROWS, COLUMNS, DEPTH)
b1 = torch.arange(0, COLUMNS * ROWS * DEPTH).reshape(ROWS, COLUMNS, DEPTH)

# 深度相加
c1 = torch.dstack((a1, b1))
print(c1.shape)  # torch.Size([10, 5, 16])

# 水平相加（行相加）
c2 = torch.hstack((a1, b1))
print(c2.shape)  # torch.Size([10, 10, 8])

# 垂直相加（列相加）
c3 = torch.vstack((a1, b1))
print(c3.shape)  # torch.Size([20, 5, 8])

# 列相加
c4 = torch.row_stack((a1, b1))
print(c4.shape)  # torch.Size([20, 5, 8])

# 行相加
c5 = torch.column_stack((a1, b1))
print(c5.shape)  # torch.Size([10, 10, 8])


torch.Size([10, 5, 16])
torch.Size([10, 10, 8])
torch.Size([20, 5, 8])
torch.Size([20, 5, 8])
torch.Size([10, 10, 8])


## numpy升降维度

https://blog.csdn.net/m0_50572604/article/details/120782788

### numpy升维可以用下列方法
1. np.atleast_2d(array) 转为二维数组
2. np.atleast_3d(array) 转为三维数组
3. array[:,np.newaxis] 升维一次 n行一列
4. array[np.newaxis,:] 升维一次 一行n列
5. array.reshape(-1,1) 变成n行一列
6. array.reshape(1,-1) 变成一行n列
7. np.expand_dims(a, axis)

In [3]:
import numpy as np
a = np.array([1,2,3,4,5])
#将数组升为二维数组
b = np.atleast_2d(a)
#通过转置来改变二维数组的形状
c = a.T
print(a)
print(b)
print(c)

[1 2 3 4 5]
[[1 2 3 4 5]]
[1 2 3 4 5]


In [4]:
a = np.array([1,2,3,4,5])
b=np.expand_dims(a, axis=0)
print(np.shape(b))
c=np.expand_dims(a, axis=1)
print(np.shape(c))

(1, 5)
(5, 1)


### numpy降维可以用下列方法
1. array.ravel()
2. np.squeeze(array)
3. array.reshape(-1)
4. array.flatten（）：返回源数据的副本

In [5]:
a = np.array([[1,2,3,4,5]])
b=np.squeeze(a)
print(b)

[1 2 3 4 5]


##  Pytorch升降维度
https://blog.csdn.net/poisonchry/article/details/121042431

### Pytorch升维用torch.unsqueeze(input, dim) → Tensor
其中，dim 的范围是`[-input.dim()-1, input.dim()+1)`,也就是允许用户以顺序、逆序的方式插入维度。举例来说，如果`dim=-1`，张量的维度会从`(A*B)`变为`(A*B*1)`;如果 `dim=0`，维度会变成`(1*A*B)`；如果`dim=1`，会变成`(A*1*B)`

In [6]:
import torch
x = torch.tensor([1, 2, 3, 4])
print(torch.unsqueeze(x, 0))
print(torch.unsqueeze(x, 1))

tensor([[1, 2, 3, 4]])
tensor([[1],
        [2],
        [3],
        [4]])


### Pytorch降维用torch.squeeze(input, dim=None, `*`, out=None) → Tensor
维度压缩，如果指定的dim参数下维度为1，会删除指定的维度，否则不变；如果没指定dim参数，会把张量中所有为1的维度全部删除，以此达到降维操作。如果输入维度是`(A*B*1*C*D*1)`，会输出维度`(A*B*C*D)`。

In [8]:
x = torch.zeros(2, 1, 2, 1, 2)
print(x.size())
y = torch.squeeze(x)# 维度全降
print(y.size())
y1 = torch.squeeze(x, 0)#无效降维
print(y1.size())
y2 = torch.squeeze(x, 1)#有效降维
print(y2.size())

torch.Size([2, 1, 2, 1, 2])
torch.Size([2, 2, 2])
torch.Size([2, 1, 2, 1, 2])
torch.Size([2, 2, 1, 2])


## numpy和tensor互转

In [26]:
import numpy as np
import torch
x = np.ones(5)
print(type(x)) # 查看x的类型
'numpy 转 tensor'
x1 = torch.tensor(x)
print(type(x1))
x2 = torch.from_numpy(x)
print(type(x2))
'tensor转numpy'
y = torch.ones(5) # 创建张量x
# tensor([1., 1., 1., 1., 1.])
y_ = y.detach().numpy() # 转换
print(type(y_))
y__= y.numpy()
print(type(y__))
# 主要区别在于是否使用detach()，也就是返回的新变量是否需要计算梯度。【用了detach()，不需要计算梯度了】

<class 'numpy.ndarray'>
<class 'torch.Tensor'>
<class 'torch.Tensor'>
<class 'numpy.ndarray'>
<class 'numpy.ndarray'>


## 广播机制

numpy和pytorch都有广播机制，“广播”这一术语用于描述如何在形状不一的数组上应用算术运算。
在满足特定限制的前提下，较小的数组“广播至”较大的数组，使两者形状互相兼容。广播提供了一个向量化数组操作的机制，这样遍历就发生在C层面，而不是Python层面。广播可以避免不必要的数据复制，通常导向高效的算法实现。不过，也存在不适用广播的情形（可能导致拖慢计算过程的低效内存使用）。

https://blog.csdn.net/CANGYE0504/article/details/117353589
https://blog.csdn.net/Lewiz_124/article/details/141597903

numpy的广播机制

In [64]:
'两个数组一样形状的时候就不用广播了'
from numpy import array
a = array([1.0, 2.0, 3.0])
b = array([2.0, 2.0, 2.0])
a * b

array([2., 4., 6.])

In [65]:
'数组和标量相乘的时候会自动广播标量'
b = 2.0
a * b

array([2., 4., 6.])

In [5]:
# 示例1：相同形状的张量总是可广播的，因为总能满足以上规则。
x = np.empty([5, 7, 3])
y = np.empty([5, 7, 3])
print((x+y).shape)
# 示例2：不可广播（ a 不满足第一条规则）。
a = np.empty([0])
b = np.empty([2, 2])
print((a+b).shape)

(5, 7, 3)


ValueError: operands could not be broadcast together with shapes (0,) (2,2) 

In [6]:
# 示例3：m 和 n 可广播：
m = np.empty([5, 3, 4, 1])
n = np.empty([   3, 1, 1])

# 倒数第一个维度：两者的尺寸均为1
# 倒数第二个维度：n尺寸为1
# 倒数第三个维度：两者尺寸相同
# 倒数第四个维度：n该维度不存在
print(((m+n).shape))

# 示例4：不可广播，因为倒数第三个维度：2 != 3
p = np.empty([5, 2, 4, 1])
q = np.empty([   3, 1, 1])
print(((p+q).shape))

(5, 3, 4, 1)


ValueError: operands could not be broadcast together with shapes (5,2,4,1) (3,1,1) 

https://zhuanlan.zhihu.com/p/86997775

pytorch的广播机制

- 可广播的一对张量需满足以下规则：
1. 每个张量至少有一个维度。
2. 迭代维度尺寸时，从尾部的维度开始，维度尺寸
    1. 或者相等，
    2. 或者其中一个张量的维度尺寸为 1 ，
    3. 或者其中一个张量不存在这个维度。

In [72]:
import torch

# 示例1：相同形状的张量总是可广播的，因为总能满足以上规则。
x = torch.empty(5, 7, 3)
y = torch.empty(5, 7, 3)
print((x+y).shape)

# 示例2：不可广播（ a 不满足第一条规则）。
a = torch.empty((0,))
b = torch.empty(2, 2)
print((a+b).shape)

torch.Size([5, 7, 3])


RuntimeError: The size of tensor a (0) must match the size of tensor b (2) at non-singleton dimension 1

In [75]:
# 示例3：m 和 n 可广播：
m = torch.empty(5, 3, 4, 1)
n = torch.empty(   3, 1, 1)

# 倒数第一个维度：两者的尺寸均为1
# 倒数第二个维度：n尺寸为1
# 倒数第三个维度：两者尺寸相同
# 倒数第四个维度：n该维度不存在
print((m+n).shape)

# 示例4：不可广播，因为倒数第三个维度：2 != 3
p = torch.empty(5, 2, 4, 1)
q = torch.empty(   3, 1, 1)
print((p+q).shape)

torch.Size([5, 3, 4, 1])


RuntimeError: The size of tensor a (2) must match the size of tensor b (3) at non-singleton dimension 1

In [74]:
# 示例5：可广播
c = torch.empty(5, 1, 4, 1)
d = torch.empty(   3, 1, 1)
(c + d).size()  # torch.Size([5, 3, 4, 1])
print((c + d).shape)

# 示例6：可广播
f = torch.empty(      1)
g = torch.empty(3, 1, 7)
(f + g).size()  # torch.Size([3, 1, 7])
print((f + g).shape)

# 示例7：不可广播
o = torch.empty(5, 2, 4, 1)
u = torch.empty(   3, 1, 1)
print((o + u).size())


torch.Size([5, 3, 4, 1])
torch.Size([3, 1, 7])


RuntimeError: The size of tensor a (2) must match the size of tensor b (3) at non-singleton dimension 1

## 向量矩阵操作

### numpy按位乘、点乘、叉乘

In [40]:
import numpy as np
'按位乘只能数值/向量同矩阵、或是两个形状一样的矩阵相乘'
a = np.array([[1,2,3],[3,2,1]])
b = np.array([[4,5,6],[6,5,4]])
print(a*b,'按位乘\n')
print(a[0]*b,'按位乘\n')
# 按位乘满足交换律

[[ 4 10 18]
 [18 10  4]] 按位乘

[[ 4 10 18]
 [ 6 10 12]] 按位乘



In [42]:
'点乘用np.dot'
print(np.dot(a,b.T),'矩阵点乘\n')
print(np.dot(a[0],b.T),'矩阵和向量点乘\n')

[[32 28]
 [28 32]] 矩阵点乘

[32 28] 矩阵和向量点乘



In [47]:
'叉乘用np.cross'
print(np.cross(a[0], b[0]), '向量叉乘\n')
# 二维向量叉乘出菱形面积，三维向量叉乘出来法向量
# print(np.cross(a, b), '矩阵叉乘')

[-3  6 -3] 向量叉乘



### numpy求范数
x_norm=np.linalg.norm(x, ord=None, axis=None, keepdims=False)

向量范数：

    ord默认=2计算2范数，ord=1算1范数、ord=np.inf取绝对值最大，还有-np.inf范数、p范数
    
矩阵范数：

    ord=1：列和的最大值
    ord=2：|λE-ATA|=0，求特征值，然后求最大特征值得算术平方根
    ord=∞：行和的最大值
    axis=1表示按行向量处理，求多个行向量的范数
    axis=0表示按列向量处理，求多个列向量的范数
    axis=None表示矩阵范数。
    keepdims：是否保持矩阵的二维特性, True表示保持矩阵的二维特性，False相反

In [49]:
import numpy as np

x1=np.array([1,5,6,3,-1])
x2=np.arange(12).reshape(3,4)
print(x1,'\n',x2)
print('向量2范数:')
print(np.linalg.norm(x1))
print(np.linalg.norm(x1,ord=2))
print('默认的矩阵范数:')
print(np.linalg.norm(x2))
print('矩阵2范数:')
print(np.linalg.norm(x2,ord=2))

[ 1  5  6  3 -1] 
 [[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]
向量2范数:
8.48528137423857
8.48528137423857
默认的矩阵范数:
22.494443758403985
矩阵2范数:
22.409298163270435


### pytorch按位乘、点乘、叉乘

pytorch向量乘法和numpy差不多

In [22]:
'向量乘法'
a=torch.tensor([1,2,3])
b=torch.tensor([2,3,4])
print(a*b) # 按位乘
print(torch.dot(a,b)) # 向量点乘
print(torch.cross(a,b)) # 向量叉乘

tensor([ 2,  6, 12])
tensor(20)
tensor([-1,  2, -1])


pytorch矩阵的乘法符号含义和numpy有些区别：
```
“点乘”为两个矩阵对应元素相乘（逐元素级element-wise）
实现方式：可以通过*和torch.mul(x, y)函数实现（含广播机制）
模型符号：一个圆圈中有一个实心点⊙

“叉乘”为传统的线性代数学的矩阵乘法
实现方式：可以通过torch.mm()和torch.matmul()实现（含广播机制）
模型符号：一个圆圈中有一个叉×

plus: 逐元素相加
实现方式：可以通过+和torch.add(x, y)函数实现
模型符号：一个圆圈中有一个加号＋
```

In [18]:
'按位乘*和torch.mul(a,b)（含广播机制）'
import torch
print('*用法\n')
a=torch.tensor([[1,2,3],[4,5,6]])
b=torch.tensor([[10,20,30],[30,20,10]])
print(a[0]*b[0])
print(a*b,'\n')
print('mul用法\n')
a = torch.ones(3,4)
print(a)
b = torch.Tensor([1,2,3]).reshape((3,1))
print(b)
print((torch.mul(a, b)))

*用法

tensor([10, 40, 90])
tensor([[ 10,  40,  90],
        [120, 100,  60]]) 

mul用法

tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]])
tensor([[1.],
        [2.],
        [3.]])
tensor([[1., 1., 1., 1.],
        [2., 2., 2., 2.],
        [3., 3., 3., 3.]])


In [19]:
'torch.mm()和torch.matmul()'
# 实现方式：可以通过torch.mm()和torch.matmul()（含广播机制）实现
x = torch.ones(3,4)
y = torch.eye(4)          #对角线为1，其余元素为0
print(torch.mm(x,y))
z = torch.ones(5,4,3)
print(torch.mm(z,x))# mm没有广播机制

tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]])


RuntimeError: self must be a matrix

In [20]:
print(torch.matmul(z,x)) ## matmul有广播机制

tensor([[[3., 3., 3., 3.],
         [3., 3., 3., 3.],
         [3., 3., 3., 3.],
         [3., 3., 3., 3.]],

        [[3., 3., 3., 3.],
         [3., 3., 3., 3.],
         [3., 3., 3., 3.],
         [3., 3., 3., 3.]],

        [[3., 3., 3., 3.],
         [3., 3., 3., 3.],
         [3., 3., 3., 3.],
         [3., 3., 3., 3.]],

        [[3., 3., 3., 3.],
         [3., 3., 3., 3.],
         [3., 3., 3., 3.],
         [3., 3., 3., 3.]],

        [[3., 3., 3., 3.],
         [3., 3., 3., 3.],
         [3., 3., 3., 3.],
         [3., 3., 3., 3.]]])


https://blog.csdn.net/ding_programmer/article/details/120822430
补充：
- 三维带batch的矩阵乘法 torch.bmm()

由于神经网络训练一般采用mini-batch，经常输入的时三维带batch的矩阵，所以提供

torch.bmm(bmat1, bmat2, out=None)

- dot 函数：

对于秩为1的数组，执行对应位置相乘，然后再相加，等价于向量的点乘；

对于秩不为1的二维数组，执行矩阵乘法运算，等价于矩阵的叉乘；

- `*` 和 `@`

`*` 代表的是矩阵逐元素乘

`@` 代表的是 矩阵乘法


经验
1. 把向量 看成 1*n 的矩阵,不过需要采用 unsqueeze() 函数来增加一下维度。转置的话 ，一般采用 a.t() 或者 a.transpose(0,1)

2. 矩阵点乘 用  torch.mul

3. 矩阵乘法 用 torch.matmul

In [23]:
x=torch.tensor([[1,2],[3,4]])
y=torch.tensor([[1,2],[3,4]])
print(x*y)
print(x@y)

tensor([[ 1,  4],
        [ 9, 16]])
tensor([[ 7, 10],
        [15, 22]])


### pytorch范数

torch.norm(input, p='fro', dim=None, keepdim=False, out=None, dtype=None)
返回所给定tensor的矩阵范数或向量范数,所谓范数也就是把一个高纬度的东西,压缩成为一个大于等于零的数,用以估算这里东西的大小(幅度)

- input：输入tensor
- p (int, float, inf, -inf, 'fro', 'nuc', optional)：范数计算中的幂指数值。默认为'fro'
- dim (int，2-tuple，2-list， optional): 指定计算的维度。如果是一个整数值，向量范数将被计算；如果是一个大小为2的元组，矩阵范数将被计算；如果为None，当输入tensor只有两维时矩阵计算矩阵范数；当输入只有一维时则计算向量范数。如果输入tensor超过2维，向量范数将被应用在最后一维
- keepdim（bool，optional）：指明输出tensor的维度dim是否保留。如果dim=None或out=None,则忽略该参数。默认值为False，不保留
- out（Tensor, optional）:tensor的输出。如果dim=None或out=None,则忽略该参数。
- dtype（torch.dtype，optional）：指定返回tensor的期望数据类型。如果指定了该参数，在执行该操作时输入tensor将被转换成 :attr:’dtype’


In [12]:
import torch
a = torch.arange(9, dtype=torch.float) - 4
b = a.reshape(3,3)
print(a)
print(b)
print((torch.norm(a)))# 如果不指明p，则是计算Frobenius范数：
print(torch.norm(b))
print(torch.norm(a, float('inf'))) # p = 'inf',则是求出矩阵或向量中各项元素绝对值中的最大值，所以为4
print(torch.norm(b, float('-inf')))

tensor([-4., -3., -2., -1.,  0.,  1.,  2.,  3.,  4.])
tensor([[-4., -3., -2.],
        [-1.,  0.,  1.],
        [ 2.,  3.,  4.]])
tensor(7.7460)
tensor(7.7460)
tensor(4.)
tensor(0.)


In [13]:
c = torch.tensor([[1,2,3],[-1,1,4]], dtype=torch.float)
print(c)
print(torch.norm(c, dim=0)) # 指定dim = 0，因为c的size() = (2,3),所以会去掉其dim=0，得到size()=(3)的结果，所以是纵向求值，计算Frobenius范数
print(torch.norm(c, dim=0).size())
print(torch.norm(c, dim=1))
print(torch.norm(c, p=1, dim=1)) # p=1, dim=1 ： 即是表示去掉维度1，使用1-范数，得到size()=(2)的结果。所以横向计算各个元素绝对值的和，为（[6,6]）

tensor([[ 1.,  2.,  3.],
        [-1.,  1.,  4.]])
tensor([1.4142, 2.2361, 5.0000])
torch.Size([3])
tensor([3.7417, 4.2426])
tensor([6., 6.])


In [14]:
d = torch.arange(8, dtype=torch.float).reshape(2,2,2)
print(torch.norm(d, dim=(1,2)))
print(d.size())
print(torch.norm(d, dim=0))
print(d[0,:,:])
print(d[0,:,:].size())
print(torch.norm(d[0,:,:]))
print(torch.norm(d[1,:,:]))

tensor([ 3.7417, 11.2250])
torch.Size([2, 2, 2])
tensor([[4.0000, 5.0990],
        [6.3246, 7.6158]])
tensor([[0., 1.],
        [2., 3.]])
torch.Size([2, 2])
tensor(3.7417)
tensor(11.2250)


### Einsum爱因斯坦求和

https://rockt.github.io/2018/04/30/einsum

https://blog.csdn.net/ashome123/article/details/117110042

该方法在numpy和pytorch中均有内置

einsum方法正是利用了爱因斯坦求和简介高效的表示方法，从而可以驾驭任何复杂的矩阵计算操作。基本的框架如下：

```C = einsum('ij,jk->ik', A, B)```

上述操作表示矩阵A与矩阵B的点积。输入的参数分为两部分，前面表示计算操作的字符串，后面是以逗号隔开的操作对象（数量需与前面对应）。其中在计算操作表示中，"->“左边是以逗号隔开的下标索引，重复出现的索引即是需要爱因斯坦求和的；”->"右边的是最后输出的结果形式。

以上式为例，其计算公式为：$C_{ik} = \sum_jA_{ij}B_{jk}$，其等价于矩阵A与B的点积。
这里有几条原则需要注意，之后也会和结合示例进行详解：
1. "->"左边的是对应维度，以逗号隔开
2. "->"右边的是最终output的形式
3. 如果符号"->"被省略则代表输出为整体求和
4. "…"表示省略之前或之后的所有维度
5. einsum中涉及到的计算操作有很多，包括但不限于点积、对应元素相乘、求和、转置等

In [43]:
import torch
from torch import einsum
a = torch.ones(3,4)
b = torch.ones(4,5)
c = torch.ones(6,7,8)
d = torch.ones(3,4)
x, y = torch.randn(5), torch.randn(5)
'计算矩阵所有元素之和'
# einsum('i,j', a)   # 等价于einsum('i,j->', a)
# einsum('i,j,k', c)
'计算矩阵的迹'
# einsum('ii', a)
'获取矩阵对角线元素组成的向量'
# einsum('ii->i', a)
"以上全都运行不了"

'向量相乘得到矩阵'
print('1\n',einsum('i,j->ij', x, y),'\n')
'矩阵点积'
print('2\n',einsum('ij,jk->ik', a, b),'\n')
'矩阵对应元素相乘'
print('3\n',einsum('ij,ij->ij', a, d),'\n')
'矩阵的转置'
print('4\n',einsum('ijk->ikj', c),'\n')
print('5\n',einsum('...jk->...kj', c) ,'\n') # 两种形式等价
'双线性运算'
A = torch.randn(3,5,4)
l = torch.randn(2,5)
r = torch.randn(2,4)
print('6\n',torch.einsum('bn,anm,bm->ba', l, A, r),'\n')
'最后来一个复杂的'
a = torch.randn(3,4,5)
b = torch.randn(6,5)
c = torch.randn(6,3)
target = einsum('fti,di,df->dt', a,b,c)
print('7\n',target,'\n')
# 把上面的求和过程写成循环的形式方便理解
# 对f和i进行求和
dt = torch.zeros(6,4)
for d in range(6):
    for t in range(4):
        tmp = 0
        for f in range(3):
            for i in range(5):
                tmp += a[f,t,i].item() * b[d,i].item() * c[d,f].item()
        dt[d,t] = tmp

print(target)
print('8\n','\n', dt)

1
 tensor([[ 0.5498, -1.1671,  1.0803,  1.6470,  0.1439],
        [ 0.5186, -1.1010,  1.0191,  1.5537,  0.1358],
        [ 0.2870, -0.6092,  0.5639,  0.8597,  0.0751],
        [ 0.1998, -0.4241,  0.3926,  0.5985,  0.0523],
        [ 0.4313, -0.9156,  0.8476,  1.2922,  0.1129]]) 

2
 tensor([[4., 4., 4., 4., 4.],
        [4., 4., 4., 4., 4.],
        [4., 4., 4., 4., 4.]]) 

3
 tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]]) 

4
 tensor([[[1., 1., 1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1., 1., 1.]],

        [[1., 1., 1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1., 1., 1.],
         [1., 1., 1., 1., 1

# pytorch保存读取网络参数

In [15]:
import random
import gym
import numpy as np
import collections
from tqdm import tqdm
import torch
import torch.nn.functional as F
import matplotlib.pyplot as plt
import rl_utils

官方文档：
https://pytorch.org/tutorials/beginner/saving_loading_models.html?highlight=load_state_dict

其他：
https://blog.csdn.net/weixin_64388392/article/details/134587209


-   torch.save：将序列化对象保存至磁盘。可以保存模型、tensor、字典等对象，使用python中pickle模块进行序列化
-   torch.load：使用pickle的unpickling功能将pickle对象反序列化至内存
-   torch.nn.Moudle.load\_state\_dict：使用反序列化函数state\_dict 来加载模型参数字典

## state\_dict字典状态

torch.nn.Module模型中包含可学习参数，可用model.parameters()访问参数。state\_dict是python字典对象，它将每一层映射到其参数张量，只有可学习参数的层的模型才具有state\_dict这一项。目标优化torch.optim的优化参数对象也有state\_dict属性，包含优化器相关信息，以及使用的超参数。


In [3]:
import torch.nn as nn
import torch.optim as optim
# 定义模型
class TheModelClass(nn.Module):
    def __init__(self):
        super(TheModelClass, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# 初始化模型
model = TheModelClass()

# 初始化优化器
optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

# 打印模型的状态字典
print("Model's state_dict:")
for param_tensor in model.state_dict():
    print(param_tensor, "\t", model.state_dict()[param_tensor].size())

# 打印优化器的状态字典
print("Optimizer's state_dict:")
for var_name in optimizer.state_dict():
    print(var_name, "\t", optimizer.state_dict()[var_name])

Model's state_dict:
conv1.weight 	 torch.Size([6, 3, 5, 5])
conv1.bias 	 torch.Size([6])
conv2.weight 	 torch.Size([16, 6, 5, 5])
conv2.bias 	 torch.Size([16])
fc1.weight 	 torch.Size([120, 400])
fc1.bias 	 torch.Size([120])
fc2.weight 	 torch.Size([84, 120])
fc2.bias 	 torch.Size([84])
fc3.weight 	 torch.Size([10, 84])
fc3.bias 	 torch.Size([10])
Optimizer's state_dict:
state 	 {}
param_groups 	 [{'lr': 0.001, 'momentum': 0.9, 'dampening': 0, 'weight_decay': 0, 'nesterov': False, 'maximize': False, 'foreach': None, 'differentiable': False, 'params': [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]}]


## 保存/加载state\_dict（推荐使用）

In [14]:
# 保存
torch.save(model.state_dict(),'save_test')  
# 加载
# model = TheModelClass(*args, **kwargs) # NameError: name 'args' is not defined
model.load_state_dict(torch.load('save_test'))

'''
# 保存
torch.save(model.state_dict(),PATH)  
# 加载
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH))
'''

'\n# 保存\ntorch.save(model.state_dict(),PATH)  \n# 加载\nmodel = TheModelClass(*args, **kwargs)\nmodel.load_state_dict(torch.load(PATH))\n'

-   pytorch中常见保存模型格式'.pt'或'.pth'
-   运行推理之前，需要调用model.eval()去设置dropout和batch normalization层为评估模型，如果不这么做，导致模型推断结果不一致
-   load\_state\_dict()只接受字典对象，需要使用torch.load来反序列化state\_dict模型

## 保存/加载整个模型（不推荐）

In [9]:
# 保存
torch.save(model, PATH)
# 加载
model = torch.load(PATH)
model.eval()

NameError: name 'PATH' is not defined

此部分保存/加载过程使用最直观的语法并涉及最少量的代码。以 Python 'pickle' 模块的方式来保存模型。这种方法的缺点是序列化数据受 限于某种特殊的类而且需要确切的字典结构。这是因为pickle无法保存模型类本身。相反，它保存包含类的文件的路径，该文件在加载时使用。 因此，当在其他项目使用或者重构之后，您的代码可能会以各种方式中断。

## 保存/加载checkpoint用于推理或继续训练

### 单个模型

In [None]:
# 模型保存
torch.save({
'epoch':epoch, 'model_state_dict':model.state_dict(),
'optimizer_state_dict':optimizer.state_dict(),
'loss':loss,
...
},PATH)

# 模型加载
model = TheModelClass(args, **kwargs)
optimizer = TheOptimizerClass(args, **kwargs)
checkpoint = torch.load(PATH)
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict')
epoch = checkpoint['epoch']
loss = checkpoint['loss']

model.train() or model.eval()

举个例子：

In [None]:
import torch.nn as nn
import torch.optim as optim
# 搭建网络模型
class TheModelClass(nn.Module):
    def __init__(self):
        super(TheModelClass, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

# 保存模型
torch.save({
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'loss': loss,
            ...
            }, 'model_path')

# 加载模型
model = TheModelClass()# 实例化模型
# 定义优化器（不唯一）
optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)
 
# 加载模型
checkpoint = torch.load('model_path')
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']

这种保存模型的方法不仅将模型以字典的形式进行了保存，同时还将模型迭代训练轮数：epoch、定义的优化器：otimizer、损失值：loss等都进行了保存，因此这种保存方法很有利于我们因各种原因而导致训练中止后继续恢复训练。

### 多个模型

In [None]:
# 多个模型保存
torch.save({
'modelA_state_dict':modelA.state_dict(),
'optimizerA_state_dict':optimizerA.state_dict(),
'modelB_state_dict':modelB.state_dict(),
'optimizerB_state_dict':optimizerB.state_dict(),
}, PATH)

# 多个模型加载
modelA = TheModelAClass(args, **kwargs)
modelB = TheModelBClass(args, *kwargs)
optimizerA = TheOptimizerAClass(args, *kwargs)
optimizerB = TheOptimizerBClass(args, **kwargs)

checkpoint = torch.load(PATH)
modelA.load_state_dict(checkpoint['modelA_state_dict'])
modelB.load_state_dict(checkpoint['modelB_state_dict'])
optimizerA.load_state_dict(checkpoint['optimizerA_state_dict'])
optimizerB.load_state_dict(checkpoint['optimizerB_state_dict'])

modelA.eval() or modelA.train()
modelB.eval() or modelB.train()

## 不同模型参数下热启动模式

In [10]:
torch.save(model.state_dict(),PATH)Text only
modelB = TheModelClass(*args. **kwargs)
modelB.load_state_dict(torch.load(PATH), strict=False)  # strict 该参数指明是否需要强制严格匹配，默认True，strict=False 忽略非匹配键的函数

SyntaxError: invalid syntax (3522999687.py, line 1)

## 不同设备保存/加载模型

In [None]:
# CPU or GPU 上保存模型
torch.save(model.state_dict(), PATH)

# CPU上保存，CPU上加载
device = torch.device('cpu')
model = TheModelClass(*args, kwargs)
model.load_state_dict(torch.load(PATH, map_location=device)) # 使用map_location参量将张量下的存储器动态重新映射到CPU设备

# CPU上保存，GPU上加载
device = torch.device('cuda')
model = TheModelClass()
model.load_state_dict(torch.load(PATH, map_loaction='cuda:0')) # 将模型加载到指定的GPU设备上
model.to(device) # 将模型的参数张量转换成CUDA张量
input = input.to(device) # 模型输入装换成CUDA张量

# GPU上保存，GPU上加载
device = torch.device('cuda')
model = TheModelClass()
model = model.load_state_dict(torch.load(PATH))
model.to(device) # 将初始化的模型转换成CUDA优化模型
my_tensor = my_tensor.to(device)

## 保存torch.nn.DataParallel模型

In [None]:
torch.save(model.module.state_dict(),PATH)
# torch.nn.DataParallel是一个模型封装，支持并行GPU使用。
# 要普通保存 DataParallel 模型, 请保存model.module.state_dict()。 
# 这样，你就可以非常灵活地以任何方式加载模型到你想要的设备中。

# DQN中第一次见的写法

## 字典

In [16]:
# d = {key1 : value1, key2 : value2 }
tinydict = {'a': 1, 'b': 2, 'b': '3'}
print(tinydict['b'])
print(tinydict)


3
{'a': 1, 'b': '3'}


值可以取任何数据类型，但键必须是不可变的，如字符串，数字或元组。

一个简单的字典实例：

In [17]:
tinydict = { 'abc': '456' }
tinydict1 = { 'abc': 456 }
tinydict2 = { 'abc': 123, 98.6: 37 }

字典添加、修改、删除、清空和更新元素

In [22]:
a = {'美琳': 18, '梦洁': 19, '雪丽': 19, '美莲': 18}
# 添加
a['梅梅'] = 20
print(a)
# 修改
a['梦洁'] = 20
print(a)
# del删除
del a['梦洁']
print(a)
# pop删除
a.pop('雪丽')
print(a)
# 使用popitem() 方法删除字典中最后一个键值对
a.popitem()
print(a)

{'美琳': 18, '梦洁': 19, '雪丽': 19, '美莲': 18, '梅梅': 20}
{'美琳': 18, '梦洁': 20, '雪丽': 19, '美莲': 18, '梅梅': 20}
{'美琳': 18, '雪丽': 19, '美莲': 18, '梅梅': 20}
{'美琳': 18, '美莲': 18, '梅梅': 20}
{'美琳': 18, '美莲': 18}


In [24]:
# 带判断删除
a = {'美琳': 18, '梦洁': 19, '雪丽': 19, '美莲': 18}  # 指定一个原始字典
if '梅梅' in a:                                       # 如果在字典中
    del a['梅梅']                                     # 删除一个元素
else:                                                 # 否则
    print("你要删除的键不在字典中")                   # 告诉结果
print("原字典为：",a)    
# 清空
a.clear()
print(a)


你要删除的键不在字典中
原字典为： {'美琳': 18, '梦洁': 19, '雪丽': 19, '美莲': 18}
{}


In [25]:
# 使用update 更新
a = {'美琳': 18, '梦洁': 19, '雪丽': 19, '美莲': 18}
a.update({'梅梅': 18, '梦洁': 20})         
print(a)

{'美琳': 18, '梦洁': 20, '雪丽': 19, '美莲': 18, '梅梅': 18}


字典的遍历

In [1]:
dict1 = {
    '小明':129,
    '小兰':148,
    '小红':89
}

for key in dict1:# 有效
    print (key)
for value in dict1: # 无效，这样只有key会出来
    print(value)
for key in dict1.keys():
    print(key,type(key))
for value in dict1.values():
    print(value,type(value))
print('同时遍历写法1')
for key,value in dict1.items():
    print ('key: ',key,'value: ',value)
print('同时遍历写法2')
for (key,value) in dict1.items():
    print ('key: ',key,'value: ',value)
print('同时遍历写法3')
for kv in dict1.items():
    print ('kv is : ',kv)
print('用zip遍历')
for key,value in zip(dict1.keys(), dict1.values()):
    print ('key:',key,'value: ',value)
    print('type key:',type(key),'type value:',type(value))

print('用函数读取key和value')
#定义读key值的函数
def keys_function(dict1):
    keys = []
    #读出key
    for k in dict1.keys():
        keys.append(format(k))
    return keys
#定义读出value
def values_function(dict1):
    values = []
    for v in dict1.values():
        values.append(v) # format(v)
    return values

print('key:',keys_function(dict1),'type:',type(keys_function(dict1)))
print('value:',values_function(dict1),'type:',type(values_function(dict1)))

print('字典转列表')
dit = {'a1':'name1',
       'a2':'name2',
       'a3':'name3'}
lst = list(dit.keys())
print('取key',lst)
lst = list(dit.values())
print('取value',lst)


print('列表转字典的方法')
seg_list = ['有些', '有']
seg_index = [0,1]
seg = zip(seg_index,seg_list)
print(dict(seg))

小明
小兰
小红
小明
小兰
小红
小明 <class 'str'>
小兰 <class 'str'>
小红 <class 'str'>
129 <class 'int'>
148 <class 'int'>
89 <class 'int'>
同时遍历写法1
key:  小明 value:  129
key:  小兰 value:  148
key:  小红 value:  89
同时遍历写法2
key:  小明 value:  129
key:  小兰 value:  148
key:  小红 value:  89
同时遍历写法3
kv is :  ('小明', 129)
kv is :  ('小兰', 148)
kv is :  ('小红', 89)
用zip遍历
key: 小明 value:  129
type key: <class 'str'> type value: <class 'int'>
key: 小兰 value:  148
type key: <class 'str'> type value: <class 'int'>
key: 小红 value:  89
type key: <class 'str'> type value: <class 'int'>
用函数读取key和value
key: ['小明', '小兰', '小红'] type: <class 'list'>
value: [129, 148, 89] type: <class 'list'>
字典转列表
取key ['a1', 'a2', 'a3']
取value ['name1', 'name2', 'name3']
列表转字典的方法
{0: '有些', 1: '有'}


## func(a=xxx)调用函数传入参数名称

In [14]:
'使用关键字参数'
def func(explore=False):
    if explore:
        print("Exploring mode is on.")

func(explore=True)  # 调用时指定 explore 参数为 True

'使用字典解包'
def func(explore=False):
    if explore:
        print("Exploring mode is on.")

params = {'explore': True}
func(**params)  # 使用字典解包来传递参数

'使用 **kwargs 来接受任意数量的关键字参数'
def func(**kwargs):
    if kwargs.get('explore'):
        print("Exploring mode is on.")

func(explore=True)  # 调用时传递 explore 参数

Exploring mode is on.
Exploring mode is on.
Exploring mode is on.


## 星号*变量

参考来源：https://blog.csdn.net/zkk9527/article/details/88675129


In [7]:
# 1. 最简单的用法是乘，略
# 2. *可以收集列表中多余的值
a,b,*c=[1,2,3,4]
c

[3, 4]

In [15]:
a = [1,2,3]
b = [*a,4,5,6]
b 
# ----------------- 输出结果 -----------------
# [1, 2, 3, 4, 5, 6]
# ----------------- 总结 -----------------
# 将a的内容移入（解包）到新列表b中。


[1, 2, 3, 4, 5, 6]

### 在函数定义时,`*`用于收集参数，

In [9]:
def myprint(*params):
    print(params)
myprint(1,2,3)

(1, 2, 3)


这里*将调用时提供的所有值，放在一个元组里

跟上面2里的有所区别，2里是收集列表中多余的参数，而这里是收集好参数，一起放进元组里面。

这种情况下，在函数定义时的形参里的*params后面，就最好不要再加入别的形参了，比如你定义成 def myprint(*params,x) ，调用的时候myprint（1,2,3），就会报错。因为这样python分不清哪个数据是给params的。如果你非要这么定义也行，不过在调用的时候，必须显示的指出哪个值是给x的。比如myprint（1,2，x=3），通过这种方式调用才不会出错。

在函数定义时,`**`用于收集关键字（key）参数组成字典

In [13]:
# 正确用法
def myprint1(**params):
    print(params)
myprint1(x=1,y=2,z=3) # 组成字典
# 错误用法
def myprint2(*params):
    print(params)
myprint2(x=1,y=2,z=3)  #会报错

{'x': 1, 'y': 2, 'z': 3}


TypeError: myprint2() got an unexpected keyword argument 'x'

In [1]:
def funcA(*args):
    print(*args)
funcA([1,2,3], [4,5,6])

[1, 2, 3] [4, 5, 6]


### 函数调用时`*`用于分配参数

In [16]:
def myprint(x,y):
    print(x)
    print(y)
params=(1,2)
myprint(*params) # 传入的是元组
# 只传入一个形参就调用了两个形参的函数

1
2


调用函数时，两个`**`的情况

In [17]:
def myprint(x,y):
    print(x)
    print(y)
params={'x':1,'y':2}
myprint(**params) # 传入字典
# 只传入一个形参就调用了两个形参的函数

1
2


### 不要在定义和调用时同时使用`*`号

技巧：调用函数时可以使用多个`*`变量将多个输入解包并合并为一个，比如
```python
target_critic_input = torch.cat((*next_states, *target_action), dim=1)
```
这里的`*next_states`和`*target_action`表示将`next_states`和`target_action`这两个可迭代对象中的元素解包，并将它们作为独立的参数传递给`torch.cat`函数。`torch.cat`函数是PyTorch库中的一个函数，用于连接张量（tensors）。

假设`next_states`是一个包含多个张量的列表，`target_action`也是一个张量列表，那么使用`*next_states`和`*target_action`可以将这些张量作为独立的参数传递给`torch.cat`，然后`torch.cat`将这些张量沿着指定的维度`dim=1`进行连接。

例如，如果`next_states`是`[A, B, C]`，`target_action`是`[X, Y]`，那么`torch.cat((*next_states, *target_action), dim=1)`等同于`torch.cat([A, B, C, X, Y], dim=1)`，这将把A、B、C、X和Y这些张量在第1维上进行连接。

其他解释：

函数定义里面形参变量前面加一个`*`，如`*args`，
表示接收任意多个位置参数，储存为元组；
变量前有两个`*`的，表示接收任意多个关键字参数，
比如 `**kwargs。`
单星号变量不仅仅能够用在函数的参数传递中，实际上对一个普通变量使用单星号前缀，能够将这个变量拆分成单个元素。
如果在变量前面使用单星号，实际上是对变量的一次拆解操作，将变量中单独的元素拆解出来，然后依次传入one()函数
而传入one()函数后，one()函数会将这些传入的单个元素保存成一个元组，这就是为什么我们 print(x[0])能够提取第一个元素的原因
变量在传入到单星号变量函数中时，会将变量自动转化为元组，而元组是不能改变的。
另外，单星号是无法读取到字典中的值的，永远只会读取到字典中的键（key），如果想读取到字典中的值，需要使用双星号(`**`)
双星号可以用来获得字典的值
需要注意的是：
使用这种方法将字典传入函数的时候，字典的键的命名要符合python变量的命名规则，通过上面的分析也不难看出，双星号会将字典首先转换成关键字参数的形式，就相当于使用字典中的键作为变量名，如果键不符合变量命名规则，则会抛出一个"TypeError"异常。


In [1]:
def one(a,*b):
    """a是一个普通传入参数，*b是一个非关键字星号参数"""
    print(b)
one(1,2,3,4,5,6)


def two(a=1,**b):
    """a是一个普通关键字参数，**b是一个关键字双星号参数"""
    print(b)
two(a=1,b=2,c=3,d=4,e=5,f=6)


(2, 3, 4, 5, 6)
{'b': 2, 'c': 3, 'd': 4, 'e': 5, 'f': 6}


### `*args`和`**kwargs`
args 是 arguments 的缩写，表示位置参数；kwargs 是 keyword arguments 的缩写，表示关键字参数。

1. ```其实并不是写成 *args 和 **kwargs ，只有前面的 * （星号）才是必须的。```

2. ```向python传递参数的方式有两种:位置参数（positional argument）和关键词参数（keyword argument）```


*args 的用法
* args 和 ** args 主要用于函数定义，你可以将不定数量的参数传递给一个函数。

这里不定的意思是： 预先并不知道，函数使用者会传递多少个参数给你，所在在这个场景下使用这两个关键字。 * args 是用来发送一个 非键值 的可变数量的参数列表给一个函数。

In [16]:
def test_var_args(f_arg, *argv):
    print("first normal arg:",f_arg)
    for arg in argv:
        print("another arg through *argv:",arg)
test_var_args('yasoob','python','eggs','test')

first normal arg: yasoob
another arg through *argv: python
another arg through *argv: eggs
another arg through *argv: test


In [17]:
def print_func(*args):
    print(type(args))
    print(args)
print_func(1,2,'python希望社',[])

<class 'tuple'>
(1, 2, 'python希望社', [])


In [18]:
def print_func(x,y,*args):
    print(type(x))
    print(x)
    print(y)
    print(type(args))
    print(args)
print_func(1,2,'python希望社',[])

<class 'int'>
1
2
<class 'tuple'>
('python希望社', [])


若 `*args` 不是在最后，则需要在参数传入时，明确定义 `*args`后面的变量参数名(**否则会报错**)，如下：

In [19]:
# 改正的代码
def print_func(*args,x,y):
    print(type(x))
    print(x)
    print(y)
    print(type(args))
    print(args)
print_func(1,2,'python希望社',[],x='x',y='y')

<class 'str'>
x
y
<class 'tuple'>
(1, 2, 'python希望社', [])


** kwargs 的用法

```**kwargs允许你将不定长度的 【键值对 key-value 】，作为参数传递给一个函数。如果你想要在一个函数里处理带名字的参数，你应该使用**kwargs```

In [23]:
def func(**kwargs):
    if kwargs.get('explore'):
        print("Exploring mode is on.")

func(explore=True)  # 调用时传递 explore 参数

Exploring mode is on.


In [21]:
def print_func(**kwargs):
    print(type(kwargs))
    print(kwargs)

print_func(a=1, b=2, c='呵呵哒', d=[])

<class 'dict'>
{'a': 1, 'b': 2, 'c': '呵呵哒', 'd': []}


In [22]:
def greet_me(**kwargs):
    for key, value in kwargs.items():
        print("{0} == {1}".format(key, value))
greet_me(name="yasoob")

name == yasoob


In [24]:
'组合使用arg,*arg,**arg'
def print_func(x, *args, **kwargs):
    print(x)
    print(args)
    print(kwargs)

print_func(1, 2, 3, 4, y=1, a=2, b=3, c=4)

1
(2, 3, 4)
{'y': 1, 'a': 2, 'b': 3, 'c': 4}


In [25]:
def test_args_kwargs(arg1,arg2,arg3):
    print("arg1:",arg1)
    print("arg2:",arg2)
    print("arg3:",arg3)
# 首先你可以使用 *args
args = ("two",3,5)
test_args_kwargs(*args)

#-------- 得到输出结果如下所示：----------------------
# arg1: two
# arg2: 3
# arg3: 5
# ---------------------------------------------------
#  现在使用 **kwargs
kwargs = {"arg3": 3,"arg2":"two","arg1":5}
test_args_kwargs(**kwargs)

#-------- 得到输出结果如下所示：----------------------
# arg1: 5
# arg2: two
# arg3: 3
# ---------------------------------------------------

arg1: two
arg2: 3
arg3: 5
arg1: 5
arg2: two
arg3: 3


## zip()

In [19]:
a = [1,2,3]
b = [4,5,6]
c = [4,5,6,7,8]
zipped = zip(a,b)
print(zipped)
list(zipped)

<zip object at 0x00000252684D3708>


[(1, 4), (2, 5), (3, 6)]

In [12]:
a = [1, 2, 3]
b = [4, 5, 6]
c = [7, 8, 9, 10, 11]
zipped01 = zip(a, b)  # 打包为元组的列表
zipped02 = zip(a, c)  # 打包为元组的列表
print(zipped01)
print(list(zipped01))
print(list(zipped02))

<zip object at 0x000001D108B78488>
[(1, 4), (2, 5), (3, 6)]
[(1, 7), (2, 8), (3, 9)]


## zip(*)

In [12]:
# 常规解包方法
a = (1,2,3) # 元组
a1,a2,a3 = (1,2,3)
print(a1)
print(a2)
print(a3)

1
2
3


In [25]:
# 使用zip(*)解包
from collections import namedtuple, deque

# 四种d出来的结果都是一样的，为啥？
# d = [[1, 2, 3, 4, 5], [4, 5, 6, 7, 8, 9, 10]]
# d = [(1, 2, 3, 4, 5), (4, 5, 6, 7, 8, 9, 10)]
# d = ([1, 2, 3, 4, 5], [4, 5, 6, 7, 8, 9, 10])
d = ((1, 2, 3, 4, 5), (4, 5, 6, 7, 8, 9, 10))
zipped03 = zip(*d)
print(list(zipped03)) # 不但解包，而且还转置了
# print([zipped03]) 只返回位置

Transition = namedtuple('Transition',
                        ('state', 'action', 'next_state',
                         'reward'))
#生成一个列表，列表中是元组
a = [(1,2,3,4),(11,12,13,14),(21,22,23,24),(31,32,33,34)]
b = zip(*a)
# print(b) 只返回位置
b = list(b)
c = Transition(*zip(*a))
c = list(c)
print(c)
# 用列表表示转置后的数值
print([list(i) for i in zip(*a)])

[(1, 4), (2, 5), (3, 6), (4, 7), (5, 8)]
[(1, 11, 21, 31), (2, 12, 22, 32), (3, 13, 23, 33), (4, 14, 24, 34)]
[[1, 11, 21, 31], [2, 12, 22, 32], [3, 13, 23, 33], [4, 14, 24, 34]]


In [23]:
# zip(*)会转置而且截断为最短列表长度
A = [1, 2, 3]
B = [4, 5, 6, 7, 8]
C = [8, 9, 10, 11, 12]
for a, b, c in zip(A, B, C):
    print(f"{a}, {b}, {c}")

1, 4, 8
2, 5, 9
3, 6, 10


In [14]:
# 声明一个列表
nums = [['a1', 'a2', 'a3'], ['b1', 'b2', 'b3']]

# 参数为list数组时，是压缩数据，相当于zip()函数
iters = zip(*nums)  
# 输出zip(*zipped)函数返回对象的类型
print("type of iters is %s" % type(iters))  
# 因为zip(*zipped)函数返回一个zip类型对象，所以我们需要对其进行转换
# 在这里，我们将其转换为字典
print(dict(iters))

type of iters is <class 'zip'>
{'a1': 'b1', 'a2': 'b2', 'a3': 'b3'}


注意：该dict()函数可用于将zip对象转换为字典。需要注意的是，只能使用两个zip()参数，前者产生key，后者产生value。

## *zip()函数

In [15]:
# 创建2个列表
m = [1, 2, 3]
n = [4, 5, 6]

print("*zip(m, n)返回:", *zip(m, n))
m2, n2 = zip(*zip(m, n))
print("m2和n2的值分别为:", m2, n2)
# 若相等，返回True；说明*zip为zip的逆过程
print(m == list(m2) and n == list(n2))

*zip(m, n)返回: (1, 4) (2, 5) (3, 6)
m2和n2的值分别为: (1, 2, 3) (4, 5, 6)
True


## namedtuple

In [28]:
from collections import namedtuple

# 定义一个namedtuple类型User，并包含name，sex和age属性。
User = namedtuple('User', ['name', 'sex', 'age'])

# 创建一个User对象
user = User(name='kongxx', sex='male', age=21)

# 也可以通过一个list来创建一个User对象，这里注意需要使用"_make"方法
user = User._make(['kongxx', 'male', 21])

print(user)
# User(name='user1', sex='male', age=21)

# 获取用户的属性
print(user.name)
print(user.sex)
print(user.age)

# 修改对象属性，注意要使用"_replace"方法
user = user._replace(age=22)
print(user)
# User(name='user1', sex='male', age=21)

# 将User对象转换成字典，注意要使用"_asdict"
print(user._asdict())
# OrderedDict([('name', 'kongxx'), ('sex', 'male'), ('age', 22)])

User(name='kongxx', sex='male', age=21)
kongxx
male
21
User(name='kongxx', sex='male', age=22)
OrderedDict([('name', 'kongxx'), ('sex', 'male'), ('age', 22)])


## Box类

In [44]:
from gym import spaces
import numpy as np
print('输出一个与shape参数指定大小的矩阵，矩阵的数值正态分布采样生成，并且这个3*4的矩阵的数值的上限为high参数，下限为low参数。')
a=spaces.Box(low=-1,high=2,shape=(3,4))
print("\r",a.sample(),end=" ")
print('\n不对数据sample')
a=spaces.Box(low=-1,high=2,shape=(3,4))
print("\r",a,end=" ")
print('\n输出一个1 * 2（一行两列）的ndarray类型（ndarray类型是numpy包里定义的数据类型）的数组，数组的数值正态分布采样生成，并且这个1*2的数组的数值的上限为high参数，下限为low参数。')
a=spaces.Box(low=np.array([-1, -2]), high=np.array([2.0, 4.0]), dtype=np.float32)
for i in range(10):
    print(a.sample())
print('\n不对数据sample')
a=spaces.Box(low=np.array([-1, -2]), high=np.array([2.0, 4.0]), dtype=np.float32)
print(a)

输出一个与shape参数指定大小的矩阵，矩阵的数值正态分布采样生成，并且这个3*4的矩阵的数值的上限为high参数，下限为low参数。
 [[-0.82098436  0.16519162  1.656999    0.6244945 ]
 [ 0.8260099   1.2651362  -0.6286092   1.3861233 ]
 [-0.7776112   1.6446414   0.4964102   0.2741933 ]] 
不对数据sample
 Box(-1.0, 2.0, (3, 4), float32) 
输出一个1 * 2（一行两列）的ndarray类型（ndarray类型是numpy包里定义的数据类型）的数组，数组的数值正态分布采样生成，并且这个1*2的数组的数值的上限为high参数，下限为low参数。
[ 1.4676481 -0.7341325]
[1.1444509 1.4857175]
[0.5865058  0.17672935]
[-0.33631134 -0.16783987]
[ 1.0294192 -1.4618783]
[1.3939005 0.816857 ]
[1.7860607 1.8121102]
[1.6478595 1.725681 ]
[1.6674246 3.0977757]
[-0.46322843 -0.56891364]

不对数据sample
Box([-1. -2.], [2. 4.], (2,), float32)


## random.choice用法

In [60]:
import numpy as np
'从0到n抽取'
print(np.random.choice(5))#从[0, 5)中随机输出一个随机数
print(np.random.choice(5, 3))#在[0, 5)内输出3个数字并组成一维数组（ndarray）
'从数组、列表或元组中抽取'
L = [1, 2, 3, 4, 5]#list列表
T = (2, 4, 6, 2)#tuple元组
A = np.array([4, 2, 1])#numpy,array数组,必须是一维的
#二维数组会报错，必须用一维数组输入
print(np.random.choice(L, 5))
print(np.random.choice(T, 5))
print(np.random.choice(A, 5))
'参数是否可取相同元素'
print(np.random.choice(5, 6, replace=True))#可以看到有相同元素
print(np.random.choice(5, 5, replace=False))

0
[4 1 1]
[2 2 2 5 5]
[6 6 2 2 6]
[2 2 4 1 4]
[0 4 2 1 1 3]
[4 2 1 0 3]


## .view()

In [59]:
import torch
import numpy as np
print('转换维度')
x = torch.randn(4, 4)
print(x.size())
y = x.view(16)
print(y.size())
z = x.view(-1, 8)  # -1表示该维度取决于其它维度大小，即（4*4）/ 8
print(z.size())
m = x.view(2, 2, 4) # 也可以变为更多维度
print(m.size())
print('转换为一维')
a = torch.Tensor([[1, 2, 3], [4, 5, 6]]) # 定义一个 2*3 的 Tensor
a = a.view(-1)
print(a)


转换维度
torch.Size([4, 4])
torch.Size([16])
torch.Size([2, 8])
torch.Size([2, 2, 4])
转换为一维
tensor([1., 2., 3., 4., 5., 6.])


## torch.where

In [61]:
x=torch.randn(3,2)
y=torch.ones(3,2)
torch.where(x>0,x,y) # 条件，是就怎样，不是又怎样

tensor([[0.3308, 0.5350],
        [0.0354, 1.0000],
        [1.5321, 1.0000]])

## torch.max

In [64]:
# (max, max_indices) = torch.max(input, dim, keepdim=False)
# 输入：
# input 是输入的tensor,dim 是索引的维度，
# dim=0寻找每一列的最大值，dim=1寻找每一行的最大值,
# keepdim 表示是否需要保持输出的维度与输入一样，
# keepdim=True表示输出和输入的维度一样，
# keepdim=False表示输出的维度被压缩了，
# 也就是输出会比输入低一个维度。
# 输出：
# max 表示取最大值后的结果，max_indices 表示最大值的索引。

x = torch.randint(0,9,(2,4))
print(x)
y = torch.max(x, 1)
print(y)

tensor([[4, 7, 1, 5],
        [7, 8, 8, 7]])
torch.return_types.max(
values=tensor([7, 8]),
indices=tensor([1, 1]))


In [65]:
#取每一行的最大值，torch.max的输出结果
y = torch.max(x, 1, keepdim=True)[0]
# keepdim=True，输出仍然是二维的
print(y)
print(np.shape(y))

tensor([[7],
        [8]])
torch.Size([2, 1])


In [66]:
y = torch.max(x, 1, keepdim=False)[0]
# keepdim=False，输出变成了一维
print(y)
print(np.shape(y))

tensor([7, 8])
torch.Size([2])


## .detach() 和.detach_()（后者少用）

***tensor.detach()*** 返回一个新的tensor，从当前计算图中分离下来的，但是仍指向原变量的存放位置,不同之处只是requires_grad为false，得到的这个tensor永远不需要计算其梯度，不具有grad。即使之后重新将它的requires_grad置为true,它也不会具有梯度grad，这样我们就会继续使用这个新的tensor进行计算，后面当我们进行反向传播时，到该调用detach()的tensor就会停止，不能再继续向前进行传播。
注意：
使用detach返回的tensor和原始的tensor共同一个内存，即一个修改另一个也会跟着改变。

***tensor.detach_()*** 将一个tensor从创建它的图中分离，并把它设置成叶子tensor，其实就相当于变量之间的关系本来是x -> m -> y,这里的叶子tensor是x，但是这个时候对m进行了m.detach_()操作,其实就是进行了两个操作：

1、将m的grad_fn的值设置为None,这样m就不会再与前一个节点x关联，这里的关系就会变成x, m -> y,此时的m就变成了叶子结点

2、然后会将m的requires_grad设置为False，这样对y进行backward()时就不会求m的梯度

总结：其实detach()和detach_()很像，两个的区别就是detach_()是对本身的更改，detach()则是生成了一个新的tensor，比如x -> m -> y中如果对m进行detach()，后面如果反悔想还是对原来的计算图进行操作还是可以的，但是如果是进行了detach_()，那么原来的计算图也发生了变化，就不能反悔了.

来源：https://blog.csdn.net/qq_43722079/article/details/136583592
https://blog.csdn.net/qq_27825451/article/details/95498211

In [3]:
import torch
a = torch.tensor([1, 2, 3.], requires_grad=True)
print(a.grad)
out = a.sigmoid()
out.sum().backward()# 求导常见写法，等同于out.backward(gradient=torch.ones(len(out)))
print(a.grad)

None
tensor([0.1966, 0.1050, 0.0452])


In [5]:
'当使用detach()分离tensor但是没有更改这个tensor时，'
'并不会影响backward():'
a = torch.tensor([1, 2, 3.], requires_grad=True)
print(a.grad)
out = a.sigmoid()
print(out)

#添加detach(),c的requires_grad为False
c = out.detach()
print(c)

#这时候没有对c进行更改，所以并不会影响backward()
out.sum().backward()
print(a.grad)

None
tensor([0.7311, 0.8808, 0.9526], grad_fn=<SigmoidBackward0>)
tensor([0.7311, 0.8808, 0.9526])
tensor([0.1966, 0.1050, 0.0452])


In [6]:
'当使用detach()分离tensor，然后用这个分离出来的tensor去求导数，'
'会影响backward()，会出现错误'
a = torch.tensor([1, 2, 3.], requires_grad=True)
print(a.grad)
out = a.sigmoid()
print(out)

#添加detach(),c的requires_grad为False
c = out.detach()
print(c)

#使用新生成的Variable进行反向传播
c.sum().backward()
print(a.grad)

None
tensor([0.7311, 0.8808, 0.9526], grad_fn=<SigmoidBackward0>)
tensor([0.7311, 0.8808, 0.9526])


RuntimeError: element 0 of tensors does not require grad and does not have a grad_fn

In [7]:
'当使用detach()分离tensor并且更改这个tensor时，'
'即使再对原来的out求导数，会影响backward()，会出现错误'
a = torch.tensor([1, 2, 3.], requires_grad=True)
print(a.grad)
out = a.sigmoid()
print(out)

#添加detach(),c的requires_grad为False
c = out.detach()
print(c)
c.zero_() #使用in place函数对其进行修改

#会发现c的修改同时会影响out的值
print(c)
print(out)

#这时候对c进行更改，所以会影响backward()，这时候就不能进行backward()，会报错
out.sum().backward()
print(a.grad)


None
tensor([0.7311, 0.8808, 0.9526], grad_fn=<SigmoidBackward0>)
tensor([0.7311, 0.8808, 0.9526])
tensor([0., 0., 0.])
tensor([0., 0., 0.], grad_fn=<SigmoidBackward0>)


RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation: [torch.FloatTensor [3]], which is output 0 of SigmoidBackward0, is at version 1; expected version 0 instead. Hint: enable anomaly detection to find the operation that failed to compute its gradient, with torch.autograd.set_detect_anomaly(True).

## @用法

```python
def decorator(func):
   return func
 
@decorator
def some_func():
    pass
```
等效于以下代码：
```python
def decorator(func):
    return func
 
def some_func():
    pass
 
some_func = decorator(some_func)
```

In [8]:
class Pizza(object):
    def __init__(self):
        self.toppings = []
 
    def __call__(self, topping):
        # When using '@instance_of_pizza' before a function definition
        # the function gets passed onto 'topping'.
        self.toppings.append(topping())
 
    def __repr__(self):
        return str(self.toppings)
 
pizza = Pizza()
@pizza
def cheese():
    return 'cheese'
@pizza
def sauce():
    return 'sauce'
print(pizza)
# ['cheese', 'sauce']

['cheese', 'sauce']


这表明在修饰符之后定义的function / method / class基本上只是在@符号之后作为argument传递给function / method。

以下两种写法等同

In [10]:
class WithoutDecorators:
    def some_static_method():
        print("this is static method")
    some_static_method = staticmethod(some_static_method)

    def some_class_method(cls):
        print("this is class method")
    some_class_method = classmethod(some_class_method)

In [11]:
class WithDecorators:
    @staticmethod
    def some_static_method():
        print("this is static method")
 
    @classmethod
    def some_class_method(cls):
        print("this is class method")

## 常用的@classmethod、@staticmethod和@property

### @classmethod：

- 这是一个装饰器，它将一个方法定义为类方法。
- 类方法的第一个参数是类本身，通常使用cls作为参数名。
- 可以通过类直接调用类方法，也可以通过类的实例调用。
- 类方法可以访问和修改类属性。

In [25]:
class MyClass:
    def hello1():
        print('hello1')
    def hello2(self):
        print('hello2')
    @classmethod
    def my_method(cls):
        print(cls)
        
instance = MyClass() # 实例化
MyClass.my_method()  # 通过类调用 
instance.my_method()  # 通过实例调用
MyClass.hello1() # 可以通过类调用普通方法
instance.hello2() # 实例调用不了hello
# hello1无法用实例调用，hello2无法通过类本身调用

<class '__main__.MyClass'>
<class '__main__.MyClass'>
hello1
hello2


In [2]:
class Date(object):
    
    def __init__(self, day=0, month=0, year=0):
        self.day = day
        self.month = month
        self.year = year

    @classmethod
#   cls 代表的是类本身，而不是类的实例。这相当酷，因为如果我们继承了我们的 Date 类，所有的子类也都会有 from_string 方法。
    def from_string(cls, date_as_string):
        day, month, year = map(int, date_as_string.split('-'))
        date1 = cls(day, month, year)
        return date1

    @staticmethod
    def is_date_valid(date_as_string):
        day, month, year = map(int, date_as_string.split('-'))
        return day <= 31 and month <= 12 and year <= 3999

date2 = Date.from_string('11-09-2012')
is_date = Date.is_date_valid('11-09-2012')


### @staticmethod
- 这是一个装饰器，它将一个方法定义为静态方法。
- 静态方法不需要类或实例的引用作为第一个参数。
- 静态方法不能访问类的状态（即类属性或实例属性）。
- 它们通常用于实现与类相关但不需要类或实例数据的功能。

静态方法与实例方法之间有几个重要的区别：
- 参数传递：静态方法不需要接收类或实例作为第一个参数，因此不需要 self 或 cls 参数。
- 访问属性：静态方法不能直接访问类或实例的属性，因为它们不接收 self 或 cls 参数。
- 调用方式：静态方法可以通过类名直接调用，而实例方法需要通过类的实例调用。

辅助函数
- 静态方法常用于定义一些与类密切相关但不需要访问实例属性的辅助函数。这些函数通常用于执行特定的任务或提供特定的功能，与类的其他方法共同完成某个操作。
```python
class MathUtil:
    @staticmethod
    def add(x, y):
        return x + y
 
    @staticmethod
    def subtract(x, y):
        return x - y
# 调用静态方法
print(MathUtil.add(5, 3))        # 输出: 8
print(MathUtil.subtract(5, 3))   # 输出: 2
```

类功能相关的函数组
- 有时候，可能需要在一个类中定义一组功能相关的函数，这些函数共同完成某个任务，但不需要访问实例的状态。静态方法可以很好地满足这种需求，使得代码更加模块化和可维护。

```python
class FileUtils:
    @staticmethod
    def get_file_extension(filename):
        return filename.split('.')[-1]
 
    @staticmethod
    def is_image(filename):
        extensions = ['jpg', 'jpeg', 'png', 'gif']
        return FileUtils.get_file_extension(filename).lower() in extensions
# 使用静态方法检查文件是否为图片
print(FileUtils.is_image('example.jpg'))   # 输出: True
print(FileUtils.is_image('document.pdf'))  # 输出: False
```
工厂函数
- 静态方法常常被用作工厂函数，用于创建类的实例。工厂函数在创建实例时提供了更灵活的方式，可以根据传入的参数不同返回不同类型的实例。
```python
class Shape:
    def __init__(self, width, height):
        self.width = width
        self.height = height
 
    @staticmethod
    def create_rectangle(width, height):
        return Shape(width, height)
 
    @staticmethod
    def create_square(side_length):
        return Shape(side_length, side_length)

# 使用静态方法创建不同类型的形状实例
rectangle = Shape.create_rectangle(4, 6)
square = Shape.create_square(5)
 
print(rectangle.width, rectangle.height)  # 输出: 4 6
print(square.width, square.height)        # 输出: 5 5
```

In [30]:
class MyClass:
    @staticmethod
    def my_method():
        print("This is a static method.")

MyClass.my_method()  # 静态方法可通过类调用
instance = MyClass()
instance.my_method()  # 也可以通过实例调用，但实例参数会被忽略

This is a static method.
This is a static method.


### @property 
- @property是 Python 中的一个装饰器，它用于将一个方法转变为属性。使用 @property 可以创建只读属性，或者在属性被访问时执行特定的代码。
- 当你使用 @property 装饰器时，你实际上是在定义一个 getter 方法，该方法可以被像普通属性一样访问。此外，你还可以使用 @<property_name>.setter 装饰器来定义一个 setter 方法，用于设置属性的值，并在设置值时执行特定的代码。

在这个例子中：
- @property 装饰器定义了 name 属性的 getter 方法。
- @name.setter 装饰器定义了 name 属性的 setter 方法，它还包含了一些逻辑来确保设置的名称是字符串类型。

使用 @property 的好处包括：
- 提供对属性访问的控制，可以在访问或设置属性时添加逻辑。
- 代码的封装性更好，隐藏了属性背后的实现细节。
- 使得类的接口看起来更像一个简单的属性访问，而不是方法调用。
- 使用 @property 是一种实现封装和数据验证的好方法，同时保持了代码的简洁性和易用性。

In [28]:
class Person:
    def __init__(self, name):
        self._name = name  # 使用一个下划线前缀来表示这是一个受保护的属性

    @property
    def name(self):
        return self._name

    @name.setter
    def name(self, value):
        if not isinstance(value, str):
            raise ValueError("Name must be a string.")
        self._name = value

# 使用
person = Person("Alice")
print(person.name)  # 使用@property访问属性

person.name = "Bob"  # 使用@name.setter设置属性
print(person.name)

Alice
Bob


1. property 应用场景
- 在获取、设置和删除对象属性的时候，需要额外做一些工作。比如在游戏编程中，设置敌人死亡之后需要播放死亡动画。
- 需要限制对象属性的设置和获取。比如用户年龄为只读，或者在设置用户年龄的时候有范围限制。
- 这时就可以使用 property 工具，它把方法包装成属性，让方法可以以属性的形式被访问和调用。
2. property() 函数
- 语法：property(fget=None, fset=None, fdel=None, doc=None) -> property attribute
- 说明：
    fget 是获取属性值的方法。
    fset 是设置属性值的方法。
    fdel 是删除属性值的方法。
- doc 是属性描述信息。如果省略，会把 fget 方法的 docstring 拿来用（如果有的话）
示例代码：

In [18]:
class Student:
    def __init__(self):
        self._age = None

    def get_age(self):
        print('获取属性时执行的代码')
        return self._age

    def set_age(self, age):
        print('设置属性时执行的代码')
        self._age = age

    def del_age(self):
        print('删除属性时执行的代码')
        del self._age

    age = property(get_age, set_age, del_age, '学生年龄')


student = Student()
# 注意要用 类名.属性.__doc__ 的形式查看属性的文档字符串
print('查看属性的文档字符串：' + Student.age.__doc__)
"""
查看属性的文档字符串：学生年龄
"""

# 设置属性
student.age = 18
"""
设置属性时执行的代码
"""

# 获取属性
print('学生年龄为：' + str(student.age))
"""
获取属性时执行的代码
学生年龄为：18
"""

# 删除属性
del student.age
"""
删除属性时执行的代码
"""

查看属性的文档字符串：学生年龄
设置属性时执行的代码
获取属性时执行的代码
学生年龄为：18
删除属性时执行的代码


'\n删除属性时执行的代码\n'

3. @property 装饰器
@property 语法糖提供了比 property() 函数更简洁直观的写法。
- 被 @property 装饰的方法是获取属性值的方法，被装饰方法的名字会被用做 属性名。
- 被 @属性名.setter 装饰的方法是设置属性值的方法。
- 被 @属性名.deleter 装饰的方法是删除属性值的方法。
以下示例代码与使用 property() 函数版本的代码等价：

In [19]:
class Student:
    def __init__(self):
        self._age = None

    @property
    def age(self):
        print('获取属性时执行的代码')
        return self._age

    @age.setter
    def age(self, age):
        print('设置属性时执行的代码')
        self._age = age

    @age.deleter
    def age(self):
        print('删除属性时执行的代码')
        del self._age


student = Student()

# 设置属性
student.age = 18
"""
设置属性时执行的代码
"""

# 获取属性
print('学生年龄为：' + str(student.age))
"""
获取属性时执行的代码
学生年龄为：18
"""

# 删除属性
del student.age
"""
删除属性时执行的代码
"""

设置属性时执行的代码
获取属性时执行的代码
学生年龄为：18
删除属性时执行的代码


'\n删除属性时执行的代码\n'

在Python中，@property 装饰器用于将一个方法变为属性访问器，使得该方法可以通过点操作符（.）访问，就像访问普通的属性一样。当你使用 @property 装饰器时，通常会配合一个 getter 方法，有时还包括 setter 方法和 deleter 方法。

下面是 @property 装饰器的基本用法：

In [20]:
class MyClass:
    def __init__(self, value):
        self._my_attribute = value

    @property
    def my_attribute(self):
        # getter 方法
        return self._my_attribute

    @my_attribute.setter
    def my_attribute(self, value):
        # setter 方法
        self._my_attribute = value

    @my_attribute.deleter
    def my_attribute(self):
        # deleter 方法
        del self._my_attribute

在这个例子中：

- @property 装饰器应用于 my_attribute 方法，将其转换为属性访问器。这意味着你可以通过 obj.my_attribute 来访问这个属性。
- @my_attribute.setter 装饰器用于定义一个设置器（setter），允许你为属性赋值。设置器的第一个参数通常是 value，表示要设置的新值。
- @my_attribute.deleter 装饰器用于定义一个删除器（deleter），允许你删除这个属性。
只有被 @property 装饰的方法才会被视为属性访问器，并且它下面的直接方法定义（通常是 setter 方法）会与它关联。如果你在 @property 下面定义了多个方法，只有紧跟在 @property 后面的第一个方法会被当作 getter 方法，而其他的方法则不会被当作属性的一部分。

例如：

In [21]:
class MyClass:
    def __init__(self, value):
        self._my_attribute = value

    @property
    def my_attribute(self):
        # 这是 getter 方法
        return self._my_attribute

    def some_other_method(self):
        # 这个方法不受 @property 的影响
        pass

    @my_attribute.setter
    def my_attribute(self, value):
        # 这是 setter 方法，与 @property 相关联
        self._my_attribute = value

在这个例子中，some_other_method 不受 @property 的影响，因为它不是 my_attribute 属性的一部分。只有紧跟在 @property 装饰器后面的 my_attribute 方法和 @my_attribute.setter 装饰的 my_attribute 方法会构成属性的 getter 和 setter。

## 类和结构体
python中没有结构体，但是可以用类、命名元祖和字典代替

（1）用类代替结构体

In [41]:
# 首先定义一个类，要有__init__
class SN:
    def __init__(self):
        self.data = ""
        self.datalen = ""
        self.datatype = ""

# 开始初始化结构体
a = SN()
a.data = "233333"
a.datalen = len(a.data)
a.datatype = type(a.data)

print(
    f"a.data: {a.data}\n"
    f"a.datalen: {a.datalen}\n"
    f"a.datatype: {a.datatype}\n"
)


a.data: 233333
a.datalen: 6
a.datatype: <class 'str'>



In [42]:
class test:
    def __init__(self):
        self.a=1
        self.b=2
Test=test()
print(Test.a)
Test.b=1
print(Test.b)

1
1


（2）用命名元组代替结构体

In [43]:
from collections import namedtuple

MyStruct = namedtuple("MyStruct", ["var1", "var2", "var3"])

# 创建结构体实例
my_struct = MyStruct("Value 1", 2, True)

# 访问结构体成员变量
print(my_struct.var1)  # 输出：Value 1
print(my_struct.var2)  # 输出：2
print(my_struct.var3)  # 输出：True


Value 1
2
True


（3）用字典代替结构体

In [44]:
my_struct = {
    "var1": "Value 1",
    "var2": 2,
    "var3": True
}

# 访问结构体成员变量
print(my_struct["var1"])  # 输出：Value 1
print(my_struct["var2"])  # 输出：2
print(my_struct["var3"])  # 输出：True


Value 1
2
True


（4）用argparse传入数值（后面有写）

## 继承、抽象与组合

### 继承
 假如已经有几个类，而类与类之间有共同的变量属性和函数属性，那就可以把这几个变量属性和函数属性提取出来作为基类的属性。而特殊的变量属性和函数属性，则在本类中定义，这样只需要继承这个基类，就可以访问基类的变量属性和函数属性。可以提高代码的可扩展性。
 
 使用继承的话,任何一点小的变化也需要重新定义一个类,很容易引起类的爆炸式增长,产生一大堆有着细微不同的子类. 所以有个 **“多用组合少用继承”** 的原则。

In [3]:
# 在Python中，类的继承是通过在类定义时在括号中指定一个或多个父类（基类或超类）来实现的。子类（派生类）会继承父类的所有属性和方法。如果子类需要扩展或修改父类的行为，可以在子类中添加或重写相应的方法。
# 下面是一个简单的Python类继承的例子：

# 定义一个父类
class Animal:
    def __init__(self, name):
        self.name = name

    def speak(self):
        raise NotImplementedError("Subclasses must implement this method")

# 定义一个子类，继承自Animal
class Dog(Animal):
    def speak(self):
        return "Woof!"

# 定义另一个子类，同样继承自Animal
class Cat(Animal):
    def speak(self):
        return "Meow!"

# 创建子类的实例
dog = Dog("Buddy")
cat = Cat("Whiskers")

# 调用子类的方法
print(dog.speak())  # 输出: Woof!
print(cat.speak())  # 输出: Meow!

# 在这个例子中：
# - `Animal` 类是一个父类，它有一个初始化方法 `__init__` 和一个抽象方法 `speak`。
# - `Dog` 和 `Cat` 类是子类，它们都继承自 `Animal` 类。
# - 子类 `Dog` 和 `Cat` 都重写了 `speak` 方法，以提供具体的实现。

# Python支持多重继承，这意味着一个子类可以同时继承多个父类。例如：
class A:
    pass

class B:
    pass

class C(A, B):
    pass

# 在这个例子中，类 `C` 继承自两个父类 `A` 和 `B`。
# 继承是面向对象编程的一个重要特性，它允许代码复用，同时提供了一种组织和管理大型软件项目中复杂性的方法。


Woof!
Meow!


### 抽象（先抽象再继承）
抽象即提取类似的部分。
基类就是抽象多个类共同的属性得到的一个类。

In [4]:
class Riven:
    camp='Noxus'
    def __init__(self,nickname,
                 script,
                 aggressivity=54,
                 life_value=414,
                 ):
 
        self.nickname = nickname
        self.aggressivity = aggressivity
        self.life_value = life_value
        self.script=script
 
    def attack(self,enemy):
        print(self.script)
        enemy.life_value -= self.aggressivity
 
 
class Garen:
    camp='Demacia'
    def __init__(self,nickname,
                 script,
                 aggressivity=58,
                 life_value=455,
                 ):
        self.nickname = nickname
        self.aggressivity = aggressivity
        self.life_value = life_value
        self.script = script
 
    def attack(self,enemy):
        print(self.script)
        enemy.life_value -= self.aggressivity
 
 
g1=Garen("德玛西亚之力","人在塔在")
g1.camp="诺克萨斯"
r1=Riven("瑞雯","断剑重铸之日，骑士归来之时")
g1.attack(r1)
print(r1.life_value)

人在塔在
356


严格来说，上述Hero.init(self,...)，不能算作子类调用父类的方法。因为我们如果去掉（Hero）这个继承关系，代码仍能得到预期的结果。
总结python中继承的特点：
1. 在子类中，并不会自动调用基类的__init__()，需要在派生类中手动调用。
2. 在调用基类的方法时，需要加上基类的类名前缀，且需要带上self参数变量。
3. 先在本类中查找调用的方法，找不到才去基类中找。

### 组合
代码复用的重要的方式除了继承，还有组合。
组合，在一个类中以另一个类的对象作为数据属性，称为类的组合。

In [6]:
# 常规写法1（在类方法中访问）
class Skill:
    def fire(self):
        print("release Fire skill")

class Riven:
    camp='Noxus'
    def __init__(self,nickname):
        self.nickname=nickname
        self.skill5=Skill().fire()#Skill类产生一个对象，并调用fire()方法,赋值给实例的skill5属性

r1=Riven("瑞雯")

release Fire skill


In [4]:
# 常规写法2（在类初始化时访问）
class Engine:
    def start(self):
        print("Engine is starting.")

    def stop(self):
        print("Engine is stopping.")

class Wheel:
    def rotate(self):
        print("Wheel is rotating.")

class Car:
    def __init__(self):
        self.engine = Engine()
        self.wheels = [Wheel() for _ in range(4)]

    def start_engine(self):
        self.engine.start()

    def stop_engine(self):
        self.engine.stop()

    def drive(self):
        self.start_engine()
        for wheel in self.wheels:
            wheel.rotate()
        print("Car is driving.")

# 使用组合
my_car = Car()
my_car.drive()

Engine is starting.
Wheel is rotating.
Wheel is rotating.
Wheel is rotating.
Wheel is rotating.
Car is driving.


继承的方式
通过继承建立了派生类与基类之间的关系，它是一种'是'的关系，比如白马是马，人是动物。
```python
class Animal:
    def walk(self):
        print("Animal is walking")
    def eat(self):
        print("Animal is eating")
class Person(Animal):
    pass
p1=Person()
p1.walk()   #Animal is walking
```
组合的方式
用组合的方式建立了类与组合的类之间的关系，它是一种‘有’的关系,比如老师有生日，老师教python课程。
```python
class Teacher:
    def __init__(self,name,sex,course):
        self.name=name
        self.sex=sex
        self.course = course
class Course:
    def __init__(self, name, period):
        self.name = name
        self.period = period
co=Course("python","7 m")
t1=Teacher("zhang","male",co)
print(t1.course.name)
```
结果：

python

**当类之间有显著不同，并且较小的类是较大的类所需要的组件时，用组合比较好。**

In [6]:
# 写法3（通过实例访问）
class Teacher:
    def __init__(self,name,sex,course):
        self.name=name
        self.sex=sex
        self.course = course
class Course:
    def __init__(self, name, period):
        self.name = name
        self.period = period
co=Course("python","7 m")
t1=Teacher("zhang","male",co)
print(t1.course.name)

python


Python 类的继承和组合
https://blog.csdn.net/mpu_nice/article/details/108054838

Python面向对象之组合
https://www.cnblogs.com/Lea4ning/p/17961558

Python_抽象方法——@abc.abstractmethod的使用与解释
https://blog.csdn.net/qq_59344127/article/details/131004865

python的类的组合
https://blog.csdn.net/qq_36594235/article/details/110728933

In [16]:
# 要求：
# （1）：创建一个任务角色类Gamerole，构造方法中封装三个属性：name,ad（攻击力），hp（血量）
# （2）：Gamerole类中定义一个方法attack：实例化两个对象以及互相攻击的功能
# （3）：创建一个工具类Weapon，构造方法中封装三个属性：name,ad（攻击力）
# （4）：Weapon类中定义一个方法fight：实例化工具对象以及攻击的力度

class Gamerole:
    def __init__(self,name,ad,hp):
        self.name = name
        self.ad = ad
        self.hp = hp
#         self.wea = #[] #''# None 可以先把self.wea定义为空值，也可以不用
#         最后还是可以用到equipment函数定义的wea变量
    def attack(self,obj):
        obj.hp = obj.hp -self.ad
        print("%s 攻击%s ,%s 掉了 %s血，还剩%s血" % (self.name,obj.name,obj.name,self.ad,obj.hp))

    def equipment(self,wea):
        self.wea = wea
class Weapon:
    def __init__(self,name,ad):
        self.name = name
        self.ad = ad

    def fight(self,obj1,obj2):
        obj2.hp = obj2.hp - self.ad
        print("%s用%s 攻击%s ,%s 掉了 %s血，还剩%s血" % (obj1.name, self.name,obj2.name, obj2.name, self.ad, obj2.hp))
gamerole1 = Gamerole("role1",30,200)
gamerole2 = Gamerole("role2",20,100)

weapon1 = Weapon("刀",10)
weapon2 = Weapon("剑",20)

weapon1.fight(gamerole1,gamerole2)#方案1

# 通过实例传递属性
gamerole1.equipment(weapon1)
gamerole1.wea.fight(gamerole1,gamerole2)#方案2

# 方案一 和方案2 对比：
# 方案1使用的是非组合的形式，攻击的发起者是工具，
# 不符合人们的一个习惯，攻击的发起者应该是人，
# 故方案二使用了类的组合的形式，
# 其中对象gamerole1封装了一个属性weapon1，
# weapon1是另一个类Weapon的一个实例，
# 很好的解决了攻击的发起者是人的这个问题

NameError: name 'NaN' is not defined

## stack和cat

In [4]:
# stack沿着一个新维度对输入张量序列进行连接。 
# 序列中所有的张量都应该为相同形状。

import torch
# 假设是时间步T1的输出
T1 = torch.tensor([[1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]])
# 假设是时间步T2的输出
T2 = torch.tensor([[10, 20, 30],
        [40, 50, 60],
        [70, 80, 90]])
print(torch.stack((T1,T2),dim=0).shape)
print(torch.stack((T1,T2),dim=1).shape)
print(torch.stack((T1,T2),dim=2).shape)
print(torch.stack((T1,T2),dim=3).shape)
# outputs:
torch.Size([2, 3, 3])
torch.Size([3, 2, 3])
torch.Size([3, 3, 2])
'选择的dim>len(outputs)，所以报错'


torch.Size([2, 3, 3])
torch.Size([3, 2, 3])
torch.Size([3, 3, 2])


IndexError: Dimension out of range (expected to be in range of [-3, 2], but got 3)

In [5]:
# cat在现有维度上拼接输入的张量序列
# x1
x1 = torch.tensor([[11,21,31],[21,31,41]],dtype=torch.int)
x1.shape # torch.Size([2, 3])
# x2
x2 = torch.tensor([[12,22,32],[22,32,42]],dtype=torch.int)
x2.shape  # torch.Size([2, 3])
'inputs为２个形状为[2 , 3]的矩阵 '
inputs = [x1, x2]
print(inputs)
'打印查看'
[tensor([[11, 21, 31],
         [21, 31, 41]], dtype=torch.int32),
 tensor([[12, 22, 32],
         [22, 32, 42]], dtype=torch.int32)]


[tensor([[11, 21, 31],
        [21, 31, 41]], dtype=torch.int32), tensor([[12, 22, 32],
        [22, 32, 42]], dtype=torch.int32)]


NameError: name 'tensor' is not defined

## 

# Pettingzoo（环境用37）

In [3]:
# 测试petting zoo是否可用

from pettingzoo.mpe import simple_spread_v3
# discrete env
dis_env = simple_spread_v3.parallel_env(N=3, continuous_actions=False)
# continuous env
con_env = simple_spread_v3.parallel_env(N=3, continuous_actions=True)
dis_env.reset()
con_env.reset()
dis_env.action_space('agent_0').sample() # 2
con_env.action_space('agent_0').sample() # array([0.24120373, 0.83279127, 0.4586939 , 0.4208583 , 0.97381055], dtype=float32)

array([0.1907757 , 0.7369741 , 0.28813577, 0.49463144, 0.09961204],
      dtype=float32)

剪刀石头布测试

In [9]:
import functools

import gymnasium
import numpy as np
from gymnasium.spaces import Discrete

from pettingzoo import AECEnv
from pettingzoo.utils import agent_selector, wrappers

ROCK = 0
PAPER = 1
SCISSORS = 2
NONE = 3
MOVES = ["ROCK", "PAPER", "SCISSORS", "None"]
NUM_ITERS = 100
REWARD_MAP = {
    (ROCK, ROCK): (0, 0),
    (ROCK, PAPER): (-1, 1),
    (ROCK, SCISSORS): (1, -1),
    (PAPER, ROCK): (1, -1),
    (PAPER, PAPER): (0, 0),
    (PAPER, SCISSORS): (-1, 1),
    (SCISSORS, ROCK): (-1, 1),
    (SCISSORS, PAPER): (1, -1),
    (SCISSORS, SCISSORS): (0, 0),
}


def env(render_mode=None):
    """
    The env function often wraps the environment in wrappers by default.
    You can find full documentation for these methods
    elsewhere in the developer documentation.
    """
    internal_render_mode = render_mode if render_mode != "ansi" else "human"
    env = raw_env(render_mode=internal_render_mode)
    # This wrapper is only for environments which print results to the terminal
    if render_mode == "ansi":
        env = wrappers.CaptureStdoutWrapper(env)
    # this wrapper helps error handling for discrete action spaces
    env = wrappers.AssertOutOfBoundsWrapper(env)
    # Provides a wide vareity of helpful user errors
    # Strongly recommended
    env = wrappers.OrderEnforcingWrapper(env)
    return env


class raw_env(AECEnv):
    """
    The metadata holds environment constants. From gymnasium, we inherit the "render_modes",
    metadata which specifies which modes can be put into the render() method.
    At least human mode should be supported.
    The "name" metadata allows the environment to be pretty printed.
    """

    metadata = {"render_modes": ["human"], "name": "rps_v2"}

    def __init__(self, render_mode=None):
        """
        The init method takes in environment arguments and
         should define the following attributes:
        - possible_agents
        - render_mode

        Note: as of v1.18.1, the action_spaces and observation_spaces attributes are deprecated.
        Spaces should be defined in the action_space() and observation_space() methods.
        If these methods are not overridden, spaces will be inferred from self.observation_spaces/action_spaces, raising a warning.

        These attributes should not be changed after initialization.
        """
        self.possible_agents = ["player_" + str(r) for r in range(2)]

        # optional: a mapping between agent name and ID
        self.agent_name_mapping = dict(
            zip(self.possible_agents, list(range(len(self.possible_agents))))
        )

        # optional: we can define the observation and action spaces here as attributes to be used in their corresponding methods
        self._action_spaces = {agent: Discrete(3) for agent in self.possible_agents}
        self._observation_spaces = {
            agent: Discrete(4) for agent in self.possible_agents
        }
        self.render_mode = render_mode

    # Observation space should be defined here.
    # lru_cache allows observation and action spaces to be memoized, reducing clock cycles required to get each agent's space.
    # If your spaces change over time, remove this line (disable caching).
    @functools.lru_cache(maxsize=None)
    def observation_space(self, agent):
        # gymnasium spaces are defined and documented here: https://gymnasium.farama.org/api/spaces/
        return Discrete(4)

    # Action space should be defined here.
    # If your spaces change over time, remove this line (disable caching).
    @functools.lru_cache(maxsize=None)
    def action_space(self, agent):
        return Discrete(3)

    def render(self):
        """
        Renders the environment. In human mode, it can print to terminal, open
        up a graphical window, or open up some other display that a human can see and understand.
        """
        if self.render_mode is None:
            gymnasium.logger.warn(
                "You are calling render method without specifying any render mode."
            )
            return

        if len(self.agents) == 2:
            string = "Current state: Agent1: {} , Agent2: {}".format(
                MOVES[self.state[self.agents[0]]], MOVES[self.state[self.agents[1]]]
            )
        else:
            string = "Game over"
        print(string)

    def observe(self, agent):
        """
        Observe should return the observation of the specified agent. This function
        should return a sane observation (though not necessarily the most up to date possible)
        at any time after reset() is called.
        """
        # observation of one agent is the previous state of the other
        return np.array(self.observations[agent])

    def close(self):
        """
        Close should release any graphical displays, subprocesses, network connections
        or any other environment data which should not be kept around after the
        user is no longer using the environment.
        """
        pass

    def reset(self, seed=None, options=None):
        """
        Reset needs to initialize the following attributes
        - agents
        - rewards
        - _cumulative_rewards
        - terminations
        - truncations
        - infos
        - agent_selection
        And must set up the environment so that render(), step(), and observe()
        can be called without issues.
        Here it sets up the state dictionary which is used by step() and the observations dictionary which is used by step() and observe()
        """
        self.agents = self.possible_agents[:]
        self.rewards = {agent: 0 for agent in self.agents}
        self._cumulative_rewards = {agent: 0 for agent in self.agents}
        self.terminations = {agent: False for agent in self.agents}
        self.truncations = {agent: False for agent in self.agents}
        self.infos = {agent: {} for agent in self.agents}
        self.state = {agent: NONE for agent in self.agents}
        self.observations = {agent: NONE for agent in self.agents}
        self.num_moves = 0
        """
        Our agent_selector utility allows easy cyclic stepping through the agents list.
        """
        self._agent_selector = agent_selector(self.agents)
        self.agent_selection = self._agent_selector.next()

    def step(self, action):
        """
        step(action) takes in an action for the current agent (specified by
        agent_selection) and needs to update
        - rewards
        - _cumulative_rewards (accumulating the rewards)
        - terminations
        - truncations
        - infos
        - agent_selection (to the next agent)
        And any internal state used by observe() or render()
        """
        if (
            self.terminations[self.agent_selection]
            or self.truncations[self.agent_selection]
        ):
            # handles stepping an agent which is already dead
            # accepts a None action for the one agent, and moves the agent_selection to
            # the next dead agent,  or if there are no more dead agents, to the next live agent
            self._was_dead_step(action)
            return

        agent = self.agent_selection

        # the agent which stepped last had its _cumulative_rewards accounted for
        # (because it was returned by last()), so the _cumulative_rewards for this
        # agent should start again at 0
        self._cumulative_rewards[agent] = 0

        # stores action of current agent
        self.state[self.agent_selection] = action

        # collect reward if it is the last agent to act
        if self._agent_selector.is_last():
            # rewards for all agents are placed in the .rewards dictionary
            self.rewards[self.agents[0]], self.rewards[self.agents[1]] = REWARD_MAP[
                (self.state[self.agents[0]], self.state[self.agents[1]])
            ]

            self.num_moves += 1
            # The truncations dictionary must be updated for all players.
            self.truncations = {
                agent: self.num_moves >= NUM_ITERS for agent in self.agents
            }

            # observe the current state
            for i in self.agents:
                self.observations[i] = self.state[
                    self.agents[1 - self.agent_name_mapping[i]]
                ]
        else:
            # necessary so that observe() returns a reasonable observation at all times.
            self.state[self.agents[1 - self.agent_name_mapping[agent]]] = NONE
            # no rewards are allocated until both players give an action
            self._clear_rewards()

        # selects the next agent.
        self.agent_selection = self._agent_selector.next()
        # Adds .rewards to ._cumulative_rewards
        self._accumulate_rewards()

        if self.render_mode == "human":
            self.render()
            
# 运行部分
# import aec_rps

env1 = env(render_mode="human")
env1.reset(seed=42)

for agent in env1.agent_iter():
    observation, reward, termination, truncation, info = env1.last()

    if termination or truncation:
        action = None
    else:
        # this is where you would insert your policy
        action = env1.action_space(agent).sample()

    env1.step(action)
env1.close()

Current state: Agent1: PAPER , Agent2: None
Current state: Agent1: PAPER , Agent2: SCISSORS
Current state: Agent1: SCISSORS , Agent2: None
Current state: Agent1: SCISSORS , Agent2: SCISSORS
Current state: Agent1: PAPER , Agent2: None
Current state: Agent1: PAPER , Agent2: ROCK
Current state: Agent1: SCISSORS , Agent2: None
Current state: Agent1: SCISSORS , Agent2: PAPER
Current state: Agent1: PAPER , Agent2: None
Current state: Agent1: PAPER , Agent2: ROCK
Current state: Agent1: ROCK , Agent2: None
Current state: Agent1: ROCK , Agent2: ROCK
Current state: Agent1: PAPER , Agent2: None
Current state: Agent1: PAPER , Agent2: SCISSORS
Current state: Agent1: ROCK , Agent2: None
Current state: Agent1: ROCK , Agent2: SCISSORS
Current state: Agent1: PAPER , Agent2: None
Current state: Agent1: PAPER , Agent2: PAPER
Current state: Agent1: ROCK , Agent2: None
Current state: Agent1: ROCK , Agent2: SCISSORS
Current state: Agent1: SCISSORS , Agent2: None
Current state: Agent1: SCISSORS , Agent2: ROC

## enumerate
用于自定义可迭代对象

In [21]:
for index, value in enumerate(['a', 'b', 'c']):# 默认start=0
    print(index, value)
for index, value in enumerate(['a', 'b', 'c'], start=1):# 自定义start
    print(index, value)

0 a
1 b
2 c
1 a
2 b
3 c


## argparse

argparse模块是命令行选项、参数和子命令解析器。可以让人轻松编写用户友好的命令行接口。适用于代码需要频繁地修改参数的情况。以下为实例

In [36]:
# 没有argparse
import math  # 为了获取π
def cylinder_volume(radius, height):
    vol = (math.pi) * (radius**2) * (height)  # 体积公式
    return vol
if __name__ == '__main__':
    print(cylinder_volume(1, 3))


9.42477796076938


In [37]:
# 有argparse1，这种方法最常用，因为它允许你在cmd中以任何顺序指定参数，并且参数的含义更明确
import math
import argparse  # 导入argparse模块
# 用来装载参数的容器
parser = argparse.ArgumentParser(description='Calculate volume of a cylinder')

'给这个解析对象添加命令行参数，名称前不加--就是位置参数，必须在命令行里面赋值，加了--是可选参数，可以用默认值'

parser.add_argument('--radius', type=int, default=1, help='Radius of cylinder')
parser.add_argument('--height', type=int, default=3, help='Height of cylinder')

args = parser.parse_args()  # 获取所有参数
def cylinder_volume(radius, height):
    vol = (math.pi) * (radius**2) * (height)
    return vol
if __name__ == '__main__':
    print(cylinder_volume(args.radius, args.height))

9.42477796076938


以上代码在命令行中的用法有
`python your_script.py`
或者改变参数
`python your_script.py --radius 2 --height 4`

In [38]:
# 有argparse2，这种方法较少，命令行里面参数必须按顺序输入
import math
import argparse

parser = argparse.ArgumentParser(description='Calculate volume of a cylinder')

"在这个版本中，radius和height仍然是位置参数，但是有了nargs='?' 表示这个参数是可选的。你可以这样运行脚本："

parser.add_argument('radius', type=int, nargs='?', default=1, help='Radius of cylinder')
parser.add_argument('height', type=int, nargs='?', default=3, help='Height of cylinder')

args = parser.parse_args()

# 使用参数
radius = args.radius
height = args.height

volume = math.pi * radius**2 * height
print(f"The volume of the cylinder is {volume:.2f}")

The volume of the cylinder is 9.42


以上代码在命令行中的用法有
`python your_script.py`
或者改变参数
`python your_script.py 2 4`

In [39]:
'argparse提供了简写形式如下'

import argparse

parser = argparse.ArgumentParser(description="Deep Gaussian Processes on MNIST")
parser.add_argument("-n", "--num-epochs", default=5, type=int)
parser.add_argument("-t", "--num-iters", default=60, type=int)
parser.add_argument("-b", "--batch-size", default=1000, type=int)
parser.add_argument("-lr", "--learning-rate", default=0.01, type=float)
 
parser.add_argument("-f","--file",default="file")#接收这个-f参数
args = parser.parse_args()
print(args.file)


file


使用这种方式定义参数后，你可以在命令行中用简写方式 `python your_script.py -n 10 -t 100 -b 500 -lr 0.001 -f myfile.txt`或完整形式`python your_script.py --num-epochs 10 --num-iters 100 --batch-size 500 --learning-rate 0.001 --file myfile.txt`指定参数，在代码中，你可以通过 `args.num_epochs、args.num_iters`等方式访问这些参数的值，无论它们是通过简写形式还是完整形式在命令行中指定的。