作者：邓擎琼

# numpy 数组

numpy提供了数组的构建方法，以及对数组进行处理的大量方法和函数。

numpy的官网：http://www.numpy.org/

官方文档：https://numpy.org/doc/stable/

## 1. numpy的导入惯例

In [None]:
import numpy as np

## 2. 数组的创建

数组的创建方法有很多，具体见下面的网页：

https://docs.scipy.org/doc/numpy/reference/routines.array-creation.html

```python
#列表转成numpy数组
a = np.array([1,2,3,4])
print(type(a), a)

#numpy数组转成列表
l = a.tolist()
print(type(l),l)

b = np.array([[1,2,3,4],[5,6,7,8]])
print(type(b), b)

#不初始化值
c = np.empty((3,2))
print(c)

#全为1
d1  = np.ones((2,3))
print(d1)

#全为0
d2 = np.zeros((2,2))
print(d2)

#和某个数组shape一样的全为0数组
d3 = np.zeros_like(c)
print(d3)

#对角矩阵
e = np.diag([5,8,9])
print(e)

#单位矩阵
f = np.eye(4)
print(f)

#类似range的等差数列，开始值、终值和步长
g = np.arange(0, 1, 0.1)
print(g)

#等差数列，但通过开始值、终值和元素个数来创建一维数组
h = np.linspace(0,10,5)
print(h)

#类似linspace，但是创建等比数列，开始值和终值都是10为底的mi
i = np.logspace(1,2,5)
print(i)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

### 2.1 数组的基本属性

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
a = np.random.rand(2,3)
print(a)

print(a.ndim)  #维度
print(a.shape, a.shape[0], a.shape[1]) #形状

print(a.size)  #元素总个数

print(a.dtype)  #元素类型

print(a.itemsize)  #一个元素存储所需字节数
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

### 2.2 数组的数据类型

#### 2.2.1 创建数组时指定数据类型

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
#通过dtype指定数组元素的数据类型
a = np.array([1,2,3,4],dtype='float32')
print(a)

b = np.ones((2,3),dtype='i2')
print(b)

c = np.array(['12345', 'zhang','张三','司马相如'], dtype='U3')
c
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

#### 2.2.2 修改数组的数据类型

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
a = np.array([1.5, 3.2, 5.7])
b = a.astype(int)
print(a)
print(b)

c = np.array([b'zhang',b'1234']).astype(str)
c
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

### 2.3 数组的形状及其操作

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    reshape 代码示例：
</div>

```python
#reshape
a = np.arange(1,9)
print(a)

b = a.reshape((2,4))
print(b)
print(a)

#原数据视图：一个变，另一个也变
b[1,1] = 100
print(a)
print(b)

a[0] = 99
print(a)
print(b)

#有一个轴为-1会自动计算
c = b.reshape((-1,2))
print(c)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    shape resize 代码示例：
</div>

```python
a = np.arange(1,9)
print(a)
print(a.shape)

a.shape=(-1,1)
print(a)
print(a.shape)

a.resize((2,4))
print(a)
print(a.shape)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    ravel flatten 把高维变成一维 代码示例：
</div>

```python
a = np.arange(1,9).reshape((2,4))
print(a)
print(a.shape)

b = a.ravel()
print(b)
print(b.shape)

c = a.reshape((a.size,))
print(c)
print(c.shape)

#ravel 会是原数据视图
b[0] = 99
c[1] = 100
print(a)
print(b)
print(c)

#flatten 不是元素组视图
d = a.flatten()
print(d)
print(d.shape)

d[2] = 98
print(d)
print(a)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    转置 代码示例：
</div>

```python
a = np.arange(2*3*4).reshape((2,3,4))
print(a)
print(a.shape)

b = a.T
print(b)
print(b.shape)

b[0,0,1] = 100
print(a)
print(b)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    任意确定各轴顺序 numpy.transpose 代码示例：
</div>

```python
a = np.arange(2*3*4).reshape((2,3,4))
print(a)
print(a.shape)

b = np.transpose(a, axes=[0,2,1])
print(b)
print(b.shape)

b = np.transpose(a, axes=[1,0,2])
print(b)
print(b.shape)

b[0,0,1] = 100
print(a)
print(b)

c = b.copy()
c[0,1,1] = 99
print(c)
print(b)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

## 3. 数组的组合及分割

### 3.1 数组的组合

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
a = np.array([[0,1,2],[3,4,5]])
b = np.array([[0,2,4],[6,8,10]])
print(a)
print(b)

#水平组合
c = np.hstack((a,b))
print(c)
print(c.shape)

#垂直组合
d = np.vstack((a,b))
print(d)
print(d.shape)

#上述两种组合可以用concatenate实现
c2 = np.concatenate((a,b), axis = 1)
print(c2)

d2 = np.concatenate((a,b), axis = 0)
print(d2)

#还有stack，但是和上述组合不同，会增加一个维度
c3 = np.stack((a,b), axis = 0)
print(c3)
print(c3.shape)

c3 = np.stack((a,b), axis = 1)
print(c3)
print(c3.shape)

c3 = np.stack((a,b), axis = 2)
print(c3)
print(c3.shape)

np.stack?
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

### 3.2 数组的分割

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
a = np.array([[0,1,2],[3,4,5]])
print(a)

#水平分割
a1,a2,a3 = np.hsplit(a,3)
print(a1)
print(a2)
print(a3)
print(a1.shape, a2.shape,a3.shape)

#垂直分割
a1,a2 = np.vsplit(a,2)
print(a1)
print(a2)
print(a1.shape, a2.shape)

#可以统一用split实现
a1,a2 = np.split(a,2, axis=0)
print(a1)
print(a2)
print(a1.shape, a2.shape)

a1,a2,a3 = np.split(a,3, axis=1)
print(a1)
print(a2)
print(a3)
print(a1.shape, a2.shape,a3.shape)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

## 4. 数组元素的存取

### 4.1 一维数组元素的存取

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
a = np.arange(10)
print(a)

#切片下标 用法和Python中的列表等相同
print(a[5])
print(a[1:-1:2])

a[2] = 100
print(a)

b = a[:4]
print(b)

#切片所获得的是原数组的视图
b[1] = -10
print(a)
print(b)

#高级下标
#高级下标1：整数列表/元组
c = a[[0,-1,2,5,7]]
print(c)

#高级下标2：整数数组
d = a[np.array([0,-1,2,5,7])]
print(d)

d2 = a[np.array([[0,-1,2],[5,7,5]])]
print(d2)

#高级下标3：bool数组
e = a[np.array([True, False]*5)]
print(e)

#bool数组常用于筛出数组中满足某个条件的元素
f = np.random.rand(4)
print(f)
print(f>=0.5) #结果为bool数组
print(f[f>=0.5])

#高级下标得到的数组不是原数组的视图
d [0] = 1000
print(d)
print(a)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

### 4.2 多维数组元素的存取

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
a = np.arange(30).reshape((5,6))
print(a)

#切片下标
print(a[0,3:5])
print(a[4:,2])
print(a[:,3])
print(a[1::2,::3])

#高级下标
print(a[(0,1,2),(2,3,4)]) 

print(a[:,(2,3,4)])

print(a[[0,1,2]])

#同上
print(a[[0,1,2],:])

print(a[1,[0,2,0]])

i = np.array((0,1,2))
j = np.array((2,3,4))
print(a[i,j])

i = np.array([1,0,1,1,0],dtype=bool)
print(a[i, 2])

i = np.array([[1,2,3],[2,3,4]])
j = np.array([[1,1,1],[2,2,2]])
print(a[i,j])
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

## 5. ufunc运算

universal function，是一种能对数组中<font color="red"> <b>每个元素</b></font>进行操作的函数，许多是C语言实现的，因此计算速度非常快。

https://docs.scipy.org/doc/numpy/reference/ufuncs.html#ufunc

<font color="red"> <b>写for循环之前要三思！！！</b></font>

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
a = np.array([-1,2,3])
print(np.abs(a))

print(np.exp(a))

print(np.power(a,3))

#四则运算
a = np.ones((2,2))
b = np.array([[2,0],[5,3]])
print(a)
print(b)

print(a+b)

print(a-b)

#不是你平时学的矩阵乘法，是相应位置的元素相乘
print(a*b)

#你平时学的叫点乘，如下：
print(a.dot(b))
#或者
print(a@b)

#出错，有除数为0
print(a/b)

#比较
a = np.array([0, 1, 2, 3, 4])
b = np.array([4, 3, 2, 1, 0])

print(a>2)

print(a==b)

print(a>b)

#非
print(~(a==b))
#或者logical_not
print(np.logical_not(a==b))

print((a==b)|(a>b))
#或者logical_or
print(np.logical_or(a==b, a>b))

print(np.all(a==b))

print(np.any(a==b))
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

## 6. 庞大的数组处理方法和函数

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    求和、平均值、方差、标准差、中位数: sum, mean/average, var, std, median
    代码示例：
</div>

```python
a = np.array([[3,7,2],[5,3,6]])
print(a)

#求和、平均值、方差、标准差、中位数: sum, mean/average, var, std, median 
print(a.sum())
print(a.sum(axis=0))  #axis是常用的参数，在哪个轴进行求和
print(a.sum(axis=1))

print(a.mean())
print(a.mean(axis=0)) #同理，axis指定在哪个轴求均值
print(a.mean(axis=1))

print(a.mean(dtype=int))
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    最值：min, max, ptp, argmin, argmax
    代码示例：
</div>

```python
a = np.array([[3,7,2],[5,3,6]])
print(a)

#最值：min, max, ptp（最大值和最小值之差）, argmin（最小值的位置）, argmax（最大值的位置）
print(a.min())
print(a.min(axis=0))
print(a.min(axis=1))

print(a.ptp(axis=1))

print(a.argmin())

print(a.argmin(axis=0))
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    排序：sort, argsort
    代码示例：
</div>

```python
a = np.array([[3,7,2],[5,3,6]])
print(a)

#排序：sort, argsort
b = a.copy()
a.sort()
print(a)

a.sort(axis=0)
print(a)

b.argsort(axis=1)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    查询：nonzero where
    代码示例：
</div>

```python
#查询：nonzero(a)，返回非零元素位置，是下标组成的元组
a = np.eye(3)
print(a)
print(np.nonzero(a))

print(np.where(a==0))
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

## 7. 广播

ufunc函数对两个数组进行计算时，两个数组的对应元素进行计算，因此它要求这两个数组有相同的大小(shape相同)，如数组的shape不同，会进行广播处理：
- 让所有输入数组都向其中shape最长的数组看齐，shape中不足的部分都通过在前面加1补齐
- 输出数组的shape是输入数组shape的各个轴上的最大值
- 如果输入数组的某个轴和输出数组的对应轴的长度相同或者其长度为1时，这个数组能够用来计算，否则出错
- 当输入数组的某个轴的长度为1时，沿着此轴运算时都用此轴上的第一组值

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
a = np.arange(6).reshape((-1,1))
b = np.array([2,3,4])
print(a)
print(b)
print(a.shape)
print(b.shape)

c = a+b
print(c)
print(c.shape)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

### 7.1 ogrid对象

ogrid对象返回一列一行两个可广播的数组，它有两种形式：

1. 开始值:结束值:步长，和np.arange(开始值, 结束值, 步长)类似

2. 开始值:结束值:长度j，当第三个参数为虚数时，它表示返回的数组的长度，和np.linspace(开始值, 结束值, 长度)类似


<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
x,y = np.ogrid[1:5, 1:6:3j]
print(x)
print(y)
print(x.shape)
print(y.shape)

z = x*np.exp(-x**2-y**2)
print(z)
print(z.shape)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

### 7.2 mgrid对象/meshgrid函数

与ogrid相似，但返回进行广播之后的数组

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
x,y = np.mgrid[1:5, 1:6:3j]
#或者：
x,y = np.meshgrid(np.linspace(1,6,3), np.arange(1,5))
print(x)
print(y)
print(x.shape)
print(y.shape)

z = x*np.exp(-x**2-y**2)
print(z)
print(z.shape)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

## 8. 文件存取

文件类型：

1. 文本格式
2. 二进制格式（无格式、Numpy专用格式）

### 8.1 文本文件存取

savetxt和loadtxt读取1维和2维数组

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
a = np.random.rand(3,4)
print(a)

np.savetxt('a.txt', a) #默认按小数点后面18位科学计数法表示，空格分隔

b = np.loadtxt('a.txt')
print(b)

np.savetxt('a.txt', a, fmt = '%.2f', delimiter=',')#小数点后面两位，都好分隔

b = np.loadtxt('a.txt', delimiter=',')
print(b)

b1,b2 = np.loadtxt('a.txt', delimiter=',', usecols=(1,2), unpack=True)
print(b1)
print(b2)

b3= np.loadtxt('a.txt', delimiter=',', usecols=(1,2))
print(b3)

#压缩文件，后缀为gz
c = np.full((1000,1000),999.99)
print(c)

np.savetxt('c.gz', c, fmt='%.2f')

d = np.loadtxt('c.gz')
print(d)
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

### 8.2 无格式二进制文件

ndarray.tofile(fid, sep='', format='%s')和 fromfile(file, dtype=float, count=-1, sep='')

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
a = np.random.rand(3,4)
print(a)
print(a.shape)

a.tofile('a.bin', format = '%f')

b = np.fromfile('a.bin')
print(b)
print(b.shape) #没有a的维度信息
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>

### 8.3 numpy专用格式二进制文件

save(file, arr)和load(file)：自动处理元素类型和shape等信息

推荐使用！

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    代码示例：
</div>

```python
a = np.random.rand(3,4)
print(a)
print(a.shape)

np.save('a.npy', a)

b = np.load('a.npy')
print(b)
print(b.shape)

#多个数组保存在一个文件中
c = np.arange(0, 0.5, 0.1)
np.savez('two.npz', a, my=c)

d = np.load('two.npz')
print(d)
print(type(d))

print(d['arr_0'])

print(d['my'])
```

<div class="alert alert-success alertsuccess" style="margin-top: 10px">
    轮到你了：
</div>