## 数据的CSV文件存取
### CSV文件
comma-separated Value, 常用来存储批量数据
![image.png](attachment:image.png)
#### 写入数据
np.savetxt(frame,array,fmt='%.18e',delimiter=None)
- frame:文件，可以是.gz的压缩文件
- array：存入文件的数组
- fmt：写入文件的格式，例如：%d %.2f
- delimiter:分割字符串，默认是任何空格。

In [2]:
import numpy as np
a = np.arange(100).reshape(5,20)
np.savetxt('a.csv',a,fmt='%d',delimiter=',')
np.savetxt('a.csv',a,fmt='%.1f', delimiter=',') #覆盖写


#### 读入数据
np.loadtxt(frame,dtype=np.float,delimiter=None,unpack=False)
- frame:文件、字符串
- dtype：数据类型，可选
- delimiter：分隔字符串，默认是任何空格
- unpack：如果True，读入属性将分别写入不同变量

In [3]:
b = np.loadtxt('a.csv',delimiter=',')
b

array([[ 0.,  1.,  2.,  3.,  4.,  5.,  6.,  7.,  8.,  9., 10., 11., 12.,
        13., 14., 15., 16., 17., 18., 19.],
       [20., 21., 22., 23., 24., 25., 26., 27., 28., 29., 30., 31., 32.,
        33., 34., 35., 36., 37., 38., 39.],
       [40., 41., 42., 43., 44., 45., 46., 47., 48., 49., 50., 51., 52.,
        53., 54., 55., 56., 57., 58., 59.],
       [60., 61., 62., 63., 64., 65., 66., 67., 68., 69., 70., 71., 72.,
        73., 74., 75., 76., 77., 78., 79.],
       [80., 81., 82., 83., 84., 85., 86., 87., 88., 89., 90., 91., 92.,
        93., 94., 95., 96., 97., 98., 99.]])

In [4]:
b = np.loadtxt('a.csv',dtype=np.int,delimiter=",")
b

Deprecated in NumPy 1.20; for more details and guidance: https://numpy.org/devdocs/release/1.20.0-notes.html#deprecations
  b = np.loadtxt('a.csv',dtype=np.int,delimiter=",")


array([[ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15,
        16, 17, 18, 19],
       [20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35,
        36, 37, 38, 39],
       [40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55,
        56, 57, 58, 59],
       [60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75,
        76, 77, 78, 79],
       [80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95,
        96, 97, 98, 99]])

#### CSV局限性
只能有效存储一维和二维数组，即savetxt 和 loadtxt只能读取存储一维，二维数组

## 多维数据的存取
#### 写入tofile(frame,sep='',format='%s')
- frame: 文件、字符串。
- sep: 数据分隔字符串，如果是空的，写入文件为二进制
- forma： 写入数据的格式

In [21]:
a = np.arange(100).reshape(5,10,2)
a.tofile('b.dat',sep=',',format='%d')

In [8]:
a = np.arange(100).reshape(5,10,2)
a.tofile('c.dat',sep='',format='%d')

#### 读取fromfile(frame,dtype=float,count=-1,sep='')
- frame:文件、字符串。
- dtype:读取的数据类型。
- count:读入元素个数，-1表示读入整个文件。
- sep:表示分隔字符串，如果是空，写入文件为二进制的
#### Notes
该方法需要读取时知道存入文件时数组的**维度**和**元素类型**，可以通过元数据文件存储额外信息(一般在第一行)

In [25]:
c = np.fromfile("b.dat",dtype=np.int32,sep=',')
c

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
       34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50,
       51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67,
       68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84,
       85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99])

In [27]:
print(c.reshape(5,10,2))

[[[ 0  1]
  [ 2  3]
  [ 4  5]
  [ 6  7]
  [ 8  9]
  [10 11]
  [12 13]
  [14 15]
  [16 17]
  [18 19]]

 [[20 21]
  [22 23]
  [24 25]
  [26 27]
  [28 29]
  [30 31]
  [32 33]
  [34 35]
  [36 37]
  [38 39]]

 [[40 41]
  [42 43]
  [44 45]
  [46 47]
  [48 49]
  [50 51]
  [52 53]
  [54 55]
  [56 57]
  [58 59]]

 [[60 61]
  [62 63]
  [64 65]
  [66 67]
  [68 69]
  [70 71]
  [72 73]
  [74 75]
  [76 77]
  [78 79]]

 [[80 81]
  [82 83]
  [84 85]
  [86 87]
  [88 89]
  [90 91]
  [92 93]
  [94 95]
  [96 97]
  [98 99]]]


### Numpy便携文件存取(非自定义)
np.save(fname,array) 或 np.savez(frame,array)
- frame:文件名，以.npy为扩展名，压缩扩展名为.npz
- array:数组变量

np.load(fname)
- frame: 文件名，以.npy为扩展名，压缩拓展名为.npz

In [36]:
a = np.arange(100).reshape(5,10,2)
np.save("a.npy",a)
b = np.load("a.npy")
b

array([[[ 0,  1],
        [ 2,  3],
        [ 4,  5],
        [ 6,  7],
        [ 8,  9],
        [10, 11],
        [12, 13],
        [14, 15],
        [16, 17],
        [18, 19]],

       [[20, 21],
        [22, 23],
        [24, 25],
        [26, 27],
        [28, 29],
        [30, 31],
        [32, 33],
        [34, 35],
        [36, 37],
        [38, 39]],

       [[40, 41],
        [42, 43],
        [44, 45],
        [46, 47],
        [48, 49],
        [50, 51],
        [52, 53],
        [54, 55],
        [56, 57],
        [58, 59]],

       [[60, 61],
        [62, 63],
        [64, 65],
        [66, 67],
        [68, 69],
        [70, 71],
        [72, 73],
        [74, 75],
        [76, 77],
        [78, 79]],

       [[80, 81],
        [82, 83],
        [84, 85],
        [86, 87],
        [88, 89],
        [90, 91],
        [92, 93],
        [94, 95],
        [96, 97],
        [98, 99]]])

## Numpy随机数
`Python`自带的标准库`random`是为一般的标量参数提供随机数生成功能的

在`NumPy`库中，`random`库能为数组类型提供随机数的相关功能
### 常用的随机数组函数：

`np.random.*`星号表示具体的函数名字

| 函数                                                        | 说明                                                 |
| ----------------------------------------------------------- | ---------------------------------------------------- |
| `rand(d0,d1,...,dn)`                                        | 根据`d0`-`dn`创建随机数数组，0到1的浮点数，均匀分布  |
| `randn(d0,d1,...,dn)`                                       | 根据`d0`-`dn`创建随机数数组，标准正态分布            |
| `randint(low[,high,shape])`<br>方括号表示方括号的内容可省略 | 根据`shape`创建随机整数或整数数组，范围是[low, high) |
| `seed(s)`                                                   | 随机数种子，s是给定的种子值                          |


In [37]:
a = np.random.rand(3,4,5)
a

array([[[0.11616286, 0.87259364, 0.79048429, 0.625015  , 0.59193813],
        [0.24331104, 0.4996861 , 0.48997923, 0.92859799, 0.86502924],
        [0.75393626, 0.43132759, 0.50654511, 0.83671006, 0.35882718],
        [0.68945402, 0.56127736, 0.14093698, 0.45343757, 0.99297671]],

       [[0.38469913, 0.29135041, 0.18261496, 0.95786872, 0.8759044 ],
        [0.94767127, 0.01314195, 0.23077763, 0.07123406, 0.58993465],
        [0.31070171, 0.75377028, 0.451999  , 0.87119087, 0.5536761 ],
        [0.38120721, 0.0966071 , 0.81253221, 0.79897993, 0.2486512 ]],

       [[0.33726416, 0.8955836 , 0.01742777, 0.29606041, 0.12281668],
        [0.07799625, 0.09938504, 0.71691989, 0.66051569, 0.65107088],
        [0.30453259, 0.7206249 , 0.10147119, 0.30952073, 0.88506502],
        [0.55691379, 0.51316859, 0.04997297, 0.85680429, 0.25437329]]])

In [39]:
sn = np.random.randn(3,4,5)
sn

array([[[-0.1722441 ,  1.33560272, -0.92793598, -1.52660297,
         -0.79471134],
        [-0.87660842, -1.06086869, -0.83815966,  0.43802842,
         -0.13866896],
        [-0.00537378, -0.16305156,  0.67023634, -0.08306813,
         -0.83282103],
        [ 0.31465112,  0.32418465, -0.02489605, -0.63539635,
          0.1868311 ]],

       [[ 1.00974886,  0.42680252, -1.32829292, -0.60220524,
          0.85386012],
        [-0.20266671,  0.38151296, -1.00962933,  0.54845469,
          0.49793388],
        [-0.53343312, -2.38250118,  0.71360523, -1.28617675,
         -0.10656871],
        [-0.0154948 ,  1.99509152, -2.57376331, -0.39981698,
          0.52814141]],

       [[-1.05184119, -1.36737574,  0.75833341, -1.11393745,
         -1.38494162],
        [-0.17841388,  0.3141551 , -0.60582409, -0.11129574,
         -1.27272221],
        [-0.40129245, -0.04350863,  0.4339077 ,  0.0541981 ,
          0.05827766],
        [-0.21131717, -0.95221542, -1.13014031,  0.07880528,
          3

In [41]:
b = np.random.randint(100,200,(3,4))
b

array([[165, 167, 130, 117],
       [110, 194, 110, 102],
       [131, 199, 100, 106]])

在生成随机数组之前使用`seed()`函数可以生成固定的随机数组，不过如果只使用一次种子函数，不能让之后生成一样的随机数组

In [45]:
np.random.seed(10)#save seed the same random number
print(np.random.randint(100,200,(3,4)))
np.random.seed(10)
print(np.random.randint(100,200,(3,4)))

[[109 115 164 128]
 [189 193 129 108]
 [173 100 140 136]]
[[109 115 164 128]
 [189 193 129 108]
 [173 100 140 136]]


### 高级随机数组功能

| 函数                         | 说明                                                         |
| :----------------------------: | :------------------------------------------------------------: |
| `shuffle(a)`                 | 随机对`a`的最外维度进行调换，改变`a`数组                     |
| `permutation(a)`             | 随机对`a`的最外维度进行调换，不改变`a`数组                   |
| `choice(a[,size,replace,p])` | 从一维数组`a`中以概率`p`抽取元素，形成`size`形状新数组，`replace`表示是否可以重用元素，默认为`True` |


In [53]:
a = np.random.randint(100,200,(3,4))
a

array([[177, 188, 115, 106],
       [185, 122, 111, 112],
       [192, 196, 162, 157]])

In [65]:
np.random.shuffle(a) #改变a
a

array([[177, 188, 115, 106],
       [192, 196, 162, 157],
       [185, 122, 111, 112]])

In [66]:
np.random.permutation(a)# 不改变a

array([[185, 122, 111, 112],
       [177, 188, 115, 106],
       [192, 196, 162, 157]])

In [67]:
a

array([[177, 188, 115, 106],
       [192, 196, 162, 157],
       [185, 122, 111, 112]])

In [68]:
b = np.random.randint(100,200,(8,))
b

array([153, 125, 148, 117, 132, 181, 180, 141])

In [70]:
np.random.choice(b,(3,2),replace = False,p=b/np.sum(b))

array([[180, 125],
       [181, 148],
       [132, 153]])

### 产生各种分布的随机数组

| 函数                     | 说明                                                         |
| ------------------------ | ------------------------------------------------------------ |
| `uniform(low,high,size)` | 产生具有均匀分布的数组，`low`起始值，`high`结束值，`size`形状 |
| `normal(loc,scale,size)` | 产生具有正太分布的数组，`loc`均值，`scale`标准差，`size`形状 |
| `poisson(lam,size)`      | 产生具有泊松分布的数组，`lam`随机事件发生率，`size`形状      |


In [72]:
u = np.random.uniform(0,10,(3,4))
u

array([[8.35570794, 4.65441626, 0.92856108, 8.54694143],
       [3.37258186, 6.06146751, 1.12664601, 5.43920447],
       [7.20798582, 8.65815366, 1.46701124, 1.0338107 ]])

In [74]:
n = np.random.normal(10,5,(3,4))
n

array([[10.45457509,  2.63002415, 10.55279029, 11.26839975],
       [11.32440894, 13.62386089,  7.32322561,  9.04697536],
       [ 7.64661696,  8.1869246 ,  6.05716218, 16.2828475 ]])

In [76]:
p = np.random.poisson(0.5,100) #上面的例子表示a事件发生的概率是0.5，那么在100个事件中发生a的事件的次数
p

array([0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 3, 0, 0, 0, 1,
       0, 0, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0, 1, 1, 0, 1, 0, 1, 1, 0, 0, 1,
       1, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 0,
       1, 0, 0, 1, 0, 0, 1, 2, 2, 0, 0, 0, 0, 1, 0, 0, 1, 0, 1, 0, 2, 0,
       0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0])

****

# `NumPy`的统计函数

统计函数能对数组中的信息进行统计

## 常用统计函数

`np.*`星号是函数名字

| 函数                                  | 说明                                                        |
| :-------------------------------------: | :-----------------------------------------------------------: |
| `sum(a, axis=None)`                   | 根据给定轴`axis`计算数组`a`相关元素之和，`axis`整数或元组   |
| `mean(a, axis=None)`                  | 根据给定轴`axis`计算数组`a`相关元素的期望，`axis`整数或元组 |
| `average(a, axis=None, weights=None)` | 根据给定轴`axis`计算数组`a`相关元素的加权平均值             |
| `std(a, axis=None)`                   | 根据给定轴`axis`计算数组`a`相关元素的标准差                 |
| `var(a, axis=None)`                   | 根据给定轴`axis`计算数组`a`相关元素的方差                   |

如果不给定轴(维度)的参数就是**对每一个元素进行计算**，如果给定轴的参数，就是对轴上的元素进行计算

In [77]:
a = np.arange(15).reshape(3,5)
a

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [78]:
np.sum(a)

105

In [81]:
np.mean(a,axis=0)#这里的平均值运算针对的是第1轴，即对第二个维度的数据求平均值。这个数组有3个元素（第一维度是3个元素），第二维度有5个元素，对这5个值求平均值，结果是：[2., 7., 12. ]


array([5., 6., 7., 8., 9.])

## 其它的统计函数

| 函数                          | 说明                                                         |
| :-----------------------------: | :------------------------------------------------------------: |
| `min(a)` `max(a)`             | 计算数组`a`中元素的最小值、最大值                            |
| `argmin(a)` `argmax(a)`       | 计算数组`a`中元素最小值、最大值所在位置<br>（降一维后的下标） |
| `unravel_index(index, shape)` | 根据`shape`将一维下标`index`转换成多维下标                   |
| `ptp(a)`                      | 计算数组`a`中元素最大值与最小值的差（极差）                  |
| `median(a)`                   | 计算数组`a`中元素的中位数（中值）                            |

### `max`例子

```python
>>> import numpy as np
>>> b = np.arange(15,0,-1).reshape(3, 5)
>>> b
array([[15, 14, 13, 12, 11],
       [10,  9,  8,  7,  6],
       [ 5,  4,  3,  2,  1]])
>>> np.max(b)
15
```

### `argmax`例子

```py
>>> np.argmax(b)
0
```

在这个例子中，`b`数组是一个3x5维度的数组，最大值的下标应该是：(0, 0)，但是在通过`np.argmax()`函数返回的下标只有一个值0

这意味着它返回的是经过降维后的下标，即当把3x5维度的数组拉成一维数组之后的下标

### `unravel_index`例子

```python
>>> np.unravel_index(np.argmax(b), b.shape)
(0, 0)
```

把扁平化后的下标还原成多维下标

因此，`argmax()`和`argmin()`函数通常与`unravel_index()`函数一起使用

### `ptp`例子

```python
>>> np.ptp(b)
14
```

### `meadian`例子

```python
>>> np.median(b)
8.0
```

求中位数的函数实际上是一种运算，因此尽管原数组中的元素可能都是整数，`np.median()`函数返回的结果是浮点数


****

# `NumPy`的梯度函数

## gradient函数(变化率)

| 函数             | 说明                                                         |
| ---------------- | ------------------------------------------------------------ |
| `np.gradient(f)` | 计算数组`f`中元素的梯度，当`f`为多维时，它可以计算在每一个维度上，每一个元素对应的梯度值 |

梯度：连续值之间的变化率，即斜率

在XY坐标系连续三个X坐标对应的Y轴值：a, b, c，其中b的梯度是：(c-a)/2

### 一维数组梯度例子

In [82]:
a = np.random.randint(0,20,(5))
a

array([18,  9,  5,  2,  6])

In [83]:
np.gradient(a)

array([-9. , -6.5, -3.5,  0.5,  4. ])

```python
>>> import numpy as np
>>> a =np.random.randint(0, 20, (5))
>>> a
array([ 2,  8, 11, 19, 19])
>>> np.gradient(a)
array([6. , 4.5, 5.5, 4. , 0. ])
```

结果中元素"4.5"的计算过程：

梯度数组的元素4.5对应数组`a`中的元素8

```
(11-2)/2 = 4.5
```

在计算数组最后一个元素的梯度的时候，例如计算`a`数组的最后一个元素19的梯度：

使用最后一个元素减去倒数第二个元素，再除以1

```
(19-19)/1 = 0
```

计算原数组第一个值同理：

使用后一个值减去第一个值，例如在计算数组`a`的第一个元素的梯度时

```
(8-2)/1 = 6
```



### 二维数组梯度例子

```python
>>> import numpy as np
>>> b =np.random.randint(0, 50, (3, 5))
>>> b
array([[34,  2, 26, 17, 14],
       [14, 20, 39, 29, 47],
       [35, 47, 43, 44,  0]])
>>> np.gradient(b)
[array([[-20. ,  18. ,  13. ,  12. ,  33. ],
        [  0.5,  22.5,   8.5,  13.5,  -7. ],
        [ 21. ,  27. ,   4. ,  15. , -47. ]]),
 array([[-32. ,  -4. ,   7.5,  -6. ,  -3. ],
        [  6. ,  12.5,   4.5,   4. ,  18. ],
        [ 12. ,   4. ,  -1.5, -21.5, -44. ]])]
```

由于`b`是二维数组，所以其中任何一个元素的梯度存在两个方向。所以`np.gradient()`返回了两个数组，分别对应两个不同的维度。

第一个数组表明元素在最外层维度的梯度值

第二个数组表明元素在第二层维度的梯度值

例如：

第一个数组的第一个元素-20的计算过程：

同一列中的梯度计算，同一列中下一个元素减去前一个元素（对于第一个元素就减去当前元素）

```
(14-34)/1 = 20
```

第二个数组同理：

同一行中，后一个元素减去前一个元素

```
(2-34)/1 = -32
```

对于有n个维度的数组，它的梯度是n个数组，每个数组代表其中的元素在那个维度的梯度



## 梯度函数的用途

多媒体运算中很重要，梯度表示数据的变化率，在进行图像声音的处理的时候，梯度有助于发现图像和声音的边缘，也就是那些变化比较快的地方。

