# Numpy

主讲老师:郭斌

Numpy 是 python 中科学计算的基础包。
- Numpy 这个词来源于两个单词：Numerical 和 python
- Numpy 提供了大量的库函数和操作，可以轻松地进行数字计算
- 是一个 python 库

## Numpy优势
1. Numpy 是一个开源的 python 科学计算库，用于快速处理任意维度的数组
2. Numpy 数组中的所有元素的类型都是相同的，而 python 列表中的元素类型是任意的，在科学计算中，可以省掉很多循环语句，代码使用方面比python列表简单的多。
3. Numpy是专门针对数组的操作和运算进行了设计，所以数组的存储效率和输入输出性能远优于Python中的嵌套列表，数组越大，Numpy的优势就越明显。


## Numpy 的安装与导入
安装

    pip install numpy 或 conda install numpy
导入

    import numpy

## Numpy 的数据类型
![image.png](attachment:image.png)

# 数组的创建方法
## 从已知数创建数组

In [2]:
## 创建一个值为 1， 2， 3 的数组
import numpy as np ## np 是自定义的别名 
my_array = np.array([1, 2, 3])
print(my_array)

[1 2 3]


In [3]:
## 将列表 [1, 2, 3] 转为多维数组
import numpy as np
x = [1, 2, 3]
my_array = np.array(x)
print(my_array)

[1 2 3]


In [4]:
## 将元组 (1,2,3) 转换为多维数组
import numpy as np 
x = (1,2,3) 
my_array = np.array(x) 
print (my_array)

[1 2 3]


## 创建特殊数组
- 创建特殊数组包括创建元素全为0的数组，
- 元素全为1的数组，
- 与其它数组相同维度的全0数组，
- 与其它数组相同维度的全1数组，
- 对角线全为1的矩阵等。

In [7]:
## 创建指定大小、数据类型为 浮点型 的数组，数组元素以 0 来填充：
import numpy as np
my_array = np.zeros((3,4)) 
print(my_array)

[[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]


In [8]:
## 创建指定大小、数据类型为 整型 的数组，数组元素以 0 来填充：
import numpy as np
my_array = np.zeros((3,4), dtype = int) 
print(my_array)

[[0 0 0 0]
 [0 0 0 0]
 [0 0 0 0]]


In [9]:
## 创建指定形状的 浮点型 数组，数组元素以 1 来填充：
import numpy as np
x = np.ones(5)
print(x)

[1. 1. 1. 1. 1.]


In [10]:
## 创建指定形状的 整型 数组，数组元素以1来填充：
import numpy as np
x = np.ones((2,2), dtype = int) 
print(x)

[[1 1]
 [1 1]]


In [11]:
## 输出对角矩阵
import numpy as np
my_array= np.eye(3, dtype=int)
print(my_array)

[[1 0 0]
 [0 1 0]
 [0 0 1]]


In [12]:
## 创建1个与my_array相同维度的元素值全为1的数组
import numpy as np
my_array = np.zeros((3,4), dtype = int)
my_array_new = np.ones_like(my_array)
print("原数组：\n",my_array)
print("新数组：\n",my_array_new)

原数组：
 [[0 0 0 0]
 [0 0 0 0]
 [0 0 0 0]]
新数组：
 [[1 1 1 1]
 [1 1 1 1]
 [1 1 1 1]]


## 从数组范围创建数组

通过从数值范围创建数组，可以自动的创建一系列有规律的数组数据。其可以根据我们设置的条件进行数组数据的创建。
- Aeange()
- Linspace()

### **arange()函数**

根据 start 与 stop 指定的范围以及 step 设定的步长，生成一个数组。

函数格式：

    arange(start, stop, step, dtype)

参数说明：

start: 起始值，默认为0。
stop: 终止值（不包含）。
step: 步长，默认为1。
dtype: 返回ndarray的数据类型，如果没有提供，则会使用输入数据的类型。

In [13]:
## 生成起始值为10、终止值为20、步长为2的数组：
import numpy as np 
my_array = np.arange(10,20,2) 
print (my_array)

[10 12 14 16 18]


In [14]:
## 生成 0 到 4 的数组:
import numpy as np 
my_array = np.arange(5) 
print (my_array)

[0 1 2 3 4]


### **linspace()函数**

用于创建一个一维数组，数组是一个等差数列构成的。

函数格式：

    linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)

参数说明：

start: 序列的起始值。
stop: 序列的终止值，如果endpoint为true，该值包含于数列中。
num: 要生成的等步长的样本数量，默认为50。
endpoint: 该值为true时，数列中包含stop值，反之不包含，默认是True。
retstep: 如果为 True 时，生成的数组中会显示间距，反之不显示。
dtype: ndarray的数据类型。

In [15]:
## 生成10个元素全部是1的数列：
import numpy as np 
my_array = np.linspace(1,1,10) 
print(my_array)

[1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]


In [16]:
## 生成元素起始点为 1 ，终止点为 10，数列个数为 10的等差数列：
import numpy as np 
my_array = np.linspace(1,10,10, dtype=int) 
print(my_array)

[ 1  2  3  4  5  6  7  8  9 10]


# ndarray数组属性与数据转换
![image.png](attachment:image.png)

In [18]:
## 用于返回数组的维度
import numpy as np
my_array = np.array([[1,2,3],[4,5,6]])
print("数组的shape是：",my_array.shape)
print("数组的size是：",my_array.size)

数组的shape是： (2, 3)
数组的size是： 6


In [23]:
## 查看数组元素的数据属性
import numpy as np
my_array = np.array([1,2,3,4,5])
print("对象的元素类型:", my_array.dtype)
print("数组类型:",type(my_array))


对象的元素类型: int32
数组类型: <class 'numpy.ndarray'>


# 常用的数据变形方法表
![image.png](attachment:image.png)

In [24]:
## 使用reshape 函数来调整数组大小：
import numpy as np 
my_array = np.array([[1,2,3],[4,5,6]]) 
my_result = my_array.reshape(3,2) 
print (my_result)

[[1 2]
 [3 4]
 [5 6]]


In [25]:
## 对数组进行转置
import numpy as np
my_array = np.array([[1,2,3],[4,5,6]])
print("原数组为：\n", my_array)
my_array_new = my_array.T
print("转置后的数组为:\n", my_array_new)

原数组为：
 [[1 2 3]
 [4 5 6]]
转置后的数组为:
 [[1 4]
 [2 5]
 [3 6]]


In [26]:
## 将数组进行展平
import numpy as np
my_array = np.array([[1,2,3],[4,5,6]])
print("原数组为：\n", my_array)
my_array_new = my_array.flatten()
print("展平后的数组为:\n", my_array_new)

原数组为：
 [[1 2 3]
 [4 5 6]]
展平后的数组为:
 [1 2 3 4 5 6]


In [27]:
## 矩阵中为1的维度去掉
import numpy as np
my_array = np.arange(8).reshape(2, 4, 1)
print("原数组为：\n", my_array)
print("原数组维度为：\n", my_array.shape)
my_array_new = my_array.squeeze()
print("去维度后的数组为:\n", my_array_new)
print("去维度后的数组的维度为:\n", my_array_new.shape)

原数组为：
 [[[0]
  [1]
  [2]
  [3]]

 [[4]
  [5]
  [6]
  [7]]]
原数组维度为：
 (2, 4, 1)
去维度后的数组为:
 [[0 1 2 3]
 [4 5 6 7]]
去维度后的数组的维度为:
 (2, 4)


# 常用数组合并与分割的方法表
![image.png](attachment:image.png)

In [35]:
## 在原数组中以每一行中加入新元素的形式合并两个已知数组
import numpy as np
my_array_a = np.array([[1, 2], [3, 4]])
my_array_b = np.array([[5, 6], [7, 8]])
my_array_new = np.concatenate((my_array_a, my_array_b),axis = 1)
print(my_array_new)

[[1 2 5 6]
 [3 4 7 8]]


In [37]:
## 在原数组中以新列的形式合并两个已知数组
import numpy as np
my_array_a = np.array([[1, 2], [3, 4]])
my_array_b = np.array([[5, 6], [7, 8]])
my_array_new = np.concatenate((my_array_a, my_array_b),axis = 0)
print(my_array_new)  ## 这种方式与np.vstack((my_array_a, my_array_b))结果一样。

[[1 2]
 [3 4]
 [5 6]
 [7 8]]


In [38]:
## 将原数组垂直分割为2个数组
import numpy as np
my_array = np.array([[1, 2], [3, 4]])
my_array_new = np.split(my_array, 2, axis=1)
print(my_array_new)  ## 这种方式与np.hsplit(my_array_new, 2)结果相同。

[array([[1],
       [3]]), array([[2],
       [4]])]


In [39]:
## 将原数组垂直分割为2个数组
import numpy as np
my_array = np.array([[1, 2], [3, 4]])
my_array_new = np.split(my_array, 2, axis=0)
print(my_array_new) ## 这种方式与np.vsplit(my_array_new, 2)结果相同。

[array([[1, 2]]), array([[3, 4]])]


# 数据类型转换

In [1]:
## 将float型数组[1.1, 2.2, 3.3, 4.4, 5.3221]转换成int32
import numpy as np
my_array = np.array([1.1, 2.2, 3.3, 4.4, 5.3221])
my_arr = my_array.dtype
print(my_arr)
my_arr= my_array.astype(np.int32)
my_arr = my_arr.dtype
print(my_arr)

float64
int32


In [42]:
## 字符串数组['1.2','2.3','3.2141']转换为数值型
import numpy as np
my_strings = np.array(['1.2','2.3','3.2141'], dtype=np.string_)
my_arr = my_strings.dtype
print(my_arr)
my_array = my_strings.astype(float)
my_array_type = my_array.dtype
print(my_array_type)

|S6
float64


## 字符与对应类型表
![image.png](attachment:image.png)

# 随机数生成
1.真随机数：完全没有规则，无法预测接下来要产生的数。
2.伪随机数：通过一些预先设定好的规则产生不能简单预测的数。

常用随机数的函数表
![image.png](attachment:image.png)

In [43]:
## 生成一个0到1之间的均匀分布
import numpy as np
my_array = np.random.rand(2)
print(my_array)

[0.75267585 0.91809627]


In [44]:
## 产生一个数组内数字为 6 到 10 间的 [2, 3, 4] 维度的数组，包括 6，不包括 10
import numpy as np
my_array = np.random.randint(low=6,high=10,size=(2,3,4),
dtype='int')
print("生成数组为：\n",my_array)
print("生成数组的维度为：\n",my_array.shape)

生成数组为：
 [[[8 9 8 9]
  [7 9 6 6]
  [8 8 8 8]]

 [[7 8 9 6]
  [7 9 9 6]
  [7 8 7 9]]]
生成数组的维度为：
 (2, 3, 4)


In [46]:
## 产生随机打乱数组顺序
import numpy as np
my_array = np.arange(10)
print("原数组为:\n",my_array)
np.random.shuffle(my_array)
print("打扰后数组为:\n",my_array)

原数组为:
 [0 1 2 3 4 5 6 7 8 9]
打扰后数组为:
 [0 3 9 1 2 6 5 8 4 7]


In [47]:
## 设置随机数种子
## 当我们设置相同的seed，每次生成的随机数相同。如果不设置seed，则每次会生成不同的随机数。
import numpy as np
my_array_test = np.random.random()
print("未设种子的随机数第1次:", my_array_test)
my_array_test = np.random.random()
print("未设种子的随机数第2次:", my_array_test)

未设种子的随机数第1次: 0.6526338721350838
未设种子的随机数第2次: 0.42402338508906123


In [48]:
np.random.seed(1)
my_array_one = np.random.random()
print("第1个随机数第1次：",my_array_one)
np.random.seed(1)
my_array_one = np.random.random()
print("第1个随机数第2次：",my_array_one)

第1个随机数第1次： 0.417022004702574
第1个随机数第2次： 0.417022004702574


In [49]:
np.random.seed(2)
my_array_two = np.random.random()
print("第2个随机数第1次：",my_array_two)
np.random.seed(2)
my_array_two = np.random.random()
print("第2个随机数第2次：",my_array_two)

第2个随机数第1次： 0.43599490214200376
第2个随机数第2次： 0.43599490214200376


In [51]:
np.random.seed(1)
my_array_one = np.random.random()
print("第1个随机数第3次：",my_array_one)
np.random.seed(2)
my_array_two = np.random.random()
print("第2个随机数第3次：",my_array_two)

第1个随机数第3次： 0.417022004702574
第2个随机数第3次： 0.43599490214200376


# 数据的索引与切片

(1)冒号:的应用

冒号用于提取部分元素，一般有3种方式：
- [start:]用于从起始下标start处开始取元素，取到该数组的最后一个元素。
- [start:end]用于从起始下标start处开始取元素，取到下标为“end-1”的元素。
- [:end]用于从下标为0的元素开始提取，取到下标为“end-1”的元素为止。


1. Start 为正数时，开始索引为start
2. Start 为负数时，开始索引为start + 1
3. End 为正数时，劫夺索引为end - 1
4. End 为负数时，结束索引为end，其中倒数第二行或者第二列为 -1

In [2]:
## 从数组[2 3 4 5 6 7 8 9]提取[4,5,6,7,8,9]
import numpy as np
my_array = np.array([2,3,4,5,6,7,8,9])
print(my_array[2:])

[4 5 6 7 8 9]


In [54]:
## 取2到5索引(不包括停止索引)之间的项
import numpy as np
my_array = np.array([2,3,4,5,6,7,8,9])
print(my_array[2:5])

[4 5 6]


In [55]:
## 从数组中的第1个元素取到索引为4的元素
import numpy as np
my_array = np.array([2,3,4,5,6,7,8,9])
print(my_array[:5])

[2 3 4 5 6]


In [57]:
## 多维数从数组索引 my_array[1:,:] 处开始切割
import numpy as np
my_array = np.array([[1, 2, 3], [3, 4, 5], [4, 5, 6]])
print("原数组为:\n",my_array)
print("从数组索引 a[1:] 处开始切割:\n", my_array[1:])

原数组为:
 [[1 2 3]
 [3 4 5]
 [4 5 6]]
从数组索引 a[1:] 处开始切割:
 [[3 4 5]
 [4 5 6]]


In [93]:
import numpy as np
my_array = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print("原数组为:\n",my_array)
print("从数组索引 a[1:] 处开始切割:\n", my_array[1:])
print("取 4 5 7 8:\n", my_array[1:,0:2])
print("取 2 3 5 6:\n", my_array[0:2,1:])

原数组为:
 [[1 2 3]
 [4 5 6]
 [7 8 9]]
从数组索引 a[1:] 处开始切割:
 [[4 5 6]
 [7 8 9]]
取 4 5 7 8:
 [[4 5]
 [7 8]]
取 2 3 5 6:
 [[2 3]
 [5 6]]


## 高级索引

In [58]:
## 获取数组中(0,0)，(1,1)和(2,0)位置处的元素
import numpy as np
my_array = np.array([[1, 2], [3, 4], [5, 6]])
my_array_new = my_array[[0, 1, 2], [0, 1, 0]]
print(my_array_new)

[1 4 5]


In [67]:
## 获取大于 5 的元素
import numpy as np
my_array = np.array([[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10, 11]])
print("我们的数组是：\n", my_array)
print("大于 5 的元素是：\n",my_array[my_array > 5])

我们的数组是：
 [[ 0  1  2]
 [ 3  4  5]
 [ 6  7  8]
 [ 9 10 11]]
大于 5 的元素是：
 [ 6  7  8  9 10 11]


In [68]:
## 过滤数据中为NaN数据
import numpy as np
my_array = np.array([np.nan, 1, 2, np.nan, 3, 4, 5])
print(my_array [~np.isnan(my_array)])

[1. 2. 3. 4. 5.]


# 数组的运算

In [69]:
## NumPy 算术函数包含简单的加减乘除:add(),subtract(),multiply()和divide()。
import numpy as np
my_array_one = np.array([[0.,1.,2.], [3.,4.,5.], [6.,7.,8.]])
print("第一个数组：\n", my_array_one)
my_array_two = np.array([10, 10, 10])
print("第二个数组：\n", my_array_two)
print("两个数组相加：\n", np.add(my_array_one,  my_array_two))
print("两个数组相减：\n", np.subtract(my_array_one,  my_array_two))
print("两个数组相乘：\n", np.multiply(my_array_one,  my_array_two))
print("两个数组相除：\n", np.divide(my_array_one,  my_array_two))

第一个数组：
 [[0. 1. 2.]
 [3. 4. 5.]
 [6. 7. 8.]]
第二个数组：
 [10 10 10]
两个数组相加：
 [[10. 11. 12.]
 [13. 14. 15.]
 [16. 17. 18.]]
两个数组相减：
 [[-10.  -9.  -8.]
 [ -7.  -6.  -5.]
 [ -4.  -3.  -2.]]
两个数组相乘：
 [[ 0. 10. 20.]
 [30. 40. 50.]
 [60. 70. 80.]]
两个数组相除：
 [[0.  0.1 0.2]
 [0.3 0.4 0.5]
 [0.6 0.7 0.8]]


In [70]:
## 标准的三角函数：sin()、cos()、tan()的计算
import numpy as np
a = np.array([0, 30, 45, 60, 90])
print("不同角度的正弦值：\n", np.sin(a * np.pi / 180))
print("数组中角度的余弦值：\n", np.cos(a * np.pi / 180))
print("数组中角度的正切值：\n", np.tan(a * np.pi / 180))


不同角度的正弦值：
 [0.         0.5        0.70710678 0.8660254  1.        ]
数组中角度的余弦值：
 [1.00000000e+00 8.66025404e-01 7.07106781e-01 5.00000000e-01
 6.12323400e-17]
数组中角度的正切值：
 [0.00000000e+00 5.77350269e-01 1.00000000e+00 1.73205081e+00
 1.63312394e+16]


In [72]:
## 返回指定数字的四舍五入值
import numpy as np
my_array = np.array([1.0, 5.55, 123, 0.567, 25.532])
print("原数组：\n", my_array)
print("舍入后：\n", np.around(my_array))

原数组：
 [  1.      5.55  123.      0.567  25.532]
舍入后：
 [  1.   6. 123.   1.  26.]


In [73]:
## 返回小于或者等于指定表达式的最大整数，即向下取整
import numpy as np 
my_array = np.array([-1.7, 1.5, -0.2, 0.6, 10])
print("提供的数组：\n", my_array)
print("修改后的数组：\n", np.floor(my_array))

提供的数组：
 [-1.7  1.5 -0.2  0.6 10. ]
修改后的数组：
 [-2.  1. -1.  0. 10.]


In [75]:
## 返回大于或者等于指定表达式的最小整数，即向上取整
import numpy as np
my_array = np.array([-1.7, 1.5, -0.2, 0.6, 10])
print("提供的数组：\n", my_array)
print("修改后的数组：\n", np.ceil(my_array))

提供的数组：
 [-1.7  1.5 -0.2  0.6 10. ]
修改后的数组：
 [-1.  2. -0.  1. 10.]


In [76]:
## 返回参数逐元素的倒数。如1/4倒数为4/1
import numpy as np
my_array = np.array([0.25, 1.33, 1, 100])
print("我们的数组是：\n", my_array)
print("调用 reciprocal 函数：\n", np.reciprocal(my_array))

我们的数组是：
 [  0.25   1.33   1.   100.  ]
调用 reciprocal 函数：
 [4.        0.7518797 1.        0.01     ]


In [77]:
## 计算输入数组中相应元素的相除后的余数
import numpy as np
my_array_one = np.array([10, 20, 30])
my_array_two = np.array([3, 5, 7])
print("第一个数组：\n", my_array_one)
print("第二个数组：\n", my_array_two)
print("调用 mod() 函数：\n", np.mod(my_array_one, my_array_two))

第一个数组：
 [10 20 30]
第二个数组：
 [3 5 7]
调用 mod() 函数：
 [1 0 2]


## 广播
广播(Broadcast)是 Numpy 对不同形状(shape)的数组进行数值计算的方式，对数组的算术运算通常在相应的元素上进行。当运算中的 2 个数组的行维度不同时，Numpy 将自动触发广播机制。
![image.png](attachment:image.png)

In [78]:
import numpy as np 
a = np.array([[0, 0, 0],
              [10, 10, 10],
              [20, 20, 20],
              [30, 30, 30]])
b = np.array([0, 1, 2])
print(a + b)

[[ 0  1  2]
 [10 11 12]
 [20 21 22]
 [30 31 32]]


# 数组的读写

In [79]:
## 随机生成个数组，并将数组保存为文本文件中，各数据之间用逗号分隔，并保存到D盘arr.txt中
import numpy as np
arr = np.array([[ 0., 0., 1., 1., 2., 2.],
                [ 3., 3., 4., 4., 5., 5.],
                [ 6., 6., 7., 7., 8., 8.],
                [ 9., 9., 10., 10., 11., 11.]])
print('创建的数组为：',arr)
np.savetxt("d:/arr.txt", arr, fmt="%d", delimiter=",")

创建的数组为： [[ 0.  0.  1.  1.  2.  2.]
 [ 3.  3.  4.  4.  5.  5.]
 [ 6.  6.  7.  7.  8.  8.]
 [ 9.  9. 10. 10. 11. 11.]]


In [82]:
## 读取生成的文本文件
import numpy as np
loaded_data = np.loadtxt("d:/arr.txt",delimiter=",")
print("读取的数组为：",loaded_data)

读取的数组为： [[ 0.  0.  1.  1.  2.  2.]
 [ 3.  3.  4.  4.  5.  5.]
 [ 6.  6.  7.  7.  8.  8.]
 [ 9.  9. 10. 10. 11. 11.]]


# csv文件读写

In [83]:
## 将指定数组保存到csv文件中
import numpy as np
arr = np.array([[ 0., 0., 1., 1., 2., 2.],
                [ 3., 3., 4., 4., 5., 5.],
                [ 6., 6., 7., 7., 8., 8.],
                [ 9., 9., 10., 10., 11., 11.]])
print('创建的数组为：',arr)
np.savetxt("d:/arr.csv", arr, fmt="%d", delimiter=",")

创建的数组为： [[ 0.  0.  1.  1.  2.  2.]
 [ 3.  3.  4.  4.  5.  5.]
 [ 6.  6.  7.  7.  8.  8.]
 [ 9.  9. 10. 10. 11. 11.]]


In [84]:
## 读取生成的csv文件
import numpy as np
loaded_data = np.loadtxt("d:/arr.csv",delimiter=",")
print('读取的数组为：',loaded_data)

读取的数组为： [[ 0.  0.  1.  1.  2.  2.]
 [ 3.  3.  4.  4.  5.  5.]
 [ 6.  6.  7.  7.  8.  8.]
 [ 9.  9. 10. 10. 11. 11.]]


# Numpy统计分析方法

## 排序

In [86]:
## 分别按着行、列从小到大进行排序
import numpy as np
my_array = np.array([[3, 7], [9, 1]]) 
print("我们的数组是:\n",my_array)
print("调用 sort() 函数：\n", np.sort(my_array))
print("按列排序：\n", np.sort(my_array, axis=0))

我们的数组是:
 [[3 7]
 [9 1]]
调用 sort() 函数：
 [[3 7]
 [1 9]]
按列排序：
 [[3 1]
 [9 7]]


In [87]:
## 返回输入数组中满足给定条件的元素的索引
import numpy as np
my_array = np.array([[0., 1., 2.],
                    [3., 4., 5.],
                     [6., 7., 8.]])
print("我们的数组是：\n", my_array)
print("大于 3 的元素的索引：\n", np.where(my_array > 3))
print("使用索引满足条件的元素：\n",my_array[np.where(my_array> 3)])

我们的数组是：
 [[0. 1. 2.]
 [3. 4. 5.]
 [6. 7. 8.]]
大于 3 的元素的索引：
 (array([1, 1, 2, 2, 2], dtype=int64), array([1, 2, 0, 1, 2], dtype=int64))
使用索引满足条件的元素：
 [4. 5. 6. 7. 8.]


In [88]:
## 根据找出数组中偶数值元素，返回满足条件的元素
import numpy as np
my_array = np.array([[0., 1., 2.],
                    [3., 4., 5.],
                    [6., 7., 8.]])
print("我们的数组是：\n", my_array)
condition = (np.mod(my_array, 2) == 0)
print("选择是偶数的条件值：\n", condition)
print("使用条件提取元素：\n", np.extract(condition, my_array))

我们的数组是：
 [[0. 1. 2.]
 [3. 4. 5.]
 [6. 7. 8.]]
选择是偶数的条件值：
 [[ True False  True]
 [False  True False]
 [ True False  True]]
使用条件提取元素：
 [0. 2. 4. 6. 8.]


## 常用的统计函数
![image.png](attachment:image.png)

In [89]:
## 分别对给出数组求和、求平均、求中位数、求方差和标准差
import numpy as np
my_array = np.array([[ 0,  1,  2,  3],
                    [ 4,  5,  6,  7],
                    [ 8,  9, 10, 11],
                    [12, 13, 14, 15]])
print("数组求和结果为：", np.sum(my_array))
print("数组求平均结果为：", np.mean(my_array))
print("数组求中位数结果为：", np.median(my_array))
print("数组求方差结果为：", np.var(my_array))
print("数组求标准差结果为：", np.std(my_array))
print("数组求最小值为：", np.min(my_array))
print("数组求最大值为：", np.max(my_array))

数组求和结果为： 120
数组求平均结果为： 7.5
数组求中位数结果为： 7.5
数组求方差结果为： 21.25
数组求标准差结果为： 4.6097722286464435
数组求最小值为： 0
数组求最大值为： 15


In [90]:
## 对 my_array 进行统计方法的水平方向的统计
import numpy as np
my_array = np.array([[ 0,  1,  2,  3],
                     [ 4,  5,  6,  7],
                     [ 8,  9, 10, 11],
                     [12, 13, 14, 15]])
print("数组水平方向求和结果为：", np.sum(my_array, axis=1))
print("数组水平方向求平均结果为：", np.mean(my_array, axis=1))
print("数组水平方向求中位数结果为：", np.median(my_array, axis=1))
print("数组水平方向求方差结果为：", np.var(my_array, axis=1))
print("数组水平方向求标准差结果为：", np.std(my_array, axis=1))
print("数组水平方向求最小值为：", np.min(my_array, axis=1))
print("数组水平方向求最大值为：", np.max(my_array, axis=1))

数组水平方向求和结果为： [ 6 22 38 54]
数组水平方向求平均结果为： [ 1.5  5.5  9.5 13.5]
数组水平方向求中位数结果为： [ 1.5  5.5  9.5 13.5]
数组水平方向求方差结果为： [1.25 1.25 1.25 1.25]
数组水平方向求标准差结果为： [1.11803399 1.11803399 1.11803399 1.11803399]
数组水平方向求最小值为： [ 0  4  8 12]
数组水平方向求最大值为： [ 3  7 11 15]


In [91]:
## 计算 my_array 的累计和以及水平方向的累计和和垂直方向的累计积
import numpy as np
my_array = np.array([[ 0,  1,  2,  3],
                    [ 4,  5,  6,  7],
                    [ 8,  9, 10, 11],
                    [12, 13, 14, 15]])
print("my_array 的累计和:\n",np.cumsum( my_array))
print("计算水平方向的累计和:\n", np.cumsum(my_array ,axis=1))
print("计算垂直方向的累计积:\n", np.cumprod(my_array ,axis=0))

my_array 的累计和:
 [  0   1   3   6  10  15  21  28  36  45  55  66  78  91 105 120]
计算水平方向的累计和:
 [[ 0  1  3  6]
 [ 4  9 15 22]
 [ 8 17 27 38]
 [12 25 39 54]]
计算垂直方向的累计积:
 [[   0    1    2    3]
 [   0    5   12   21]
 [   0   45  120  231]
 [   0  585 1680 3465]]


# 小测验

为了研究特定的农作物(例如水稻)在某地区灌溉周期的特性，现针对某国某地区的2015年-2017年的温度和降雨量等数据进行分析，得到该地区种植水稻的灌溉时间段的具体参数，以便当地气候参数提醒农民大概的灌溉的周期。这里以水稻为例，水稻需要以下参数气候条件：
1. 平均而言，每个月大约需要180-300毫米水才能生产出相当好的稻米。
2. 最佳温度20-35摄氏度。

根据表3-8所提供的数据，求出3年来每个月平均的温度和降雨量，并根据水稻对温度和降雨量的要求，求出一般在几月不需要灌溉。(本实训所用数据可以github网上[项目](https://github.com/TanvirMahmudEmon/Rainfall-Prediction))下载。

表3-8 某国某地区2015年-2017年气候数据情况表
![image.png](attachment:image.png)

In [92]:
import numpy as np
sum = 0
loaded_data = np.loadtxt("d:/my_dataset.csv",delimiter=",")
print('读取的数组维度为：',loaded_data.shape)
temp_avg = (loaded_data[:,3]+loaded_data[:,4])/2
rain = loaded_data[:,-1]
temp_new = np.linspace(0,0,12)
rain_new = np.linspace(0,0,12)
result = np.linspace(0,0,12)
for month in range(1,13):
    index = np.where(loaded_data[:,1] == month)
    for q in index:
        temp_value = np.mean(temp_avg[q])
        temp_new[month-1] = temp_value
        rain_value = np.mean(rain[q])
        rain_value = rain_value*10
        rain_new[month-1] = rain_value
        if ((temp_value >= 20 and temp_value <= 35) and (rain_value >= 180 and rain_value <= 300)):
            result[sum] = month
            sum = sum + 1
print("三年内每个月的平均温度为:\n",temp_new)
print("三年内每个月的平均降雨量为:\n",rain_new)
print("不需要灌溉的月份为:\n",result[result != 0])

OSError: d:/my_dataset.csv not found.

# 小结

介绍了多维数组的创建数组的方法、ndarray对象属性与数据转换、随机数组生成和数组结构变换。关于数组运算主要介绍了数组的索引与切片、运算。对于数组的输入输出，主要依赖于数组的读写，Numpy作为统计分析方法其操作主要包括：排序、去重、求和、平均、方差、标准差、最值等方法。

# 参考资料
> [numpy-菜鸟网](https://www.runoob.com/numpy/numpy-tutorial.html)  
> [numpy-官网用户指南](https://numpy.org/doc/stable/user/index.html#user)  
> [numpy-c语言中文网](http://c.biancheng.net/numpy/)  
> []()
> []()
> []()
> []()
> []()