
# <center>科学计算库NumPy</center>

## 课程内容

* 1.ndarray对象
* 2.ufunc运算
* 3.函数库
* 4.模块
* 5.文件读写

导入NumPy函数库:
```
import numpy
from numpy import *
import numpy as np
```

### 1.ndarray对象
Numpy 的核心是连续的多维数组。  
Numpy中的数组叫做```np.ndarray```，也可以使用别名```np.array```。  
但这里的np.array与Python标准库中的array.array是不同的。
下列是几个```ndarray```中的重要属性：  

**ndarray.ndim**  
　　数组的维数。  
**ndarray.shape**  
　　数组的形状。  
**ndarray.size**  
　　数组的元素个数。  
**ndarray.dtype**  
　　数组的元素类型。  
  
例子： 查看 data=np.arange(15).reshape(3,5) 对象属性

#### 1.1 创建数组
**1.使用array( )函数**

创建数组有多种方式。你可以使用```np.array```直接用Python的元组和列表来创建，如果传递的是多层嵌套的序列，将创建多维数组。
```py
a=np.array([1,2,3])
b=np.array([1.1,2.2,3.3])
c=np.array([(1,2,3),(4.5,5,6)]) #创建二维数组
d=np.array([(1,2),(3,4)],dtype=complex) #数组的类型可以在创建时显式声明
```

**2.使用arange( )函数**

为了创建列表，NumPy提供了和 ```range``` 类似的函数，通过指定开始值、终值和步长来创建一维数组，注意数组不包括终值。
```py
np.arange(start,end,step)
a=np.arange(10,30,5)
b=np.arange(0,2,0.3)#同样可以接收浮点数
```
arange函数可以看做是range函数的数组版，能生成一个一维数组，然后可以用reshape函数将一维数组改变成想要的形状，原数组的shape保持不变。
```py
b = a.reshape(5, -1)
```

**3.使用zeros()、ones()、empty()函数**

numpy.zeros 创建指定大小的数组，数组元素以 0 来填充：
```
numpy.zeros(shape, dtype = float)
x = np.zeros(5) # 默认为浮点数
y = np.zeros((5,), dtype = np.int) # 设置类型为整数
```
numpy.ones 创建指定形状的数组，数组元素以 1 来填充
```
numpy.ones(shape, dtype = float)
x = np.ones(5)
```

numpy.empty 方法用来创建一个指定形状（shape）、数据类型（dtype）且未初始化的数组
```py
numpy.empty(shape, dtype = float)
x = np.empty([3,2], dtype = int)

```
需要注意的是上述方法创建的数组元素的类型是 ```float64```

#### 打印数组
当你打印一个数组时，NumPy显示数组的方式和嵌套的列表类似，但是会遵循以下布局：
 - 最后一维从左到右显示
 - 第二维到最后一维从上到下显示
 - 剩下的同样从上到下显示，以空行分隔
 
一维数组显示成一行，二维数组显示成矩阵，三维数组显示成矩阵的列表。
```
a=np.arange(6)
b=np.arange(12).reshape(4,3)
c=np.arange(24).reshape(2,3,4)
```

当一个数组元素太多，不方便显示时，NumPy会自动数组的中间部分，只显示边角的数据。

```
np.arange(10000)
```

#### 1.2 索引与切片

**1.使用标准方法**

数组元素的存取方法和Python的标准方法相同
```py
a = np.arange(10)
a[5] # 用整数作为下标可以获取数组中的某个元素
a[3:5] # 用范围作为下标获取数组的一个切片，包括a[3]不包括a[5]
a[:5] # 省略开始下标，表示从a[0]开始
a[:-1] # 下标可以使用负数，表示从数组后往前数
a[2:4] = 100,101 # 下标还可以用来修改元素的值
a[1:-1:2] # 范围中的第三个参数表示步长，2表示隔一个元素取一个元素
a[::-1] # 省略范围的开始下标和结束下标，步长为-1，整个数组头尾颠倒
a[5:1:-2] # 步长为负数时，开始下标必须大于结束下标
```

和Python的列表序列不同，通过下标范围获取的新的数组是原始数组的一个视图。它与原始数组共享同一块数据空间


**2.使用整数序列**

当使用整数序列对数组元素进行存取时，将使用整数序列中的每个元素作为下标，整数序列可以是列表或者数组。使用整数序列作为下标获得的数组不和原始数组共享数据空间。
```py
x = np.arange(10,1,-1) # array([10, 9, 8, 7, 6, 5, 4, 3, 2])
x[[3, 3, 1, 8]] # 获取x中的下标为3, 3, 1, 8的4个元素，组成一个新的数组
b = x[np.array([3,3,-3,8])] #下标可以是负数
b[2] = 100
x # 由于b和x不共享数据空间，因此x中的值并没有改变
x[[3,5,1]] = -1, -2, -3 # 整数序列下标也可以用来修改元素的值
```

**3.使用布尔数组**

当使用布尔数组b作为下标存取数组x中的元素时，将收集数组x中所有在数组b中对应下标为True的元素。使用布尔数组作为下标获得的数组不和原始数组共享数据空间，注意只对应于布尔数组，不能使用布尔列表。

```py
x = np.arange(5,0,-1)
x[np.array([True, False, True, False, False])]
# 布尔数组中下标为0，2的元素为True，因此获取x中下标为0,2的元素
x[[True, False, True, False, False]]
# 如果是布尔列表，则把True当作1, False当作0，按照整数序列方式获取x中的元素
x[np.array([True, False, True, True])]
# 布尔数组的长度不够时，不够的部分都当作False
x[np.array([True, False, True, True])] = -1, -2, -3
# 布尔数组下标也可以用来修改元素
```

布尔数组一般不是手工产生，而是使用布尔运算的ufunc函数产生
```py
x = np.random.rand(10) # 产生一个长度为10，元素值为0-1的随机数的数组
x>0.5
# 数组x中的每个元素和0.5进行大小比较，得到一个布尔数组，True表示x中对应的值大于0.5
x[x>0.5]
# 使用x>0.5返回的布尔数组收集x中的元素，因此得到的结果是x中所有大于0.5的元素的数组
```

#### 多维数组

多维数组的存取和一维数组类似，因为多维数组有多个轴，因此它的下标需要用多个值来表示，NumPy采用组元(tuple)作为数组的下标。
```py
# 6x6的数组
np.arange(0, 60, 10).reshape(-1, 1) + np.arange(0, 6)
```

* 使用数组切片语法访问多维数组中的元素
![](img/1.png)


* 使用整数序列和布尔数组访问多维数组中的元素
![](img/2.png)

对多维数组的迭代是在第一维进行迭代的。
```
for row in b:
    print(row)
```

如果需要遍历多维数组的所有元素，可以使用flat这个属性。
```
for element in b.flat:
    print(element)
```

#### 1.3 数组相关操作

**切分数组**

将一个数组划分为多个更小的数组

numpy.split 函数沿特定的轴将数组分割为子数组
```
a = np.arange(9)
b = np.split(a,3) # 将数组分为三个大小相等的子数组
b = np.split(a,[4,7]) # 将数组在一维数组中表明的位置分割
```

numpy.hsplit 函数用于水平分割数组，通过指定要返回的相同形状的数组数量来拆分原数组
```
harr = np.floor(10 * np.random.random((2, 6)))
np.hsplit(harr, 3)
```

numpy.vsplit 沿着垂直轴分割，其分割方式与hsplit用法相同
```
a = np.arange(16).reshape(4,4)
b = np.vsplit(a,2)
```

**拼接数组**

堆砌不同的数组，多个数组可以按照不同的轴合在一起

numpy.concatenate 函数用于沿指定轴连接相同形状的两个或多个数组
```
a = np.array([[1,2],[3,4]])
b = np.array([[5,6],[7,8]])
np.concatenate((a,b)) # 沿轴 0 连接两个数组
np.concatenate((a,b),axis = 1) # 沿轴 1 连接两个数组
```


**复制和视图**

当操作数组时，数组的数据有时会复制到新数组中，有时又不会。这通常令初学者感到困难。总的来说有下面三种情况：

#### 不复制
简单的赋值不会复制数组的数据。
```
a=np.arange(12)
b=a
print(b is a)
b.shape=3,4
print(a.shape)
```

#### 视图和浅复制
不同的数组可以使用同一份数据，```view```函数在同一份数据上创建了新的数组对象。
```
c=a.view()
print(c is a)
print(c.base is a) #c是a的数据的视图
print(c.flags.owndata)
c.shape=6,2
print(a.shape) #a的形状没有改变
c[4,1]=1234 #a的数据改变了
print(a)
```
对数组切片会返回数组的视图
```
s=a[:,1:3]
s[:]=10
print(a)
```

#### 深复制

copy函数实现了对数据和数组的完全复制。
```
d=a.copy()
print(d is a)
print(d.base is a)
d[0,0]=9999
print(a)
```

### 2.ufunc运算

ufunc是universal function的缩写，它是一种能对数组的每个元素进行操作的函数。许多ufunc函数都是在C语言级别实现的，因此它们的计算速度非常快。
比较了一下numpy.math和Python标准库的math.sin的计算速度。
```py
import time
import math
import numpy as np
x = [i * 0.001 for i in range(1000000)]
start = time.clock()
for i, t in enumerate(x):
    x[i] = math.sin(t)
print("math.sin:", time.clock() - start) 

x = [i * 0.001 for i in range(1000000)]
x = np.array(x)
start = time.clock()
np.sin(x,x)
print ("numpy.sin:", time.clock() - start)
```
计算100万次正弦值，numpy.sin比math.sin快10倍多

数组的算数计算是在元素层级运算的。计算结果会存在一个新创建的数组中。

类似于+=和*=的运算是直接在现有数组上计算的，没有创建新的数组。Numpy中的计算同样也是向上转型的，可以简单理解成浮点数和整数运算的结果是浮点数。
```
a = np.ones((2,3), dtype=int)
b = np.random.random((2,3))
```

In [None]:
import time
import math

x = [i * 0.001 for i in range(1000000)]
start = time.process_time()
for i, t in enumerate(x):
    x[i] = math.sin(t)   #python自带的函数
print("math.sin:", time.process_time() - start)    #统计计算时间

In [None]:
#采用numpy函数会计算的更快
x = [i * 0.001 for i in range(1000000)]
x = np.array(x)   # x已经转变为 ndarray对象
start = time.process_time()
np.sin(x,x)  #numpy的函数
print ("numpy.sin:", time.process_time() - start)

#### 2.1 常用函数

**一元ufunc**
* ceil(x): 向上最接近的整数，参数是 number 或 array
* floor(x): 向下最接近的整数，参数是 number 或 array
* rint(x): 四舍五入，参数是 number 或 array
* negative(x): 元素取反，参数是 number 或 array
* abs(x)：元素的绝对值，参数是 number 或 array
* square(x)：元素的平方，参数是 number 或 array
* aqrt(x)：元素的平方根，参数是 number 或 array
* sign(x)：计算各元素的正负号, 1(正数)、0（零）、-1(负数)，参数是 number 或 array
* modf(x)：将数组的小数和整数部分以两个独立数组的形式返回，参数是 number 或 array
* isnan(x): 判断元素是否为 NaN(Not a Number)，返回bool，参数是 number 或 array

```
a = np.array([-1.7,  1.5,  -0.2,  0.6,  10])
np.floor(a)
```

**二元ufunc**
* add(x, y): 元素相加，x + y，参数是 number 或 array
* subtract(x, y): 元素相减，x – y，参数是 number 或 array
* multiply(x, y): 元素相乘，x * y，参数是 number 或 array
* divide(x, y): 元素相除，x / y，参数是 number 或 array
* floor_divide(x, y): 元素相除取整数商(丢弃余数)，x // y，参数是 number 或 array
* mod(x, y): 元素求余数，x % y，参数是 number 或 array
* power(x, y): 元素求次方，x ** y，参数是 number 或 array
* equal(x1, x2 [, y]) : y = x1 == x2 
* not_equal(x1, x2 [, y]) : y = x1 != x2 
* less(x1, x2, [, y]) : y = x1 < x2 
* less_equal(x1, x2, [, y]) : y = x1 <= x2 
* greater(x1, x2, [, y]) : y = x1 > x2 
* greater_equal(x1, x2, [, y]) : y = x1 >= x2 

```
a = np.array([10,20,30]) 
b = np.array([3,5,7]) 
np.mod(a,b)
```
需要注意的是数组必须具有相同的形状或符合数组广播规则

NumPy提供了熟知的数学方法，如：sin、cos、exp等。在NumPy中，这些方法被称作广播函数。这些函数会对数组中的每个元素进行计算，返回计算后的数组。
```
B=np.arange(3)
print(B)
print(np.exp(B))
print(np.sqrt(B))
C=np.array([2,-1,4])
print(np.add(B,C))
print(B+C)
```

### 3.函数库

**比较运算**
* allclose(a, b[, rtol, atol, equal_nan]) 如果两个数组在容差范围内在元素方面相等，则返回True。
* isclose(a, b[, rtol, atol, equal_nan]) 返回一个布尔数组，其中两个数组在容差范围内是元素相等的。
* array_equal(a1, a2) 如果两个数组具有相同的形状和元素，则为真，否则为False。
* array_equiv(a1, a2) 如果输入数组的形状一致且所有元素相等，则返回True。
* greater(x1, x2, /[, out, where, casting, …]) 逐个元素方式返回（x1> x2）的真值。
* greater_equal(x1, x2, /[, out, where, …]) 逐个元素方式返回（x1> = x2）的真值。
* less(x1, x2, /[, out, where, casting, …]) 逐个元素方式返回
* less_equal(x1, x2, /[, out, where, casting, …]) 逐个元素方式返回
* equal(x1, x2, /[, out, where, casting, …]) 逐个元素返回（x1 == x2）。
* not_equal(x1, x2, /[, out, where, casting, …]) 逐个元素返回 Return (x1 != x2)。


**三角函数**
* sin(x, /[, out, where, casting, order, …]) 逐个元素运算三角正弦函数。
* cos(x, /[, out, where, casting, order, …]) 逐个元素运算三角余弦函数。
* tan(x, /[, out, where, casting, order, …]) 逐个元素运算三角正切函数。
* arcsin(x, /[, out, where, casting, order, …]) 逐个元素运算三角反正弦函数。
* arccos(x, /[, out, where, casting, order, …]) 逐个元素运算三角反余弦函数。
* arctan(x, /[, out, where, casting, order, …]) 逐个元素运算三角反正切函数。
* hypot(x1, x2, /[, out, where, casting, …]) 给定直角三角形的“腿”，返回它的斜边。
* arctan2(x1, x2, /[, out, where, casting, …]) 元素弧切线x1/x2正确选择象限。
* degrees(x, /[, out, where, casting, order, …]) 将角度从弧度转换为度数。
* radians(x, /[, out, where, casting, order, …]) 将角度从度数转换为弧度。
* unwrap(p[, discont, axis]) 通过将值之间的差值更改为2*pi补码来展开。
* deg2rad(x, /[, out, where, casting, order, …]) 将角度从度数转换为弧度。
* rad2deg(x, /[, out, where, casting, order, …]) 将角度从弧度转换为度数。

**求总和, 求乘积, 求差异**
* prod(a[, axis, dtype, out, keepdims]) 返回给定轴上的数组元素的乘积。
* sum(a[, axis, dtype, out, keepdims]) 给定轴上的数组元素的总和。
* nanprod(a[, axis, dtype, out, keepdims]) 返回给定轴上的数组元素的乘积。
* nansum(a[, axis, dtype, out, keepdims]) 返回给定轴上的数组元素的总和。
* cumprod(a[, axis, dtype, out]) 返回给定轴上元素的累积乘积。
* cumsum(a[, axis, dtype, out]) 返回给定轴上元素的累积和。
* nancumprod(a[, axis, dtype, out]) 返回给定轴上的数组元素的累积乘积
* nancumsum(a[, axis, dtype, out]) 返回给定轴上的数组元素的累积和。
* diff(a[, n, axis]) 计算沿给定轴的第n个离散差。
* ediff1d(ary[, to_end, to_begin]) 数组的连续元素之间的差异。
* gradient(f, varargs, *kwargs) 返回N维数组的渐变。
* cross(a, b[, axisa, axisb, axisc, axis]) 返回两个（数组）向量的叉积。
* trapz(y[, x, dx, axis]) 沿给定的轴积分使用复合梯形规则运算。

**平均数和差异**
* median(a[, axis, out, overwrite_input, keepdims]) 沿指定轴计算中值。
* average(a[, axis, weights, returned]) 计算沿指定轴的加权平均。
* mean(a[, axis, dtype, out, keepdims]) 沿指定的轴计算算术平均值。
* std(a[, axis, dtype, out, ddof, keepdims]) 计算沿指定轴的标准偏差。
* var(a[, axis, dtype, out, ddof, keepdims]) 计算沿指定轴的方差。
* nanmedian(a[, axis, out, overwrite_input, …]) 在忽略NAS的情况下，沿指定的轴计算中值。
* nanmean(a[, axis, dtype, out, keepdims]) 计算沿指定轴的算术平均值，忽略NAS。
* nanstd(a[, axis, dtype, out, ddof, keepdims]) 计算指定轴上的标准偏差，而忽略NAS。
* nanvar(a[, axis, dtype, out, ddof, keepdims]) 计算指定轴上的方差，同时忽略NAS。

```
a=np.random.random((2,3))
print(a)
print(a.sum())
print(a.mean())
print(a.max())
print(a.min())
```

默认的，这些操作是对整个数组进行计算，没有考虑到数组的形状。你可以设置axis参数来指定运算方向。axis表示第n维（从0开始）。
```
b=np.arange(12).reshape(3,4)
print(b)
print(b.sum(axis=0)) #对第0维的元素求和
print(b.sum(axis=1)) #对第1维的元素求和
print(b.min(axis=1))
print(b.cumsum(axis=1)) #对第1维的元素累加求和
```

### 4.文件存取

使用numpy.savetxt和numpy.loadtxt可以读写1维和2维的数组
```
np.loadtxt(FILENAME, dtype=int, delimiter=' ')
np.savetxt(FILENAME, a, fmt="%d", delimiter=",")

a = np.arange(0,12,0.5).reshape(4,-1)
np.savetxt("a.txt", a) # 缺省按照'%.18e'格式保存数据，以空格分隔
np.loadtxt("a.txt")

np.savetxt("a.txt", a, fmt="%d", delimiter=",") #改为保存为整数，以逗号分隔
np.loadtxt("a.txt",delimiter=",") # 读入的时候也需要指定逗号分隔
```

In [None]:
a = np.arange(0,12).reshape(3,4)
a

In [None]:
np.savetxt("a.txt", a, fmt='%10.5f')

In [None]:
b = np.loadtxt("a.txt",delimiter=",", dtype=str)

In [None]:
b

# Any Questions?

小练习，不执行下面的代码，阅读代码分析，会输出什么结果？
然后创新新的cell，复制代码执行看是否正确

```python
list1=[]
for i in range(1,10):
    for j in range(1,10):
        list1.append(i*j)
        
a1 = np.array(list1).reshape(9,9)
print(a1)
```