### <center>NumPy基本使用语法</center>

### 1.什么是NumPy？

NumPy(Numerical Python) 是 Python 语言的一个扩展程序库，支持大规模的**维度数组与矩阵运算**，此外也针对数组运算提供大量的数学函数库。

- 数组矩阵是科学计算、机器学习的基础。  NumPy操作简单，避免写大量循环

对于同样的数值计算任务，使用NumPy要比直接编写Python代码便捷得多。这是因为NumPy能够直接对数组和矩阵进行操作，可以省略很多循环语句，其众多的数学函数也会让编写代码的工作轻松许多。

- 底层基于c语言编写，性能好

NumPy中数组的存储效率和输入输出性能均远远优于Python中等价的基本数据结构（如嵌套的list容器）。其能够提升的性能是与数组中元素的数目成比例的。对于大型数组的运算，使用NumPy的确很有优势。对于TB级的大文件，NumPy使用内存映射文件来处理，以达到最优的数据读写性能。

- 适合存储计算图像、音频、视频等数据


NumPy的官方文档：
https://docs.scipy.org/doc/numpy/reference/


### 2.如何创建数组？

- ndarray：  多维数据数据结构，一种新的数据类型
- ufunc： 配套的很多函数

In [None]:
#导入numpy包，这样才能使用它提供的对象和函数，按惯例大家命名为 简写的 np
import numpy as np  

#### 使用list创建数据组ndarray

In [None]:
# 使用list数据初始化一个 ndarray
a=np.array([1,2,3])



print(a) # a变量就是 numpy的数据对象， ndarray
b=np.array([1.1,2.2,3.3])
print(b.dtype)
c=np.array([[1,2,3],[4,5,6]]) #创建二维数组
c


In [None]:
a=np.array([1,2,'3'])  #ndarray里数据需要为统一类型，为自动转换；  list里不要求
a

In [None]:
a=np.array([1,2,3.3])
a

#### 使用arange函数

为了创建列表，NumPy提供了和 ```range``` 类似的函数，通过指定开始值、终值和步长来创建一维数组，注意数组不包括终值。
```py
np.arange(start,end,step)
a=np.arange(10,30,5)
b=np.arange(0,2,0.3)#同样可以接收浮点数
```
arange函数可以看做是range函数的数组版，能生成一个一维数组，然后可以用reshape函数将一维数组改变成想要的形状，原数组的shape保持不变。
```py
b = a.reshape(5, -1)
```

In [None]:
a = np.arange(1, 100,2)    #步长为2
print(a )
b = np.arange(0, 3, 0.3)
print(b)


In [None]:
#生成随机数组
ra=np.random.rand(10)
print(ra)

In [None]:
#修改数组形状shape
b = ra.reshape(5 , -1)  #   -1表示 对a重组，为5行，列的数目自动计算即10/5=2
print(b)

### 2.如何访问数组里数据？

数组元素的存取方法和Python中字符串和list的标准方法相同

In [None]:
a = np.arange(10)
a[5] # 用整数作为下标可以获取数组中的某个元素
a[3:5] # 用范围作为下标获取数组的一个切片，包括a[3]不包括a[5]
a[:5] # 省略开始下标，表示从a[0]开始
a[:-1] # 下标可以使用负数，表示从数组后往前数
a[2:4] = 100,101 # 下标还可以用来修改元素的值
a[1:-1:2] # 范围中的第三个参数表示步长，2表示隔一个元素取一个元素
a[::-1] # 省略范围的开始下标和结束下标，步长为-1，整个数组头尾颠倒
a[5:1:-2] # 步长为负数时，开始下标必须大于结束下标

### 3.数组的运算



构造数组
![Data Layout](img/data.png)

加法： 实现对应位置上的数据相加的操作（即每行数据进行相加），这种操作比循环读取数组的方法代码实现更加简洁。
![Data Layout](img/jiafa.png)
![Data Layout](img/jianfa.jpeg)

In [None]:
data=np.array([1,2])
data

In [None]:
ones=np.ones(2)
ones

In [None]:
data+ones

In [None]:
data-ones

## 矩阵点乘
![Data Layout](img/dot.png)

![Data Layout](img/dot2.jpeg)

### 4.多维数组

多维数组的存取和一维数组类似，因为多维数组有多个轴，因此它的下标需要用多个值来表示

In [None]:
duowei = np.arange(0, 60).reshape(6,10)
duowei

In [None]:
duowei[1:3, 3:5]

### 5.NumPy提供的数组的函数ufunc

ufunc是universal function的缩写，它是一种能对数组的每个元素进行操作的函数。许多ufunc函数都是在C语言级别实现的，因此它们的计算速度非常快。

**一元ufunc**  ：数学运算
* ceil(x): 向上最接近的整数，参数是 number 或 array
* floor(x): 向下最接近的整数，参数是 number 或 array
* rint(x): 四舍五入，参数是 number 或 array
* negative(x): 元素取反，参数是 number 或 array
* abs(x)：元素的绝对值，参数是 number 或 array
* square(x)：元素的平方，参数是 number 或 array
* aqrt(x)：元素的平方根，参数是 number 或 array
* sign(x)：计算各元素的正负号, 1(正数)、0（零）、-1(负数)，参数是 number 或 array
* modf(x)：将数组的小数和整数部分以两个独立数组的形式返回，参数是 number 或 array
* isnan(x): 判断元素是否为 NaN(Not a Number)，返回bool，参数是 number 或 array


In [None]:
x=np.array([1.1,2.2,3]) 
np.square(x)  #一元ufunc调用实例

**二元ufunc**  ：数组的四则运算与比较运算
* add(x, y): 元素相加，x + y，参数是 number 或 array
* subtract(x, y): 元素相减，x – y，参数是 number 或 array
* multiply(x, y): 元素相乘，x * y，参数是 number 或 array
* divide(x, y): 元素相除，x / y，参数是 number 或 array
* floor_divide(x, y): 元素相除取整数商(丢弃余数)，x // y，参数是 number 或 array
* mod(x, y): 元素求余数，x % y，参数是 number 或 array
* power(x, y): 元素求次方，x ** y，参数是 number 或 array
* equal(x1, x2 [, y]) : y = x1 == x2 
* not_equal(x1, x2 [, y]) : y = x1 != x2 
* less(x1, x2, [, y]) : y = x1 < x2 
* less_equal(x1, x2, [, y]) : y = x1 <= x2 
* greater(x1, x2, [, y]) : y = x1 > x2 
* greater_equal(x1, x2, [, y]) : y = x1 >= x2 


In [None]:
#数组间运算，是每个位置的元素对应分别计算,形状需要一样
x=np.array([1,2,3])
y=np.array([5,6,7]) 

print(x+y)
print(x-y)
print(x*y)
print(x/y)

In [None]:
print(x<y)

### 7.NumPy提供了其他的函数库

函数库不是只针对ndarray数组，是一些通用的函数，对int ，float也可以使用

**比较运算**
* allclose(a, b[, rtol, atol, equal_nan]) 如果两个数组在容差范围内在元素方面相等，则返回True。
* isclose(a, b[, rtol, atol, equal_nan]) 返回一个布尔数组，其中两个数组在容差范围内是元素相等的。
* array_equal(a1, a2) 如果两个数组具有相同的形状和元素，则为真，否则为False。
* array_equiv(a1, a2) 如果输入数组的形状一致且所有元素相等，则返回True。
* greater(x1, x2, /[, out, where, casting, …]) 逐个元素方式返回（x1> x2）的真值。
* greater_equal(x1, x2, /[, out, where, …]) 逐个元素方式返回（x1> = x2）的真值。
* less(x1, x2, /[, out, where, casting, …]) 逐个元素方式返回
* less_equal(x1, x2, /[, out, where, casting, …]) 逐个元素方式返回
* equal(x1, x2, /[, out, where, casting, …]) 逐个元素返回（x1 == x2）。
* not_equal(x1, x2, /[, out, where, casting, …]) 逐个元素返回 Return (x1 != x2)。

**三角函数**
* sin(x, /[, out, where, casting, order, …]) 逐个元素运算三角正弦函数。
* cos(x, /[, out, where, casting, order, …]) 逐个元素运算三角余弦函数。
* tan(x, /[, out, where, casting, order, …]) 逐个元素运算三角正切函数。
* arcsin(x, /[, out, where, casting, order, …]) 逐个元素运算三角反正弦函数。
* arccos(x, /[, out, where, casting, order, …]) 逐个元素运算三角反余弦函数。
* arctan(x, /[, out, where, casting, order, …]) 逐个元素运算三角反正切函数。
* hypot(x1, x2, /[, out, where, casting, …]) 给定直角三角形的“腿”，返回它的斜边。
* arctan2(x1, x2, /[, out, where, casting, …]) 元素弧切线x1/x2正确选择象限。
* degrees(x, /[, out, where, casting, order, …]) 将角度从弧度转换为度数。
* radians(x, /[, out, where, casting, order, …]) 将角度从度数转换为弧度。
* unwrap(p[, discont, axis]) 通过将值之间的差值更改为2*pi补码来展开。
* deg2rad(x, /[, out, where, casting, order, …]) 将角度从度数转换为弧度。
* rad2deg(x, /[, out, where, casting, order, …]) 将角度从弧度转换为度数。

**求总和, 求乘积, 求差异**
* prod(a[, axis, dtype, out, keepdims]) 返回给定轴上的数组元素的乘积。
* sum(a[, axis, dtype, out, keepdims]) 给定轴上的数组元素的总和。
* nanprod(a[, axis, dtype, out, keepdims]) 返回给定轴上的数组元素的乘积。
* nansum(a[, axis, dtype, out, keepdims]) 返回给定轴上的数组元素的总和。
* cumprod(a[, axis, dtype, out]) 返回给定轴上元素的累积乘积。
* cumsum(a[, axis, dtype, out]) 返回给定轴上元素的累积和。
* nancumprod(a[, axis, dtype, out]) 返回给定轴上的数组元素的累积乘积
* nancumsum(a[, axis, dtype, out]) 返回给定轴上的数组元素的累积和。
* diff(a[, n, axis]) 计算沿给定轴的第n个离散差。
* ediff1d(ary[, to_end, to_begin]) 数组的连续元素之间的差异。
* gradient(f, varargs, *kwargs) 返回N维数组的渐变。
* cross(a, b[, axisa, axisb, axisc, axis]) 返回两个（数组）向量的叉积。
* trapz(y[, x, dx, axis]) 沿给定的轴积分使用复合梯形规则运算。

**平均数和差异**
* median(a[, axis, out, overwrite_input, keepdims]) 沿指定轴计算中值。
* average(a[, axis, weights, returned]) 计算沿指定轴的加权平均。
* mean(a[, axis, dtype, out, keepdims]) 沿指定的轴计算算术平均值。
* std(a[, axis, dtype, out, ddof, keepdims]) 计算沿指定轴的标准偏差。
* var(a[, axis, dtype, out, ddof, keepdims]) 计算沿指定轴的方差。
* nanmedian(a[, axis, out, overwrite_input, …]) 在忽略NAS的情况下，沿指定的轴计算中值。
* nanmean(a[, axis, dtype, out, keepdims]) 计算沿指定轴的算术平均值，忽略NAS。
* nanstd(a[, axis, dtype, out, ddof, keepdims]) 计算指定轴上的标准偏差，而忽略NAS。
* nanvar(a[, axis, dtype, out, ddof, keepdims]) 计算指定轴上的方差，同时忽略NAS。

In [None]:
import time
import math

x = [i * 0.001 for i in range(1000000)]
start = time.process_time()
for i, t in enumerate(x):
    x[i] = math.sin(t)   #python自带的函数
print("math.sin:", time.process_time() - start)    #统计计算时间

In [None]:
#采用numpy函数会计算的更快
x = [i * 0.001 for i in range(1000000)]
x = np.array(x)   # x已经转变为 ndarray对象
start = time.process_time()
np.sin(x)  #numpy的函数
print ("numpy.sin:", time.process_time() - start)

### 8.NumPy的文件读取函数

从文件里读取数据直接构建ndarray，或者把结果保存

使用numpy.savetxt和numpy.loadtxt可以读写1维和2维的数组
```
np.loadtxt(FILENAME, dtype=int, delimiter=' ')
np.savetxt(FILENAME, a, fmt="%d", delimiter=",")

a = np.arange(0,12,0.5).reshape(4,-1)
np.savetxt("a.txt", a) # 缺省按照'%.18e'格式保存数据，以空格分隔
np.loadtxt("a.txt")

np.savetxt("a.txt", a, fmt="%d", delimiter=",") #改为保存为整数，以逗号分隔
np.loadtxt("a.txt",delimiter=",") # 读入的时候也需要指定逗号分隔
```

In [None]:
a = np.arange(0,12).reshape(3,4)
np.savetxt("a.txt", a, delimiter=",",fmt='%10.5f')
a 

In [None]:
b = np.loadtxt("a.txt",delimiter=",", dtype=float)
b

### 练习

不执行下面的代码，阅读代码分析，会输出什么结果？ 然后添加一个新的cell，复制代码执行看是否正确
```
list1=[]
for i in range(1,10):
    for j in range(1,10):
        list1.append(i*j)

a1 = np.array(list1).reshape(9,9)
print(a1)
```