### <center>数值计算库NumPy基本使用语法</center>

**Jupyter Notebook简介**

1.cell type:
markdown 用于写笔记，有一定语法 https://www.jianshu.com/p/576e3f1049f8 可以参考
code： 用于写python代码来执行

2.code cell
选中一个cell 点运行
清除cell运行结果    cell->current outputs->clear  cell-> all outputs ->clear



2.可以新建一个notebook
File->new notebookj

3.打印
File->print preview
或 download as  html

### 1.什么是NumPy？

NumPy(Numerical Python) 是 Python 语言的一个扩展程序库，支持大规模的**维度数组与矩阵运算**，此外也针对数组运算提供大量的数学函数库。

- 数组矩阵是科学计算、机器学习的基础。  NumPy操作简单，避免写大量循环

- 底层基于c语言编写，性能好

- 适合存储计算图像、音频、视频等数据

- 是后续Pandas、scipy等的基础

NumPy的官方文档：
https://docs.scipy.org/doc/numpy/reference/


NumPy 通常与 SciPy（Scientific Python）和 Matplotlib（绘图库）一起使用， 这种组合广泛用于**替代 MatLab**，是一个强大的科学计算环境，有助于我们通过 Python 学习数据科学或者机器学习。

SciPy 是一个开源的 Python 算法库和数学工具包。SciPy 包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。

Matplotlib 是 Python 编程语言及其数值数学扩展包 NumPy 的可视化操作界面。它为利用通用的图形用户界面工具包，如 Tkinter, wxPython, Qt 或 GTK+ 向应用程序嵌入式绘图提供了应用程序接口（API）。

**本课程重点介绍和数据存储计算相关功能，不介绍SciPy处理高等数学相关内容**

### 2.如何创建数组？

- ndarray：  多维数据数据结构，一种新的数据类型
- ufunc： 提供了配套的很多函数

In [None]:
#导入numpy包，这样才能使用它提供的对象和函数，按惯例大家命名为 简写的 np
import numpy as np  

#### 使用list创建数据组ndarray

In [None]:
# 使用Python list数据初始化一个 ndarray
a=np.array([1,2,3])

print(a) # a变量就是 numpy的数据对象， ndarray； print表示打印输出到屏幕
a #一个 code类型的cell 最后一行 放一个变量名


In [None]:
a=np.array([1,2,'3aaade'])  #ndarray里数据需要为统一类型，为自动转换；  list里不要求
a

In [None]:
a=np.array([1,2,3.3]) #都自动转换为float类型
a

#### 使用arange函数

为了创建列表，NumPy提供了和 ```Python range``` 类似的函数，通过指定开始值、终值和步长来创建一维数组，注意数组不包括终值。
```py
np.arange(start,end,step)
a=np.arange(10,30,5)
b=np.arange(0,2,0.3)#同样可以接收浮点数
```
arange函数可以看做是range函数的数组版，能生成一个一维数组，然后可以用reshape函数将一维数组改变成想要的形状，原数组的shape保持不变。
```py
b = a.reshape(5, -1)
```

In [None]:
a = np.arange(1, 100,2)    #步长为2 
print(a )
b = np.arange(0, 3, 0.3)
print(b)


In [None]:
#修改数组形状shape
b = b.reshape(2 , -1)    #   -1表示 对a重组，为5行，列的数目自动计算即10/5=2
print(b)

### 3.如何访问数组里数据？

数组元素的存取方法和Python中字符串和list的标准方法相同，请参考Python编程基础课程字符串部分内容

切片操作：ndarray[start:end:step] 从start这个位置开始，到end-1 截止， 每次跳step步

In [None]:
a = np.arange(10)  #string 切片操作一样； python  list 的切片
a

In [None]:
a = np.arange(10)
a[5] # 用整数作为下标可以获取数组中的某个元素
a[3:5] # 用范围作为下标获取数组的一个切片，包括a[3]不包括a[5]
a[:5] # 省略开始下标，表示从a[0]开始
a[:-1] # 下标可以使用负数，表示从数组后往前数
a[2:4] = 100,101 # 下标还可以用来修改元素的值
a[1:-1:2] # 范围中的第三个参数表示步长，2表示隔一个元素取一个元素
a[::-1] # 省略范围的开始下标和结束下标，步长为-1，整个数组头尾颠倒
a[5:1:-2] # 步长为负数时，开始下标必须大于结束下标

In [None]:
a[3:5]

### 4.数组的运算



构造数组
![Data Layout](img/data.png)

加法： 实现对应位置上的数据相加的操作（即每行数据进行相加），这种操作比循环读取数组的方法代码实现更加简洁。
![Data Layout](img/jiafa.png)
![Data Layout](img/jianfa.jpeg)

In [None]:
data=np.array([1,2])
data

In [None]:
ones=np.ones(2)
ones

In [None]:
data+ones

In [None]:
data-ones

### 5.多维数组

多维数组的存取和一维数组类似，因为多维数组有多个轴，因此它的下标需要用多个值来表示

In [None]:
c=np.array([[1,2,3],[4,5,6]]) #使用列表list创建二维数组
c


In [None]:
c.ndim #维数

In [None]:
c.size #元素个数

In [None]:
c.shape

In [None]:
duowei = np.arange(0, 60).reshape(6,10)
duowei

In [None]:
duowei[1:3, 3:5]

### 6. 随机数

In [None]:
np.random.seed(10) #设定一个seed，确保随机序列不变

a=np.random.rand(3,4)      #创建指定为3行4列的数组(范围在0至1之间)
print("创建指定为3行4列)的数组：\n",a)   #\n 表示换行


#从一个均匀分布[low,high)中随机采样，注意定义域是左闭右开，即包含low，不包含high
b=np.random.uniform(0,100) #创建指定范围内的一个数
print("创建指定范围内的一个数：%.2f" %b) #%.2f 表示结果保留2位小数


#返回一个随机整型数，范围从低（包括）到高（不包括），即[low, high)
c=np.random.randint(0,100) #创建指定范围内的一个整数
print("创建指定范围内的一个整数：",c)


In [None]:
#正态分布生成3行4列的二维数组
a= np.random.normal(1.5, 3, (3, 4))  #均值为1.5，标准差为3
print(a)
# 截取第1至2行的第2至3列(从第0行、0列算起算起)
b = a[1:3, 2:4]
print("截取第1至2行的第2至3列: \n",b)


### 7. NumPy统计类运算

In [None]:
a=np.arange(20).reshape(4,5)
print("原数组a:\n",a)
print("a全部元素和: ", a.sum())
print("a的最大值: ", a.max())
print("a的最小值: ", a.min())
print("a每行的最大值: ", a.max(axis=1))  #axis=1代表行
print("a每列的最大值: ", a.min(axis=0))  #axis=0代表列
print("a每行元素的求和: ", a.sum(axis=1)) 
print("a每行元素的均值：",np.mean(a,axis=1))
print("a每行元素的标准差：",np.std(a,axis=1))

### 8. 矩阵运算

In [None]:
A = np.array([[0,1], [1,2]])  #数组
B = np.array([[2,5],[3,4]])   #数组
print("对应元素相乘：\n",A*B)
print("矩阵点乘：\n",A.dot(B))
print("矩阵点乘：\n",np.dot(A,B))  #(M行, N列) * (N行, Z列) = (M行, Z列)
print("横向相加：\n",np.hstack((A,B)))
print("纵向相加：\n",np.vstack((A,B)))

### 9.NumPy提供的数组的函数ufunc

ufunc是universal function的缩写，它是一种能对数组的每个元素进行操作的函数。许多ufunc函数都是在C语言级别实现的，因此它们的计算速度非常快。

**一元ufunc**  ：数学运算
* ceil(x): 向上最接近的整数，参数是 number 或 array
* floor(x): 向下最接近的整数，参数是 number 或 array
* rint(x): 四舍五入，参数是 number 或 array
* negative(x): 元素取反，参数是 number 或 array
* abs(x)：元素的绝对值，参数是 number 或 array
* square(x)：元素的平方，参数是 number 或 array
* aqrt(x)：元素的平方根，参数是 number 或 array
* sign(x)：计算各元素的正负号, 1(正数)、0（零）、-1(负数)，参数是 number 或 array
* modf(x)：将数组的小数和整数部分以两个独立数组的形式返回，参数是 number 或 array
* isnan(x): 判断元素是否为 NaN(Not a Number)，返回bool，参数是 number 或 array


In [None]:
x=np.array([1.1,2.2,3]) 
np.square(x)  #一元ufunc调用实例

**二元ufunc**  ：数组的四则运算与比较运算
* add(x, y): 元素相加，x + y，参数是 number 或 array
* subtract(x, y): 元素相减，x – y，参数是 number 或 array
* multiply(x, y): 元素相乘，x * y，参数是 number 或 array
* divide(x, y): 元素相除，x / y，参数是 number 或 array
* floor_divide(x, y): 元素相除取整数商(丢弃余数)，x // y，参数是 number 或 array
* mod(x, y): 元素求余数，x % y，参数是 number 或 array
* power(x, y): 元素求次方，x ** y，参数是 number 或 array
* equal(x1, x2 [, y]) : y = x1 == x2 
* not_equal(x1, x2 [, y]) : y = x1 != x2 
* less(x1, x2, [, y]) : y = x1 < x2 
* less_equal(x1, x2, [, y]) : y = x1 <= x2 
* greater(x1, x2, [, y]) : y = x1 > x2 
* greater_equal(x1, x2, [, y]) : y = x1 >= x2 


### 10.NumPy提供了其他的函数库

函数库不是只针对ndarray数组，是一些通用的函数，对int ，float也可以使用

**比较运算**
* allclose(a, b[, rtol, atol, equal_nan]) 如果两个数组在容差范围内在元素方面相等，则返回True。
* isclose(a, b[, rtol, atol, equal_nan]) 返回一个布尔数组，其中两个数组在容差范围内是元素相等的。
* array_equal(a1, a2) 如果两个数组具有相同的形状和元素，则为真，否则为False。
* array_equiv(a1, a2) 如果输入数组的形状一致且所有元素相等，则返回True。
* greater(x1, x2, /[, out, where, casting, …]) 逐个元素方式返回（x1> x2）的真值。
* greater_equal(x1, x2, /[, out, where, …]) 逐个元素方式返回（x1> = x2）的真值。
* less(x1, x2, /[, out, where, casting, …]) 逐个元素方式返回
* less_equal(x1, x2, /[, out, where, casting, …]) 逐个元素方式返回
* equal(x1, x2, /[, out, where, casting, …]) 逐个元素返回（x1 == x2）。
* not_equal(x1, x2, /[, out, where, casting, …]) 逐个元素返回 Return (x1 != x2)。

**三角函数**
* sin(x, /[, out, where, casting, order, …]) 逐个元素运算三角正弦函数。
* cos(x, /[, out, where, casting, order, …]) 逐个元素运算三角余弦函数。
* tan(x, /[, out, where, casting, order, …]) 逐个元素运算三角正切函数。
* arcsin(x, /[, out, where, casting, order, …]) 逐个元素运算三角反正弦函数。
* arccos(x, /[, out, where, casting, order, …]) 逐个元素运算三角反余弦函数。
* arctan(x, /[, out, where, casting, order, …]) 逐个元素运算三角反正切函数。
* hypot(x1, x2, /[, out, where, casting, …]) 给定直角三角形的“腿”，返回它的斜边。
* arctan2(x1, x2, /[, out, where, casting, …]) 元素弧切线x1/x2正确选择象限。
* degrees(x, /[, out, where, casting, order, …]) 将角度从弧度转换为度数。
* radians(x, /[, out, where, casting, order, …]) 将角度从度数转换为弧度。
* unwrap(p[, discont, axis]) 通过将值之间的差值更改为2*pi补码来展开。
* deg2rad(x, /[, out, where, casting, order, …]) 将角度从度数转换为弧度。
* rad2deg(x, /[, out, where, casting, order, …]) 将角度从弧度转换为度数。

**求总和, 求乘积, 求差异**
* prod(a[, axis, dtype, out, keepdims]) 返回给定轴上的数组元素的乘积。
* sum(a[, axis, dtype, out, keepdims]) 给定轴上的数组元素的总和。
* nanprod(a[, axis, dtype, out, keepdims]) 返回给定轴上的数组元素的乘积。
* nansum(a[, axis, dtype, out, keepdims]) 返回给定轴上的数组元素的总和。
* cumprod(a[, axis, dtype, out]) 返回给定轴上元素的累积乘积。
* cumsum(a[, axis, dtype, out]) 返回给定轴上元素的累积和。
* nancumprod(a[, axis, dtype, out]) 返回给定轴上的数组元素的累积乘积
* nancumsum(a[, axis, dtype, out]) 返回给定轴上的数组元素的累积和。
* diff(a[, n, axis]) 计算沿给定轴的第n个离散差。
* ediff1d(ary[, to_end, to_begin]) 数组的连续元素之间的差异。
* gradient(f, varargs, *kwargs) 返回N维数组的渐变。
* cross(a, b[, axisa, axisb, axisc, axis]) 返回两个（数组）向量的叉积。
* trapz(y[, x, dx, axis]) 沿给定的轴积分使用复合梯形规则运算。

**平均数和差异**
* median(a[, axis, out, overwrite_input, keepdims]) 沿指定轴计算中值。
* average(a[, axis, weights, returned]) 计算沿指定轴的加权平均。
* mean(a[, axis, dtype, out, keepdims]) 沿指定的轴计算算术平均值。
* std(a[, axis, dtype, out, ddof, keepdims]) 计算沿指定轴的标准偏差。
* var(a[, axis, dtype, out, ddof, keepdims]) 计算沿指定轴的方差。
* nanmedian(a[, axis, out, overwrite_input, …]) 在忽略NAS的情况下，沿指定的轴计算中值。
* nanmean(a[, axis, dtype, out, keepdims]) 计算沿指定轴的算术平均值，忽略NAS。
* nanstd(a[, axis, dtype, out, ddof, keepdims]) 计算指定轴上的标准偏差，而忽略NAS。
* nanvar(a[, axis, dtype, out, ddof, keepdims]) 计算指定轴上的方差，同时忽略NAS。

## Numpy进行图像处理小案例

In [None]:
from imageio import imread

import matplotlib.pyplot as plt

img = plt.imread( 'img/dog.jpg')

plt.imshow(img)

In [None]:
type(img)

In [None]:
img.shape   #1000 1000分别表示图像高度与宽度的像素值， 第三个数字表示图像有红、绿、蓝三个通道( RGB channel ) 

In [None]:
img[600,300,:] #一个像素点

In [None]:
img.ndim

In [None]:
plt.imshow(img[ 200:, :, :]) #200行以下

In [None]:
plt.imshow(img[ :, 200:, :])#200列右

In [None]:
img_rotate = img[ :, ::-1, :]  #每一行的值替换为 从右往左

plt.imshow(img_rotate)

In [None]:
img_rotate = img[ ::-1, :, :]  #每一行都取

plt.imshow(img_rotate)

灰度图的数据可以看成是二维数组，元素取值为0 ~ 255，其中，0为黑色，255为白色。从0到255逐渐由暗色变为亮色。

灰度图转换（ITU-R 601-2亮度变换）：

L = R * 299 / 1000 + G * 587 / 1000 + B * 114 / 1000

In [None]:
# a# 三维的数组  最高维：高，   次高维：宽     最低维[R,G,B]
b=np.array([0.299,0.587,0.114])
x=np.dot(img,b)  # 将上面的RGB和b数组中的每个元素进行对位相乘，再相加，一定得到的是一个数字L
plt.imshow(x,cmap="gray") 


In [None]:
#将图像沿重复
t=img.copy() 

# 先水平方向两次，再垂直方向3次
r1=np.concatenate((t,t),axis=1)
r2=np.concatenate((r1,r1),axis=0)
plt.imshow(r2)
