# Numpy 基础讲解
***
## 1. Numpy 简介与安装教程
###     1.1 [Numpy 简介](#1.1)
###     1.2 [安装教程](#1.1)
***
## 2. NumPy Ndarray 对象
###     2.1 [数据类型](#2.1)
###     2.2 [数组属性](#2.2)
###     2.3 [数组创建](#2.3)
***
## 3. NumPy 切片和索引
###     3.1 [切片和索引](#3.1)
###     3.2 [高级索引](#3.2)
###     3.3 [副本和视图](#3.3)
***
## 4. NumPy 数组操作
###     4.1 [修改数组形状](#4.1)
###     4.2 [翻转数组](#4.2)
###     4.3 [修改数组维度](#4.3)
###     4.4 [连接数组](#4.4)
###     4.5 [分割数组](#4.5)
###     4.6 [数组元素的添加与删除](#4.6)
***
## 5. NumPy 内置函数
###     5.1 [字符串函数](#5.1)
###     5.2 [数学函数](#5.2)
###     5.3 [算数函数](#5.3)
###     5.4 [统计函数](#5.4)
###     5.5 [排序、条件刷选函数](#5.5)
***
## 6. NumPy 读写和应用 
###     6.1 [保存和读取](#6.1)
###     6.2 [矩阵库](#6.2)
###     6.3 [线性代数](#6.3)
###     6.4 [NumPy & Matplotlib](#6.4)
——————————————————————————————————————————————————————————————





## 1. Numpy 简介与安装教程



### 1.1
### Numpy 简介

![title](png/1.png)

NumPy(Numerical Python) 是 Python 语言的一个扩展程序库，支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。

NumPy 的前身 Numeric 最早是由 Jim Hugunin 与其它协作者共同开发，2005 年，Travis Oliphant 在 Numeric 中结合了另一个同性质的程序库 Numarray 的特色，并加入了其它扩展而开发了 NumPy。NumPy 为开放源代码并且由许多协作者共同维护开发。

**NumPy 是一个运行速度非常快的数学库，主要用于数组计算，包含：**

- 一个快速、高效的N维数组对象 ndarray
- 基于元素的数组计算以及数组间数学操作函数
- 用于读写硬盘中基于数组的数据集
- 线性代数、傅里叶变换、随机数生成等功能

**NumPy 应用**

NumPy 通常与 SciPy（Scientific Python）和 Matplotlib（绘图库）一起使用， 这种组合广泛用于替代 MatLab，是一个强大的科学计算环境，有助于我们通  过 Python 学习数据科学或者机器学习。
SciPy 是一个开源的 Python 算法库和数学工具包。
SciPy 包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。
Matplotlib 是 Python 编程语言及其数值数学扩展包 NumPy 的可视化操作界面。它为利用通用的图形用户界面工具包，如 Tkinter, wxPython, Qt 或 GTK+ 向应用程序嵌入式绘图提供了应用程序接口（API）。

### 1.2 
### Numpy 安装
### 1.2.1 使用已有的发行版本
对于许多用户，尤其是在 Windows 上，最简单的方法是下载以下的 Python 发行版，它们包含了所有的关键包（包括 NumPy，SciPy，matplotlib，IPython，SymPy 以及 Python 核心自带的其它包）：
1. Anaconda: 免费 Python 发行版，用于进行大规模数据处理、预测分析，和科学计算，致力于简化包的管理和部署。支持 Linux, Windows 和 Mac 系统。
2. Enthought Canopy: 提供了免费和商业发行版。持 Linux, Windows 和 Mac 系统。
3. Python(x,y): 免费的 Python 发行版，包含了完整的 Python 语言开发包 及 Spyder IDE。支持 Windows，仅限 Python 2 版本。
4. WinPython: 另一个免费的 Python 发行版，包含科学计算包与 Spyder IDE。支持 Windows。
5. Pyzo: 基于 Anaconda 的免费发行版本及 IEP 的交互开发环境，超轻量级。 支持 Linux, Windows 和 Mac 系统。

### 1.2.2 使用 pip 安装
#### Windows 系统
安装 NumPy 最简单的方法就是使用 pip 工具：


In [17]:
pip install numpy scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple

Looking in indexes: https://pypi.tuna.tsinghua.edu.cn/simple
Note: you may need to restart the kernel to use updated packages.


**Mac 系统**

Mac 系统的 Homebrew 不包含 NumPy 或其他一些科学计算包，所以可以使用以下方式来安装：

In [18]:
pip3 install numpy scipy matplotlib -i https://pypi.tuna.tsinghua.edu.cn/simple

SyntaxError: invalid syntax (<ipython-input-18-f47647961388>, line 1)

**安装验证**

测试是否安装成功：

In [None]:
import numpy as np
a=np.eye(4)
print(a)

****
##  2. NumPy Ndarray 对象


NumPy 最重要的一个特点是其 **N 维数组对象 ndarray**，它是一系列同类型数据的集合，**以 0 下标为开始**进行集合中元素的索引。

- ndarray 对象是用于存放同类型元素的多维数组。（dtype)

- ndarray 中的每个元素在内存中都有相同存储大小的区域。(shape)
![title](png/2.png)

创建一个 ndarray 只需调用 NumPy 的 array 函数即可：

numpy.array(object, dtype = None, copy = True, order = None, subok = False, ndmin = 0)


![title](png/3.png)

In [19]:
# 实例一：最小维度的运用
import numpy as np 
a = np.array([1,2,3,4,5], ndmin =  2)  
print (a)  

[[1 2 3 4 5]]


### 2.1 
### 数据类型对象（dtype)

numpy 支持的数据类型比 Python 内置的类型要多很多，基本上可以和 C 语言的数据类型对应上，其中部分类型对应为 Python 内置的类型。

下表列举了常用 NumPy 基本类型。
![title](png/4.png)

numpy 的数值类型实际上是 dtype 对象的实例，并对应唯一的字符，包括 **np.bool_，np.int32，np.float32**，等等。
数据类型对象（numpy.dtype 类的实例）用来描述与数组对应的内存区域是如何使用，它描述了数据的以下几个方面：
1. 数据的类型（整数，浮点数或者 Python 对象）
2. 数据的大小（例如， 整数使用多少个字节存储）
3. 数据的字节顺序（小端法或大端法）
4. 在结构化类型的情况下，字段的名称、每个字段的数据类型和每个字段所取的内存块的部分
5. 如果数据类型是子数组，那么它的形状和数据类型是什么。

备注：字节顺序是通过对数据类型预先设定 < 或 > 来决定的。 < 意味着小端法(最小值存储在最小的地址，即低位组放在最前面)。> 意味着大端法(最重要的字节存储在最小的地址，即高位组放在最前面)。

In [20]:
#实例一：使用标量类型
import numpy as np
dt = np.dtype(np.int32)
print(dt)
dt

int32


dtype('int32')

In [None]:
# 实例二：int8, int16, int32, int64 四种数据类型可以使用字符串 'i1', 'i2','i4','i8' 代替
import numpy as np
dt = np.dtype('i4')
print(dt)

**下面的实例展示结构化数据类型的使用，类型字段和对应的实际类型将被创建。**

In [None]:
# 首先创建结构化数据类型
import numpy as np
dt = np.dtype([('age',np.int8)]) 
print(dt)

In [None]:
# 将数据类型应用于 ndarray 对象
import numpy as np
dt = np.dtype([('age',np.int8)]) 
a = np.array([(10,),(20,),(30,)], dtype = dt) 
print(a)

In [21]:
# 类型字段名可以用于存取实际的 age 列
import numpy as np
dt = np.dtype([('age',np.int8)]) 
a = np.array([(10,),(20,),(30,)], dtype = dt) 
print(a['age'])

[10 20 30]


### 2.2
### 数组属性
NumPy 数组的维数称为秩（rank），秩就是轴的数量，即数组的维度，一维数组的秩为 1，二维数组的秩为 2，以此类推。

在 NumPy中，每一个线性的数组称为是一个轴（axis），也就是维度（dimensions）。比如说，二维数组相当于是多个一维数组，其中第一个一维数组中每个元素又是一个一维数组。所以一维数组就是 NumPy 中的轴（axis），第一个轴相当于是底层数组，第二个轴是底层数组里的数组。而轴的数量——秩，就是数组的维数。

**很多时候可以声明 axis。axis=0，表示沿着第 0 轴进行操作，即对每一列进行操作；axis=1，表示沿着第1轴进行操作，即对每一行进行操作（仅适用于二维数组）。**

NumPy 的数组中比较重要 ndarray 对象属性有：
![title](png/5.png)

In [None]:
# 实例一：ndarray.ndim 用于返回数组的维数，等于秩
import numpy as np 

a = np.arange(24)  
print (a.ndim)             # a 现在只有一个维度

# 现在调整其大小
b = a.reshape(2,4,3)  # b 现在拥有三个维度
print (b.ndim)

In [None]:
# 实例二：ndarray.shape 表示数组的维度，返回一个元组，这个元组的长度就是维度的数目，即 ndim 属性(秩)。
import numpy as np  

a = np.array([[1,2,3],[4,5,6]])  
print (a.shape)

In [None]:
# 实例三：调整数组大小。
import numpy as np 

a = np.array([[1,2,3],[4,5,6]]) 
print (a)
a.shape =  (3,2)  
print (a)

In [None]:
# 实例四：NumPy 也提供了 reshape 函数来调整数组大小。
import numpy as np 

a = np.array([[1,2,3],[4,5,6]]) 
print(a)
b = a.reshape(3,2)  
print (b)
print (a)

### 注意ndarray.reshape 通常返回的是非拷贝副本，改变返回后数组的元素，原数组对应元素的值也会改变。

In [None]:
# 沿用上例
import numpy as np  

b[0,0]=99
print(b)
print (a)

### 2.3 
### Numpy数组创建
#### 2.3.1 常用数组创建方法
1. numpy.empty 方法用来创建一个指定形状（shape）、数据类型（dtype）且未初始化的数组：
    > numpy.empty(shape, dtype = float, order = 'C')
2. numpy.zeros 方法用来创建指定大小的数组，数组元素以 0 来填充：
    > numpy.zeros(shape, dtype = float, order = 'C')
3. numpy.ones 方法用来创建指定形状的数组，数组元素以 1 来填充：
    > numpy.ones(shape, dtype = None, order = 'C')

In [25]:
#实例
import numpy as np

x = np.empty([3,2], dtype = int) 
print (x)             # 注意：数组元素为随机值，因为它们未初始化。
y = np.zeros((2,2), dtype = [('x', 'i4'), ('y', 'i4')])  
print(y)
z = np.ones([2,2], dtype = int)
print(z)

[[2063314960        572]
 [         0          0]
 [         1        572]]
[[(0, 0) (0, 0)]
 [(0, 0) (0, 0)]]
[[1 1]
 [1 1]]


#### 2.3.2 NumPy 从已有的数组创建数组(numpy.asarray）
  

numpy.asarray 类似 numpy.array，但 numpy.asarray 参数只有三个，比 numpy.array 少两个。
   > numpy.asarray(a, dtype = None, order = None)


![title](png/6.png)

In [None]:
# 实例一：将列表转换为 ndarray。
import numpy as np 

x =  [1,2,3] 
a = np.asarray(x)  
a

In [None]:
# 将元组列表转换为 ndarray。
import numpy as np 

x =  [(1,2,3),(4,5)] 
a = np.asarray(x)  
a

#### 2.3.3 NumPy 从数值范围创建数组（numpy.arange）
numpy 包中的使用 arange 函数创建数值范围并返回 ndarray 对象，函数格式如下：
   > numpy.arange(start, stop, step, dtype)

![title](png/7.png)

In [26]:
# 实例一：从数值范围创建数组。
import numpy as np

a = np.arange(10,dtype = 'i4')  
a

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [None]:
# 实例二：numpy.linspace 函数用于创建一个一维数组，数组是一个等差数列构成的。
import numpy as np

a = np.linspace(1,10,10)
a

In [None]:
# 实例三：numpy.logspace 函数用于创建一个于等比数列(一维)
import numpy as np

a = np.logspace(1.0,  2.0, num =  10)  # 默认底数是 10
a

******
## 3.NumPy 切片和索引
ndarray对象的内容可以通过索引或切片来访问和修改，与 Python 中 list 的切片操作一样。

ndarray 数组可以**基于 0 - n 的下标进行索引**，切片对象可以通过内置的 slice 函数，并设置 start, stop 及 step 参数进行，从原数组中切割出一个新数组。
### 3.1
### NumPy 切片

In [27]:
# 实例一：使用slice方法来进行切片操作
import numpy as np

a = np.arange(10)
s = slice(2,7,2)   # 从索引 2 （第3个元素）开始到索引 7 （第8个元素）停止(不包括停止索引)，间隔为2
print (a[s])

[2 4 6]


In [None]:
# 实例二：使用冒号分隔切片参数 start:stop:step 来进行切片操作
import numpy as np

a = np.arange(10)  
b = a[2:7:2]   # 从索引 2 开始到索引 7 停止，间隔为 2
print(b)

### 冒号的解释：如果只放置一个参数，如 [2]，将返回与该索引相对应的单个元素。如果为 [2:]，表示从该索引开始以后的所有项都将被提取。如果使用了两个参数，如 [2:7]，那么则提取两个索引(不包括停止索引)之间的项。

In [None]:
# 实例三：冒号的用法
import numpy as np

a = np.arange(10)  # [0 1 2 3 4 5 6 7 8 9]
b = a[5] 
print(b)
c=a[2:]
print(c)

In [28]:
# 实例四：多维数组的切片同样适用上述方法
import numpy as np

a = np.array([[1,2,3],[3,4,5],[4,5,6]])
print(a)
# 从某个索引处开始切割，默认为axis = 0,对二维数组来说即沿着列切割
print('从数组索引 a[1:] 处开始切割')
print(a[1:])

[[1 2 3]
 [3 4 5]
 [4 5 6]]
从数组索引 a[1:] 处开始切割
[[3 4 5]
 [4 5 6]]


### 在多维数组的切片中，使用 , 区分维数。

In [None]:
# 实例五：','用于区分维度（二维中即行和列）
import numpy as np

a=np.arange(0,12)
a.shape=(3,4)
print(a)           # 可以把冒号左边的数看成是横坐标，右边的数看成是纵坐标，四个坐标做笛卡尔积，即取数组 a 下标为 (0,1),(0,2),(1,1),(1,2) 。
print(a[0:2,1:3])  # 注意：冒号分隔切片不包含停止索引。
                   

### 切片还可以包括省略号 …，来使选择元组的长度与数组的维度相同。 如果在行位置使用省略号，它将返回包含行中所有元素的 ndarray。

In [None]:
# 实例六： …在切片中的用法
import numpy as np

a = np.array([[1,2,3],[3,4,5],[4,5,6]])  
print (a[...,1])   # 第2列元素,在切片中相当于print(a[:,1])。
print (a[1,...])   # 第2行元素
print (a[...,1:])  # 第2列及剩下的所有元素

In [29]:
# 实例七：在多维数组中，非连续索引切片：
import numpy as np

b = np.arange(0, 25)
b.shape = (5, 5)
r = np.array([0,1,4])  # r = [0,1,4]
c = [1, 2, 4]   
print("b:\n", b)
print("b_slice:\n", b[r, :][:, c]) # 第1，2，5行和第2，3，5列的交叉元素组成的数组。

b:
 [[ 0  1  2  3  4]
 [ 5  6  7  8  9]
 [10 11 12 13 14]
 [15 16 17 18 19]
 [20 21 22 23 24]]
b_slice:
 [[ 1  2  4]
 [ 6  7  9]
 [21 22 24]]


In [None]:
#实例七衍生
print(b[r, :])
print(b[:, c])
print(b[r,c]) #得到的是点乘数组

### 3.2 
### 高级索引
  NumPy 比一般的 Python 序列提供更多的索引方式。除了之前看到的用整数和切片的索引外，数组可以由整数数组索引、布尔索引及花式索引。

#### 3.2.1整数数组索引

In [30]:
# 实例：获取数组x中(0,0)，(1,1)和(2,0)位置处的元素。
import numpy as np 

x = np.array([[1,  2],  [3,  4],  [5,  6]]) 
y = x[[0,1,2],  [0,1,0]]  
print (y)

[1 4 5]


#### 3.2.2布尔索引

我们可以通过一个布尔数组来索引目标数组。布尔索引通过布尔运算（如：比较运算符）来获取符合指定条件的元素的数组。

In [None]:
# 实例一：获取数组x中大于 5 的元素。
import numpy as np 

x = np.array([[  0,  1,  2],[  3,  4,  5],[  6,  7,  8],[  9,  10,  11]])  
print ('我们的数组是：')
print (x)
print ('\n')
# 现在我们会打印出大于 5 的元素  
print  ('大于 5 的元素是：')
print (x[x >  5])

In [None]:
# 实例二：使用~（取补运算符）来过滤 NaN
import numpy as np 

a = np.array([np.nan,  1,2,np.nan,3,4,5])  
print (a[~np.isnan(a)])

#### 3.2.3花式索引

花式索引指的是利用整数数组进行索引。

花式索引根据索引数组的值作为目标数组的某个轴的下标来取值。对于使用一维整型数组作为索引，如果目标是一维数组，那么索引的结果就是对应位置的元素；**如果目标是二维数组，那么就是对应下标的行**。

花式索引跟切片不一样，它总是将数据**复制**到新数组中。

In [31]:
# 实例一：传入顺序索引数组
import numpy as np 

x=np.arange(32).reshape((8,4))
print (x[[4,2,1,7]])  #注意有两个方括号,对应二维数组

[[16 17 18 19]
 [ 8  9 10 11]
 [ 4  5  6  7]
 [28 29 30 31]]


In [None]:
# 实例二：传入倒序索引数组
import numpy as np 

x=np.arange(32).reshape((8,4))
print (x[[-4,-2,-1,-7]])

In [None]:
# 实例三：传入多个索引数组（要使用np.ix_）
import numpy as np 

x=np.arange(32).reshape((8,4))
print (x[np.ix_([1,5,7,2],[0,3,1,2])])   #比之前3.1实例七中的非连续切片方便得多
y=np.array([[x[1,0], x[1,3], x[1,1], x[1,2]],\
            [x[5,0], x[5,3], x[5,1],x[5,2]],\
            [x[7,0] ,x[7,3], x[7,1], x[7,2]],\
            [x[2,0], x[2,3], x[2,1], x[2,2]]])
print(y)

### 3.3 
### 副本和视图

**副本是一个数据的完整的拷贝，如果我们对副本进行修改，它不会影响到原始数据，物理内存不在同一位置。**

**视图是数据的一个别称或引用，通过该别称或引用亦便可访问、操作原有数据，但原有数据不会产生拷贝。如果我们对视图进行修改，它会影响到原始数据，物理内存在同一位置。**

视图一般发生在：

1. **numpy 的切片操作返回原数据的视图。**
2. 调用 ndarray 的 view() 函数产生一个视图。

副本一般发生在：

1. Python 序列的切片操作，调用deepCopy()函数。
2. **调用 ndarray 的 copy() 函数产生一个副本。**

#### 3.3.1 简单赋值不复制

简单的赋值不会创建数组对象的副本。 相反，它使用原始数组的相同id()来访问它。 id()返回 Python 对象的通用标识符，类似于 C 中的指针。

此外，一个数组的任何变化都反映在另一个数组上。 例如，一个数组的形状改变也会改变另一个数组的形状。

In [None]:
# 实例一：赋值无复制
import numpy as np 

a = np.arange(6)  
print ('我们的数组是：')
print (a)
print ('调用 id() 函数：')
print (id(a))
print ('a 赋值给 b：')
b = a 
print (b)
print ('b 拥有相同 id()：')
print (id(b))
print ('修改 b 的形状：')
b.shape =  3,2  
print (b)
print ('a 的形状也修改了：')
print (a)
print ('修改 b 的数据：')
b[0,0] =  1000 
print (b)
print ('a的数据也修改了：')
print (a)

#### 3.3.2 视图或浅拷贝
ndarray.view() 方会创建一个新的数组对象，该方法创建的新数组的维数更改**不会更改原始数据的维数。但是对其数据的更改会是原始数据也发生相应更改。**

In [None]:
# 实例一：视图或浅拷贝
import numpy as np 

# 最开始 a 是个 3X2 的数组
a = np.arange(6).reshape(3,2)  
print ('数组 a：')
print (a)
print ('创建 a 的视图：')
b = a.view()  
print (b)
print ('两个数组的 id() 不同：')
print ('a 的 id()：')
print (id(a))
print ('b 的 id()：' )
print (id(b))
# 修改 b 的形状，并不会修改 a
b.shape =  2,3
print ('b 的形状：')
print (b)
print ('a 的形状：')
print (a)
# 修改 b 的数据，会修改 a
b[0,0] =  1000 
print ('b修改后的数据：')
print (b)
print ('a的数据也修改了：')
print (a)

#### 3.3.3 副本或深拷贝
ndarray.copy() 函数创建一个副本。 对副本数据进行修改，**不会影响到原始数据，它们物理内存不在同一位置。**

In [None]:
# 实例一：副本或深拷贝
import numpy as np 

a = np.array([[10,10],  [2,3],  [4,5]])  
print ('数组 a：')
print (id(a))

print ('创建 a 的深层副本：')
b = a.copy()  
print ('数组 b：')
print (id(b))

# b 与 a 不共享任何内容  

print ('我们能够写入 b 来写入 a 吗？')
print (b is a)

print ('修改 b 的内容：')
b[0,0]  =  100  
print ('修改后的数组 b：')
print (b)

print ('a 保持不变：')
print (a)

*********
## 4.Numpy 数组操作

Numpy 中包含了一些函数用于处理数组，大概可分为以下几类：

1. 修改数组形状

2. 翻转数组

3. 修改数组维度

4. 连接数组

5. 分割数组

6. 数组元素的添加与删除

### 4.1 
### 修改数组形状

![title](png/8.png) 

In [None]:
# 实例一：对数组中每个元素都进行处理，可以使用flat属性，该属性是一个数组元素迭代器。
import numpy as np 

a = np.arange(9).reshape(3,3) 
print ('原始数组：')
for x in a:
    print (x)
    
print ('迭代后的数组：')
for element in a.flat:
    print (element)

### 4.2 
### 翻转数组

![title](png/9.png) 

In [None]:
# 实例一：numpy.transpose 函数用于对换数组的维度。
import numpy as np
 
a = np.arange(12).reshape(3,4)
 
print ('原数组：')
print (a )
print ('\n')
 
print ('对换数组：')
print (np.transpose(a))

print ('转置数组：')
print (a.T)  #注意 T 大写

### 4.3 
### 修改数组维度


![title](png/10.png) 

In [None]:
# 实例一：numpy.broadcast_to 函数将数组广播到新形状。它在原始数组上返回只读视图.如果新形状不符合 NumPy 的广播规则，可能会抛出ValueError。
import numpy as np
 
a = np.arange(4).reshape(1,4)
 
print ('原数组：')
print (a)
print ('\n')
 
print ('调用 broadcast_to 函数之后：')
print (np.broadcast_to(a,(4,4)))

### 4.4 
### 连接数组

![title](png/11.png) 

In [None]:
# 实例一：numpy.concatenate((a1, a2, ...), axis)用于沿指定轴连接相同形状的两个或多个数组
import numpy as np
 
a = np.array([[1,2],[3,4]])
 
print ('第一个数组：')
print (a)
print ('\n')
b = np.array([[5,6],[7,8]])
 
print ('第二个数组：')
print (b)
print ('\n')
# 两个数组的维度相同
 
print ('沿轴 0 连接两个数组：')
print (np.concatenate((a,b)))
print ('\n')
 
print ('沿轴 1 连接两个数组：')
print (np.concatenate((a,b),axis = 1))

### 4.5 
### 分割数组


![title](png/12.png) 

In [None]:
# 实例一：numpy.split(ary, indices_or_sections, axis)沿特定的轴将数组分割为子数组
import numpy as np
 
a = np.arange(9)
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('将数组分为三个大小相等的子数组：')
b = np.split(a,3)
print (b)
print ('\n')
 
print ('将数组在一维数组中表明的位置分割：')
b = np.split(a,[4,7])
print (b)

### 4.6
### 数组元素的添加与删除

![title](png/13.png)

*********
> **4.6.1 numpy.resize(arr, shape)**
> + numpy.resize 函数返回指定大小的新数组。
> + 如果新数组大小大于原始大小，则包含原始数组中的元素的副本。

In [None]:
# 实例一：numpy.resize的应用
import numpy as np
 
a = np.array([[1,2,3],[4,5,6]])
 
print ('第一个数组：')
print (a)
print (id(a))
print ('\n')
 
print ('第一个数组的形状：')
print (a.shape)
print ('\n')
b = np.resize(a, (3,2))
 
print ('第二个数组：')
print (b)
print (id(b))
print ('\n')
 
print ('第二个数组的形状：')
print (b.shape)
print ('\n')

 
print ('修改第二个数组的大小：')
b = np.resize(a,(3,3))
print (b)   # 要注意 a 的第一行在 b 中重复出现，因为尺寸变大了

*********
> **4.6.2 numpy.append(arr, values, axis=None)**
> + numpy.append 函数在数组的末尾添加值。 追加操作会分配整个数组，并把原来的数组复制到新数组中。 此外，输入数组的维度必须匹配否则将生成ValueError。
> + **axis：默认为 None。当axis无定义时，是横向加成，返回总是为一维数组！当axis有定义的时候，分别为0和1的时候。当axis为0时（列数要相同）。当axis为1时，数组是加在右边（行数要相同）**

In [None]:
# 实例一：numpy.append的应用。
import numpy as np
 
a = np.array([[1,2,3],[4,5,6]])
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('向数组添加元素：')
print (np.append(a, [7,8,9]))
print ('\n')
 
print ('沿轴 0 添加元素：')
print (np.append(a, [[7,8,9]],axis = 0))
print ('\n')
 
print ('沿轴 1 添加元素：')
print (np.append(a, [[5,5,5],[7,8,9]],axis = 1))

*********
> **4.6.3 numpy.insert(arr, obj, values, axis)**
> + numpy.insert 函数在给定索引之前，沿给定轴在输入数组中插入值。
> + 如果值的类型转换为要插入，则它与输入数组不同。 插入没有原地的，函数会返回一个新数组。 **此外，如果未提供轴，则输入数组会被展开。**

In [32]:
# 实例一：numpy.insert的应用。
import numpy as np
 
a = np.array([[1,2],[3,4],[5,6]])
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('未传递 Axis 参数。 在插入之前输入数组会被展开。')
print (np.insert(a,3,[11,12]))  # ‘3’指的是沿一维展开后的下标值
print ('\n')
print ('传递了 Axis 参数。 会广播值数组来配输入数组。')
 
print ('沿轴 0 广播：')
print (np.insert(a,1,[11],axis = 0))
print ('\n')
 
print ('沿轴 1 广播：')
print (np.insert(a,1,11,axis = 1))

第一个数组：
[[1 2]
 [3 4]
 [5 6]]


未传递 Axis 参数。 在插入之前输入数组会被展开。
[ 1  2  3 11 12  4  5  6]


传递了 Axis 参数。 会广播值数组来配输入数组。
沿轴 0 广播：
[[ 1  2]
 [11 11]
 [ 3  4]
 [ 5  6]]


沿轴 1 广播：
[[ 1 11  2]
 [ 3 11  4]
 [ 5 11  6]]


*********
> **4.6.4 Numpy.delete(arr, obj, axis)**
> + numpy.delete 函数返回从输入数组中删除指定子数组的新数组。 与 insert() 函数的情况一样，**如果未提供轴参数，则输入数组将展开。**

In [None]:
# 实例一：Numpy.delete的应用。
import numpy as np
 
a = np.arange(12).reshape(3,4)
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('未传递 Axis 参数。 在插入之前输入数组会被展开。')
print (np.delete(a,5))
print ('\n')
 
print ('删除第二列：')
print (np.delete(a,1,axis = 1))
print ('\n')
 

*********
> **4.6.5 Numpy.unique(arr, return_index, return_inverse, return_counts)**
> + arr：输入数组，如果不是一维数组则会展开
> + return_index：如果为true，返回新列表元素在旧列表中的位置（下标），并以列表形式储
> + return_inverse：如果为true，返回旧列表元素在新列表中的位置（下标），并以列表形式储
> + return_counts：如果为true，返回去重数组中的元素在原数组中的出现次数

In [None]:
# 实例一：Numpy.unique的应用。
import numpy as np
 
a = np.array([5,2,6,2,7,5,6,8,2,9])
 
print ('第一个数组：')
print (a)
print ('\n')
 
print ('第一个数组的去重值：')
u = np.unique(a)
print (u)
print ('\n')
 
print ('去重数组的索引数组：')
u,indices = np.unique(a, return_index = True)
print (indices)
print ('\n')
 
print ('我们可以看到每个和原数组下标对应的数值：')
print (a)
print ('\n')
 
print ('去重数组的下标：')
u,indices = np.unique(a,return_inverse = True)
print (u)
print ('\n')
 
print ('下标为：')
print (indices)
print ('\n')
 
print ('使用下标重构原数组：')
print (u[indices])
print ('\n')
 
print ('返回去重元素的重复数量：')
u,indices = np.unique(a,return_counts = True)
print (u)
print (indices)

*********
## 5.NumPy 内置函数

### 5.1 
### NumPy 字符串函数

以下函数用于对 dtype 为 numpy.string_ 或 numpy.unicode_ 的数组执行向量化字符串操作。 它们基于 Python 内置库中的标准字符串函数。

这些函数在字符数组类（**numpy.char**）中定义。

![title](png/14.png)

In [None]:
# 实例一：np.char.add的应用。
import numpy as np 
 
print ('连接两个字符串：')
print (np.char.add(['hello'],[' xyz']))
print ('\n')
 
print ('连接示例：')
print (np.char.add(['hello', 'hi'],[' abc', ' xyz']))

### 5.2 
### NumPy 数学函数

NumPy 包含大量的各种数学运算的函数，包括三角函数，算术运算的函数，复数处理函数等。下面举几个常用函数例子。
> + NumPy 提供了标准的三角函数：sin()、cos()、tan()。
> + numpy.around() 函数返回指定数字的四舍五入值。
> + numpy.floor() 返回小于或者等于指定表达式的最大整数，即向下取整。
> + numpy.ceil() 返回大于或者等于指定表达式的最小整数，即向上取整。

In [None]:
# 实例一：np.ceil的应用。
import numpy as np
 
a = np.array([-1.7,  1.5,  -0.2,  0.6,  10])  
print  ('提供的数组：')
print (a)
print ('\n')
print ('修改后的数组：')
print (np.ceil(a))

### 5.3 
### NumPy 算数函数

需要注意的是数组必须具有相同的形状或符合数组广播规则。下面举几个常用函数例子
> + numpy 算术函数包含简单的加减乘除: add()，subtract()，multiply() 和 divide()。
> + numpy.reciprocal() 函数返回参数逐元素的倒数。如 1/4 倒数为 4/1。
> + numpy.power() 函数将第一个输入数组中的元素作为底数，计算它与第二个输入数组中相应元素的幂。
> + numpy.mod() 计算输入数组中相应元素的相除后的余数。 函数 numpy.remainder() 也产生相同的结果。

In [None]:
# 实例一：numpy中加减乘除的应用。
import numpy as np 
 
a = np.arange(9, dtype = np.float_).reshape(3,3)  
print ('第一个数组：')
print (a)
print ('\n')
print ('第二个数组：')
b = np.array([10,10,10])  
print (b)
print ('\n')
print ('两个数组相加：')
print (np.add(a,b))
print ('\n')
print ('两个数组相减：')
print (np.subtract(a,b))
print ('\n')
print ('两个数组相乘：')
print (np.multiply(a,b))
print ('\n')
print ('两个数组相除：')
print (np.divide(a,b))

### 5.4 
### NumPy 统计函数

NumPy 提供了很多统计函数，用于从数组中查找最小元素，最大元素，百分位标准差和方差等。 
> + numpy.amin() 用于计算数组中的元素沿指定轴的最小值。
> + numpy.amax() 用于计算数组中的元素沿指定轴的最大值。
> + numpy.ptp()函数计算数组中元素最大值与最小值的差（最大值 - 最小值）。
> + numpy.percentile()函数计算百分位数,这是统计中使用的度量，表示小于这个值的观察值的百分比。
> + numpy.median() 函数用于计算数组 a 中元素的中位数（中值）.
> + numpy.mean() 函数返回数组中元素的算术平均值。 如果提供了轴，则沿其计算。算术平均值是沿轴的元素的总和除以元素的数量。
> + numpy.average() 函数根据在另一个数组中给出的各自的权重计算数组中元素的加权平均值。该函数可以接受一个轴参数。 如果没有指定轴，则数组会被展开。
> + 标准差公式：std = sqrt(mean((x - x.mean())**2)) or = np.std()
> +方差公式：np.var()

In [None]:
# 实例一：numpy中加权平均值的应用。
import numpy as np 
 
a = np.array([1,2,3,4])  
print ('我们的数组是：')
print (a)
print ('\n')
print ('调用 average() 函数：')
print (np.average(a))   # 不指定权重时相当于 mean 函数
print ('\n')

wts = np.array([4,3,2,1])  
print ('再次调用 average() 函数：')
print (np.average(a,weights = wts))
print ('\n')

print ('权重的和：')
print (np.average([1,2,3,  4],weights =  [4,3,2,1], returned =  True))   # 如果 returned 参数设为 true，则返回权重的和  

### 5.5 
### NumPy 排序、条件刷选函数

NumPy 提供了很多统计函数，用于从数组中查找最小元素，最大元素，百分位标准差和方差等。 

NumPy 提供了多种排序的方法。 这些排序函数实现不同的排序算法，每个排序算法的特征在于执行速度，最坏情况性能，所需的工作空间和算法的稳定性。 下表显示了三种排序算法的比较：

![](png/15.png)

**numpy.sort()**
   
   numpy.sort() 函数返回输入数组的排序副本。函数格式如下：

> numpy.sort(a, axis, kind, order)

> 参数说明：
> + a: 要排序的数组
> + axis: 沿着它排序数组的轴，如果没有数组会被展开，沿着最后的轴排序， axis=0 按列排序，axis=1 按行排序
> + kind: 默认为'quicksort'（快速排序）
> + order: 如果数组包含字段，则是要排序的字段

In [None]:
# 实例一：numpy中sort函数的应用。
import numpy as np  
 
a = np.array([[3,7],[9,1]])  
print ('我们的数组是：')
print (a)
print ('\n')
print ('调用 sort() 函数：')
print (np.sort(a))
print ('\n')
print ('按列排序：')
print (np.sort(a, axis =  0))
print ('\n')

# 在 sort 函数中排序字段 
dt = np.dtype([('name',  'S10'),('age',  int)]) 
a = np.array([("raju",21),("anil",25),("ravi",  17),  ("amar",27)], dtype = dt)  
print ('我们的数组是：')
print (a)
print ('\n')
print ('按 name 排序：')
print (np.sort(a, order =  'name'))

#### 这里给出其他几种排序方法函数：
> 1. numpy.argmax() 和 numpy.argmin()函数分别沿给定轴返回最大和最小元素的索引。
> 2. numpy.nonzero() 函数返回输入数组中非零元素的索引。
> 3. numpy.where() 函数返回输入数组中满足给定条件的元素的索引。
> 4. numpy.extract() 函数根据某个条件从数组中抽取元素，返回满条件的元素。

In [None]:
# 实例一：numpy.where()的应用
import numpy as np 
 
x = np.arange(9.).reshape(3,  3)  
print ('我们的数组是：')
print (x)
print ( '大于 3 的元素的索引：')
y = np.where(x >  3)  
print (y)
print ('使用这些索引来获取满足条件的元素：')
print (x[y])



In [None]:
# 实例二：numpy.extract(()的应用
import numpy as np 
 
x = np.arange(9.).reshape(3,  3)  
print ('我们的数组是：')
print (x)
# 定义条件, 选择偶数元素
condition = np.mod(x,2)  ==  0  
print ('按元素的条件值：')
print (condition)
print ('使用条件提取元素：')
print (np.extract(condition, x))

***************
## 6. NumPy 读写和应用

### 6.1 
### NumPy的保存和读取

Numpy 可以读写磁盘上的文本数据或二进制数据。NumPy 为 ndarray 对象引入了一个简单的文件格式：npy。npy 文件用于存储重建 ndarray 所需的数据、图形、dtype 和其他信息。

常用的 IO 函数有：
- load() 和 save() 函数是读写文件数组数据的两个主要函数，默认情况下，数组是以未压缩的原始二进制格式保存在扩展名为 .npy 的文件中。
- savez() 函数用于将多个数组写入文件，默认情况下，数组是以未压缩的原始二进制格式保存在扩展名为 .npz 的文件中。
- loadtxt() 和 savetxt() 函数处理正常的文本文件(.txt 等)


> **6.1.1 numpy.save(file, arr, allow_pickle=True, fix_imports=True)**
> + file：要保存的文件，扩展名为 .npy，如果文件路径末尾没有扩展名 .npy，该扩展名会被自动加上。
> + arr: 要保存的数组
> + allow_pickle: 可选，布尔值，允许使用 Python pickles 保存对象数组，Python 中的 pickle 用于在保存到磁盘文件或从磁盘文件读取之前，对对象进行序列化和反序列化。
> + fix_imports: 可选，为了方便 Pyhton2 中读取 Python3 保存的数据。

In [None]:
# 实例一：numpy.save() 函数的应用。
import numpy as np 
 
a = np.array([1,2,3,4,5]) 
 
# 保存到 outfile.npy 文件上
np.save('outfile.npy',a) 
 
# 保存到 outfile2.npy 文件上，如果文件路径末尾没有扩展名 .npy，该扩展名会被自动加上
np.save('outfile2',a)

In [None]:
# 实例二：读取数组文件。
import numpy as np 
 
b = np.load('outfile.npy')  
print (b)

> **6.1.2 numpy.savez(file, *args, **kwds)**
> + file：要保存的文件，扩展名为 .npy，如果文件路径末尾没有扩展名 .npy，该扩展名会被自动加上。
> + args: 要保存的数组，可以使用关键字参数为数组起一个名字，非关键字参数传递的数组会自动起名为 arr_0, arr_1, …　。
> + kwds: 要保存的数组使用关键字名称。

In [None]:
# 实例一：numpy.savez() 函数的应用。
import numpy as np 
 
a = np.array([[1,2,3],[4,5,6]])
b = np.arange(0, 1.0, 0.1)
c = np.sin(b)
# c 使用了关键字参数 sin_array
np.savez("runoob.npz", a, b, sin_array = c)
r = np.load("runoob.npz")  
print(r.files) # 查看各个数组名称
print(r["arr_0"]) # 数组 a
print(r["arr_1"]) # 数组 b
print(r["sin_array"]) # 数组 c

### 6.2 
### 矩阵库

NumPy 中包含了一个矩阵库 numpy.matlib，该模块中的函数返回的是一个矩阵，而不是 ndarray 对象。
> + numpy.matlib.empty(shape, dtype, order) 函数返回一个新的无初始值的矩阵，不一定是零矩阵。
> + numpy.matlib.zeros() 函数创建一个以 0 填充的矩阵。
> + numpy.matlib.ones()函数创建一个以 1 填充的矩阵。
> + numpy.matlib.eye() 函数返回一个矩阵，对角线元素为 1，其他位置为零。
> + numpy.matlib.identity() 函数返回给定大小的单位矩阵。
> + numpy.matlib.rand() 函数创建一个给定大小的矩阵，数据是随机填充的。
> + 矩阵总是二维的，而 ndarray 是一个 n 维数组。 两个对象都是可互换的：np.asarray(i)、np.asmatrix (j)  

In [None]:
# 实例一：矩阵和数组的互换。
import numpy.matlib 
import numpy as np  

#创建一个矩阵
i = np.matrix('1,2;3,4')  
print (i) 

#将矩阵变换为数组
j = np.asarray(i)  
print (j)

#将数组变换为矩阵
k = np.asmatrix (j)  
print (k)



### 6.3 
### 线性代数

NumPy 提供了线性代数函数库 linalg，该库包含了线性代数所需的所有功能，可以看看下面的说明：
![](png/16.png)

> + numpy.dot() 对于两个一维的数组，计算的是这两个数组对应下标元素的乘积和(数学上称之为内积)；对于二维数组，计算的是两个数组的矩阵乘积；对于多维数组，它的通用计算公式如下，即结果数组中的每个元素都是：数组a的最后一维上的所有元素与数组b的倒数第二位上的所有元素的乘积和： dot(a, b)[i,j,k,m] = sum(a[i,j,:] * b[k,:,m])。

> + numpy.vdot() 函数是两个向量的点积。 如果第一个参数是复数，那么它的共轭复数会用于计算。 如果参数是多维数组，它会被展开。
 
> + numpy.inner() 函数返回一维数组的向量内积。对于更高的维度，它返回最后一个轴上的和的乘积。

> + numpy.matmul 函数返回两个数组的矩阵乘积。 虽然它返回二维数组的正常乘积，但如果任一参数的维数大于2，则将其视为存在于最后两个索引的矩阵的栈，并进行相应广播。另一方面，如果任一参数是一维数组，则通过在其维度上附加 1 来将其提升为矩阵，并在乘法之后被去除。对于二维数组，它就是矩阵乘法。
 
> + numpy.linalg.det() 函数计算输入矩阵的行列式。行列式在线性代数中是非常有用的值。 它从方阵的对角元素计算。 对于 2×2 矩阵，它是左上和右下元素的乘积与其他两个的乘积的差。换句话说，对于矩阵[[a，b]，[c，d]]，行列式计算为 ad-bc。 较大的方阵被认为是 2×2 矩阵的组合。
 
> + numpy.linalg.solve() 函数给出了矩阵形式的线性方程的解。
 
> + numpy.linalg.inv() 函数计算矩阵的乘法逆矩阵。 

In [None]:
# 实例一：创建一个矩阵A的逆矩阵。
import numpy as np 
 
a = np.array([[1,1,1],[0,2,5],[2,5,-1]]) 
 
print ('数组 a：')
print (a)
ainv = np.linalg.inv(a) 
 
print ('a 的逆：')
print (ainv)
 
print ('矩阵 b：')
b = np.array([[6],[-4],[27]]) 
print (b)
 
print ('计算：A^(-1)B：')
x = np.linalg.solve(a,b) 
print (x)
# 这就是线性方向 x = 5, y = 3, z = -2 的解

# 结果也可以使用以下函数获取：
x1 = np.dot(ainv,b)
print(x1)

### 6.4 
### NumPy & Matplotlib
Matplotlib 是 Python 的绘图库。 它可与 NumPy 一起使用，提供了一种有效的 MatLab 开源替代方案。 它也可以和图形工具包一起使用，如 PyQt 和 wxPython。

In [None]:
# 实例一：使用 matplotlib 生成正弦波图。
import numpy as np 
import matplotlib.pyplot as plt 

# 计算正弦曲线上点的 x 和 y 坐标
x = np.arange(0,  3  * np.pi,  0.1) 
y = np.sin(x)
plt.title("sine wave form")  
# 使用 matplotlib 来绘制点
plt.plot(x, y) 
plt.show()