# 第13章 numpy编程基础
* 利用Python进行数据分析，主要用到numpy、panda、scipy、matplotlib、statsmodels、sklearn等包或分析工具库。

## 13.1 关于numpy
* **numpy**(Numerical Python)工具库：提供便于进行数据分析的数据结构，如向量、数组、矩阵等。
* Numpy本身并没有提供很多高级的数据分析功能，但是Numpy却成为了数据科学实践中最常用的模块。
    * 其原因是它是众多数据科学模块所需要的基础模块。

### 13.1.1 numpy的安装
* 一般安装Python时会自动安装numpy工具库。
* 安装numpy最简单的方法就是使用pip安装包的命令：

In [None]:
#pip3 install --user numpy

### 13.1.2 导入numpy
* numpy在使用前需要用import语句导入：

In [None]:
from numpy import *

* 为了更简洁的调用numpy中的模块或函数，通常会在导入的同时对numpy重命名为np：

In [None]:
import numpy as np  #重命名模块名

### 13.1.3 numpy的矢量化运算
* numpy可以不用循环直接对数据执行**矢量化运算**(vectorization)。

#### 例：使用Python基本库中的列表存储数据，并进行每个数据都乘以2的运算过程如下：

In [None]:
list_data=[1,2,3,4,5]
for i in range(len(list_data)):
    list_data[i]*=2
list_data

* numpy中提供的数据类型可以实现元素级别的操作。

In [None]:
numpy_data=np.array([1,2,3,4,5])
2*numpy_data

* 这种特性在数据分析过程中会极大地提升运算效率。

#### 例：分别利用Python基本库和numpy工具库定义功能相同的函数，对比其运行时间。

In [None]:
def Python_multi(n):
    a=b=list(range(n))
    c=[]
    for i in range(len(a)):
        a[i]=i**2
        b[i]=i**3
        c.append(a[i]*b[i])
    return c

def numpy_multi(n):
    c=np.arange(n)**2*np.arange(n)**3
    return c

In [None]:
%timeit Python_multi(10000)
%timeit numpy_multi(10000)

### 13.1.4 数组对象ndarray
* Numpy提供了两种基本对象：ndarray和ufunc。
    * ndarray为数组，其特点是只能存储单一数据类型；
    * ufunc是对数组进行处理的函数。
* 数组对象ndarray是numpy最为核心的数据结构。
* **数组的元素一般是同质的**，但可以有异质数组元素存在（即：结构数组）。

### 数组的创建：
* numpy中常用的创建数组的函数：

|函数|功能|
|--|--|
|**array**|将输入数据（列表、元组、数组或其他序列）转换成ndarray|
|asarray|将输入转换为ndarray|
|arange|类似Python内置的range，但返回一个ndarray是不可迭代对象|
|linspace|创建等差数列一维数组|
|logspace|创建等比数列一维数组|
|ones|根据指定形状和dtype创建一个数据全为1的数组|
|zeros|根据指定形状和dtype创建一个数据全为0的数组|
|eye或identity|创建单位阵|
|fromfunction|通过指定函数创建数组|

* 对于上述函数都可以用help()或?来查询帮助文件。

In [None]:
?np.array

In [None]:
a1=np.array([1,2,10,4])  #利用列表构建一维数组，可以理解为列向量
a1

In [None]:
a2=np.array([[1,2,3,4],[4,15,6,17]])  #利用列表构建二维数组，可以理解为矩阵
a2

In [None]:
a3=np.array([(1,2,3,4),(4,15,6,17)])  #利用元组构建二维数组，可以理解为矩阵
a3

* 创建好的数组，作为一个数据类型是有自己的属性变量的。
    * ndim：表示数组的维度
    * shape：表示数组的维度，即行列数
    * size：表示数组中元素的总个数
    * dtype：表示数组中元素的数据类型

In [None]:
print(a1.ndim)
print(a1.shape)
print(a1.size)
print(a1.dtype)

In [None]:
print(a2.ndim)
print(a2.shape)
print(a2.size)
print(a2.dtype)

In [None]:
def add(i,j): return(i+j)
np.fromfunction(add,(5,5))  #第二个参数(5,5)表示数组的维度shape，同时其也作为实参传入add函数中。

* **注意：因为数组的shape属性值是二维的，因此np.fromfunction(func,shape=(a,b))中func函数的参数个数必须是两个**。

## 13.2 向量
* **向量：即一维数组**。

|常用创建向量的函数|功能|格式|
|--|--|--|
|array|将输入数据（列表、元组、数组或其他序列）转换成ndarray|np.array(object)|
|arange|类似Python内置的range，但返回一个ndarray是不可迭代对象|np.arange([start],end[,step)]|
|linspace|创建等差数列一维数组|np.linspace(start,end,num=50)|
|logspace|创建等比数列一维数组|np.logspace(start,end,num=50)|
|ones|根据指定形状和dtype创建一个数据全为1的数组|np.ones(shape,dtype)|
|zeros|根据指定形状和dtype创建一个数据全为0的数组|np.zeros(shape,dtype)|
|empty|创建一个内容随机并且依赖于内存状态的向量||
|random|创建随机数向量，如random.randn创建正态分布随机数||
|fromstring|根据字符的ASCII编码将字符串转换为向量|np.fromstring(string,dtype=float)|

* 用**arange函数**创建向量是最简单最常用的方式之一。
* arange函数的用法类似于range函数，可以通过指定**初始值、终止值**和**步长**来创建一维数组。

In [None]:
v=np.arange(0,10,2)
v

In [None]:
s="123 ABC abc"
np.fromstring(s, dtype=np.int8)

In [None]:
np.fromstring(s, dtype=np.int8, sep=' ')  #空格作为元素分隔符

In [None]:
np.fromstring("1 2 3", dtype=np.int8, sep=' ')

* **向量的矢量化运算**：向量可以直接对每一个元素进行运算。

In [None]:
v=np.arange(0,10,2)
v*10

## 13.3 数组
* **数组**(ndarray)由实际数据和描述这些数据的元数据组成。如：

In [None]:
a=np.array([np.arange(3),np.arange(3)])
print(a)
print(a.shape)
print(a.ndim)

* 数组可以由列表、元组等序列构造；
* 数组也可以通过**tolist方法**转换为列表。

In [None]:
print(a.tolist())
type(a.tolist())

### 13.3.1 数据类型和结构数组

### （1）数组的数据类型
* Numpy中提供了逻辑、整数、浮点数等多种数据类型，并且每种数据类型的名称均对应其转换函数。
* 可以使用“**np.数据类型()**”的方式**直接转换**对应类型的数据对象：

In [None]:
np.float(50) # 返回值50.0

In [None]:
np.int(50.35)# 返回值50

#### 表13-1：numpy数据类型及其符号

|数据类型|描述|符号表示|
|--|--|--|
|bool\_|布尔|?|
|int8|8位整数，即-128~127的整数|i|
|uint8|0~255无符号整数|u|
|float16|5位指数10位尾数的半精度浮点数|f|
|str\_|字符型|U|

### （2）结构数组
* **数组的数据类型也可以有用户自己定义。**
* 自定义数据类型是一种**异质结构**数据类型，通常用来记录一行数据或一系列数据，即**结构数组**。
* **结构数据的定义方式：先定义dtype类型，再定义结构数组**。
* 而**dtype类型的声明方式**主要有两种：
    * 直接声明：np.dtype([(列标题1,数据类型1),(列标题2,数据类型2),…])
    * 借用字典：np.dtype({"names":[列标题1,列标题2,…], "formats":[数据类型1,数据类型2,…]})

#### 例：要创建一个火锅团购的信息清单，它包含的字段有团购名称、团购人数与团购价。
* 第一步：使用dtype函数字来定义这些字段的类型。

In [None]:
hot=np.dtype([('name',np.str_,10),('number',np.int64),('price',np.float64)])
hot

In [None]:
hot=np.dtype({"names":['name','number','price'], "formats":[(np.str_,10),np.int64,np.float64]})
hot

* 第2步：定义好数据类型之后，就可以构造结构数据了。
* 这是类似我们平时数据分析的数据形式。

In [None]:
hotbuy=np.array([('双人餐','35','98'),('100元代金券','43','79'),('酸汤鱼火锅','1','165')])
hotbuy

In [None]:
hotbuy=np.array([('双人餐','35','98'),('100元代金券','43','79'),('酸汤鱼火锅','1','165')],dtype=hot)
hotbuy

### 13.3.2 索引与切片
* 数组的索引主要包括以下几种：
    1. 基本索引
    * 逻辑索引
    * 花式索引

#### 13.3.2.1 基本索引与切片
* 数组的索引与切片与Python基础库中序列的索引与切片方式完全一样：
    * 数值“0,1,2,…”或“-1,-2,…”表示索引；
    * 用**中括号**“[]”选定下标来实现；
    * 同时采用**冒号**“:”分隔起止位置和步长。

In [None]:
a=np.arange(1,10,1)
print(a)
print(a[3])
print(a[1:4])
print(a[:2])
print(a[-2])
print(a[::-1])

* 对于**多维数组**还有其他符号用于索引和切片：
    * 用**逗号**“,”表示不同维度；
    * 用“...”表示遍历剩下的维度。

In [None]:
b=np.arange(24).reshape(2,3,4)  #使用数组的reshape方法需要注意，元素总数一定要满足切分条件
print(b)
print(b.shape)

In [None]:
b[1,2,3]  #选择第2层第3行第4列的元素

In [None]:
b[0,2,1:2]

In [None]:
b[0,2,:]

In [None]:
b[0,2]

In [None]:
b[0,:,:]

In [None]:
b[0,...]  #多个冒号可以用...代替

In [None]:
b[...]

In [None]:
b[0,::2,-2]  #用步长实现间隔选取元素

* **结构数组可以直接使用字段名进行索引和切片**。

In [None]:
print(hotbuy)
hotbuy["name"]

In [None]:
hotbuy["name"][2]

In [None]:
hotbuy[2]["name"]

#### 13.3.2.2 逻辑索引
* **逻辑索引**：即**布尔型索引**或**条件索引**，可以通过指定**布尔数组**或**条件**进行索引。

In [None]:
print(b)
b[b>=15]

In [None]:
b[~(b>=15)]

In [None]:
b[(b>=15) & (b<=15)]

* 一般情况下，**逻辑运算符**and、or和not在布尔数组中无效；
    * 因为其不能产生于数组等维度的布尔序列。
* 但当其表达式的值是数值时，是有效的；
    * 此时是作为一般索引而非逻辑索引。

In [None]:
b[0,(1 and 2)]

In [None]:
1 and 2

#### 例：创建一个**布尔型数组**，将其用于对数组b的布尔型索引。

In [None]:
b_bool1=np.array([False,True], dtype=bool)
b[b_bool1]

In [None]:
b_bool2=np.array([False,True,True], dtype=bool)
b[b_bool1,b_bool2]

In [None]:
b_bool3=np.array([False,True,True,False], dtype=bool)
b[b_bool1,b_bool2,b_bool3]

#### 13.3.2.3 花式索引
* **花式索引**：利用整数数组进行索引，其可使用指定顺序对数组提取子集。

In [None]:
print(b)
b[[[0],[1,2],[3]]]  #相当于[0,1,3]和[0,2,3]，共选出1*2*1=2个元素

* **ix_函数**可以将若干一维整数数组转换为一个用于选取矩形区域的索引器；
    * 目的：避免输入很多中括号。

In [None]:
np.ix_([1,0],[2,1],[0,3,2])

In [None]:
b[np.ix_([1,0],[2,1],[0,3,2])]  #共选出2*2*3=12个元素

* 数组切片是原始数组的视图(view)，该视图与原始数组存在**绑定**关系。
    * 即：视图上的任何修改都会直接反映到原始数组中。

In [None]:
b=np.arange(24).reshape(2,3,4)
b_slice=b[0,1,1:3]
b_slice

In [None]:
b_slice[1]=666
b_slice

In [None]:
b

* 需要数组切片是一个副本而不是视图，可以用**copy方法**进行**浅复制**。

In [None]:
b=np.arange(24).reshape(2,3,4)
b_copy=b[0,1,1:3].copy()
b_copy

In [None]:
b_copy[1]=666
b_copy[1]

In [None]:
b

### 13.3.3 数组的属性
* 创建好的数组，作为一个数据类型是有自己的属性变量的。
    * ndim：表示数组的维度
    * shape：表示数组的维度，即行列数
    * size：表示数组中元素的总个数
    * dtype：表示数组中元素的数据类型
    
#### 表13-2：数组的常用属性

### 13.3.4 数组排序
* numpy提供了多种排序函数（**默认为升序**）：
    * sort：返回排序后的数组
    * lexsort：根据键值的字典序进行排序
    * argsort：返回数组排序后的下标
    * msort：沿着第一个轴排序
    * sort_complex：对复数按照先实后虚的顺序进行排序
* 此外，ndarray对象的sort方法也可以对数组进行原地排序。

In [None]:
s=np.random.randint(0,5,size=10)  #产生整数随机数
print(s)
np.sort(s)  #返回排序后的数组

In [None]:
print(np.argsort(s))  #返回数组排序后的下标
print(s[np.argsort(s)])  #升序
print(s[np.argsort(-s)])  #降序

In [None]:
s.sort()  #sort方法排序后会改变数组中元素的位置，即原地排序
print(s)

* 在**多维数组**中，可以指定按照数组的轴(axis)进行排序。

In [None]:
sr=np.random.randint(0,10,size=24).reshape(2,3,4)
print(sr)

In [None]:
?np.sort

In [None]:
sr.sort(axis=-1)  #默认值axis=-1，sorts along the last axis
print(sr)

In [None]:
sr.sort(axis=0)
print(sr)

In [None]:
sr.sort(axis=1)
print(sr)

* 使用lexsort函数可以指定排序的顺序。

In [None]:
a=np.random.randint(0,5,size=6)
b=np.random.randint(5,10,size=6)
print(a)
print(b)

In [None]:
ablexs=np.lexsort((b,a))  #先按a排序，再按b排序，得到排序后的下标
ablexs

In [None]:
[(a[i],b[i]) for i in ablexs]

### 13.3.5 数组维度
* 数组的维度可以进行变换，如行列互换(转置)、降维等。
* numpy中可以使用ndarray数组对象的**reshape方法**改变数组的维数。
* ndarray数组对象的维度用其**ndim方法**实现。

In [None]:
b=np.arange(24).reshape(2,3,4)
print(b)
print(b.ndim)

#### 13.3.5.1 展平
* 展平（拉直）：将多维数组降维成一维数组（类似代数中的拉直运算）。
    * numpy中的**raval函数**：执行后只是返回数组的一个视图；
    * ndarray数组对象的**flatten方法**：执行后会分配内存并保存结果。

In [None]:
b1=np.ravel(b)
print(b1)
b1[0]=-1
print(b1)
print(b)

In [None]:
b2=b.flatten()
b2[0]=-2
print(b2)
print(b)

In [None]:
b.reshape(1,1,24)  #类似一维数组，但本质还是多维数组

#### 13.3.5.2 维度改变
* 数组的维度改变方式主要有：
    * **reshape方法**：返回数组的一个视图；
    * **resize方法**：直接修改所操作的数组；
    * 使用**shape属性赋值**：直接改变数组的维度或尺寸。

In [None]:
b=np.arange(24)
print(b)
b1=b.reshape(2,3,4)
print(b1)

In [None]:
b1[1]=1
print(b1)
print(b)

In [None]:
b=np.arange(24)
print(b)
b.resize(2,3,4)
print(b)

In [None]:
b.shape=(1,1,24)
b

#### 13.3.5.3 转置
* 转置：是数据分析中常用的数据处理方法；
    * 即把数组的维度(尺寸)大小互换。
* 数组转置的实现方式主要有：
    * 使用numpy中的**transpose函数**
    * 数组对象的**T方法**

In [None]:
b=np.arange(24).reshape(2,3,4)
print(b)

In [None]:
print(np.transpose(b).shape)
print(np.transpose(b))

In [None]:
print(b.T.shape)
print(b.T)

### 13.3.6 数组组合
* numpy数组的组合可以分为：


|数组组合|功能|要求|实现函数|
|--|--|--|--|
|水平组合|将所有参加组合的数组进行**拼接**|各数组**行数**应相等|hstack函数|
||||concatenate函数，其参数axis=1|
|垂直组合|将所有参加组合的数组**追加**在一起|各数组**列数**应一致|vstack函数|
||||concatenate函数，其参数axis=0|
|深度组合|将参加组合的各数组相同位置的数据组合在一起|所有数组维度属性要相同|dstack函数|
|列组合|对于一维数组按列方向进行组合||colume_stack函数|
|行组合|对于一维数组按行方向进行组合||row_stack函数|

#### 注意：
* 行组合和列组合一般处理对象为一维数组的组合。
* 对于二维数组，行组合和列组合分别与垂直组合和水平组合效果相同。

### 13.3.7 数组分拆
* numpy数组的拆分可以分为：

|数组分拆|功能|要求|实现函数|
|--|--|--|--|
|水平分拆|把数组沿水平方向进行分拆||hsplit函数|
||||split函数，其参数axis=1|
|垂直分拆|把数组沿垂直方向进行分拆||vsplit函数|
||||split函数，其参数axis=0|
|深度分拆|按照深度方向分拆数组|所分拆数组对象必须具有3个维度(含)以上|dsplit函数|

#### 注意：数组分拆结果返回的是列表，而列表中的元素才是numpy数组。

### 13.3.8 ufunc运算
* ufunc(universal function)：是一种能对数组中每个元素进行操作的函数。
    * 具体操作包括：四则运算、比较运算以及布尔运算等。

#### 13.3.8.1 函数运算、比较运算与布尔运算
* numpy中内置了很多ufunc运算函数，大多都是C语言实现的，其计算速度都非常快。
    * 可以使用“out=”关键字来指定函数返回结果存储在指定数组中，类似于“绑定”。
* 具体内置函数及运算符号的列表参考：https://blog.csdn.net/unixtch/article/details/78531585

In [None]:
dir(np)

In [None]:
x=np.linspace(0,2*np.pi,10)
y=np.sin(x)
print(y)
id(x)==id(y)

In [None]:
x=np.linspace(0,2*np.pi,10)
y=np.sin(x,out=x)  #通过“out=已定义的数组名”设定返回结果存储在指定数组中，类似于“绑定”
print(y)
id(x)==id(y)

#### 13.3.8.2 自定义ufunc函数
* 通过NumPy提供的标准ufunc函数，可以组合出复杂的表达式，在C语言级别对数组的每个元素进行计算。
* 但有时这种表达式不易编写，而对每个元素进行计算的程序却很容易用Python实现；
    * 此时可以用**frompyfunc()**将一个计算单个元素的函数转换成ufunc函数。
    * 这样就可以方便地用所产生的ufunc函数对数组进行计算。
* **frompyfunc()的调用格式为：**

In [None]:
frompyfunc(func, n_in, n_out)  #其中n_in表示函数输入参数的个数，n_out表示函数返回值的个数

#### 例：在考试中由于题目难度偏大，需要对所有人的分数进行提升，并且保持分数的相对位置不变，可以编制如下函数。

In [None]:
def liftscore(n):
    n_new=np.sqrt((n^2) * 100)
    return n_new

使用frompyfunc()函数将其自定义为ufunc函数，并对数组对象进行操作。

In [None]:
score=np.array([87,77,56,100,60])
score_1=np.frompyfunc(liftscore, 1, 1)(score)
print(score_1)

* **注意：frompyfunc转换的ufunc函数所返回数组的元素类型是object**。

因此还需要再调用数组的**astype方法**将其转换为浮点数组。

In [None]:
score_1 = score_1.astype(float)
print(score_1.dtype)

#### 13.3.8.3 广播
* 先看个例子：

In [None]:
a=np.arange(0,60,10).reshape(-1,1)
b=np.arange(0,5)
print(a)
print(b)

现在计算a+b，不过现在有一个问题，a和b的维度不一样，那应该怎么加？

In [None]:
a+b

结果来看，是用a的每一行的元素（这里a为列向量，每一行只有一个元素）与b的每一个元素相加，相当于：

In [None]:
a=array([[ 0,  0,  0,  0,  0],
       [10, 10, 10, 10, 10],
       [20, 20, 20, 20, 20],
       [30, 30, 30, 30, 30],
       [40, 40, 40, 40, 40],
       [50, 50, 50, 50, 50]])

而b是一个行向量，现在我们将这一个行向量重复6次，和a的第0轴长度相同，构成一个二维数组，相当于：

In [None]:
b=array([[0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4],
       [0, 1, 2, 3, 4]])

现在，再进行相加，自然就是对用元素相加了，也就是上面的结果，这就是numpy中的广播，对进行运算的两个narray对象shape不一样时，进行的维度补齐。

* 总的来说，**numpy的广播规则基于下面4个规则**：
    * (1)让所有输入数姐都向其中维数最多的数组看齐，shape属性中不足的部分都通过在前面加1补齐。 
        * 如：上面的输入中，a.shape=(6,1)，b.shape=(,5)，a的维数是2，b的维数是1，所以b向a看齐，并且用1补齐，那么b.shape=(1,5）
    * (2)输出数组的shape属性是输入数组的shape属性的各个轴上的最大值。
        * 如：上面的输出中，a+b的输出的shape应该是(6,5)
    * (3)如果输入数组的某个轴的长度为1或与输出数组的对应轴的长度相同，这个数组能够用来计算，否则出错。
    * (4)当输入数组的某个轴的长度为1吋，沿着此轴运算时都用此轴上的第一组值。

* 由于广播在numpy计算中比较常见，所以numpy提供了两种用来创建广播计算数组的方法：
    * **ogrid方法**：前者返回的是两个向量
    * **mgrid方法**：后者返回的是进行广播运算的数组

In [None]:
x,y=np.ogrid[:5,:5]
print(x)
print(y)

In [None]:
x,y=np.mgrid[:5,:5]
print(x)
print(y)

#### 13.3.8.4 ufunc的方法
* ufunc函数对象本身还有一些**方法函数**，这些方法只对两个输入、一个输出的ufunc函数有效，其他的ufunc对象调用这些方法时会抛出ValueError异常。
* （1）**reduce()**，沿着指定轴对数组进行操作，相当于将相应的操作放到该轴元素之间。

In [None]:
np.add.reduce([1,2,3])

In [None]:
np.add.reduce([[1,2,3],[4,5,6]])

In [None]:
np.add.reduce([[1,2,3],[4,5,6]],axis=1)

In [None]:
np.add.reduce([[1,2,3],[4,5,6]],axis=0)

* （2）**accumulate()**和reduce()类似，区别时是前者会保留中间结果：

In [None]:
np.add.accumulate([1,2,3])

In [None]:
np.add.accumulate([[1,2,3],[4,5,6]],axis=1)

In [None]:
np.add.accumulate([[1,2,3],[4,5,6]],axis=0)

* （3）**reduceat()**计算多对reduce()的结果，通过indices参数指定一系列的起始和终止位置。

In [None]:
a=np.array([1,2,3,4])
result=np.add.reduceat(a, indices=[0,1,0,2,0,3,0])
result

其计算过程如下：
* 1: a[0]=1
* 2: a[1]=2
* 3: a[0]+a[1]=1+2=3
* 3: a[2]=3
* 6: a[0]+a[1]+a[2]=1+2+3=6
* 4: a[3]=4
* 10：a[0]+a[1]+a[2]+a[4]=1+2+3+4=10

* （4）**outer()**可以对其作为两个参数的数组的每两对元素的组合进行运算。

In [None]:
np.add.outer([1,2,3,4],[5,6,7,8])

In [None]:
np.multiply.outer([1,2,3],[4,5,6,7,8])

## 13.4 矩阵
* **矩阵**(matrix)：是numpy提供的另外一种数据类型；
    * 可以使用**mat**或**matrix**函数将数组转换为矩阵。

In [None]:
m1=np.mat([[1,2,3],[4,5,6]])
m1

In [None]:
m1=np.matrix([[1,2,3],[4,5,6]])
m1

* 矩阵也可以进行**矢量化运算**。

In [None]:
m1*8

In [None]:
m1.T  #矩阵转置

In [None]:
m1*m1.T

In [None]:
m2=np.identity(2)  #单位阵
m2

In [None]:
eye(2)  #单位阵

In [None]:
np.linalg.inv(m2)  #矩阵求逆，即根据AX=I求解X=A的逆矩阵

* 注意：一般情况下在Python中都会使用数组来进行运算，因为数组更灵活、速度更快。

In [None]:
dir(matrix)

## 13.5 numpy中的文件读写
* numpy中的文件读写主要有两种形式：
    * （1）二进制的文件读写
    * （2）文件列表形式的数据读写

### 13.5.1 二进制的文件读写
    
|函数|功能|格式|
|--|--|--|
|save|以二进制的格式保存数据|np.save ("./save_arr ", arr1)|
|load|从二进制的文件中读取数据|np.load("./ save_arr.npy")|
|savez|将多个数组保存到一个文件中|np.savez('./savez_arr',arr1,arr2)|

* **注意：存储时可以省略扩展名，但读取时不能省略扩展名**!

In [None]:
arr1=np.arange(40).reshape((5,8))
print(arr1)
np.save('./save_arr',arr1)  #保存二进制文件，npy格式是一个数组的文件保存

In [None]:
arr2=np.load('./save_arr.npy')  # 读取二进制文件
arr2

In [None]:
arr3=np.arange(1,10,1)
print(arr3)
np.savez('./savez_arr',arr1,arr3)  #保存二进制文件，npz多个数组的文件保存

In [None]:
load_data=np.load('./savez_arr.npz')  #读取二进制文件
print(load_data)

In [None]:
print(type(load_data))

In [None]:
# 可遍历文件中的键值(也可以通过开启断点来获取)
for i,k in load_data.items():
    print(i,k)

In [None]:
print(load_data['arr_0'])
print(load_data['arr_1'])

### 13.5.2 文本文件的读写：

|函数|功能|格式|
|--|--|--|
|savetxt|将数组写到某种分隔符隔开的文本文件中||
|loadtxt|把文件加载到一个二维数组中||
|genfromtxt|面向的是结构化数组和缺失数据(基本操作)||

In [None]:
arr=np.arange(0,9,1).reshape(3,-1) # -1的意思是根据行数自动匹配列数
print(arr)
np.savetxt('arr.txt',arr,fmt='%d',delimiter=',')  #保存，其中fmt='%d'表示保存为整数，delimiter=","表示用','隔开

In [None]:
load_txt=np.loadtxt('arr.txt',delimiter=',')  #读取
print(load_txt)

In [None]:
load_txt=np.genfromtxt('./arr.txt',delimiter=',',skip_header=1)  #读取，其中skip_header从哪行开启读取
print(load_txt)

In [None]:
print(load_txt[1:2,0:3])  # 二维数组切片方式

In [None]:
print(load_txt[0:3,0])