# Numpy基础

## 1. Numpy介绍
**Numpy是什么**
NumPy (Numerical Python) 是 Python 语言的一个扩展程序库，支持大量的维度数组与矩阵运算，此外也针对数组运算提供大量的数学函数库。
实践中，NumPy已成为 Python 中默认的矩阵运算库。几乎所有涉及到矩阵相关操作的其他的库（如Pandas,xarray等等），都是基于NumPy实现的。
对于Python，我们常常会有运行速度慢之类的刻板印象。然而对于 Python 中的矩阵运算库NumPy，这一刻板印象是不成立的。如果我们只使用NumPy进行计算，而不使用 Python 中原生的for循环等操作，那么实际上，我们的运算速度往往是不输给，甚至是胜过Fortran的。

这是因为NumPy是基于 C/Fortran 实现的。在此之上，它还会使用 blas，进一步增快运行速度。同时，它还会进行一些细节上的优化。这使得一般情况下，NumPy的矩阵运算速度应当是优于未经优化的 Fortran 代码的。

作为Python数值计算宇宙的重要基础设施，我们有必要对 NumPy 进行深入的掌握，从而发挥 Python 的真正潜力。

### 1.1.  Ndarray 对象
NumPy 最重要的一个特点是其 N 维数组对象 ndarray，它是一系列同类型数据的集合，以 0 下标为开始进行集合中元素的索引。

ndarray 对象是用于存放同类型元素的多维数组。

ndarray 中的每个元素在内存中都有相同存储大小的区域。

ndarray 内部由以下内容组成：

一个指向数据（内存或内存映射文件中的一块数据）的指针。

数据类型或 dtype，描述在数组中的固定大小值的格子。

一个表示数组形状（shape）的元组，表示各维度大小的元组。

一个跨度元组（stride），其中的整数指的是为了前进到当前维度下一个元素需要"跨过"的字节数。

**实例**
我们可以先从一个hello world等级的实例，来入门NumPy:

In [None]:
import numpy as np 
a = np.array([1,2,3])
b = np.array([[1, 2], [3, 4]])  
c = np.array([1,  2,  3], dtype = np.float64)  
print(a)
print(b)
print(c)

在上面的例子里，我们分别进行了以下 3 个操作：

* 创建了一个一维数组
* 创建了一个 2 维数组
* 创建了一个 1 维数组，并指定了其中元素的类型为双精度浮点数

使用NumPy创建一个数组就是这么简单：指定数据的具体值，然后指定数据类型 dtype（可选），就可以了。

### 1.2 NumPy 数据类型
numpy 支持的数据类型比 Python 内置的类型要多很多，基本上可以和 C 语言的数据类型对应上，其中部分类型对应为 Python 内置的类型。

In [None]:
d = np.array([1,2,3],dtype=float) # dtype为python内置类型float
d

In [None]:
e = np.array([1,2,3],dtype=np.float64) # 其与双精度浮点数flaot64是一样的
e

In [None]:
f = np.array([1,2,3],dtype=np.float32) # 可以将dtype设置为各种不同的数据类型
f

### 1.3 NumPy数组属性
ndim 数组维度
shape 数组每个维度大小
size 数组的总大小
dtype 数据类型
itemsize 每个数组元素字节大小
nbytes 数组总字节大小
flags ndarray对象的内存信息
real ndarray元素的实部（复数的实部）
imag ndarray元素的虚部（复数的虚部）

In [None]:
a = np.array([1,2,3],dtype=float)
print("a ndim:",a.ndim)
print("a shape",a.shape)
print("a size",a.size)
print("a dtype",a.dtype)
print("a itemsize:",a.itemsize,"bytes")
print("a nbytes:",a.nbytes,"bytes")
print("a flags:",a.flags)

### 1.4 数据类型转换
我们有时候需要将一种数据类型的数组转化为另一种。这个时候我们就需要用到astype方法进行转化：

In [None]:
a = np.array([1,2,3],dtype=float)
b = a.astype(int)
print (b)
b.dtype

## 2.便捷创建一个Numpy数组
ndarray 数组除了可以使用 ndarray 来创建外，也可以通过以下几种方式来创建。

### 2.1 np.zeros
创建指定大小的数组，数组元素以 0 来填充：

In [None]:
a = np.zeros((2,3), dtype = np.float64)
a

### 2.2 np.ones
创建指定形状的数组，数组元素以 1 来填充：

In [None]:
a = np.ones([2,3], dtype = int)  # 输入的数组形状不仅可以是元组，也可以是一个列表
a

### 2.3 np.eye
创建指定形状的单位矩阵。

In [None]:
np.eye(4)

### 2.4 np.random 创建随机数组
除了创建元素全为 0 和 1 的数组之外，NumPy 也支持创建元素为随机值的数组。

#### 2.4.1 np.random.rand
创建指定维度大小的，样本位于[0, 1)的随机样本。

In [None]:
np.random.rand(2,3)

#### 2.4.2 np.random.randint
创建指定维度大小的，样本为随机整数样本的数组。

In [None]:
np.random.randint(low=1,high=10, size=(5,6))

#### 2.4.3 np.random.randn
创建指定维度大小的，样本为正态分布随机值的数组

In [None]:
np.random.randn(2, 4)

### 2.5 从数值范围创建数组
NumPy 也可以从某个范围中，创建所需的数组。

#### 2.5.1 np.arange
根据 start 与 stop 指定的范围以及 step 设定的步长，生成一个 ndarray。

注意，停止的 stop 值不在生成的数组的范围之内。

In [None]:
x = np.arange(start=10,stop=20,step=2)  
x

#### 2.5.2 np.linspace
np.linspace 函数用于创建一个一维数组，数组是一个等差数列构成的。

In [None]:
# 生成开始值为10，结束值为20，大小为51的等差数组
np.linspace(start=10, stop=20, num=51)

#### 2.5.3 np.logspace
np.logspace 函数用于创建一个对数等比数列

In [None]:
# 生成开始值为2**1，结束值为2**8，大小为8的等差数组
np.logspace(start=1, stop=8 ,num=8 ,base=2)

## 3. NumPy 统计函数
NumPy 数组中提供了一些简单的统计函数，可以帮助我们计算数组的最大、最小值、平均值、中位数等。

### 3.1最大、最小值
可以使用.max()/.min()或np.amax()/np.amin()，计算数组的最大最小值

In [None]:
a = np.random.randint(low=0,high=99, size=(7,9))
print (a,"\n",a.max(),"\n",a.min())

### 3.2平均值
可以使用np.mean()/np.average()或.mean()方法获取数组中所有元素的均值

In [None]:
a.mean()

### 3.3中位数
使用np.median()计算数组的中位数

In [None]:
np.median(a)

### 3.4标准差
使用np.std计算标准差

In [None]:
np.std(a)

## 4.Nump数据-索引&切片&排序
ndarray对象的内容可以通过索引或切片来访问和修改
通过sort函数进行排序

### 4.1索引
ndarray 数组可以基于 0 - n 的下标进行索引

In [None]:
import numpy as np
a = np.arange(10)
print(a)

In [None]:
print(a[3])

### 4.2 切片
切片对象通过内置的 slice 函数，并设置 start, stop 及 step 参数进行，从原数组中切割出一个新数组。

In [None]:
import numpy as np
a = np.arange(10)
s = slice(2,7,2)   # 从索引 2 开始到索引 7 停止，间隔为2
print (a[s])

以上实例中，我们首先通过 arange() 函数创建 ndarray 对象。 然后，分别设置起始，终止和步长的参数为 2，7 和 2。

我们也可以通过冒号分隔切片参数 start:stop:step 来进行切片操作：

In [None]:
b = a[2:7:2]   # 从索引 2 开始到索引 7 停止，间隔为 2
print(b)

冒号 : 的解释：如果只放置一个参数，如 [2]，将返回与该索引相对应的单个元素。如果为 [2:]，表示从该索引开始以后的所有项都将被提取。如果使用了两个参数，如 [2:7]，那么则提取两个索引(不包括停止索引)之间的项。

In [None]:
a = np.arange(10)  # [0 1 2 3 4 5 6 7 8 9]
b = a[5] 
print(b)
print(a[2:])
print(a[2:5])

多维数组同样适用上述索引提取方法：

In [None]:
import numpy as np
 
a = np.array([[1,2,3],[3,4,5],[4,5,6]])
print(a)
# 从某个索引处开始切割
print('从数组索引 a[1:] 处开始切割')
print(a[1:])

切片还可以包括省略号 …，来使选择元组的长度与数组的维度相同。 如果在行位置使用省略号，它将返回包含行中元素的 ndarray。

In [None]:
print (a[...,1])   # 第2列元素
print (a[1,...])   # 第2行元素
print (a[...,1:])  # 第2列及剩下的所有元素

### 4.3 排序
通过np.sort()可以对数组对象进行排序

In [None]:
import numpy as np
s = np.random.rand(1,3)
print(s)
print(np.sort(s,axis = 1)) #axis = 1表示按行对元素排序，0表示按列对元素排序

## 5. 数组的相关运算
数组的运算可以分为：
* 数组内的运算
* 数据与数组之间的运算

### 5.1 数组内的运算
Numpy提供了丰富的函数进行数组内的运算——
* 求和
* 求乘积
* 求最值
* 求均值
* 求方差和标准差
* 幂运算
* 对数运算

In [None]:
import numpy as np
a = np.random.randint(low=1,high=100,size=(10)) #创建一个随机从1～100取数，10个元素的数组
print(a)

In [None]:
print(np.sum(a)) #求和
print(np.prod(a)) #求乘积
print(np.max(a)) #最大值
print(np.min(a)) #最小值
print(np.mean(a)) #均值
print(np.var(a)) #方差
print(np.std(a)) #标准差
print(np.sqrt(a)) #开方（每个元素）
print(np.square(a)) #平方（每个元素）
print(np.exp(a)) #以e为底的指数次方
print(np.log(a)) #自然对数
print(np.log2(a)) #底数为2对数
print(np.log10(a)) #底数为10对数

### 5.2 数组间的运算
数组间的运算依然是包括了加（＋）、减（ - ）、乘（ x ）除（ / ）等，这些运算可以适合于具有相同的行数和列数的多个数组，并且是对数组的全部元素进行运算。

In [None]:
import numpy as np
a = np.random.randint(low=1,high=100,size=(10)) #创建一个随机从1～100取数，10个元素的数组
b = np.random.randint(low=1,high=100,size=(10))
print(a)
print(b)

In [None]:
c = a+b
d = a-b
e = a*b
f = a/b

print(c)
print(d)
print(e)
print(f)