<h1>Table of Contents<span class="tocSkip"></span></h1>
<div class="toc"><ul class="toc-item"><li><span><a href="#创建N维数组" data-toc-modified-id="创建N维数组-1"><span class="toc-item-num">1&nbsp;&nbsp;</span>创建N维数组</a></span></li><li><span><a href="#数组索引与切片" data-toc-modified-id="数组索引与切片-2"><span class="toc-item-num">2&nbsp;&nbsp;</span>数组索引与切片</a></span></li><li><span><a href="#创建数组副本的方法" data-toc-modified-id="创建数组副本的方法-3"><span class="toc-item-num">3&nbsp;&nbsp;</span>创建数组副本的方法</a></span></li><li><span><a href="#数组拼接与分裂" data-toc-modified-id="数组拼接与分裂-4"><span class="toc-item-num">4&nbsp;&nbsp;</span>数组拼接与分裂</a></span></li><li><span><a href="#数组属性" data-toc-modified-id="数组属性-5"><span class="toc-item-num">5&nbsp;&nbsp;</span>数组属性</a></span></li><li><span><a href="#常量" data-toc-modified-id="常量-6"><span class="toc-item-num">6&nbsp;&nbsp;</span>常量</a></span></li><li><span><a href="#广播机制" data-toc-modified-id="广播机制-7"><span class="toc-item-num">7&nbsp;&nbsp;</span>广播机制</a></span></li></ul></div>

官方文档地址：https://numpy.org/doc/  
中文网站：https://www.numpy.org.cn/

In [1]:
import numpy as np

np.__version__

'1.18.1'

速查表

![numpy_cheat_sheet](https://storage.googleapis.com/molten/lava/2018/09/d84c3e64-numpy-cheat-sheet.jpg)

#### 创建N维数组

In [5]:
# 最基本的创建N维数组的方法：np.array()，可以指定类型也可以有numpy自动制定类型
x = np.array([[2,4],[7,1]], np.int32)
x

array([[2, 4],
       [7, 1]])

In [20]:
# 创建N维数据的主要方式

# 用序列创建
x_from_arange = np.arange(20).reshape(4,5)
x_from_arange_step = np.arange(6,30,2).reshape(3,4)

# 创建 0 矩阵，1矩阵，单位矩阵 和 空矩阵
x_zeros = np.zeros((3,4))
x_ones = np.ones((2,2))
x_empty = np.empty((3,2))
x_eye = np.eye(3)

#  0 矩阵，1矩阵 和 空矩阵 可以用 _like 方法来指定形状
r = np.array([[2.3,5.1,1.2,1.9],[0,4.1,1.7,6.1],[1.0,3.9,3.2,1.1]], np.float64)
r_ones = np.ones_like(r)

In [40]:
# 其他创建N维数据的方法

# 用固定值填满
x_full = np.full((2, 3), 5)
x_full_like = np.full_like(r, 6)

# 线性空间：指定范围内等间距的数字
x_linespace = np.linspace(2, 10, 5)

# 线性空间：指定范围内以对数刻度均匀分布
x_logspace = np.logspace(2, 10, 10)

# 提取矩阵的对角线数据
m = np.array([[1,3,5],[2,4,6],[1,4,7]])
x_diag = np.diag(m)
x_diag_dim = np.diag(m,1)
x_diagflat = np.diagflat(m,1)

# 主对角线及以下均为1，其余为0的矩阵
x_tri = np.tri(5, 5, dtype=int)

# 矩阵的上三角
x_triu = np.triu(m)

# 矩阵的下三角
x_tril = np.tril(m)

array([[1, 3, 5],
       [0, 4, 6],
       [0, 0, 7]])

创建n维数组时可以指定数组的数据类型，通过 `dtype=`，numpy 中的标准数据类型如下表。（来自[《python数据科学手册》](https://book.douban.com/subject/27667378/)）

![dtypes](pics\dtypes.png)

#### 数组索引与切片

索引是指用方括号 `[]` 来获取N维数组中的值，对于只有1个维度的数据索引方法与python中的相同，而对于更高维的数组，则需要用多维索引。

切片的基本方法是`arr[i:j:k]`，其中 $i$ 是起始索引，$j$ 是停止索引，$k$ 是步长。

In [62]:
x_one_d_array = np.arange(0,10)
x_one_d_array[2]       # 2
x_one_d_array[-2]      # 8
x_one_d_array[3:-1]    # array([3, 4, 5, 6, 7, 8])
x_one_d_array[2:-1:2]  # array([2, 4, 6, 8])
x_one_d_array[np.array([0,-3,-6])]   # array([0, 7, 4])，注意这个索引中，index允许重复或者负数，但是不能超过范围

array([0, 7, 4])

对于多维数组，索引的顺序是先行后列。

In [2]:
x = np.array([[1, 2], [3, 4], [5, 6]])
x[[0, 1, 2], [0, 1, 0]]    # array([1, 4, 5])

array([1, 4, 5])

In [60]:
d = np.arange(16).reshape(4,4)
d[2,2]       # 10
d[2:]        # array([[ 8,  9, 10, 11],
             #       [12, 13, 14, 15]])
d[2:3]       # array([[ 8,  9, 10, 11]])
d[2:3, 1:3]  # array([[ 9, 10]])

array([[ 9, 10]])

In [4]:
y = np.arange(35).reshape(5, 7)
y[1:4:2, ::3]     # array([[ 7, 10, 13],
                  #        [21, 24, 27]])
y[:2, :3] 

array([[0, 1, 2],
       [7, 8, 9]])

In [3]:
a = np.array([[1, 2, 3], [2, 3, 4], [3, 4, 5]])
a[::-1,::-1]

array([[5, 4, 3],
       [4, 3, 2],
       [3, 2, 1]])

In [66]:
# 布尔索引
d = np.arange(16).reshape(4,4)
d[d>4]

array([ 5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15])

#### 创建数组副本的方法

In [5]:
# 直接赋值给另一个数组，如果发生变化，两个数组将同时被改变
a = np.array([[2, 4], [3, 6]])
b = a
b[0, 1] = 99
a

array([[ 2, 99],
       [ 3,  6]])

In [6]:
a = np.array([[2, 4], [3, 6]])
b = a.copy()
b[0, 1] = 99
a

array([[2, 4],
       [3, 6]])

#### 数组拼接与分裂

In [12]:
a = np.array([[2, 3, 4], [4, 5, 6]])
b = np.array([[9, 8, 7], [6, 7, 9]])
np.concatenate([a, b], axis=0)
np.concatenate([a, b], axis=1)

array([[2, 3, 4, 9, 8, 7],
       [4, 5, 6, 6, 7, 9]])

`np.stack()`、`np.vstack()` 和 `np.hstack()` 的用法可以参考下图（来源medium需强国）

![vstack_and_hstack](https://miro.medium.com/max/1645/1*i5yqTKWOY7Iyl6AD-62u8Q.png)

#### 数组属性

In [9]:
x = np.array([[2, 3, 4], [7, 8, 9], [1.1, 1.5, 2.0]])
x.shape     # (3, 3)，数组每个维度的大小
x.size      # 9 ，数组总大小
x.ndim      # 2，数组的维度
x.dtype     # dtype('float64')
x.T         # array([[2. , 7. , 1.1],
            #        [3. , 8. , 1.5],
            #       [4. , 9. , 2. ]])

array([[2. , 7. , 1.1],
       [3. , 8. , 1.5],
       [4. , 9. , 2. ]])

####  常量

In [4]:
# 几个常量

np.Inf         # 表示（正）无穷大
np.NaN         # nan，非数字
np.Infinity    # 表示（正）无穷大

inf

In [13]:
x = np.array([[1.1, np.nan, 2.1], [2, np.nan, 4.1]])
x[np.isnan(x)] = 1
x       # array([[1.1, 1. , 2.1],
        #        [2. , 1. , 4.1]])

array([[1.1, 1. , 2.1],
       [2. , 1. , 4.1]])

#### 广播机制

In [8]:
a_arr = np.array([2,1])
b_arr = np.array([[1,1], [3,3]])
c_arr = b_arr + a_arr
c_arr

array([[3, 2],
       [5, 4]])

**广播**（broadcast）机制使得符合一定条件的不同维度的n维数组之间可以进行计算或对n维数组使用通用函数，广播机制是指：
* 如果两个数组的维度数不相同，那么小维度数组的形状将会在最左边补1
* 如果两个数组的形状在任何一个维度上都不匹配，那么数组的形状会沿着维度为 1 的维度扩展以匹配另外一个数组的形状
* 如果两个数组的形状在任何一个维度上都不匹配并且没有任何一个维度等于1，那么会引发异常

In [9]:
# 不能使用广播机制的情况下触发ValueError
a_arr = np.array([[2,3], [3,4]])
b_arr = np.array([[1.1, 2.0, 4.2]])
c_arr = b_arr + a_arr

ValueError: operands could not be broadcast together with shapes (1,3) (2,2) 

numpy中有60多个通用函数（ufunc）

In [11]:
a_arr = np.array([2,2])
b_arr = np.array([3,2])
c_arr = np.power(a_arr, b_arr)
c_arr

array([8, 4], dtype=int32)

In [12]:
r = np.array([1.1, 1.4, 5.9, 7.0])
r = np.rint(r)
r

array([1., 1., 6., 7.])

In [13]:
s = np.log(r)
s

array([0.        , 0.        , 1.79175947, 1.94591015])

In [14]:
r = np.array([[1, 3, 7], [1.4, -3.1, 1.9], [4.0, 8.1, -1.8]])
np.sin(r)

array([[ 0.84147098,  0.14112001,  0.6569866 ],
       [ 0.98544973, -0.04158066,  0.94630009],
       [-0.7568025 ,  0.96988981, -0.97384763]])

In [15]:
np.rad2deg(r)

array([[  57.29577951,  171.88733854,  401.07045659],
       [  80.21409132, -177.61691649,  108.86198107],
       [ 229.18311805,  464.09581406, -103.13240312]])

In [18]:
np.max(r, axis=0)

array([4. , 8.1, 7. ])