15-数组检索子程序之一
====
indexing routines，生成索引数组
----

| Generating   index arrays                       |                                                              |
| ----------------------------------------------- | ------------------------------------------------------------ |
| c_                                              | Translates   slice objects to concatenation along the second axis. |
| r_                                              | Translates   slice objects to concatenation along the first axis. |
| s_                                              | A   nicer way to build up index tuples for arrays.           |
| nonzero(a)                                      | Return   the indices of the elements that are non-zero.      |
| where(condition, [x, y])                        | Return   elements, either from x or y, depending on condition. |
| indices(dimensions[, dtype])                    | Return   an array representing the indices of a grid.        |
| ix_(*args)                                      | Construct   an open mesh from multiple sequences.            |
| ogrid                                           | nd_grid instance which returns an open multi-dimensional   “meshgrid”. |
| ravel_multi_index(multi_index, dims[, mode, …]) | Converts   a tuple of index arrays into an array of flat indices, applying boundary   modes to the multi-index. |
| unravel_index(indices, dims[, order])           | Converts   a flat index or array of flat indices into a tuple of coordinate arrays. |
| diag_indices(n[, ndim])                         | Return   the indices to access the main diagonal of an array. |
| diag_indices_from(arr)                          | Return   the indices to access the main diagonal of an n-dimensional array. |
| mask_indices(n, mask_func[, k])                 | Return   the indices to access (n, n) arrays, given a masking function. |
| tril_indices(n[, k, m])                         | Return   the indices for the lower-triangle of an (n, m) array. |
| tril_indices_from(arr[, k])                     | Return   the indices for the lower-triangle of arr.          |
| triu_indices(n[, k, m])                         | Return   the indices for the upper-triangle of an (n, m) array. |
| triu_indices_from(arr[, k])                     | Return   the indices for the upper-triangle of arr.          |

# numpy.c_
`numpy.c_ = <numpy.lib.index_tricks.CClass object>`

将切片对象转换为沿第二轴的连接。

这是`np.r_['-1,2,0', index expression]`的简写，因为它很常见，所以很有用。 特别是，数组将在升级到至少2-D后沿着它们的最后一个轴堆叠，其中1个后置为形状（由1-D数组生成的列向量）。

## 示例

In [1]:
import numpy as np
np.c_[np.array([1,2,3]), np.array([4,5,6])]

array([[1, 4],
       [2, 5],
       [3, 6]])

In [2]:
np.c_[np.array([[1,2,3]]), 0, 0, np.array([[4,5,6]])]

array([[1, 2, 3, 0, 0, 4, 5, 6]])

# numpy.r_
numpy.r_ = <numpy.lib.index_tricks.RClass object>

将切片对象转换为沿第一轴的连接。

这是一种快速构建数组的简单方法。有两个用例。

1. 如果索引表达式包含逗号分隔的数组，则将它们沿第一个轴堆叠。
2. 如果索引表达式包含切片符号或标量，则创建一个具有切片符号指示范围的一维数组。

如果使用切片符号，则语法 `start：stop：step` 相当于 `np.arange（start，stop，step）`的括号内。但是，如果step是一个虚数（即100j），那么它的整数部分被解释为所需的点数，并且start和stop是包含的。换句话说，`start：stop：stepj`被解释为`np.linspace（start，stop，step，endpoint = 1）`括号内的。扩展切片表示法后，所有逗号分隔的序列连接在一起。

作为索引表达式的第一个元素放置的可选字符串可用于更改输出。字符串'r'或'c'导致输出矩阵。如果结果是1-D并且指定'r'，则产生1×N（行）矩阵。如果结果是1-D并且指定了'c'，则产生N×1（列）矩阵。如果结果是2-D，则两者都提供相同的矩阵结果。

字符串整数指定堆叠多个逗号分隔数组的轴。由两个逗号分隔的整数组成的字符串允许指示最小的维数，以强制每个条目作为第二个整数（要连接的轴仍然是第一个整数）。

具有三个以逗号分隔的整数的字符串允许指定轴连接，强制条目的最小维数，以及哪个轴应包含小于指定维数的数组的开头。换句话说，第三个整数允许您指定1应放置在其形状已升级的数组形状中的位置。默认情况下，它们位于形状元组的前面。第三个参数允许您指定数组的起始位置。因此，第三个参数'0'会将1放在数组形状的末尾。负整数指定新形状元组中应放置升级数组的最后一个维度的位置，因此默认值为“-1”。

一个带有三个逗号分隔的整数的字符串允许指定轴的连接，最小的维度来强制条目，并且哪个轴应该包含数组的开始，这些数组的数量小于指定的维数。换句话说，第三个整数允许你指定在shape已升级的数组的shape中`1's`的应该被放置的位置。默认情况下，它们被放置在shape元组的前面。第三个参数允许您指定数组的起始位置。因此，“0”的第三个参数将把`1's`放在数组形状的末尾。负整数指定了新形状元组的位置，升级后的数组的最后一个维度应该放在哪里，所以默认值是'-1'。

**参数：**
不是一个函数，所以没有参数。

**返回：**
一个连接的 nadarray 或者 matrix.

## 示例

In [3]:
>>> np.r_[np.array([1,2,3]), 0, 0, np.array([4,5,6])]

array([1, 2, 3, 0, 0, 4, 5, 6])

In [4]:
>>> np.r_[-1:1:6j, [0]*3, 5, 6]

array([-1. , -0.6, -0.2,  0.2,  0.6,  1. ,  0. ,  0. ,  0. ,  5. ,  6. ])

字符串整数指定要连接的轴或最小的维数，以迫使条目进入。

In [5]:
>>> a = np.array([[0, 1, 2], [3, 4, 5]])
>>> np.r_['-1', a, a] # concatenate along last axis

array([[0, 1, 2, 0, 1, 2],
       [3, 4, 5, 3, 4, 5]])

In [6]:
>>> np.r_['0,2', [1,2,3], [4,5,6]] # concatenate along first axis, dim>=2

array([[1, 2, 3],
       [4, 5, 6]])

In [7]:
>>> np.r_['0,2,0', [1,2,3], [4,5,6]]

array([[1],
       [2],
       [3],
       [4],
       [5],
       [6]])

In [8]:
>>> np.r_['1,2,0', [1,2,3], [4,5,6]]

array([[1, 4],
       [2, 5],
       [3, 6]])

用“r”或“c”作为第一个字符串参数创建一个矩阵。

In [9]:
np.r_['r',[1,2,3], [4,5,6]]

matrix([[1, 2, 3, 4, 5, 6]])

# numpy.s_
`numpy.s_ = <numpy.lib.index_tricks.IndexExpression object>`

一种更好的建立数组的索引元组的方法。

**注意**

使用两个预定义的`index_exp`实例或 `s_rather`，而不是直接使用IndexExpression。

对于任何索引组合，包括切片和轴插入，`[indices]`与任何数组 `a[np.index_exp [indices]]`相同。 但是，`np.index_exp [indices]`可以在Python代码中的任何位置使用，并返回可用于构造复杂索引表达式的切片对象元组。

## Parameters:	
**maketuple** : bool

如果是True，总是返回元组。

返回切片元组。

**注意**：

你可以用`slice（）`加上一些特殊的对象来完成所有这些，但是需要记住很多东西，这个版本更简单，因为它使用了标准的数组索引语法。

## 示例

In [10]:
>>> np.s_[2::2]

slice(2, None, 2)

In [11]:
slice(2, None, 2)

slice(2, None, 2)

In [12]:
>>> np.index_exp[2::2]

(slice(2, None, 2),)

In [13]:
>>> np.array([0, 1, 2, 3, 4])[np.s_[2::2]]

array([2, 4])

# numpy.nonzero
`numpy.nonzero(a)`

返回非零元素的索引。

返回一个数组的元组，一个用于a的每个维度，包含该维度中非零元素的索引。a中的值总是经过测试，并以c级的顺序返回。相应的非零值可以通过：

`a[nonzero(a)]`

使用元素而不是维度来对索引进行分组：

`transpose(nonzero(a))`

这样做的结果总是一个2-D数组，每个非零元素都有一行。

## Parameters:	
**a :** array_like，l输入数组

## Returns:	
数组的元组： 元组，非零元素的索引。
## 示例

In [14]:
>>> x = np.array([[1,0,0], [0,2,0], [1,1,0]])
>>> x

array([[1, 0, 0],
       [0, 2, 0],
       [1, 1, 0]])

In [15]:
>>> np.nonzero(x)

(array([0, 1, 2, 2], dtype=int64), array([0, 1, 0, 1], dtype=int64))

In [16]:
>>> x[np.nonzero(x)]

array([1, 2, 1, 1])

In [17]:
>>> np.transpose(np.nonzero(x))

array([[0, 0],
       [1, 1],
       [2, 0],
       [2, 1]], dtype=int64)

nozero 的一个常见用途是找到一个数组的索引，其中一个条件为真。给定一个数组a，条件a是一个布尔数组，因为False被解释为0，np。非零（a-3）产生条件为tru的a的指数。

非零的一个常见用途是查找数组的索引，其中条件为True。 给定一个数组a，条件a> 3是一个布尔数组，并且因为False被解释为0，所以`np.nonzero（a> 3）`产生条件为tru的a的索引。

In [18]:
>>> a = np.array([[1,2,3],[4,5,6],[7,8,9]])
>>> a > 3

array([[False, False, False],
       [ True,  True,  True],
       [ True,  True,  True]])

In [19]:
>>> np.nonzero(a > 3)

(array([1, 1, 1, 2, 2, 2], dtype=int64),
 array([0, 1, 2, 0, 1, 2], dtype=int64))

可以调用布尔数组的非零方法：

In [20]:
 (a > 3).nonzero()

(array([1, 1, 1, 2, 2, 2], dtype=int64),
 array([0, 1, 2, 0, 1, 2], dtype=int64))

# numpy.where
`numpy.where(condition[, x, y])`

根据condition，从 x 或 y 返回元素。

如果仅给出 condition，返回`condition.nonzero()`。

## Parameters:	
**condition :** array_like, bool，
为True时返回 x，否则返回 y。

**x, y :** array_like, 可选参数。从x, y之一中选择值，并且需要将 condition 广播到一些形状。

## Returns:	
out : ndarray or tuple of ndarrays
输出：ndarray 或者 ndarrays 元组。

如果x 和 y 都被定义了，输出的数组包含 x 中 condition 为 True的元素，否则从 y 中提取。

如果仅给出了 condition，返回`condition.nonzero()`元组， condition为True的位置的索引。

**注意**

如果给出了 x 和 y ，并且输入的数组是1-D的，等同于下面的检索：

`[xv if c else yv for (c,xv,yv) in zip(condition,x,y)]`

## 示例

In [21]:
>>> np.where([[True, False], [True, True]],
...          [[1, 2], [3, 4]],
...          [[9, 8], [7, 6]])

array([[1, 8],
       [3, 4]])

In [22]:
>>> np.where([[0, 1], [1, 0]])

(array([0, 1], dtype=int64), array([1, 0], dtype=int64))

In [23]:
>>> x = np.arange(9.).reshape(3, 3)

In [24]:
>>> np.where( x > 5 )

(array([2, 2, 2], dtype=int64), array([0, 1, 2], dtype=int64))

In [25]:
>>> x[np.where( x > 3.0 )]               # Note: result is 1D.

array([4., 5., 6., 7., 8.])

In [26]:
>>> np.where(x < 5, x, -1)               # Note: broadcasting.

array([[ 0.,  1.,  2.],
       [ 3.,  4., -1.],
       [-1., -1., -1.]])

求出具有良好值的x元素的指标。
Find the indices of elements of x that are in goodvalues.

In [27]:
>>> goodvalues = [3, 4, 7]

In [28]:
>>> ix = np.isin(x, goodvalues)

In [29]:
>>> ix

array([[False, False, False],
       [ True,  True, False],
       [False,  True, False]])

In [30]:
>>> np.where(ix)

(array([1, 1, 2], dtype=int64), array([0, 1, 1], dtype=int64))

# numpy.indices
`numpy.indices(dimensions, dtype=<class 'int'>)`

返回一个表示网格索引的数组。

计算一个数组，其中子数组包含索引值 `0,1,…`只沿相应的轴变化。

## Parameters:	
**dimensions :** sequence of ints，网格的shape.

**dtype :** dtype, 可选关键字参数。结果的数据类型。

**Returns:** grid : ndarray

网格索引的数组，`grid.shape = (len(dimensions),) + tuple(dimensions)`.



**注意**

输出shape是通过在前面的维度元组里预先设置维度数得到的，即，如果维度是一个长度为N的元组 `(r0, ..., rN-1) `,输出shape是`(N,r0,...,rN-1)`。

子数组`grid[k]`包含沿第k轴的 N-D 索引数组。即：`grid[k,i0,i1,...,iN-1] = ik`

## 示例

In [31]:
>>> grid = np.indices((2, 3))
grid

array([[[0, 0, 0],
        [1, 1, 1]],

       [[0, 1, 2],
        [0, 1, 2]]])

In [32]:
>>> grid.shape

(2, 2, 3)

In [33]:
>>> grid[0]        # row indices

array([[0, 0, 0],
       [1, 1, 1]])

In [34]:
>>> grid[1]        # column indices

array([[0, 1, 2],
       [0, 1, 2]])

这些索引可以用作一个数组的索引：

In [35]:
>>> x = np.arange(20).reshape(5, 4)
x

array([[ 0,  1,  2,  3],
       [ 4,  5,  6,  7],
       [ 8,  9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19]])

In [36]:
>>> row, col = np.indices((2, 3))
row

array([[0, 0, 0],
       [1, 1, 1]])

In [37]:
col

array([[0, 1, 2],
       [0, 1, 2]])

In [38]:
>>> x[row, col]

array([[0, 1, 2],
       [4, 5, 6]])

**注意**：

请注意，在上面的示例中，使用`x [：2，：3]`直接提取所需元素会更直接。

# numpy.ix_
`numpy.ix_(*args)`

从多个序列构造一个开放网格。

该函数采用N个1-D序列并返回N个输出，每个输出具有N个维度，使得除了一个维度外，形状都为 `1`，具有非单位形状值的维度在所有N个维度中循环。

使用`ix_`可以快速构建索引数组，以索引交叉产品。 `a [np.ix _（[1,3]，[2,5]）]`返回数组
`[[a[1,2] a[1,5]]，[a[3,2] a[3,5]]]]`。

## Parameters:	
**args :** 1-D sequences

每个序列应该是整数或布尔类型。布尔序列将被解释为相应维度的布尔掩码（相当于传入`np.nonzero（boolean_sequence）`）。

## Returns:	
out : tuple of ndarrays

N个数组，每个N维，N为输入序列的数量。 这些数组一起形成开放网格。

## 示例

In [39]:
>>> a = np.arange(10).reshape(2, 5)
>>> a

array([[0, 1, 2, 3, 4],
       [5, 6, 7, 8, 9]])

In [40]:
>>> ixgrid = np.ix_([0, 1], [2, 4])
>>> ixgrid

(array([[0],
        [1]]), array([[2, 4]]))

In [41]:
>>> ixgrid[0].shape, ixgrid[1].shape
>>> a[ixgrid]

array([[2, 4],
       [7, 9]])

In [42]:
>>> ixgrid = np.ix_([True, True], [2, 4])
>>> a[ixgrid]

array([[2, 4],
       [7, 9]])

In [43]:
>>> ixgrid = np.ix_([True, True], [False, False, True, False, True])
>>> a[ixgrid]

array([[2, 4],
       [7, 9]])

# numpy.ogrid
`numpy.ogrid = <numpy.lib.index_tricks.nd_grid object>`

nd_grid实例，它返回一个开放的多维“meshgrid”。

`numpy.lib.index_tricks.nd_grid`的一个实例，它在索引时返回一个打开的（即没有充实的）网格-网格，这样每个返回的数组只有一个维度大于1. 输出数组的维度和数量等于索引维度数。 如果step不是复数，则stop不包括在内。

然而，如果步长是复数（例如5j），则其幅度的整数部分被解释为指定在start和stop之间创建的点的数量，其中stop是包含的。

**返回：** 只有一个维度的网格-网格`ndarrays`，'math：`neq 1'`

## 示例

In [44]:
>>> from numpy import ogrid
>>> ogrid[-1:1:5j]

array([-1. , -0.5,  0. ,  0.5,  1. ])

In [45]:
>>> ogrid[0:5,0:5]

[array([[0],
        [1],
        [2],
        [3],
        [4]]), array([[0, 1, 2, 3, 4]])]

# numpy.ravel_multi_index
`numpy.ravel_multi_index(multi_index, dims, mode='raise', order='C')`

将索引数组的元组转换为平面索引数组，将边界模式应用于多重索引。

## Parameters:	
**multi_index :** 类似数组的元组，整数数组的元组，每个维度一个数组。是一个索引数组。

**dims :** tuple of ints，被检索数组的shape，应用`multi_index`中的索引检索的目标数组的形状。

**mode :** `{‘raise’, ‘wrap’, ‘clip’}`, 可选参数。指定如何处理越界索引。可以指定一种模式或模式的元组，每个索引一种模式。

- ‘raise’ – raise an error (default)
- ‘wrap’ – wrap around
- ‘clip’ – clip to the range

在“clip”模式下，通常会换行的负索引将剪切为0。

**order :** `{‘C’, ‘F’}`, 可选参数。确定是将多索引视为以行主（C样式）还是列为主（Fortran样式）顺序编制索引。

## Returns:	
raveled_indices : ndarray，解开的索引：ndarray

一个维度模糊的数组的扁平化版本的索引数组。


## 示例

In [46]:
>>> arr = np.array([[3,6,6],[4,5,1]])
arr

array([[3, 6, 6],
       [4, 5, 1]])

In [47]:
>>> np.ravel_multi_index(arr, (7,6))

array([22, 41, 37], dtype=int64)

In [48]:
>>> np.ravel_multi_index(arr, (7,6), order='F')

array([31, 41, 13], dtype=int64)

In [49]:
>>> np.ravel_multi_index(arr, (4,6), mode='clip')

array([22, 23, 19], dtype=int64)

In [50]:
>>> np.ravel_multi_index(arr, (4,4), mode=('clip','wrap'))

array([12, 13, 13], dtype=int64)

In [51]:
>>> np.ravel_multi_index((3,1,4,1), (6,7,8,9))

1621

## 函数释义

上面的定义和示例来自官方文档。很难看明白。释义如下：

这个函数主要功能为把给定的一个由多个数组组成的元组，函数的第一个参数，元组元素的个数与要检索的数组的维度一致，即要检索的目标数组有几维，该元组就有几个元素（数组），将该元组转化为一系列的数值对，用这些数值对作为各维度上的索引值到目标数组中检索数据。

dims参数定义了要检索的目标数组，dims（函数的第二个参数）是目标数组的shape，值为依次增大的自然数。

在上面的示例中，dims是一个shape为（7，6）的2-D数组，值为从零开始依次增大的自然数。

该函数使用`multi_index`作为索引数组，从dims中检索出数据。

dims是一个整数元组，设 `dims = (dims0,dims1,dimsN-1)`, dims 实际可以这样生成： `np.arange(dims0*dims1*...dimsN-1).reshape(dims)`.

**官方示例中的dims可以这样得到：**

In [52]:
dims = np.arange(7*6)
dims

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
       34, 35, 36, 37, 38, 39, 40, 41])

In [53]:
dims = dims.reshape(7,6)
dims

array([[ 0,  1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10, 11],
       [12, 13, 14, 15, 16, 17],
       [18, 19, 20, 21, 22, 23],
       [24, 25, 26, 27, 28, 29],
       [30, 31, 32, 33, 34, 35],
       [36, 37, 38, 39, 40, 41]])

该函数的意义即为用一个唯一的一维数组来定位（检索、保存）原数组的二维（或多维(i,j,k,…)）数对的数据。

官方示例中`arr`即为要转换的多维索引数组，把arr的内容当作索引，即[3,6,6]为横坐标，[4,5,1]为纵坐标，去索引形状为(7,6)，内容为从0开始，从左往右，从上往下依次增大的自然数为值的数组中的值。

例如第一个要索引的数`[3,4]`即为shape为`(7,6)`的dims数组中第4行，第5列的的值，即为3*6+4=22，即为结果中的第一个数。依次类推。

明白了函数的意义，其它参数的作用就好理解了。