多维数组及其子数组
====

In [2]:
import numpy as np

多维数组是由子数组组成的，准确解析数组的结构对初学者来说是一件头痛的事。

任意 ndarray 的三个重要的属性对解析数组的结构非常有帮助：

- numpy.shape
- numpy.ndim
- numpy.size

假设有一个数组，它的shape是，(3, 2, 2, 4)

In [56]:
grid = np.arange(48)
grid.shape

(48,)

In [57]:
grid.ndim

1

In [38]:
grid.size

48

In [58]:
grid

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16,
       17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33,
       34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47])

In [60]:
grid = grid.reshape(3,2,2,4)
grid

array([[[[ 0,  1,  2,  3],
         [ 4,  5,  6,  7]],

        [[ 8,  9, 10, 11],
         [12, 13, 14, 15]]],


       [[[16, 17, 18, 19],
         [20, 21, 22, 23]],

        [[24, 25, 26, 27],
         [28, 29, 30, 31]]],


       [[[32, 33, 34, 35],
         [36, 37, 38, 39]],

        [[40, 41, 42, 43],
         [44, 45, 46, 47]]]])

不同的创建数组方法，其结果稍有差异。

下面将重点以`numpy.zeros()`函数和 `numpy.indices()`函数为例讨论这个问题。

数组实际上是一个网格结构，多维数组就是网格（数组）中的每个小格子又嵌套了一个子网格（子数组）。

用grid代表一个数组，即为顶级网格，grid[k]就是其中的第k个格子，即第k个子数组。这第k个格子又可能嵌套了一个子网格（即为子数组）。

如何通过两个函数的参数和数组的shape属性来解析多维数组的结构呢？

# numpy.indices()创建的数组

`grid = np.indices(dimensions)`

numpy.indices()函数创建的数组，其shape属性是这样求得的：在 dimensions 元组前面加上 dimensions 元组中元素的数量，即如果 dimensions 是长度为 N 的元组（r0，...，rN-1），则输出shape为（N，r0，......，RN-1）。

表示为：`grid.shape = (len(dimensions),) + tuple(dimensions).`

创建的数组的维度是shape的长度，即len(grid.shape).

In [4]:
dimensions = (2,2,3,3)
grid = np.indices(dimensions)
grid.shape

(4, 2, 2, 3, 3)

In [5]:
(len(dimensions),2,2,3,3)

(4, 2, 2, 3, 3)

In [6]:
len(grid.shape), grid.ndim,len(dimensions)+1

(5, 5, 5)

In [7]:
grid[0,0,0,0,0]

0

## indecis数据的检索

`grid = numpy.indices((i0,i1,...,iN-1))`

- dimensions是一个正整数元组，即dimensions为：（r0，...，rN-1）。
- grid.shape为`（N，r0，......，RN-1）`，其中 N = len(dimensions)。
- grid的维数，或轴数 `D = len(grid.shape) = grid.ndim = N+1`。
- 定义一个 `k = k0,k1,.kj..kD-1'`作为索引值列表。k元素个数至少1个，最多等于shape元素个数（维度数D），即检索深度小于等于维度数（实际就是网格嵌套层次）。
- kj 为区间'[0, rj-1]'内的整数值。
- grid[k0,k1,...kj],当`j = D-1`时检索出的是单个值。
>- 当'j < D-1'时，检索出的是一个子数组，该数组是沿 k0 轴，**索引为 N-D**的数组。明确地表示方法如下：

`grid[k,i0,i1,...,iN-1] = ik`





**说明：** 
- 使用`numpy.indices(dimensions)`创建数组，dimensions是一个正整数元组，即dimensions为：（r0，...，rN-1）
- grid是一个多维数组，每个子数组是其中的一个元素，每个元素实际是一个嵌套的列表或值;
- grid.shape属性输出的是一个元组，该元组的第一个元素就是它的维度数，又被称为轴数，即为N；
- grid[k]，k属于[0 : N)，即** ` 0 <= k <= (N-1) `**；
- grid值的总个数 = `N * r0 * r1  *r2...* (rN-1)`；
- grid是一个数组平面，被划分为 N 个格子（0层），0层上的每个格子被划分为r0个1级子格，每个1级子格又被划分为r1个子格；依此类推。
- 想象一下，grid是一个层层嵌套的网格，当缩小到一定的时候，就看不清内部网格的划分了，只能看到第一层最大的格子，实际就是 N 个格子；
- 当放大网格时，会看到，每个大格子里又有若干个小格子。

下面以`grid = numpy.indices(2,3,4)`创建的数组网格为例说明：

In [8]:
k = 0,1,1
grid[k]

array([[1, 1, 1],
       [1, 1, 1],
       [1, 1, 1]])

In [9]:
import numpy as np
grid = np.indices((2,3,4))
grid.shape, grid.ndim


((3, 2, 3, 4), 4)

上面的代码创建了一个维度数为3的数组，即N=3，它的结构可以用下图来示意：

<img src = "../../../pf-img-store/indices-grid02.png">

**总结：**
- 维度数 N=3 即为数组的轴数，可以理解为数组空间被划分为3个格子；
- ndarray实际是一个带有array标识的特殊的列表，numpy.array()输出的结果，就是“array([.....])”这样一个特殊的对象。
- 列表层层嵌套（就是网格的层层分割）；
- shape有4个元素，每个元素的索引就是对应的网格层，该索引位置的值就是该层的子风格数。本例：

`grid.shape  = (3,2,3,4)`

`shape.index = (0,1,2,3)`

- 0层（数组空间），分割为3格，0层的格数就是数组的维度数，或轴数；
- 1层，分割为2格；
- 2层，分割为3格；
- 3层，分割为4格。

假设创建的数组的shape如下：

```
grid.shape = (3,3,2,5)

shape.index = (0,1,2,3)```

- 0层（数组空间），分割为3格，0层的格数就是数组的维度数N，或轴数；
- 1层，分割为3格；
- 2层，分割为2格；
- 3层，分割为5格。

In [10]:
grid.ndim

4

# indices 网格的检索

grid[k] 包含的数组，是沿第 k 轴，**索引为 N-D的数组** 。明确地表示方法如下：

`grid[k,i0,i1,...,iN-1] = ik`

indices创建数组，对其进行检索，索引值按照与grid.shape属性输出的元组值对应的位置进行检索。

shape.index = 0,1,2,3...

k检索0级格子，i0检索1级格子，i1检索2级格子，....iN-1检索最后的值。

In [11]:
grid[1].ndim
#只有一个索引值，为k，对应shape中的N，输出的是0级格子中在索引为1位置的格子中的数组，该数组是一个
#输出的的子数组，是一个1级格子，在0层上索引号为1。
#输出的格子被划分为2格，也就是检索出的子数组的维度数为2。`N - len[k] = 3 - 1 = 2`，索引只有一个元素，长度为1。

3

In [12]:
xx = grid[1,0]
# 有两个索引值，第一个索引值检索出0级格子，也就是轴，再在这个0级格子中检索出它的子格。
# 索引有两个元素，长度为2，检索出的数组维度为`3-2=1'，也就是检索出的数组空间作为一个格子，
xx

array([[0, 0, 0, 0],
       [1, 1, 1, 1],
       [2, 2, 2, 2]])

In [13]:
xx.ndim

2

In [14]:
yy=grid[1,1,2]
yy

array([2, 2, 2, 2])

In [15]:
yy.ndim

1

In [16]:
#因为一级格子被划分为两个子格，最大索引只能是 2-1 = 1，大于等于对应位置的值都会触发错误
grid[1,2]

IndexError: index 2 is out of bounds for axis 1 with size 2

In [None]:
grid[2,1]

In [None]:
grid[2,1,1]

In [None]:
grid[2,1,2,3]

In [None]:
grid[2,1,2,2]

In [None]:
x= np.indices((0,0))
x