# numpy索引高级技巧
-------------------------------
numpy提供了比python list, tuple更丰富的索引功能,可以使用数组或者bool值数组来追踪
## Indexing with Arrays of Indices

In [1]:
import numpy as np
a = np.arange(12)**2
print(a)

[  0   1   4   9  16  25  36  49  64  81 100 121]


In [2]:
i = np.array([1,1,3,8,5])
print(a[i])

[ 1  1  9 64 25]


测试一下是浅拷贝还是深拷贝：

In [5]:
a = np.arange(12)**2
print('a=',a)
i = np.array([1,1,3,8,5])
b = a[i]
a[i] = 0
print('a=',a)
print('b=',b)

a= [  0   1   4   9  16  25  36  49  64  81 100 121]
a= [  0   0   4   0  16   0  36  49   0  81 100 121]
b= [ 1  1  9 64 25]


可以看到，`b=a[i]`这种形式是**深拷贝**，创建了另一个数据对象

index还可以使多维数组，得到的结果和index维度相同，如下例子：

In [6]:
i= np.array([[0,1],
            [2,3]])
b = a[i]
print(b)

[[0 0]
 [4 0]]


假如a是一个多维数组，情况又如何呢？很好想象，index作为一个整数，指示了取a的第一个维度依次放到结果里，如果a是二维的，则一个index指示row

In [8]:
palette = np.array([[0,0,0],
                   [255,0,0],
                   [0,255,0],
                   [0,0,255],
                   [255,255,255]])
image = np.array([[2,4],
                  [0,1]])

palette[image]

array([[[  0, 255,   0],
        [255, 255, 255]],

       [[  0,   0,   0],
        [255,   0,   0]]])

索引还可以组成一个列表，分别指示行和列：

In [10]:
a = np.arange(12).reshape(3,4)
print(a)

[[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]


In [11]:
i = np.array([[0,1],
             [1,2]])
j = np.array([[2,1],
             [3,1]])
a[i,j]

array([[2, 5],
       [7, 9]])

In [12]:
a[i,2]

array([[ 2,  6],
       [ 6, 10]])

In [13]:
a[:,j]

array([[[ 2,  1],
        [ 3,  1]],

       [[ 6,  5],
        [ 7,  5]],

       [[10,  9],
        [11,  9]]])

还可以把i,j组成list或者tuple来作为一个索引，得到的结果和a[i,j]是一样的：

In [14]:
l = [i,j]
a[l]

array([[2, 5],
       [7, 9]])

但是，不可以把i,j组成np.array，因为这样的话得到的结果是一个更高维度的array，而不是两个单独array组成的列表：

In [15]:
s = np.array([i,j])
print(s)

[[[0 1]
  [1 2]]

 [[2 1]
  [3 1]]]


经常用到的index的地方,看如下一个例子：

In [18]:
time = np.linspace(20, 145, 5)  
print('time=',time)
data = np.sin(np.arange(20)).reshape(5,4)
print('data=', data)

time= [ 20.    51.25  82.5  113.75 145.  ]
data= [[ 0.          0.84147098  0.90929743  0.14112001]
 [-0.7568025  -0.95892427 -0.2794155   0.6569866 ]
 [ 0.98935825  0.41211849 -0.54402111 -0.99999021]
 [-0.53657292  0.42016704  0.99060736  0.65028784]
 [-0.28790332 -0.96139749 -0.75098725  0.14987721]]


In [19]:
ind = data.argmax(axis=0)
print(ind)

[2 0 3 1]


In [20]:
time_idx = time[ind]
print(time_idx)

[ 82.5   20.   113.75  51.25]


In [26]:
data_max = data[ind, range(data.shape[1])]
print(data_max)

[0.98935825 0.84147098 0.99060736 0.6569866 ]


In [27]:
all(data_max == data.max(axis=0))

True

可以直接使用索引进行数组赋值操作：

In [29]:
a = np.arange(5)
a[[3,4]]=0
print(a)

[0 1 2 0 0]


如果进行多项赋值，需要注意，如果某个索引值出现多次，以最后一个为最终结果：

In [30]:
a = np.arange(5)
a[[0,0,3]]=[1,2,3]
print(a)

[2 1 2 3 4]


这个地方，a[0]被赋值2次，以最后一个2为最终结果，但是，有一种操作除外，`+=`

In [31]:
a = np.arange(5)
a[[0,0,1]] += 1
print(a)

[1 2 2 3 4]


尽管a[0]出现了2次，但是并不会加两次，这是为什么，很好理解，因为两次a[0]=a[0]+1, a[0]=a[0]虽然赋值不是同时完成，加法操作却是同时完成的，这，意味着对a[0]赋了两次1,最终的结果就是1