## Numpy 对数组按索引查询
三种索引方式：
- 基础索引
- 神奇索引
- 布尔索引

In [2]:
import numpy as np

In [3]:
# 一维向量
x= np.arange(10)
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [4]:
# 二维向量，一般用大写字母
X = np.arange(20).reshape(4,5)
X

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

### 基础索引

##### 一维数组
和 Python 的 List 一样

In [5]:
 x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [6]:
print(x[2], x[5], x[-1])

2 5 9


In [7]:
x[2:4] # 也支持切片的方式

array([2, 3])

In [8]:
x[2:-1]

array([2, 3, 4, 5, 6, 7, 8])

In [9]:
x[-3:]

array([7, 8, 9])

In [10]:
x[:-3]

array([0, 1, 2, 3, 4, 5, 6])

#### 二维数组

In [11]:
X

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

In [13]:
# 分别行坐标、列坐标、实现行列筛选
X[0,0]

0

In [15]:
X[-1,2] # 最后一行，第二列

17

In [16]:
# 可以省略后续索引值，返回的数据是降低一个维度的数组
# 这里的 2，其实是要筛选第二行
X[2]

array([10, 11, 12, 13, 14])

In [17]:
# 筛选 -1 对应的行
X[-1]

array([15, 16, 17, 18, 19])

In [19]:
# 筛选多行
X[:-1] # 除了最后一行，其他所有行

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [20]:
# 筛选多行，然后筛选多列
X[:2,2:4]

array([[2, 3],
       [7, 8]])

### 注意：切片的修改会修改原来的数组

原因：Numpy 经常要处理大数组，避免每次都复制而影响性能

In [21]:
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [23]:
x[2:4] = 666
x

array([  0,   1, 666, 666,   4,   5,   6,   7,   8,   9])

In [24]:
X[:1,:2] = 666
X

array([[666, 666,   2,   3,   4],
       [  5,   6,   7,   8,   9],
       [ 10,  11,  12,  13,  14],
       [ 15,  16,  17,  18,  19]])

### 神奇索引

其实就是：用整数数组进行的索引，叫神奇索引

In [25]:
x = np.arange(10)
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [31]:
x[[3, 4, 7]] # 返回了 3，4,7 对应位置的数据

array([3, 4, 7])

In [32]:
indexs = np.array( [[0, 2],[1, 3]] ) # 先构建好两行两列的形式，然后再取索引
x[indexs]

array([[0, 2],
       [1, 3]])

### 实例：获取数组中最大的前 N 个数字

In [34]:
# 随机生成 1 到 100 之间的，10 个数字
arr = np.random.randint(1, 100, 10)
arr

array([24, 14,  4, 22, 61, 54, 82, 82, 18, 75])

In [37]:
# arr.argsort() 会返回排序后的索引的 index
# 取最大值对应的 3 个下标
arr.argsort()[-3:]

array([9, 6, 7])

In [38]:
arr[arr.argsort()[-3:]]

array([75, 82, 82])

#### 二维数组

In [40]:
X = np.arange(20).reshape(4, 5)
X

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

In [42]:
# 筛选多行，列可以省略
X[[0, 2],:] # 使用列表筛选多行

array([[ 0,  1,  2,  3,  4],
       [10, 11, 12, 13, 14]])

In [44]:
# 同上
X[[0, 2],:] # ":"可以省略

array([[ 0,  1,  2,  3,  4],
       [10, 11, 12, 13, 14]])

In [49]:
# 筛选多列，行不省略
X[:,[0, 2, 3]] 

array([[ 0,  2,  3],
       [ 5,  7,  8],
       [10, 12, 13],
       [15, 17, 18]])

In [50]:
# 同时指定行列 - 列表
# 返回的是 [(0,1),(2,3),(3,4)] 位置的数字
X[[0, 2, 3],[1, 3, 4]] # 行，列的数字列表

array([ 1, 13, 19])

### 布尔索引

注意：布尔索引选择的数据是数组的拷贝

#### 一维数组

In [52]:
# 将数据还原
x = np.arange(10)
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [53]:
x > 5

array([False, False, False, False, False, False,  True,  True,  True,
        True])

In [54]:
x[x > 5]

array([6, 7, 8, 9])

In [56]:
# 实例：把一维数组进行 01 化处理
# 比如把放假数字，变成“高房价”为 1，“低房价”为 0
x[ x <= 5] = 0
x[ x > 5] = 1
x

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [57]:
x = np.arange(10)
x[x < 5] += 20
x

array([20, 21, 22, 23, 24,  5,  6,  7,  8,  9])

#### 二维数组

In [59]:
X = np.arange(20).reshape(4, 5)
X

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

In [60]:
X > 5

array([[False, False, False, False, False],
       [False,  True,  True,  True,  True],
       [ True,  True,  True,  True,  True],
       [ True,  True,  True,  True,  True]])

In [61]:
# X > 5 的 boolean 数组，既有行，又有列
# 因此返回的是（行，列）一维结果
X[X > 5]

array([ 6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19])

In [62]:
# 举例：怎样把第 3 列大于 5 的行筛选出来
X[:, 3]

array([ 3,  8, 13, 18])

In [64]:
X[:, 3] > 5

array([False,  True,  True,  True])

In [65]:
# 筛选
X[X[:, 3] > 5]

array([[ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14],
       [15, 16, 17, 18, 19]])

In [67]:
X[X[:, 3] > 5] = 666
X

array([[  0,   1,   2,   3,   4],
       [666, 666, 666, 666, 666],
       [666, 666, 666, 666, 666],
       [666, 666, 666, 666, 666]])

#### 条件的组合

In [68]:
x = np.arange(10)
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [70]:
# 注意：每个条件都要加小括号
condition = (x % 2 == 0) | (x > 7) # 偶数且大于 7
condition

array([ True, False,  True, False,  True, False,  True, False,  True,
        True])

In [71]:
x[condition]

array([0, 2, 4, 6, 8, 9])