### 7.2.1 将条件逻辑作为数组操作

In [1]:
import numpy as np
a = np.array([[1,3,6],[9,3,2],[1,4,3]])
print(f'数组:\n{a}')
print('-'*30)
print(a>3)
print('-'*30)
print(np.where(a>3,520,1314))             # 大于3的数值为520否则为1314


数组:
[[1 3 6]
 [9 3 2]
 [1 4 3]]
------------------------------
[[False False  True]
 [ True False False]
 [False  True False]]
------------------------------
[[1314 1314  520]
 [ 520 1314 1314]
 [1314  520 1314]]


### 7.2.2 布尔值数组方法  any和all

In [2]:
import numpy as np
a = np.array([[1,3,6],[9,3,2],[1,4,3]])
print(f'数组:\n{a}')
print('-'*30)
print((a>3).sum())  # 数组中大于3的数有多少个


数组:
[[1 3 6]
 [9 3 2]
 [1 4 3]]
------------------------------
3


对于布尔值数组，有两个常用方法any和all。

any：检查数组中是否至少有一个True

all：检查是否每个值都是True

In [3]:
import numpy as np
a = np.array([False,False,True,False])
print(a.any())
print(a.all())

True
False


### 7.2.3 按值大小排序 sort

ndarray.sort(axis=-1, kind='quicksort', order=None)

|参数|描述|
|----|----|
|axis|排序沿数组的（轴）方向，0表示按行，1表示按列，None表示展开来排序，默认值为-1，表示沿最后的轴排序|
|kind|排序的算法，提供了快排‘quicksort’、混排‘mergesort’、堆排‘heapsort’，默认为'quicksort'|
|order|排序的字段名，可指定字段排序，默认为None|

In [4]:
# 一维数组：
import numpy as np
a = np.array([3,6,7,9,2,1,8,5,4])
a.sort()
print(a)

[1 2 3 4 5 6 7 8 9]


In [11]:
# 二维数组：
import numpy as np
a = np.array([[0,12,48],[4,18,14],[7,1,99]])
print(f'数组：\n{a}')
print('-'*30)
print(np.sort(a))  # 默认按最后的轴排序，就是（行，列）（0，1）
print('-'*30)
print(np.sort(a,axis=0))  # 按行排序

数组：
[[ 0 12 48]
 [ 4 18 14]
 [ 7  1 99]]
------------------------------
[[ 0 12 48]
 [ 4 14 18]
 [ 1  7 99]]
------------------------------
[[ 0  1 14]
 [ 4 12 48]
 [ 7 18 99]]
[[ -7 -18 -99]
 [ -4 -12 -48]
 [  0  -1 -14]]


拓展：按字段名排序

In [6]:
dt = np.dtype([('name', 'S10'), ('age', int)])
a = np.array([("Mike", 21), ("Nancy", 25), ("Bob", 17), ("Jane", 27)], dtype = dt)
np.sort(a, order = 'name')

array([(b'Bob', 17), (b'Jane', 27), (b'Mike', 21), (b'Nancy', 25)],
      dtype=[('name', 'S10'), ('age', '<i4')])

In [7]:
np.sort(a, order = 'age')

array([(b'Bob', 17), (b'Mike', 21), (b'Nancy', 25), (b'Jane', 27)],
      dtype=[('name', 'S10'), ('age', '<i4')])

### 7.2.4 从大到小的索引 argsort

numpy.argsort(a, axis=-1, kind='quicksort', order=None)

对数组沿给定轴执行间接排序，并使用指定排序类型返回数据的索引数组。 这个索引数组用于构造排序后的数组。

参数类似于sort()

In [10]:
# 一维数组：
import numpy as np
x = np.array([59, 29, 39])
a = np.argsort(x)
print(f'索引升序：{a}')  # 升序
# argsort函数返回的是数组值从小到大的索引值,[3, 1, 2]从小到大为[1，2，3],期对应的索引为[1，2，0]
print(f'数组升序：{x[a]}')  # 以排序后的顺序重构原数组
b = np.argsort(-x)  # 降序
print(f'索引降序：{b}')
print(f'数组降序：{x[b]}')


索引升序：[1 2 0]
数组升序：[29 39 59]
索引降序：[0 2 1]
数组降序：[59 39 29]


In [9]:
# 二维数组：
import numpy as np
x = np.array([[0, 12, 48], [4, 18, 14], [7, 1, 99]])
a1 = np.argsort(x)
print(f'索引排序：\n{a1}')
print('-'*30)
# 以排序后的顺序重构原数组，注意与一维数组的形式不一样
print(np.array([np.take(x[i], x[i].argsort()) for i in range(3)]))

索引排序：
[[0 1 2]
 [0 2 1]
 [1 0 2]]
------------------------------
[[ 0 12 48]
 [ 4 14 18]
 [ 1  7 99]]


### 7.2.5 多级排序方法 lexsort

lexsort(keys, axis=-1)

lexsort是一种多级排序方法。

作用为对给定的 keys 中的最后一个 key 排序，每一个 key 都被认为是列向量，其他 keys 用来辅助最后一个 key 进行排序。

最后返回最后一个 key 进行排序的索引。

|参数|描述|
|--------|---------|
|'axis'|数组排序时的基准，axis=0，按行排序；axis=1，按列排序|
|'keys'|排序的参照物包括数组或包含N维的元组，默认值为最后一行，（如果为二维数组则指最后一列）|

假设有学生成绩：
|英语成绩|数学成绩|语文成绩|总成绩|
|--------|--------|--------|------|
|31|54|84|169|
|78|31|54|163|
|35|89|97|221|
|48|76|97|221|

对学生成绩进行排序时，首先考虑总成绩，总成绩相同时再根据语文成绩进行排序

lexsort就是根据keys从后往前进行排序
```
[[31, 54, 84, 169],             [[78, 31, 54, 163], 
 [78, 31, 54, 163],     =>       [31, 54, 84, 169], 
 [35, 89, 97, 221],              [35, 89, 97, 221],
 [48, 76, 97, 221]]              [48, 76, 97, 221]]
```
 此时第三和第四名同学总成绩相同，再根据语文成绩进行排序，
 语文成绩再次相同，根据数学成绩进行排序，
```
[[78, 31, 54, 163],              [[78, 31, 54, 163], 
 [31, 54, 84, 169],     =>       [31, 54, 84, 169], 
 [48, 76, 97, 221],              [35, 89, 97, 221],
 [35, 89, 97, 221]]              [48, 76, 97, 221]]
``` 
 当数学成绩再次相同时，根据英语成绩进行排序，
 当英语成绩也相同时，考虑作弊嫌疑

In [26]:
import numpy as np
x = np.array([[0, 12, 48], 
              [4, 18, 14], 
              [7, 1, 99]])
np.lexsort(x)  # 返回索引值

array([[ 4, 18, 14],
       [ 0, 12, 48],
       [ 7,  1, 99]])

In [19]:
a = np.array([1, 5, 1, 4, 3, 4, 4])
b = np.array([9, 3, 0, 4, 0, 2, 1])
ind = np.lexsort((b, a))  # 对a数组进行排序，同时参考b数组
print(ind)
print(a[ind])

[2 0 4 6 5 3 1]
[1 1 3 4 4 4 5]


In [20]:
list(zip(a[ind], b[ind]))

[(1, 0), (1, 9), (3, 0), (4, 1), (4, 2), (4, 4), (5, 3)]

矩阵类型进行lexsort排序时，按行从后往前进行排序

In [21]:
c = np.array([[9, 3, 0, 4, 0, 2, 1],
              [1, 5, 1, 4, 3, 4, 4]])
np.lexsort(c)  # 按行从后往前参考keys进行排序

array([2, 0, 4, 6, 5, 3, 1], dtype=int64)

In [51]:
y = np.array([[6,45,91],
              [1,65,65],
              [9,35,15]])
print(y)       
print(y.T[np.lexsort(y)].T)      # 按最后一行排序
print(y[np.lexsort(y.T)])        # 按最后一列排序

[[ 6 45 91]
 [ 1 65 65]
 [ 9 35 15]]
[[ 6 91 45]
 [ 1 65 65]
 [ 9 15 35]]
[[ 9 35 15]
 [ 1 65 65]
 [ 6 45 91]]


### 7.2.6 唯一值与其它集合逻辑 unique和in1d

In [52]:
# 去重复：
import numpy as np
name = np.array(['孙悟空','猪八戒','孙悟空','沙和尚','孙悟空','唐僧'])
print(np.unique(name))
arry = np.array([1,3,1,3,5,3,1,3,7,3,5,6])
print(np.unique(arry))


['唐僧' '孙悟空' '沙和尚' '猪八戒']
[1 3 5 6 7]


In [53]:
# 检查一个数组中的值是否在另外一个数组中，并返回一个布尔数组：
import numpy as np
a = np.array([6,0,0,3,2,5,6])
print(np.in1d(a,[2,3,6]))


[ True False False  True  True False  True]


**附：数组的集合操作    x和y是两个不同的数组**
|方法|描述|
|----|----|
|unique(x)|	计算x的唯一值，并排序|
|intersect1d(x,y)|	计算x和y的交集，并排序|
|union1d(x,y)|	计算x和y的并集，并排序|
|in1d(x,y)|	计算x中的元素是否包含在y中，返回一个布尔值数组|
|setdiff1d(x,y)|	差集，在x中但不在y中的x元素|
|setxor1d(x,y)|	异或集，在x或y中，但不属于x、y交集的元素|