# NumPy 排序、条件刷选函数

NumPy 提供了多种排序的方法。 这些排序函数实现不同的排序算法，每个排序算法的特征在于执行速度，最坏情况性能，所需的工作空间和算法的稳定性。 下表显示了三种排序算法的比较。

种类 	             速度 	最坏情况 	工作空间 	稳定性
'quicksort'（快速排序） 	1 	    O(n^2)     	0 	     否
'mergesort'（归并排序） 	2 	   O(n*log(n)) 	 ~n/2 	    是
'heapsort' （堆排序） 	 3 	    O(n*log(n)) 	0 	     否

numpy.sort()
numpy.sort() 函数返回输入数组的排序副本。函数格式如下：
numpy.sort(a, axis, kind, order)
a: 要排序的数组
axis: 沿着它排序数组的轴，如果没有数组会被展开，沿着最后的轴排序， axis=0 按列排序，axis=1 按行排序
kind: 默认为'quicksort'（快速排序）
order: 如果数组包含字段，则是要排序的字段

In [4]:
import numpy as np

a = np.array([[3,7],[9,1]])
print("我们的数组是：")
print(a)
print("\n")
print("调用sort()函数：")
print(np.sort(a))
print("\n")
print("按列排序：")
print(np.sort(a,axis=0))
print("\n")
#在sort函数中排序字段
dt = np.dtype([("name","S10"),("age",int)])
a = np.array([("raju",21),("anil",25),("ravi",17),("amar",27)],dtype=dt)
print("我们的数组是：")
print(a)
print("\n")
print("按name排序：")
print(np.sort(a,order='name'))
print("\n")
print("按age排序：")
print(np.sort(a,order='age'))

我们的数组是：
[[3 7]
 [9 1]]


调用sort()函数：
[[3 7]
 [1 9]]


按列排序：
[[3 1]
 [9 7]]


我们的数组是：
[(b'raju', 21) (b'anil', 25) (b'ravi', 17) (b'amar', 27)]


按name排序：
[(b'amar', 27) (b'anil', 25) (b'raju', 21) (b'ravi', 17)]


按age排序：
[(b'ravi', 17) (b'raju', 21) (b'anil', 25) (b'amar', 27)]


numpy.argsort()
numpy.argsort() 函数返回的是数组值从小到大的索引值。

In [5]:
x = np.array([3,1,2])
print("我们的数组是：")
print(x)
print("\n")
print("对x调用argsort()函数：")
y = np.argsort(x)
print(y)
print("\n")
print("以排序后的顺序重构原数组：")
print(x[y])
print("\n")
print("使用循环重构原数组：")
for i in y:
    print(x[i],end='')

我们的数组是：
[3 1 2]


对x调用argsort()函数：
[1 2 0]


以排序后的顺序重构原数组：
[1 2 3]


使用循环重构原数组：
123

numpy.lexsort()
numpy.lexsort() 用于对多个序列进行排序。把它想象成对电子表格进行排序，每一列代表一个序列，排序时优先照顾靠后的列。

In [6]:
nm = ("raju","anil","ravi","amar")
dv = ("f.y","s.y","s.y","f.y")
ind = np.lexsort((dv,nm))
print("调用lexsort()函数：")
print(ind)
print("\n")
print("使用这个索引来获取排序后的数据：")
print([nm[i]+","+dv[i] for i in ind])

调用lexsort()函数：
[3 1 0 2]


使用这个索引来获取排序后的数据：
['amar,f.y', 'anil,s,y', 'raju,f.y', 'ravi,s.y']


In [9]:
#复数排序
a = np.sort_complex([5,3,6,2,1])
print(a)
print("\n")
print(np.sort_complex([1+2j,2-1j,3-2j,3-3j,3+5j]))

[1.+0.j 2.+0.j 3.+0.j 5.+0.j 6.+0.j]


[1.+2.j 2.-1.j 3.-3.j 3.-2.j 3.+5.j]


In [11]:
#partition()分区排序：
a = np.array([3,4,2,1])
print(np.partition(a,3))
#将数组a中所有的元素（包括重复数组）从小到大排列，3表示的是排序数组索引为3的数字
#，比该数字小的排在该数字前面，比这数字大的排在该数字后面
print(np.partition(a,(1,3)))#小于1的在前面，大于3的在后面，1和3的在中间

[2 1 3 4]
[1 2 3 4]


In [12]:
#找到数组的第3小（index=2）的值和第二大（index=-2)的值
arr = np.array([46,57,23,39,1,10,0,120])
print(arr[np.argpartition(arr,2)[2]])
print(arr[np.argpartition(arr,-2)[-2]])

10
57


In [14]:
#同时找到第3和第4小的值。
print(arr[np.argpartition(arr,[2,3])[2]])
print(arr[np.argpartition(arr,[2,3])[3]])

10
23


numpy.argmax() 和 numpy.argmin()
numpy.argmax() 和 numpy.argmin()函数分别沿给定轴返回最大和最小元素的索引。 

In [17]:
a = np.array([[30,40,70],[80,20,10],[50,90,60]])
print("我们的数组是：")
print(a)
print("\n")
print("调用argmax()函数：")
print(np.argmax(a))
print("\n")
print("展开数组：")
print(a.flatten())
print("\n")
print("沿轴0的最大索引：")
maxindex = np.argmax(a,axis=0)
print(maxindex)
print("\n")
print("沿轴1的最大索引：")
maxindex = np.argmax(a,axis=1)
print(maxindex)
print("\n")
print("调用argmin()函数：")
minindex = np.argmin(a)
print(minindex)
print("\n")
print("展开数组中的最小值：")
print(a.flatten()[minindex])
print("\n")
print("沿轴0的最小索引值：")
minindex = np.argmin(a,axis = 0)
print(minindex)
print("\n")
print("沿轴1的最小值索引：")
minindex = np.argmin(a,axis=1)
print(minindex)

我们的数组是：
[[30 40 70]
 [80 20 10]
 [50 90 60]]


调用argmax()函数：
7


展开数组：
[30 40 70 80 20 10 50 90 60]


沿轴0的最大索引：
[1 2 0]


沿轴1的最大索引：
[2 0 1]


调用argmin()函数：
5


展开数组中的最小值：
10


沿轴0的最小索引值：
[0 1 1]


沿轴1的最小值索引：
[0 2 0]


numpy.nonzero()
numpy.nonzero() 函数返回输入数组中非零元素的索引

In [18]:
a = np.array([[30,40,0],[0,20,10],[50,0,60]])
print("我们的数组是：")
print(a)
print('\n')
print("调用nonzero()函数：")
print(np.nonzero(a))

我们的数组是：
[[30 40  0]
 [ 0 20 10]
 [50  0 60]]


调用nonzero()函数：
(array([0, 0, 1, 1, 2, 2], dtype=int64), array([0, 1, 1, 2, 0, 2], dtype=int64))


numpy.where()
numpy.where() 函数返回输入数组中满足给定条件的元素的索引。

In [19]:
x = np.arange(9.).reshape(3,3)
print("我们的数组是：")
print(x)
print("大于3的元素索引：")
y = np.where(x>3)
print(y)
print("使用这些索引来获取满足条件的元素：")
print(x[y])

我们的数组是：
[[0. 1. 2.]
 [3. 4. 5.]
 [6. 7. 8.]]
大于3的元素索引：
(array([1, 1, 2, 2, 2], dtype=int64), array([1, 2, 0, 1, 2], dtype=int64))
使用这些索引来获取满足条件的元素：
[4. 5. 6. 7. 8.]


numpy.extract()
numpy.extract() 函数根据某个条件从数组中抽取元素，返回满条件的元素。

In [21]:
x = np.arange(9.).reshape(3,3)
print("我们的数组是：")
print(x)
#定义条件，选择偶数元素
condition = np.mod(x,2) == 0
print("按元素的条件值：")
print(condition)
print("使用条件提取元素：")
print(np.extract(condition,x))

我们的数组是：
[[0. 1. 2.]
 [3. 4. 5.]
 [6. 7. 8.]]
按元素的条件值：
[[ True False  True]
 [False  True False]
 [ True False  True]]
使用条件提取元素：
[0. 2. 4. 6. 8.]
