## Numpy怎样对数组排序

Numpy给数组排序的三个方法：  
* numpy.sort：返回排序后数组的拷贝
* array.sort：原地排序数组而不是返回拷贝
* numpy.argsort：间接排序，返回的是排序后的数字索引

3个方法都支持一个参数kind，可以是以下一个值：
* quicksort：快速排序，平均O(nlogn)，不稳定情况
* mergesort：归并排序，平均O(nlogn)，稳定排序
* heapsort：堆排序，平均O(nlogn)，不稳定排序
* stable：稳定排序

kind默认值是quicksort，快速排序平均情况是最快，保持默认即可

In [1]:
import numpy as np

### 1. np.sort返回排序后的数组

In [2]:
arr = np.array([3, 2, 4, 5, 1, 9, 7, 8, 6])

In [3]:
# 返回拷贝后的数组
np.sort(arr)

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [4]:
arr

array([3, 2, 4, 5, 1, 9, 7, 8, 6])

### 2. array.sort进行原地排序

In [5]:
arr2 = arr.copy()

In [6]:
arr2

array([3, 2, 4, 5, 1, 9, 7, 8, 6])

In [7]:
arr2.sort()

In [8]:
arr2

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

### 3. np.argsort 返回的是有序数字的索引

In [9]:
arr

array([3, 2, 4, 5, 1, 9, 7, 8, 6])

In [10]:
# 获得排序元素对应的索引数字列表
indices = np.argsort(arr)
indices

array([4, 1, 0, 2, 3, 8, 6, 7, 5], dtype=int64)

In [11]:
# 可以直接获取对应的数据列表
arr[indices]

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

### 4. Python原生sorted与np.sort的性能对比

In [12]:
arr_np = np.random.randint(0, 100, 100*10000)

In [13]:
%timeit np.sort(arr_np)

24 ms ± 2.14 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [14]:
# 将numpy arr变成python list
arr_py = arr_np.tolist()

In [15]:
%timeit sorted(arr_py)

90.1 ms ± 726 µs per loop (mean ± std. dev. of 7 runs, 10 loops each)
