## 数组排序

In [1]:
from numpy import *

### sort 函数
先看这个例子：

In [2]:
names = array(['bob', 'sue', 'jan', 'ad'])
weights = array([20.8, 93.2, 53.4, 61.8])

sort(weights)

array([20.8, 53.4, 61.8, 93.2])

`sort` 返回的结果是从小到大排列的。

### argsort 函数
`argsort` 返回从小到大的排列在数组中的索引位置：

In [3]:
ordered_indices = argsort(weights)
ordered_indices

array([0, 2, 3, 1], dtype=int64)

In [4]:
weights[ordered_indices]

array([20.8, 53.4, 61.8, 93.2])

In [5]:
names[ordered_indices]

array(['bob', 'jan', 'ad', 'sue'], dtype='<U3')

使用函数并不会改变原来数组的值：

In [6]:
weights

array([20.8, 93.2, 53.4, 61.8])

### sort 和 argsort 方法
数组也支持方法操作：

In [7]:
data = array([20.8,  93.2,  53.4,  61.8])
data.argsort()

array([0, 2, 3, 1], dtype=int64)

`argsort` 方法与 `argsort` 函数的使用没什么区别，也不会改变数组的值。

In [8]:
data

array([20.8, 93.2, 53.4, 61.8])

但是 sort方法会改变数组的值：

In [9]:
data.sort()

In [10]:
data

array([20.8, 53.4, 61.8, 93.2])

### 二维数组排序
对于多维数组，sort方法默认沿着最后一维开始排序：

In [11]:
a = array([
        [.2, .1, .5],
        [.4, .8, .3],
        [.9, .6, .7]
    ])
a

array([[0.2, 0.1, 0.5],
       [0.4, 0.8, 0.3],
       [0.9, 0.6, 0.7]])

对于二维数组，默认相当于对每一行进行排序：

In [12]:
sort(a)

array([[0.1, 0.2, 0.5],
       [0.3, 0.4, 0.8],
       [0.6, 0.7, 0.9]])

改变轴，对每一列进行排序：

In [13]:
sort(a, axis = 0)

array([[0.2, 0.1, 0.3],
       [0.4, 0.6, 0.5],
       [0.9, 0.8, 0.7]])

### searchsorted 函数

`searchsorted(sorted_array, values)`

searchsorted 接受两个参数，其中，第一个必需是已排序的数组。

In [14]:
sorted_array = linspace(0,1,5)
values = array([.1,.8,.3,.12,.5,.25])
sorted_array, values

(array([0.  , 0.25, 0.5 , 0.75, 1.  ]),
 array([0.1 , 0.8 , 0.3 , 0.12, 0.5 , 0.25]))

In [15]:
searchsorted(sorted_array, values)

array([1, 4, 2, 1, 2, 1], dtype=int64)

排序数组：

|  0   | 1  | 2  | 3  | 4  |
|  ----  | ----  | ----  | ----  | ----  |
|  0.0   | 0.25  | 0.5  | 0.75  | 1.0  |

数值：

|  值   | 0.1  | 0.8  | 0.3  | 0.12  | 0.5  | 0.25  |
|  ----  | ----  | ----  | ----  | ----  | ----  | ----  |
|  插入位置   | 1  | 4  | 2  | 1  | 2  | 1  |

`searchsorted` 返回的值相当于保持第一个数组的排序性质不变，将第二个数组中的值插入第一个数组中的位置：

例如 `0.1` 在 [0.0, 0.25) 之间，所以插入时应当放在第一个数组的索引 `1` 处，故第一个返回值为 `1`。

In [16]:
from numpy.random import rand
data = rand(100)
data.sort()
data

array([0.00812334, 0.01416101, 0.02111828, 0.02741476, 0.02825724,
       0.02839569, 0.037208  , 0.03967187, 0.04678097, 0.0593443 ,
       0.06091791, 0.07127188, 0.07535524, 0.07992699, 0.08503087,
       0.08586329, 0.08864384, 0.09476442, 0.09865343, 0.10007016,
       0.12128516, 0.13730472, 0.13975216, 0.14706749, 0.14769293,
       0.15347223, 0.16014143, 0.18473054, 0.19183789, 0.25072153,
       0.26256739, 0.27893197, 0.31292468, 0.32454478, 0.32660323,
       0.32866231, 0.34510823, 0.35301837, 0.38968036, 0.39802429,
       0.43162442, 0.43230638, 0.45293794, 0.47034826, 0.4722773 ,
       0.47422475, 0.47851657, 0.47864181, 0.48263502, 0.49708593,
       0.49992119, 0.5018384 , 0.50661636, 0.51511929, 0.53449656,
       0.53807727, 0.54936396, 0.55948835, 0.56465362, 0.58199602,
       0.58208579, 0.58964756, 0.62244904, 0.62404039, 0.65201543,
       0.66496216, 0.68212165, 0.68678241, 0.6945958 , 0.70208736,
       0.70479017, 0.70570828, 0.71145908, 0.72993488, 0.74027

不加括号，默认是元组：

In [17]:
bounds = .4, .6
bounds

(0.4, 0.6)

返回这两个值对应的插入位置：

In [18]:
low_idx, high_idx = searchsorted(data, bounds)
low_idx, high_idx

(40, 62)

利用插入位置，将数组中所有在这两个值之间的值提取出来：

In [19]:
data[low_idx:high_idx]

array([0.43162442, 0.43230638, 0.45293794, 0.47034826, 0.4722773 ,
       0.47422475, 0.47851657, 0.47864181, 0.48263502, 0.49708593,
       0.49992119, 0.5018384 , 0.50661636, 0.51511929, 0.53449656,
       0.53807727, 0.54936396, 0.55948835, 0.56465362, 0.58199602,
       0.58208579, 0.58964756])