# 排序、搜索与数算

In [1]:
import numpy as np

In [2]:
np.__version__

'1.15.0'

In [3]:
author = 'kyubyong. longinglove@nate.com'

## 排序

 1. [ ] 沿着第二个轴对`x`进行排序。

In [5]:
x = np.array([[1,4],[3,1]])

out = np.sort(x, axis=1)
x.sort(axis=1)
assert np.array_equal(out, x)
out

array([[1, 4],
       [1, 3]])

 2. [ ] 对姓名对进行排序，然后返回其索引值（先姓后名）。

In [7]:
surnames =    ('Hertz',    'Galilei', 'Hertz')
first_names = ('Heinrich', 'Galileo', 'Gustav')

np.lexsort((surnames, first_names))

array([1, 2, 0])

 3. [ ] 沿着第二个轴排序`x`后返回索引值，即间接排序。

In [8]:
x = np.array([[1,4],[3,1]])

np.argsort(x, axis=1)

array([[0, 1],
       [1, 0]])

 4. [ ] 使用`x`中的第5个元素建立一个分割后的阵列副本。

In [62]:
x = np.random.permutation(10)
print("x =", x)
print("\n检查第五个元素之前的元素是否都小于第五元素，\
之后的元素都大于第五元素。\n\
设x = np.array([8,6,9,3,1,4,7,2,0,5]) 时，此项检查不成立！")
out = np.partition(x, 5)

x.partition(5) # 在x上进行内部等价改变支持评估验证
assert np.array_equal(x, out)
out

x = [2 9 6 1 0 7 3 8 4 5]

检查第五个元素之前的元素是否都小于第五元素，之后的元素都大于第五元素。
设x = np.array([8,6,9,3,1,4,7,2,0,5]) 时，此项检查不成立！


array([1, 0, 2, 4, 3, 5, 9, 8, 7, 6])

 5. [ ] 用`x`阵列中第3个元素建立一个分割后的阵列索引。

In [47]:
x = np.random.permutation(10)
print("x =", x)

partitioned = np.partition(x, 3)
indices = np.argpartition(x, 3)
assert np.array_equiv(x[indices], partitioned)
print("partitioned =", partitioned)
print("indices =", indices)

x = [4 5 6 8 9 1 2 0 3 7]
partitioned = [1 0 2 3 4 6 5 7 8 9]
indices = [5 7 6 8 0 2 1 9 3 4]


## 搜索

 1. [ ] 沿着`x`的第二个轴得到最大的值和最大值索引数，以及最小值和最小值索引数。

In [49]:
x = np.random.permutation(10).reshape(2, 5)
print("x =", x)
print("x中的最大值 =", np.max(x, 1))
print("最大值的索引数 =", np.argmax(x, 1))
print("x中的最小值 =", np.min(x, 1))
print("最小值的索引数 =", np.argmin(x, 1))

x = [[7 2 5 3 6]
 [8 9 0 1 4]]
x中的最大值 = [7 9]
最大值的索引数 = [0 1]
x中的最小值 = [2 0]
最小值的索引数 = [1 2]


 2. [ ] 忽略空值情况，沿着`x`的第二个轴得到最大的值和最大值索引数，以及最小值和最小值索引数。

In [50]:
x = np.array([[np.nan, 4, 2], [3, 2, 4]])
print("x中的最大值 =", np.nanmax(x, 1))
print("最大值的索引数 =", np.nanargmax(x, 1))
print("x中的最小值 =", np.nanmin(x, 1))
print("最小值的索引数 =", np.nanargmin(x, 1))

x中的最大值 = [4. 4.]
最大值的索引数 = [1 2]
x中的最小值 = [2. 2.]
最小值的索引数 = [2 1]


 3. [ ] 得到`x`中大于2的所有元素值和`x`中元素的索引数。

In [52]:
x = np.array([[1, 2, 3], [1, 3, 5]])

assert np.array_equiv(x[x>2], x[np.nonzero(x > 2)])
assert np.array_equiv(x[x>2], np.extract(x > 2, x))
print("x中大于2的元素值是 =", x[x>2])
print("x中元素的索引数是 ", np.nonzero(x > 2))

x中大于2的元素值是 = [3 3 5]
x中元素的索引数是  (array([0, 1, 1]), array([2, 1, 2]))


 4. [ ] 得到扁平化过的`x`中大于2的元素索引数。

In [54]:
x = np.array([[1, 2, 3], [1, 3, 5]])

assert np.array_equiv(np.flatnonzero(x), x.ravel().nonzero())
np.flatnonzero(x>2)

array([2, 4, 5])

 5. [ ] 检查`x`的元素，如果有小于0的元素就返回结果`0`，否则返回元素本身。

In [55]:
x = np.arange(-5, 4).reshape(3, 3)
np.where(x < 0, 0, x)

array([[0, 0, 0],
       [0, 0, 0],
       [1, 2, 3]])

 6. [ ] 把`y`的值插入到`x`中，还不影响排序。

In [59]:
x = [1, 3, 5, 7, 9]
y = [0, 4, 2, 6]

ind = np.searchsorted(x, y)
print("y里的元素要插入x时的索引位是 ", ind)
np.insert(x, ind, y)

y里的元素要插入x时的索引位是  [0 2 1 3]


array([0, 1, 2, 3, 4, 5, 6, 7, 9])

## 数算

 1. [ ] 数一数`x`里非0的元素数量有多少个？

In [61]:
x = [[0,1,7,0,0],[3,0,0,2,19]]

assert np.count_nonzero(x) == len(x[x!=0])
np.count_nonzero(x)

5