# Pandas 排序

Pandas 有两种排序方式，分别是:

* 按标签
* 按实际值

In [2]:
import pandas as pd
import numpy as np

unsorted_df = pd.DataFrame(np.random.randn(10, 2),
                           index=[1, 4, 6, 2, 3, 5, 9, 8, 0, 7],
                           columns=['col2', 'col1'])
print(unsorted_df)

       col2      col1
1  1.217415 -0.943138
4 -0.904086 -0.405699
6 -0.827520 -0.689838
2  0.751256 -0.281404
3 -0.965675 -0.805068
5  0.219396  0.904536
9  0.305055 -0.953440
8 -1.438967 -0.774550
0 -0.436537  0.020784
7 -0.556014  0.497264


## 按标签排序

使用 sort_index() 方法， 通过传递 axis 参数和排序顺序，可以对 DataFrame 进行排序，默认情况下，按照升序对行标签进行排序。

In [3]:
sorted_df = unsorted_df.sort_index()
print(sorted_df)

       col2      col1
0 -0.436537  0.020784
1  1.217415 -0.943138
2  0.751256 -0.281404
3 -0.965675 -0.805068
4 -0.904086 -0.405699
5  0.219396  0.904536
6 -0.827520 -0.689838
7 -0.556014  0.497264
8 -1.438967 -0.774550
9  0.305055 -0.953440


In [4]:
# 排序顺序，通过将布尔值传递给升序参数，可以控制排序顺序。
sorted_df = unsorted_df.sort_index(ascending=False)
print(sorted_df)

       col2      col1
9  0.305055 -0.953440
8 -1.438967 -0.774550
7 -0.556014  0.497264
6 -0.827520 -0.689838
5  0.219396  0.904536
4 -0.904086 -0.405699
3 -0.965675 -0.805068
2  0.751256 -0.281404
1  1.217415 -0.943138
0 -0.436537  0.020784


In [5]:
# 按列排列，通过传递 axis 参数值为 0 或 1 , 
# 可以对列标签进行排序。默认情况下， axis = 0, 逐行排列。
sorted_df = unsorted_df.sort_index(axis=1)
print(sorted_df)

       col1      col2
1 -0.943138  1.217415
4 -0.405699 -0.904086
6 -0.689838 -0.827520
2 -0.281404  0.751256
3 -0.805068 -0.965675
5  0.904536  0.219396
9 -0.953440  0.305055
8 -0.774550 -1.438967
0  0.020784 -0.436537
7  0.497264 -0.556014


## 按值排序

像索引排序一样， sort_values() 是按值排序的方法，它接受一个 by 参数， 它将使用要与其排序值的 DataFrame 列名称

In [6]:
sorted_df = unsorted_df.sort_values(by='col1')
print(sorted_df)

       col2      col1
9  0.305055 -0.953440
1  1.217415 -0.943138
3 -0.965675 -0.805068
8 -1.438967 -0.774550
6 -0.827520 -0.689838
4 -0.904086 -0.405699
2  0.751256 -0.281404
0 -0.436537  0.020784
7 -0.556014  0.497264
5  0.219396  0.904536


### 排序算法

sort_values() 提供了从 mergesort, heapsort 和 quicksort 中选择一个算法， Mergesort 是唯一稳定的算法。

In [7]:
sorted_df = unsorted_df.sort_values(by='col1', kind='mergesort')
print(sorted_df)

       col2      col1
9  0.305055 -0.953440
1  1.217415 -0.943138
3 -0.965675 -0.805068
8 -1.438967 -0.774550
6 -0.827520 -0.689838
4 -0.904086 -0.405699
2  0.751256 -0.281404
0 -0.436537  0.020784
7 -0.556014  0.497264
5  0.219396  0.904536
