# pandas数据排序
Series的排序:
**`Series.sort_values(ascending=True, inplace=False)`**
参数说明:
- ascending: 默认True升序排序, 为False降序排序
- inplace: 是否修改原始Series


DataFrame的排序:
**`DataFrame.sort_values(by, ascending=True, inplace=False)`**
参数说明:
- by: 字符串或者List<字符串>, 单列排序或者多列排序
- ascending: bool或者List, 默认True升序排序, 为False降序排序, 如果是List对于by的多列
- inplace: 是否修改原始DataFrame

In [10]:
import pandas as pd

## 1.读取数据

In [11]:
fpath='./data/weather/weater_beijing.xlsx'
df = pd.read_excel(fpath)


In [12]:
df

Unnamed: 0,日期,最高温,最低温,天气,风力风向,空气质量指数
0,2011-01-01 周六,-2°,-7°,多云~阴,无持续风向微风,
1,2011-01-02 周日,-2°,-7°,多云,无持续风向微风,
2,2011-01-03 周一,-2°,-6°,多云~阴,西北风~北风3-4级~4-5级,
3,2011-01-04 周二,-2°,-9°,晴,北风5-6级,
4,2011-01-05 周三,-2°,-10°,晴,北风~无持续风向3-4级~微风,
...,...,...,...,...,...,...
4001,2021-12-27 周一,6°,-8°,晴,西北风1级,56 良
4002,2021-12-28 周二,6°,-5°,多云~晴,西北风1级,64 良
4003,2021-12-29 周三,5°,-5°,晴,西北风3级,43 优
4004,2021-12-30 周四,6°,-7°,晴,西北风3级,38 优


In [13]:
# 替换温度中的°并处理缺失值
# 第一种处理缺失值方式
df.loc[:, '最高温'] = df['最高温'].str.replace('°', '').replace('', '0')
df.loc[:, '最高温'] = df['最高温'].fillna('0')
df.loc[:, '最高温'] = df['最高温'].astype('int32')

In [14]:
df

Unnamed: 0,日期,最高温,最低温,天气,风力风向,空气质量指数
0,2011-01-01 周六,-2,-7°,多云~阴,无持续风向微风,
1,2011-01-02 周日,-2,-7°,多云,无持续风向微风,
2,2011-01-03 周一,-2,-6°,多云~阴,西北风~北风3-4级~4-5级,
3,2011-01-04 周二,-2,-9°,晴,北风5-6级,
4,2011-01-05 周三,-2,-10°,晴,北风~无持续风向3-4级~微风,
...,...,...,...,...,...,...
4001,2021-12-27 周一,6,-8°,晴,西北风1级,56 良
4002,2021-12-28 周二,6,-5°,多云~晴,西北风1级,64 良
4003,2021-12-29 周三,5,-5°,晴,西北风3级,43 优
4004,2021-12-30 周四,6,-7°,晴,西北风3级,38 优


In [15]:
# 第二种处理缺失值方式
df.loc[:, '最低温'] = df['最低温'].str.replace('°', '').replace('', '0')
df.loc[:, '最低温'] = df['最低温'].fillna({'最低温': '0'})
df.loc[:, '最低温'] = df['最低温'].astype('int32')

In [17]:
df

Unnamed: 0,日期,最高温,最低温,天气,风力风向,空气质量指数
0,2011-01-01 周六,-2,-7,多云~阴,无持续风向微风,
1,2011-01-02 周日,-2,-7,多云,无持续风向微风,
2,2011-01-03 周一,-2,-6,多云~阴,西北风~北风3-4级~4-5级,
3,2011-01-04 周二,-2,-9,晴,北风5-6级,
4,2011-01-05 周三,-2,-10,晴,北风~无持续风向3-4级~微风,
...,...,...,...,...,...,...
4001,2021-12-27 周一,6,-8,晴,西北风1级,56 良
4002,2021-12-28 周二,6,-5,多云~晴,西北风1级,64 良
4003,2021-12-29 周三,5,-5,晴,西北风3级,43 优
4004,2021-12-30 周四,6,-7,晴,西北风3级,38 优


## 2.1 Series排序

In [19]:
df['空气质量指数'].sort_values()

2863    100 良
3989    100 良
3749    100 良
2671    100 良
2346    100 良
        ...  
1809      NaN
1810      NaN
1811      NaN
1812      NaN
1813      NaN
Name: 空气质量指数, Length: 4006, dtype: object

In [22]:
df['空气质量指数'].sort_values(ascending=False)

2217    99 良
3524    99 良
2688    99 良
2413    99 良
1887    99 良
        ... 
1809     NaN
1810     NaN
1811     NaN
1812     NaN
1813     NaN
Name: 空气质量指数, Length: 4006, dtype: object

In [24]:
df['天气'].sort_values()

942             下午到夜间~阴有大雨到暴雨
926                下午到夜间~阴有阵雨
1265      下午到夜间阴转大雨~傍晚到夜间阴有大雨
1250    下午到夜间：中-大雨~傍晚到前半夜阴有中雨
901      下午到夜间：雾霾转大雨~傍晚-夜间：大雨
                ...          
1803                      霾~雾
1815                      霾~雾
1766                      霾~雾
2122                      霾~雾
1153             霾转阴~傍晚阴转零星小雨
Name: 天气, Length: 4006, dtype: object

## 2.2 DataFrame排序
- 2.2.1 单列排序

In [27]:
df.sort_values(by='最高温')

Unnamed: 0,日期,最高温,最低温,天气,风力风向,空气质量指数
1836,2016-01-23 周六,-11,-14,晴,北风5-6级,65 良
3638,2020-12-29 周二,-8,-13,多云~晴,西北风4级,56 良
3647,2021-01-07 周四,-7,-14,晴,西北风3级,34 优
1835,2016-01-22 周五,-6,-16,多云~晴,北风4-5级,24 优
721,2013-01-02 周三,-6,-14,晴间多云,北风4-5级,
...,...,...,...,...,...,...
3094,2019-07-04 周四,38,25,晴~多云,西南风2级,89 良
1641,2015-07-12 周日,38,25,晴,无持续风向微风,
2700,2018-06-05 周二,38,25,多云,西南风4-5级,94 良
2345,2017-06-15 周四,38,24,晴,南风1-2级,82 良


In [29]:
df.sort_values(by='最高温', ascending=False)

Unnamed: 0,日期,最高温,最低温,天气,风力风向,空气质量指数
1642,2015-07-13 周一,40,25,雷雨~晴,无持续风向微风,
3094,2019-07-04 周四,38,25,晴~多云,西南风2级,89 良
522,2012-06-17 周日,38,24,多云~晴,无持续风向微风,
1641,2015-07-12 周日,38,25,晴,无持续风向微风,
2345,2017-06-15 周四,38,24,晴,南风1-2级,82 良
...,...,...,...,...,...,...
1835,2016-01-22 周五,-6,-16,多云~晴,北风4-5级,24 优
721,2013-01-02 周三,-6,-14,晴间多云,北风4-5级,
3647,2021-01-07 周四,-7,-14,晴,西北风3级,34 优
3638,2020-12-29 周二,-8,-13,多云~晴,西北风4级,56 良


- 2.2.2 多列排序

In [31]:
# 按控制质量等级、最高温度排序, 默认升序
df.sort_values(by=['空气质量指数', '最高温'])

Unnamed: 0,日期,最高温,最低温,天气,风力风向,空气质量指数
3271,2019-12-28 周六,3,-7,晴~多云,东北风1级,100 良
3989,2021-12-15 周三,3,-4,多云~晴,东北风1级,100 良
2863,2018-11-15 周四,8,1,小雨~多云,北风3-4级,100 良
2093,2016-10-06 周四,19,14,小雨~小到中雨,无持续风向微风,100 良
3749,2021-04-19 周一,27,15,晴~多云,西南风2级,100 良
...,...,...,...,...,...,...
1643,2015-07-14 周二,37,24,雷雨,无持续风向微风,
522,2012-06-17 周日,38,24,多云~晴,无持续风向微风,
1232,2014-05-29 周四,38,23,晴间多云~多云转晴,无持续风向微风,
1641,2015-07-12 周日,38,25,晴,无持续风向微风,


In [33]:
# 两个字段都是降序
df.sort_values(by=['空气质量指数', '最高温'], ascending=False)

Unnamed: 0,日期,最高温,最低温,天气,风力风向,空气质量指数
2756,2018-07-31 周二,35,26,晴,南风1-2级,99 良
3054,2019-05-25 周六,35,20,多云~雷阵雨,东南风2级,99 良
2743,2018-07-18 周三,33,25,多云,南风1-2级,99 良
2688,2018-05-24 周四,31,17,晴,南风3-4级,99 良
3524,2020-09-06 周日,30,20,多云~雷阵雨,东南风2级,99 良
...,...,...,...,...,...,...
716,2012-12-28 周五,-4,-8,阴有轻雾转小雪~小雪转多云,无持续风向~北风微风~5-6级,
722,2013-01-03 周四,-4,-13,晴间多云~晴,无持续风向微风,
757,2013-02-07 周四,-4,-12,晴间多云,北风~无持续风向3-4级~微风,
711,2012-12-23 周日,-5,-11,晴间多云,北风~无持续风向3-4级~微风,


In [34]:
# 分别指定两个字段是升序和降序
df.sort_values(by=['空气质量指数', '最高温'], ascending=[True, False])

Unnamed: 0,日期,最高温,最低温,天气,风力风向,空气质量指数
2346,2017-06-16 周五,36,24,多云~阴,南风3-4级,100 良
3442,2020-06-16 周二,36,24,阴~多云,南风2级,100 良
2435,2017-09-13 周三,28,19,多云,东风1-2级,100 良
2671,2018-05-07 周一,28,13,晴,南风3-4级,100 良
3749,2021-04-19 周一,27,15,晴~多云,西南风2级,100 良
...,...,...,...,...,...,...
716,2012-12-28 周五,-4,-8,阴有轻雾转小雪~小雪转多云,无持续风向~北风微风~5-6级,
722,2013-01-03 周四,-4,-13,晴间多云~晴,无持续风向微风,
757,2013-02-07 周四,-4,-12,晴间多云,北风~无持续风向3-4级~微风,
711,2012-12-23 周日,-5,-11,晴间多云,北风~无持续风向3-4级~微风,
