# 07_데이터프레임 정렬
### 1. 정렬
- 데이터프레임을 정렬하려면 sort_index() 또는 sort_values() 함수를 이용  
- **sort_index()**는 행 또는 열의 이름으로 정렬  
        DataFrame.sort_index(*, axis=0, level=None, ascending=True,  
        inplace=False, kind='quicksort', na_position='last',  
        sort_remaining=True, ignore_index=False, key=None)
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.sort_index.html
- **sort_values()**는 값을 이용해서 정렬
        DataFrame.sort_values(by, *, axis=0, ascending=True, inplace=False,
        kind='quicksort', na_position='last', ignore_index=False, key=None)
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.sort_values.html

### 2. 행 이름으로 정렬
- **sort_index()** : 데이터프레임의 행 이름을 이용해서 정렬

In [1]:
import seaborn as sns
import pandas as pd

In [2]:
iris = sns.load_dataset('iris')

In [3]:
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
0,5.1,3.5,1.4,0.2,setosa
1,4.9,3.0,1.4,0.2,setosa
2,4.7,3.2,1.3,0.2,setosa
3,4.6,3.1,1.5,0.2,setosa
4,5.0,3.6,1.4,0.2,setosa


In [4]:
iris.sort_index().head()  # 이미 인덱스로 정렬되어있어 변화가 없음

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
0,5.1,3.5,1.4,0.2,setosa
1,4.9,3.0,1.4,0.2,setosa
2,4.7,3.2,1.3,0.2,setosa
3,4.6,3.1,1.5,0.2,setosa
4,5.0,3.6,1.4,0.2,setosa


In [5]:
# 행 이름으로 내림차순 정렬함
iris.sort_index(ascending=False).head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
149,5.9,3.0,5.1,1.8,virginica
148,6.2,3.4,5.4,2.3,virginica
147,6.5,3.0,5.2,2.0,virginica
146,6.3,2.5,5.0,1.9,virginica
145,6.7,3.0,5.2,2.3,virginica


### 3. 열 이름으로 열 순서 바꾸기
- axis=1 속성을 이용하면 열의 이름으로 열의 순서를 바꿈

In [6]:
iris.sort_index(axis=1).head()

Unnamed: 0,petal_length,petal_width,sepal_length,sepal_width,species
0,1.4,0.2,5.1,3.5,setosa
1,1.4,0.2,4.9,3.0,setosa
2,1.3,0.2,4.7,3.2,setosa
3,1.5,0.2,4.6,3.1,setosa
4,1.4,0.2,5.0,3.6,setosa


In [7]:
iris.sort_index(axis=1, inplace=True)  # 원본 객체가 변경

In [8]:
iris.head()

Unnamed: 0,petal_length,petal_width,sepal_length,sepal_width,species
0,1.4,0.2,5.1,3.5,setosa
1,1.4,0.2,4.9,3.0,setosa
2,1.3,0.2,4.7,3.2,setosa
3,1.5,0.2,4.6,3.1,setosa
4,1.4,0.2,5.0,3.6,setosa


### 4. 값으로 정렬
- 데이터프레임의 **값을 기준으로 정렬**하려면 **sort_values()**를 이용

In [9]:
iris = sns.load_dataset('iris')

In [10]:
iris.sort_values(by=['sepal_length'], inplace=True)  # by속성으로 정렬할 열 이름 지정(리스트 형식)

In [11]:
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
13,4.3,3.0,1.1,0.1,setosa
42,4.4,3.2,1.3,0.2,setosa
38,4.4,3.0,1.3,0.2,setosa
8,4.4,2.9,1.4,0.2,setosa
41,4.5,2.3,1.3,0.3,setosa


- 여러 열을 이용해서 정렬하고 싶을 때는 리스트 형식으로 지정

In [12]:
iris.sort_values(by=['sepal_length', 'sepal_width']
                 , inplace=True)

In [13]:
iris.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species
13,4.3,3.0,1.1,0.1,setosa
8,4.4,2.9,1.4,0.2,setosa
38,4.4,3.0,1.3,0.2,setosa
42,4.4,3.2,1.3,0.2,setosa
41,4.5,2.3,1.3,0.3,setosa


### 5. 레벨로 정렬
- 열 이름 또는 행 이름에 레벨이 지정되어 있을 경우 레벨로 정렬

In [14]:
iris = sns.load_dataset('iris')

In [15]:
iris.columns = [['sepal', 'sepal', 'petal', 'petal', 'species'],
                iris.columns]
iris.columns.names = ['info', 'details']

In [16]:
iris.head()

info,sepal,sepal,petal,petal,species
details,sepal_length,sepal_width,petal_length,petal_width,species
0,5.1,3.5,1.4,0.2,setosa
1,4.9,3.0,1.4,0.2,setosa
2,4.7,3.2,1.3,0.2,setosa
3,4.6,3.1,1.5,0.2,setosa
4,5.0,3.6,1.4,0.2,setosa


In [17]:
iris.sort_index(level=['info'], axis=1).head()

info,petal,petal,sepal,sepal,species
details,petal_length,petal_width,sepal_length,sepal_width,species
0,1.4,0.2,5.1,3.5,setosa
1,1.4,0.2,4.9,3.0,setosa
2,1.3,0.2,4.7,3.2,setosa
3,1.5,0.2,4.6,3.1,setosa
4,1.4,0.2,5.0,3.6,setosa


In [18]:
iris.sort_index(level=0, axis=1).head()  # 가장 바깥 쪽이 level=0, 안쪽으로 들어올 수록 증가

info,petal,petal,sepal,sepal,species
details,petal_length,petal_width,sepal_length,sepal_width,species
0,1.4,0.2,5.1,3.5,setosa
1,1.4,0.2,4.9,3.0,setosa
2,1.3,0.2,4.7,3.2,setosa
3,1.5,0.2,4.6,3.1,setosa
4,1.4,0.2,5.0,3.6,setosa
