## Chapter 4. 인덱스

### 4.1. 인덱싱과 슬라이싱

#### 4.1.1. 대괄호 인덱싱

In [1]:
# 코드 4-1. 실습을 위한 데이터 프레임 생성
import pandas as pd
data1 = [[84, 74, 86, 83, 60, 78],
         [69, 60, 91, 60, 91, 76],
         [88, 89, 80, 62, 62, 60],
         [72, 87, 90, 61, 98, 99],
         [90, 88, 64, 62, 83, 69]]
df = pd.DataFrame(data1, index=['A', 'B', 'C', 'D', 'E'],
                  columns=['국어','영어','수학','사회','과학','불어'])
# 원본인 df는 두고 df를 복제한 df1를 생성 실습한다.
df1 = df.copy()
df1

Unnamed: 0,국어,영어,수학,사회,과학,불어
A,84,74,86,83,60,78
B,69,60,91,60,91,76
C,88,89,80,62,62,60
D,72,87,90,61,98,99
E,90,88,64,62,83,69


In [2]:
# 코드 4-2. 대괄호 인덱싱으로 국어 열을 시리즈로 추출
df1['국어']

A    84
B    69
C    88
D    72
E    90
Name: 국어, dtype: int64

In [3]:
# 코드 4-3. 대괄호 인덱싱으로 복수의 열을 추출하기
df1[['영어', '과학']]

Unnamed: 0,영어,과학
A,74,60
B,60,91
C,89,62
D,87,98
E,88,83


In [4]:
# 코드 4-4. 동일한 열을 여러 번 인덱싱하기
df1[['과학', '영어', '과학']]

Unnamed: 0,과학,영어,과학.1
A,60,74,60
B,91,60,91
C,62,89,62
D,98,87,98
E,83,88,83


In [5]:
# 코드 4-5. 대괄호 인덱싱으로 열의 순서 변경하기
df1[['과학', '영어', '수학', '사회', '불어', '국어']]

Unnamed: 0,과학,영어,수학,사회,불어,국어
A,60,74,86,83,78,84
B,91,60,91,60,76,69
C,62,89,80,62,60,88
D,98,87,90,61,99,72
E,83,88,64,62,69,90


대괄호에 존재하지 않는 열 이름을 입력해 출력하면 KeyError가 발생한다.

```python
df1['체육']
```
```python
KeyError: '체육'
```
df1에는 체육 열이 없으므로 KeyError가 발생한다

#### 4.1.2. 대괄호 인덱싱으로 열 생성하기

In [6]:
# 코드 4-6. 대괄호 인덱싱으로 열 생성하기
df1['체육'] = 'pass'
df1

Unnamed: 0,국어,영어,수학,사회,과학,불어,체육
A,84,74,86,83,60,78,pass
B,69,60,91,60,91,76,pass
C,88,89,80,62,62,60,pass
D,72,87,90,61,98,99,pass
E,90,88,64,62,83,69,pass


In [7]:
# 코드 4-7. 서로 다른 값을 부여해 열 생성하기
df1['도덕'] = [95, 87, 83, 91, 77]
df1

Unnamed: 0,국어,영어,수학,사회,과학,불어,체육,도덕
A,84,74,86,83,60,78,pass,95
B,69,60,91,60,91,76,pass,87
C,88,89,80,62,62,60,pass,83
D,72,87,90,61,98,99,pass,91
E,90,88,64,62,83,69,pass,77


In [8]:
# 코드 4-8. 복수의 열 생성하기
df1[['미술', '음악']] = 90
df1

Unnamed: 0,국어,영어,수학,사회,과학,불어,체육,도덕,미술,음악
A,84,74,86,83,60,78,pass,95,90,90
B,69,60,91,60,91,76,pass,87,90,90
C,88,89,80,62,62,60,pass,83,90,90
D,72,87,90,61,98,99,pass,91,90,90
E,90,88,64,62,83,69,pass,77,90,90


#### 4.1.3. 대괄호 인덱싱으로 열 수정하기

In [9]:
# 코드 4-9. 열 수정하기
df1['국어'] = 99
df1

Unnamed: 0,국어,영어,수학,사회,과학,불어,체육,도덕,미술,음악
A,99,74,86,83,60,78,pass,95,90,90
B,99,60,91,60,91,76,pass,87,90,90
C,99,89,80,62,62,60,pass,83,90,90
D,99,87,90,61,98,99,pass,91,90,90
E,99,88,64,62,83,69,pass,77,90,90


#### 4.1.4. 대괄호 슬라이싱

In [10]:
# 코드 4-10. df에서 B학생부터 D학생까지 추출하기
df['B':'D']

Unnamed: 0,국어,영어,수학,사회,과학,불어
B,69,60,91,60,91,76
C,88,89,80,62,62,60
D,72,87,90,61,98,99


#### 4.1.5. 키 인덱싱과 슬라이싱(loc 인덱서)

In [11]:
# 코드 4-11. df를 복제한 df2에서 A학생의 국어 성적 추출하기
df2 = df.copy()
df2.loc['A', '국어']

84

In [12]:
# 코드 4-12. loc 인덱서로 복수의 행과 열을 인덱싱하기
df2.loc[['A', 'C', 'D'], ['국어', '수학']]

Unnamed: 0,국어,수학
A,84,86
C,88,80
D,72,90


In [13]:
# 코드 4-13. B행부터 D행의 영어부터 과학 성적까지 추출하기
df2.loc['B': 'D', '영어': '과학']

Unnamed: 0,영어,수학,사회,과학
B,60,91,60,91
C,89,80,62,62
D,87,90,61,98


In [14]:
# 코드 4-14. 시작점이 처음이거나 끝 지점이 마지막이면 생략 가능
df2.loc['A':'D', '수학':'불어'] # 1도 가능하지만
df2.loc[:'D', '수학':] # 2처럼 생략도 가능하다

Unnamed: 0,수학,사회,과학,불어
A,86,83,60,78
B,91,60,91,76
C,80,62,62,60
D,90,61,98,99


In [15]:
# 코드 4-15. 모든 행을 가져온다면 행의 슬라이싱은 콜론(:)으로 대체 가능
df2.loc['A':'E', '수학':'과학'] # 1도 가능하지만
df2.loc[:, '수학':'과학'] # 2처럼 생략도 가능하다

Unnamed: 0,수학,사회,과학
A,86,83,60
B,91,60,91
C,80,62,62
D,90,61,98
E,64,62,83


In [16]:
# 코드 4-16. 모든 열을 가져온다면 열의 슬라이싱은 생략 가능
df2.loc[:'D', :] # 1처럼 콜론으로 생략도 가능하지만
df2.loc[:'D'] # 모든 열을 가져올 때 2처럼 열의 슬라이싱 전체를 생략 가능

Unnamed: 0,국어,영어,수학,사회,과학,불어
A,84,74,86,83,60,78
B,69,60,91,60,91,76
C,88,89,80,62,62,60
D,72,87,90,61,98,99


행을 전부 가져올 경우라도 행의 슬라이싱은 생략될 수 없다.
코드 4-15처럼 사용해야 한다.

```python
df2.loc['수학':'과학'] # X
df2.loc[:, '수학':'과학'] # O
```

In [17]:
# 코드 4-17. 인덱싱과 슬라이싱은 열과 행에 각각 적용 가능
df2.loc[:'D', ['과학', '수학']]

Unnamed: 0,과학,수학
A,60,86
B,91,91
C,62,80
D,98,90


#### 4.1.6. loc 인덱서로 열과 행 생성하기

In [18]:
# 코드 4-18. B와 D에게만 80을 부여한 실험 열 생성하기 (나머지는 NaN)
df2.loc[['B', 'D'], '실험'] = 80
df2

Unnamed: 0,국어,영어,수학,사회,과학,불어,실험
A,84,74,86,83,60,78,
B,69,60,91,60,91,76,80.0
C,88,89,80,62,62,60,
D,72,87,90,61,98,99,80.0
E,90,88,64,62,83,69,


In [19]:
# 코드 4-19. A의 과학 점수를 70점으로 수정하기
df2.loc['A', '과학'] = 70
df2

Unnamed: 0,국어,영어,수학,사회,과학,불어,실험
A,84,74,86,83,70,78,
B,69,60,91,60,91,76,80.0
C,88,89,80,62,62,60,
D,72,87,90,61,98,99,80.0
E,90,88,64,62,83,69,


In [20]:
# 코드 4-20. df2에 전 과목 점수가 60인 F학생의 데이터 생성하기
df2.loc['F'] = 60
df2

Unnamed: 0,국어,영어,수학,사회,과학,불어,실험
A,84,74,86,83,70,78,
B,69,60,91,60,91,76,80.0
C,88,89,80,62,62,60,
D,72,87,90,61,98,99,80.0
E,90,88,64,62,83,69,
F,60,60,60,60,60,60,60.0


#### 4.1.7. 로케이션 인덱싱과 슬라이싱 (iloc 인덱서)

In [21]:
# 코드 4-21. df를 복제한 df3로 A 학생의 국어 점수 로케이션 인덱싱하기
df3 = df.copy()
df3.iloc[0, 0]

84

In [22]:
# 코드 4-22. A, C, D 학생의 국어와 수학 성적을 가져오기
df3.iloc[[0, 2, 3], [0, 2]]

Unnamed: 0,국어,수학
A,84,86
C,88,80
D,72,90


In [23]:
# 코드 4-23. 행을 1:3, 열을 1:4로 슬라이싱하기
df3.iloc[1:3, 1:4]

Unnamed: 0,영어,수학,사회
B,60,91,60
C,89,80,62


In [24]:
# 코드 4-24. 행은 B부터 D, 열은 영어부터 과학까지 로케이션 슬라이싱하기
df3.iloc[1:4, 1:5]

Unnamed: 0,영어,수학,사회,과학
B,60,91,60,91
C,89,80,62,62
D,87,90,61,98


In [25]:
# 코드 4-25. 행은 A부터 D, 열은 수학부터 불어까지 로케이션 슬라이싱
df3.iloc[:4, 2:]

Unnamed: 0,수학,사회,과학,불어
A,86,83,60,78
B,91,60,91,76
C,80,62,62,60
D,90,61,98,99


In [26]:
# 코드 4-26. 첫 행을 시리즈로 추출하기
df3.iloc[0]

국어    84
영어    74
수학    86
사회    83
과학    60
불어    78
Name: A, dtype: int64

In [27]:
# 코드 4-27. 마지막 행을 시리즈로 추출하기 (음의 로케이션)
df3.iloc[-1]

국어    90
영어    88
수학    64
사회    62
과학    83
불어    69
Name: E, dtype: int64

In [28]:
# 코드 4-28. 행은 슬라이싱, 열은 인덱싱하기
df3.iloc[1:4 , [-2, 3, -2]]

Unnamed: 0,과학,사회,과학.1
B,91,60,91
C,62,62,62
D,98,61,98


#### 4.1.8. 인덱싱과 슬라이싱 정리

### 4.2. 데이터를 추출하는 함수들

#### 4.2.1. 행과 열 삭제하기 (drop)

In [29]:
# 코드 4-29. drop 함수 실습 예제 코드
import pandas as pd
data1 = [[95, 65, 82], [84, 83, 76], [91, 88, 69], [91, 67, 90]]
idx = ['A', 'B', 'C', 'D']
cols = columns=['국어', '영어', '수학']
df = pd.DataFrame(data1, index=idx, columns=cols)
df

Unnamed: 0,국어,영어,수학
A,95,65,82
B,84,83,76
C,91,88,69
D,91,67,90


In [30]:
# 코드 4-30. df에서 영어 열 삭제
df.drop('영어', axis=1)

Unnamed: 0,국어,수학
A,95,82
B,84,76
C,91,69
D,91,90


In [31]:
# 코드 4-31. df에서 영어와 수학 열 삭제
df.drop(['영어', '수학'], axis=1)

Unnamed: 0,국어
A,95
B,84
C,91
D,91


In [32]:
# 코드 4-32. drop 함수와 인덱싱 실습 예제 코드
data2 = {'이름': ['김판다', '강승주', '권보아', '임재범'],
         '국어점수': [88, 81, 89, 79], '영어점수': [68, 82, 84, 80],
         '수학점수': [75, 80, 84, 89], '과학점수': [75.5, 62, 82, 89],
         '성별': ['남', '여', '여', '남'], '반': ['A', 'B', 'A', 'B'],
         '전형': ['수시', '수시', '정시', '정시']}
df1 = pd.DataFrame(data2)
df1

Unnamed: 0,이름,국어점수,영어점수,수학점수,과학점수,성별,반,전형
0,김판다,88,68,75,75.5,남,A,수시
1,강승주,81,82,80,62.0,여,B,수시
2,권보아,89,84,84,82.0,여,A,정시
3,임재범,79,80,89,89.0,남,B,정시


In [33]:
# 코드 4-33. df1에서 이름과 성별 열을 제외하고 인덱싱하기
df1.loc[:, ['국어점수', '영어점수', '수학점수', '과학점수', '반', '전형']]

Unnamed: 0,국어점수,영어점수,수학점수,과학점수,반,전형
0,88,68,75,75.5,A,수시
1,81,82,80,62.0,B,수시
2,89,84,84,82.0,A,정시
3,79,80,89,89.0,B,정시


In [34]:
# 코드 4-34. df1에서 이름과 성별 열 삭제하기
df1.drop(['이름', '성별'], axis=1)

Unnamed: 0,국어점수,영어점수,수학점수,과학점수,반,전형
0,88,68,75,75.5,A,수시
1,81,82,80,62.0,B,수시
2,89,84,84,82.0,A,정시
3,79,80,89,89.0,B,정시


In [35]:
# 코드 4-35. 슬라이싱 후에 성별 열 삭제하기
df1.iloc[:, 1:7].drop(['과학점수'], axis=1)

Unnamed: 0,국어점수,영어점수,수학점수,성별,반
0,88,68,75,남,A
1,81,82,80,여,B
2,89,84,84,여,A
3,79,80,89,남,B


#### 4.2.2. 열 이름으로 필터링하기 (filter)

In [36]:
# 코드 4-36. filter 함수 실습 예제 코드
data1 = [[81, 80, 65, 62], [62, 88, 87, 78],
         [73, 71, 87, 66], [61, 63, 75, 78]]
df = pd.DataFrame(data1, columns=['국어', '영어', '수학', '고전국어'])
df

Unnamed: 0,국어,영어,수학,고전국어
0,81,80,65,62
1,62,88,87,78
2,73,71,87,66
3,61,63,75,78


In [37]:
# 코드 4-37. 열 이름에 국어를 포함하는 열만 필터링하기
df.filter(like='국어')

Unnamed: 0,국어,고전국어
0,81,62
1,62,78
2,73,66
3,61,78


In [38]:
# 코드 4-38. 코드32의 df1에서 열 이름에 점수가 포함된 열만 필터링하기
df1.filter(like='점수')

Unnamed: 0,국어점수,영어점수,수학점수,과학점수
0,88,68,75,75.5
1,81,82,80,62.0
2,89,84,84,82.0
3,79,80,89,89.0


#### 4.2.3. 자료형으로 열 선택하기 (select_dtypes)

In [39]:
# 코드 4-39. select_dtypes 함수 실습 예제 코드
data1 = {'이름': ['김판다', '강승주', '권보아', '임재범'],
         '국어': [81, 80, 65, 62], '영어': [62, 88.5, 87, 78],
         '성별': ['남', '여', '여', '남']}
df = pd.DataFrame(data1)
df

Unnamed: 0,이름,국어,영어,성별
0,김판다,81,62.0,남
1,강승주,80,88.5,여
2,권보아,65,87.0,여
3,임재범,62,78.0,남


In [40]:
# 코드 4-40. df의 자료형 확인하기
df.dtypes

이름     object
국어      int64
영어    float64
성별     object
dtype: object

In [41]:
# 코드 4-41. 정수인 열과 실수인 열만 추출
df.select_dtypes('int') # 자료형이 정수인 국어 열만 추출
df.select_dtypes('float') # 자료형이 실수인 영어 열만 추출

Unnamed: 0,영어
0,62.0
1,88.5
2,87.0
3,78.0


In [42]:
# 코드 4-42. 정수와 실수 등 수치형 데이터인 열만 추출하기
df.select_dtypes('number')

Unnamed: 0,국어,영어
0,81,62.0
1,80,88.5
2,65,87.0
3,62,78.0


In [43]:
# 코드 4-43. 실수 자료형인 열 제외하기
df.select_dtypes(exclude='float')

Unnamed: 0,이름,국어,성별
0,김판다,81,남
1,강승주,80,여
2,권보아,65,여
3,임재범,62,남


#### 4.2.4. 판다스의 함수와 원본 변경하기

In [44]:
# 코드 4-44. 코드 4-42의 함수 적용 결과로 원본 df를 변경하기
df = df.select_dtypes('number')
df

Unnamed: 0,국어,영어
0,81,62.0
1,80,88.5
2,65,87.0
3,62,78.0


### 엑셀 예제1. 타이타닉 침몰 사고 승객 데이터 인덱싱과 슬라이싱


In [45]:
# 코드 4-45. 타이타닉 엑셀파일에서 데이터 프레임 불러오기
import pandas as pd
pd.options.display.max_rows = 6 # 6행까지만 출력 코드
url1 = 'https://github.com/panda-kim/book1/blob/main/05titanic.xlsx?raw=true'
df_titanic = pd.read_excel(url1)
df_titanic

Unnamed: 0,PassengerId,Survived,Pclass,Name,Gender,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
0,1,0,3,"Braund, Mr. Owen Harris",male,22.0,1,0,A/5 21171,7.2500,,S
1,2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Th...",female,38.0,1,0,PC 17599,71.2833,C85,C
2,3,1,3,"Heikkinen, Miss. Laina",female,26.0,0,0,STON/O2. 3101282,7.9250,,S
...,...,...,...,...,...,...,...,...,...,...,...,...
888,889,0,3,"Johnston, Miss. Catherine Helen ""Carrie""",female,,1,2,W./C. 6607,23.4500,,S
889,890,1,1,"Behr, Mr. Karl Howell",male,26.0,0,0,111369,30.0000,C148,C
890,891,0,3,"Dooley, Mr. Patrick",male,32.0,0,0,370376,7.7500,,Q


In [46]:
# 코드 4-46. df_titanic의 컬럼즈 확인하기
df_titanic.columns

Index(['PassengerId', 'Survived', 'Pclass', 'Name', 'Gender', 'Age', 'SibSp',
       'Parch', 'Ticket', 'Fare', 'Cabin', 'Embarked'],
      dtype='object')

In [47]:
# 코드 4-47. 생존여부, 객실등급, 성별, 나이, 요금 열만 가져오기
cols = ['Survived', 'Pclass', 'Gender', 'Age', 'Fare']
df_titanic[cols]

Unnamed: 0,Survived,Pclass,Gender,Age,Fare
0,0,3,male,22.0,7.2500
1,1,1,female,38.0,71.2833
2,1,3,female,26.0,7.9250
...,...,...,...,...,...
888,0,3,female,,23.4500
889,1,1,male,26.0,30.0000
890,0,3,male,32.0,7.7500


In [48]:
# 코드 4-48. 수치형 데이터의 상위 100행만 가져오기
df_titanic.select_dtypes('number').iloc[:100]

Unnamed: 0,PassengerId,Survived,Pclass,Age,SibSp,Parch,Fare
0,1,0,3,22.0,1,0,7.2500
1,2,1,1,38.0,1,0,71.2833
2,3,1,3,26.0,0,0,7.9250
...,...,...,...,...,...,...,...
97,98,1,1,23.0,0,1,63.3583
98,99,1,2,34.0,0,1,23.0000
99,100,0,2,34.0,1,0,26.0000


### 4.3. 인덱스 클래스를 다루는 함수들

#### 4.3.1. 인덱스 설정하기(set_index)

In [49]:
# 코드 4-49. 실습 예제 코드
import pandas as pd
data = [['송중기', 70, 'A'], ['강승주', 80, 'A'],
        ['김판다', 93, 'B'], ['이예준', 92, 'B']]
df = pd.DataFrame(data, columns=['이름', '점수', '반'])
df1 = df.set_index('이름')
df2 = df.copy() # df를 복제한 df2
df

Unnamed: 0,이름,점수,반
0,송중기,70,A
1,강승주,80,A
2,김판다,93,B
3,이예준,92,B


In [50]:
# 코드 4-50. df의 이름 열을 인덱스로 설정하기
df.set_index('이름')

Unnamed: 0_level_0,점수,반
이름,Unnamed: 1_level_1,Unnamed: 2_level_1
송중기,70,A
강승주,80,A
김판다,93,B
이예준,92,B


In [51]:
# 코드 4-51. 복수의 열(반, 이름)을 인덱스로 설정하기
df.set_index(['반', '이름'])

Unnamed: 0_level_0,Unnamed: 1_level_0,점수
반,이름,Unnamed: 2_level_1
A,송중기,70
A,강승주,80
B,김판다,93
B,이예준,92


#### 4.3.2. 인덱스 리셋하기 (reset_index)

In [52]:
# 코드 4-52. 코드 4-49의 df1의 인덱스를 일반 열로 변환하기
df1.reset_index()

Unnamed: 0,이름,점수,반
0,송중기,70,A
1,강승주,80,A
2,김판다,93,B
3,이예준,92,B


In [53]:
# 코드 4-53. df1의 인덱스의 데이터를 완전히 삭제하기
df1.reset_index(drop=True)

Unnamed: 0,점수,반
0,70,A
1,80,A
2,93,B
3,92,B


#### 4.3.3. 인덱스 클래스 변경하기 (배정)

In [54]:
# 코드 4-54. df2의 컬럼즈를 Name, Score, Class로 변경하기 (배정)
df2.columns = ['Name', 'Score', 'Class']
df2

Unnamed: 0,Name,Score,Class
0,송중기,70,A
1,강승주,80,A
2,김판다,93,B
3,이예준,92,B


#### 4.3.4. 인덱스 클래스 변경하기 (set_axis)

In [55]:
# 코드 4-55. df의 컬럼즈를 Name, Score, Class로 변경하기 (set_axis)
df.set_axis(['Name', 'Score', 'Class'], axis=1)

Unnamed: 0,Name,Score,Class
0,송중기,70,A
1,강승주,80,A
2,김판다,93,B
3,이예준,92,B


#### 4.3.5. 열 이름 변경하기 (rename)

In [56]:
# 코드 4-56. 점수 열의 이름을 성적으로 변경하기
df.rename({'점수':'성적'}, axis=1)

Unnamed: 0,이름,성적,반
0,송중기,70,A
1,강승주,80,A
2,김판다,93,B
3,이예준,92,B


In [57]:
# 코드 4-57. 점수 열을 성적으로, 반 열을 소속으로 변경하기
df.rename({'점수':'성적', '반':'소속'}, axis=1)

Unnamed: 0,이름,성적,소속
0,송중기,70,A
1,강승주,80,A
2,김판다,93,B
3,이예준,92,B


#### 4.3.6. 매핑과 매퍼

#### 4.3.7. 데이터 재배열하기 (reindex)

In [58]:
# 코드 4-58. df의 열을 이름, 반, 성별 순으로 재배열
df.reindex(['이름', '반', '성별'], axis=1)

Unnamed: 0,이름,반,성별
0,송중기,A,
1,강승주,A,
2,김판다,B,
3,이예준,B,


#### 4.3.8. 인덱스명 변경하기 (rename_axis)


In [59]:
# 코드 4-59. df1에서 인덱스의 인덱스명 제거하기
df1.rename_axis(None)

Unnamed: 0,점수,반
송중기,70,A
강승주,80,A
김판다,93,B
이예준,92,B


#### 4.3.9. 인덱스 클래스를 리스트로 변환하기 (tolist)

In [60]:
# 코드 4-60. df의 컬럼즈를 리스트로 변환하기
df.columns.tolist()

['이름', '점수', '반']

### 4.4. 멀티 인덱스 소개

#### 4.4.1. 멀티 인덱스와 레벨

In [61]:
# 코드 4-61. 멀티 인덱스 실습 예제 코드
data1 = {('국어', '남'): {'1반': 10, '2반': 20},
         ('국어', '여'): {'1반': 30, '2반': 40},
         ('영어', '남'): {'1반': 15, '2반': 25},
         ('영어', '여'): {'1반': 35, '2반': 45}}
df = pd.DataFrame(data1)
df

Unnamed: 0_level_0,국어,국어,영어,영어
Unnamed: 0_level_1,남,여,남,여
1반,10,30,15,35
2반,20,40,25,45


In [62]:
# 코드 4-62. df의 멀티 인덱스 확인
df.columns

MultiIndex([('국어', '남'),
            ('국어', '여'),
            ('영어', '남'),
            ('영어', '여')],
           )

In [63]:
# 코드 4-63. df의 멀티 인덱스를 단일 인덱스로 변경하기
df.set_axis(['국어_남', '국어_여', '영어_남', '영어_여'], axis=1)

Unnamed: 0,국어_남,국어_여,영어_남,영어_여
1반,10,30,15,35
2반,20,40,25,45


#### 4.4.2. 멀티 인덱스의 구조 변경하기 (stack, unstack)

In [64]:
# 코드 4-64. stack 함수로 df의 구조 변경하기
df.stack()

Unnamed: 0,Unnamed: 1,국어,영어
1반,남,10,15
1반,여,30,35
2반,남,20,25
2반,여,40,45
