# [DataFrame 인덱스 다루기]
- (1) 새로운 인덱스 설정 : 컬럼 ==> 인덱스 설정

### (1~) 데이터 준비

In [39]:
# 1. 데이터 준비
import pandas as pd

# 2. 데이터 입력
exam = {'이름' :['갓기','현길', '시명', '주영'],
        '국어' : [60, 70, 100, 90],
        '미술' : [80, 20, 40, 80],
        '수학' : [90, 100, 90, 60],
        '체육' : [0, 30, 70, 50]}

# 3. 데이터 저장
examDF = pd.DataFrame(exam)
examDF

Unnamed: 0,이름,국어,미술,수학,체육
0,갓기,60,80,90,0
1,현길,70,20,100,30
2,시명,100,40,90,70
3,주영,90,80,60,50


### (5-1) 새로운 인덱스 설정 - 방법 1 : 인덱스 일부 변경 DF.rename()

In [40]:
# 1. 행 인덱스 일부 변경 => {기존 인덱스:새로운 인덱스}
# .rename(index={_old:_new}, [inplace=False])
examDF.rename(index={0:'zero'})

Unnamed: 0,이름,국어,미술,수학,체육
zero,갓기,60,80,90,0
1,현길,70,20,100,30
2,시명,100,40,90,70
3,주영,90,80,60,50


In [41]:
examDF    # inplace=False : 기본적으로 원본을 건들지 않는다

Unnamed: 0,이름,국어,미술,수학,체육
0,갓기,60,80,90,0
1,현길,70,20,100,30
2,시명,100,40,90,70
3,주영,90,80,60,50


In [42]:
# inplace=True : 원본 자체를 바꿔버린다!
# 기본은 변경 안하는 것
examDF.rename(index={0:'zero'}, inplace=True)
examDF

Unnamed: 0,이름,국어,미술,수학,체육
zero,갓기,60,80,90,0
1,현길,70,20,100,30
2,시명,100,40,90,70
3,주영,90,80,60,50


In [43]:
# 2. 열 이름 인덱스 일부 변경 => columns ={_old:_new}
examDF.rename(columns={'체육':'음악'}, inplace=True)
examDF.columns

Index(['이름', '국어', '미술', '수학', '음악'], dtype='object')

### (5-2) 새로운 인덱스 설정 - 방법 2 : .set_index ; 기존 열을 인덱스로 만들기
- .set_index(['col'])    => 이러면 여러 열을 인덱스로 할 수 있다
- .set_index('col')

In [44]:
# 1. 1개 컬럼을 인덱스로 설정. 단, inplace=False : 원본 적용 안됨
examDF.set_index(['이름'])

Unnamed: 0_level_0,국어,미술,수학,음악
이름,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
갓기,60,80,90,0
현길,70,20,100,30
시명,100,40,90,70
주영,90,80,60,50


In [45]:
examDF.set_index('이름')

Unnamed: 0_level_0,국어,미술,수학,음악
이름,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
갓기,60,80,90,0
현길,70,20,100,30
시명,100,40,90,70
주영,90,80,60,50


In [46]:
# 여러 열을 인덱스로 만들기 => 가능!
# 사용 예: 성, 이름
examDF.set_index(['이름','국어'])

Unnamed: 0_level_0,Unnamed: 1_level_0,미술,수학,음악
이름,국어,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
갓기,60,80,90,0
현길,70,20,100,30
시명,100,40,90,70
주영,90,80,60,50


In [47]:
examDF.set_index('이름','수학')

  examDF.set_index('이름','수학')


Unnamed: 0_level_0,국어,미술,수학,음악
이름,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
갓기,60,80,90,0
현길,70,20,100,30
시명,100,40,90,70
주영,90,80,60,50


In [48]:
# 복수 인덱스의 호출 : 모두 불러야 호출된다

examDF2 = examDF.set_index(['이름','국어'])
# examDF.loc['갓기']
examDF2.loc[('갓기',60)]

미술    80
수학    90
음악     0
Name: (갓기, 60), dtype: int64

In [49]:
# 하나만 호출 : 나머지 멀티 인덱스가 포함된 데이터프레임으로 출력
# -> 성능에 좋지 않음
examDF2.loc['갓기']

Unnamed: 0_level_0,미술,수학,음악
국어,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
60,80,90,0


In [None]:
# 맨 앞 인덱스가 아니면: 오류 발생
# -> 맨 앞 인덱스부터 찾기 때문
# examDF2.loc[60]

### (5-3) 새로운 인덱스 설정 방법 3: 인덱스 리셋

In [51]:
# .reset_index( [inplace=False] )
# => 현재 행 인덱스를 컬럼으로 추가
examDF.reset_index(inplace=True)
examDF

Unnamed: 0,index,이름,국어,미술,수학,음악
0,zero,갓기,60,80,90,0
1,1,현길,70,20,100,30
2,2,시명,100,40,90,70
3,3,주영,90,80,60,50


In [52]:
# .reset_index 는 인덱스를 밀어 넣는 것: 0~ 의 인덱스를 열에 계속 추가
examDF.reset_index().reset_index()  # 엥 다시하니까 왜 오류 나지

ValueError: cannot insert level_0, already exists

In [53]:
# drop=True : 인덱스를 리셋하면서 열로 넣지 않음
df2 = examDF.reset_index(drop=True)
df2

Unnamed: 0,index,이름,국어,미술,수학,음악
0,zero,갓기,60,80,90,0
1,1,현길,70,20,100,30
2,2,시명,100,40,90,70
3,3,주영,90,80,60,50
