# Index 다루기

 - 인덱스의 일부 변경하는 경우

 - 특정 컬럼을 인덱스 설정하는 경우
 
 - 기존 인덱스에 새로 추가하는 경우
 
 - 0-base 인덱스로 리셋하는 경우

In [29]:
# 모듈 로딩
import pandas as pd

# DF 객체 생성
df=pd.DataFrame({'이름':['서준','우현','인아'],
                 '수학':[90,80,70],'영어':[98,89,95],
                 '음악':[85,95,100],'체육':[100,90,90]})
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 5 columns):
 #   Column  Non-Null Count  Dtype 
---  ------  --------------  ----- 
 0   이름      3 non-null      object
 1   수학      3 non-null      int64 
 2   영어      3 non-null      int64 
 3   음악      3 non-null      int64 
 4   체육      3 non-null      int64 
dtypes: int64(4), object(1)
memory usage: 248.0+ bytes


In [30]:
df

Unnamed: 0,이름,수학,영어,음악,체육
0,서준,90,98,85,100
1,우현,80,89,95,90
2,인아,70,95,100,90


In [31]:
# DF의 속성 읽기 -> index, columns, shape

print(f'df.index => {df.index}',f'df.columns =>{df.columns}', f'df.shape =>{df.shape}', sep='\n')

df.index => RangeIndex(start=0, stop=3, step=1)
df.columns =>Index(['이름', '수학', '영어', '음악', '체육'], dtype='object')
df.shape =>(3, 5)


# 특정 컬럼을 인덱스 설정 
 
 - 조건 : 중복 / NaN(Not a Number) : 빈칸 의미
 
 - 생성 : DF객체변수명.set_index('컬럼명', inplace=False) <- 기본값
          DF객체변수명.set_index(['컬럼명','] inplace=False) <- 기본값

In [32]:
# 이름 컬럼 => 행 인덱스 설정
df1=df.set_index('이름')
df1

Unnamed: 0_level_0,수학,영어,음악,체육
이름,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
서준,90,98,85,100
우현,80,89,95,90
인아,70,95,100,90


In [33]:
df

Unnamed: 0,이름,수학,영어,음악,체육
0,서준,90,98,85,100
1,우현,80,89,95,90
2,인아,70,95,100,90


In [34]:
df1.index

Index(['서준', '우현', '인아'], dtype='object', name='이름')

# 인덱스 초기화(리셋)

 - 기존의 컬럼 인덱스 => 컬럼 돌려주기
 
 - 메서드 : DF객체변수명.reset_index() => inplace=False 파라미터로 설정

In [35]:
df=df1.reset_index()
df

Unnamed: 0,이름,수학,영어,음악,체육
0,서준,90,98,85,100
1,우현,80,89,95,90
2,인아,70,95,100,90


In [36]:
# 행(Row) 추가
df.loc[3]=['서준',95,90,95,95]
df

Unnamed: 0,이름,수학,영어,음악,체육
0,서준,90,98,85,100
1,우현,80,89,95,90
2,인아,70,95,100,90
3,서준,95,90,95,95


In [37]:
# 특정 컬럼 인덱스로 설정
df2=df.set_index(['이름','수학'])
df2

Unnamed: 0_level_0,Unnamed: 1_level_0,영어,음악,체육
이름,수학,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
서준,90,98,85,100
우현,80,89,95,90
인아,70,95,100,90
서준,95,90,95,95


# 인덱스 재배열 설정

 - 기존 인덱스에 변경을 가하는 것
 
 - 원본 적용 inplace=False 기본값
 
 - 메서드 : DF객체변수명.reindex([인덱스 리스트, fill_value=값)

In [38]:
df2

Unnamed: 0_level_0,Unnamed: 1_level_0,영어,음악,체육
이름,수학,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
서준,90,98,85,100
우현,80,89,95,90
인아,70,95,100,90
서준,95,90,95,95


In [40]:
df1=df.reindex([0,1,2,3,4,5])
df1

Unnamed: 0,이름,수학,영어,음악,체육
0,서준,90.0,98.0,85.0,100.0
1,우현,80.0,89.0,95.0,90.0
2,인아,70.0,95.0,100.0,90.0
3,서준,95.0,90.0,95.0,95.0
4,,,,,
5,,,,,


In [43]:
df1=df.reindex([0,'a'], fill_value=0)
df1.shape

(2, 5)

In [44]:
df1

Unnamed: 0,이름,수학,영어,음악,체육
0,서준,90,98,85,100
a,0,0,0,0,0


# 인덱스 & 컬럼 일부분 변경

 - 기존 인덱스/컬럼 일부분 변경하는 메서드
 
 - DF객체변수명.rename(index={기존:새}, columns={기존:새}, inplace=False)
   - 인덱스명 일부 변경 => DF객체변수명.rename(index={기존:새, 기존:새,...})
   - 컬럼명 일부 변경 => DF객체변수명.rename(columns={기존:새, 기존:새,...})

In [45]:
df

Unnamed: 0,이름,수학,영어,음악,체육
0,서준,90,98,85,100
1,우현,80,89,95,90
2,인아,70,95,100,90
3,서준,95,90,95,95


In [52]:
# 수학 => MATH, 음악 => MUSIC 으로 변경

df.rename(columns={'수학':'MATH','음악':'MUSIC'})

Unnamed: 0,이름,MATH,영어,MUSIC,체육
0,서준,90,98,85,100
1,우현,80,89,95,90
2,인아,70,95,100,90
3,서준,95,90,95,95
