In [37]:
# 멀티인덱스(Multi-Index)

from pandas import DataFrame
import pandas as pd

data = [
    ['영업이익', '컨센서스', 1000, 1200],
    ['영업이익', '잠정치', 900, 1400],
    ['당기순이익', '컨센서스', 800, 900],
    ['당기순이익', '잠정치', 700, 800]
]

df = DataFrame(data=data)
df = df.set_index([0,1]) 
print(df)
df.index.names = ['재무연월', '']
df.columns = ['2020/06', '2020/09']
print(df)

# 밀티인덱스 인덱싱, 슬라이싱
print(df.loc['영업이익'])
print(df.loc['영업이익', '컨센서스'])
print(df.iloc[0])
print(df.iloc[0,0])
print(df.loc[('영업이익', '컨센서스'), '2020/06'])

print(df.loc[(slice(None), '컨센서스'), : ]) # 컨센서스 항목만 전체 슬라이싱
idx = pd.IndexSlice
print(df.loc[ idx[:,'컨센서스',], :]) # IndexSlice 사용 ['level0', 'level1', 'level2'] 형태로 지정

               2     3
0     1               
영업이익  컨센서스  1000  1200
      잠정치    900  1400
당기순이익 컨센서스   800   900
      잠정치    700   800
            2020/06  2020/09
재무연월                        
영업이익  컨센서스     1000     1200
      잠정치       900     1400
당기순이익 컨센서스      800      900
      잠정치       700      800
      2020/06  2020/09
                      
컨센서스     1000     1200
잠정치       900     1400
2020/06    1000
2020/09    1200
Name: (영업이익, 컨센서스), dtype: int64
2020/06    1000
2020/09    1200
Name: (영업이익, 컨센서스), dtype: int64
1000
1000
            2020/06  2020/09
재무연월                        
영업이익  컨센서스     1000     1200
당기순이익 컨센서스      800      900
            2020/06  2020/09
재무연월                        
영업이익  컨센서스     1000     1200
당기순이익 컨센서스      800      900


In [54]:
# 멀티컬럼(Multi-Column)

from pandas import DataFrame

data = [
    [1000, 900, 800, 700],
    [1200, 1400, 900, 800]
]

columns = [
    ['영업이익', '영업이익', '당기순이익', '당기순이익'],
    ['컨센서스', '잠정치', '컨센서스', '잠정치']
]

df = DataFrame(data = data, index = ['2020/06', '2020/09'], columns = columns)
print(df)

# 컬럼 개수가 많을 경우 MultiIndex의 from_product 함수 사용

import pandas as pd

level_0 = ['영업이익', '당기순이익']
level_1 = ['컨센서스', '잠정치']
idx = pd.MultiIndex.from_product([level_0, level_1])
print(idx)
print(idx.get_level_values(0))

# 응용
print()
columns = pd.MultiIndex.from_product([level_0, level_1])
df1 = DataFrame(data = data, index = ['2020/06', '2020/09'], columns = columns)
print(df1)

# 멀티컬럼 인덱싱, 슬라이싱
print()
print(df['영업이익']) 
print(df['영업이익', '컨센서스']) # 영업이익 컬럼의 컨센서스 컬럼 데이터 출력
print(df.loc['2020/06', '영업이익']) # 2020/06(행), 영업이익(열) 추출
print(df.loc['2020/06', ('영업이익', '컨센서스')])
print(df.loc['2020/06', (slice(None), '컨센서스')]) # 2020/06(행), level0 전체 컬럼 중 level1 컨센서스 컬럼 추출

# 멀티 컬럼 -> 멀티 인덱스 변환 (T속성, transpose)
print()
print(df.transpose()) # 데이터의 x/y축을 단순하게 변경하고 싶다면 사용
print(df.T)

         영업이익       당기순이익     
         컨센서스   잠정치  컨센서스  잠정치
2020/06  1000   900   800  700
2020/09  1200  1400   900  800
MultiIndex([( '영업이익', '컨센서스'),
            ( '영업이익',  '잠정치'),
            ('당기순이익', '컨센서스'),
            ('당기순이익',  '잠정치')],
           )
Index(['영업이익', '영업이익', '당기순이익', '당기순이익'], dtype='object')

         영업이익       당기순이익     
         컨센서스   잠정치  컨센서스  잠정치
2020/06  1000   900   800  700
2020/09  1200  1400   900  800

         컨센서스   잠정치
2020/06  1000   900
2020/09  1200  1400
2020/06    1000
2020/09    1200
Name: (영업이익, 컨센서스), dtype: int64
컨센서스    1000
잠정치      900
Name: 2020/06, dtype: int64
1000
영업이익   컨센서스    1000
당기순이익  컨센서스     800
Name: 2020/06, dtype: int64

            2020/06  2020/09
영업이익  컨센서스     1000     1200
      잠정치       900     1400
당기순이익 컨센서스      800      900
      잠정치       700      800
            2020/06  2020/09
영업이익  컨센서스     1000     1200
      잠정치       900     1400
당기순이익 컨센서스      800      900
      잠정치       700      800


In [95]:
# Stack / Unstack 

from pandas import DataFrame
import pandas as pd

data = [
    [1000, 900, 800, 700],
    [1200, 1400, 900, 800],
]

level_0 = ['영업이익', '당기순이익']
level_1 = ['컨센서스', '잠정치']
columns = pd.MultiIndex.from_product([level_0, level_1])
df = DataFrame(data = data, index = ['2020/06', '2020/09'], columns = columns)
print(df)
print(df.stack(future_stack = True)) # 컬럼을 인덱스로 옮김
print(df.stack(level = 0, future_stack = True)) # 기본적으로 높은 레벨의 컬럼이 인덱스로 지정, but level 옵션으로 지정 가능
df = df.stack(future_stack =True).stack(future_stack = True) # 컬럼이 존재한다면 반복 가능
print(df)
print()

# 응용
data = [
    [1000,1100,900,1200,1300],
    [800,2000,1700,1500,1800]
]
index = ['자본금', '부채']
columns = ['2020/03', '2020/06', '2020/09', '2021/03', '2021/06']
df = DataFrame(data, index, columns)
print(df)
df_stacked = df.stack(future_stack = True).reset_index() # 컬럼을 2차원 인덱스로 만들고 다시 인덱스를 컬럼(값)으로 변경
print(df_stacked)
temp = df_stacked['level_1'].str.split('/') # level1컬럼을 선택하고 각각의 문자열에 split 메소드 적용 
print(temp)
df_split = DataFrame(list(temp)) # 리스트로 변환 후 데이터프레임 객체로 변환
print(df_split) 
df_merged = pd.concat([df_stacked,df_split], axis = 1) # df_stacked와 df_split 좌우로 합치기
df_merged.columns = ['계정', '년월', '금액', '연도', '월']
print(df_merged)
df_group = df_merged.groupby(['계정', '연도']).sum(numeric_only=True) # 계정과 연도 기준으로 묶어서 합산 출력 (numeric_only=True 자동으로 숫자만 반환)
print(df_group)
df_unstack = df_group.unstack() # unstack으로 인덱스 연도를 컬럼으로 변경
result = df_unstack['금액'] 
result.columns.name = ''
result.index.name = '' # 간소화
result

         영업이익       당기순이익     
         컨센서스   잠정치  컨센서스  잠정치
2020/06  1000   900   800  700
2020/09  1200  1400   900  800
              영업이익  당기순이익
2020/06 컨센서스  1000    800
        잠정치    900    700
2020/09 컨센서스  1200    900
        잠정치   1400    800
               컨센서스   잠정치
2020/06 영업이익   1000   900
        당기순이익   800   700
2020/09 영업이익   1200  1400
        당기순이익   900   800
2020/06  컨센서스  영업이익     1000
               당기순이익     800
         잠정치   영업이익      900
               당기순이익     700
2020/09  컨센서스  영업이익     1200
               당기순이익     900
         잠정치   영업이익     1400
               당기순이익     800
dtype: int64

     2020/03  2020/06  2020/09  2021/03  2021/06
자본금     1000     1100      900     1200     1300
부채       800     2000     1700     1500     1800
  level_0  level_1     0
0     자본금  2020/03  1000
1     자본금  2020/06  1100
2     자본금  2020/09   900
3     자본금  2021/03  1200
4     자본금  2021/06  1300
5      부채  2020/03   800
6      부채  2020/06  2000
7      부채  2020/09  170

Unnamed: 0,2020,2021
,,
부채,4500.0,3300.0
자본금,3000.0,2500.0
