In [17]:
import pandas as pd 
import numpy as np 

# 1. Stack & Unstack 
# 멀티 인덱스 만들기
# 튜플의 list를 이용해서 멀티 인덱스 만들기 
mul_index = pd.MultiIndex.from_tuples([('cust_1', '2015'),('cust_1','2016'),
                                        ('cust_2','2015'),('cust_2','2016')])

print(mul_index)

MultiIndex([('cust_1', '2015'),
            ('cust_1', '2016'),
            ('cust_2', '2015'),
            ('cust_2', '2016')],
           )


In [18]:
# 데이터 프레임 만들기
data = pd.DataFrame(data=np.arange(16).reshape(4,4),
                    index=mul_index,
                    columns=['prd_1', 'prd_2','prd_3','prd_4'])

print(data)

prd_1  prd_2  prd_3  prd_4
cust_1 2015      0      1      2      3
       2016      4      5      6      7
cust_2 2015      8      9     10     11
       2016     12     13     14     15


In [19]:
# 컬럼들을 인덱스로 설정 - stack 
# 모든 열을 세로 방향으로 세워서 하나의 열로 만든다. 
# index는 1개의 Level이 더 많아 진다. 
data_stacked = data.stack()
print(data_stacked)

cust_1  2015  prd_1     0
              prd_2     1
              prd_3     2
              prd_4     3
        2016  prd_1     4
              prd_2     5
              prd_3     6
              prd_4     7
cust_2  2015  prd_1     8
              prd_2     9
              prd_3    10
              prd_4    11
        2016  prd_1    12
              prd_2    13
              prd_3    14
              prd_4    15
dtype: int64


In [20]:
# unstack은 데이터를 가로 방향으로 늘어뜨리는 것
# level 옵션을 이용해서 원하는 만큼만 열로 만들 수 있다.
# 지금같은 경우는 index가 3가지 이므로 0,1,2 가능 
print(data_stacked.unstack(level=0))
print()
print(data_stacked.unstack(level=2))
print()
print(data_stacked.unstack(level=2).unstack(level=1))

cust_1  cust_2
2015 prd_1       0       8
     prd_2       1       9
     prd_3       2      10
     prd_4       3      11
2016 prd_1       4      12
     prd_2       5      13
     prd_3       6      14
     prd_4       7      15

             prd_1  prd_2  prd_3  prd_4
cust_1 2015      0      1      2      3
       2016      4      5      6      7
cust_2 2015      8      9     10     11
       2016     12     13     14     15

       prd_1      prd_2      prd_3      prd_4     
        2015 2016  2015 2016  2015 2016  2015 2016
cust_1     0    4     1    5     2    6     3    7
cust_2     8   12     9   13    10   14    11   15


In [26]:
# 2. melt 

# 2개의 컬럼을 합쳐서 1개로 만들기 
# 남겨두고자 하는 컬럼의 list를 id_vars에 대입하면 
# 나머지 컬럼을 합쳐서 컬럼의 이름은 variable 
# 값은 value에 설정한다. 
print(data)
print()
print(pd.melt(data, id_vars=['prd_3','prd_4']))

prd_1  prd_2  prd_3  prd_4
cust_1 2015      0      1      2      3
       2016      4      5      6      7
cust_2 2015      8      9     10     11
       2016     12     13     14     15

   prd_3  prd_4 variable  value
0      2      3    prd_1      0
1      6      7    prd_1      4
2     10     11    prd_1      8
3     14     15    prd_1     12
4      2      3    prd_2      1
5      6      7    prd_2      5
6     10     11    prd_2      9
7     14     15    prd_2     13
