## 필수 패키지 설치

python의 pandas, xled, openpyxl 패키지를 설치 한다.
```bash
$ pip install pandas xlrd openpyxl 
```

In [58]:
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np

df = pd.read_excel('sample.xlsx')

df.head()

Unnamed: 0,Num,Date,Category,Deposit,Withdraw,Balance
0,1,2020-07-13,201,30000,0,30000
1,2,2020-07-14,204,220000,0,250000
2,3,2020-07-15,management rate,0,150000,100000
3,4,2020-07-16,303,300000,0,400000
4,5,2020-07-17,305,300000,0,700000


In [59]:
# 엑셀 파일의 Category 컬럼을 pandas에서 사용하는 astype("category")로 지정한다.
df['Category'] = df['Category'].astype("category")
# 텍스트로 입력된 Date를 pandas의 datetime 형식으로 변경한다.
df['Date'] = pd.to_datetime(df['Date'])
# DateMonth을 %Y-%m 형식으로 표시하고, astype("category")로 지정한다.
df['DateMonth'] = df['Date'].dt.strftime('%Y-%m').astype("category")


In [60]:

# 행은 'Category', 열은 'DateMonth', 값은 'Deposit'로 피벗을 만든다.
df_Deposit = df.pivot_table(index = ['Category'], columns = 'DateMonth', values = ['Deposit'], aggfunc=np.sum)
# csv파일로 저장한다.
df_Deposit.to_csv("./pivoted-Deposit-sample.csv", sep=",", encoding="utf-8")
print(df_Deposit)

                     Deposit                                             \
DateMonth            2020-07 2020-08  2020-09 2020-10  2020-11  2020-12   
Category                                                                  
101                  3400000  400000   400000  385000   800000   400000   
102                   300000       0  2300000       0   600000   300000   
103                   260000  260000   260000  520000   260000   260000   
104                        0  660000        0  440000        0   440000   
105                        0  280000   560000  560000        0   560000   
106                        0  600000   200000  200000   200000   200000   
201                    30000   60000    55500   30000    30000    30000   
202                   300000  300000  2300000  900000   300000  2300000   
203                        0       0        0  280000        0   280000   
204                   220000  800000   300000  600000        0  1340000   
205                   300

In [61]:
# 행은 'Category', 열은 'DateMonth', 값은 'Withdraw'로 피벗을 만든다.
df_Withdraw = df.pivot_table(index = ['Category'], columns = 'DateMonth', values = ['Withdraw'], aggfunc=np.sum)
# csv파일로 저장한다.
df_Withdraw.to_csv("./pivoted-Withdraw-sample.csv", sep=",", encoding="utf-8")
print(df_Withdraw)

                    Withdraw                                              \
DateMonth            2020-07  2020-08  2020-09 2020-10  2020-11  2020-12   
Category                                                                   
101                   400000        0        0       0        0        0   
102                        0  2060000        0  230000        0        0   
103                        0        0        0       0        0        0   
104                        0        0        0       0        0        0   
105                        0        0        0       0        0     5000   
106                        0        0        0       0        0        0   
201                        0        0    25500       0        0        0   
202                        0    50000  1812000       0        0  2000000   
203                        0        0        0       0   115000        0   
204                        0   890000        0       0        0   189000   
205         

In [62]:
df['Income'] = df['Deposit'] - df['Withdraw']

# 행은 'Category', 열은 'DateMonth', 값은 'Withdraw'로 피벗을 만든다.
df_Income = df.pivot_table(index = ['Category'], values = ['Income'], aggfunc=np.sum)
# csv파일로 저장한다.
df_Income.to_csv("./pivoted-Income-sample.csv", sep=",", encoding="utf-8")
print(df_Income)

                       Income
Category                     
101                  11571000
102                   6115000
103                   5145800
104                   5559764
105                   6146000
106                   4500000
201                   8147990
202                  10389000
203                   5285000
204                   5771000
205                   6765000
206                   5363260
301                  11205000
302                   6735000
303                   7197000
304                   5180000
305                   7037000
306                   5885000
electricity pricing   -133530
internet pricing     -2165130
management rate      -3000000
water rate           -2827390


In [63]:
#생성된 df 데이터프레임을 월별 Deposit, Withdraw만 표시하고  Num, Balance 컬럼은 삭제
df_group = df.groupby('DateMonth').sum().drop(['Num','Balance'],axis=1)
df_group['income'] = df_group['Deposit'] - df_group['Withdraw']

#print(df_group)#
