### matplotlib.pyplot

- pd.NA , np.nan   ==> 서로 다른 결측치로 판다스는 인식 ==> 통일해야!!!

- rcParams --> resource configure Parameters ==> 기본값 세팅 모음
<!--                                         --> 기본값 설정 가능


### [남북한 발전 전력량 분석 및 시각화]

<br>
- 데이터셋      : 남북한 발전전력량.xlsx <br>
- 데이터구성<br>
                * 1990 ~ 2016년까지 수력,화력,원자력,신재생 에너지 데이터

- 분석          : 남한과 북한의 에너지 데이터 변화 분석

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

%matplotlib inline

In [None]:
file_path = r'C:\Users\KDP-43\Desktop\KDT_Pandas\과제\DATA\남북한발전전력량.xlsx'

In [None]:
# excel --> DF 저장
dataDF = pd.read_excel(file_path)

In [None]:
# 데이터 확인
dataDF.info()

##### 데이터 전처리 및 가공
- 전력량, 발전 전력별 칼럼 -> 멀티인덱스:  행 인덱스화<br>

- 전력량 컬럼의 NaN값 처리 방안 모색 

In [None]:
# [1] 컬럼의 NaN값 처리
dataDF.columns

In [None]:
dataDF[dataDF.columns[0]]

In [None]:
# NaN값을 '남한' '북한'으로 대체
dataDF[dataDF.columns[0]].ffill(inplace=True)

# FutureWanring
# dataDF[dataDF.columns[0]].fillna( method='ffill')

In [None]:
dataDF.head()

In [None]:
# [2] 2개 칼럼 행인덱스로 설정
dataDF.set_index( [dataDF.columns[0], dataDF.columns[1]],  inplace=True)

''' 
other ver.

dataDF.set_index( dataDF.columns[:2].to_list(), inplace=True )
'''

dataDF.head(10)

In [None]:
# 행 인덱스 names 속성 수정
idx_names = dataDF.index.names
print(idx_names,"\n")

dataDF.index.set_names( {idx_names[0] : "구분", idx_names[1] : "전력"}, inplace=True)
print(f'[확인]\n {dataDF.head()}')



In [None]:
dataDF.index

In [None]:
# "-" --> 결측치 <NA> --> 0 으로 변환

dataDF.replace("-", pd.NA, inplace=True)
print(f'[확인]\n {dataDF.head()}')

In [None]:
dataDF.isna().T.sum()

In [None]:
dataDF.fillna(0, inplace=True)
dataDF.isna().T.sum()

In [None]:
# object --> int16 형변환
dataDF = dataDF.astype('int16')
dataDF.dtypes

In [None]:
# 한글폰트 설정
from matplotlib import font_manager as fm, rc

# 적용 폰트 파일
FONT_FILE = r'C:\Windows\Fonts\malgun.ttf'

# 폰트 패밀리 이름 가져오기
font_name = fm.FontProperties(fname=FONT_FILE).get_name()

# 새로운 폰트 패밀리 이름 지정
rc( 'font', family = font_name )


In [None]:
# 폰트 설정 함수 선언

def set_customFont(font_path):
    from matplotlib import font_manager as fm
    from matplotlib import rc

    # 폰트 패밀리 이름 가져오기
    font_name = fm.FontProperties(fname=font_path).get_name()

    # 새로운 폰트 패밀리 이름 지정
    rc( 'font', family = font_name )

set_customFont(r'C:\Windows\Fonts\malgun.ttf')

In [None]:
# 범례 한글 패치
plt.rcParams['font.family'] ='Malgun Gothic'
plt.rcParams['axes.unicode_minus'] =False


label_1 = dataDF.index[0][0]
label_2 = dataDF.index[5][0]


plt.plot(dataDF.loc[ ('남한','합계')], label=label_1, ms=6)
plt.plot(dataDF.loc[ ('남한','합계')][::5], 'b^-')
plt.plot(dataDF.loc[ ('북한','합계')],  'r^-', label=label_2, ms=6)
plt.xlabel("년도")
plt.ylabel("합계 전력")
plt.legend()
plt.show()

In [None]:
# 그래프 plot 함수화
def drawLineGraph( title, columns, labels, xlable, ylabel, fms_list):
    
    # for col in columns:
    #      plt.plot(dataDF.loc[col], 'bo-', label=f'{col}' )

    #      plt.title(f'----[{title}]----')
    #      plt.xlabel(xlable)
    #      plt.ylabel(ylabel)
    #      plt.legend(labels)
    #      plt.show()

    for idx, col in enumerate(columns):
         plt.plot(dataDF.loc[col], fms_list[idx], label=labels[idx] )

    plt.title(f'----[{title}]----')
    plt.xlabel(xlable)
    plt.ylabel(ylabel)
    plt.legend()
    plt.show()
    

In [None]:
drawLineGraph( 'TEST', 
              [ ('남한','수력'), ('북한','수력'), ('남한','합계'), ('북한','합계') ], 
              [ '남한-수력', '북한-수력', '남한-합계', '북한-합계'],
              '년도','발전량',
              ['b^-', 'r*-', 'ko-', 'ms-'])

##### 하나의 Figure에 여러 개 그래프 넣기

In [None]:
## 하나의 figure 안에 수력,화력,원자력,합계 그래프넣기

# - figure 객체 생성
# - 생성된 figure 객체 안에 subplot 객체 생성
# * 그래프 표시 방식 지정:   
#                       가로/세로 각 몇개 넣을 지
# - 각 subplot에 그래프 넣기



In [None]:
# - figure 객체 생성
fig = plt.figure()

# - 생성된 figure 객체 안에 subplot 객체 생성
ax1 = fig.add_subplot(2,2,1)
ax2 = fig.add_subplot(2,2,2)
ax3 = fig.add_subplot(2,2,3)
ax4 = fig.add_subplot(2,2,4)

In [None]:
# - figure 객체 생성
fig = plt.figure()

# - 생성된 figure 객체 안에 subplot 객체 생성
ax1 = fig.add_subplot(2,2,1)
ax2 = fig.add_subplot(2,2,2)
ax3 = fig.add_subplot(2,2,3)
ax4 = fig.add_subplot(2,2,4)

# - 각 subplot에 그래프 넣기
ax1.plot( dataDF.loc[('남한','수력')], 'bo-', label='남한-수력')
ax2.plot( dataDF.loc[('남한','화력')], 'bo-', label='남한-화력')
ax3.plot( dataDF.loc[('남한','원자력')], 'bo-', label='남한-원자력')
ax4.plot( dataDF.loc[('남한','합계')], 'bo-', label='남한-합계')


# 각 subplot별 설정
ax1.set_title("-------남한 수력 발전량-------")
ax1.set_xlabel("년도")

ax2.set_title("-------남한 화력 발전량-------")
ax2.set_xlabel("년도")

ax3.set_title("-------남한 원자력 발전량-------")
ax3.set_xlabel("년도")

ax4.set_title("-------남한 합계 발전량-------")
ax4.set_xlabel("년도")

# 화면에 띄우기
plt.tight_layout()
# plt.legend()
plt.show()

In [None]:
# subplots() 객체 응용   --> axes 객체를 배열에 담아 반환
#                       --> 행단위로 axes 담아서 반환
#                       --> 반복문으로 subplot 값 할당

fig = plt.figure(figsize=(12,6))
axes = fig.subplots(1,4)

index_list = [('남한','수력'), ('남한','화력'), ('남한','원자력'),('남한','합계') ]
# dataDF.index.to_list()[:4]

fms_list = ['bo-','rs-', 'go-', 'ks--']

for idx in range(4):
    axes[idx].plot(dataDF.loc[index_list[idx]], fms_list[idx])
    axes[idx].set_title(f'{index_list[idx][0]} {index_list[idx][1]}량')

''' 
for idx, ax in enumerate(axes):
    ax.plot( dataDF.loc[ data[idx]], fmfs[idx] )
'''

# 전체 fig에 대한 제목 선언
fig.suptitle("남한의 에너지 발전량 변화 동향", fontsize=12)

# plot 출력
plt.tight_layout()
plt.show()


''' 
axes[0].plot(dataDF.loc[('남한','수력')], 'bo-')
axes[1].plot(dataDF.loc[('남한','화력')], 'bo-')
'''


In [None]:
print()
axes = fig.subplots(2,2)
print(axes, axes[0], axes[0,0])
