### [ 남북한발전전력량 분석 및 시각화]
- 데이터셋 : 남북한발전전력량.xlsx
- 데이터 구성 :
    - 1990년~2016년 수력, 화력, 원자력, 신재생 에너지 데이터
- 분석주제 : 남한과 북한의 에너지 데이터 변화 분석

In [None]:
# [1] 모듈 로딩
import pandas as pd
import matplotlib.pyplot as plt

In [None]:
# [2] 데이터 준비
file_name=r'C:\KDT\과제\pandas\0712-14 과제\남북한발전전력량.xlsx'

In [None]:
# [3] EXCEL => DataFrame 형태로 저장
dataDF=pd.read_excel(file_name)

In [None]:
dataDF.info()

In [None]:
# [5] 데이터 전처리 및 가공
# - 멀티인덱싱 : 컬럼 ==> 행인덱스 설정
# - (1) NaN컬럼에 대한 처리
# - (2) 두개의 컬럼을 행인덱스로 설정 

In [None]:
# - (1) NaN컬럼에 대한 처리
dataDF.columns

In [None]:
#dataDF['전력량 (억㎾h)']   << 혹시나 변경될때를 대비해 이름쓰는것 추천xxx
dataDF[dataDF.columns[0]].ffill(inplace=True)

In [None]:
dataDF

In [None]:
# - (2) 두개의 컬럼을 행인덱스로 설정 
dataDF.set_index([dataDF.columns[0],dataDF.columns[1]],inplace=True)
#dataDF.set_index(dataDF.columns[:2].to_list(),inplace=True)

In [None]:
# - 행 인덱스 names 속성 수정
idx_names=dataDF.index.names
dataDF.index.set_names({idx_names[0]:'구분',idx_names[1]:'전력'},inplace=True)   # 인덱스 정보수정 
dataDF

In [None]:
# 결측치 처리
# - '-' 를 Na로 치환후 0로 변환
dataDF.replace('-',pd.NA,inplace=True)
dataDF

In [None]:
dataDF.isna().T.sum()

In [None]:
# - NA 데이터값을 0으로 치환
dataDF.fillna(0,inplace=True)
dataDF

In [None]:
# 한글 폰트 설정 => 폰트 매니저 모듈 사용
from matplotlib import font_manager as fm
from matplotlib import rc

# 적용할 폰트 파일
Font_file=r'C:\Windows\Fonts\gulim.ttc'

# 폰트 패밀리 이름 가져오기
font_name=fm.FontProperties(fname=Font_file).get_name()

# 새로운 폰트 패밀리 이름지정
rc('font',family=font_name)

In [None]:
plt.plot(dataDF.loc[('남한','합계')],'bo-',label='S')
plt.plot(dataDF.loc[('북한','합계')],'ro-',label='N')
plt.title('[남북한 전력 발전량]')
plt.legend()
plt.xlabel('year')
plt.ylabel('Value')
plt.show()


In [None]:
def drawGraph(title,columns,xlabel,ylabel):
    for col in columns:
        plt.plot(dataDF.loc[col],'o-',label=f'{col}')
        
    plt.title(f'-----[{title}]-----')
    plt.legend()
    plt.xlabel(xlabel)
    plt.ylabel(ylabel)
    plt.show()


In [None]:
drawGraph('수력발전',[('남한','수력')],'연도','전력')

In [None]:
drawGraph('수력발전',[('남한','수력'),('북한','수력')],'연도','전력')

### 하나의 피규어에 여러개 그래프 넣기
- figure 객체 생성
- 생성된 figure 객체 안에 subplot 객체 생성
    * 그래프를 표시 방식 지정 : 가로/세로 몇개 그래프 넣을 지 지정
- subplot에 그래프를 넣기

In [None]:
# -> 하나의 Figure에서 수력/화력/원자력/합계 그래프 넣기
fig=plt.figure()

# - add_subplot(행수,열수,번호)
ax1=fig.add_subplot(2,2,1)
ax2=fig.add_subplot(2,2,2)
ax3=fig.add_subplot(2,2,3)
ax4=fig.add_subplot(2,2,4)

# - 각 subplot에 그래프 넣기
ax1.plot(dataDF.loc[('남한','수력')],'bo-',label='남한-수력')
ax2.plot(dataDF.loc[('남한','화력')],'bo-',label='남한-화력')
ax3.plot(dataDF.loc[('남한','원자력')],'bo-',label='남한-원자력')
ax4.plot(dataDF.loc[('남한','합계')],'bo-',label='남한-합계')

# - 각 subplot별로 설정
ax1.set_title('남한 - 수력발전')
ax1.set_xlabel('년도')
ax1.set_xticks([0,5,10,15,20,25])

ax2.set_title('남한 - 화력발전')
ax2.set_xlabel('년도')

ax3.set_title('남한 - 원자력발전')
ax3.set_xlabel('년도')

ax4.set_title('남한 - 전력발전합계')
ax4.set_xlabel('년도')

plt.tight_layout()

plt.legend()
plt.show()

In [None]:
# -> 하나의 Figure에서 수력/화력/원자력/합계 그래프 넣기
fig=plt.figure()

# - subplot 객체 생성 : subplots() => axes 객체를 배열에 담아서 반환
#                                  => 행단위로 axes 담아서 반환

# axes=fig.subplots(2,2)        # axes[0,1] 로 부를수있음!    
# print(axes)

axes=fig.subplots(1,4)
print(axes)

# # - subplot에 그래프 넣기
# axes[0].plot(dataDF.loc[('남한','수력')],'bo-',label='남한-수력')

# for i in range(4):                # 내코드
#     axes[i].plot(dataDF.iloc[i],'o-',label=dataDF.iloc[i].name)

datas=dataDF.index.to_list()[:4]
fmfs=['bo-','ro-','go-','ko-']
for idx,ax in enumerate(axes):
    ax.plot(dataDF.loc[datas[idx]],fmfs[idx])
    ax.set_title(datas[idx])


# - 전체 창 즉, figure 설정
fig.suptitle('남한의 에너지 발전량',fontsize=20)

plt.legend()
plt.tight_layout()
plt.show()