# 선 그래프

## - 불러올 패키지 목록

In [None]:
# 데이터 핸들링을 위한 패키지
import numpy as np
import pandas as pd

# 시각화를 위한 패키지
import seaborn as sb
import matplotlib.pyplot as plt

# %matplotlib inline 의 목적은 plt.show()함수가 호출되지 않은 경우에도 matplotlib 다이어그램을 렌더링하는 것이다.
# 그러나 현재 업데이트된 버전의 주피터 노트북 버전에서는 %matplotlib inline 를 사용하지 않더라도 Matplotlib 다이어그램을 개체로 표현한다.
# 따라서 굳이 필요하지는 않다. 그러나 코드를 깨끗하게 유지하고 자신이 만든 플롯을 호출하기 위해 여전히 관례적으로 권장된다.
%matplotlib inline

# 한글 폰트 설정
plt.rc('font', family='Malgun Gothic')

## 1. 데이터 전처리

In [None]:
# Excel 데이터를 데이터프레임 변환 
df = pd.read_excel( 'C:\\Users\\Administrator\\GitHub\\TIL\\Python\\source_판다스 데이터 분석\\part4\\시도별 전출입 인구수.xlsx',
                    engine = 'openpyxl' )
df

In [None]:
# 결측치 확인
df.isnull().sum()

In [None]:
# '전출지별' 컬럼에 NaN 값 존재 (엑셀 양식에서 셀이 병합된 부분)
# 누락값(NaN)을 앞 데이터로 채움 

df = df.fillna(method='ffill')
df

In [None]:
# 서울에서 다른 지역으로 이동한 데이터만 추출하여 정리하기 위해 데이터프레임 재구성

# 전출지가 서울이고, 전입지는 서울이 아닌 지역인 데이터만 추출
filtering = ( df['전출지별'] == '서울특별시' ) & ( df['전입지별'] != '서울특별시' ) 
df_seoul = df[ filtering ]

# '전출지별' 컬럼은 필요 없으므로 삭제
df_seoul = df_seoul.drop( '전출지별', axis = 1)

# '전입지별' 컬럼이름을 '전입지'로 변경
df_seoul.rename({'전입지별':'전입지'}, axis=1, inplace=True)

# 전입지를 기준으로 행 데이터를 선택할수 있도록 인덱스 지정
df_seoul.set_index('전입지', inplace=True)

df_seoul

## 2. 시각화

In [None]:
# 연도별로 정리하기 쉽도록 행렬 전치 수행
df_seoul_T = df_seoul.T
display(df_seoul_T)

# 서울에서 '경기도'로 이동한 인구 데이터 값만 선택
sr_one = df_seoul_T['경기도']

### 선 그래프 그리기 - 기본

In [None]:
# x, y축 데이터를 plot 함수에 입력하여 그리기
plt.plot(sr_one.index, sr_one.values)

In [None]:
# 판다스 객체를 plot 함수에 입력하여 그리기
plt.plot(sr_one)

### 그래프 꾸미기

#### 그래프 크기, 차트 제목, 축 이름, 범례 등을 설정

In [None]:
# 적용 순서에 따라 결과가 달라짐!!!!!!!!!!
# 왜그런지 확인해 볼 것!!!!!!!!


# 그림 사이즈 지정(가로 14인치, 세로 5인치)
# 사이즈 지정을 가장 먼저 하지 않으면 그래프가 이상하게 출력됨.
plt.figure(figsize=(14, 5))

# 판다스 객체를 plot 함수에 입력
# 마커 표시 옵션 추가
plt.plot( sr_one,
          marker='o',  # 마커 종류
          markersize=10 )  # 마커 크기 

# 차트 제목 추가
plt.title('서울 -> 경기 인구 이동')

# 축이름 추가
plt.xlabel('기간')
plt.ylabel('이동 인구수')

# x축 눈금 라벨 회전하기
plt.xticks( size=10,  # 폰트 크기
            rotation='vertical')

# 범례 표시. 가장 마지막에 하지 않으면 적용 안됨.
plt.legend( labels = ['서울 -> 경기'], loc = 'best') 

plt.show()  # 변경사항 저장하고 그래프 출력

#### 스타일 서식 지정

In [None]:
# 적용 가능한 스타일을 알고 싶을 때는 스타일 리스트 출력
plt.style.available

In [None]:
# 스타일 서식 지정
plt.style.use('ggplot') 


# 그림 사이즈 지정(가로 14인치, 세로 5인치)
# 사이즈 지정을 가장 먼저 하지 않으면 그래프가 이상하게 출력됨.
plt.figure(figsize=(14, 5))

# 판다스 객체를 plot 함수에 입력
# 마커 표시 옵션 추가
plt.plot( sr_one,
          marker='o',  # 마커 종류
          markersize=10 )  # 마커 크기 

# 차트 제목 추가
plt.title('서울 -> 경기 인구 이동')

# 축이름 추가
plt.xlabel('기간')
plt.ylabel('이동 인구수')

# x축 눈금 라벨 회전하기
plt.xticks( size=10,  # 폰트 크기
            rotation='vertical')

# 범례 표시. 가장 마지막에 하지 않으면 적용 안됨.
plt.legend( labels = ['서울 -> 경기'], loc = 'best') 

plt.show()  # 변경사항 저장하고 그래프 출력

#### 그래프에 대한 설명(주석) 추가

In [None]:
# 스타일 서식 지정
plt.style.use('ggplot') 

# 그림 사이즈 지정(가로 14인치, 세로 5인치)
# 사이즈 지정을 가장 먼저 하지 않으면 그래프가 이상하게 출력됨.
plt.figure(figsize=(14, 5))

# 판다스 객체를 plot 함수에 입력
# 마커 표시 옵션 추가
plt.plot( sr_one,
          marker='o',  # 마커 종류
          markersize=10 )  # 마커 크기 

# 차트 제목 추가
plt.title('서울 -> 경기 인구 이동')

# 축이름 추가
plt.xlabel('기간')
plt.ylabel('이동 인구수')

# x축 눈금 라벨 회전하기
plt.xticks( size=10,  # 폰트 크기
            rotation='vertical')

# 범례 표시. 가장 마지막에 하지 않으면 적용 안됨.
plt.legend( labels = ['서울 -> 경기'], loc = 'best')




# y축 범위 지정 (최소값, 최대값)
plt.ylim(50000, 800000)

# 주석 표시 - 화살표
plt.annotate('',
             xy=(20, 620000),       #화살표의 머리 부분(끝점)
             xytext=(2, 290000),    #화살표의 꼬리 부분(시작점)
             xycoords='data',       #좌표체계
             arrowprops=dict(arrowstyle='->', color='skyblue', lw=5), #화살표 서식
             )

plt.annotate('',
             xy=(47, 450000),       #화살표의 머리 부분(끝점)
             xytext=(30, 580000),   #화살표의 꼬리 부분(시작점)
             xycoords='data',       #좌표체계
             arrowprops=dict(arrowstyle='->', color='olive', lw=5),  #화살표 서식
             )

# 주석 표시 - 텍스트
plt.annotate('인구이동 증가(1970-1995)',  #텍스트 입력
             xy=(10, 550000),            #텍스트 위치 기준점
             rotation=25,                #텍스트 회전각도
             va='baseline',              #텍스트 상하 정렬
             ha='center',                #텍스트 좌우 정렬
             fontsize=15,                #텍스트 크기
             )

plt.annotate('인구이동 감소(1995-2017)',  #텍스트 입력
             xy=(40, 560000),            #텍스트 위치 기준점
             rotation=-11,               #텍스트 회전각도
             va='baseline',              #텍스트 상하 정렬
             ha='center',                #텍스트 좌우 정렬
             fontsize=15,                #텍스트 크기
             )

plt.show()  # 변경사항 저장하고 그래프 출력

### axe 객체 활용

#### 화면 분할하여 그래프 여러 개 그리기

In [None]:
# 스타일 서식 지정
plt.style.use('ggplot') 

# 그래프 객체 생성 (figure에 2개의 서브 플롯을 생성)
fig = plt.figure( figsize = (10, 10) )   
ax1 = fig.add_subplot(2, 1, 1)
ax2 = fig.add_subplot(2, 1, 2)

# axe 객체에 plot 함수로 그래프 출력
ax1.plot( sr_one,
          'o',
          markersize = 10)

ax2.plot( sr_one,
          marker = 'o',
          markerfacecolor = 'green',
          markersize = 10,
          color = 'olive',
          linewidth = 2,
          label = '서울 -> 경기' )

ax2.legend( loc = 'best' )

#y축 범위 지정 (최소값, 최대값)
ax1.set_ylim(50000, 800000)
ax2.set_ylim(50000, 800000)

# 축 눈금 라벨 지정 및 75도 회전
# (에러 메시지의 원인)
ax1.set_xticklabels( sr_one.index,
                     rotation = 75 )
ax2.set_xticklabels( sr_one.index,
                     rotation = 75 )

plt.show()  # 변경사항 저장하고 그래프 출력

#### 그래프 꾸미기

In [None]:
# 스타일 서식 지정
plt.style.use('ggplot') 

# 그래프 객체 생성 (figure에 1개의 서브 플롯을 생성)
fig = plt.figure(figsize=(20, 5))   
ax = fig.add_subplot(1, 1, 1)

# axe 객체에 plot 함수로 그래프 출력
ax.plot( sr_one,
         marker='o', markerfacecolor='orange', markersize=10, 
         color='olive',
         linewidth=2,
         label='서울 -> 경기' )

ax.legend(loc='best')

#y축 범위 지정 (최소값, 최대값)
ax.set_ylim(50000, 800000)

# 차트 제목 추가
ax.set_title('서울 -> 경기 인구 이동', size=20)

# 축이름 추가
ax.set_xlabel('기간', size=12)
ax.set_ylabel('이동 인구수', size = 12)

# 축 눈금 라벨 지정 및 75도 회전
ax.set_xticklabels(sr_one.index, rotation=75)

# 축 눈금 라벨 크기
ax.tick_params(axis="x", labelsize=10)
ax.tick_params(axis="y", labelsize=10)

plt.show()  # 변경사항 저장하고 그래프 출력

#### 동일한 axe 객체에 여러 개의 그래프 추가

In [None]:
# 서울에서 '충청남도','경상북도', '강원도'로 이동한 인구 데이터 값만 선택
col_years = list(map(str, range(1970, 2018)))
df_3 = df_seoul.loc[['충청남도','경상북도', '강원도'], col_years]

# 스타일 서식 지정
plt.style.use('ggplot') 

# 그래프 객체 생성 (figure에 1개의 서브 플롯을 생성)
fig = plt.figure(figsize=(20, 5))   
ax = fig.add_subplot(1, 1, 1)

# axe 객체에 plot 함수로 그래프 출력
ax.plot(col_years, df_3.loc['충청남도',:], marker='o', markerfacecolor='green', 
        markersize=10, color='olive', linewidth=2, label='서울 -> 충남')
ax.plot(col_years, df_3.loc['경상북도',:], marker='o', markerfacecolor='blue', 
        markersize=10, color='skyblue', linewidth=2, label='서울 -> 경북')
ax.plot(col_years, df_3.loc['강원도',:], marker='o', markerfacecolor='red', 
        markersize=10, color='magenta', linewidth=2, label='서울 -> 강원')

# 범례 표시
ax.legend(loc='best')

# 차트 제목 추가
ax.set_title('서울 -> 충남, 경북, 강원 인구 이동', size=20)

# 축이름 추가
ax.set_xlabel('기간', size=12)
ax.set_ylabel('이동 인구수', size = 12)

# 축 눈금 라벨 지정 및 90도 회전
ax.set_xticklabels(col_years, rotation=90)

# 축 눈금 라벨 크기
ax.tick_params(axis="x", labelsize=10)
ax.tick_params(axis="y", labelsize=10)

plt.show()  # 변경사항 저장하고 그래프 출력

#### 여러 개의 axe 객체를 사용하여 그래프 출력

In [None]:
# 서울에서 '충청남도','경상북도', '강원도', '전라남도'로 이동한 인구 데이터 값만 선택
col_years = list(map(str, range(1970, 2018)))
df_4 = df_seoul.loc[['충청남도','경상북도', '강원도', '전라남도'], col_years]

# 스타일 서식 지정
plt.style.use('ggplot') 

# 그래프 객체 생성 (figure에 1개의 서브 플롯을 생성)
fig = plt.figure(figsize=(20, 10))   
ax1 = fig.add_subplot(2, 2, 1)
ax2 = fig.add_subplot(2, 2, 2)
ax3 = fig.add_subplot(2, 2, 3)
ax4 = fig.add_subplot(2, 2, 4)

# axe 객체에 plot 함수로 그래프 출력
ax1.plot(col_years, df_4.loc['충청남도',:], marker='o', markerfacecolor='green', 
        markersize=10, color='olive', linewidth=2, label='서울 -> 충남')
ax2.plot(col_years, df_4.loc['경상북도',:], marker='o', markerfacecolor='blue', 
        markersize=10, color='skyblue', linewidth=2, label='서울 -> 경북')
ax3.plot(col_years, df_4.loc['강원도',:], marker='o', markerfacecolor='red', 
        markersize=10, color='magenta', linewidth=2, label='서울 -> 강원')
ax4.plot(col_years, df_4.loc['전라남도',:], marker='o', markerfacecolor='orange', 
        markersize=10, color='yellow', linewidth=2, label='서울 -> 전남')

# 범례 표시
ax1.legend(loc='best')
ax2.legend(loc='best')
ax3.legend(loc='best')
ax4.legend(loc='best')

# 차트 제목 추가
ax1.set_title('서울 -> 충남 인구 이동', size=15)
ax2.set_title('서울 -> 경북 인구 이동', size=15)
ax3.set_title('서울 -> 강원 인구 이동', size=15)
ax4.set_title('서울 -> 전남 인구 이동', size=15)

# 축 눈금 라벨 지정 및 90도 회전
ax1.set_xticklabels(col_years, rotation=90)
ax2.set_xticklabels(col_years, rotation=90)
ax3.set_xticklabels(col_years, rotation=90)
ax4.set_xticklabels(col_years, rotation=90)

plt.show()  # 변경사항 저장하고 그래프 출력

In [None]:
# 라이브러리 불러오기
import matplotlib

# 컬러 정보를 담을 빈 딕셔너리 생성
colors={}

# 컬러 이름과 헥사코드 확인하여 딕셔서리에 입력
for name, hex in matplotlib.colors.cnames.items():
	colors[name] = hex

# 딕셔너리 출력    
colors