# 실전 인터랙티브 데이터 시각화

분석할 데이터를 읽고, Bokeh 라이브러리를 사용하여 다양한 인터랙티브 시각화 만들기

+ 공공데이터 포털 : 20200225일 기준 성남시 동별 인구수 csv파일 이용
+ 성남시내 3개 구내 구별,동별 인구수 분석


## 데이터 파일 읽기

In [16]:
import numpy as np
import pandas as pd

from bokeh.io import output_notebook, show
from bokeh.plotting import figure , show
output_notebook()

In [12]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [124]:
pop = pd.read_csv("/content/drive/My Drive/Colab Notebooks/data/20200225.csv",encoding='euc-kr')
pop.head()

Unnamed: 0,구별,동,인구수_계,인구수_남,인구수_여,19세 이상_계,19세 이상_남,19세 이상_여,65세 이상_계,65세 이상_남자,65세 이상_여자,세대수,재외국민
0,수정구,신흥1동,13659,7098,6561,12439,6466,5973,2437,1039,1398,7763,9
1,수정구,신흥2동,9906,4893,5013,8327,4103,4224,1483,695,788,3801,14
2,수정구,신흥3동,11140,5792,5348,10117,5256,4861,1916,828,1088,6172,8
3,수정구,태평1동,15870,8042,7828,14538,7345,7193,2925,1266,1659,8604,26
4,수정구,태평2동,16111,8071,8040,14219,7092,7127,2677,1124,1553,7805,19


## 인터랙티브 데이터 시각화

**성남시 구별 인구수 분석**

In [None]:
location = ["분당구", "수정구", "중원구"]
A = pop.groupby(by=['구별'], as_index=False)["인구수_계"].sum()
A

Unnamed: 0,구별,인구수_계
0,분당구,488114
1,수정구,234614
2,중원구,219921


In [189]:
p = figure(x_range = A["구별"], plot_width = 800, plot_height = 600, title = "성남시 구별 인구수" y_axis_type = "log")
p.line(A["구별"], A["인구수_계"], line_width = 2,legend_label="인구수")
p.xgrid.grid_line_color =None
p.xaxis.axis_label = "구"
p.yaxis.axis_label = "인구수" 
show(p)

In [None]:
labels_bd = pop[pop["구별"] == "분당구"]
labels_bd = labels_bd.iloc[:, 1:3]
labels_bd.head()

In [141]:
p = figure(plot_width = 800, plot_height = 600)
p.hex(pop["인구수_남"], pop["인구수_여"], size = pop["재외국민"]/10, color = "darkblue", alpha = 0.5,legend_label="재외국민")
p.xaxis.axis_label = "인구수_남"
p.yaxis.axis_label = "인구수_여"
show(p)

In [128]:
labels_bd = pop[pop["구별"] == "분당구"]
labels_bd = labels_bd.iloc[:, 1:3]
labels_bd.head()

Unnamed: 0,동,인구수_계
28,분당동,26840
29,수내1동,18185
30,수내2동,10825
31,수내3동,14401
32,정자동,20113


In [140]:
labels_bd["동"].head()

28    분당동          
29    수내1동         
30    수내2동         
31    수내3동         
32    정자동          
Name: 동, dtype: object

In [157]:

p = figure(x_range = labels_bd["동"], plot_height = 600,plot_width = 1500, title = "분당구 동별 인구수")
p.line( labels_bd["동"] , labels_bd["인구수_계"] , line_width = 2,legend_label="인구수")
p.xgrid.grid_line_color =None
p.xaxis.axis_label = "동"
p.yaxis.axis_label = "인구수"         
show(p);


In [156]:
p.scatter( labels_bd["동"] , labels_bd["인구수_계"] , line_width = 2,legend_label="인구수")
show(p)

In [219]:
labels_sj = pop[pop["구별"] == "수정구"]
labels_sj = labels_sj.iloc[:, 0:3]
labels_sj.head()

Unnamed: 0,구별,동,인구수_계
0,수정구,신흥1동,13659
1,수정구,신흥2동,9906
2,수정구,신흥3동,11140
3,수정구,태평1동,15870
4,수정구,태평2동,16111


In [232]:

p = figure(x_range = labels_sj["동"], plot_height = 600,plot_width = 1500, title = "수정구 동별 인구수")
#p.line( labels_sj["동"] , labels_sj["인구수_계"] , line_width = 2,legend_label="인구수")
p.hex(labels_sj["동"] , labels_sj["인구수_계"] ,  size = labels_sj["인구수_계"]/500, color = "purple", alpha = 0.3, legend_label="인구수/500")
p.xgrid.grid_line_color =None
p.xaxis.axis_label = "동"
p.yaxis.axis_label = "인구수"         
show(p);


In [151]:
labels_gw = pop[pop["구별"] == "중원구"]
labels_gw = labels_gw.iloc[:, 0:3]
labels_gw.head()

Unnamed: 0,구별,동,인구수_계
17,중원구,성남동,33477
18,중원구,중앙동,14412
19,중원구,금광1동,7199
20,중원구,금광2동,25331
21,중원구,은행1동,11029


In [153]:

p = figure(x_range = labels_gw["동"], plot_height = 600,plot_width = 1500, title = "중원구 동별 인구수")
p.line( labels_gw["동"] , labels_gw["인구수_계"] , line_width = 2,legend_label="인구수")
p.xgrid.grid_line_color =None
p.xaxis.axis_label = "동"
p.yaxis.axis_label = "인구수"         
show(p);
