bokeh library를 활용하여 line chart를 그리는 노트북

bokeh는 자바스크립트 기반의 상호반응형 시각화 툴로, 파이썬으로 작성한 코드를 백엔드에서 자바스크립트로 변환하는 방식으로 구현됨 (reference: https://docs.bokeh.org/en/latest/docs/first_steps/first_steps_1.html)

본 노트북에서 구현하려고 하는 것은 다음과 같음

![image.png](attachment:image.png)
![image-2.png](attachment:image-2.png)

아래부터 시작!

---

모듈 임포트

In [1]:
from bokeh.io import output_notebook
from bokeh.plotting import figure, show
output_notebook()

시각화 대상 데이터를 x, y 변수로 선언

In [2]:
# prepare some data
x = [1, 2, 3, 4, 5]
y = [6, 7, 2, 4, 5]

제목으로 `Simple line example`을 x축 레이블로 `x`, y축 레이블로 `y`를 가지는 figure를 생성

In [3]:
# create a new plot with a title and axis labels
p = figure(title="Simple line example", x_axis_label='x', y_axis_label='y')

x, y를 각 축으로 하는 선 그래프를 그리자

In [4]:
# add a line renderer with legend and line thickness to the plot
p.line(x, y, legend_label="Temp.", line_width=2)

`show()` 메서드를 통해 figure를 html로 띄워줌

In [5]:
# show the results
show(p)

# 다양한 선 그래프 그리기

아래와 같은 여러 개의 선 그래프로 이루어진 차트도 그릴 수 있음.
![image.png](attachment:image.png)

동일한 x축 좌표에 대해, 선마다 다양한 값을 가질 수 있음

In [6]:
# prepare some data
x = [1, 2, 3, 4, 5]
y1 = [6, 7, 2, 4, 5]
y2 = [2, 3, 4, 5, 6]
y3 = [4, 5, 5, 7, 2]

title 새로 만들어주고

In [7]:
# create a new plot with a title and axis labels
p = figure(title="Multiple line example", x_axis_label='x', y_axis_label='y')

여러 개의 renderer를 figure에 추가. legend_label과 color를 통해 이름과 색을 부여함

In [8]:
# add multiple renderers
p.line(x, y1, legend_label="Temp.", color="blue", line_width=2)
p.line(x, y2, legend_label="Rate", color="red", line_width=2)
p.line(x, y3, legend_label="Objects", color="green", line_width=2)

In [9]:
# show the results
show(p)

이렇게 하면 png로 차트 이미지를 저장할수도 있고, zoom in & out 같은 기본적인 도구박스를 가진 차트를 시각화할 수 있음

---

# Breast-cancer Example

유방암 데이터를 기반으로 라인차트를 시각화해보자

In [10]:
from sklearn.datasets import load_breast_cancer

data = load_breast_cancer()
data.keys()

dict_keys(['data', 'target', 'frame', 'target_names', 'DESCR', 'feature_names', 'filename', 'data_module'])

In [11]:
data['feature_names']

array(['mean radius', 'mean texture', 'mean perimeter', 'mean area',
       'mean smoothness', 'mean compactness', 'mean concavity',
       'mean concave points', 'mean symmetry', 'mean fractal dimension',
       'radius error', 'texture error', 'perimeter error', 'area error',
       'smoothness error', 'compactness error', 'concavity error',
       'concave points error', 'symmetry error',
       'fractal dimension error', 'worst radius', 'worst texture',
       'worst perimeter', 'worst area', 'worst smoothness',
       'worst compactness', 'worst concavity', 'worst concave points',
       'worst symmetry', 'worst fractal dimension'], dtype='<U23')

다양한 속성 정보중, `'mean radius'`에 대해, `'mean texture', 'mean perimeter', 'mean area'` 세 개의 속성을 하나의 플롯으로 시각화해보자

In [12]:
samples = range(data['data'].shape[0])
mean_radius = data['data'][:, 0]
mean_texture = data['data'][:, 1]
mean_perimeter = data['data'][:, 2]
mean_area = data['data'][:, 3]

In [13]:
p = figure(title='Breast Cancer Features', x_axis_label='samples', y_axis_label='Attribues')

In [14]:
p.line(samples, mean_radius, legend_label="meanRadius", color='black', line_width=2)
p.line(samples, mean_texture, legend_label="meanTexture", color='blue', line_width=2)
p.line(samples, mean_perimeter, legend_label="meanPerimeter", color='red', line_width=2)
p.line(samples, mean_area, legend_label="meanArea", color='green', line_width=2)

In [15]:
show(p)

bokeh를 활용하여 선그래프는 그릴 수 있게 되었다!