# [그래프 기초] 간단한 형태의 그래프를 그려보자

링크: https://docs.bokeh.org/en/latest/docs/user_guide/plotting.html#userguide-plotting

## jupyter notebook에서 그래프 출력하기

* output_file("파일명.html")을 입력해주면 결과값이 html 파일형태로 저장됨과 동시에 웹브라우저의 새로운 탭이 열리면서 해당 html 파일(결과값)이 출력된다. 우리는 현재 bokeh에서 그래프를 그리는 주요 기능을 연습하고 있기에 쥬피터 노트북 상에서 그래프가 표현되도록 하자. <br>
  (이를 위해 각 코드에 output_file() 코드가 있다면 이를 주석처리해서 남겨두었다.)
<br><br>
* 아래 코드는 bokeh의 그래프를 jupyter notebook 상에 표현하는 방법이다.(링크: https://stackoverflow.com/questions/51512907/how-to-stop-bokeh-from-opening-a-new-tab-in-jupyter-notebook)<br>
  이렇게 설정을 한번 해주면 각 그래프를 그릴때 따로 저장설정을 안해줘도 바로 jupyter notebook 상에 표현된다. 



In [64]:
import bokeh.io

# bokeh 결과값의 표현 방법을 reset해준다.
bokeh.io.reset_output()
# bokeh 결과값의 표현 방법을 
bokeh.io.output_notebook()

## 그래프 그리기 시작

In [29]:
from bokeh.plotting import figure, output_file, show

# # 출력형태를 정해준다.
# output_file("line.html")

p = figure(plot_width=400, plot_height=400)

# <figure>.circle() 메소드로 원형 산포도를 생성한다. 인자로는 x값, y값을 받는다.
p.circle([1, 2, 3, 4, 5], [6, 7, 2, 4, 5], size=20, color="navy", alpha=0.5)

# show the results
show(p)

### 원형산포도가 아닌 사각형 산포도를 원한다면 circle 대신 &lt;figure&gt;.square() 메소드를 사용한다.

In [30]:
from bokeh.plotting import figure, output_file, show

# # output to static HTML file
# output_file("square.html")

p = figure(plot_width=400, plot_height=400)

# add a square renderer with a size, color, and alpha
p.square([1, 2, 3, 4, 5], [6, 7, 2, 4, 5], size=20, color="olive", alpha=0.5)

# show the results
show(p)

## Bokeh에는 다양한 형태의 marker를 제공한다. 

<table width = 100%>
    <tr>
        <td>
asterisk()
        </td>
        <td>
circle()
        </td>
        <td>    
circle_cross()
        </td>
    </tr>
    <tr>
<td>
circle_x()
        </td>
        <td>           
cross()
        </td>
        <td>
dash()
        </td>
    </tr>
    <tr>
        <td>
diamond()
        </td>
        <td>
diamond_cross()
        </td>
        <td>
inverted_triangle()
        </td>
        <tr>
            <td>
square()
            </td>
            <td>                
square_cross()
            </td>
            <td>
square_x()
            </td>
            <tr>
                <td>
triangle()
                </td>
                <td>
x()
                </td>
                <td>
                </td>
    </tr>
</table>

### 모든 marker들은 x,y,size라는 인자를 받는다. circle()의 경우 추가적으로 radius를 인자로 받는다.  

## Line 선형 그래프

### 기초적인 선형그래프

In [31]:
from bokeh.plotting import figure, output_file, show

# output_file("line.html")

p = figure(plot_width=400, plot_height=400)

# add a line renderer
p.line([1, 2, 3, 4, 5], [6, 7, 2, 4, 5], line_width=2)

show(p)

### 특정 데이터의 경우 데이터 값 분절적으로 연결해서 표현해야 할 수 있다. 이 경우 step() 메소드를 사용한다.

In [32]:
from bokeh.plotting import figure, output_file, show

# output_file("line.html")

p = figure(plot_width=400, plot_height=400)

# add a steps renderer
p.step([1, 2, 3, 4, 5], [6, 7, 2, 4, 5], line_width=2, mode="center")

show(p)

### Multiple Lines 여러줄의 그래프 그리기

> &lt;figure&gt;.multi_line()을 사용해서 여러줄의 선형그래프를 그려줄 수 있다. 두 줄의 선형그래프를 그려줄 때는 인자로 [ [ x데이터1, y데이터1 ] ] , [ [ x데이터2, y데이터2 ] ] 를 받는다.

> &lt;figure&gt;.multi_line()의 color 옵션 역시 각각의 선형그래프의 색상을 list 형태의 인자로 받는다.

In [33]:
from bokeh.plotting import figure, output_file, show

# output_file("patch.html")

p = figure(plot_width=400, plot_height=400)

p.multi_line([[1, 3, 2], [3, 4, 6, 6]], [[2, 1, 4], [4, 7, 8, 5]],
             color=["firebrick", "navy"], alpha=[0.8, 0.3], line_width=4)

show(p)

### Missing Point 단절된 선형 그래프 그리기

> 선형그래프를 그리는 기본 메소드인 line의 인자로 받는 데이터에 nan값을 넣어주면 해당 값이 있는 영역은 선이 없는 것으로 표현된다.

In [34]:
from bokeh.plotting import figure, output_file, show

# output_file("line.html")

p = figure(plot_width=400, plot_height=400)

nan = float('nan')
p.line([1, 2, 3, nan, 4, 5], [6, 7, 2, 4, 4, 5], line_width=2)

show(p)

### Stacked Lines 같은 x값(혹은 y 값)을 가진 선형 그래프들을 그리기

* 같은 x값을 가진 선형 그래프들을 그리는 메소드는 vline_stack()이고 같은 y값을 가진 선형 그래프들을 그리는 메소드는 hline_stack()이다. 
<br><br>
* 같은 값을 가진 선형그래프의 경우 중복된 데이터가 있다는 것이고 이는 ColumnDataSource() 객체를 만들어서 처리해준다.
ColumnDataSource(data = &lt;dictionary7gt;)로 작동한다.


#### vline_stack()의 세부 작동은 아래 코드를 통해 이해한다.

In [35]:
from bokeh.models import ColumnDataSource
from bokeh.plotting import figure, output_file, show

# output_file("vline_stack.html")

source = ColumnDataSource(data=dict(
    x=[1, 2, 3, 4, 5],
    y1=[1, 2, 4, 3, 4],
    y2=[1, 4, 2, 2, 3],
))
p = figure(plot_width=400, plot_height=400)

p.vline_stack(['y1', 'y2'], x='x', source=source)

show(p)

### Bar and Rectangles 막대그래프 그리기

#### vbar & hbar
* 수평 형태로 전개되는(x축 위에 표현되는) 막대그래프를 그리려 한다면 vbar() 메소드를 사용한다. 
* 수직 형태로 전개되는 (y축 위에 표현되는) 막대그래프를 그리려 한다면 hbar() 메소드를 사용한다.


#### ★아래 코드에서 적용해볼 것: y축과 x축의 범위 설정해주기★
* &lt;figure&gt;의 객체의 속성으로 x_range와 y_range가 있는데 이 속성에 값을 지정함을 통해서 그래프의 x축과 y축의 범주를 설정해줄 수 있다.
<br><br>
* 위의 y_range 혹은 x_range는 &lt;figure&gt;.x_range의 형태로 쓰이는데 그 값으로는 Range1d(시작숫자, 끝숫자)를 받느다. 이때 Range1d는 bokeh의 모델의 하나로 bokeh.models에서 import 해와야 사용이 가능하다.

In [36]:
from bokeh.plotting import figure, show, output_file
from bokeh.models import Range1d

# output_file('vbar.html')

p = figure(plot_width=400, plot_height=400)

# x축위에 표현되는 vbar는 기본 인자로 x와 top을 받는다.
# vbar의 인자 중 bottom는 해당 그래프가 표현되기 시작하는 위치를 의미한다.
# >> bottom이 0이면 top값이 0부터 표현된다.
p.vbar(x=[1, 2, 3], width=0.5, bottom=0,
       top=[1.2, 2.5, 3.7], color="firebrick")

p.y_range = Range1d(0, 5)

show(p)

### 막대그래프를 가로로도 그려보자( hbar( )  )

In [37]:
from bokeh.plotting import figure, show, output_file

# output_file('hbar.html')

p = figure(plot_width=400, plot_height=400)

# y축위에 표현되는 hbar는 기본 인자로 y와 right를 받느다.
# hbar의 인자 중 left는 해당 그래프가 표현되기 시작하는 위치를 의미한다.
p.hbar(y=[1, 2, 3], height=0.5, left=0,
       right=[1.2, 2.5, 3.7], color="navy")

show(p)

### Stacked Bars 막대그래프들을 쌓은 형태의 그래프를 그려보자 <h4> (아래 설명은 두 개를 쌓는 것을 가정해서 작성하였지만 3개든 그 이상이든 원리는 같다)</h4>
<br>
* 막대그래프를 그리는 방법은 기본적으로 y축위에 그리는 hbar와 x축위에 그리는 vbar가 존재한다. 따라서 막대그래프를 쌓아서 그리는 것 역시 y축위의 막대그래프를 쌓는 것과 x축위의 막대그래프를 쌓는 것 두가지가 존재한다. 
<br><br>
* 기본적으로 막대그래프 y축에 그리든 x축에 그리든 필요한 인자는 두가지이다. 바로 막대그래프의 위치(x축에 그리는 경우 x값, y축에 그리는 경우 y값)와 해당 막대그래프의 크기이다. 
<br><br>
* 막대그래프를 쌓는 것 역시 필요한 인자의 종류는 두가지이다. 다만 이 경우 막대그래프가 그려질 위치(x축이든 y축이든)는 막대그래프들간 공통된 값을 가지지만, 해당 위치에 그려질 두개의 막대그래프의 크기(높이)는 다르다. 
<br><br>
* 공통된 요소를 가진 두개의 그래프는 앞서 배웠듯이 ColumnDataSource 객체를 사용해서 모든 데이터(값)들을 dictionary 형태로 입력해주고 그래프를 그리는 메소드에 source 값으로 넣어준다.
<br><br>
* 아래의 예시에서는 hbar_stack() 메소드를 사용해 볼 것이다. (hbar_stack() 메소드의 경우 y축위에 그려지는 것이기에 파라미터 y값을 따로 받고 막대그래프들의 크기는 list형태로 받는다. _ 세부적인 작성 방법은 아래 코드를 참고한다.)

In [40]:
from bokeh.models import ColumnDataSource
from bokeh.plotting import figure, output_file, show


source = ColumnDataSource(data=dict(
    y=[1, 2, 3, 4, 5],
    x1=[1, 2, 4, 3, 4],
    x2=[1, 4, 2, 2, 3],
))
p = figure(plot_width=400, plot_height=400)

# y축위에 그려지는 막대그래프이기에 너비는 height 파라미터를 사용해서 값을 지정한다.
p.hbar_stack(['x1', 'x2'], y='y', height=0.8, color=("grey", "lightgrey"), source=source)

show(p)

### Hex Tiles 육각형의 타일형 그래프 그리기

In [52]:
import numpy as np

from bokeh.io import output_file, show
from bokeh.plotting import figure
from bokeh.util.hex import axial_to_cartesian

# output_file("hex_coords.html")

y = np.array([0,  0, 0, -1, -1,  1, 1])
x = np.array([0, -1, 1,  0,  1, -1, 0])

p = figure(plot_width=400, plot_height=400, toolbar_location=None)

# figure의 격자를 없앤다. <figure>.grid.visible = False
p.grid.visible = False

# hex_tile()메소드로 육각형의 타일 그래프를 그린다.
# >> hex_tile() 메소드의 인자로는 y축값, x축값, size(타일 사이즈) fill_color(타일색상) 등이 있다.
p.hex_tile(y, x, size=1, fill_color=["firebrick"]*3 + ["navy"]*4,
           line_color="white", alpha=0.5)

# tile위에 text를 입력하기 위해서 각각 타일의 중심 좌표값을 구한다. 
xs, ys = axial_to_cartesian(y, x, 1, "pointytop")

# text_baseline은 해당 타일의 영역(상단,중단,하단)에서 어떤 곳에 text가 위치할지 선택하는 옵션이다.
p.text(xs, ys, text=["(%d, %d)" % (y,x) for (y, x) in zip(q, r)],
       text_baseline="middle", text_align="center")

show(p)

In [50]:
print(xs)
print(type(xs))

[ 0.         -0.8660254   0.8660254  -1.73205081 -0.8660254   0.8660254
  1.73205081]
<class 'numpy.ndarray'>


### Combining Multiple Glyphs

선형그래프와 원형 산점도를 결합하여 그래프를 그려보자

In [53]:
from bokeh.plotting import figure, output_file, show

x = [1, 2, 3, 4, 5]
y = [6, 7, 8, 7, 3]

# output_file("multiple.html")

p = figure(plot_width=400, plot_height=400)

# 같은 도화지(figure)상에 두개의 그래프를 그려주면 중복되서 나온다.
p.line(x, y, line_width=2)
p.circle(x, y, fill_color="white", size=8)

show(p)

### Specifying Axis Types   x축(y축)의 값의 형태를 설정해보자

* 그래프를 그릴 때, 특정 데이터의 경우 축의 값으로 숫자가 아닌 카테고리(종류)가 와야 할 수 도 있고 시계열 데이터의 경우 시간(날짜)가 축에 표현되어야 할 수 도 있다. 따라서 이번에 우리는 축(axis)의 유형(type)을 설정해주는 방법을 배워본다.



#### Categorical Axes 카테고리형 축 표현방법

카테고리로 표현할 값들을 리스트로 미리 만들어 두고 &lt;figure&gt; 객체를 생성할 때 y_range 옵션값으로 해당 리스트를 할당해주면 y 축의 값으로 해당 카테고리 리스트가 들어간다.  

In [56]:
from bokeh.plotting import figure, output_file, show

# y축의 값으로 들어갈 카테고리 값들을 factors라는 리스트로 만들어준다.
factors = ["a", "b", "c", "d", "e", "f", "g", "h"]
x = [50, 40, 65, 10, 25, 37, 80, 60]

# output_file("categorical.html")

# figure을 생성할 때 y_range 옵션 값으로 카테고리 리스트를 할당해준다.
p = figure(y_range=factors)

p.circle(x, factors, size=15, fill_color="orange", line_color="green", line_width=3)

show(p)

#### Datetime Axes 시계열 축 표현방법

figure 객체 생성 시 x_axis_type(y_axis_type) 옵션 값으로 "datetime"을 설정하면 x값으로 오는 값들을 datetime 데이터로 인식하고 x축 위에 표현한다.
(x축위에 표현하는 것들은 해당 데이터의 크기에 따라 다르다.
'년도'를 표현할 수도 있고 '월' 혹은 '일'로 표현할 수도 있다.)

In [62]:
import pandas as pd
from bokeh.plotting import figure, output_file, show
from bokeh.sampledata.stocks import AAPL

df = pd.DataFrame(AAPL)
# pd_to_datetime() 메소드를 통해 해당 데이터의 유형을 datetime 데이터로 설정한다.
df['date'] = pd.to_datetime(df['date'])

# output_file("datetime.html")

# 선형그래프를 그려주고 x_axis_type을 "datetime"으로 정해줌으로서 x축의 값을 datetime 데이터로 인식하게하고 이를 x축에 표현하게 한다. 
p = figure(plot_width=800, plot_height=250, x_axis_type="datetime")

# 참고로 아래의 코드에서 df["close"]는 종가를 의미한다. 
p.line(df['date'], df['close'], color='navy', alpha=0.5)

show(p)

#### Log Scale Axes 로그값으로 축 표현방법


In [65]:
from bokeh.plotting import figure, output_file, show

x = [0.1, 0.5, 1.0, 1.5, 2.0, 2.5, 3.0]
y = [10**xx for xx in x]

# output_file("log.html")

#  y_axis_type값을 "log"로 줌으로서 y값을 로그로 인식하고 y축위에 표현할 때 이를 고려해서 표현한다.
p = figure(plot_width=400, plot_height=400, y_axis_type="log")

p.line(x, y, line_width=2)
p.circle(x, y, fill_color="white", size=8)

show(p)

#### Twin Axes 한쪽에 두개의 축 그리기(서로 범위가 다른)

* x축이나 y축쪽에 extra_x_range나 extra_y_range를 사용해서 추가적으로 축을 그려줄 수 있다. 
<br><br>
* numpy.arange(옵션1시작위치,필수끝위치,옵션2스텝): numpy의 arange 메소드는 시작위치부터 끝위치까지 스텝을 간격으로 위치한 숫자들을 array로 반환해준다. 끝위치는 필수 입력 사항이고 시작위치의 default 값은 0이고 스텝의 default값은 1이다. 
<br><br>
* 새로운 축을 만들어주는 작업은 크게 3가지로 나눠 볼 수 있다. 
<br>
1) 축의 범위를 설정해준다. (&lt;figure&gt;.extra_y_range )
<br>
2) 축의 형태를 설정해준다. = 축을 생성 ( LinearAxis() )
<br>
3) 축을 &lt;figure&gt; 객체에 더해준다. ( &lt;figure&gt;.add_layout() )


In [68]:
from numpy import pi, arange, sin, linspace
from bokeh.plotting import output_file, figure, show
# bokeh.models의 LinearAxis를 통해 선형(직선)의 축을 만들어 줄 수 있다.
from bokeh.models import LinearAxis, Range1d

x = arange(-2*pi, 2*pi, 0.1)
y = sin(x)
y2 = linspace(0, 100, len(y))

# output_file("twin_axis.html")

p = figure(x_range=(-6.5, 6.5), y_range=(-1.1, 1.1))

p.circle(x, y, color="red")


# 1) 새로운 축의 범위를 설정해준다.(<figure>.extra_y_ranges)
# 단 범위를 설정 한것이지 이를 도화지 상에 추가한 것은 아니다.
## >> <figure>.extra_y_range를 통해 새로운 축의 범위를 설정할 때, {축 이름: Range1d(start = 값, end = 값)}으로 입력해준다.
p.extra_y_ranges = {"foo": Range1d(start=0, end=100)}

# 기존의 <figure> 축이 아닌 새로 만든 축을 기준으로 그래프를 그리려면 y_range_name = "새로운 축이름" 으로 설정해준다. 
p.circle(x, y2, color="blue", y_range_name="foo")


# 2),3) 새로운 축의 형태설정과 도화지에 추가하는 작업을 동시에 한다.
# <figure>.add_layout(LinearAxis(y_range_name = "축이름"), 'left')
## >> LinearAxis(y_range_name = "축이름")을 통해서 해당 축이름의 범위를 가진 축을 LinearAxis 형태로 만들어준다.
## >> <figure>의 add_layout 메소드를 이용해서 만든 축을 추가할 수 있다.
p.add_layout(LinearAxis(y_range_name="foo"), 'left')

show(p)