# Parte 1 - Introdução Bokeh

Para facilitar o entendimento de como a biblioteca Bokeh funciona iremos criar gráficos simples.

## Carregar o conjunto de dados

In [None]:
import pandas as pd

In [None]:
# Essa opção do pandas format os tipos floats com duas casas decimais.
pd.options.display.float_format = "{:.2f}".format

In [None]:
df = pd.read_csv('preco_casas_final.csv', sep=';', encoding='utf-8')

In [None]:
df.head()

## Gráfico de Linhas

In [None]:
from bokeh.io import output_notebook, show

In [None]:
from bokeh.plotting import figure

In [None]:
output_notebook()

Primeiramente iremos criar um gráfico simples para plotar o preço de imóveis por ano de construção, ano da venda, além de incluir as ferramentas que permitem ações no gráfico gerado.

In [None]:
df_aux = df[['condicao', 'qualidade_geral', 'preco']]

In [None]:
preco_cond = df_aux[['condicao', 'preco']].groupby(['condicao']).mean()

In [None]:
preco_cond.loc[10] = 0

In [None]:
preco_cond

In [None]:
preco_quali = df_aux[['qualidade_geral', 'preco']].groupby(['qualidade_geral']).mean()

In [None]:
preco_quali

In [None]:
p = figure(
    title='Gráfico de Linha',
    width = 500,
    height = 300,
    x_axis_label='Classificação (1 até 10)',
    y_axis_label='Preço',
)

In [None]:
p.line(x=preco_quali.index, y=preco_quali.preco,
       legend='Qualidade Geral',
       line_width=2,
       line_color="green"
)

In [None]:
show(p)

In [None]:
p.line(x=preco_cond.index, y=preco_cond.preco,
       legend='Condição',
       line_width=2,
       line_color="blue"
)

In [None]:
show(p)

In [None]:
p.legend.location = 'top_left'

http://bokeh.pydata.org/en/latest/docs/user_guide/styling.html#legends

In [None]:
show(p)

In [None]:
p.left[0].formatter.use_scientific = False

In [None]:
show(p)

In [None]:
p.yaxis.ticker = [x for x in range(0, int(df_aux.preco.max()), 250000)]

In [None]:
show(p)

http://bokeh.pydata.org/en/latest/docs/user_guide/styling.html

## Gráfico de Dispersão

Vamos criar um gráfico de dispersáo com tamanhos para cada item utilizando a biblioteca Bokeh.

In [None]:
df.head()

In [None]:
ano = df[['qtde_comodos', 'preco']].groupby(['qtde_comodos']).count()

In [None]:
ano.head()

In [None]:
from bokeh.io import output_notebook, show
from bokeh.plotting import figure

In [None]:
output_notebook()

In [None]:
fig = figure(
    title='Gráfico de Dispersão',
    width = 400,
    height = 400,
    tools='box_zoom,reset,save,crosshair,wheel_zoom',
    y_range=(0, 500)
)

In [None]:
fig.circle(ano.index, ano.preco,
           size=ano.preco/5,
           line_color="navy", 
           fill_color="orange", 
           fill_alpha=0.5)

In [None]:
show(fig)