<img alt="Colaboratory logo" width="15%" src="https://raw.githubusercontent.com/carlosfab/escola-data-science/master/img/novo_logo_bg_claro.png">

#### **Data Science na Prática**
*by [sigmoidal.ai](https://sigmoidal.ai)*

---

# Bar Chart Race

Outro gráfico muito interessante e que tem ganhado cada vez mais espaço na mídia é o Bar Chart Race.

<center><img src="https://www.dexplo.org/bar_chart_race/images/covid19_horiz.gif" height="400px"></center>

Basicamente, é um gráfico de barras animado, que representa a evolução dos números ao longo do tempo.

Para utilizar esse tipo de visualização precisamos de um conjunto de dados "largo" onde:

* Cada linha representa um período no tempo
* Cada coluna contém valores para uma categoria
* O index contém um elemento de tempo (opcional)

O conjunto de dados que vamos usar vem da [documentação oficial]() dessa biblioteca, e está formatado da forma que precisamos para plotar esse gráfico.

O conjunto mostra o total de mortes por COVID-19 em diversos países.

A primeira coisa que precisamos fazer é instalar o pacote.

In [None]:
# instalando a biblioteca
!pip install bar_chart_race -q

[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/156.8 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m156.8/156.8 kB[0m [31m7.0 MB/s[0m eta [36m0:00:00[0m
[?25h

In [None]:
# importando o pacote
import bar_chart_race as bcr

# carregando o conjunto de dados
df = bcr.load_dataset('covid19_tutorial')

Com o nosso df definido e pronto, basta plotá-lo!

Para isso, vamos chamar o plot, definir os dados, e para fazer o embedding em um Jupyter Notebook, como o colab, basta definir o nome do arquivo como None.

In [None]:
# plotando o gráfico
bcr.bar_chart_race(df=df, filename=None)

  ax.set_yticklabels(self.df_values.columns)
  ax.set_xticklabels([max_val] * len(ax.get_xticks()))


In [None]:
# criando o plot customizado
bcr.bar_chart_race(
    df=df, # selecionando os dados
    filename=None, # nomeando o arquivo
    orientation='h', # orientação do gráfico
    sort='desc', # organização
    n_bars=10, # número de barras
    fixed_order=False, # ordem fixa
    fixed_max=True, # máximo fixo
    steps_per_period=10, # stepos por período
    interpolate_period=False, # interpolar o período
    label_bars=True, # colocar labels nas barras
    bar_size=.95, # tamanho da barra
    period_label={'x': .99, 'y': .25, 'ha': 'right', 'va': 'center'}, # labels dos períodos
    period_fmt='%B %d, %Y', # formato do período
    period_summary_func=lambda v, r: {'x': .99, 'y': .18,
                                      's': f'Total deaths: {v.nlargest(6).sum():,.0f}',
                                      'ha': 'right', 'size': 8, 'family': 'Courier New'}, # resumo do período
    perpendicular_bar_func='median', # função da barra perpendicular
    period_length=500,# tamanho do período
    figsize=(5, 3), # tamanho da período
    dpi=144,
    cmap='dark12', # esquema de cores
    title='COVID-19 Deaths by Country', # título
    title_size='', # tamamnho do título
    bar_label_size=7, # tamanho do label das barras
    tick_label_size=7, # tamanho do tick do label
    shared_fontdict={'family' : 'Helvetica', 'color' : '.1'}, # definindo a fonte
    scale='linear', # escala dos dados
    writer=None, # escrever no plot
    fig=None, # definir a figura
    bar_kwargs={'alpha': .7}, # kwargs
    filter_column_colors=False)  # filtrar cores das colunas


  ax.set_yticklabels(self.df_values.columns)
  ax.set_xticklabels([max_val] * len(ax.get_xticks()))


Também é possível salvar como html para fazer embedding em outros lugares.

In [None]:
# salvando como html
bcr_html = bcr.bar_chart_race(df=df, filename='bar_chart_race.html')

  ax.set_yticklabels(self.df_values.columns)
  ax.set_xticklabels([max_val] * len(ax.get_xticks()))
