<a href="https://colab.research.google.com/github/fabioolivei/Fabio_Olivei_Data_Sciense/blob/main/O_Bar_Chart_Race_como_Ferramenta_de_Visualiza%C3%A7%C3%A3o_de_Dados.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# O Bar Chart Race como Ferramenta de Visualização de Dados

O bar chart race é um gráfico dinâmico que mostra a evolução de um valor ao longo do tempo. É uma forma muito eficaz de visualizar dados, pois permite que os usuários vejam como os valores mudam ao longo do tempo de forma rápida e fácil.

## Exemplos de Bar Chart Race

Um exemplo de bar chart race é o gráfico da ["COVID-19 no Brasil e no mundo".](https://colab.research.google.com/drive/1xCWs_1iNEVKde8KAUvLAVFlqPLeEPNqj?usp=sharing) Este gráfico mostra a evolução do número de casos de COVID-19 no Brasil e no mundo desde o início da pandemia.

![Gráfico de Corrida de Barras](https://cdn-images-1.medium.com/max/800/1*CqOQ-KmnH_wZCeMm8TRVVg.gif)


Outro exemplo é o gráfico ["TOP 100 Filmes com maiores bilheterias"](https://colab.research.google.com/drive/1G-6le_8CDM7G3wdDoVcJjtX-pbqsdNDn?usp=sharing). Este gráfico mostra a evolução das maiores bilheterias mundiais de filmes desde 1980.

![Gráfico de Corrida de Barras](https://cdn-images-1.medium.com/max/800/1*UmI_kujo3WpdwEWdlM7-RQ.gif)




## Como Plotar um Bar Chart Race?

Existem várias maneiras de plotar um bar chart race. Uma maneira é usar uma ferramenta de código aberto como o Python ou o R. Aqui está um exemplo

**OBS:** *Para outros exemplos, como os citados acima é só clicar nestes links*  ["COVID-19 no Brasil e no mundo"](https://colab.research.google.com/drive/1xCWs_1iNEVKde8KAUvLAVFlqPLeEPNqj?), e ["TOP 100 Filmes com maiores bilheterias"](https://colab.research.google.com/drive/1G-6le_8CDM7G3wdDoVcJjtX-pbqsdNDn?usp=sharing).

Para iniciar, vou começar instalando o bar chart race

In [7]:
!pip install bar_chart_race


Collecting bar_chart_race
  Downloading bar_chart_race-0.1.0-py3-none-any.whl (156 kB)
[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/156.8 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m156.8/156.8 kB[0m [31m6.6 MB/s[0m eta [36m0:00:00[0m
Installing collected packages: bar_chart_race
Successfully installed bar_chart_race-0.1.0


Vamos ver na prática como se cria um bar chart race, para isso vou importar as bibliotecas necessárias, criar um dataFrame e após formatar e executar o código para o gráfico animado bcr.

In [None]:
# Importar as bibliotecas necessárias
import pandas as pd
import bar_chart_race as bcr

# Criar um dataframe de exemplo
df = pd.DataFrame({
    'Time 1': [10, 15, 20, 25, 30, 35, 40, 45, 50, 55],
    'Time 2': [5, 10, 20, 25, 35, 40, 50, 55, 60, 65],
    'Time 3': [0, 5, 10, 15, 20, 25, 30, 35, 40, 45]
}, index=pd.date_range(start='1/1/2023', periods=10))

# Criar o gráfico de corrida de barras
bcr.bar_chart_race(
    df=df,  # DataFrame que contém os dados
    filename='evolução_pontos.mp4',  # O nome do arquivo onde a animação será salva
    n_bars=3,  # O número de barras que serão mostradas no gráfico
    steps_per_period=10,  # Número de etapas para transitar de um período para o próximo
    period_length=500,  # Duração de cada período, em milissegundos
    bar_label_size=7,  # Tamanho da fonte das etiquetas nas barras
    tick_label_size=7,  # Tamanho da fonte dos rótulos do eixo
    title='Evolução dos Pontos dos Times ao Longo de 10 Rodadas',  # Título do gráfico
    title_size='smaller',  # Tamanho do título
    period_label={'x': .99, 'y': .25, 'ha': 'right', 'va': 'center'},  # Configurações de localização e alinhamento do rótulo do período
    period_fmt='%B %d, %Y',  # Formato da data que aparecerá no rótulo do período
    period_summary_func=lambda v, r: {'x': .99, 'y': .18,  # Função para calcular e exibir o resumo do período (neste caso, o total de pontos)
                                      's': f'Total pontos: {v.nlargest(3).sum():,.0f}',
                                      'ha': 'right', 'size': 8, 'family': 'DejaVu Sans'},
    cmap='tab10'  # O mapa de cores a ser usado para as barras
)

Este script irá criar uma animação de corrida de barras, mostrando a evolução dos pontos de três times ao longo de dez rodadas. A animação será salva como 'evolução_pontos.mp4' na pasta de trabalho atual. Outra forma de executar o gráfico, seria aqui no próprio ambiente do Colab. Para isso é necessário mudar a opção filename que está salvando o arquivo. Ex: **`filename='evolução_pontos.mp4'`** para **`filename='None'`**. Dessa forma o arquivo será retornado na saída do Google Colab.

In [12]:
# Criar o gráfico de corrida de barras
bcr.bar_chart_race(
    df=df,  # DataFrame que contém os dados
    filename=None,  # Utilizando None para não salvar, e ser retornado na saída do ambiente
    n_bars=3,  # O número de barras que serão mostradas no gráfico
    steps_per_period=10,  # Número de etapas para transitar de um período para o próximo
    period_length=500,  # Duração de cada período, em milissegundos
    bar_label_size=7,  # Tamanho da fonte das etiquetas nas barras
    tick_label_size=7,  # Tamanho da fonte dos rótulos do eixo
    title='Evolução dos Pontos dos Times ao Longo de 10 Rodadas',  # Título do gráfico
    title_size='smaller',  # Tamanho do título
    period_label={'x': .99, 'y': .25, 'ha': 'right', 'va': 'center'},  # Configurações de localização e alinhamento do rótulo do período
    period_fmt='%B %d, %Y',  # Formato da data que aparecerá no rótulo do período
    period_summary_func=lambda v, r: {'x': .99, 'y': .18,  # Função para calcular e exibir o resumo do período (neste caso, o total de pontos)
                                      's': f'Total pontos: {v.nlargest(3).sum():,.0f}',
                                      'ha': 'right', 'size': 8, 'family': 'DejaVu Sans'},
    cmap='tab10'  # O mapa de cores a ser usado para as barras
)

  ax.set_yticklabels(self.df_values.columns)
  ax.set_xticklabels([max_val] * len(ax.get_xticks()))


Podemos ver a evolução dos pontos de três times (**Time 1, Time 2 e Time 3**) **ao longo de 10 rodadas**. Os valores para cada time em cada rodada são os seguintes:

- **Rodada 1** (1 de janeiro de 2023): Time 1 tem 10 pontos, Time 2 tem 5 pontos e Time 3 tem 0 pontos.
- **Rodada 2** (2 de janeiro de 2023): Time 1 tem 15 pontos, Time 2 tem 10 pontos e Time 3 tem 5 pontos.
- **Rodada 3** (3 de janeiro de 2023): Time 1 tem 20 pontos, Time 2 tem 20 pontos e Time 3 tem 10 pontos.
- **Rodada 4** (4 de janeiro de 2023): Time 1 tem 25 pontos, Time 2 tem 25 pontos e Time 3 tem 15 pontos.
- **Rodada 5** (5 de janeiro de 2023): Time 1 tem 30 pontos, Time 2 tem 35 pontos e Time 3 tem 20 pontos.
- **Rodada 6** (6 de janeiro de 2023): Time 1 tem 35 pontos, Time 2 tem 40 pontos e Time 3 tem 25 pontos.
- **Rodada 7** (7 de janeiro de 2023): Time 1 tem 40 pontos, Time 2 tem 50 pontos e Time 3 tem 30 pontos.
- **Rodada 8** (8 de janeiro de 2023): Time 1 tem 45 pontos, Time 2 tem 55 pontos e Time 3 tem 35 pontos.
- **Rodada 9** (9 de janeiro de 2023): Time 1 tem 50 pontos, Time 2 tem 60 pontos e Time 3 tem 40 pontos.
- **Rodada 10** (10 de janeiro de 2023): Time 1 tem 55 pontos, Time 2 tem 65 pontos e Time 3 tem 45 pontos.

Em cada etapa da animação, a barra mais longa representa o time com mais pontos naquela rodada, enquanto a barra mais curta representa o time com menos pontos. As barras mudam de tamanho e posição ao longo do tempo para refletir a mudança na classificação dos times.


## Usando o Bard e o ChatGPT para auxiliar na criação de gráficos dinâmicos

O Bard e o ChatGPT são grandes modelos de linguagem com a capacidade de auxiliar muito nas suas tarefas e inclusive para criar um gráfico dinâmico.

<table>
<tr>
<td> <img src="https://logowik.com/content/uploads/images/google-bard3872.logowik.com.webp" alt="Google" style="width: 600px;"/> </td>
    
<td> <img src="https://freelogopng.com/images/all_img/1681038628chatgpt-icon-logo.png" alt="ChatGPT" style="width: 100px;"/> </td>
    
</tr>
</table>







## Considerações Finais

Os bar chart races podem ser usados para visualizar dados de qualquer tipo. Eles são uma ferramenta muito versátil, e pode ser usada para fins diversos, seja como nos exemplos dados sobre entender a COVID-19, ou mesmo só como entretenimento, curiosidades. Vários canais do Youtube inclusive utilizam desses gráficos pra representarem os "Top 10,50,100" relacionado a vários conteúdos. Para um cientista de dados poder combinar a simplicidade de um gráfico de barras com animação, facilita, auxiliando na compreensão da visualização dos dados.

Para conferir análises, informações mais completas, os códigos dos projetos citados estão no meu repositório do [GitHub](https://github.com/fabioolivei/Fabio_Olivei_Data_Sciense).
```
---