
# Bar Chart Race — Manifestações por período (diário/mensal)

Gera um **ranking animado** a partir de uma base em formato longo com:

- `data` (YYYY-MM-DD ou YYYY-MM)
- `categoria` (ex.: Linha, Tipo)
- `valor` (quantidade no período)

Ajuste as variáveis na seção **Configuração** e rode as células.


In [None]:

# Bibliotecas
import os, math
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from matplotlib import animation
from matplotlib.animation import PillowWriter

pd.set_option("display.max_rows", 10)



## 1) Configuração


In [None]:

# >>>>>>> edite aqui <<<<<<<
ARQUIVO_DADOS = None  # ex.: "manifestacoes.csv"  (deixe None para usar um exemplo sintético)
FREQ = "M"            # "D" = diário | "M" = mensal
TOP_N = 10            # Top N do ranking
STEPS_PER_PERIOD = 10 # suavização (maior = mais liso e mais pesado)
FPS = 20              # frames por segundo
SAIDA = "bar_chart_race_manifestacoes.gif"  # .gif (Pillow) ou .mp4 (se FFMPEG disponível)

# Se suas colunas tiverem outros nomes, ajuste aqui:
COL_DATA = "data"
COL_CATEGORIA = "categoria"
COL_VALOR = "valor"



## 2) Carregamento da base


In [None]:

def carregar_base(arquivo):
    if arquivo is None:
        # Exemplo sintético para você ver funcionando
        rng = pd.date_range("2024-01-01", "2025-07-31", freq="D")
        linhas = ["Linha 7","Linha 10","Linha 11","Linha 12","Linha 13"]
        dados = []
        rs = np.random.RandomState(42)
        for d in rng:
            base = rs.poisson(lam=[40,28,25,35,30]).astype(float)
            saz = 10*np.sin(2*np.pi*(d.dayofyear)/365.0)
            base = base + saz + rs.normal(0,5,len(base))
            for cat, v in zip(linhas, base):
                dados.append([d, cat, max(0, int(round(v)))])
        df = pd.DataFrame(dados, columns=[COL_DATA, COL_CATEGORIA, COL_VALOR])
    else:
        if arquivo.lower().endswith(".csv"):
            df = pd.read_csv(arquivo)
        else:
            df = pd.read_excel(arquivo)
        cols_lower = {c.lower(): c for c in df.columns}
        for alvo, candidatos in [(COL_DATA, ["data","mes_ano","mesano","mes","dia","date"]), 
                                 (COL_CATEGORIA, ["categoria","linha","tipo","classe"]),
                                 (COL_VALOR, ["valor","qtd","quantidade","manifestacoes","manifestações","volume"])]:
            if alvo not in df.columns:
                for c in candidatos:
                    if c in cols_lower:
                        df.rename(columns={cols_lower[c]: alvo}, inplace=True)
                        break
        if COL_DATA not in df.columns or COL_CATEGORIA not in df.columns or COL_VALOR not in df.columns:
            raise ValueError("A base deve conter colunas equivalentes a: data, categoria, valor.")
    df[COL_DATA] = pd.to_datetime(df[COL_DATA], errors="coerce")
    df = df.dropna(subset=[COL_DATA, COL_CATEGORIA, COL_VALOR]).copy()
    df[COL_CATEGORIA] = df[COL_CATEGORIA].astype(str)
    df[COL_VALOR] = pd.to_numeric(df[COL_VALOR], errors="coerce").fillna(0).astype(int)
    return df

df_long = carregar_base(ARQUIVO_DADOS)
df_long.head()



## 3) Preparação do painel


In [None]:

def preparar_painel(df, freq="M"):
    df = df.copy()
    if freq not in ("D","M"):
        raise ValueError("freq deve ser 'D' (diário) ou 'M' (mensal).")
    if freq == "M":
        df["periodo"] = df[COL_DATA].dt.to_period("M").dt.to_timestamp()
    else:
        df["periodo"] = df[COL_DATA].dt.floor("D")
    agg = (df.groupby(["periodo", COL_CATEGORIA], as_index=False)[COL_VALOR].sum()
             .sort_values(["periodo", COL_VALOR], ascending=[True, False]))
    painel = agg.pivot_table(index="periodo", columns=COL_CATEGORIA, values=COL_VALOR, fill_value=0)
    painel = painel.sort_index()
    return painel, agg

painel, agg = preparar_painel(df_long, FREQ)
painel.head()



## 4) Função do bar chart race


In [None]:

from matplotlib.cm import get_cmap

def bar_chart_race(painel, top_n=10, steps_per_period=10, fps=20, saida="bar_chart_race.gif", titulo=None):
    painel = painel.copy().astype(float).fillna(0.0)
    periods = painel.index.to_list()
    cats = list(painel.columns)
    cmap = get_cmap("tab20")
    cores = {c: cmap(i % 20) for i, c in enumerate(sorted(cats))}
    frames = []
    for i in range(len(periods)-1):
        a, b = periods[i], periods[i+1]
        va = painel.loc[a]
        vb = painel.loc[b]
        union_cats = sorted(set(va.index) | set(vb.index))
        va = va.reindex(union_cats).fillna(0)
        vb = vb.reindex(union_cats).fillna(0)
        for s in range(steps_per_period):
            t = s / float(steps_per_period)
            v = va*(1-t) + vb*t
            frames.append((a, v))
    frames.append((periods[-1], painel.iloc[-1].reindex(cats).fillna(0)))
    fig, ax = plt.subplots(figsize=(10, 6))
    ax.set_facecolor("#f8f8f8")
    fig.patch.set_facecolor("#f8f8f8")
    ax.grid(axis="x", zorder=0, linestyle="--", alpha=0.3)
    title_text = ax.text(0.5, 1.05, titulo or "Bar Chart Race", transform=ax.transAxes,
                         ha="center", va="bottom", fontsize=16, weight="bold")
    date_text = ax.text(0.98, 0.95, "", transform=ax.transAxes, ha="right", va="top",
                        fontsize=12, family="monospace")
    def draw_frame(frame_data):
        periodo, valores = frame_data
        ax.clear()
        ax.set_facecolor("#f8f8f8")
        ax.grid(axis="x", zorder=0, linestyle="--", alpha=0.3)
        top = valores.sort_values(ascending=False).head(top_n)[::-1]
        ax.barh(top.index, top.values, color=[cores[c] for c in top.index], zorder=3)
        for cat, val in zip(top.index, top.values):
            ax.text(val, cat, f" {int(val):,}".replace(",", "."), va="center", ha="left", fontsize=11)
        ax.set_xlim(0, max(1, valores.max())*1.15)
        ax.set_xlabel("Quantidade")
        ax.set_ylabel("Categoria")
        title_text.set_text(titulo or "Bar Chart Race")
        date_text.set_text(pd.to_datetime(periodo).strftime("%Y-%m-%d"))
    ani = animation.FuncAnimation(fig, draw_frame, frames=frames, interval=1000/fps, blit=False, repeat=False)
    if saida.lower().endswith(".gif"):
        ani.save(saida, writer=PillowWriter(fps=fps))
    else:
        try:
            ani.save(saida, fps=fps)
        except Exception as e:
            print("FFMPEG não disponível. Salve como .gif ou instale FFMPEG. Erro:", e)
    plt.close(fig)
    return saida



## 5) Gerar o GIF/MP4


In [None]:

titulo = f"Manifestações — Ranking por {('dia' if FREQ=='D' else 'mês')} (Top {TOP_N})"
arquivo_saida = bar_chart_race(
    painel,
    top_n=TOP_N,
    steps_per_period=STEPS_PER_PERIOD,
    fps=FPS,
    saida=SAIDA,
    titulo=titulo
)
arquivo_saida
