# Mini-projeto 04 — Visualização

Storytelling rápido: 2 gráficos + 1 visual interativo salvo em HTML.

> Entregável de portfólio — gerado em 2026-01-30.


## Objetivo

        Criar gráficos com matplotlib/seaborn e um gráfico interativo com plotly, salvando evidências em `assets/`.

        ## Entregáveis (para portfólio)

        - [ ] `assets/series_temporal.png`
- [ ] `assets/heatmap_categoria_regiao.png`
- [ ] `assets/plotly_receita_categoria.html`

        ## Como usar

        1- Rode este notebook (kernel com o `.venv` do repo)  
        2- Gere **assets** (imagens/HTML) e **reports** (markdown/json) dentro desta pasta  
        3- Faça commit dos arquivos gerados para evidenciar o resultado no GitHub

In [None]:
# Setup: detectar raiz do repositório + paths padrão
from pathlib import Path
import pandas as pd
import numpy as np

def find_repo_root(start: Path | None = None) -> Path:
    p = (start or Path.cwd()).resolve()
    for _ in range(12):
        if (p / "requirements.txt").exists() and (p / "README.md").exists():
            return p
        p = p.parent
    return (start or Path.cwd()).resolve()

ROOT = find_repo_root()
DATA_SAMPLE = ROOT / "data" / "sample"
DATA_SOURCE = ROOT / "data" / "source" / "bases-dados-analytics-powerbi-ml"

# Pasta do projeto (onde salvar assets/outputs/reports)
PROJ = ROOT / "projects" / "04_visualizacao"
ASSETS = PROJ / "assets"
OUTPUTS = PROJ / "outputs"
REPORTS = PROJ / "reports"
for d in (ASSETS, OUTPUTS, REPORTS):
    d.mkdir(parents=True, exist_ok=True)

# Dataset padrão (sempre disponível)
sales_path = DATA_SAMPLE / "sales.csv"
customers_path = DATA_SAMPLE / "customers.csv"
sales = pd.read_csv(sales_path, parse_dates=["date"])
customers = pd.read_csv(customers_path, parse_dates=["signup_date"])

# Dataset real (opcional): se você adicionou o submodule/clone em dados/source/
has_real = DATA_SOURCE.exists()

print("ROOT:", ROOT)
print("Dataset sample:", sales.shape, customers.shape)
print("Dataset real disponível?", has_real)

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px

df = sales.copy()
df["date"] = pd.to_datetime(df["date"], errors="coerce")

# 1) Série temporal (matplotlib)
daily = df.groupby("date", as_index=False)["revenue"].sum()
plt.figure()
plt.plot(daily["date"], daily["revenue"])
plt.title("Receita diária (sample)")
plt.xticks(rotation=30, ha="right")
out1 = ASSETS / "series_temporal.png"
plt.tight_layout()
plt.savefig(out1, dpi=160)
plt.close()
print("Salvo:", out1)

# 2) Heatmap (seaborn)
pivot = df.pivot_table(index="region", columns="category", values="revenue", aggfunc="sum", fill_value=0)
plt.figure()
sns.heatmap(pivot, annot=False)
plt.title("Receita por região x categoria")
out2 = ASSETS / "heatmap_categoria_regiao.png"
plt.tight_layout()
plt.savefig(out2, dpi=160)
plt.close()
print("Salvo:", out2)

# 3) Plotly (HTML)
by_cat = df.groupby("category", as_index=False)["revenue"].sum().sort_values("revenue", ascending=False)
fig = px.bar(by_cat, x="category", y="revenue", title="Receita por categoria (interativo)")
out3 = ASSETS / "plotly_receita_categoria.html"
fig.write_html(str(out3), include_plotlyjs="cdn")
print("Salvo:", out3)

## Evidências

![](./assets/series_temporal.png)

![](./assets/heatmap_categoria_regiao.png)

Abra o HTML em `assets/plotly_receita_categoria.html`.
