# Notebook 02 — Camada Analítica (SQLite → tabelas para BI)

**Objetivo (simples):** ler os dados **certificados** no SQLite e gerar tabelas prontas para dashboard:

- `fato_vendas_analitica` (nível de venda / linha)
- `vendas_mensais` (agregado por mês)
- `meta_vs_realizado` (meta x realizado por mês)

> Este notebook **não mexe** no Excel.  
> Ele lê do SQLite e grava novas tabelas analíticas no **mesmo SQLite**.


In [None]:
# =========================
# 0) Configuração
# =========================
import pandas as pd
import sqlite3
from pathlib import Path

DB_PATH = Path("database") / "dados_tratados.db"
print("SQLite:", DB_PATH.resolve())


In [None]:
# =========================
# 1) Ler tabelas certificadas
# =========================
with sqlite3.connect(DB_PATH) as conn:
    vendas = pd.read_sql("SELECT * FROM vendas_certificadas", conn)
    produtos = pd.read_sql("SELECT * FROM produtos_certificados", conn)
    metas = pd.read_sql("SELECT * FROM metas_certificadas", conn)

print("Linhas vendas:", len(vendas))
print("Linhas produtos:", len(produtos))
print("Linhas metas:", len(metas))

display(vendas.head())


In [None]:
# =========================
# 2) Tipos básicos (só o necessário)
# =========================
vendas["data_venda"] = pd.to_datetime(vendas["data_venda"], errors="coerce")
vendas["quantidade"] = pd.to_numeric(vendas["quantidade"], errors="coerce")
vendas["preco_unitario_oficial"] = pd.to_numeric(vendas["preco_unitario_oficial"], errors="coerce")

# Produtos: custo_unitario é opcional (se existir, calculamos lucro)
if "custo_unitario" in produtos.columns:
    produtos["custo_unitario"] = pd.to_numeric(produtos["custo_unitario"], errors="coerce")

# Metas
if "meta_faturamento" in metas.columns:
    metas["meta_faturamento"] = pd.to_numeric(metas["meta_faturamento"], errors="coerce")


## 3) Criar a Fato Analítica

- `ano_mes` (YYYY-MM) para facilitar gráficos
- `receita` = quantidade × preço oficial
- se existir `custo_unitario` em produtos:
  - `custo_total`, `lucro`, `margem`


In [None]:
# =========================
# 3) Fato analítica
# =========================
# Join com produtos (para trazer custo_unitario, se existir)
cols_prod = ["id_produto"]
if "custo_unitario" in produtos.columns:
    cols_prod.append("custo_unitario")

fato = vendas.merge(produtos[cols_prod], on="id_produto", how="left")

# ano_mes (ótimo pro BI)
fato["ano_mes"] = fato["data_venda"].dt.to_period("M").astype(str)

# receita
fato["receita"] = fato["quantidade"] * fato["preco_unitario_oficial"]

# custo/lucro/margem só se tiver custo_unitario
if "custo_unitario" in fato.columns:
    fato["custo_total"] = fato["quantidade"] * fato["custo_unitario"]
    fato["lucro"] = fato["receita"] - fato["custo_total"]
    fato["margem"] = (fato["lucro"] / fato["receita"]).where(fato["receita"] != 0)
else:
    fato["custo_total"] = pd.NA
    fato["lucro"] = pd.NA
    fato["margem"] = pd.NA
    print("⚠️ Não encontrei 'custo_unitario' em produtos_certificados. Vou gerar só receita (sem lucro/margem).")

# Colunas finais (simples e úteis)
cols_fato = [
    "data_venda","ano_mes","id_produto","id_cliente","canal_venda","quantidade",
    "preco_unitario_oficial","receita","custo_total","lucro","margem"
]
cols_fato = [c for c in cols_fato if c in fato.columns]
fato = fato[cols_fato].copy()

display(fato.head())


## 4) Agregação mensal

Aqui a gente cria uma tabela resumida por mês (ótima pro dashboard).


In [None]:
# =========================
# 4) Vendas mensais
# =========================
vendas_mensais = (
    fato.groupby("ano_mes", as_index=False)
        .agg(
            receita=("receita", "sum"),
            quantidade=("quantidade", "sum"),
            vendas=("ano_mes", "count")
        )
)

# lucro e margem mensal só se existir lucro
if "lucro" in fato.columns and fato["lucro"].notna().any():
    lucro_mensal = fato.groupby("ano_mes", as_index=False).agg(lucro=("lucro", "sum"))
    vendas_mensais = vendas_mensais.merge(lucro_mensal, on="ano_mes", how="left")
    vendas_mensais["margem"] = (vendas_mensais["lucro"] / vendas_mensais["receita"]).where(vendas_mensais["receita"] != 0)
else:
    vendas_mensais["lucro"] = pd.NA
    vendas_mensais["margem"] = pd.NA

display(vendas_mensais)


## 5) Meta vs Realizado

Junta `metas_certificadas` com `vendas_mensais` para comparar meta e realizado.


In [None]:
# =========================
# 5) Meta vs Realizado
# =========================
if "ano_mes" not in metas.columns:
    if "mes" in metas.columns:
        metas = metas.rename(columns={"mes": "ano_mes"})
    else:
        raise ValueError("A tabela metas_certificadas precisa ter uma coluna 'ano_mes' (ou 'mes').")

meta_vs_realizado = metas.merge(
    vendas_mensais[["ano_mes","receita","lucro","margem"]],
    on="ano_mes",
    how="left"
)

if "meta_faturamento" in meta_vs_realizado.columns:
    meta_vs_realizado["atingimento_meta"] = (meta_vs_realizado["receita"] / meta_vs_realizado["meta_faturamento"]).where(meta_vs_realizado["meta_faturamento"] != 0)
else:
    meta_vs_realizado["atingimento_meta"] = pd.NA
    print("⚠️ Não encontrei 'meta_faturamento' em metas_certificadas. Vou salvar mesmo assim, mas sem atingimento.")

display(meta_vs_realizado)


## 6) Salvar tabelas analíticas no SQLite

Essas tabelas são as que você conecta no Metabase/Power BI.


In [None]:
# =========================
# 6) Persistência no SQLite
# =========================
with sqlite3.connect(DB_PATH) as conn:
    fato.to_sql("fato_vendas_analitica", conn, if_exists="replace", index=False)
    vendas_mensais.to_sql("vendas_mensais", conn, if_exists="replace", index=False)
    meta_vs_realizado.to_sql("meta_vs_realizado", conn, if_exists="replace", index=False)

print("✅ Tabelas analíticas salvas:")
print("- fato_vendas_analitica")
print("- vendas_mensais")
print("- meta_vs_realizado")


In [None]:
# =========================
# 7) Sanity check
# =========================
with sqlite3.connect(DB_PATH) as conn:
    chk = pd.read_sql("""
        SELECT
          (SELECT COUNT(*) FROM fato_vendas_analitica) AS linhas_fato,
          (SELECT COUNT(*) FROM vendas_mensais) AS linhas_mensais,
          (SELECT COUNT(*) FROM meta_vs_realizado) AS linhas_meta
    """, conn)

display(chk)
