# Mini-projeto 01 — Fundamentos aplicados a dados

Transformar perguntas de negócio em código Python (sem Pandas pesado).

> Entregável de portfólio — gerado em 2026-01-30.


## Objetivo

        Responder perguntas simples usando estruturas nativas (listas/dicts), funções, comprehensions e tratamento de erros.

        ## Entregáveis (para portfólio)

        - [ ] `reports/perguntas_negocio.md`
- [ ] Funções reutilizáveis (no próprio notebook)
- [ ] Pequena validação/defesa contra dados faltantes

        ## Como usar

        1- Rode este notebook (kernel com o `.venv` do repo)  
        2- Gere **assets** (imagens/HTML) e **reports** (markdown/json) dentro desta pasta  
        3- Faça commit dos arquivos gerados para evidenciar o resultado no GitHub

In [None]:
# Setup: detectar raiz do repositório + paths padrão
from pathlib import Path
import pandas as pd
import numpy as np

def find_repo_root(start: Path | None = None) -> Path:
    p = (start or Path.cwd()).resolve()
    for _ in range(12):
        if (p / "requirements.txt").exists() and (p / "README.md").exists():
            return p
        p = p.parent
    return (start or Path.cwd()).resolve()

ROOT = find_repo_root()
DATA_SAMPLE = ROOT / "data" / "sample"
DATA_SOURCE = ROOT / "data" / "source" / "bases-dados-analytics-powerbi-ml"

# Pasta do projeto (onde salvar assets/outputs/reports)
PROJ = ROOT / "projects" / "01_fundamentos"
ASSETS = PROJ / "assets"
OUTPUTS = PROJ / "outputs"
REPORTS = PROJ / "reports"
for d in (ASSETS, OUTPUTS, REPORTS):
    d.mkdir(parents=True, exist_ok=True)

# Dataset padrão (sempre disponível)
sales_path = DATA_SAMPLE / "sales.csv"
customers_path = DATA_SAMPLE / "customers.csv"
sales = pd.read_csv(sales_path, parse_dates=["date"])
customers = pd.read_csv(customers_path, parse_dates=["signup_date"])

# Dataset real (opcional): se você adicionou o submodule/clone em dados/source/
has_real = DATA_SOURCE.exists()

print("ROOT:", ROOT)
print("Dataset sample:", sales.shape, customers.shape)
print("Dataset real disponível?", has_real)

In [None]:
# 1) Transformar DataFrame -> registros (dicts) e responder perguntas com Python "puro"
records = sales.to_dict(orient="records")

def safe_float(x, default=0.0):
    try:
        return float(x)
    except Exception:
        return default

# Receita total
total_revenue = sum(safe_float(r.get("revenue")) for r in records)

# Receita por região (dict)
revenue_by_region = {}
for r in records:
    reg = r.get("region", "N/A")
    revenue_by_region[reg] = revenue_by_region.get(reg, 0.0) + safe_float(r.get("revenue"))

top_regions = sorted(revenue_by_region.items(), key=lambda kv: kv[1], reverse=True)

# 2) Escrever um report simples em Markdown
lines = []
lines.append("# Perguntas de negócio — 01_fundamentos\n")
lines.append(f"## Receita total\n- R$ {total_revenue:,.2f}\n")
lines.append("## Receita por região (Top)\n")
for reg, val in top_regions:
    lines.append(f"- {reg}: R$ {val:,.2f}")

out = REPORTS / "perguntas_negocio.md"
out.write_text("\n".join(lines), encoding="utf-8")
print("Salvo:", out)

## Evidências

- Abra `reports/perguntas_negocio.md` e valide se o texto está claro.
