# 02 — Numpy: estatística + simulação (random)

Objetivo: usar amostragem e simulação para estimar cenários (demanda, receita, risco).

Tempo: ~25–30 min

In [None]:
from pathlib import Path

def find_repo_root(start: Path | None = None) -> Path:
    """Sobe diretórios até encontrar uma 'marca' do repositório (README.md + pasta data)."""
    cur = (start or Path.cwd()).resolve()
    for _ in range(10):
        if (cur / "README.md").exists() and (cur / "data").exists():
            return cur
        cur = cur.parent
    # fallback: assume cwd
    return Path.cwd().resolve()

ROOT = find_repo_root()
DATA_DIR = ROOT / "data"
SAMPLE_DIR = DATA_DIR / "sample"

print("ROOT:", ROOT)
print("SAMPLE_DIR:", SAMPLE_DIR)

In [None]:
import pandas as pd

sales = pd.read_csv(SAMPLE_DIR / "sales.csv")
customers = pd.read_csv(SAMPLE_DIR / "customers.csv")

display(sales.head())
display(customers.head())

## 1) Distribuição de revenue

Vamos usar percentis como base para simulação.

In [None]:
import numpy as np

revenue = sales["revenue"].to_numpy()

p50 = np.percentile(revenue, 50)
p90 = np.percentile(revenue, 90)
p95 = np.percentile(revenue, 95)

p50, p90, p95

## 2) Simulação simples

Cenário: "Se eu tiver 1.000 pedidos similares, quanto pode dar a receita total?"

In [None]:
rng = np.random.default_rng(42)

# Amostra com reposição da distribuição observada
sim = rng.choice(revenue, size=(1000, 1000), replace=True)  # 1000 simulações, 1000 pedidos cada
totals = sim.sum(axis=1)

totals.mean(), np.percentile(totals, [5,50,95])

## 3) Interpretação

- média: expectativa
- p05/p95: faixa provável

Você pode levar isso para um storytelling de risco/planejamento.

## Exercícios

1- Rode a simulação com 5.000 pedidos por simulação.
2- Simule aplicando um desconto de 5% em `unit_price` antes de calcular revenue.
3- Calcule a probabilidade de a receita total passar de X (escolha um X).

In [None]:
# Escreva suas respostas aqui
