# Capítulo 3 - PMF, CDF e PDF

Objetivos:
- Entender a diferença entre variáveis **discretas** e **contínuas**.
- Calcular e visualizar **PMF (Probability Mass Function)** para dados discretos.
- Calcular e visualizar **CDF (Cumulative Distribution Function)**.
- Entender e visualizar **PDF (Probability Density Function)** para dados contínuos.


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
from scipy.stats import norm


In [None]:
# Exemplo: lançamentos de um dado (variável discreta)
dados = [1,2,3,4,5,6,6,6,3,2,1,4,6,5,3,2,2,6,1,4]
s = pd.Series(dados)

pmf = s.value_counts(normalize=True).sort_index()
print("PMF (probabilidades):")
print(pmf)

pmf.plot(kind="bar")
plt.title("PMF - Distribuição de um dado")
plt.xlabel("Número no dado")
plt.ylabel("Probabilidade")
plt.savefig("../images/pmf_dado.png")
plt.show()


A **PMF** mostra a probabilidade de cada valor discreto.
No exemplo acima:
- `s.value_counts(normalize=True)` conta as ocorrências e divide pelo total.
- O resultado é a probabilidade empírica de cada face do dado.


In [None]:
cdf_dado = pmf.cumsum()
print("CDF (probabilidades acumuladas):")
print(cdf_dado)

cdf_dado.plot(drawstyle="steps-post", marker="o")
plt.title("CDF - Dado (discreto)")
plt.xlabel("Número no dado")
plt.ylabel("Probabilidade acumulada")
plt.savefig("../images/cdf_dado.png")
plt.show()


A **CDF** (discreta) é a soma acumulada das probabilidades.
Exemplo: CDF(3) = P(X ≤ 3).


In [None]:
# Exemplo: altura ~ Normal(170, 10)
x = np.linspace(140, 200, 500)
pdf = norm.pdf(x, loc=170, scale=10)

plt.plot(x, pdf)
plt.title("PDF - Altura (Normal(170,10))")
plt.xlabel("Altura (cm)")
plt.ylabel("Densidade")
plt.savefig("../images/pdf_normal.png")
plt.show()


A **PDF** representa a função densidade de probabilidade.
- Usada para variáveis contínuas.
- A probabilidade de um valor exato é ~0.
- O que importa é a **área sob a curva em um intervalo**.


In [None]:
cdf = norm.cdf(x, loc=170, scale=10)

plt.plot(x, cdf)
plt.title("CDF - Altura (Normal(170,10))")
plt.xlabel("Altura (cm)")
plt.ylabel("Probabilidade acumulada")
plt.savefig("../images/cdf_normal.png")
plt.show()


## Conclusão do Capítulo 3
- **PMF**: probabilidade em variáveis discretas (ex.: dado).
- **CDF**: probabilidade acumulada até um valor.
- **PDF**: densidade de probabilidade em variáveis contínuas.

Em resumo:
- PMF → discreto
- PDF → contínuo
- CDF → acumulado (vale para os dois)
