# Capítulo 2 - Medidas de Centralidade e Dispersão

Objetivos:
- Calcular média, mediana e moda.
- Medir dispersão: variância, desvio padrão, amplitude e IQR.
- Visualizar a distribuição com boxplot e interpretar quartis/outliers.


In [None]:
import pandas as pd
import matplotlib.pyplot as plt
from statistics import mode


In [None]:
# Exemplo: notas fictícias de uma turma (0 a 10)
notas = [5.5, 7.0, 8.5, 9.0, 6.0, 7.5, 8.0, 6.5, 7.0, 9.5,
         8.0, 7.0, 6.0, 8.5, 5.0, 9.0, 7.5, 8.0, 6.5, 7.0]
s = pd.Series(notas)
s.head()


In [None]:
media = s.mean()
mediana = s.median()
moda = mode(notas)  # statistics.mode retorna a moda (se houver tie, pode levantar erro)

media, mediana, moda


**Centralidade**
- **Média**: ponto de equilíbrio (influenciada por valores extremos).
- **Mediana**: valor central (robusta a outliers).
- **Moda**: valor mais frequente.


In [None]:
variancia = s.var(ddof=1)   # amostral (ddof=1)
desvio_padrao = s.std(ddof=1)
amplitude = s.max() - s.min()

# Quartis e IQR
q1 = s.quantile(0.25)
q3 = s.quantile(0.75)
iqr = q3 - q1

variancia, desvio_padrao, amplitude, q1, q3, iqr


**Dispersão**
- **Variância / Desvio-padrão**: quão espalhados estão os dados em torno da média.
- **Amplitude**: diferença entre máx e mín.
- **Quartis (Q1, Q3) e IQR (Q3 - Q1)**: dispersão “robusta” (menos sensível a outliers).


In [None]:
limite_inferior = q1 - 1.5 * iqr
limite_superior = q3 + 1.5 * iqr
outliers = s[(s < limite_inferior) | (s > limite_superior)]

limite_inferior, limite_superior, outliers.tolist()


In [None]:
plt.boxplot(notas, vert=True, patch_artist=True)
plt.title("Boxplot das Notas")
plt.ylabel("Nota")
plt.grid(axis="y", alpha=0.4)
plt.savefig("../images/cap2_boxplot.png")
plt.show()


## Conclusão do Capítulo 2
- Média, mediana e moda resumem a **tendência central**.
- Variância, desvio-padrão, amplitude e IQR medem a **dispersão**.
- O **boxplot** resume mediana, quartis e evidencia possíveis **outliers**.
- Para relatórios, combine **tabela de métricas** + **boxplot**.
