## Experimento 7 — Estatística Descritiva
**Objetivo:** calcular métricas descritivas e tratar outliers por IQR.

**Enunciado:**  
1. Carregue o dataset **Iris** (`sklearn.datasets.load_iris`) e crie um `DataFrame` com `sepal length (cm)`.  
2. Calcule **média, mediana e desvio padrão** dessa variável.  
3. **Tarefa Extra:** **remova outliers** usando a regra do **IQR (Q3 − Q1)** e **recalcule** as métricas.


[![Abrir no Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/flavioluizseixas/aprendizado-de-maquina-na-saude/blob/main/0-Nivelamento/Experimento_07.ipynb)

In [1]:
from sklearn.datasets import load_iris

In [2]:
# Código-base
iris = load_iris(as_frame=True)
df = iris.frame[['sepal length (cm)']].copy()
df.rename(columns={'sepal length (cm)': 'sepal_length'}, inplace=True)

media = df['sepal_length'].mean()
mediana = df['sepal_length'].median()
desvio = df['sepal_length'].std()

print(f"Média: {media:.3f}, Mediana: {mediana:.3f}, Desvio: {desvio:.3f}")


Média: 5.843, Mediana: 5.800, Desvio: 0.828


### Adaptação (Extra)
- Calcule Q1 e Q3 com `quantile(0.25)` e `quantile(0.75)`.
- IQR = Q3 − Q1.
- Limites: inferior = Q1 − 1.5*IQR, superior = Q3 + 1.5*IQR.
- Filtre o DataFrame e recalcule as métricas.


In [3]:
# Código final (com Extra)
iris = load_iris(as_frame=True)
df = iris.frame[['sepal length (cm)']].copy()
df.rename(columns={'sepal length (cm)': 'sepal_length'}, inplace=True)

Q1 = df['sepal_length'].quantile(0.25)
Q3 = df['sepal_length'].quantile(0.75)
IQR = Q3 - Q1
low, high = Q1 - 1.5*IQR, Q3 + 1.5*IQR

df_no_out = df[(df['sepal_length'] >= low) & (df['sepal_length'] <= high)]

def resumo(serie):
    return serie.mean(), serie.median(), serie.std()

m1, md1, sd1 = resumo(df['sepal_length'])
m2, md2, sd2 = resumo(df_no_out['sepal_length'])

print("Com outliers ->", f"Média: {m1:.3f}, Mediana: {md1:.3f}, Desvio: {sd1:.3f}")
print("Sem outliers  ->", f"Média: {m2:.3f}, Mediana: {md2:.3f}, Desvio: {sd2:.3f}")


Com outliers -> Média: 5.843, Mediana: 5.800, Desvio: 0.828
Sem outliers  -> Média: 5.843, Mediana: 5.800, Desvio: 0.828
