#  박스플롯(Boxplot)의 **이상치(outlier) 기준**

박스플롯에서 이상치를 판단하는 가장 대표적인 규칙은 **IQR(InterQuartile Range) 규칙**입니다.

---

#  1. IQR(사분위 범위) 정의
### IQR 상위 25%~하위 25%를 제외한 중간 50% 값들의 폭

- Q1 = 1사분위수 (25%)
- Q3 = 3사분위수 (75%)
- IQR = Q3 − Q1

$$ IQR = Q3 - Q1 $$

---

#  2. 이상치(outlier) 기준

###  **아래 범위를 벗어나면 이상치로 판단**

---

##  **Mild Outlier (경미한 이상치)**  
(일반적으로 "이상치"라고 하면 이 기준)

정규분포(가우시안) 데이터 기준으로 보면:
- 평균 ± 2.7σ 정도가
- IQR ± 1.5×IQR 에 해당
- 중간에 몰려 있는 “평범한 값들의 구역”에서
- 너무 멀리 떨어진 값은 이상치라고 판단하는 것

$$
\text{Lower Bound} = Q1 - 1.5 \times IQR
$$

$$
\text{Upper Bound} = Q3 + 1.5 \times IQR
$$

 이 범위 밖의 값은 **확률적으로 보기 어려운 값** → 이상치

---

##  **Extreme Outlier (극단 이상치)**

$$
\text{Lower Extreme} = Q1 - 3 \times IQR
$$

$$
\text{Upper Extreme} = Q3 + 3 \times IQR
$$

 통계적으로 **더 강하게 이상치**로 판단

---

#  예시 코드 (Pandas)

```python
import pandas as pd

s = pd.Series([1,2,3,4,5,100])

Q1 = s.quantile(0.25)
Q3 = s.quantile(0.75)

# IQR 상위 25%~하위 25%를 제외한 중간 50% 값들의 폭
IQR = Q3 - Q1

# 중간에 몰려 있는 “평범한 값들의 구역”에서
# 너무 멀리 떨어진 값은 이상치라고 판단하는 것
lower = Q1 - 1.5 * IQR
upper = Q3 + 1.5 * IQR

lower, upper


#   Z-Score (표준점수) 기반 이상치 탐지

정규분포(가우시안 분포) 가정일 때 가장 흔히 사용됩니다.

- 평균에서 **몇 표준편차** 떨어져 있는지 확인
- 보통 `|Z| > 3` → 이상치

$$
Z = \frac{x - \mu}{\sigma}
$$

```python
import numpy as np
import pandas as pd

s = pd.Series([1,2,3,4,5,100])

z = (s - s.mean()) / s.std()
outliers = s[z.abs() > 3]
