# stats 통계 예시

1. 기본 통계
2. 확률 분포
3. 분류기 성능
4. 성능 지표
5. 해석

In [None]:
# 라이브러리 불러오기
import numpy as np
import matplotlib.pyplot as plt
from sklearn.metrics import confusion_matrix, ConfusionMatrixDisplay
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
from scipy import stats


In [None]:
# 1. 기본 통계
data = [1, 3, 4, 4, 13]

mean   = np.mean(data)
median = np.median(data)
mode   = stats.mode(data, keepdims = True)[0][0]

print("Data:", data)
print("Mean:", mean)
print("Median:", median)
print("Mode:", mode)
print()


In [None]:
# 2. 확률 분포
uniform = np.random.uniform(low = 0, high = 1, size = 1000 ) # 균등 분포
normal = np.random.normal(loc = 0, scale = 1, size = 1000 ) # 정규 분포
bernoulli = np.random.binomial(n =1, p =0.5, size = 1000 ) # 베르누이 분포 (장리 던지기)

# 시각화
plt.figure(figsize = (12, 4))

plt.subplot(1,3,1)
plt.hist(uniform, bins = 20, color ='skyblue', edgecolor = 'black')
plt.title("Uniform (0~1)")

plt.subplot(1,3,2)
plt.hist(uniform, bins = 20, color ='skyblue', edgecolor = 'black')
plt.title("Normal")

plt.subplot(1,3,3)
plt.hist(uniform, bins = 20, color ='skyblue', edgecolor = 'black')
plt.title("bernoulli (p = 0.5)")

plt.tight_layout()
plt.show()

# 3. 분류기 성능 

# 가상의 의료 테스트 시뮬레이션
# 실제 레이블 (1 = 질병 있음, 0 = 건강)
y_true = np.array([1,1,1,1,0,0,0,0,0,0])

# 예측 결과
y_pred = np.array([1,0,1,0,1,0,0,1,0])

# 혼동 행렬
cm = confusion_matrix(y_true, y_pred)
disp = ConfusionMatrixDisplay(
    confusion_matrix= cm,
    display_labels =  cm,
    display_labels = ["Healthy(0)", "Sick(1)"]
)
disp.plot(cmap="Blues")
plt.title("Confusion Matrix")



# 4. 성능 지표

accuracy = accuracy_score(y_true, y_pred) #정확도
precision = precision_score(y_true, y_pred) #정밀도
recall = recall_score(y_true, y_pred) # 재현율
f1_score = f1_score(y_true, y_pred) # (정밀도 및 재현율)

print("Acc:", accuracy)
print("Prec:", precision)
print("Recall:", recall)
print("F1:", f1_score)



### 해석 

**1. Accurancy: 전체 예측 중 얼마나 맞췄는가?**

**2. Precision: 양성이라고 한 것 중 실제 양성이 얼마나 되는가?**

**3. Recall: 실제 양성 중 얼마나 마췄는가?**

**4. F1: Precision과 Recall의 균형을 나타냅니다.**