## 통계 Markdown 📘

## 1. 기술 통계

데이터를 요약하고 설명하는 기초적인 통계 기법.

- 중심 경향치 (Measures of Central Tendency)
  - 평균 (Mean)
  - 중앙값 (Median)
  - 최빈값 (Mode)

- 산포도 (Measures of Dispersion)
  - 범위 (Range)
  - 분산 (Variance)
  - 표준편차 (Standard Deviation)
  - 사분위 범위 (IQR)

- 시각화
  - 히스토그램
  - 박스플롯
  - 산점도

### 🔹 Python 실습
```python
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from scipy import stats

# 샘플 데이터 생성
data = np.random.normal(loc=50, scale=10, size=100)  # 평균 50, 표준편차 10, 표본 크기 100
df = pd.DataFrame(data, columns=["value"])

# 기술 통계
print("평균:", np.mean(data))
print("중앙값:", np.median(data))
print("최빈값:", stats.mode(data, keepdims=True).mode[0])
print("분산:", np.var(data))
print("표준편차:", np.std(data))
print("최솟값:", np.min(data), "최댓값:", np.max(data))

# 시각화
sns.histplot(data, kde=True)
plt.title("Histogram + KDE")
plt.show()

sns.boxplot(x=df["value"])
plt.title("Boxplot")
plt.show()

## 2. 확률과 분포
- 확률 개념
  - 조건부 확률
  - 독립 사건
  - 베이즈 정리
- 확률 분포
  - 이산형 분포: 베르누이, 이항, 포아송
  - 연속형 분포: 정규분포, t-분포, F-분포, 카이제곱분포

### 🔹 Python 실습 예제
```python
# 이항분포 (n=10, p=0.5)
binom_rv = stats.binom.rvs(n=10, p=0.5, size=1000)
sns.histplot(binom_rv, kde=False)
plt.title("Binomial Distribution (n=10, p=0.5)")
plt.show()

# 정규분포
x = np.linspace(-4, 4, 1000)
y = stats.norm.pdf(x, loc=0, scale=1)
plt.plot(x, y)
plt.title("Standard Normal Distribution")
plt.show()

# 포아송 분포 (λ=3)
poisson_rv = stats.poisson.rvs(mu=3, size=1000)
sns.histplot(poisson_rv, kde=False)
plt.title("Poisson Distribution (λ=3)")
plt.show()


## 3. 추론 통계

3-1. 점추정
- 표본 평균, 표본 비율 등으로 모집단 추정

```python
sample_mean = np.mean(data)
print("표본 평균 (모집단 평균 추정):", sample_mean)


3-2. 구간 추정
- 신뢰 구간 계산
    ex) 모집단 평균에 대해95% 신뢰 구간

```python
confidence_interval = stats.t.interval(alpha=0.95, 
                                       df=len(data)-1,
                                       loc=np.mean(data),
                                       scale=stats.sem(data))
print("95% 신뢰구간:", confidence_interval)


3-3. 가설 검정
- 귀무가설 : 이게 맞다
- 대립 가설 : 이게 아니다

```python
t_stat, p_val = stats.ttest_1samp(data, popmean=50)
print("t-통계량:", t_stat, "p-값:", p_val)

if p_val < 0.05:
    print("귀무가설 기각: 평균이 50과 다르다.")
else:
    print("귀무가설 채택: 평균이 50과 유의하게 다르지 않다.")




