## 데이터와 통계 용어부터 바로 알기 🎲📊

### 💡 개념 (Concept)

데이터를 분석하고 해석하기 위한 첫걸음은 기본적인 통계 용어를 이해하는 것입니다.

* **모집단 (Population)**
  * 우리가 관심을 가지는 전체 대상의 집합입니다. 
  * 예를 들어, "대한민국 모든 청소년의 하루 평균 SNS 사용 시간"을 연구한다면, 모집단은 대한민국 모든 청소년이 됩니다. 
  * 사회과학 연구에서는 특정 정책의 영향을 받는 모든 시민, 특정 프로그램의 모든 참여자 등이 모집단이 될 수 있습니다.
  
* **표본 (Sample)**
  * 모집단 전체를 조사하는 것은 시간과 비용 면에서 비효율적이거나 불가능할 때가 많습니다. 그래서 모집단의 일부를 추출하여 조사하는데, 이 일부를 표본이라고 합니다. 
  * 표본은 모집단을 잘 대표할 수 있도록 랜덤하게 추출하는 것이 중요합니다. 
  * 예를 들어, 대한민국 청소년 1,000명을 무작위로 뽑아 하루 평균 SNS 사용 시간을 조사했다면, 이 1,000명이 표본이 됩니다.
  
* **모수 (Parameter)**
  * 모집단의 특성을 나타내는 값입니다. 
  * 예를 들어, 대한민국 모든 청소년의 실제 하루 평균 SNS 사용 시간, 특정 정책에 대한 전국민의 실제 평균 지지율 등이 모수에 해당합니다. 
  * 모수는 우리가 정확히 알기 어려운 값일 경우가 많아 표본을 통해 추정합니다.
  
* **통계량 (Statistic)**
  * 표본으로부터 얻어진 데이터를 요약하고 설명하는 값입니다. 
  * 예를 들어, 표본으로 뽑힌 청소년 1,000명의 하루 평균 SNS 사용 시간, 설문조사에 응답한 500명의 정책 평균 지지율 등이 통계량입니다. 
  * 우리는 이 통계량을 통해 모수를 추론합니다.

요약하자면, 우리는 **표본**에서 얻은 **통계량**을 통해 **모집단**의 **모수**를 알고자 합니다.


### 💻 예시 코드 (Example Code)

간단한 사회과학 설문조사 결과를 예시로 살펴봅시다. 어떤 새로운 복지 정책에 대한 20대 청년들의 찬반 의견을 100명에게 물어본 상황을 가정합니다.

In [1]:
import pandas as pd
import plotly.express as px

# 가상 설문조사 데이터 생성 (표본 데이터)
data = {'respondent_id': range(1, 101),
        'opinion': ['찬성'] * 65 + ['반대'] * 25 + ['모름'] * 10}
survey_df = pd.DataFrame(data)

print("설문조사 결과 (일부)")
survey_df.head()

설문조사 결과 (일부):


Unnamed: 0,respondent_id,opinion
0,1,찬성
1,2,찬성
2,3,찬성
3,4,찬성
4,5,찬성


In [2]:
print(f"총 응답자 수 (표본 크기): {len(survey_df)}")

총 응답자 수 (표본 크기): 100


In [4]:
# 의견별 응답 수 (통계량)
opinion_counts = survey_df['opinion'].value_counts()
print("의견별 응답 수")
print(opinion_counts)


의견별 응답 수
opinion
찬성    65
반대    25
모름    10
Name: count, dtype: int64


In [6]:
# 의견별 응답 비율 (통계량)
opinion_ratios = survey_df['opinion'].value_counts(normalize=True) * 100
print("\n의견별 응답 비율 (%):")
opinion_ratios.round(1)


의견별 응답 비율 (%):


opinion
찬성    65.0
반대    25.0
모름    10.0
Name: proportion, dtype: float64

In [7]:
# 시각화: 의견 분포 (원그래프)
fig_pie = px.pie(opinion_counts, values=opinion_counts.values, names=opinion_counts.index,
                 title='새로운 복지 정책에 대한 20대 청년 의견 분포 (표본, n=100)')
fig_pie.show()

* `survey_df`는 우리의 **표본** 데이터입니다.
* `len(survey_df)` (100명)은 **표본 크기**입니다.
* `opinion_counts`와 `opinion_ratios` (예: 찬성 65%, 반대 25%, 모름 10%)는 이 표본으로부터 계산된 **통계량**입니다.
* 우리가 진짜 알고 싶은 것은 "대한민국 모든 20대 청년의 실제 정책 찬성/반대 비율"일 것이며, 이것이 **모수**에 해당합니다.


### ✏️ 연습 문제 (Practice Problems)

1.  어떤 연구자가 "서울시 중학생들의 월 평균 사교육비"를 연구하려고 합니다. 이 연구에서 **모집단**, **표본**, **모수**, **통계량**은 각각 무엇일지 설명해보세요.


- **모집단**: 서울시에 거주하는 모든 중학생
- **표본**: 연구자가 실제로 조사한 일부 서울시 중학생(예: 200명)
- **모수**: 서울시 모든 중학생의 '월 평균 사교육비' (진짜 평균, 우리가 알고 싶은 값)
- **통계량**: 표본(조사한 200명)의 '월 평균 사교육비' (실제 계산된 값, 모수를 추정하기 위한 값)


2.  아래는 5명의 학생에게 하루 TV 시청 시간(분 단위)을 조사한 결과입니다. 이 데이터(표본)를 이용하여 평균 TV 시청 시간(통계량)을 계산하고, 이 표본의 평균이 의미하는 바를 모집단과 관련지어 설명해보세요.
    `tv_time_sample = [60, 90, 120, 75, 100]`

In [None]:
# 연습 문제 2번 풀이 공간
import numpy as np

tv_time_sample = [60, 90, 120, 75, 100]
# 평균 TV 시청 시간 (통계량) 계산 코드를 작성하세요.
# 계산된 평균이 모집단의 평균(모수)과 어떤 관계가 있을지 주석으로 설명해보세요.

In [8]:
# 연습 문제 2번 풀이 공간
import numpy as np

tv_time_sample = [60, 90, 120, 75, 100]
# 평균 TV 시청 시간 (통계량) 계산
mean_tv_time = np.mean(tv_time_sample)
print("표본의 평균 TV 시청 시간(통계량):", mean_tv_time, "분")


표본의 평균 TV 시청 시간(통계량): 89.0 분


- 위에서 구한 평균(통계량)은 표본(5명)의 TV 시청 시간 평균입니다.
- 이 값은 모집단(예: 전체 학생)의 평균 TV 시청 시간(모수)을 '추정'하는 데 사용됩니다.
- 표본이 모집단을 잘 대표한다면, 이 통계량은 모수에 가까울 것입니다.

---

## 2. 🤔 가설 검정의 세계로: 무엇을 알고 싶은가?

### 💡 개념 (Concept)

**가설(Hypothesis)** 이란 아직 참인지 거짓인지 증명되지 않은 주장이나 예측입니다. 가설 검정은 우리가 수집한 표본 데이터를 근거로 하여 모집단에 대한 가설이 타당한지를 통계적으로 판단하는 과정입니다.

가설 검정에는 두 가지 상반되는 가설이 등장합니다:

* **귀무가설 (Null Hypothesis, $H_0$)**: "차이가 없다", "효과가 없다", "관계가 없다"와 같이 기존에 알려진 사실이나 보수적인 주장을 나타내는 가설입니다. 연구를 통해 기각하고자 하는 대상이 됩니다.
    * 예시:
        * "새로운 교육 프로그램은 학생들의 학업 성취도에 영향을 주지 않는다 ($H_0$: 평균 성적 변화 = 0)."
        * "A 정책과 B 정책에 대한 시민들의 지지율은 차이가 없다 ($H_0$: A 정책 지지율 = B 정책 지지율)."
        * "성별에 따라 직무 만족도에는 차이가 없다 ($H_0$: 남성 평균 만족도 = 여성 평균 만족도)."

* **대립가설 (Alternative Hypothesis, $H_1$ 또는 $H_a$)**: 연구자가 새롭게 주장하고 싶은 내용, 즉 "차이가 있다", "효과가 있다", "관계가 있다"를 나타내는 가설입니다. 귀무가설이 기각될 때 받아들여지는 가설입니다.
    * 예시:
        * "새로운 교육 프로그램은 학생들의 학업 성취도를 향상시킨다 ($H_1$: 평균 성적 변화 > 0)." (단측 검정)
        * "A 정책과 B 정책에 대한 시민들의 지지율은 차이가 있다 ($H_1$: A 정책 지지율 ≠ B 정책 지지율)." (양측 검정)
        * "성별에 따라 직무 만족도에는 차이가 있다 ($H_1$: 남성 평균 만족도 ≠ 여성 평균 만족도)." (양측 검정)

**양측 검정(Two-tailed test)**은 "같지 않다" 즉, 크거나 작은 양쪽 방향의 차이를 모두 고려하는 경우이고, **단측 검정(One-tailed test)**은 "크다" 또는 "작다"와 같이 특정 방향의 차이만 고려하는 경우입니다.

### 💻 예시 코드 (Example Code)

"새로운 공익 광고가 청소년들의 기부 의식에 긍정적인 영향을 미치는지" 연구한다고 가정해봅시다.

In [1]:
import pandas as pd
import numpy as np
import plotly.express as px

# 연구 질문: 새로운 공익 광고가 청소년들의 기부 의식(10점 만점)을 향상시키는가?

# 가설 설정
# H0 (귀무가설): 공익 광고는 기부 의식에 영향을 주지 않는다 (평균 변화 = 0 또는 평균 변화 <= 0).
# H1 (대립가설): 공익 광고는 기부 의식을 향상시킨다 (평균 변화 > 0).

# 가상 데이터 생성: 광고 시청 전후 기부 의식 점수
np.random.seed(42) # 결과 재현을 위한 시드 설정
sample_size = 50
pre_campaign_scores = np.random.normal(loc=5, scale=1.5, size=sample_size).clip(1, 10) # 광고 전, 평균 5점
# 광고 후 점수가 약간 상승했다고 가정
post_campaign_scores = (pre_campaign_scores + np.random.normal(loc=0.8, scale=1.0, size=sample_size)).clip(1, 10)

df_campaign = pd.DataFrame({
    'student_id': range(1, sample_size + 1),
    'pre_score': pre_campaign_scores,
    'post_score': post_campaign_scores
})

df_campaign['score_change'] = df_campaign['post_score'] - df_campaign['pre_score']

print("광고 캠페인 전후 기부 의식 점수 (일부):")
print(df_campaign.head())
print(f"\n점수 변화 평균: {df_campaign['score_change'].mean():.2f}")


광고 캠페인 전후 기부 의식 점수 (일부):
   student_id  pre_score  post_score  score_change
0           1   5.745071    6.869155      1.124084
1           2   4.792604    5.207521      0.414918
2           3   5.971533    6.094611      0.123078
3           4   7.284545    8.696221      1.411676
4           5   4.648770    6.479769      1.831000

점수 변화 평균: 0.82


In [2]:
# 시각화: 광고 전후 점수 분포 비교 (박스 플롯)
df_melted = df_campaign.melt(id_vars=['student_id'], value_vars=['pre_score', 'post_score'],
                             var_name='campaign_stage', value_name='score')

fig_box = px.box(df_melted, x='campaign_stage', y='score',
                 title='공익 광고 시청 전후 기부 의식 점수 분포',
                 labels={'campaign_stage': '광고 캠페인 단계', 'score': '기부 의식 점수'},
                 points="all") # 모든 데이터 포인트 표시
fig_box.show()

위 예시에서 박스 플롯을 통해 광고 시청 전과 후의 점수 분포를 시각적으로 비교해볼 수 있습니다. 평균 점수가 약간 상승한 것처럼 보이지만, 이것이 통계적으로 유의미한 변화인지는 가설 검정을 통해 판단해야 합니다.


### ✏️ 연습 문제 (Practice Problems)

1.  "주 4일 근무제 도입이 직장인의 직무 만족도를 변화시키는지" 연구하고 싶습니다. 이 연구에 대한 **귀무가설($H_0$)** 과 **대립가설($H_1$)** 을 설정해보세요. (양측 검정으로 설정해보세요)

* 연습 문제 1번 (마크다운으로 작성)
 - H0:
 - H1:

2.  어떤 사회학자가 "소득 수준에 따라 특정 사회 문제에 대한 인식이 다를 것이다"라고 예측했습니다. 이를 검증하기 위한 **귀무가설($H_0$)** 과 **대립가설($H_1$)** 을 작성해보세요.

* 연습 문제 2번 (마크다운으로 작성)
 - H0:
 - H1:

---

## 3. ⚖️ 가설 검정의 과정과 판단 기준

### 💡 개념 (Concept)

가설 검정은 정해진 절차에 따라 이루어지며, 몇 가지 중요한 판단 기준이 사용됩니다.

* **가설검정의 절차 (일반적)**:
    1.  귀무가설($H_0$)과 대립가설($H_1$)을 설정합니다.
    2.  유의수준($\alpha$)을 결정합니다.
    3.  표본 데이터를 수집하고, 검정 통계량(test statistic)을 계산합니다. (검정 통계량은 데이터가 귀무가설을 얼마나 지지하지 않는지를 나타내는 값입니다. 예를 들어 t-값, z-값, $\chi^2$-값 등이 있습니다. 여기서는 개념만 이해합니다.)
    4.  P-값(p-value)을 계산하거나 기각역(rejection region)을 설정합니다.
    5.  P-값과 유의수준을 비교하여 통계적 결정을 내립니다. ($P \le \alpha$ 이면 $H_0$를 기각, $P > \alpha$ 이면 $H_0$를 기각하지 못함)

* **유의수준 (Significance Level, $\alpha$)**
  * 귀무가설이 실제로 맞는데도 불구하고, 우리가 그것을 틀렸다고 판단(즉, 귀무가설을 기각)할 최대 허용 확률입니다. 
  * 이는 제1종 오류를 범할 확률의 최댓값이기도 합니다. 연구자가 직접 설정하며, 사회과학에서는 보통 0.05 (5%) 또는 0.01 (1%)을 많이 사용합니다.
  * $\alpha = 0.05$ 라는 것은, 귀무가설이 맞을 때 우연히 극단적인 표본이 뽑혀 귀무가설을 잘못 기각할 확률을 5%까지 허용한다는 의미입니다.

* **P-값 (P-value)**: **귀무가설이 참이라고 가정했을 때, 우리가 관찰한 표본 데이터와 같거나 더 극단적인 데이터가 관찰될 확률**입니다.
    * P-값이 작을수록 귀무가설이 맞다는 가정 하에 현재와 같은 데이터가 나오기 어렵다는 의미이므로, 귀무가설을 기각할 근거가 강해집니다.
    * 판단 기준:
        * **$P \le \alpha$ (P-값이 유의수준보다 작거나 같으면)**: 귀무가설을 기각하고 대립가설을 채택합니다. "통계적으로 유의미하다"고 표현합니다.
        * **$P > \alpha$ (P-값이 유의수준보다 크면)**: 귀무가설을 기각하지 못합니다. (주의: 귀무가설이 맞다고 증명된 것은 아닙니다. 단지 기각할 충분한 근거가 없다는 의미입니다.)

* **기각역 (Rejection Region)**: 검정 통계량의 분포에서 귀무가설을 기각하게 되는 값의 영역입니다. 이 영역에 검정 통계량이 위치하면 귀무가설을 기각합니다. 유의수준 $\alpha$에 의해 크기가 결정됩니다.

### 💻 예시 코드 (Example Code)

한 도시에서 "청소년 대상 금융 교육 프로그램이 금융 이해도를 높이는지"에 대한 연구를 진행했고, 가설 검정 결과 P-값이 0.03으로 나왔다고 가정합시다. 유의수준은 0.05로 설정했습니다.

In [3]:
# 가설 검정 결과 (가정)
p_value_education = 0.03
alpha = 0.05  # 유의수준

print(f"계산된 P-값: {p_value_education}")
print(f"설정된 유의수준 (alpha): {alpha}")

# 통계적 결정
if p_value_education <= alpha:
    print(f"결론: P-값 ({p_value_education}) <= 유의수준 ({alpha}) 이므로, 귀무가설을 기각합니다.")
    print("즉, 금융 교육 프로그램은 청소년의 금융 이해도를 높이는 데 통계적으로 유의미한 효과가 있다고 볼 수 있습니다.")
else:
    print(f"결론: P-값 ({p_value_education}) > 유의수준 ({alpha}) 이므로, 귀무가설을 기각하지 못합니다.")
    print("즉, 금융 교육 프로그램이 청소년의 금융 이해도를 높인다고 말할 충분한 통계적 근거가 없습니다.")

계산된 P-값: 0.03
설정된 유의수준 (alpha): 0.05
결론: P-값 (0.03) <= 유의수준 (0.05) 이므로, 귀무가설을 기각합니다.
즉, 금융 교육 프로그램은 청소년의 금융 이해도를 높이는 데 통계적으로 유의미한 효과가 있다고 볼 수 있습니다.


In [5]:
# P-값과 유의수준을 시각적으로 표현하기 위한 간단한 예시 (정규분포 가정)
# 실제 검정 통계량의 분포를 그려야 하지만, 여기서는 개념 이해를 돕기 위함입니다.
import numpy as np
import plotly.graph_objects as go
from scipy.stats import norm

# 표준 정규 분포 생성
x_norm = np.linspace(-3, 3, 500)
y_norm = norm.pdf(x_norm, 0, 1)

# 유의수준에 해당하는 임계값 (양측검정의 경우 alpha/2, 단측검정은 alpha)
# 여기서는 단측 검정 (효과가 있다)을 가정하고 오른쪽 꼬리만 고려
critical_value = norm.ppf(1 - alpha) # P(Z > critical_value) = alpha

fig_dist = go.Figure()
fig_dist.add_trace(go.Scatter(x=x_norm, y=y_norm, mode='lines', name='검정 통계량 분포 (가정)'))

# 기각역 (Rejection Region) 표시
x_rejection = np.linspace(critical_value, 3, 100)
y_rejection = norm.pdf(x_rejection, 0, 1)
fig_dist.add_trace(go.Scatter(x=x_rejection, y=y_rejection, fill='tozeroy', mode='lines',
                              name=f'기각역 (alpha={alpha})', fillcolor='rgba(255,0,0,0.3)'))

# P-값에 해당하는 영역 표시 (실제로는 검정통계량 값으로 표시)
# 여기서는 P-값이 0.03이므로, Z값이 norm.ppf(1-0.03)일 때의 영역을 가정하여 표시
p_value_z = norm.ppf(1 - p_value_education)
x_p_value_fill = np.linspace(p_value_z, 3, 100)
y_p_value_fill = norm.pdf(x_p_value_fill, 0, 1)
fig_dist.add_trace(go.Scatter(x=x_p_value_fill, y=y_p_value_fill, fill='tozeroy', mode='lines',
                              name=f'P-value 영역 (P={p_value_education})', fillcolor='rgba(0,0,255,0.3)'))


fig_dist.update_layout(title_text='P-값과 기각역의 개념적 시각화 (단측 검정, 오른쪽 꼬리)',
                       xaxis_title='검정 통계량 Z (가정)', yaxis_title='확률 밀도')
fig_dist.add_vline(
    x=critical_value,
    line_dash="dash",
    line_color="red",
    annotation_text=f"임계값: {critical_value:.2f}",
    annotation_position="bottom"
)
if p_value_z > critical_value: # P-value가 기각역에 해당하면
    fig_dist.add_vline(x=p_value_z, line_dash="dash", line_color="blue" , annotation_text=f"관찰된 Z (P-value={p_value_education})")


fig_dist.show()

위 시각화는 P-값과 기각역의 개념을 보여주기 위한 단순화된 예시입니다. 실제로는 해당 검정 방법에 맞는 검정 통계량 분포를 사용해야 합니다. P-값이 기각역 내에 위치하면 (즉, P-값이 $\alpha$보다 작으면) 귀무가설을 기각합니다.



### ✏️ 연습 문제

1.  어떤 사회복지 프로그램의 효과를 검증한 결과, P-값이 0.072로 나왔습니다. 연구자가 설정한 유의수준($\alpha$)이 0.05라면, 이 연구의 귀무가설은 기각될까요? 그 이유는 무엇이며, 이 결과를 어떻게 해석해야 할까요?

> 작성공간
1. P-value = 0.072, alpha = 0.05 일 때
* 결론:
* 이유:
* 해석:

2.  만약 위 1번 문제에서 연구자가 유의수준($\alpha$)을 0.1로 설정했다면 결론이 달라질까요? 달라진다면 어떻게 달라지는지 설명하고, 유의수준 설정의 중요성에 대해 간략히 이야기해보세요.

> 작성공간

2. P-value = 0.072, alpha = 0.1 일 때
* 결론:
* 이유:
* 유의수준 설정의 중요성:

---

## 4. ⚠️ 가설 검정의 두 가지 오류

### 💡 개념 (Concept)

가설 검정은 표본 데이터를 기반으로 모집단에 대한 판단을 내리기 때문에 항상 오류의 가능성을 안고 있습니다. 가설 검정에서 발생할 수 있는 두 가지 유형의 오류는 다음과 같습니다.

* **제1종 오류 (Type I Error, $\alpha$ 오류)**: **귀무가설($H_0$)이 실제로 참인데, 귀무가설을 기각하는 오류**입니다.
    * "False Positive"라고도 합니다.
    * 제1종 오류를 범할 최대 허용 확률이 바로 앞에서 배운 **유의수준($\alpha$)** 입니다.
    * 사회과학 예시:
        * "효과 없는 정책을 효과가 있다고 잘못 판단하여 예산을 낭비하는 경우."
        * "차이가 없는 두 집단 간에 차이가 있다고 잘못 결론 내리는 경우."

* **제2종 오류 (Type II Error, $\beta$ 오류)**: **귀무가설($H_0$)이 실제로 거짓인데 (즉, 대립가설($H_1$)이 참인데), 귀무가설을 기각하지 못하는 오류**입니다.
    * "False Negative"라고도 합니다.
    * 제2종 오류를 범할 확률을 $\beta$(베타)라고 합니다.
    * 사회과학 예시:
        * "실제로 효과가 있는 정책을 효과가 없다고 잘못 판단하여 좋은 정책을 도입하지 못하는 경우."
        * "실제로 차이가 있는 두 집단 간에 차이가 없다고 잘못 결론 내리는 경우."

|                      | $H_0$가 참 (효과 없음) | $H_0$가 거짓 (효과 있음) |
| :------------------- | :-------------------- | :---------------------- |
| **$H_0$ 기각 (효과 있다 판단)** | 제1종 오류 ($\alpha$)  | 올바른 결정 (검정력 $1-\beta$) |
| **$H_0$ 채택 (효과 없다 판단)** | 올바른 결정           | 제2종 오류 ($\beta$)     |

* **검정력 (Power, $1-\beta$)**: 대립가설이 참일 때 (즉, 실제로 효과나 차이가 있을 때) 이를 옳게 판단하여 귀무가설을 기각할 확률입니다. 연구에서는 검정력을 높이는 것이 중요합니다. 검정력은 표본 크기, 유의수준, 효과 크기 등에 영향을 받습니다.

1종 오류와 2종 오류는 서로 반비례 관계(trade-off)에 있는 경향이 있습니다. 즉, $\alpha$를 줄여 1종 오류를 범할 가능성을 낮추면, $\beta$가 커져 2종 오류를 범할 가능성이 높아질 수 있습니다 (다른 조건이 동일할 때).


### 💻 예시 코드 (Example Code)

새로운 학교 폭력 예방 프로그램의 효과를 검증한다고 가정해봅시다.

In [6]:
# 시나리오: 학교 폭력 예방 프로그램 효과 검증

# 실제 상황 1: 프로그램이 효과가 없다 (H0가 참)
#   - 검정 결과 H0 기각 (효과 있다고 판단) => 제1종 오류 (alpha)
#     - "효과 없는 프로그램에 자원을 투입하게 됨"
#   - 검정 결과 H0 채택 (효과 없다고 판단) => 올바른 결정

# 실제 상황 2: 프로그램이 효과가 있다 (H0가 거짓, H1이 참)
#   - 검정 결과 H0 기각 (효과 있다고 판단) => 올바른 결정 (검정력 1-beta)
#     - "효과 있는 프로그램을 도입하여 학교 폭력 감소에 기여"
#   - 검정 결과 H0 채택 (효과 없다고 판단) => 제2종 오류 (beta)
#     - "효과 있는 프로그램을 놓치게 되어 개선의 기회를 잃음"

def describe_error_scenario(actual_effect_exists, decision_to_reject_h0):
    if actual_effect_exists: # H0가 거짓 (효과 있음)
        if decision_to_reject_h0: # H0 기각 (효과 있다고 판단)
            return "올바른 결정 (검정력): 실제 효과 있는 프로그램을 효과 있다고 판단함."
        else: # H0 채택 (효과 없다고 판단)
            return "제2종 오류 (Beta): 실제 효과 있는 프로그램을 효과 없다고 판단함 (아쉬운 상황)."
    else: # H0가 참 (효과 없음)
        if decision_to_reject_h0: # H0 기각 (효과 있다고 판단)
            return "제1종 오류 (Alpha): 실제 효과 없는 프로그램을 효과 있다고 판단함 (낭비 발생 가능)."
        else: # H0 채택 (효과 없다고 판단)
            return "올바른 결정: 실제 효과 없는 프로그램을 효과 없다고 판단함."

# 예시 시나리오 실행
print("시나리오 1: 실제 효과 없음, 그러나 효과 있다고 잘못 판단")
print(describe_error_scenario(actual_effect_exists=False, decision_to_reject_h0=True))

print("\n시나리오 2: 실제 효과 있음, 그러나 효과 없다고 잘못 판단")
print(describe_error_scenario(actual_effect_exists=True, decision_to_reject_h0=False))

print("\n시나리오 3: 실제 효과 있음, 효과 있다고 올바르게 판단")
print(describe_error_scenario(actual_effect_exists=True, decision_to_reject_h0=True))

시나리오 1: 실제 효과 없음, 그러나 효과 있다고 잘못 판단
제1종 오류 (Alpha): 실제 효과 없는 프로그램을 효과 있다고 판단함 (낭비 발생 가능).

시나리오 2: 실제 효과 있음, 그러나 효과 없다고 잘못 판단
제2종 오류 (Beta): 실제 효과 있는 프로그램을 효과 없다고 판단함 (아쉬운 상황).

시나리오 3: 실제 효과 있음, 효과 있다고 올바르게 판단
올바른 결정 (검정력): 실제 효과 있는 프로그램을 효과 있다고 판단함.


### ✏️ 연습 문제 (Practice Problems)

1.  어떤 지역의 범죄율 감소를 위해 새로운 CCTV 설치 정책을 시행하고 그 효과를 검증하려고 합니다. 이 상황에서 발생할 수 있는 **제1종 오류**와 **제2종 오류**가 각각 무엇을 의미하는지 구체적으로 설명하고, 각 오류가 사회적으로 어떤 결과를 초래할 수 있을지 생각해보세요.

> 작성공간
1. CCTV 정책 효과 검증에서의 오류
* 제1종 오류의 의미:
* 제1종 오류의 사회적 결과:
* 제2종 오류의 의미:
* 제2종 오류의 사회적 결과:


2.  연구자가 유의수준 $\alpha$를 매우 작게 설정하면(예: 0.001), 제1종 오류를 범할 확률은 낮아집니다. 하지만 이 경우 제2종 오류를 범할 확률은 어떻게 될 가능성이 높을까요? 그 이유는 무엇일까요?

> 작성공간
2. 유의수준 alpha를 매우 작게 설정할 경우
* 제2종 오류 발생 가능성:
* 이유:

---

## 5. 🔬(예제 시나리오) 새로운 공익 광고의 효과 측정

### 💡 개념 (Concept)

앞서 배운 개념들을 종합하여, 새로운 공익 광고가 특정 사회적 태도(예: 환경 보호 의식)에 미치는 영향을 측정하는 가상 시나리오를 통해 가설 검정 과정을 따라가 보겠습니다.

* **연구 질문**: 새로운 환경 보호 공익 광고가 시민들의 환경 보호 의식 점수(10점 만점)를 향상시키는가?
* **모집단**: 광고에 노출될 가능성이 있는 모든 시민.
* **모수**: 모든 시민의 실제 평균 환경 보호 의식 점수 변화량 ($\mu_{change}$).
* **표본**: 연구에 참여한 시민 100명.
* **통계량**: 표본 100명의 평균 환경 보호 의식 점수 변화량 ($\bar{x}_{change}$).

* **귀무가설 ($H_0$)**: 공익 광고는 환경 보호 의식 점수에 영향을 주지 않는다 (또는 감소시킨다). 즉, $\mu_{change} \le 0$.
* **대립가설 ($H_1$)**: 공익 광고는 환경 보호 의식 점수를 향상시킨다. 즉, $\mu_{change} > 0$. (단측 검정)
* **유의수준 ($\alpha$)**: 0.05로 설정.

(가상 시나리오) 광고 시청 전후로 참여자들의 환경 보호 의식 점수를 측정하고, 점수 변화량 데이터를 분석했습니다. 그 결과, **P-값이 0.028**로 계산되었다고 가정합시다.

* **결론 도출**:
    * P-값 (0.028)이 유의수준 $\alpha$ (0.05)보다 작습니다 ($0.028 \le 0.05$).
    * 따라서 귀무가설($H_0$)을 기각합니다.
    * 결론: 새로운 환경 보호 공익 광고는 시민들의 환경 보호 의식 점수를 향상시키는 데 통계적으로 유의미한 효과가 있다고 볼 수 있습니다 (유의수준 5% 하에서).

* **발생 가능한 오류**: 만약 실제로 광고가 효과가 없었는데 우연히 효과가 있는 것처럼 결과가 나왔다면 (즉, $H_0$가 참인데 기각했다면), 이는 **제1종 오류**에 해당합니다.

### 💻 예시 코드 (Example Code)

Python과 `scipy.stats` 라이브러리를 사용하여 이와 유사한 상황에서 대응표본 t-검정(paired t-test)을 수행하고 P-값을 얻는 과정을 간단히 살펴보겠습니다. 대응표본 t-검정은 동일한 대상에 대해 두 가지 조건(예: 전/후) 하에서 측정된 값의 평균 차이를 비교할 때 사용됩니다.

In [None]:
import pandas as pd
import numpy as np
import plotly.express as px
from scipy import stats # 통계 분석을 위한 scipy 라이브러리

# 가상 데이터 생성: 광고 시청 전후 환경 보호 의식 점수 (10점 만점)
np.random.seed(123) # 결과 재현을 위한 시드 설정
sample_size = 100
# 광고 전 점수 (평균 6점)
before_scores_env = np.random.normal(loc=6, scale=1.5, size=sample_size).clip(1, 10)
# 광고 후 점수가 평균 0.5점 상승했다고 가정
after_scores_env = (before_scores_env + np.random.normal(loc=0.5, scale=1.2, size=sample_size)).clip(1, 10)

df_env_campaign = pd.DataFrame({
    'participant_id': range(1, sample_size + 1),
    'before_score': before_scores_env,
    'after_score': after_scores_env
})

print("환경 보호 의식 점수 (일부 데이터):")
print(df_env_campaign.head())

# 점수 변화량 계산 및 평균 확인
df_env_campaign['score_change'] = df_env_campaign['after_score'] - df_env_campaign['before_score']
print(f"\n표본의 평균 점수 변화량: {df_env_campaign['score_change'].mean():.2f}")

# 시각화: 광고 전후 점수 분포 (박스 플롯)
df_env_melted = df_env_campaign.melt(id_vars=['participant_id'], value_vars=['before_score', 'after_score'],
                                     var_name='campaign_timing', value_name='score')
fig_env_box = px.box(df_env_melted, x='campaign_timing', y='score', color='campaign_timing',
                     title='공익 광고 시청 전후 환경 보호 의식 점수',
                     labels={'campaign_timing': '광고 캠페인 시점', 'score': '의식 점수'},
                     points='all')
fig_env_box.show()

# 가설 검정: 대응표본 t-검정 (Paired t-test)
# H0: 평균 점수 변화 <= 0 (효과 없거나 부정적)
# H1: 평균 점수 변화 > 0 (긍정적 효과)
# alternative='greater'는 대립가설이 '더 크다'는 단측 검정을 의미합니다.
t_statistic, p_value_env = stats.ttest_rel(df_env_campaign['after_score'],
                                           df_env_campaign['before_score'],
                                           alternative='greater')

print(f"\n대응표본 t-검정 결과:")
print(f"  T-statistic: {t_statistic:.3f}")
print(f"  P-value: {p_value_env:.3f}")

# 유의수준 설정 및 결론 도출
alpha = 0.05
print(f"\n유의수준 (alpha): {alpha}")

if p_value_env <= alpha:
    print(f"결론: P-값 ({p_value_env:.3f}) <= 유의수준 ({alpha}). 귀무가설을 기각합니다.")
    print("      새로운 환경 보호 공익 광고는 시민들의 환경 보호 의식 점수를 향상시키는 데 통계적으로 유의미한 효과가 있다고 판단됩니다.")
else:
    print(f"결론: P-값 ({p_value_env:.3f}) > 유의수준 ({alpha}). 귀무가설을 기각하지 못합니다.")
    print("      새로운 환경 보호 공익 광고가 시민들의 환경 보호 의식 점수를 향상시킨다고 말할 충분한 통계적 근거가 없습니다.")

`scipy.stats.ttest_rel` 함수는 두 쌍의 데이터 간의 평균 차이가 0과 유의하게 다른지를 검정합니다. `alternative='greater'` 옵션은 대립가설이 "첫 번째 표본의 평균이 두 번째 표본의 평균보다 크다" (즉, `after_score`의 평균이 `before_score`의 평균보다 크다)임을 명시합니다. 이 함수의 결과로 나오는 P-값을 해석하여 결론을 내립니다.

### ✏️ 연습 문제

1.  어떤 지역 사회에서 "청소년 멘토링 프로그램"을 실시한 후, 프로그램 참여 청소년들의 자존감 점수(사전/사후 측정)에 변화가 있었는지 검증하려고 합니다.
    * 이 연구의 **귀무가설($H_0$)** 과 **대립가설($H_1$)** 을 "자존감 점수가 향상되었다"는 방향으로 설정해보세요 (단측 검정).
    * 만약 대응표본 t-검정 결과 P-값이 0.065가 나왔고, 유의수준 $\alpha$를 0.05로 설정했다면 어떤 결론을 내릴 수 있을까요? 그 결론의 의미를 설명해보세요.
    * 만약 이 결론이 잘못된 것이라면 (실제로는 프로그램이 효과가 있었는데 없다고 결론 내렸다면), 어떤 종류의 오류에 해당할까요?
2.  위 예시 코드에서 `np.random.seed(123)` 대신 다른 숫자(예: 42 또는 100)로 시드값을 변경하거나, `after_scores_env` 생성 시 `loc=0.1` (평균 0.1점 상승)과 같이 효과 크기를 매우 작게 변경한 후 코드를 다시 실행해보세요. P-값이 어떻게 변하는지 관찰하고, 그 결과가 의미하는 바를 생각해보세요. (코드 실행 후 결과에 대한 설명은 주석으로 작성)

In [None]:
# 연습 문제 1번 답안 작성 공간 (주석으로 설명)
# 1. 청소년 멘토링 프로그램 효과 검증
# H0:
# H1:
# P-value = 0.065, alpha = 0.05 일 때의 결론 및 의미:
# 만약 이 결론이 잘못되었다면 어떤 오류인가?:


# 연습 문제 2번 풀이 공간 (코드 수정 및 주석으로 결과 설명)
# (위 예시 코드를 복사하여 수정하고 실행한 후, P-값 변화와 그 의미를 주석으로 작성하세요)