베스킨라빈스는 쿼트(Quart) 아이스크림의 중앙값이 620g이라고 주장하고 있습니다. 저는 실제로 이 아이스크림의 중앙값이 620g보다 무겁다고 주장합니다. 다음은 20개의 쿼트 아이스크림 샘플의 무게 측정 결과입니다. 이 측정 결과를 바탕으로 나의 주장이 사실인지 비모수 검정(Wilcoxon Signed-Rank Test)을 통해 검정해보십시오. p-value값을 소수점 둘째 자리에서 반올림하여 계산

- 귀무가설: "베스킨라빈스 쿼트 아이스크림의 중앙값은 620g이다."
- 대립가설: "베스킨라빈스 쿼트 아이스크림의 중앙값은 620g보다 무겁다."

### 윌콕슨 부호 순위 검정(Wilcoxon Signed-Rank Test)
- 관련된 두 샘플 또는 쌍을 비교하는 데 사용되는 비모수 통계적 검정
- 대응 표본 t-검정의 비모수 버전으로, 데이터가 정규 분포를 따르지 않는 경우에 사용 됨
- 목적
    - 두 관련 샘플의 중앙값 차이가 0인지 여부 검정
    - 주로 같은 대상에 대한 두가지 조건 또는 시점의 데이터를 비교할 때 사용
- 가정
    - 데이터는 연속형
    - 각 쌍은 독립적
    - 데이터 쌍의 차이는 대칭적으로 분포되어 있어야 함
- 가설
    - 귀무가설 : 두 관련된 샘플의 중앙값 차이가 0이다.
    - 대립가설 : 두 관련된 샘플의 중앙값 차이가 0이 아니다.
- 장점
    - 데이터가 정규분포를 따르지 않아도 사용 가능
    - 이상치의 영향 덜 받음
- 단점
    - 연속형 데이터에만 적용 가능
    - 순위에 기반하므로 정보 일부 손실 가능

In [1]:
import pandas as pd
from scipy.stats import wilcoxon

In [2]:
# 데이터 생성
data = {
    "weight": [630, 610, 625, 615, 622, 618, 623, 619, 620, 624, 616, 621, 617, 629, 626, 620, 618, 622, 625, 615, 
               628, 617, 624, 619, 621, 623, 620, 622, 618, 625, 616, 629, 620, 624, 617, 621, 623, 619, 625, 618,
               622, 620, 624, 617, 621, 623, 619, 625, 618, 622]
}

df = pd.DataFrame(data)

In [3]:
# 설정값
quart_median = 620

In [10]:
# Wilcoxon Signed-Rank Test 수행
s, p_value = wilcoxon(df["weight"] - quart_median, alternative='greater')

In [11]:
p_value = round(p_value, 2)
print('p-value :', p_value)

p-value : 0.03


In [12]:
# 유의수준
alpha = 0.05

if p_value < alpha:
    print('대립가설 채택: 베스킨라빈스 쿼트 아이스크림의 중앙값은 620g보다 무겁다는 주장을 지지합니다.')
else:
    print('귀무가설 채택: 베스킨라빈스 쿼트 아이스크림의 중앙값은 620g보다 무겁다는 주장을 지지할 수 없습니다.')

대립가설 채택: 베스킨라빈스 쿼트 아이스크림의 중앙값은 620g보다 무겁다는 주장을 지지합니다.
