
## 크리스마스 장식 종류와 지역에 따라 판매량에 유의미한 차이가 있는지 이원 분산 분석을 통해 검정하세요


1. 크리스마스 장식 종류(트리, 조명, 장식품)가 판매량에 미치는 영향을 분석하세요. 이때, 장식 종류의 F-value, p-value를 구하시오
2. 지역(북부, 남부, 동부, 서부)이 판매량에 미치는 영향을 분석하세요. 이때, 장식 종류의 F-value, p-value를 구하시오
3. 크리스마스 장식 종류와 지역의 상호작용이 판매량에 미치는 영향을 분석하세요. 이때, 장식 종류의 F-value, p-value를 구하시오

## 일원 분산 분석(One-Way ANOVA)
- 하나의 독립 변수가 여러 그룹으로 구성된 경우
- 예: 세 개의 교육 방법(A, B, C)에 따른 학생들의 성적 비교

## 이원 분산 분석(Two-Way ANOVA)
- 두 개의 독립 변수가 있는 경우
- 각 독립 변수와 이들의 상호작용이 종속 변수에 미치는 영향을 평가
- 예: 교육 방법(A, B)와 성별(남, 여)에 따른 학생들의 성적 비교

In [84]:
import pandas as pd
import statsmodels.api as sm
from statsmodels.formula.api import ols

In [85]:
df = pd.read_csv('dataset/christmas_decoration_sales.csv')
df.head()

Unnamed: 0,Decoration_Type,Region,Sales
0,트리,북부,64
1,트리,남부,67
2,트리,동부,84
3,트리,서부,87
4,트리,북부,87


In [86]:
import statsmodels.api as sm
from statsmodels.formula.api import ols

In [87]:
formula = 'Sales ~ C(Decoration_Type) * C(Region)'
model = ols(formula, data=df).fit()
anoava_table = sm.stats.anova_lm(model)
display(anova_table)

Unnamed: 0,df,sum_sq,mean_sq,F,PR(>F)
C(Decoration_Type),2.0,1764.5,882.25,2.370578,0.114943
C(Region),3.0,804.305556,268.101852,0.720381,0.549614
C(Decoration_Type):C(Region),6.0,5153.944444,858.990741,2.308081,0.066915
Residual,24.0,8932.0,372.166667,,


In [88]:
# F-value 추출
f_value_Decoration_Type = anoava_table['F'][0]
print('Decoration_Type의 F-value:', f_value_Decoration_Type)
f_value_Region = anoava_table['F'][1]
print('Region F-value:', f_value_Region)
f_value_interaction = anoava_table['F'][2]
print('Decoration_Type과 Region 상호작용의 F-value:', f_value_interaction)

print()

# p-value 추출
p_value_Decoration_Type = anoava_table['PR(>F)'][0]
print('Decoration_Type의 p-value:', p_value_Decoration_Type)
p_value_Region = anoava_table['PR(>F)'][1]
print('Region의 p-value:', p_value_Region)
p_value_interaction = anoava_table['PR(>F)'][2]
print('Decoration_Type과 Region 상호작용의 p-value:', p_value_interaction)

Decoration_Type의 F-value: 2.370577698163901
Region F-value: 0.7203811514156353
Decoration_Type과 Region 상호작용의 F-value: 2.3080808080808097

Decoration_Type의 p-value: 0.1149434496063908
Region의 p-value: 0.5496135553740116
Decoration_Type과 Region 상호작용의 p-value: 0.06691452600857872


In [89]:
alpha = 0.05
# 가설 검정 및 결과 표현
if p_value_Decoration_Type < alpha:
    print('대립가설 채택 : Decoration_Type는 Sales에 유의미한 영향을 미친다.')
else:
    print('귀무가설 채택 : Decoration_Type는 Sales에 유의미한 영향을 미치지 않는다.')

if p_value_Region < alpha:
    print('대립가설 채택 : Region은 Sales에 유의미한 영향을 미친다.')
else:
    print('귀무가설 채택 : Region은 Sales에 유의미한 영향을 미치지 않는다.')

if p_value_interaction < alpha:
    print('대립가설 채택 : Decoration_Type와 Region의 상호작용은 Sales에 유의미한 영향을 미친다.')
else:
    print('귀무가설 채택 : Decoration_Type와 Region의 상호작용은 Sales에 유의미한 영향을 미치지 않는다.')

귀무가설 채택 : Decoration_Type는 Sales에 유의미한 영향을 미치지 않는다.
귀무가설 채택 : Region은 Sales에 유의미한 영향을 미치지 않는다.
귀무가설 채택 : Decoration_Type와 Region의 상호작용은 Sales에 유의미한 영향을 미치지 않는다.
