In [1]:
import numpy as np
np.random.seed(42)
strategy_a = np.random.normal(loc=15, scale=4, size=40)
strategy_b = np.random.normal(loc=12, scale=7, size=35)

귀무가설 - 전략 A의 평균 매출 증가율은 전략 B보다 크지 않다.

대립가설 - 전략 A의 평균 매출 증가율은 전략 B보다 크다.

In [2]:
# A의 평균과 표준편차
mean_a, std_a = np.mean(strategy_a), np.std(strategy_a, ddof=1)


# B의 평균과 표준편차
mean_b, std_b = np.mean(strategy_b), np.std(strategy_b, ddof=1)

print(f"Strategy A: 평균 = {mean_a:.4f}, 표준편차 = {std_a:.4f}")
print(f"Strategy B: 평균 = {mean_b:.4f}, 표준편차 = {std_b:.4f}")

Strategy A: 평균 = 14.1255, 표준편차 = 3.8112
Strategy B: 평균 = 12.0248, 표준편차 = 6.7487


전략 A의 평균 매출 증가율이 전략 B보다 높고,
전략 B는 표준편차가 더 커서 성과 변동성이 크다.

In [3]:
import pandas as pd

dfa = pd.Series(strategy_a)
dfb = pd.Series(strategy_b)

print("Strategy A")
print(dfa.describe()[['mean', 'std']])
#day1 필사 할 때 표준편차를 std라고 하였음

print()
print("Strategy B")
print(dfb.describe()[['mean', 'std']])

Strategy A
mean    14.125453
std      3.811236
dtype: float64

Strategy B
mean    12.024825
std      6.748658
dtype: float64


In [4]:
from scipy import stats

# 레빈 검정 (Levene's Test)
asdasd, pa = stats.levene(strategy_a, strategy_b)
#stats.levene(A, B) = A와 B의 데이터를 넣어서 분산이 같은지 계산하라
#lasdasd = 계산한 수치(변수 이름을 임의로 넣어도 상관없음)
#pa = **확률값** (변수 이름을 임의로 넣어도 상관없음)

print(f"Levene 검정 p-value: {pa:.4f}")

if asdasd < 0.05:
    print("결과: 등분산성을 만족하지 않음 (분산이 다름)")
else:
    print("결과: 등분산성을 만족함 (분산이 비슷함)")

Levene 검정 p-value: 0.0020
결과: 등분산성을 만족함 (분산이 비슷함)


In [5]:
# 앞에서 레빈 검정 결과가 "등분산성을 만족함"으로 나왔으므로, 
# equal_var=True 옵션을 사용하여 t-검정을 수행합니다.

# 이표본 t-검정 수행
t_t_stat, p_value = stats.ttest_ind(strategy_a, strategy_b, equal_var=True)
#t_t_stat = t-통계량(변수 이름을 임의로 넣어도 상관없음)
#p_value = p-value(변수 이름을 임의로 넣어도 상관없음)
#equal_var=True = 두 집단의 분산이 비슷하다. (비슷하지 않다면 equal_var=False)
#stats.ttest_ind(A, B) = 두 집단의 평균을 비교한다.


print(f"t-통계량: {t_t_stat:.4f}")
print(f"p-value : {p_value:.4f}")
print()

# 최종 해석
if p_value < 0.05:
    print("결과: p-value가 0.05보다 작으므로 귀무가설을 기각합니다.")
    print("해석: 두 전략(A, B) 간의 매출 증가율 평균 차이는 통계적으로 유의미합니다.")
else:
    print("결과: p-value가 0.05보다 크므로 귀무가설을 기각할 수 없습니다.")
    print("해석: 두 전략 간의 매출 증가율 차이는 단순한 우연일 가능성이 높으며, 통계적으로 유의미하지 않습니다.")

t-통계량: 1.6861
p-value : 0.0960

결과: p-value가 0.05보다 크므로 귀무가설을 기각할 수 없습니다.
해석: 두 전략 간의 매출 증가율 차이는 단순한 우연일 가능성이 높으며, 통계적으로 유의미하지 않습니다.


In [10]:
from scipy.stats import levene, ttest_ind

t_stat, p_value = ttest_ind(
    strategy_a,
    strategy_b,
    alternative='greater'  # A > B 단측 검정
)

print(f"t-value: {t_stat:.4f}")
print(f"p-value: {p_value:.4f}")

t-value: 1.6861
p-value: 0.0480
