In [1]:
import pandas as pd
import numpy as np

import scipy.stats as stats
import matplotlib.pyplot as plt
import seaborn as sns

In [2]:
# 한 그룹의 구매 금액
purchase_amounts = [12000, 12500, 13000, 12800, 12600, 12200, 12700, 12900, 12400, 12100]  # 실제 고객 구매 금액
expected_value = 13000  # 비교 구매 금액 (회사의 목표 평균 구매 금액)

# 일표본 t-검정 수행
t_stat, p_value = stats.ttest_1samp(purchase_amounts, expected_value)

# 결과 출력
print(f"T-statistic: {t_stat:.4f}")
print(f"P-value: {p_value:.10f}")  # 소수점 10자리까지 표시

# 해석
alpha = 0.05  # 유의수준 5%
if p_value < alpha:#실제 평균이 비교값 보다 작을 경우 음수
    print(f"그룹의 평균 구매 금액이 {expected_value}원과 유의미하게 다릅니다.")
else:
    print(f"그룹의 평균 구매 금액이 {expected_value}원과 유의미하게 다르지 않습니다.")

T-statistic: -4.4313
P-value: 0.0016440744
그룹의 평균 구매 금액이 13000원과 유의미하게 다릅니다.


In [3]:
# 똑같은 고객들의 프로모션 전후 구매 금액
before_promo = [12000, 12500, 13000, 12800, 12600, 12200, 12700, 12900, 12400, 12100]  # 프로모션 전
after_promo = [13500, 14000, 13800, 13600, 13900, 13700, 13400, 13200, 14100, 13300]  # 프로모션 후

# 대응 표본 t-검정 수행
t_stat, p_value = stats.ttest_rel(before_promo, after_promo)  # 대응 표본 t-검정

# 결과 출력
print(f"T-statistic: {t_stat:.4f}")
print(f"P-value: {p_value:.10f}")  # 소수점 10자리까지 표시

# 해석
alpha = 0.05  # 유의수준 5%
if p_value < alpha:
    print("프로모션 전후 구매 금액 차이가 유의미합니다.")
else:
    print("프로모션 전후 구매 금액 차이가 유의미하지 않습니다.")

T-statistic: -7.8583
P-value: 0.0000255257
프로모션 전후 구매 금액 차이가 유의미합니다.


한 회사가 A/B 프로모션을 시행하여 고객의 전환율을 비교하려고 합니다. 각 프로모션에서 전환(구매)한 고객과 전환하지 않은 고객의 수가 다음과 같습니다.

프로모션 A: 전환한 고객수 60명, 전환하지 않은 고객수 440명

프로모션 B: 전환한 고객수 90명, 전환하지 않은 고객수 410명

(1) 위 데이터를 사용하여 카이제곱 검정을 수행하세요.

(2) p-value를 보고 전환율 차이가 유의미한지 판단하세요.

(3) 유의미한 경우, 어떤 프로모션이 더 전환율이 높은지 해석하세요.

In [5]:
# (1) 위 데이터를 사용하여 카이제곱 검정을 수행하세요.
# A/B 프로모션별 전환 수와 비전환 수
# [전환한 고객 수, 전환하지 않은 고객 수]
promotion_A = [60, 440]  # A 프로모션 (전환율 60/440 = 12%)
promotion_B = [90, 410]  # B 프로모션 (전환율 90/410 = 18%)

# 카이제곱 검정을 위한 분할표 생성
conversion_table = np.array([promotion_A, promotion_B])

# 카이제곱 검정 수행
chi2_stat, p_value, dof, expected = stats.chi2_contingency(conversion_table)

# 결과 출력
print(f"Chi-Square Statistic: {chi2_stat:.4f}")
print(f"P-value: {p_value:.10f}")

# 해석
alpha = 0.05  # 유의수준 5%
if p_value < alpha:
    print("A/B 프로모션 간 전환율 차이가 유의미합니다.")
else:
    print("A/B 프로모션 간 전환율 차이가 유의미하지 않습니다.")


# (2) p-value를 보고 전환율 차이가 유의미한지 판단하세요.
# (3) 유의미한 경우, 어떤 프로모션이 더 전환율이 높은지 해석하세요.
# A 프로모션 (전환율 60/440 = 12%), B 프로모션 (전환율 90/410 = 18%)
# P-value값이 0.05보다 작으므로 A/B 프로모션간 전환율 차이가 유의미하다고 판단, 따라서 B 프로모션이 더 효과적

Chi-Square Statistic: 6.5961
P-value: 0.0102203630
A/B 프로모션 간 전환율 차이가 유의미합니다.


In [None]:
# (2) p-value를 보고 전환율 차이가 유의미한지 판단하세요.

In [None]:
# (3) 유의미한 경우, 어떤 프로모션이 더 전환율이 높은지 해석하세요.
# A 프로모션 (전환율 60/440 = 12%), B 프로모션 (전환율 90/410 = 18%)
# P-value값이 0.05보다 작으므로 A/B 프로모션간 전환율 차이가 유의미하다고 판단, 따라서 B 프로모션이 더 효과적