In [None]:
import pandas as pd
import numpy as np
from scipy.stats import ttest_ind

# 예시 데이터프레임 생성
np.random.seed(42)
data = {
    'customer_id': np.arange(1, 1001),
    'review_length': np.random.normal(120, 30, 1000).astype(int),
    'review_count': np.random.poisson(1.5, 1000),
    'review_score': np.random.choice([1, 2, 3, 4, 5], 1000)
}
df = pd.DataFrame(data)

### Step 1: 정액/정율 리워드에 대한 시뮬레이션 ###

# 정액 리워드 10$, 15$ 제공 그룹
fixed_rewards = [10, 15]
fixed_results = {}

for reward in fixed_rewards:
    # 정액 리워드에 따른 평균 리뷰 길이 및 빈도 분석
    reward_length = df['review_length'] + np.random.normal(10, 5, df.shape[0])
    reward_count = df['review_count'] + np.random.poisson(0.2, df.shape[0])
    
    fixed_results[f"{reward}$ Fixed"] = {
        'avg_review_length': reward_length.mean(),
        'avg_review_count': reward_count.mean()
    }

# 정율 리워드 5%, 10% 제공 그룹
rate_rewards = [0.05, 0.1]
rate_results = {}

for rate in rate_rewards:
    # 정율 리워드에 따른 평균 리뷰 길이 및 빈도 분석
    reward_length = df['review_length'] + np.random.normal(10 * rate * 10, 5, df.shape[0])
    reward_count = df['review_count'] + np.random.poisson(0.3, df.shape[0])
    
    rate_results[f"{int(rate*100)}% Rate"] = {
        'avg_review_length': reward_length.mean(),
        'avg_review_count': reward_count.mean()
    }

# Step 1 시뮬레이션 결과 출력
print("정액 리워드 결과:")
for reward, metrics in fixed_results.items():
    print(f"{reward}: 평균 리뷰 길이 {metrics['avg_review_length']:.2f}, 평균 리뷰 빈도 {metrics['avg_review_count']:.2f}")

print("\n정율 리워드 결과:")
for rate, metrics in rate_results.items():
    print(f"{rate}: 평균 리뷰 길이 {metrics['avg_review_length']:.2f}, 평균 리뷰 빈도 {metrics['avg_review_count']:.2f}")

### Step 2: 리워드 지급 시기에 대한 시뮬레이션 ###

# Step 1에서 나온 최적의 리워드 방식에 대해 1주일, 2주일, 1개월 지급 시점 비교
# 예시: 15$ Fixed 리워드를 선택하여 지급 시점 비교

timing_results = {}
timeframes = ['1_week', '2_weeks', '1_month']

for timeframe in timeframes:
    if timeframe == '1_week':
        reward_length = df['review_length'] + np.random.normal(15, 5, df.shape[0])
        reward_count = df['review_count'] + np.random.poisson(0.5, df.shape[0])
    elif timeframe == '2_weeks':
        reward_length = df['review_length'] + np.random.normal(12, 5, df.shape[0])
        reward_count = df['review_count'] + np.random.poisson(0.4, df.shape[0])
    elif timeframe == '1_month':
        reward_length = df['review_length'] + np.random.normal(10, 5, df.shape[0])
        reward_count = df['review_count'] + np.random.poisson(0.3, df.shape[0])

    timing_results[timeframe] = {
        'avg_review_length': reward_length.mean(),
        'avg_review_count': reward_count.mean()
    }

# Step 2 시뮬레이션 결과 출력
print("\n지급 시점에 따른 결과:")
for timeframe, metrics in timing_results.items():
    print(f"{timeframe}: 평균 리뷰 길이 {metrics['avg_review_length']:.2f}, 평균 리뷰 빈도 {metrics['avg_review_count']:.2f}")
