In [1]:
import pandas as pd
import numpy as np
from itertools import product

class QuizGridSearchAnalyzer:
    def __init__(self):
        # 기본 비용/수익 설정 (변수로 변경될 수 있음)
        self.costs = {
            'ad_revenue': 1,           # 광고 수익 (변수)
            'success_reward': 3,       # 일반 보상 (고정)
            'retry_success_reward': 1, # 재도전 성공 보상 (고정)
            'streak_reward': 100,      # 7일 연속 참여 보상 (변수)
            'extra_reward': 3          # 추가 보상 (변수)
        }
        
        # 7일 연속 참여 분포 (17.5% 트리거 확률)
        self.streak_7_trigger_rate = 0.175
        self.streak_7_distribution = {
            1: 0.4911, 2: 0.1823, 3: 0.0976, 4: 0.0589, 5: 0.0421,
            6: 0.0283, 7: 0.0217, 8: 0.0148, 9: 0.0154, 10: 0.0123,
            11: 0.0161, 12: 0.0193
        }
        
        self.daily_users = 100000
    
    def calculate_success_scenario(self, p_correct, p_watch_ad, p_extra_reward, p_retry, ad_revenue, extra_reward):
        """정답 즉시 성공 시나리오 계산"""
        # 광고 시청 수 (정답자 중 광고 시청하는 비율)
        ad_views = p_watch_ad
        
        # 추가 보상 획득 수 (광고 시청자 중 추가 보상 받는 비율)
        extra_rewards = p_watch_ad * p_extra_reward
        
        # 수익/비용
        revenue = ad_views * ad_revenue
        cost = self.costs['success_reward'] + extra_rewards * extra_reward
        
        return {
            'ad_views': ad_views,
            'extra_rewards': extra_rewards,
            'revenue': revenue,
            'cost': cost,
            'profit': revenue - cost
        }
    
    def calculate_failure_scenario(self, p_correct, p_watch_ad, p_extra_reward, p_retry, ad_revenue, extra_reward):
        """오답 후 재도전 시나리오 계산"""
        total_ad_views = 1  # 첫 강제 광고
        total_extra_rewards = 0
        total_retry_success = 0
        
        retry_chance = p_retry
        max_retries = 10
        
        for attempt in range(1, max_retries + 1):
            # 이번 시도에서 성공할 확률
            success_prob = retry_chance * p_correct
            
            if success_prob > 0.001:  # 무시할 수 있는 수준까지
                # 재도전 성공 시
                total_retry_success += success_prob
                
                # 성공 후 광고 시청 및 추가 보상
                ad_after_success = success_prob * p_watch_ad
                extra_after_success = ad_after_success * p_extra_reward
                
                total_ad_views += ad_after_success
                total_extra_rewards += extra_after_success
            
            # 실패하고 재도전할 확률
            fail_and_retry_prob = retry_chance * (1 - p_correct) * p_retry
            
            if fail_and_retry_prob < 0.001:  # 무시할 수 있는 수준
                break
            
            # 실패 시 추가 광고
            total_ad_views += fail_and_retry_prob
            
            # 다음 재도전 확률 업데이트
            retry_chance = fail_and_retry_prob
        
        # 수익/비용 계산
        revenue = total_ad_views * ad_revenue
        cost = total_retry_success * self.costs['retry_success_reward'] + \
               total_extra_rewards * extra_reward
        
        return {
            'ad_views': total_ad_views,
            'retry_success': total_retry_success,
            'extra_rewards': total_extra_rewards,
            'revenue': revenue,
            'cost': cost,
            'profit': revenue - cost
        }
    
    def calculate_7day_streak_metrics(self, streak_reward):
        """7일 연속 참여 보상 계산"""
        adjusted_users = self.daily_users * self.streak_7_trigger_rate
        
        total_streak_users = 0
        total_streak_cost = 0
        
        for streak_count, probability in self.streak_7_distribution.items():
            expected_users = adjusted_users * probability
            streak_cost = expected_users * streak_count * streak_reward
            
            total_streak_users += expected_users
            total_streak_cost += streak_cost
        
        return {
            'daily_streak_users': total_streak_users,
            'daily_streak_cost': total_streak_cost
        }
    
    def calculate_scenario_metrics(self, p_correct, p_watch_ad, p_extra_reward, p_retry, ad_revenue, streak_reward, extra_reward):
        """단일 시나리오의 모든 지표 계산"""
        
        # 성공/실패 시나리오별 계산
        success_result = self.calculate_success_scenario(p_correct, p_watch_ad, p_extra_reward, p_retry, ad_revenue, extra_reward)
        failure_result = self.calculate_failure_scenario(p_correct, p_watch_ad, p_extra_reward, p_retry, ad_revenue, extra_reward)
        
        # 일일 사용자 분포
        daily_success_users = self.daily_users * p_correct
        daily_failure_users = self.daily_users * (1 - p_correct)
        
        # 일일 집계 지표
        일일_광고시청수 = int(daily_success_users * success_result['ad_views'] + 
                         daily_failure_users * failure_result['ad_views'])
        
        일일_참여수 = self.daily_users
        
        일일_일반보상지급수 = int(daily_success_users)
        
        일일_재도전성공수 = int(daily_failure_users * failure_result['retry_success'])
        
        일일_추가보상수 = int(daily_success_users * success_result['extra_rewards'] +
                         daily_failure_users * failure_result['extra_rewards'])
        
        # 7일 연속 참여 보상
        streak_metrics = self.calculate_7day_streak_metrics(streak_reward)
        일일_7일연속보상수 = int(streak_metrics['daily_streak_users'])
        
        # 보상액 계산
        일반보상액 = 일일_일반보상지급수 * self.costs['success_reward']
        재도전보상액 = 일일_재도전성공수 * self.costs['retry_success_reward']
        추가보상액 = 일일_추가보상수 * extra_reward
        연속보상액 = streak_metrics['daily_streak_cost']
        총보상액 = 일반보상액 + 재도전보상액 + 추가보상액 + 연속보상액
        
        # 매출액
        광고매출액 = 일일_광고시청수 * ad_revenue
        총매출액 = 광고매출액
        
        # 손익 계산
        일일순손익액 = 총매출액 - 총보상액
        주간게임손익액 = (광고매출액 - (일반보상액 + 재도전보상액 + 추가보상액)) * 7
        주간순손익액 = 주간게임손익액 - 연속보상액
        수익성여부 = '수익' if 주간순손익액 > 0 else '손실'
        
        return {
            '광고매출': ad_revenue,
            '7일연속보상': streak_reward,
            '추가보상': extra_reward,
            '정답률': f"{p_correct:.1%}",
            '광고시청률': f"{p_watch_ad:.1%}",
            '추가보상률': f"{p_extra_reward:.1%}",
            '재도전률': f"{p_retry:.1%}",
            '일일_광고시청수': 일일_광고시청수,
            '일일_참여수': 일일_참여수,
            '일일_일반보상지급수': 일일_일반보상지급수,
            '일일_재도전성공수': 일일_재도전성공수,
            '일일_추가보상수': 일일_추가보상수,
            '일일_7일연속보상수': 일일_7일연속보상수,
            '일반보상액': 일반보상액,
            '재도전보상액': 재도전보상액,
            '추가보상액': 추가보상액,
            '7일연속보상액': int(연속보상액),
            '총보상액': int(총보상액),
            '광고매출액': 광고매출액,
            '총매출액': 총매출액,
            '일일순손익액': int(일일순손익액),
            '주간순손익액': int(주간순손익액),
            '수익성여부': 수익성여부
        }
    
    def run_grid_search(self):
        """전체 Grid Search 실행 (비용/매출 변수 포함)"""
        
        # Grid 범위 정의
        correct_rates = [0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8]
        watch_ad_rates = [0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8]
        extra_reward_rates = [0.5, 0.6, 0.7, 0.8, 0.9]
        retry_rates = [0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8]
        
        # 비용/매출 변수 범위 추가
        ad_revenues = [1, 2, 3, 4, 5]  # 광고 매출 1~5원
        streak_rewards = [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]  # 7일 연속 보상 10~100원
        extra_rewards = [1, 2, 3]  # 추가 보상 1~3원
        
        total_scenarios = (len(correct_rates) * len(watch_ad_rates) * len(extra_reward_rates) * 
                          len(retry_rates) * len(ad_revenues) * len(streak_rewards) * len(extra_rewards))
        
        print(f"Grid Search 시작:")
        print(f"확률 변수: {len(correct_rates)}×{len(watch_ad_rates)}×{len(extra_reward_rates)}×{len(retry_rates)}")
        print(f"비용/매출 변수: {len(ad_revenues)}×{len(streak_rewards)}×{len(extra_rewards)}")
        print(f"총 시나리오: {total_scenarios:,}개")
        
        results = []
        scenario_id = 1
        
        # 모든 조합에 대해 계산
        for ad_revenue, streak_reward, extra_reward in product(ad_revenues, streak_rewards, extra_rewards):
            for p_correct, p_watch_ad, p_extra_reward, p_retry in product(
                correct_rates, watch_ad_rates, extra_reward_rates, retry_rates
            ):
                metrics = self.calculate_scenario_metrics(
                    p_correct, p_watch_ad, p_extra_reward, p_retry,
                    ad_revenue, streak_reward, extra_reward
                )
                
                # 시나리오 ID 추가
                metrics['시나리오_ID'] = f"S{scenario_id:06d}"
                
                results.append(metrics)
                scenario_id += 1
                
                # 진행상황 출력
                if scenario_id % 10000 == 0:
                    progress = (scenario_id-1) / total_scenarios * 100
                    print(f"진행상황: {scenario_id-1:,}개 완료 ({progress:.1f}%)...")
        
        # DataFrame 생성 (컬럼 순서 조정)
        column_order = [
            '시나리오_ID', '광고매출', '7일연속보상', '추가보상',
            '정답률', '광고시청률', '추가보상률', '재도전률',
            '일일_광고시청수', '일일_참여수', '일일_일반보상지급수', '일일_재도전성공수', 
            '일일_추가보상수', '일일_7일연속보상수',
            '일반보상액', '재도전보상액', '추가보상액', '7일연속보상액', '총보상액',
            '광고매출액', '총매출액', '일일순손익액', '주간순손익액', '수익성여부'
        ]
        
        df = pd.DataFrame(results)[column_order]
        
        print(f"Grid Search 완료: {len(df):,}개 시나리오 생성")
        print(f"수익 시나리오: {len(df[df['수익성여부'] == '수익']):,}개")
        print(f"손실 시나리오: {len(df[df['수익성여부'] == '손실']):,}개")
        
        return df

def extract_best_scenarios(df, base_scenario_params=None, n=10, sort_by='주간순손익액', improvement_threshold=0):
    """
    기존 대비 가장 좋은 시나리오를 n개 추출하는 함수
    
    Parameters:
    -----------
    df : pandas.DataFrame
        Grid Search 결과 데이터프레임
    base_scenario_params : dict, optional
        기준 시나리오 파라미터. None이면 기본값 사용
    n : int
        추출할 시나리오 개수 (기본값: 10)
    sort_by : str
        정렬 기준 컬럼 (기본값: '주간순손익액')
    improvement_threshold : int
        최소 개선 금액 기준 (기본값: 0원)
    
    Returns:
    --------
    dict : 분석 결과를 포함한 딕셔너리
    """
    
    # 필수 컬럼 확인
    required_columns = ['시나리오_ID', sort_by]
    if not all(col in df.columns for col in required_columns):
        print(f"❌ 필수 컬럼이 없습니다: {[col for col in required_columns if col not in df.columns]}")
        return None
    
    # 기본 시나리오 파라미터 설정
    if base_scenario_params is None:
        base_scenario_params = {
            '광고매출': 1,
            '7일연속보상': 100,
            '추가보상': 3,
            '정답률': '50.0%',
            '광고시청률': '50.0%',
            '추가보상률': '70.0%',
            '재도전률': '50.0%'
        }
    
    # 기준 시나리오 찾기 (존재하는 컬럼만 사용)
    base_scenario = df.copy()
    valid_params = {}
    
    for key, value in base_scenario_params.items():
        if key in df.columns:
            base_scenario = base_scenario[base_scenario[key] == value]
            valid_params[key] = value
        else:
            print(f"⚠️ 컬럼 '{key}'이 존재하지 않아 조건에서 제외됩니다.")
    
    if base_scenario.empty:
        print("❌ 기준 시나리오를 찾을 수 없습니다.")
        print(f"유효한 검색 조건: {valid_params}")
        return None
    
    base_profit = base_scenario.iloc[0][sort_by]
    base_scenario_id = base_scenario.iloc[0]['시나리오_ID']
    
    print(f"=== 기준 시나리오 ({base_scenario_id}) ===")
    
    # 존재하는 컬럼만 출력
    cost_vars = ['광고매출', '7일연속보상', '추가보상']
    prob_vars = ['정답률', '광고시청률', '추가보상률', '재도전률']
    
    cost_info = []
    for var in cost_vars:
        if var in df.columns:
            cost_info.append(f"{var}={base_scenario.iloc[0][var]}")
    
    prob_info = []
    for var in prob_vars:
        if var in df.columns:
            prob_info.append(base_scenario.iloc[0][var])
    
    if cost_info:
        print(f"설정: {', '.join(cost_info)}")
    if prob_info:
        print(f"확률: {', '.join(map(str, prob_info))}")
    
    print(f"기준 {sort_by}: {base_profit:,}원")
    
    if '수익성여부' in df.columns:
        print(f"수익성: {base_scenario.iloc[0]['수익성여부']}")
    
    # 개선된 시나리오 필터링
    improved_scenarios = df[df[sort_by] > base_profit + improvement_threshold].copy()
    
    if improved_scenarios.empty:
        print(f"\n❌ 개선 기준({improvement_threshold:,}원)을 만족하는 시나리오가 없습니다.")
        return {
            'base_scenario': base_scenario.iloc[0],
            'improved_scenarios': pd.DataFrame(),
            'analysis': {}
        }
    
    # 개선 금액 계산
    improved_scenarios['개선금액'] = improved_scenarios[sort_by] - base_profit
    if base_profit > 0:
        improved_scenarios['개선배수'] = improved_scenarios[sort_by] / base_profit
    else:
        improved_scenarios['개선배수'] = float('inf')
    
    # 상위 n개 추출
    best_scenarios = improved_scenarios.nlargest(n, sort_by).copy()
    
    print(f"\n=== 상위 {len(best_scenarios)}개 개선 시나리오 ===")
    print(f"총 {len(improved_scenarios):,}개 시나리오가 기준보다 우수함")
    
    # 결과 테이블 출력 (존재하는 컬럼만)
    display_columns = ['시나리오_ID']
    
    for col in cost_vars + prob_vars + [sort_by, '개선금액']:
        if col in best_scenarios.columns:
            display_columns.append(col)
    
    if '수익성여부' in best_scenarios.columns:
        display_columns.append('수익성여부')
    
    print(best_scenarios[display_columns].to_string(index=False))
    
    # 변수별 개선 영향 분석
    print(f"\n=== 변수별 개선 영향 분석 ===")
    
    variable_analysis = {}
    
    # 비용/매출 변수 분석 (존재하는 것만)
    for var in cost_vars:
        if var in df.columns:
            base_value = base_scenario.iloc[0][var]
            var_changes = best_scenarios[var] - base_value
            variable_analysis[var] = {
                '기준값': base_value,
                '평균변화': var_changes.mean(),
                '최대값': best_scenarios[var].max(),
                '최소값': best_scenarios[var].min(),
                '변화범위': f"{var_changes.min():+} ~ {var_changes.max():+}"
            }
            print(f"{var}: 기준 {base_value} → 범위 {best_scenarios[var].min()}~{best_scenarios[var].max()} (평균변화: {var_changes.mean():+.1f})")
    
    # 확률 변수 분석 (존재하는 것만)
    print(f"\n확률 변수 분포:")
    for var in prob_vars:
        if var in df.columns:
            var_dist = best_scenarios[var].value_counts().sort_index()
            if len(var_dist) > 0:
                most_common = var_dist.index[0]
                print(f"{var}: 최빈값 {most_common} ({var_dist.iloc[0]}회), 전체 {len(var_dist)}개 값")
    
    return {
        'base_scenario': base_scenario.iloc[0],
        'best_scenarios': best_scenarios,
        'improved_count': len(improved_scenarios),
        'variable_analysis': variable_analysis
    }

def analyze_scenario_comparison(df, scenario_ids):
    """
    특정 시나리오들을 상세 비교 분석하는 함수
    
    Parameters:
    -----------
    df : pandas.DataFrame
        Grid Search 결과 데이터프레임
    scenario_ids : list
        비교할 시나리오 ID 리스트
    """
    scenarios = df[df['시나리오_ID'].isin(scenario_ids)].copy()
    
    if scenarios.empty:
        print("❌ 해당 시나리오들을 찾을 수 없습니다.")
        return
    
    print(f"=== 시나리오 상세 비교 ({len(scenarios)}개) ===")
    
    # 주요 지표 비교 (존재하는 컬럼만)
    comparison_columns = ['시나리오_ID']
    
    # 비용/매출 변수
    for col in ['광고매출', '7일연속보상', '추가보상']:
        if col in df.columns:
            comparison_columns.append(col)
    
    # 확률 변수
    for col in ['정답률', '광고시청률', '추가보상률', '재도전률']:
        if col in df.columns:
            comparison_columns.append(col)
    
    # 결과 지표
    for col in ['일일_광고시청수', '일일순손익액', '주간순손익액', '수익성여부']:
        if col in df.columns:
            comparison_columns.append(col)
    
    print(scenarios[comparison_columns].to_string(index=False))
    
    # 수익 구조 분석 (존재하는 컬럼만)
    print(f"\n=== 수익 구조 분석 ===")
    
    for idx, row in scenarios.iterrows():
        print(f"\n{row['시나리오_ID']}:")
        
        # 매출 정보
        if '광고매출액' in df.columns:
            print(f"  매출: 광고 {row['광고매출액']:,}원")
        
        # 비용 정보
        cost_info = []
        if '일반보상액' in df.columns:
            cost_info.append(f"일반 {row['일반보상액']:,}원")
        if '재도전보상액' in df.columns:
            cost_info.append(f"재도전 {row['재도전보상액']:,}원")
        if '추가보상액' in df.columns:
            cost_info.append(f"추가 {row['추가보상액']:,}원")
        if '7일연속보상액' in df.columns:
            cost_info.append(f"연속 {row['7일연속보상액']:,}원")
        
        if cost_info:
            total_cost = row['총보상액'] if '총보상액' in df.columns else 0
            print(f"  비용: {' + '.join(cost_info)} = {total_cost:,}원")
        
        if '주간순손익액' in df.columns:
            print(f"  순이익: {row['주간순손익액']:,}원")

def main():
    """메인 실행 함수"""
    
    # 분석기 생성 및 실행
    analyzer = QuizGridSearchAnalyzer()
    
    # 먼저 작은 샘플로 테스트
    print("=== 샘플 테스트 ===")
    test_metrics = analyzer.calculate_scenario_metrics(0.5, 0.5, 0.7, 0.5, 1, 100, 3)
    print(f"테스트 결과 키: {list(test_metrics.keys())}")
    print(f"광고매출 포함 여부: {'광고매출' in test_metrics}")
    print(f"7일연속보상 포함 여부: {'7일연속보상' in test_metrics}")
    print(f"추가보상 포함 여부: {'추가보상' in test_metrics}")
    
    # 전체 Grid Search 실행
    df = analyzer.run_grid_search()
    
    # 기본 통계 출력
    print("\n=== 기본 통계 ===")
    print(f"전체 시나리오 수: {len(df):,}")
    
    # 컬럼 존재 여부 확인
    print(f"DataFrame 컬럼: {list(df.columns)}")
    
    # 비용/매출 변수 확인
    cost_vars = ['광고매출', '7일연속보상', '추가보상']
    missing_cost_vars = [var for var in cost_vars if var not in df.columns]
    
    if missing_cost_vars:
        print(f"❌ 누락된 비용/매출 변수: {missing_cost_vars}")
    else:
        print(f"✅ 모든 비용/매출 변수 존재")
    
    if '수익성여부' in df.columns:
        print(f"수익 시나리오 수: {len(df[df['수익성여부'] == '수익']):,}")
        print(f"수익률: {len(df[df['수익성여부'] == '수익'])/len(df)*100:.1f}%")
    
    if '주간순손익액' in df.columns:
        print(f"\n주간 순손익 범위:")
        print(f"최대 수익: {df['주간순손익액'].max():,}원")
        print(f"최대 손실: {df['주간순손익액'].min():,}원")
        print(f"평균: {df['주간순손익액'].mean():,.0f}원")
    
    # 컬럼 확인 후 상위 시나리오 출력
    required_columns = ['시나리오_ID', '정답률', '광고시청률', '추가보상률', '재도전률', '주간순손익액']
    
    # 비용/매출 변수가 있으면 추가
    available_cost_vars = [var for var in cost_vars if var in df.columns]
    display_columns = ['시나리오_ID'] + available_cost_vars + ['정답률', '광고시청률', '추가보상률', '재도전률', '주간순손익액']
    
    # 실제 존재하는 컬럼만 필터링
    final_display_columns = [col for col in display_columns if col in df.columns]
    
    if '주간순손익액' in df.columns:
        # 상위 10개 수익 시나리오
        print(f"\n=== 상위 10개 수익 시나리오 ===")
        print(f"표시 컬럼: {final_display_columns}")
        top10 = df.nlargest(10, '주간순손익액')[final_display_columns]
        print(top10.to_string(index=False))
    
    # 기본 시나리오 찾기 (존재하는 컬럼만 사용)
    base_conditions = []
    
    if '광고매출' in df.columns:
        base_conditions.append(('광고매출', 1))
    if '7일연속보상' in df.columns:
        base_conditions.append(('7일연속보상', 100))
    if '추가보상' in df.columns:
        base_conditions.append(('추가보상', 3))
    if '정답률' in df.columns:
        base_conditions.append(('정답률', '50.0%'))
    if '광고시청률' in df.columns:
        base_conditions.append(('광고시청률', '50.0%'))
    if '추가보상률' in df.columns:
        base_conditions.append(('추가보상률', '70.0%'))
    if '재도전률' in df.columns:
        base_conditions.append(('재도전률', '50.0%'))
    
    if base_conditions:
        base_scenario = df.copy()
        for col, val in base_conditions:
            base_scenario = base_scenario[base_scenario[col] == val]
        
        if not base_scenario.empty:
            print(f"\n=== 기본 시나리오 ({base_scenario.iloc[0]['시나리오_ID']}) ===")
            
            # 설정 정보 출력 (존재하는 것만)
            cost_info = []
            if '광고매출' in df.columns:
                cost_info.append(f"광고매출={base_scenario.iloc[0]['광고매출']}원")
            if '7일연속보상' in df.columns:
                cost_info.append(f"7일연속보상={base_scenario.iloc[0]['7일연속보상']}원")
            if '추가보상' in df.columns:
                cost_info.append(f"추가보상={base_scenario.iloc[0]['추가보상']}원")
            
            if cost_info:
                print(f"설정: {', '.join(cost_info)}")
            
            # 확률 정보 출력
            prob_info = []
            for var in ['정답률', '광고시청률', '추가보상률', '재도전률']:
                if var in df.columns:
                    prob_info.append(base_scenario.iloc[0][var])
            
            if prob_info:
                print(f"확률: {', '.join(map(str, prob_info))}")
            
            if '주간순손익액' in df.columns:
                print(f"주간 순손익: {base_scenario.iloc[0]['주간순손익액']:,}원")
            if '수익성여부' in df.columns:
                print(f"수익성: {base_scenario.iloc[0]['수익성여부']}")
    
    # 비용/매출 변수별 수익 시나리오 분포
    if '수익성여부' in df.columns:
        profitable_df = df[df['수익성여부'] == '수익']
        
        if len(profitable_df) > 0:
            print(f"\n=== 비용/매출 변수별 수익 시나리오 분포 ===")
            
            for var in ['광고매출', '7일연속보상', '추가보상']:
                if var in df.columns:
                    var_dist = profitable_df[var].value_counts().sort_index()
                    print(f"{var}별 수익 시나리오 수:")
                    for value, count in var_dist.items():
                        print(f"  {value}: {count:,}개")
                    print()
    
    # CSV 저장
    filename = 'quiz_grid_search_results_extended.csv'
    df.to_csv(filename, index=False, encoding='utf-8-sig')
    print(f"\n결과가 '{filename}'에 저장되었습니다.")
    
    return df

# 실행
if __name__ == "__main__":
    df = main()
    
    # DataFrame이 성공적으로 생성되었는지 확인
    if df is not None and len(df) > 0:
        print("\n" + "="*80)
        
        # 예시: 상위 10개 시나리오 추출
        try:
            best_analysis = extract_best_scenarios(df, n=10)
            
            if best_analysis:
                print("\n✅ 기본 시나리오 분석 완료")
            else:
                print("\n❌ 기본 시나리오 분석 실패")
        except Exception as e:
            print(f"\n❌ 기본 시나리오 분석 중 오류: {e}")
        
        # 예시: 특정 조건으로 시나리오 추출 (컬럼 존재 확인)
        print("\n" + "="*80)
        
        # 커스텀 기준 시나리오가 있는지 확인
        required_cols = ['광고매출', '7일연속보상', '추가보상', '정답률', '광고시청률', '추가보상률', '재도전률']
        if all(col in df.columns for col in required_cols):
            try:
                custom_base = {
                    '광고매출': 2,
                    '7일연속보상': 50,
                    '추가보상': 2,
                    '정답률': '60.0%',
                    '광고시청률': '60.0%',
                    '추가보상률': '80.0%',
                    '재도전률': '40.0%'
                }
                custom_analysis = extract_best_scenarios(df, base_scenario_params=custom_base, n=5, improvement_threshold=100000)
                
                if custom_analysis:
                    print("\n✅ 커스텀 시나리오 분석 완료")
                else:
                    print("\n❌ 커스텀 시나리오 분석 실패")
            except Exception as e:
                print(f"\n❌ 커스텀 시나리오 분석 중 오류: {e}")
        else:
            missing_cols = [col for col in required_cols if col not in df.columns]
            print(f"\n⚠️ 커스텀 분석을 위한 필수 컬럼 누락: {missing_cols}")
    else:
        print("\n❌ DataFrame 생성 실패")

=== 샘플 테스트 ===
테스트 결과 키: ['광고매출', '7일연속보상', '추가보상', '정답률', '광고시청률', '추가보상률', '재도전률', '일일_광고시청수', '일일_참여수', '일일_일반보상지급수', '일일_재도전성공수', '일일_추가보상수', '일일_7일연속보상수', '일반보상액', '재도전보상액', '추가보상액', '7일연속보상액', '총보상액', '광고매출액', '총매출액', '일일순손익액', '주간순손익액', '수익성여부']
광고매출 포함 여부: True
7일연속보상 포함 여부: True
추가보상 포함 여부: True
Grid Search 시작:
확률 변수: 7×7×5×7
비용/매출 변수: 5×10×3
총 시나리오: 257,250개
진행상황: 9,999개 완료 (3.9%)...
진행상황: 19,999개 완료 (7.8%)...
진행상황: 29,999개 완료 (11.7%)...
진행상황: 39,999개 완료 (15.5%)...
진행상황: 49,999개 완료 (19.4%)...
진행상황: 59,999개 완료 (23.3%)...
진행상황: 69,999개 완료 (27.2%)...
진행상황: 79,999개 완료 (31.1%)...
진행상황: 89,999개 완료 (35.0%)...
진행상황: 99,999개 완료 (38.9%)...
진행상황: 109,999개 완료 (42.8%)...
진행상황: 119,999개 완료 (46.6%)...
진행상황: 129,999개 완료 (50.5%)...
진행상황: 139,999개 완료 (54.4%)...
진행상황: 149,999개 완료 (58.3%)...
진행상황: 159,999개 완료 (62.2%)...
진행상황: 169,999개 완료 (66.1%)...
진행상황: 179,999개 완료 (70.0%)...
진행상황: 189,999개 완료 (73.9%)...
진행상황: 199,999개 완료 (77.7%)...
진행상황: 209,999개 완료 (81.6%)...
진행상황: 219,999개 완료 (85.5%)...
진행상황

In [6]:
import pandas as pd
import numpy as np

def filter_bep_scenarios(df, bep_threshold=0, tolerance=50000):
    """
    BEP(손익분기점)이 달성되는 시나리오들을 필터링하는 함수
    
    Parameters:
    -----------
    df : pandas.DataFrame
        Grid Search 결과 데이터프레임
    bep_threshold : int
        BEP 기준값 (기본값: 0원, 즉 수익 전환점)
    tolerance : int
        BEP 허용 오차 범위 (기본값: ±50,000원)
    
    Returns:
    --------
    dict : BEP 시나리오 분석 결과
    """
    
    if '주간순손익액' not in df.columns:
        print("❌ '주간순손익액' 컬럼이 존재하지 않습니다.")
        return None
    
    # BEP 범위 계산
    bep_min = bep_threshold - tolerance
    bep_max = bep_threshold + tolerance
    
    # BEP 시나리오 필터링
    bep_scenarios = df[
        (df['주간순손익액'] >= bep_min) & 
        (df['주간순손익액'] <= bep_max)
    ].copy()
    
    print(f"=== BEP 시나리오 분석 ===")
    print(f"BEP 기준: {bep_threshold:,}원 ± {tolerance:,}원 (범위: {bep_min:,}원 ~ {bep_max:,}원)")
    print(f"발견된 BEP 시나리오: {len(bep_scenarios):,}개")
    
    if bep_scenarios.empty:
        print("❌ BEP 범위 내 시나리오가 없습니다.")
        return {
            'bep_scenarios': pd.DataFrame(),
            'analysis': {},
            'recommendations': []
        }
    
    # BEP 시나리오 정렬 (BEP에 가장 가까운 순서)
    bep_scenarios['bep_distance'] = abs(bep_scenarios['주간순손익액'] - bep_threshold)
    bep_scenarios = bep_scenarios.sort_values('bep_distance')
    
    # 상위 20개 BEP 시나리오 출력
    display_columns = ['시나리오_ID']
    cost_vars = ['광고매출', '7일연속보상', '추가보상']
    prob_vars = ['정답률', '광고시청률', '추가보상률', '재도전률']
    
    # 존재하는 컬럼만 추가
    for col in cost_vars + prob_vars + ['주간순손익액', 'bep_distance']:
        if col in bep_scenarios.columns:
            display_columns.append(col)
    
    print(f"\n=== BEP에 가장 가까운 상위 20개 시나리오 ===")
    top_bep = bep_scenarios.head(20)[display_columns]
    print(top_bep.to_string(index=False))
    
    # BEP 시나리오 패턴 분석
    print(f"\n=== BEP 시나리오 패턴 분석 ===")
    
    pattern_analysis = {}
    
    # 비용/매출 변수 분포 분석
    for var in cost_vars:
        if var in bep_scenarios.columns:
            var_dist = bep_scenarios[var].value_counts().sort_index()
            most_common = var_dist.index[0]
            pattern_analysis[var] = {
                '최빈값': most_common,
                '빈도': var_dist.iloc[0],
                '분포': dict(var_dist)
            }
            print(f"{var} 분포:")
            print(f"  최빈값: {most_common} ({var_dist.iloc[0]}회)")
            print(f"  전체 분포: {dict(var_dist.head(5))}")
            print()
    
    # 확률 변수 분포 분석
    for var in prob_vars:
        if var in bep_scenarios.columns:
            var_dist = bep_scenarios[var].value_counts().sort_index()
            if len(var_dist) > 0:
                most_common = var_dist.index[0]
                pattern_analysis[var] = {
                    '최빈값': most_common,
                    '빈도': var_dist.iloc[0],
                    '분포': dict(var_dist)
                }
                print(f"{var} 분포:")
                print(f"  최빈값: {most_common} ({var_dist.iloc[0]}회)")
                print(f"  전체 분포: {dict(var_dist.head(5))}")
                print()
    
    # BEP 달성을 위한 추천 조합
    print(f"=== BEP 달성 추천 조합 ===")
    
    recommendations = []
    
    # 가장 BEP에 가까운 시나리오 (정확한 BEP)
    closest_bep = bep_scenarios.iloc[0]
    recommendations.append({
        'type': '정확한 BEP',
        'scenario_id': closest_bep['시나리오_ID'],
        'profit': closest_bep['주간순손익액'],
        'distance': closest_bep['bep_distance'],
        'description': f"BEP에 가장 가까운 시나리오 (오차: {closest_bep['bep_distance']:,}원)"
    })
    
    print(f"💯 정확한 BEP 달성: {closest_bep['시나리오_ID']}")
    print(f"   순이익: {closest_bep['주간순손익액']:,}원 (오차: {closest_bep['bep_distance']:,}원)")
    
    # 설정 정보 출력
    cost_info = []
    for var in cost_vars:
        if var in bep_scenarios.columns:
            cost_info.append(f"{var}={closest_bep[var]}")
    
    prob_info = []
    for var in prob_vars:
        if var in bep_scenarios.columns:
            prob_info.append(str(closest_bep[var]))
    
    if cost_info:
        print(f"   설정: {', '.join(cost_info)}")
    if prob_info:
        print(f"   확률: {', '.join(prob_info)}")
    
    # 달성하기 쉬운 BEP 시나리오 (변경 변수 최소화)
    print(f"\n🎯 달성하기 쉬운 BEP 시나리오:")
    
    # 기본 설정과 비교하여 변경사항이 적은 시나리오 찾기
    base_settings = {
        '광고매출': 1,
        '7일연속보상': 100,
        '추가보상': 3,
        '정답률': '50.0%',
        '광고시청률': '50.0%',
        '추가보상률': '70.0%',
        '재도전률': '50.0%'
    }
    
    # 각 BEP 시나리오의 변경사항 계산
    bep_scenarios['변경사항'] = 0
    for idx, row in bep_scenarios.iterrows():
        changes = 0
        for var, base_val in base_settings.items():
            if var in bep_scenarios.columns and row[var] != base_val:
                changes += 1
        bep_scenarios.loc[idx, '변경사항'] = changes
    
    # 변경사항이 적은 순으로 정렬
    easy_bep = bep_scenarios.nsmallest(5, ['변경사항', 'bep_distance'])
    
    for i, (idx, row) in enumerate(easy_bep.iterrows()):
        print(f"   {i+1}. {row['시나리오_ID']}: {row['주간순손익액']:,}원 (변경 {int(row['변경사항'])}개 변수)")
        
        # 변경된 설정만 출력
        changes = []
        for var, base_val in base_settings.items():
            if var in bep_scenarios.columns and row[var] != base_val:
                changes.append(f"{var}: {base_val} → {row[var]}")
        
        if changes:
            print(f"      변경사항: {', '.join(changes)}")
        else:
            print(f"      변경사항: 없음 (기본 설정)")
        
        recommendations.append({
            'type': '달성 용이',
            'scenario_id': row['시나리오_ID'],
            'profit': row['주간순손익액'],
            'changes': int(row['변경사항']),
            'description': f"변경 {int(row['변경사항'])}개 변수로 BEP 달성"
        })
    
    # BEP 달성 전략 요약
    print(f"\n=== BEP 달성 전략 요약 ===")
    
    # 가장 효과적인 변수 찾기
    effective_vars = {}
    
    for var in cost_vars + prob_vars:
        if var in bep_scenarios.columns:
            var_values = bep_scenarios[var].unique()
            base_val = base_settings.get(var)
            
            if base_val and base_val not in var_values:
                # 기본값이 BEP 시나리오에 없다면, 가장 빈번한 값이 효과적
                most_common = bep_scenarios[var].value_counts().index[0]
                effective_vars[var] = {
                    'recommended': most_common,
                    'from': base_val,
                    'frequency': bep_scenarios[var].value_counts().iloc[0]
                }
    
    if effective_vars:
        print("핵심 변경 권장사항:")
        for var, info in effective_vars.items():
            print(f"  {var}: {info['from']} → {info['recommended']} (BEP 시나리오 중 {info['frequency']}회 등장)")
    
    return {
        'bep_scenarios': bep_scenarios.drop('bep_distance', axis=1),
        'closest_bep': closest_bep,
        'pattern_analysis': pattern_analysis,
        'recommendations': recommendations,
        'effective_changes': effective_vars,
        'summary': {
            'total_scenarios': len(bep_scenarios),
            'bep_range': (bep_min, bep_max),
            'closest_distance': closest_bep['bep_distance']
        }
    }

def analyze_bep_sensitivity(df, base_scenario_params=None, step_size=10000):
    """
    BEP 민감도 분석 - 각 변수별로 BEP 달성에 필요한 최소 변화량 분석
    
    Parameters:
    -----------
    df : pandas.DataFrame
        Grid Search 결과 데이터프레임
    base_scenario_params : dict
        기준 시나리오 파라미터
    step_size : int
        BEP 범위 증가 단위
    """
    
    if '주간순손익액' not in df.columns:
        print("❌ '주간순손익액' 컬럼이 존재하지 않습니다.")
        return None
    
    # 기본 시나리오 설정
    if base_scenario_params is None:
        base_scenario_params = {
            '광고매출': 1,
            '7일연속보상': 100,
            '추가보상': 3,
            '정답률': '50.0%',
            '광고시청률': '50.0%',
            '추가보상률': '70.0%',
            '재도전률': '50.0%'
        }
    
    print(f"=== BEP 민감도 분석 ===")
    
    # 각 변수별 BEP 달성 분석
    sensitivity_results = {}
    
    for var, base_val in base_scenario_params.items():
        if var not in df.columns:
            continue
        
        print(f"\n{var} 민감도 분석:")
        print(f"기준값: {base_val}")
        
        # 해당 변수만 변경하고 나머지는 고정
        other_conditions = {k: v for k, v in base_scenario_params.items() if k != var and k in df.columns}
        
        # 조건에 맞는 시나리오 필터링
        filtered_df = df.copy()
        for other_var, other_val in other_conditions.items():
            filtered_df = filtered_df[filtered_df[other_var] == other_val]
        
        if filtered_df.empty:
            print("  ❌ 해당 조건의 시나리오가 없습니다.")
            continue
        
        # BEP 달성 시나리오 찾기
        bep_achieved = filtered_df[filtered_df['주간순손익액'] >= 0]
        
        if bep_achieved.empty:
            print("  ❌ BEP 달성 시나리오가 없습니다.")
            sensitivity_results[var] = {'achievable': False}
            continue
        
        # 가장 기준값에 가까운 BEP 달성 시나리오
        if var in ['광고매출', '7일연속보상', '추가보상']:
            # 숫자형 변수
            bep_achieved['distance_from_base'] = abs(bep_achieved[var] - base_val)
        else:
            # 확률 변수 (백분율)
            base_numeric = float(str(base_val).rstrip('%'))
            bep_achieved['distance_from_base'] = abs(
                bep_achieved[var].str.rstrip('%').astype(float) - base_numeric
            )
        
        closest_bep = bep_achieved.nsmallest(1, 'distance_from_base').iloc[0]
        
        print(f"  ✅ BEP 달성 가능")
        print(f"  최소 변경: {base_val} → {closest_bep[var]}")
        print(f"  달성 순이익: {closest_bep['주간순손익액']:,}원")
        
        sensitivity_results[var] = {
            'achievable': True,
            'base_value': base_val,
            'bep_value': closest_bep[var],
            'min_profit': closest_bep['주간순손익액'],
            'scenario_id': closest_bep['시나리오_ID']
        }
    
    # 민감도 순위
    print(f"\n=== 변수별 BEP 달성 난이도 순위 ===")
    
    achievable_vars = {k: v for k, v in sensitivity_results.items() if v.get('achievable', False)}
    
    if achievable_vars:
        # 변화량 기준 정렬 (숫자형과 확률형 구분)
        ranked_vars = []
        
        for var, info in achievable_vars.items():
            if var in ['광고매출', '7일연속보상', '추가보상']:
                change_magnitude = abs(info['bep_value'] - info['base_value'])
                change_ratio = change_magnitude / info['base_value'] if info['base_value'] != 0 else float('inf')
            else:
                base_numeric = float(str(info['base_value']).rstrip('%'))
                bep_numeric = float(str(info['bep_value']).rstrip('%'))
                change_magnitude = abs(bep_numeric - base_numeric)
                change_ratio = change_magnitude / base_numeric if base_numeric != 0 else float('inf')
            
            ranked_vars.append({
                'variable': var,
                'change_magnitude': change_magnitude,
                'change_ratio': change_ratio,
                'info': info
            })
        
        # 변화 비율 기준 정렬 (작은 변화가 더 쉬움)
        ranked_vars.sort(key=lambda x: x['change_ratio'])
        
        for i, item in enumerate(ranked_vars):
            var = item['variable']
            info = item['info']
            print(f"{i+1}. {var}: {info['base_value']} → {info['bep_value']}")
            print(f"   시나리오: {info['scenario_id']}, 순이익: {info['min_profit']:,}원")
            print(f"   변화율: {item['change_ratio']:.1%}")
            print()
    
    return {
        'sensitivity_results': sensitivity_results,
        'ranking': ranked_vars if achievable_vars else [],
        'achievable_count': len(achievable_vars)
    }

# 사용 예시
if __name__ == "__main__":
    # 예시 데이터프레임이 있다고 가정
    # df = 실제 Grid Search 결과 DataFrame
    
    print("=== BEP 분석 함수 사용 예시 ===")
    print()
    print("1. BEP 시나리오 필터링:")
    print("   bep_analysis = filter_bep_scenarios(df, bep_threshold=0, tolerance=50000)")
    print()
    print("2. BEP 민감도 분석:")
    print("   sensitivity_analysis = analyze_bep_sensitivity(df)")
    print()
    print("3. 결과 활용:")
    print("   bep_scenarios = bep_analysis['bep_scenarios']")
    print("   bep_scenarios.to_csv('bep_scenarios.csv', index=False)")
    print()
    print("함수가 성공적으로 정의되었습니다!")

=== BEP 분석 함수 사용 예시 ===

1. BEP 시나리오 필터링:
   bep_analysis = filter_bep_scenarios(df, bep_threshold=0, tolerance=50000)

2. BEP 민감도 분석:
   sensitivity_analysis = analyze_bep_sensitivity(df)

3. 결과 활용:
   bep_scenarios = bep_analysis['bep_scenarios']
   bep_scenarios.to_csv('bep_scenarios.csv', index=False)

함수가 성공적으로 정의되었습니다!


In [12]:
bep_analysis = filter_bep_scenarios(df, bep_threshold=0, tolerance=1000)

=== BEP 시나리오 분석 ===
BEP 기준: 0원 ± 1,000원 (범위: -1,000원 ~ 1,000원)
발견된 BEP 시나리오: 58개

=== BEP에 가장 가까운 상위 20개 시나리오 ===
시나리오_ID  광고매출  7일연속보상  추가보상   정답률 광고시청률 추가보상률  재도전률  주간순손익액  bep_distance
S052030     2      10     1 40.0% 40.0% 70.0% 70.0%     -56            56
S207381     5      10     1 80.0% 50.0% 50.0% 70.0%      56            56
S210212     5      10     3 60.0% 20.0% 50.0% 30.0%     -70            70
S195670     4      90     1 20.0% 60.0% 70.0% 70.0%      70            70
S231569     5      60     1 20.0% 30.0% 60.0% 30.0%      77            77
S210561     5      10     3 70.0% 50.0% 50.0% 20.0%      98            98
S070455     2      40     3 20.0% 50.0% 90.0% 80.0%     -98            98
S194229     4      80     3 30.0% 70.0% 60.0% 80.0%    -133           133
S192535     4      80     2 30.0% 70.0% 90.0% 80.0%    -140           140
S163722     4      20     3 50.0% 30.0% 80.0% 70.0%     154           154
S161972     4      20     2 50.0% 20.0% 80.0% 70.0%     161           16

### 시나리오 분석

In [31]:
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 150)

In [30]:
df[
    (df['7일연속보상'] == 10)
    & (df['추가보상'] == 2)
    & (df['광고시청률'] == '70.0%')
    & (df['정답률'] == '50.0%')
]

Unnamed: 0,시나리오_ID,광고매출,7일연속보상,추가보상,정답률,광고시청률,추가보상률,재도전률,일일_광고시청수,일일_참여수,일일_일반보상지급수,일일_재도전성공수,일일_추가보상수,일일_7일연속보상수,일반보상액,재도전보상액,추가보상액,7일연속보상액,총보상액,광고매출액,총매출액,일일순손익액,주간순손익액,수익성여부
2625,S002626,1,10,2,50.0%,70.0%,50.0%,20.0%,89985,100000,50000,5550,19442,17498,150000,5550,38884,473375,667809,89985,89985,-577824,-1204518,손실
2626,S002627,1,10,2,50.0%,70.0%,50.0%,30.0%,93793,100000,50000,8793,20577,17498,150000,8793,41154,473375,673322,93793,93793,-579529,-1216453,손실
2627,S002628,1,10,2,50.0%,70.0%,50.0%,40.0%,98696,100000,50000,12480,21868,17498,150000,12480,43736,473375,679591,98696,98696,-580895,-1226015,손실
2628,S002629,1,10,2,50.0%,70.0%,50.0%,50.0%,104921,100000,50000,16601,23310,17498,150000,16601,46620,473375,686596,104921,104921,-581675,-1231475,손실
2629,S002630,1,10,2,50.0%,70.0%,50.0%,60.0%,112789,100000,50000,21376,24981,17498,150000,21376,49962,473375,694713,112789,112789,-581924,-1233218,손실
2630,S002631,1,10,2,50.0%,70.0%,50.0%,70.0%,122623,100000,50000,26873,26905,17498,150000,26873,53810,473375,704058,122623,122623,-581435,-1229795,손실
2631,S002632,1,10,2,50.0%,70.0%,50.0%,80.0%,134918,100000,50000,33278,29147,17498,150000,33278,58294,473375,714947,134918,134918,-580029,-1219953,손실
2632,S002633,1,10,2,50.0%,70.0%,60.0%,20.0%,89985,100000,50000,5550,23331,17498,150000,5550,46662,473375,675587,89985,89985,-585602,-1258964,손실
2633,S002634,1,10,2,50.0%,70.0%,60.0%,30.0%,93793,100000,50000,8793,24693,17498,150000,8793,49386,473375,681554,93793,93793,-587761,-1274077,손실
2634,S002635,1,10,2,50.0%,70.0%,60.0%,40.0%,98696,100000,50000,12480,26241,17498,150000,12480,52482,473375,688337,98696,98696,-589641,-1287237,손실
