In [1]:
import pandas as pd
import numpy as np
import re
import json
from typing import Dict, List, Tuple

# Конфигурация параметров
CONFIG = {
    'min_cpc': 0.5,
    'max_cpc': 15.0,
    'strategy_defaults': {
        'MaxClicksBudget': 100,
        'MaxClicksAvgCPC': 10,
        'MaxConversionsCPA': 500,
        'MaxConversionsCPC': 15,
        'ManualCPC': 8
    }
}

# ===============================================
# ЗАГРУЗКА И ПРЕДОБРАБОТКА ДАННЫХ
# ===============================================
def load_and_preprocess(file_path: str) -> pd.DataFrame:
    """Загрузка и предобработка данных с вычислением недостающих метрик"""
    # Функция для очистки числовых значений
    def clean_currency(value):
        if isinstance(value, str):
            cleaned = re.sub(r'[^\d.,]', '', value)
            cleaned = cleaned.replace(',', '.')
            if cleaned.count('.') > 1:
                cleaned = cleaned.replace('.', '', cleaned.count('.')-1)
            return float(cleaned) if cleaned else 0.0
        return float(value)
    
    # Загрузка данных
    try:
        df = pd.read_csv(file_path, sep='\t')
    except Exception as e:
        raise FileNotFoundError(f"Ошибка загрузки файла {file_path}: {str(e)}")
    
    # Удаление строк с итогами
    df = df[~df['Campaign'].str.contains('Всего|Total', case=False, na=False)]
    
    # Преобразование числовых колонок
    numeric_cols = ['Spend', 'CPC', 'Clicks', 'Current Conversions', 'ControlParameter']
    for col in numeric_cols:
        if col in df.columns:
            df[col] = df[col].apply(clean_currency)
    
    # Вычисление недостающих метрик
    # 1. Если нет кликов, но есть траты и CPC
    if 'Clicks' not in df.columns and 'Spend' in df.columns and 'CPC' in df.columns:
        df['Clicks'] = np.where(
            df['CPC'] > 0,
            df['Spend'] / df['CPC'],
            0
        )
        print("Вычислено колонки 'Clicks' на основе Spend и CPC")
    
    # 2. Если нет CPC, но есть траты и клики
    if 'CPC' not in df.columns and 'Spend' in df.columns and 'Clicks' in df.columns:
        df['CPC'] = np.where(
            df['Clicks'] > 0,
            df['Spend'] / df['Clicks'],
            CONFIG['min_cpc']
        )
        print("Вычислено колонки 'CPC' на основе Spend и Clicks")
    
    # 3. Если нет конверсий, используем 0
    if 'Current Conversions' not in df.columns:
        df['Current Conversions'] = 0
        print("Установлено значение 0 для отсутствующей колонки 'Current Conversions'")
    
    # Добавление стратегии, если отсутствует (с улучшенной логикой)
    if 'Strategy' not in df.columns:
        df['Strategy'] = np.where(
            df['Campaign'].str.contains('Budget', case=False, na=False), 'MaxClicksBudget',
            np.where(df['Campaign'].str.contains('AvgCPC', case=False, na=False), 'MaxClicksAvgCPC',
                    np.where(df['Campaign'].str.contains('CPA', case=False, na=False), 'MaxConversionsCPA',
                            np.where(df['Campaign'].str.contains('CPC', case=False, na=False), 'MaxConversionsCPC', 'ManualCPC')))
        )
        print("Автоматически определены стратегии на основе названий кампаний")
    
    # Заполнение параметра стратегии
    if 'ControlParameter' not in df.columns:
        df['ControlParameter'] = df['Strategy'].map(CONFIG['strategy_defaults'])
        print("Установлены значения по умолчанию для параметров стратегий")
    
    return df

# ===============================================
# ПРОВЕРКА ДАННЫХ
# ===============================================
def validate_data(df: pd.DataFrame):
    """Проверка качества данных перед расчетами"""
    required_columns = ['Campaign', 'Spend', 'Current Conversions']
    missing = [col for col in required_columns if col not in df.columns]
    
    if missing:
        raise ValueError(f"Отсутствуют обязательные колонки: {', '.join(missing)}")
    
    # Проверяем наличие необходимых для расчетов колонок
    if 'Clicks' not in df.columns:
        if 'CPC' in df.columns and 'Spend' in df.columns:
            df['Clicks'] = np.where(
                df['CPC'] > 0,
                df['Spend'] / df['CPC'],
                0
            )
            print("Вычислено колонки 'Clicks' в validate_data")
        else:
            raise ValueError("Отсутствуют данные для расчета кликов (нужны 'Spend' и 'CPC')")
    
    if 'CPC' not in df.columns:
        if 'Clicks' in df.columns and 'Spend' in df.columns:
            df['CPC'] = np.where(
                df['Clicks'] > 0,
                df['Spend'] / df['Clicks'],
                CONFIG['min_cpc']
            )
            print("Вычислено колонки 'CPC' в validate_data")
        else:
            raise ValueError("Отсутствуют данные для расчета CPC (нужны 'Spend' и 'Clicks')")
    
    if df['Spend'].le(0).all():
        print("Предупреждение: Все значения расходов нулевые или отрицательные!")
    
    # Проверка отрицательных значений
    negative_cols = []
    for col in ['Spend', 'Clicks', 'Current Conversions']:
        if col in df.columns and (df[col] < 0).any():
            negative_cols.append(col)
    
    if negative_cols:
        print(f"Предупреждение: Обнаружены отрицательные значения в колонках: {', '.join(negative_cols)}")
    
    # Логирование проблемных случаев
    zero_clicks = df[df['Clicks'] == 0]
    if not zero_clicks.empty:
        print(f"Внимание: {len(zero_clicks)} кампаний без кликов")
    
    zero_conversions = df[df['Current Conversions'] == 0]
    if not zero_conversions.empty:
        print(f"Внимание: {len(zero_conversions)} кампаний без конверсий")
    
    return df

# ===============================================
# РАСЧЕТ МЕТРИК БЛАГОСОСТОЯНИЯ (НОВАЯ ФУНКЦИЯ)
# ===============================================
def calculate_welfare_metrics(conversions_list: List[float]) -> Tuple[float, float]:
    """
    Расчет метрик справедливости распределения конверсий
    
    Nash Welfare (справедливость по Нэшу) - среднее геометрическое конверсий,
    показывает баланс между кампаниями. Чем выше и равномернее конверсии, тем выше значение.
    
    Egalitarian Welfare (эгалитарная справедливость) - минимальная конверсия,
    показывает гарантированный минимум для самой слабой кампании.
    """
    # Фильтруем нулевые значения для Nash Welfare
    conversions_nonzero = [c for c in conversions_list if c > 0]
    
    # Считаем Nash Welfare (среднее геометрическое)
    if conversions_nonzero:
        nash = np.prod(conversions_nonzero) ** (1/len(conversions_nonzero))
    else:
        nash = 0
    
    # Считаем Egalitarian Welfare (минимум)
    egalitarian = np.min(conversions_list) if conversions_list else 0
    
    return nash, egalitarian

# ===============================================
# ОПТИМИЗАЦИЯ БЮДЖЕТА
# ===============================================
def optimize_budgets(df: pd.DataFrame, total_budget: float) -> Dict:
    """Оптимизация распределения бюджета между кампаниями"""
    # Группируем данные по кампаниям
    campaign_groups = df.groupby('Campaign')
    
    # Собираем метрики для каждой кампании
    metrics = {}
    for campaign, group in campaign_groups:
        spend = group['Spend'].sum()
        clicks = group['Clicks'].sum()
        conversions = group['Current Conversions'].sum()
        
        # Расчет ключевых метрик
        cpc = spend / clicks if clicks > 0 else CONFIG['min_cpc']
        conversion_rate = conversions / clicks if clicks > 0 else 0
        
        metrics[campaign] = {
            'current_spend': spend,
            'clicks': clicks,
            'conversions': conversions,
            'cpc': cpc,
            'conversion_rate': conversion_rate,
            'strategy': group['Strategy'].iloc[0],
            'control_param': group['ControlParameter'].iloc[0]
        }
    
    # Расчет ожидаемых конверсий для каждой кампании
    for campaign, m in metrics.items():
        # Здесь должна быть ваша логика расчета ожидаемых конверсий
        # Для примера используем упрощенную формулу
        m['expected_conversions'] = m['conversion_rate'] * (total_budget / m['cpc'])
    
    # ВЫЧИСЛЕНИЕ МЕТРИК БЛАГОСОСТОЯНИЯ (НОВОЕ)
    # Фактические конверсии
    actual_conversions = [m['conversions'] for m in metrics.values()]
    nash_actual, egalitarian_actual = calculate_welfare_metrics(actual_conversions)
    
    # Оптимизированные конверсии
    optimized_conversions = [m['expected_conversions'] for m in metrics.values()]
    nash_optimized, egalitarian_optimized = calculate_welfare_metrics(optimized_conversions)
    
    # Вывод результатов
    print(f"\n=== МЕТРИКИ СПРАВЕДЛИВОСТИ РАСПРЕДЕЛЕНИЯ ===")
    print(f"Nash Welfare (факт → оптимизировано): {nash_actual:.2f} → {nash_optimized:.2f}")
    print(f"Egalitarian Welfare (факт → оптимизировано): {egalitarian_actual:.2f} → {egalitarian_optimized:.2f}")
    
    # Анализ изменений
    if nash_optimized > nash_actual:
        print("✓ Распределение стало более сбалансированным (Nash Welfare улучшился)")
    else:
        print("✗ Распределение стало менее сбалансированным (Nash Welfare ухудшился)")
    
    if egalitarian_optimized > egalitarian_actual:
        print("✓ Гарантированный минимум конверсий улучшился")
    else:
        print("✗ Гарантированный минимум конверсий ухудшился")
    
    return metrics

# ===============================================
# ГЛАВНАЯ ФУНКЦИЯ
# ===============================================
def main():
    """Основная функция выполнения скрипта"""
    try:
        # Загрузка и подготовка данных
        file_path = "ad_campaigns.csv"  # Замените на ваш путь к файлу
        df = load_and_preprocess(file_path)
        
        # Проверка данных
        df = validate_data(df)
        
        # Оптимизация бюджета
        total_budget = 10000  # Пример общего бюджета
        results = optimize_budgets(df, total_budget)
        
        # Дополнительная логика обработки результатов...
        
    except Exception as e:
        print(f"Произошла ошибка: {str(e)}")
        return False
    
    return True

if __name__ == "__main__":
    main()

Произошла ошибка: Ошибка загрузки файла ad_campaigns.csv: [Errno 2] No such file or directory: 'ad_campaigns.csv'
