In [14]:
# ==============================================================================
# 1. ИМПОРТ БИБЛИОТЕК И ЗАГРУЗКА ДАННЫХ
# ==============================================================================
import pandas as pd
import numpy as np

# Загружаем исходные данные
try:
    prolongations = pd.read_csv('prolongations.csv')
    financial_data = pd.read_csv('financial_data.csv')
    print("Файлы успешно загружены.")
except FileNotFoundError:
    raise ValueError("Файлы 'prolongations.csv' или 'financial_data.csv' не найдены в текущем каталоге.") 

# ==============================================================================
# 2. ФУНКЦИИ-ПОМОЩНИКИ ДЛЯ ОЧИСТКИ ДАННЫХ
# ==============================================================================

# Словарь для стандартизации названий месяцев
MONTH_MAP = {
    'январь': 1, 'февраль': 2, 'март': 3, 'апрель': 4, 'май': 5, 'июнь': 6,
    'июль': 7, 'август': 8, 'сентябрь': 9, 'октябрь': 10, 'ноябрь': 11, 'декабрь': 12
}

def standardize_month_format(month_str):
    """Преобразует строку 'месяц год' в формат 'Год-Месяц' (напр., '2023-01')."""
    if not isinstance(month_str, str):
        return None
    parts = month_str.lower().split()
    if len(parts) != 2:
        return None
    month_name, year = parts
    month_num = MONTH_MAP.get(month_name)
    if month_num and year.isdigit():
        return f"{year}-{month_num:02d}"
    return None

def clean_shipment_value(value):
    """Преобразует строковое значение отгрузки в число с плавающей точкой."""
    if pd.isna(value):
        return 0.0
    if isinstance(value, (int, float)):
        return float(value)
    
    # Обрабатываем строковые значения, сначала проверяя флаги
    value_str = str(value).strip().lower()
    if value_str in ['стоп', 'end']:
        return -1.0 # Используем -1 как флаг для проектов, которые нужно исключить
    if value_str == 'в ноль':
        return 0.0 # 'в ноль' означает нулевую отгрузку в этом месяце
    
    # Очищаем числовые строки от пробелов и заменяем запятую на точку
    try:
        cleaned_str = value_str.replace('\xa0', '').replace(' ', '').replace(',', '.')
        return float(cleaned_str)
    except (ValueError, TypeError):
        return 0.0
    
def standardize_manager_name(name):
    """Приводит ФИО к формату 'Фамилия Имя' для корректного мэтчинга."""
    if not isinstance(name, str): return None
    parts = name.strip().split()
    if len(parts) >= 2:
        return f"{parts[0]} {parts[1]}"
    return name

Файлы успешно загружены.


In [None]:
# ==============================================================================
# 3. ПРЕДОБРАБОТКА И ОЧИСТКА ДАННЫХ
# ==============================================================================
print("Начало предобработки данных...")

# --- Шаг 3.1: Стандартизация имен менеджеров ---
prolongations['AM_std'] = prolongations['AM'].apply(standardize_manager_name)
financial_data['Account_std'] = financial_data['Account'].apply(standardize_manager_name)
# Создаем справочник полных имен для финального отчета
full_name_map = financial_data.drop_duplicates('Account_std').set_index('Account_std')['Account'].to_dict()


# --- Шаг 3.2: Стандартизация месяцев ---
prolongations['month_std'] = prolongations['month'].apply(standardize_month_format)
original_month_cols = [col for col in financial_data.columns if any(m in col.lower() for m in MONTH_MAP)]
standardized_month_cols = [standardize_month_format(col) for col in original_month_cols]
rename_dict = dict(zip(original_month_cols, standardized_month_cols))
financial_data.rename(columns=rename_dict, inplace=True)
actual_month_cols = [col for col in standardized_month_cols if col is not None and col in financial_data.columns]


# --- Шаг 3.3: Очистка финансовой таблицы ---
for col in actual_month_cols:
    financial_data[col] = financial_data[col].apply(clean_shipment_value)

stop_ids = set(financial_data[financial_data[actual_month_cols].eq(-1.0).any(axis=1)]['id'])
prolongations_filtered = prolongations[~prolongations['id'].isin(stop_ids)].copy()


# --- Шаг 3.4: Агрегация фин. данных и подготовка флагов 'в ноль' ---
fin_data_long = financial_data.melt(
    id_vars=['id', 'Account_std'],
    value_vars=actual_month_cols,
    var_name='shipment_month',
    value_name='shipment'
)
fin_data_agg = fin_data_long.groupby(['id', 'shipment_month', 'Account_std'])['shipment'].sum().reset_index()

# Заново читаем файл, чтобы найти флаги 'в ноль' в их первозданном виде
financial_data_raw = pd.read_csv('financial_data.csv').rename(columns=rename_dict)
v_nol_flags = set()
for col in actual_month_cols:
    ids_with_flag = financial_data_raw[financial_data_raw[col].astype(str).str.lower().str.strip() == 'в ноль']['id']
    for pid in ids_with_flag:
        v_nol_flags.add((pid, col))
print(v_nol_flags)

# --- Шаг 3.5: Объединение данных ---
# Используем Account_std из fin_data_agg как более полный источник имен
df_main = pd.merge(prolongations_filtered, fin_data_agg, on='id', how='left')

# Заполняем пропуски в Account_std, если проект есть в prolongations, но не в financial_data
df_main.fillna({'Account_std': df_main['AM_std']}, inplace=True)
print("Предобработка данных завершена.")


Начало предобработки данных...
Предобработка данных завершена.


In [None]:
# ==============================================================================
# 4. РАСЧЕТ КОЭФФИЦИЕНТОВ
# ==============================================================================
print("Вычисление коэффициентов...")

results = []
# Берем менеджеров из объединенной таблицы, чтобы учесть всех
managers = df_main['Account_std'].dropna().unique().tolist() + ['Overall']
calculation_months = sorted([m for m in actual_month_cols if '2023' in m])

def get_base_shipment(project_id, last_month_std, df_agg, v_nol_lookup):
    """Получает базовую отгрузку с учетом правила 'в ноль'."""
    shipment_series = df_agg[(df_agg['id'] == project_id) & (df_agg['shipment_month'] == last_month_std)]['shipment']
    shipment = shipment_series.sum()
    
    if shipment == 0 and (project_id, last_month_std) in v_nol_lookup:
        last_month_dt = pd.to_datetime(last_month_std + '-01')
        prev_month_std = (last_month_dt - pd.DateOffset(months=1)).strftime('%Y-%m')
        return df_agg[(df_agg['id'] == project_id) & (df_agg['shipment_month'] == prev_month_std)]['shipment'].sum()
    return shipment

for month in calculation_months:
    current_month_dt = pd.to_datetime(month + '-01')
    prev_month_std = (current_month_dt - pd.DateOffset(months=1)).strftime('%Y-%m')
    two_months_ago_std = (current_month_dt - pd.DateOffset(months=2)).strftime('%Y-%m')

    for manager_std in managers:
        manager_filter = (df_main['Account_std'] == manager_std) if manager_std != 'Overall' else pd.Series([True] * len(df_main))
        
        # --- K1 ---
        ended_prev_month_ids = df_main[manager_filter & (df_main['month_std'] == prev_month_std)]['id'].unique()
        k1_denominator = sum(get_base_shipment(pid, prev_month_std, fin_data_agg, v_nol_flags) for pid in ended_prev_month_ids)
        k1_numerator = fin_data_agg[fin_data_agg['id'].isin(ended_prev_month_ids) & (fin_data_agg['shipment_month'] == month)]['shipment'].sum()

        # --- K2 ---
        ended_2_months_ago_ids = df_main[manager_filter & (df_main['month_std'] == two_months_ago_std)]['id'].unique()
        renewed_in_prev_month_ids = fin_data_agg[(fin_data_agg['id'].isin(ended_2_months_ago_ids)) & (fin_data_agg['shipment_month'] == prev_month_std) & (fin_data_agg['shipment'] > 0)]['id'].unique()
        ids_for_k2 = np.setdiff1d(ended_2_months_ago_ids, renewed_in_prev_month_ids)
        
        k2_denominator = sum(get_base_shipment(pid, two_months_ago_std, fin_data_agg, v_nol_flags) for pid in ids_for_k2)
        k2_numerator = fin_data_agg[fin_data_agg['id'].isin(ids_for_k2) & (fin_data_agg['shipment_month'] == month)]['shipment'].sum()

        results.append({
            'month': month, 'manager_std': manager_std,
            'k1_numerator': k1_numerator, 'k1_denominator': k1_denominator,
            'k2_numerator': k2_numerator, 'k2_denominator': k2_denominator,
            'k1': k1_numerator / k1_denominator if k1_denominator > 0 else 0,
            'k2': k2_numerator / k2_denominator if k2_denominator > 0 else 0
        })

monthly_results_df = pd.DataFrame(results)
print("Расчеты завершены.")

Вычисление коэффициентов...
Расчеты завершены.


In [17]:
# ==============================================================================
# 5. ФОРМИРОВАНИЕ EXCEL-ОТЧЕТА
# ==============================================================================
print("Формирование Excel-отчета...")

# Возвращаем полные имена менеджеров для отчета
monthly_results_df['manager'] = monthly_results_df['manager_std'].map(full_name_map).fillna(monthly_results_df['manager_std'])
# Для 'Overall' оставляем 'Overall'
monthly_results_df.loc[monthly_results_df['manager_std'] == 'Overall', 'manager'] = 'ИТОГО по отделу'


annual_results_df = monthly_results_df.groupby('manager').agg({
    'k1_numerator': 'sum', 'k1_denominator': 'sum',
    'k2_numerator': 'sum', 'k2_denominator': 'sum'
}).reset_index()

annual_results_df['k1_annual'] = annual_results_df['k1_numerator'] / annual_results_df['k1_denominator']
annual_results_df['k2_annual'] = annual_results_df['k2_numerator'] / annual_results_df['k2_denominator']

monthly_pivot_k1 = monthly_results_df.pivot_table(index='manager', columns='month', values='k1', fill_value=0)
monthly_pivot_k2 = monthly_results_df.pivot_table(index='manager', columns='month', values='k2', fill_value=0)

with pd.ExcelWriter('prolongation_report.xlsx', engine='xlsxwriter') as writer:
    annual_results_df[['manager', 'k1_annual', 'k2_annual', 'k1_denominator', 'k2_denominator']].to_excel(writer, sheet_name='Годовые итоги', index=False)
    monthly_pivot_k1.to_excel(writer, sheet_name='K1 по месяцам')
    monthly_pivot_k2.to_excel(writer, sheet_name='K2 по месяцам')
    monthly_results_df.to_excel(writer, sheet_name='Детальные данные', index=False)
    
    workbook = writer.book
    percent_format = workbook.add_format({'num_format': '0.0%'})
    money_format = workbook.add_format({'num_format': '#,##0'})
    
    ws_annual = writer.sheets['Годовые итоги']
    ws_annual.set_column('A:A', 35); ws_annual.set_column('B:C', 15, percent_format); ws_annual.set_column('D:E', 22, money_format)
    
    for sheet_name in ['K1 по месяцам', 'K2 по месяцам']:
        ws_monthly = writer.sheets[sheet_name]
        ws_monthly.set_column('A:A', 35); ws_monthly.set_column('B:M', 12, percent_format)
        ws_monthly.conditional_format('B2:M20', {'type': '3_color_scale'}) # Диапазон можно поправить

print("Готово! Отчет 'prolongation_report.xlsx' сохранен.")

Формирование Excel-отчета...
Готово! Отчет 'prolongation_report.xlsx' сохранен.
