In [None]:
# Random Forest для СКР с данными за 2014-2023
import pandas as pd
import numpy as np
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
from sklearn.preprocessing import StandardScaler
import joblib
import os

# Создаем папку для сохранения результатов
output_dir = 'notebooks/Random Forest'

def standardize_region_names(df):
    """Стандартизация названий регионов"""
    df_clean = df.copy()
    
    # Создаем словарь замен
    replacements = {
        'Ненецкий авт.округ': 'Ненецкий автономный округ',
        'Hенецкий авт.округ': 'Ненецкий автономный округ',
        '  Ненецкий автономный округ': 'Ненецкий автономный округ',
        
        'Ямало-Ненецкий авт.округ': 'Ямало-Ненецкий автономный округ',
        'Ямало-Hенецкий авт.округ': 'Ямало-Ненецкий автономный округ',
        '  Ямало-Ненецкий автономный округ': 'Ямало-Ненецкий автономный округ',
        
        'Ханты-Мансийский авт.округ-Югра': 'Ханты-Мансийский автономный округ - Югра',
        '  Ханты-Мансийский автономный округ - Югра': 'Ханты-Мансийский автономный округ - Югра',
        
        'Республика Татарстан(Татарстан)': 'Республика Татарстан',
        'Чувашская Республика(Чувашия)': 'Чувашская Республика',
        'Республика Северная Осетия- Алания': 'Республика Северная Осетия-Алания',
        
        'Oмская область': 'Омская область',
        'Hижегородская область': 'Нижегородская область',
        
        'г. Севастополь': 'г.Севастополь',
        'г.Москва': 'г.Москва',
        'г.Санкт-Петербург': 'г.Санкт-Петербург',
        
        'Чукотский авт.округ': 'Чукотский автономный округ',
        'Чукотский автономный округ': 'Чукотский автономный округ'
    }
    
    # Применяем замены
    df_clean['Регион'] = df_clean['Регион'].replace(replacements)
    
    return df_clean

class SKRForecaster:
    def __init__(self, n_estimators=100, random_state=42):
        self.model = RandomForestRegressor(
            n_estimators=n_estimators,
            random_state=random_state,
            max_depth=10,
            min_samples_split=5,
            n_jobs=-1
        )
        self.scaler = StandardScaler()
        self.feature_names = []
        self.is_fitted = False
        self.last_known_data = None
        self.first_year = None
        
    def clean_numeric_columns(self, df):
        """
        Очистка числовых колонок
        """
        df = df.copy()
        
        numeric_columns = [col for col in df.columns if col not in ['Регион', 'Год', 'СКР']]
        
        for col in numeric_columns:
            if df[col].dtype == 'object':
                df[col] = (df[col]
                          .astype(str)
                          .str.replace('\xa0', '')
                          .str.replace(' ', '')
                          .str.replace(',', '.')
                          .str.replace('−', '-')
                          .str.replace('–', '-')
                          )
                df[col] = pd.to_numeric(df[col], errors='coerce')
        
        if 'СКР' in df.columns:
            df['СКР'] = pd.to_numeric(df['СКР'], errors='coerce')
        
        return df
        
    def prepare_features(self, df, is_training=True):
        """
        Подготовка признаков с данными за 2014-2023
        """
        df = df.copy().sort_values(['Регион', 'Год'])
        
        # Определяем первый год для расчета тренда
        if self.first_year is None:
            self.first_year = df['Год'].min()
        
        print(f"Исходные данные: {df['Год'].min()}-{df['Год'].max()}, {len(df)} строк")
        
        # Создание лаговых признаков
        if is_training or df['Год'].min() < 2024:
            df['lag1_СКР'] = df.groupby('Регион')['СКР'].shift(1)
            df['lag2_СКР'] = df.groupby('Регион')['СКР'].shift(2)
            df['lag1_Браков'] = df.groupby('Регион')['Браков'].shift(1)
            df['lag1_Разводов'] = df.groupby('Регион')['Разводов'].shift(1)
            df['lag1_Число родившихся'] = df.groupby('Регион')['Число родившихся'].shift(1)
            
            # Скользящие средние с min_periods=1 чтобы сохранить больше данных
            df['СКР_MA2'] = df.groupby('Регион')['СКР'].transform(lambda x: x.rolling(2, min_periods=1).mean())
            df['СКР_MA3'] = df.groupby('Регион')['СКР'].transform(lambda x: x.rolling(3, min_periods=1).mean())
        
        # Создание тренда времени
        df['year_trend'] = df['Год'] - self.first_year
        df['год_от_начала'] = df['Год'] - self.first_year
        
        # Создание производных показателей
        df['Браков_на_1000'] = df['Браков'] / df['Численность населения'] * 1000
        df['Разводов_на_1000'] = df['Разводов'] / df['Численность населения'] * 1000
        df['Родившихся_на_1000'] = df['Число родившихся'] / df['Численность населения'] * 1000
        df['Преступлений_на_1000'] = df['Кол-во преступлений'] / df['Численность населения'] * 1000
        
        # Экономические индексы
        df['Социально_экономический_индекс'] = (
            df['Средняя ЗП'] / df['Величина прожиточного минимума'] - 
            (df['Уровень бедности'] / 100)
        )
        
        # Относительные изменения
        df['изменение_населения'] = df.groupby('Регион')['Численность населения'].pct_change()
        df['изменение_ВРП'] = df.groupby('Регион')['Валовой региональный продукт на душу населения (ОКВЭД 2)'].pct_change()
        
        if is_training:
            print(f"Данные до обработки NaN: {len(df)} строк")
            
            # Заполняем числовые колонки медианами по регионам
            numeric_cols = df.select_dtypes(include=[np.number]).columns
            for col in numeric_cols:
                if col not in ['Год']:  # не заполняем год
                    # Заполняем медианами по регионам
                    df[col] = df.groupby('Регион')[col].transform(
                        lambda x: x.fillna(x.median()) if not x.isnull().all() else x
                    )
            
            # Если все еще есть NaN, заполняем общими медианами
            df = df.fillna(df.median(numeric_only=True))
            
            print(f"Данные после обработки NaN: {len(df)} строк")
            print(f"Годы после обработки: {df['Год'].min()}-{df['Год'].max()}")
        
        return df
    
    def train_test_split_temporal(self, df, test_years=[2021, 2022, 2023]):
        """
        Разделение на train/test по времени
        """
        train_mask = ~df['Год'].isin(test_years)
        test_mask = df['Год'].isin(test_years)
        
        X_train = df[train_mask][self.feature_names]
        X_test = df[test_mask][self.feature_names]
        y_train = df[train_mask]['СКР']
        y_test = df[test_mask]['СКР']
        
        return X_train, X_test, y_train, y_test, train_mask, test_mask
    
    def fit(self, df):
        """
        Обучение модели на расширенных данных
        """
        # Очистка и подготовка данных
        df_clean = self.clean_numeric_columns(df)
        df_processed = self.prepare_features(df_clean, is_training=True)
        
        print(f"Данные за период: {df_processed['Год'].min()}-{df_processed['Год'].max()}")
        
        # Сохраняем последние известные данные для прогноза
        self.last_known_data = df_processed[df_processed['Год'] == 2023].copy()
        
        # Определение признаков
        self.feature_names = [
            # Демографические
            'Численность населения', 
            'Число родившихся',
            'Браков', 
            'Разводов',
            
            # Социально-экономические
            'Кол-во преступлений', 
            'Уровень безработицы', 
            'Уровень бедности', 
            'Величина прожиточного минимума',
            'Валовой региональный продукт на душу населения (ОКВЭД 2)',
            'Средняя ЗП',
            
            # Лаговые признаки
            'lag1_СКР', 
            'lag2_СКР',
            'lag1_Браков', 
            'lag1_Разводов',
            'lag1_Число родившихся',
            
            # Скользящие средние
            'СКР_MA2',
            'СКР_MA3',
            
            # Тренд и время
            'year_trend',
            'год_от_начала',
            
            # Производные показатели
            'Браков_на_1000', 
            'Разводов_на_1000',
            'Родившихся_на_1000',
            'Преступлений_на_1000',
            'Социально_экономический_индекс',
            'изменение_населения',
            'изменение_ВРП'
        ]
        
        # Убираем признаки, которых нет в данных
        available_features = [f for f in self.feature_names if f in df_processed.columns]
        self.feature_names = available_features
        
        print(f"Используется {len(self.feature_names)} признаков")
        
        # Разделение на train/test
        X_train, X_test, y_train, y_test, train_mask, test_mask = self.train_test_split_temporal(df_processed)
        
        print(f"Размер train: {X_train.shape}, test: {X_test.shape}")
        print(f"Период обучения: {df_processed[train_mask]['Год'].min()}-{df_processed[train_mask]['Год'].max()}")
        print(f"Период тестирования: {df_processed[test_mask]['Год'].min()}-{df_processed[test_mask]['Год'].max()}")
        
        # Масштабирование признаков
        scale_features = [f for f in self.feature_names if not f.startswith(('lag', 'СКР_MA', 'изменение_'))]
        X_train_scaled = X_train.copy()
        X_test_scaled = X_test.copy()
        
        X_train_scaled[scale_features] = self.scaler.fit_transform(X_train[scale_features])
        X_test_scaled[scale_features] = self.scaler.transform(X_test[scale_features])
        
        # Обучение модели
        print("Обучение модели на расширенных данных...")
        self.model.fit(X_train_scaled, y_train)
        self.is_fitted = True
        
        # Предсказание на тесте
        y_pred = self.model.predict(X_test_scaled)
        
        # Метрики качества
        self.calculate_metrics(y_test, y_pred)
        
        # Дополнительная валидация
        self.cross_validation(X_train_scaled, y_train)
        
        # Сохранение результатов
        self.results = {
            'X_train': X_train_scaled, 'X_test': X_test_scaled,
            'y_train': y_train, 'y_test': y_test, 'y_pred': y_pred,
            'df_processed': df_processed
        }
        
        return self
    
    def calculate_metrics(self, y_true, y_pred):
        """
        Расчет метрик качества
        """
        mse = mean_squared_error(y_true, y_pred)
        mae = mean_absolute_error(y_true, y_pred)
        rmse = np.sqrt(mse)
        r2 = r2_score(y_true, y_pred)
        
        print("\n" + "="*50)
        print("МЕТРИКИ КАЧЕСТВА Random Forest ДЛЯ СКР (2014-2023)")
        print("="*50)
        print(f"RMSE: {rmse:.4f}")
        print(f"MAE: {mae:.4f}")
        print(f"R²: {r2:.4f}")
        print(f"Средний СКР в тесте: {y_true.mean():.4f}")
        print(f"Относительная ошибка: {rmse/y_true.mean()*100:.2f}%")
        
        # Дополнительные метрики
        mape = np.mean(np.abs((y_true - y_pred) / y_true)) * 100
        max_error = np.max(np.abs(y_true - y_pred))
        print(f"MAPE: {mape:.2f}%")
        print(f"Максимальная ошибка: {max_error:.4f}")
        
        self.metrics = {'RMSE': rmse, 'MAE': mae, 'R2': r2, 'MAPE': mape, 'MaxError': max_error}
    
    def cross_validation(self, X_train, y_train, cv=5):
        """
        Кросс-валидация для оценки устойчивости модели
        """
        print("\nКросс-валидация (RMSE):")
        scores = cross_val_score(self.model, X_train, y_train, 
                               scoring='neg_mean_squared_error', cv=cv)
        rmse_scores = np.sqrt(-scores)
        print(f"Среднее: {rmse_scores.mean():.4f} (+/- {rmse_scores.std() * 2:.4f})")
    
    def save_model(self, filepath=None):
        """
        Сохранение обученной модели и всех компонентов
        """
        if not self.is_fitted:
            print("Модель не обучена!")
            return False
        
        if filepath is None:
            filepath = os.path.join(output_dir, 'skr_random_forest_model.pkl')
        
        model_data = {
            'model': self.model,
            'scaler': self.scaler,
            'feature_names': self.feature_names,
            'first_year': self.first_year,
            'last_known_data': self.last_known_data,
            'metrics': self.metrics
        }
        
        joblib.dump(model_data, filepath)
        print(f"✓ Модель сохранена в {filepath}")
        return True
    
    def load_model(self, filepath=None):
        """
        Загрузка обученной модели
        """
        if filepath is None:
            filepath = os.path.join(output_dir, 'skr_random_forest_model.pkl')
            
        if not os.path.exists(filepath):
            print(f"Файл модели {filepath} не найден!")
            return False
        
        model_data = joblib.load(filepath)
        self.model = model_data['model']
        self.scaler = model_data['scaler']
        self.feature_names = model_data['feature_names']
        self.first_year = model_data['first_year']
        self.last_known_data = model_data['last_known_data']
        self.metrics = model_data['metrics']
        self.is_fitted = True
        
        print(f"✓ Модель загружена из {filepath}")
        return True

    def prepare_final_output(self, predictions_df, target_year=2024):
        """
        Подготовка финального файла для GitHub пайплайна
        """
        # Создаем DataFrame с требуемыми полями
        final_output = pd.DataFrame({
            'Регион': predictions_df['Регион'],
            'Год': predictions_df['Год'],
            'СКР': predictions_df['СКР_предыдущий'],  # Фактическое значение за предыдущий год
            'predictions': predictions_df['СКР_прогноз']  # Прогноз на target_year
        })
        
        return final_output

    def predict_future(self, df, future_years=[2024, 2025]):  # ИЗМЕНЕНО: добавлен 2025 год
        """
        Прогноз на будущие периоды
        """
        if not self.is_fitted:
            print("Сначала обучите модель!")
            return None
        
        if self.last_known_data is None:
            print("Нет данных для прогноза!")
            return None
        
        print(f"\nСоздание прогноза СКР на {future_years} год...")
        
        all_predictions = []
        
        # Создаем копию последних известных данных для модификации
        current_data = self.last_known_data.copy()
        
        for year_idx, year in enumerate(future_years):
            print(f"Прогноз на {year} год...")
            year_predictions = []
            
            # Для каждого региона создаем прогноз
            for i, (_, last_row) in enumerate(current_data.iterrows()):
                # Создаем строку для прогноза
                future_row = last_row.copy()
                future_row['Год'] = year
                future_row['year_trend'] = year - self.first_year
                future_row['год_от_начала'] = year - self.first_year
                
                # Прогноз значений признаков
                # Для первого года (2024) используем фактические данные 2023
                # Для второго года (2025) используем прогнозные данные 2024
                
                # Коэффициенты роста для 2024 и 2025 годов
                if year_idx == 0:  # 2024 год
                    # Используем фактические данные 2023 года
                    population_factor = 1.003
                    births_factor = 0.995
                    marriages_factor = 1.01
                    divorces_factor = 1.005
                    grp_factor = 1.02
                    salary_factor = 1.04
                    living_wage_factor = 1.03
                    poverty_factor = 0.98
                else:  # 2025 год - более консервативные коэффициенты
                    # Используем прогнозные данные 2024 года
                    population_factor = 1.002
                    births_factor = 1.008  # Небольшой рост рождаемости
                    marriages_factor = 1.008
                    divorces_factor = 1.003
                    grp_factor = 1.018
                    salary_factor = 1.035
                    living_wage_factor = 1.028
                    poverty_factor = 0.985
                
                # Применяем коэффициенты
                future_row['Численность населения'] = last_row['Численность населения'] * population_factor
                future_row['Число родившихся'] = last_row['Число родившихся'] * births_factor
                future_row['Браков'] = last_row['Браков'] * marriages_factor
                future_row['Разводов'] = last_row['Разводов'] * divorces_factor
                future_row['Валовой региональный продукт на душу населения (ОКВЭД 2)'] = last_row['Валовой региональный продукт на душу населения (ОКВЭД 2)'] * grp_factor
                future_row['Средняя ЗП'] = last_row['Средняя ЗП'] * salary_factor
                future_row['Величина прожиточного минимума'] = last_row['Величина прожиточного минимума'] * living_wage_factor
                future_row['Уровень бедности'] = last_row['Уровень бедности'] * poverty_factor
                
                # Лаги берем из предыдущего года
                if year_idx == 0:  # 2024 год - используем фактические данные
                    future_row['lag1_СКР'] = last_row['СКР']
                    future_row['lag2_СКР'] = last_row.get('lag1_СКР', last_row['СКР'])
                else:  # 2025 год - используем прогнозные данные 2024 года
                    # Находим прогноз СКР за 2024 год для этого региона
                    prev_prediction = None
                    for pred in all_predictions[-len(current_data):]:
                        if pred['Регион'] == last_row['Регион'] and pred['Год'] == future_years[0]:
                            prev_prediction = pred
                            break
                    
                    if prev_prediction:
                        future_row['lag1_СКР'] = prev_prediction['СКР_прогноз']
                        future_row['lag2_СКР'] = last_row['СКР']
                    else:
                        future_row['lag1_СКР'] = last_row['СКР']
                        future_row['lag2_СКР'] = last_row.get('lag1_СКР', last_row['СКР'])
                
                future_row['lag1_Браков'] = future_row['Браков']
                future_row['lag1_Разводов'] = future_row['Разводов']
                future_row['lag1_Число родившихся'] = future_row['Число родившихся']
                
                # Пересчитываем скользящие средние
                future_row['СКР_MA2'] = (future_row['lag1_СКР'] + future_row['lag2_СКР']) / 2
                future_row['СКР_MA3'] = (future_row['lag2_СКР'] + 
                                        last_row.get('lag2_СКР', future_row['lag2_СКР']) + 
                                        future_row['lag1_СКР']) / 3
                
                # Пересчитываем производные показатели
                future_row['Браков_на_1000'] = future_row['Браков'] / future_row['Численность населения'] * 1000
                future_row['Разводов_на_1000'] = future_row['Разводов'] / future_row['Численность населения'] * 1000
                future_row['Родившихся_на_1000'] = future_row['Число родившихся'] / future_row['Численность населения'] * 1000
                future_row['Преступлений_на_1000'] = future_row['Кол-во преступлений'] / future_row['Численность населения'] * 1000
                future_row['Социально_экономический_индекс'] = (
                    future_row['Средняя ЗП'] / future_row['Величина прожиточного минимума'] - 
                    (future_row['Уровень бедности'] / 100)
                )
                future_row['изменение_населения'] = (future_row['Численность населения'] - last_row['Численность населения']) / last_row['Численность населения']
                future_row['изменение_ВРП'] = (future_row['Валовой региональный продукт на душу населения (ОКВЭД 2)'] - last_row['Валовой региональный продукт на душу населения (ОКВЭД 2)']) / last_row['Валовой региональный продукт на душу населения (ОКВЭД 2)']
                
                year_predictions.append(future_row)
            
            # Прогноз на конкретный год
            future_df = pd.DataFrame(year_predictions)
            X_future = future_df[self.feature_names]
            
            # Масштабирование
            scale_features = [f for f in self.feature_names if not f.startswith(('lag', 'СКР_MA', 'изменение_'))]
            X_future_scaled = X_future.copy()
            X_future_scaled[scale_features] = self.scaler.transform(X_future[scale_features])
            
            # Прогноз
            predictions = self.model.predict(X_future_scaled)
            
            # Сохраняем результаты
            for i, (_, last_row) in enumerate(current_data.iterrows()):
                # Определяем предыдущее значение СКР
                if year_idx == 0:  # 2024 год
                    prev_skr = last_row['СКР']
                else:  # 2025 год - используем прогноз 2024 года
                    # Находим прогноз СКР за 2024 год для этого региона
                    prev_skr_prediction = None
                    for pred in all_predictions[-len(current_data):]:
                        if pred['Регион'] == last_row['Регион'] and pred['Год'] == future_years[0]:
                            prev_skr_prediction = pred['СКР_прогноз']
                            break
                    prev_skr = prev_skr_prediction if prev_skr_prediction else last_row['СКР']
                
                all_predictions.append({
                    'Регион': last_row['Регион'],
                    'Год': year,
                    'СКР_прогноз': predictions[i],
                    'СКР_предыдущий': prev_skr,
                    'Изменение_СКР': predictions[i] - prev_skr
                })
            
            # Обновляем текущие данные для следующей итерации (2025 года)
            future_df['СКР'] = predictions
            current_data = future_df.copy()
        
        results_df = pd.DataFrame(all_predictions)
        print("Прогноз успешно создан")
        return results_df

if __name__ == "__main__":
    # Загрузка данных
    df = pd.read_excel('Финальный вариант/общая_СКР (2).xlsx')
    
    # Стандартизация названий регионов
    print("Стандартизация названий регионов...")
    df = standardize_region_names(df)
    print(f"Уникальных регионов после очистки: {df['Регион'].nunique()}")
    
    print("="*70)
    print("МОДЕЛЬ СЛУЧАЙНОГО ЛЕСА ДЛЯ ПРОГНОЗА СКР (2014-2023)")
    print("="*70)
    
    # Диагностика данных
    print(f"Размер данных: {df.shape}")
    print(f"Период данных: {df['Год'].min()}-{df['Год'].max()}")
    print(f"Количество регионов: {df['Регион'].nunique()}")
    
    # Обучение модели
    forecaster = SKRForecaster(n_estimators=200)
    forecaster.fit(df)
    
    # Сохранение модели
    forecaster.save_model()
    
    # Прогноз на 2024 и 2025 годы (ИЗМЕНЕНО: добавлен 2025 год)
    future_predictions = forecaster.predict_future(df, [2024, 2025])
    
    if future_predictions is not None:
        # Разделяем прогнозы по годам
        predictions_2024 = future_predictions[future_predictions['Год'] == 2024]
        predictions_2025 = future_predictions[future_predictions['Год'] == 2025]
        
        # Подготовка финального вывода для GitHub пайплайна для 2024 года
        final_output_2024 = forecaster.prepare_final_output(predictions_2024, 2024)
        
        # Подготовка финального вывода для GitHub пайплайна для 2025 года
        final_output_2025 = forecaster.prepare_final_output(predictions_2025, 2025)
        
        # Сохранение в формате для пайплайна для 2024 года
        predictions_filepath_2024 = os.path.join(output_dir, 'predictions_afr.xlsx')
        final_output_2024.to_excel(predictions_filepath_2024, index=False)
        print(f"✓ Финальный файл для пайплайна (2024) сохранен как '{predictions_filepath_2024}'")
        
        # Сохранение в формате для пайплайна для 2025 года
        predictions_filepath_2025 = os.path.join(output_dir, 'predictions_afr_2025.xlsx')
        final_output_2025.to_excel(predictions_filepath_2025, index=False)
        print(f"✓ Финальный файл для пайплайна (2025) сохранен как '{predictions_filepath_2025}'")
        
        # Вывод статистики
        print(f"\nСТАТИСТИКА ПРОГНОЗА:")
        
        # Для 2024 года
        print(f"\n2024 год:")
        print(f"  Средний СКР: {predictions_2024['СКР_прогноз'].mean():.3f}")
        print(f"  Средний СКР (факт 2023): {predictions_2024['СКР_предыдущий'].mean():.3f}")
        print(f"  Среднее изменение: {predictions_2024['Изменение_СКР'].mean():.4f}")
        print(f"  Регионов с ростом СКР: {(predictions_2024['Изменение_СКР'] > 0).sum()}")
        print(f"  Регионов со снижением СКР: {(predictions_2024['Изменение_СКР'] < 0).sum()}")
        
        # Для 2025 года
        print(f"\n2025 год:")
        print(f"  Средний СКР: {predictions_2025['СКР_прогноз'].mean():.3f}")
        print(f"  Средний СКР (прогноз 2024): {predictions_2025['СКР_предыдущий'].mean():.3f}")
        print(f"  Среднее изменение: {predictions_2025['Изменение_СКР'].mean():.4f}")
        print(f"  Регионов с ростом СКР: {(predictions_2025['Изменение_СКР'] > 0).sum()}")
        print(f"  Регионов со снижением СКР: {(predictions_2025['Изменение_СКР'] < 0).sum()}")
        
        # Пример первых строк финальных файлов
        print(f"\nПервые 5 строк финального файла для 2024:")
        print(final_output_2024.head())
        
        print(f"\nПервые 5 строк финального файла для 2025:")
        print(final_output_2025.head())
        
        # Дополнительно: сохранение полных результатов для анализа
        full_results_filepath = os.path.join(output_dir, 'full_skr_predictions_results.csv')
        future_predictions.to_csv(full_results_filepath, index=False)
        print(f"✓ Полные результаты сохранены в '{full_results_filepath}'")
        
        # Сводная статистика по годам
        print("\n" + "="*70)
        print("СВОДНАЯ СТАТИСТИКА ПО ГОДАМ:")
        print("="*70)
        
        summary_stats = future_predictions.groupby('Год').agg({
            'СКР_прогноз': ['mean', 'min', 'max', 'std'],
            'Изменение_СКР': ['mean', 'min', 'max']
        }).round(4)
        
        print(summary_stats)
        
        print("\n" + "="*70)
        print("ПРОГНОЗ НА 2024 И 2025 ГОДЫ УСПЕШНО СОЗДАН!")
        print(f"Основной файл для сервера: {predictions_filepath_2024}")
        print(f"Дополнительный файл (2025): {predictions_filepath_2025}")
        print("="*70)