<a href="https://colab.research.google.com/github/CodeHunterOfficial/ABC_DataMining/blob/main/TimeSeries/TimeSeries-2025/%D0%9F%D0%BB%D0%B0%D0%BD.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Машинное обучение в задачах прогнозирования (временных рядов)



### **Тема 1. Введение в анализ временных рядов и основы**

**Введение в временные ряды:**  
- Определение временного ряда и его типы (регулярные, нерегулярные, одномерные, многомерные).  
- Основные компоненты: тренд, сезонность, цикличность, остаток (шум).

**Описательная статистика временных рядов:**  
- Математическое ожидание, дисперсия и ковариация.  
- Понятие автоковариации и автокорреляции.

**Предварительный анализ данных:**  
- Загрузка и предобработка: обработка пропущенных значений и выбросов.  
- Визуализация временных рядов: линейные графики, сезонные графики, графики автокорреляционной функции (ACF) и частичной автокорреляционной функции (PACF).

**Декомпозиция временных рядов:**  
- Аддитивные и мультипликативные модели декомпозиции.  
- Методы декомпозиции: классическая декомпозиция, STL (Seasonal and Trend decomposition using Loess).



### **Тема 2. Стационарность и стратегии прогнозирования**

**Понятие стационарности временных рядов:**  
- Строгая и слабая стационарность.  
- Важность стационарности для построения моделей временных рядов.

**Тесты на стационарность:**  
- Тест Дики–Фуллера (ADF).  
- Тест KPSS.

**Преобразования для достижения стационарности:**  
- Дифференцирование.  
- Логарифмическое преобразование.  
- Преобразование Бокса–Кокса.  
- Другие методы стабилизации дисперсии и устранения тренда.

**Задача и стратегии прогнозирования:**  
- Постановка задачи прогнозирования.  
- Рекурсивная (итеративная) стратегия.  
- Прямая стратегия.  
- Гибридная стратегия.



### **Тема 3. Модели экспоненциального сглаживания и оценка моделей**

**Модели экспоненциального сглаживания:**  
- Простое экспоненциальное сглаживание.  
- Модель Хольта (учёт тренда).  
- Модель Хольта–Винтерса (учёт тренда и сезонности).  
- Подбор параметров сглаживания, включая методы оптимизации.

**Оценка качества прогнозов:**  
- Основные метрики ошибок: MAE, MSE, RMSE, MAPE, SMAPE.  
- Интервальное прогнозирование: построение доверительных интервалов.

**Схемы кросс-валидации для временных рядов:**  
- Скользящее окно (Rolling Forecast Origin).  
- Корректное разделение выборки с учётом временной зависимости.



### **Тема 4. Модели ARIMA и SARIMA**

**Авторегрессионные модели (AR):**  
- Определение и порядок AR-модели.

**Модели скользящего среднего (MA):**  
- Определение и порядок MA-модели.

**Модели авторегрессии со скользящим средним (ARMA):**  
- Комбинирование AR и MA процессов.

**Модели интегрированного авторегрессионного скользящего среднего (ARIMA):**  
- Понятие интегрирования (дифференцирование).  
- Идентификация порядка модели (p, d, q) с использованием ACF, PACF, AIC, BIC.

**Сезонные модели ARIMA (SARIMA):**  
- Учёт сезонности в рамках ARIMA.  
- Идентификация сезонных параметров (P, D, Q)s.

**Построение и диагностика моделей ARIMA/SARIMA:**  
- Оценка параметров модели.  
- Анализ остатков: проверка на белый шум, нормальность и гомоскедастичность.  
- Дополнительные тесты: структурные сдвиги, причинность по Грейнджеру.



### **Тема 5. Многомерный анализ временных рядов**

**Введение в многомерные временные ряды:**  
- Понятие причинности по Грейнджеру.

**Модели векторной авторегрессии (VAR):**  
- Построение, оценка и интерпретация VAR-моделей.  
- Анализ импульсных откликов (Impulse Response Functions).

**Модели векторной авторегрессии со скользящим средним (VARMA):**  
- Расширение VAR-моделей за счёт компоненты скользящего среднего.

**Модели с экзогенными переменными (ARIMAX, VARX):**  
- Включение внешних факторов в прогнозные модели.

**Коинтеграция (при необходимости):**  
- Понятие коинтеграции и её значение для нестационарных многомерных рядов.  
- Тесты на коинтеграцию: Энгла–Грейнджера, Йохансена.

**Специализированные многомерные модели:**  
- TBATS — для сложных сезонных паттернов.  
- Введение в модели GARCH/ARCH для анализа волатильности (по актуальности для аудитории).


### **Тема 6. Машинное обучение для временных рядов**

**Подготовка данных:**  
- Создание признаков (Feature Engineering): лаговые значения, скользящие средние, признаки тренда и сезонности, календарные признаки, агрегированные показатели, доменные признаки.  
- Отбор признаков (Feature Selection): фильтрационные, обёрточные и встраиваемые методы.

**Линейные регрессионные модели:**  
- Применение линейной регрессии к прогнозированию временных рядов.

**Модели на основе деревьев решений:**  
- Случайный лес (Random Forest).  
- Градиентный бустинг (Gradient Boosting, XGBoost, LightGBM).

**Метод опорных векторов (SVM) для временных рядов:**  
- Регрессия опорных векторов (SVR).

**Особенности применения ML-моделей к временным рядам:**  
- Проблема утечки данных (data leakage).  
- Корректная организация кросс-валидации.  
- Обработка категориальных признаков и временных меток.



### **Тема 7. Глубокое обучение в анализе временных рядов**

**Введение в глубокое обучение:**  
- Преимущества и вызовы использования нейронных сетей для временных рядов.

**Многослойные перцептроны (MLP):**  
- Применение MLP для прогнозирования последовательностей.

**Рекуррентные нейронные сети (RNN):**  
- Базовые RNN.  
- LSTM (долговременная краткосрочная память).  
- GRU (вентильные рекуррентные блоки).

**Свёрточные нейронные сети (CNN):**  
- Использование 1D-CNN для извлечения признаков из временных рядов.  
- Временные свёрточные сети (TCN).

**Архитектуры Seq2Seq:**  
- Применение энкодер-декодерных моделей для прогнозирования.

**Transfer Learning для временных рядов (опционально):**  
- Перенос знаний между схожими задачами прогнозирования.


### **Тема 8. Трансформерные модели для временных рядов**

**Введение в архитектуру Трансформера:**  
- Механизм внимания (Attention Mechanism).  
- Self-Attention.

**Применение Трансформеров в анализе временных рядов:**  
- Преимущества перед RNN и CNN при работе с длинными последовательностями.  
- Примеры архитектур: Informer, Autoformer, FEDformer.  
- Практические аспекты реализации и обучения.



### **Тема 9. Дополнительные темы и практические аспекты (самостоятельное изучение)**

**Модели пространства состояний и фильтр Калмана:**  
- Основы теории и применение для сглаживания и прогнозирования.

**Обнаружение аномалий во временных рядах:**  
- Статистические методы, подходы машинного и глубокого обучения.

**Ансамблевые методы для прогнозирования:**  
- Бэггинг, бустинг, стекинг моделей.

**Интерпретируемость моделей:**  
- Методы SHAP, LIME и другие техники объяснения "чёрных ящиков".

**Автоматизированное машинное обучение (AutoML) для временных рядов:**  
- Обзор инструментов и подходов к автоматическому подбору моделей и гиперпараметров.

**Работа с высокочастотными или нерегулярно дискретизированными данными (опционально):**  
- Особенности предобработки, интерполяции и моделирования.

**Прикладные кейсы:**  
- Разбор реальных примеров из различных областей: финансы, инженерия, медицина, экономика, IoT.  
- Использование открытых наборов данных.

**Инструменты и библиотеки:**  
- Python: `statsmodels`, `pmdarima`, `Prophet`, `sktime`, `tsfresh`, `TensorFlow`, `PyTorch`, `gluonTS`, `Nixtla` и другие.  
- R: `forecast`, `tsibble`, `fable`, `tidymodels`.
