<a href="https://colab.research.google.com/github/CodeHunterOfficial/ABC_DataMining/blob/main/TimeSeries/TimeSeries-2025/New/%D0%9F%D1%80%D0%B0%D0%BA%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B0%D1%8F_%D1%80%D0%B0%D0%B1%D0%BE%D1%82%D0%B0_%E2%84%96%E2%80%AF5.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# **Практическая работа № 5**  
## **Глубокое обучение для табличных данных и временных рядов**

---

### **1. Цель и задачи работы**

**Цель работы** — формирование у обучающегося системного представления о методологии сравнительного анализа моделей глубокого обучения, применяемых к задачам машинного обучения на структурированных данных, включая как стандартные табличные задачи (регрессия, классификация), так и специфические сценарии временных рядов. Работа направлена на освоение практических навыков проектирования, настройки, диагностики и интерпретации глубоких архитектур при условии соблюдения строгих требований к предобработке, корректному разделению данных, отсутствию утечки будущего и воспроизводимости результатов в соответствии с передовыми научно-методическими стандартами.

**Основные задачи работы:**  
1. Использовать два типа данных:  
   – **Табличный датасет из Практической работы № 1**, содержащий не менее 720 последовательных наблюдений, с подтверждённой стационарностью, стабилизированной дисперсией и богатым набором инженерных признаков (лаги, скользящие окна, циклические кодировки), преобразованный в регрессионную задачу;  
   – **Дополнительный табличный датасет без временной структуры**, содержащий смешанные типы признаков (например, California Housing для регрессии или Adult Income для классификации).  
2. Формализовать задачу машинного обучения с учётом природы данных: для временных рядов — как задачу прогнозирования с соблюдением временного порядка; для табличных данных — как стандартную задачу регрессии или классификации.  
3. Определить архитектуры и пространства гиперпараметров для всех моделей и провести их обучение с использованием корректной валидации: `TimeSeriesSplit` для временных рядов, стратифицированное разбиение — для табличных данных.  
4. Реализовать и сравнить следующие архитектуры глубокого обучения:  
   – **MLP (многослойный перцептрон)** — базовая архитектура для табличных данных;  
   – **1D-CNN** — применённая к последовательности лагов (для временных рядов) или к эмбеддингам категориальных признаков (для табличных данных);  
   – **RNN-семейство**: Vanilla RNN, LSTM, GRU — только для задач с временной структурой;  
   – **Двунаправленные модели**: BiLSTM, BiGRU — для offline-анализа временных рядов;  
   – **Encoder–Decoder** — для многопшагового прогнозирования временных рядов;  
   – **Гибридные архитектуры**:  
     • **Tabular + Temporal**: MLP для статических признаков + LSTM для временных;  
     • **CNN + RNN**: извлечение локальных паттернов → моделирование динамики;  
     • **Residual MLP/LSTM**: с skip-соединениями для стабилизации градиентов.  
5. Обеспечить корректную предобработку: масштабирование числовых признаков, кодирование категориальных (эмбеддинги или one-hot), формирование окон без утечки будущего.  
6. Оценить качество прогнозов/классификации по метрикам:  
   – Для регрессии: MAE, RMSE, MASE, R²;  
   – Для классификации: Accuracy, F1, AUC-ROC — **на независимой тестовой выборке, не участвовавшей в настройке**.  
7. Провести углублённую диагностику обучения:  
   – Графики train/val loss и метрик;  
   – Анализ переобучения (разрыв между train и val);  
   – Мониторинг градиентов и норм весов (особенно для RNN).  
8. Проанализировать интерпретируемость моделей:  
   – Для MLP/CNN: Saliency Maps, Integrated Gradients;  
   – Для RNN/LSTM/GRU: анализ скрытых состояний и вентилей;  
   – Для гибридных моделей: вклад временных и статических признаков.  
9. Сравнить все глубокие модели между собой и с **лучшими классическими моделями** из Практической работы № 3 (LightGBM, XGBoost, Ridge и др.).  
10. Оценить вычислительную сложность: время обучения, прогнозирования и потребление памяти.  
11. Разработать модульный фреймворк на PyTorch или TensorFlow с единым интерфейсом для всех архитектур и типов данных.  
12. Обеспечить воспроизводимость и открытость результатов: опубликовать код, сравнительные таблицы, веса моделей и аналитический отчёт.

---

### **2. Теоретические предпосылки**

На протяжении десятилетий табличные данные оставались доменом классических алгоритмов — деревьев решений, ансамблей и линейных моделей. Глубокое обучение долгое время считалось неэффективным в этой области из-за отсутствия пространственной или последовательной структуры, на которой строятся CNN/RNN, высокого риска переобучения при малом объёме данных и сложности работы с разнородными типами признаков.

Однако последние годы показали, что при правильной архитектуре, регуляризации и инициализации **глубокие модели могут конкурировать, а иногда и превосходить градиентный бустинг**, особенно в задачах с длинными последовательностями, сложными нелинейными взаимодействиями признаков или мультимодальными структурами.

**MLP**, несмотря на простоту, остаётся сильной базовой линией для табличных данных. С добавлением dropout, batch normalization и Xavier-инициализации он демонстрирует удивительную устойчивость.

**1D-CNN** находят применение двумя способами: как свёртки по временной оси для извлечения локальных паттернов в лагах и как свёртки по эмбеддингам категориальных признаков, выстроенных в искусственную «последовательность».

**Рекуррентные сети (LSTM, GRU)** применимы исключительно в контексте временной или упорядоченной структуры данных. Их способность моделировать долгосрочные зависимости делает их незаменимыми в задачах прогнозирования, но бесполезными в чисто табличных задачах без порядка.

**Encoder–Decoder** архитектура — естественное решение для многопшагового прогнозирования, где требуется сгенерировать последовательность выходов. В отличие от рекурсивной стратегии, она обучается end-to-end и избегает накопления ошибки.

**Гибридные модели** открывают путь к объединению статического и динамического контекста: например, прогнозирование спроса с учётом как исторических продаж (LSTM), так и характеристик товара и магазина (MLP).

Ключевой тезис настоящей работы: **глубокое обучение для табличных данных — это не универсальный инструмент, а контекстно-зависимый выбор, требующий понимания природы данных и задачи**.

---

### **3. Порядок выполнения работы**

Работа выполняется в несколько последовательных этапов, каждый из которых направлен на достижение конкретных образовательных и исследовательских результатов.

#### **3.1. Использование данных из Практической работы № 1 и дополнительного табличного датасета**

**Задача:** Обеспечить методологическую преемственность и введение разнообразных сценариев.  
**Требования к выполнению:**  
– **Датасет 1 (временной ряд)**: финальная таблица из Практической работы № 1:  
  • Объём: не менее 720 последовательных наблюдений;  
  • Наличие целевой переменной и не менее пяти дополнительных признаков (включая лаги \( y_{t-1}, y_{t-7}, y_{t-30} \), скользящие средние, циклические кодировки);  
  • Подтверждённая стационарность (результаты ADF/KPSS);  
  • Сохранённые параметры преобразований (например, \( \lambda \) для Бокса–Кокса).  
– **Датасет 2 (табличный)**: например, `California Housing` (регрессия) или `Adult Income` (классификация):  
  • Содержит числовые и категориальные признаки;  
  • Объём ≥10 000 наблюдений.  
– Все признаки представлены в табличной форме без пропусков на момент обучения.

#### **3.2. Формализация задачи и разделение данных**

**Задача:** Корректно сформулировать задачу машинного обучения с учётом природы данных.  
**Требования к выполнению:**  
– Для временных рядов:  
  • Целевая переменная: \( y_t \); признаки \( X_t \): все доступные лаги и инженерные признаки;  
  • Разделение: тренировочная + валидационная часть — всё до \( T - 90 \); финальный тест — последние 90 наблюдений (только для итоговой оценки);  
  • Для кросс-валидации: `TimeSeriesSplit(n_splits=5, test_size=60)` — без перемешивания.  
– Для табличных данных:  
  • Стандартная задача регрессии/классификации;  
  • Разделение: 80/10/10 с стратификацией по целевой переменной.

#### **3.3. Определение архитектур и настройка моделей**

**Задача:** Привести каждую модель к её оптимальной конфигурации с использованием корректной валидации.  
**Требования к выполнению:**  
– Для всех моделей определяются гиперпараметры на основе рекомендаций литературы:  
  • **MLP**: `hidden_layers ∈ [(128,64), (256,128,64)]`, `dropout ∈ [0.2, 0.5]`;  
  • **1D-CNN**: `kernel_size ∈ [3,5,7]`, `filters ∈ [32,64]`;  
  • **LSTM/GRU**: `hidden_size ∈ [32,64,128]`, `num_layers ∈ [1,2]`;  
  • **Encoder–Decoder**: `encoder_hidden=64`, `decoder_hidden=64`.  
– Настройка:  
  • Обучение с фиксированным seed;  
  • Оптимизатор: Adam (lr=1e-3), ReduceLROnPlateau;  
  • Регуляризация: dropout, weight decay, gradient clipping (для RNN);  
  • Остановка: early stopping по val loss (patience=10).  
– Все процедуры выполняются только на тренировочной части с корректной валидацией.  
– Фиксация: оптимальные гиперпараметры, значение метрики на валидации, время обучения.

#### **3.4. Стратегии многопшагового прогнозирования (для временных рядов)**

**Задача:** Реализовать и сравнить подходы к прогнозу на горизонт \( h \geq 7 \).  
**Требования к выполнению:**  
– **Рекурсивная стратегия**: одна настроенная модель; прогноз на \( t+1 \) используется как вход для \( t+2 \);  
– **Прямая стратегия**: отдельная настройка и обучение модели для каждого шага \( t+1, \dots, t+h \);  
– **Encoder–Decoder**: единая модель для генерации всей последовательности;  
– Для каждой стратегии и каждого горизонта (\( h = 1, 7, 30 \)):  
  • Расчёт MAE, RMSE на каждом шаге;  
  • Фиксация общего времени вычислений;  
  • Построение графика накопления ошибки.

#### **3.5. Построение и настройка моделей**

**Задача:** Реализовать единообразный интерфейс для всех глубоких моделей.  
**Требования к выполнению:**  
– Все модели реализуются на PyTorch или TensorFlow с единым API:  
  • `model.fit(X_train, y_train)`;  
  • `model.predict(X_test)`.  
– Поддержка GPU и CPU;  
– Для временных рядов — вход в формате `(batch, seq_len, features)`;  
– Для табличных — `(batch, num_features)`.  
– Примеры архитектур:  
  • **MLP**: `Linear → ReLU → Dropout → ... → Output`;  
  • **1D-CNN**: `Conv1d → ReLU → AdaptiveAvgPool1d → Flatten → Linear`;  
  • **LSTM**: `LSTM → Dropout → Linear`;  
  • **Encoder–Decoder**: отдельные модули для кодирования и декодирования.

#### **3.6. Диагностика адекватности моделей**

**Задача:** Убедиться, что модель корректно обучается и не переобучается.  
**Требования к выполнению:**  
– **Графики обучения**: train/val loss и метрик по эпохам;  
– **Анализ переобучения**: разрыв между train и val метриками > 20%;  
– **Мониторинг градиентов**: норма градиентов по слоям (особенно для RNN);  
– **Стабильность весов**: отсутствие взрывного роста или затухания.  
– Диагностика обязательна для всех моделей и обоих типов данных.

#### **3.7. Оценка качества и статистическое сравнение**

**Задача:** Обоснованно сравнить модели по объективным критериям.  
**Требования к выполнению:**  
– Расчёт метрик **на финальной тестовой выборке** для каждого датасета и горизонта:  
  • Регрессия: MAE, RMSE, MASE, R²;  
  • Классификация: Accuracy, F1, AUC-ROC.  
– Составление сравнительных таблиц:  
  • Модели × датасеты × метрики × время обучения × время прогноза;  
  • Интерпретируемость (Saliency, SHAP, анализ вентилей);  
  • Диагностические показатели (переобучение, стабильность градиентов).  
– Ранжирование моделей по взвешенной оценке, учитывающей точность (50%), адекватность обучения (30%) и интерпретируемость (20%).

#### **3.8. Анализ интерпретируемости моделей**

**Задача:** Оценить способность модели объяснять свои предсказания.  
**Требования к выполнению:**  
– Для **MLP/CNN**: вычисление Saliency Maps и Integrated Gradients;  
– Для **LSTM/GRU**: визуализация forget/input/output gates на реальных последовательностях;  
– Для **гипридных моделей**: анализ вклада временных и статических признаков;  
– Проведение **локальной интерпретации**: водопадные диаграммы для отдельных прогнозов;  
– Анализ **устойчивости**: повторный запуск с разными seed — насколько стабильны ключевые признаки?  
– Результаты интерпретации включаются в сравнительные таблицы.

#### **3.9. Анализ вычислительной эффективности**

**Задача:** Оценить практическую применимость моделей в условиях ограниченных ресурсов.  
**Требования к выполнению:**  
– Фиксация времени:  
  • Обучение (в секундах),  
  • Прогнозирование (в миллисекундах на наблюдение);  
– Оценка потребления памяти (опционально, через `memory_profiler`);  
– Сравнение скорости сходимости: количество эпох до early stopping;  
– Включение столбца «Вычислительная сложность» в сравнительные таблицы: низкая/средняя/высокая.

#### **3.10. Разработка модульного фреймворка**

**Задача:** Создать единый интерфейс для всех архитектур и типов данных.  
**Требования к выполнению:**  
– Единый базовый класс `BaseDeepModel` с методами `fit()`, `predict()`, `interpret()`;  
– Поддержка переключения между задачами (табличная/временная) через конфигурацию;  
– Автоматическая предобработка признаков (масштабирование, эмбеддинги);  
– Экспорт/загрузка весов моделей.

#### **3.11. Публикация результатов исследования**

**Задача:** Обеспечить открытость и воспроизводимость работы.  
**Требования к выполнению:**  
– Для кода и результатов составляется метаописание, включающее:  
  • Список моделей и пространств гиперпараметров;  
  • Оптимальные гиперпараметры и метрики на валидации;  
  • Сравнительные таблицы по всем моделям и датасетам;  
  • Ключевые выводы и рекомендации;  
  • Инструкцию по запуску фреймворка.  
– Все материалы публикуются в публичном репозитории (GitHub/GitLab);  
– Веса моделей и логи обучения — архивированы;  
– Использование открытых лицензий: MIT (код), CC BY 4.0 (данные).

---

### **4. Дополнительные исследовательские задания**

1. Сравнение MLP с табличными специализированными архитектурами: NODE, TabNet, DCN (без реализации, через библиотеки).  
2. Анализ влияния размера датасета: при каком количестве наблюдений DL начинает выигрывать у бустинга?  
3. Робастность к зашумлённым признакам: сравнение устойчивости MLP, LSTM и LightGBM к добавлению шума.  
4. Transfer learning между табличными задачами: возможно ли?  
5. Ансамблирование DL и классических моделей: stacking MLP + LightGBM.  
6. Исследование зависимости времени обучения от длины временного ряда (масштабируемость).

---

### **5. Требования к отчёту**

Отчёт оформляется в соответствии с ГОСТ 7.32–2017 и должен содержать следующие разделы:  
1. **Введение** — постановка задачи, актуальность глубокого обучения для табличных данных, обзор литературы, указание на преемственность с Практической работой № 1.  
2. **Методология** — описание данных, трансформация ряда в признаки, архитектуры моделей, стратегии обучения, список инструментов.  
3. **Результаты экспериментов** — сравнительные таблицы, графики обучения, результаты диагностики, визуализации интерпретаций (Saliency, gates).  
4. **Обсуждение** — интерпретация важных признаков, анализ влияния архитектуры на качество, сравнение с классическим ML, вычислительная эффективность.  
5. **Заключение** — итоговые выводы, практические рекомендации по выбору архитектуры в зависимости от типа данных и задачи, ограничения исследования.  
6. **Список использованных источников** — оформлен в соответствии с ГОСТ Р 7.0.5–2008.  
7. **Приложения** — фрагменты кода, скриншоты визуализаций, примеры сравнительных таблиц, таблицы гиперпараметров.  
Отчёт сопровождается ссылками на репозиторий с кодом и опубликованные данные.

---

### **6. Критерии оценивания**

| Оценка | Критерии |
|--------|----------|
| **Отлично** | Полное выполнение всех этапов; обучение всех архитектур на двух типах данных; корректная валидация без утечки будущего; углублённая диагностика обучения; развёрнутый анализ интерпретируемости (Saliency, gates, устойчивость); оценка вычислительной сложности; модульный фреймворк; публикация всех материалов; отчёт, соответствующий ГОСТ. |
| **Хорошо** | Выполнение основных этапов; обучение 6–8 моделей на обоих датасетах; наличие сравнительных таблиц и базовой диагностики; реализация основных архитектур; отсутствие лишь отдельных элементов (например, гибридных моделей или анализа градиентов). |
| **Удовлетворительно** | Работа проведена только на одном типе данных; реализованы 3–5 моделей без полной диагностики; есть сравнение по метрикам; отсутствует интерпретация или стратегии прогнозирования. |
| **Неудовлетворительно** | Отсутствуют ключевые компоненты работы (данные из работы № 1 не использованы, отсутствует корректное разделение данных, нет сравнительного анализа, отчёт не представлен). |
