---

## 1️⃣ Введение

Когда мы работаем с **метриками типа DAU, WAU, MAU, Retention, LTV, LT**, важно понимать **когда и зачем заполнять пропущенные даты**, и как выстраивать подготовку данных.  

> **Главное правило:**  
> Не заполняй пропуски автоматически. Делай это **только**, если смысл метрики зависит от непрерывности времени.

---

## 2️⃣ Универсальная последовательность подготовки данных

| Этап | Цель | Пример действий |
|------|------|-----------------|
| **1. Загрузка** | Получить исходные данные | `read_csv()`, `SELECT` |
| **2. Очистка** | Удалить дубликаты и аномалии | `dropna()`, `distinct()` |
| **3. Приведение типов** | Преобразовать даты, числа, категории | `to_datetime()`, `astype()` |
| **4. Фичи (feature engineering)** | Добавить производные признаки (день, неделя, месяц) | `dt.week`, `dt.month`, `groupby()` |
| **5. Проверка качества данных** | Убедиться, что хватает данных для анализа | `count()`, `unique()`, `describe()` |
| **6. Заполнение пропусков** | Только если временной ряд требует непрерывности | `merge(full_range)`, `resample()` |
| **7. Агрегация** | Сводим события в метрики | `groupby().count()`, `mean()` |
| **8. Анализ / визуализация / модель** | Построение графиков, отчётов, моделей | `matplotlib`, Power BI, ML pipeline |

---

## 3️⃣ Когда заполнять пропуски

| Метрика | Нужно ли заполнять? | Почему |
|----------|--------------------|--------|
| **DAU / WAU / MAU** | ✅ Да | Чтобы видеть дни с нулевой активностью |
| **Retention** | ✅ Да | Чтобы кривая retention была непрерывной |
| **LTV (integral)** | ⚠️ Иногда | При интегрировании важно учитывать все периоды |
| **LT (по diff max-min)** | ❌ Нет | Считается по каждому пользователю независимо |
| **Анализ заказов / событий** | ❌ Нет | Пустые дни не имеют смысла |
| **Когортный анализ** | ⚠️ Частично | Иногда нужен календарь, иногда нет |

---

## 4️⃣ Как правильно строить вопросы к данным

При новой задаче нужно ответить на 5 ключевых вопросов:

1. **Что я считаю?**  
   Метрика: DAU, Retention, LTV и т.п.
2. **Кто объект анализа?**  
   Пользователь, заказ, устройство, сессия?
3. **Какой временной масштаб?**  
   День, неделя, месяц?
4. **Что является активностью?**  
   Логин, покупка, просмотр?
5. **Что должно быть на оси времени?**  
   Полный календарь или только реальные события?

---

## 5️⃣ Итог

- **DAU, WAU, MAU, Retention** → заполняем пропуски, чтобы видеть реальную динамику и нули.  
- **LT, LTV по пользователям** → пропуски не обязательны, считаем по активности конкретного пользователя.  
- **Каждая метрика требует осознанного подхода**: сначала понимаем смысл, потом готовим данные.

---