# Модуль 4: Агрегационные функции

**Тема: Основные агрегаты и их использование
Цель**: Научить использовать агрегатные функции (SUM, AVG, COUNT, MIN, MAX, COUNTD) для суммирования и анализа данных, комбинировать их в формулах и применять динамическую агрегацию в визуализациях.

## Теория
**Что такое агрегатные функции?**
Агрегатные функции в Tableau обрабатывают группы данных и возвращают одно значение для набора строк. Например, SUM([Sales]) суммирует все продажи в категории, а MAX([Profit]) находит максимальную прибыль. Эти функции необходимы для анализа данных на уровне групп, таких как категории, регионы или месяцы.
**Основные агрегатные функции**  
* **SUM**: Суммирует значения числового поля.  
* **AVG**: Вычисляет среднее значение числового поля.  
* **COUNT**: Подсчитывает количество строк (включая NULL, если не указано иное).  
* **MIN**: Находит минимальное значение в поле (работает с числами, датами, строками).  
* **MAX**: Находит максимальное значение в поле (работает с числами, датами, строками).  
* **COUNTD**: Подсчитывает количество уникальных значений в поле (игнорирует NULL).

⠀**Зачем это нужно?**  
* **Суммирование и анализ**: Агрегаты позволяют обобщать данные, например, подсчитывать общие продажи или среднюю прибыль по регионам.  
* **Комбинирование в формулах**: Используются в вычислениях, например, для расчета доли продаж (SUM([Sales]) / SUM([Total Sales])).  
* **Динамическая агрегация**: В визуализациях Tableau автоматически применяет агрегацию в зависимости от измерений (например, сумма продаж по месяцам).

⠀**Комбинирование агрегатов в формулах**  
* Агрегаты можно комбинировать в формулах, например, SUM([Sales]) / COUNT([Order ID]) для средней суммы заказа.  
* Важно: все части формулы должны быть агрегатными, иначе Tableau выдаст ошибку "cannot mix aggregate and non-aggregate". Для неагрегатных полей (измерений) используйте MIN, MAX или ATTR, как обсуждалось ранее.  
* Пример: IF ATTR([Category]) = "Technology" THEN SUM([Sales]) ELSE 0 END согласовывает агрегацию.

⠀**Динамическая агрегация в визуализациях**  
* В Tableau агрегация зависит от измерений в визуализации. Например, если вы добавите [Category] на строки и SUM([Sales]) на столбцы, Tableau автоматически суммирует продажи для каждой категории.  
* Вы можете изменить агрегацию в визуализации: щелкните на поле в области "Marks" и выберите другую функцию (SUM, AVG, MIN и т.д.).  
* Уровень детализации (LOD) влияет на результат: больше измерений (например, [Category] и [Region]) создают более мелкие группы для агрегации.

⠀**Где это делается?**  
* **В формулах**: В редакторе вычислений (Create Calculated Field).  
* **В визуализациях**: Перетаскивайте поля в области Rows, Columns или Marks, выбирая нужную агрегацию.

⠀**Советы по работе**:  
* Проверяйте типы данных: SUM и AVG работают только с числами, MIN и MAX — с числами, датами и строками, COUNTD — с любыми полями.  
* Добавляйте комментарии (// или /* */) для пояснения формул.  
* Тестируйте формулы в таблице, чтобы понять, как агрегация зависит от визуализации.  
* Избегайте чрезмерной сложности: если формула с агрегатами замедляет дашборд, попробуйте LOD-выражения.

⠀
## Примеры формул
* **SUM: Суммирование продаж**  
  * **Формула**:   SUM([Sales]) // Суммирует продажи
  * **Что делает**: Суммирует значения поля [Sales] для текущего уровня детализации (например, по категориям).  
  * **Результат**: Если продажи в категории: 200, 300, 500, то результат = 1000.  
  * **Применение**: Анализ общих продаж по регионам или месяцам.  
  * **Визуализация**: Постройте столбчатую диаграмму с SUM([Sales]) по категориям.
    
![image.png](attachment:85142f90-863c-4e21-9c92-2afb146a0c25.png)

* **AVG: Средняя прибыль**  
  * **Формула**:   AVG([Profit]) // Средняя прибыль
  * **Что делает**: Вычисляет среднее значение поля [Profit] для группы данных.  
  * **Результат**: Если прибыли: 100, 200, 300, то результат = 200.  
  * **Применение**: Оценка средней производительности продуктов или регионов.  
  * **Визуализация**: Создайте линейный график, показывающий AVG([Profit]) по месяцам.

![image 2.png](attachment:6685acd2-a9c2-4904-9b87-5dd61a58bef6.png)

* **COUNT: Подсчет заказов**  
  * **Формула**:   COUNT([Order ID]) // Количество заказов
  * **Что делает**: Подсчитывает количество строк в поле [Order ID], включая NULL.  
  * **Результат**: Если в группе 5 заказов, то результат = 5.  
  * **Применение**: Подсчет общего числа событий или транзакций.  
  * **Визуализация**: Постройте таблицу, показывающую COUNT([Order ID]) по регионам.

![image 3.png](attachment:b3d2d16c-93bd-45f0-9a35-2ac10916936b.png)

* **COUNTD: Уникальные клиенты**  
  * **Формула**:   COUNTD([Customer Name]) // Количество уникальных клиентов
  * **Что делает**: Подсчитывает уникальные значения в поле [Customer Name], игнорируя NULL.  
  * **Результат**: Если в группе Customer Name клиентов: "C1", "C1", "C2", то результат = 2.  
  * **Применение**: Анализ клиентской базы или уникальных событий.  
  * **Визуализация**: Создайте гистограмму, показывающую COUNTD([Customer Name]) по годам.

![image 4.png](attachment:3cf58f81-9342-449d-9d30-3d05063d6ddd.png)

* **MIN: Самая ранняя дата заказа**  
  * **Формула**:   MIN([Order Date]) // Самая ранняя дата
  * **Что делает**: Находит самую раннюю дату в поле [Order Date] для группы.  
  * **Результат**: Если даты: 2025-01-01, 2025-02-01, 2025-03-01, то результат = 2025-01-01.  
  * **Применение**: Определение начала активности в группе (например, по региону).  
  * **Визуализация**: Постройте временную шкалу с MIN([Order Date]) для каждой категории.

![image 5.png](attachment:e69c73aa-1146-4c99-b7b0-3a87592b6d56.png)

* **MAX: Максимальная цена**  
  * **Формула**:   MAX([Sales]) // Максимальная цена
  * **Что делает**: Находит максимальное значение в поле [Sales] для группы.  
  * **Результат**: Если цена: 100, 200, 300, то результат = 300.  
  * **Применение**: Выделение лучшего результата в группе.  
  * **Визуализация**: Создайте таблицу, показывающую MAX([Sales]) по продуктам.

![image 6.png](attachment:8bd22273-0067-4aab-b795-f4716dff7af0.png)

* **Комбинирование агрегатов: Средняя сумма заказа**  
  * **Формула**:   /* Средняя сумма заказа */
    SUM([Sales]) / COUNT([Order ID])
  * **Что делает**: Делит сумму продаж на количество заказов, чтобы найти среднюю сумму заказа.  
  * **Результат**: Если SUM([Sales]) = 1000 и COUNT([Order ID]) = 5, то результат = 200.  
  * **Применение**: Анализ среднего чека по регионам или категориям.  
  * **Визуализация**: Постройте линейный график, показывающий среднюю сумму заказа по месяцам.

![image 7.png](attachment:8c9d2248-6d56-4a2c-b65d-2f1a11668d64.png)

* **Комбинирование с IF: Условная агрегация**  
  * **Формула**:   /* Сумма продаж только для Technology */
    IF ATTR([Category]) = "Technology" THEN SUM([Sales]) ELSE 0 END
  * **Что делает**: Суммирует продажи только для категории "Technology", используя ATTR([Category]) для согласования агрегации. Возвращает 0 для других категорий.  
  * **Результат**: Если [Category] = "Technology" и SUM([Sales]) = 1000, то результат = 1000; если [Category] = "Furniture", то результат = 0.  
  * **Применение**: Выделение данных для конкретных условий.  
  * **Визуализация**: Постройте столбчатую диаграмму, показывающую продажи только для "Technology".

![image 8.png](attachment:8b287176-3f2a-4316-9d87-d6d0a20f7771.png)

* **Динамическая агрегация: Условное сравнение максимума**  
  * **Формула**:   /* Проверяет максимальные продажи */
    IF MAX([Sales]) > SUM([Sales]) / COUNT([Order ID]) THEN "Above Average" ELSE "Below Average" END
  * **Что делает**: Сравнивает максимальные продажи в группе с их средней суммой заказа. Возвращает "Above Average", если максимум выше среднего.  
  * **Результат**: Если MAX([Sales]) = 500 и SUM([Sales]) / COUNT([Order ID]) = 200, то результат = "Above Average".  
  * **Применение**: Анализ выбросов в данных.  
  * **Визуализация**: Создайте тепловую карту, где цвет отражает "Above Average" или "Below Average" по регионам.

![image 9.png](attachment:fc049e97-2efd-462c-b161-adc91457ab58.png)
⠀
## Рекомендации для новичков
* **Проверяйте типы данных**: Убедитесь, что поля подходят для выбранной функции (SUM и AVG — только для чисел, MIN и MAX — для чисел, дат, строк).  
* **Согласовывайте агрегацию**: Если используете агрегаты в формуле, оборачивайте измерения в MIN, MAX или ATTR, чтобы избежать ошибки "cannot mix aggregate and non-aggregate".  
* **Добавляйте комментарии**: Например, // Суммирует продажи или /* Проверяет максимум для категории */ для ясности.  
* **Тестируйте в визуализациях**: Создайте таблицу с минимальным количеством измерений, чтобы проверить, как агрегация работает.  
  * **Пример визуализации**: Постройте столбчатую диаграмму с SUM([Sales]) по [Category], затем измените агрегацию на AVG в области Marks, чтобы сравнить результаты.
* **Контролируйте детализацию**: Добавляйте или убирайте измерения (например, [Region], [Month]) в визуализации, чтобы увидеть, как меняется агрегация.  
* **Избегайте сложных формул**: Если производительность падает, попробуйте LOD-выражения вместо множественных агрегатов.
⠀
## Почему это важно?
Агрегатные функции (SUM, AVG, COUNT, MIN, MAX, COUNTD) — основа для анализа данных в Tableau. Они позволяют обобщать данные, сравнивать группы и создавать сложные вычисления, такие как средний чек или доля продаж. Понимание, как комбинировать их в формулах и использовать в визуализациях, даёт гибкость для построения дашбордов. Освоив динамическую агрегацию, вы подготовитесь к продвинутым темам, таким как LOD-выражения или кросс-источниковый анализ.