# SQL aggregate functions

###  Содержание <a class="anchor" id=0></a>
- [1. Знакомимся с данными](#1)
- [2. Убираем повторяющиеся значения](#2)
- [3. Агрегатные функции](#3)
- [4. Группировка](#4)
- [5. Фильтрация агрегированных строк](#5)
- [6. Итоги](#6)

## Знакомство с данными <a class="anchor" id=1></a>

[к содержанию](#0)

На протяжении всего модуля мы будем работать с таблицей [sql.pokemon](http://sql.skillfactory.ru:3000/question#eyJkYXRhc2V0X3F1ZXJ5Ijp7ImRhdGFiYXNlIjoyLCJxdWVyeSI6eyJzb3VyY2UtdGFibGUiOjM3fSwidHlwZSI6InF1ZXJ5In0sImRpc3BsYXkiOiJ0YWJsZSIsInZpc3VhbGl6YXRpb25fc2V0dGluZ3MiOnt9fQ==), содержащей данные о покемонах и их характеристиках из классических видеоигр.

Давайте познакомимся с нашими покемонами и данными о них!

<img src=sql_2_img1.png>

Присмотримся к содержимому таблицы `sql.pokemon`: в ней хранится информация о покемонах.

* `id`	- уникальный идентификатор
* `name`	- имя
* `type1`	- основной тип
* `type2`	- дополнительный тип
* `hp`	- количество очков здоровья
* `attack`	- показатели атаки
* `defense`	- показатели защиты
* `speed`	- показатели скорости

## Убираем повторяющиеся значения <a class="anchor" id=2></a>

[к содержанию](#0)

>**Примечание**. Как и в предыдущем модуле, вы можете посмотреть подробный разбор структуры предлагаемых запросов во вкладке **Детализация**.

Для начала получим все основные типы покемонов.

In [None]:
SELECT /*выбор*/
    type1 /*столбец type1*/
FROM sql.pokemon /*из таблицы sql.pokemon*/

Видно, что типы повторяются, потому что в результате запроса вы получаете все строки, которые подходят под заданные условия.

Чтобы получить уникальные значения из столбца, воспользуемся ключевым словом `DISTINCT`.

In [None]:
SELECT DISTINCT /*выбрать уникальные значения*/
    type1 /*столбец type1*/
FROM sql.pokemon /*из таблицы sql.pokemon*/

Мы можем применять `DISTINCT` и для нескольких столбцов.

Получим, например, все уникальные пары основного и дополнительного типов для покемонов.

In [None]:
SELECT DISTINCT /*выбрать уникальные значения*/
    type1, /*столбец type1*/
    type2 /*столбец type2*/
FROM sql.pokemon /*из таблицы sql.pokemon*/

>**Обратите внимание!** `DISTINCT` пишется только один раз, в начале списка получаемых столбцов.

## Агрегатные функции <a class="anchor" id=3></a>

[к содержанию](#0)

Кроме простых математических операций, которые мы использовали в предыдущем модуле, СУБД позволяет проводить статистические вычисления для нескольких строк.

Давайте посчитаем количество строк в таблице. Для этого применим агрегатную функцию `COUNT`.

In [None]:
SELECT
    COUNT(*)
FROM sql.pokemon

`COUNT` считает строки, а звёздочка (`*`) в аргументе функции означает, что считаются все строки, которые возвращает запрос.

Если в аргументе функции указать название столбца, функция обработает только строки с непустым значением.

Внутри функции `COUNT` мы можем также применять `DISTINCT`, чтобы вычислить количество уникальных значений.

In [None]:
SELECT
    COUNT(DISTINCT type1), /*кол-во уникальный типов покемонов */
    COUNT(DISTINCT type2) /*кол-во уникальных подтипов покемонов */
FROM sql.pokemon

### ОСНОВНЫЕ АГРЕГАТНЫЕ ФУНКЦИИ 

* `COUNT` — вычисляет число непустых строк;
* `SUM` — вычисляет сумму;
* `AVG` — вычисляет среднее;
* `MAX` — вычисляет максимум;
* `MIN` — вычисляет минимум.

Какое среднее количество очков здоровья у покемонов-драконов (то есть тех, у кого основной тип — `Dragon`)?

In [None]:
SELECT
    AVG(hp)
FROM sql.pokemon
WHERE type1 = 'Dragon'

In [None]:
SELECT /*выбор*/
    COUNT(*) AS "всего травяных покемонов", /*подсчёт всех строк; назначить алиас "всего травяных покемонов"*/
    COUNT(type2) AS "покемонов с дополнительным типом", /*подсчёт непустых строк в столбце type2; назначить алиас "покемонов с дополнительным типом"*/
    AVG(attack) AS "средняя атака", /*среднее значение столбца attack; назначить алиас "средняя атака"*/
    AVG(defense) AS "средняя защита" /*среднее значение столбца defense; назначить алиас "средняя защита"*/
FROM sql.pokemon /*из таблицы sql.pokemon*/
WHERE type1 = 'Grass'/*при условии, что значение столбца type1 содержит grass*/

<img src=sql_2_img2.png>

Итак, мы разобрали и попробовали применить базовые агрегатные функции.

### ДОПОЛНИТЕЛЬНО

С полным перечнем существующих агрегатных функций вы можете ознакомиться в [официальной документации](https://postgrespro.ru/docs/postgrespro/11/functions-aggregate).

>**Важно!** Если платформа не принимает ваш вариант кода, обращайте внимание на выпадающий пункт меню See full output: там иногда могут быть подсказки о причине ошибки.

Напишите запрос, который выведет:

* количество покемонов (столбец `pokemon_count`);
* среднюю скорость (столбец `avg_speed`);
* максимальное и минимальное число очков здоровья (столбцы `max_hp` и `min_hp`)
* для электрических (`Electric`) покемонов, имеющих дополнительный тип и показатели атаки или защиты больше 50.

In [None]:
SELECT
    COUNT(*) pokemon_count,
    AVG(speed) avg_speed,
    MAX(hp) max_hp,
    MIN(hp) min_hp
FROM sql.pokemon
WHERE type1 = 'Electric'
    AND type2 IS NOT NULL
    AND (attack > 50 OR defense > 50)

## Группировка <a class="anchor" id=4></a>

[к содержанию](#0)

Прежде мы применяли агрегатные функции для всего вывода, а сейчас используем для различных групп строк. Поможет нам в этом ключевое слово `GROUP BY`.

`GROUP BY` используется для определения групп выходных строк, к которым могут применяться агрегатные функции.

Выведем число покемонов каждого типа.

In [None]:
SELECT
    type1 AS pokemon_type,
    COUNT(*) AS pokemon_count
FROM sql.pokemon
GROUP BY type1
ORDER BY type1

Представим ТОП существующих типов покемонов.

In [None]:
SELECT
    type1 AS pokemon_type,
    COUNT(*) AS pokemon_count
FROM sql.pokemon
GROUP BY pokemon_type
ORDER BY COUNT(*) DESC

>**Обратите внимание!** Мы использовали в группировке не название столбца, а его алиас.

Напишите запрос, который выведет:

* число различных дополнительных типов (столбец additional_types_count);
* среднее число очков здоровья (столбец avg_hp);
* сумму показателей атаки (столбец attack_sum) в разбивке по основным типам (столбец primary_type).

Отсортируйте результат по числу дополнительных типов в порядке убывания, при равенстве — по основному типу в алфавитном порядке.
Столбцы к выводу (**обратите внимание на порядок!**): primary_type, additional_types_count, avg_hp, attack_sum.

In [None]:
SELECT
    type1 primary_type,
    COUNT(DISTINCT type2) additional_types_count,
    AVG(hp) avg_hp,
    SUM(attack) attack_sum
FROM sql.pokemon
GROUP BY primary_type
ORDER BY additional_types_count DESC, primary_type

>**Обратите внимание!** В группировке можно указывать порядковый номер столбца так же, как мы делали это в прошлом модуле для сортировки.

`GROUP BY` можно использовать и без агрегатных функций. Тогда его действие будет равносильно действию `DISTINCT`.

Сравните выводы двух запросов:

In [None]:
SELECT
    type1
FROM sql.pokemon
GROUP BY type1

/* равносильно */
SELECT DISTINCT 
    type1
FROM sql.pokemon

## Фильтрация агрегированных строк <a class="anchor" id=5></a>

[к содержанию](#0)

Если ключевое слово `WHERE` определяет фильтрацию строк до агрегирования, то для фильтрации уже агрегированных данных применяется ключевое слово `HAVING`.

>**Важно!** `HAVING` обязательно пишется после `GROUP BY`.

Выведем типы покемонов и их средний показатель атаки, при этом оставим только тех, у кого средняя атака больше 90.

In [None]:
SELECT /*выбор*/
    type1 AS primary_type, /*таблица type1; присвоить алиас primary_type*/
    AVG(attack) AS avg_attack /*расчёт среднего по столбцу attack; присвоить алиас avg_attack*/
FROM sql.pokemon /*из таблицы sql.pokemon*/
GROUP BY primary_type /*группировать по столбцу primary_type*/
HAVING AVG(attack) > 90 /*фильтровать по среднему значению attack, превышающему 90*/

Попробуйте удалить из запроса вывод второго столбца (со средним показателем атаки).

?Что получилось?

Запрос работает и выводит только названия типов, у которых средний показатель атаки выше 90.

**В `HAVING` вы можете использовать все те же условия, что и в `WHERE`.**

### ДОПОЛНИТЕЛЬНО

Об отличиях HAVING от WHERE можно прочитать в [официальной документации](https://postgrespro.ru/docs/postgresql/11/tutorial-agg).

В общем виде синтаксис оператора `SELECT`, с учётом имеющихся на данный момент знаний, представляем следующим образом:

In [None]:
SELECT [ALL | DISTINCT] список_столбцов|*
FROM список_имён_таблиц
[WHERE условие_поиска]
[GROUP BY список_имён_столбцов]
[HAVING условие_поиска]
[ORDER BY имя_столбца [ASC | DESC],…]

>**Обратите внимание!** В квадратных скобках указаны необязательные предложения: они могут отсутствовать в операторе `SELECT`.

Напишите запрос, который выведет основной и дополнительный типы покемонов (столбцы `primary_type` и `additional_type`) для тех типов, у которых средний показатель атаки больше 100 и максимальный показатель очков здоровья меньше 80.

In [None]:
SELECT 
    type1 primary_type,
    type2 additional_type
FROM sql.pokemon
GROUP BY primary_type, additional_type
HAVING AVG(attack) > 100
    AND MAX(hp) < 80

Напишите запрос, который выводит столбцы с основным типом (`primary_type`) и числом покемонов этого типа (`pokemon_count`) для тех покемонов, чьё имя (`name`) начинается с S.

Оставьте только типы, у которых средний показатель защиты больше 80.

Выведите только ТОП-3 типов по числу покемонов в них.

In [None]:
SELECT
    type1 primary_type,
    count(*) pokemon_count
FROM sql.pokemon
WHERE name LIKE 'S%'
GROUP BY primary_type
HAVING AVG(defense) > 80
ORDER BY pokemon_count DESC
LIMIT 3

## Итоги <a class="anchor" id=6></a>

[к содержанию](#0)

Структура запроса

In [None]:
SELECT
    столбец1 AS новое_название,
    столбец2,
    АГРЕГАТ(столбец3)
FROM таблица
WHERE (условие1 OR условие2)
    AND условие3
GROUP BY столбец1, столбец2
HAVING АГРЕГАТ(столбец3) > 5
ORDER BY сортировка1, сортировка2
OFFSET 1 LIMIT 2

Напишите запрос, который выведет основной и дополнительный типы покемонов и средние значения по каждому показателю (столбцы `avg_hp`, `avg_attack`, `avg_defense`, `avg_speed`).
Оставьте только те пары типов, у которых сумма этих четырёх показателей более 400.

In [None]:
SELECT
    type1,
    type2,
    AVG(hp) avg_hp,
    AVG(attack) avg_attack,
    AVG(defense) avg_defense,
    AVG(speed) avg_speed
FROM sql.pokemon
GROUP BY type1, type2
HAVING (AVG(hp) + AVG(attack) + AVG(defense) + AVG(speed)) >400

Напишите запрос, который выведет столбцы с основным типом покемона и общим количеством покемонов этого типа.

Учитывайте только тех покемонов, у которых или показатель атаки, или показатель защиты принимает значение между 50 и 100 включительно.

Оставьте только те типы покемонов, у которых максимальный показатель здоровья не больше 125.

Выведите только тот тип, который находится на пятом месте по количеству покемонов.

In [None]:
SELECT
    type1,
    count(*)
FROM sql.pokemon
WHERE (attack BETWEEN 50 and 100) OR (defense BETWEEN 50 and 100)
GROUP BY type1
HAVING MAX(hp) <= 125
ORDER BY count(*) DESC
OFFSET 4 LIMIT 1