# 1. Знакомимся с данными
✍ Вы уже умеете делать запросы к одной таблице, использовать агрегатные функции и фильтровать данные в выводе. Но в реальных условиях базы данных обычно содержат множество таблиц и при запросе необходимо обращаться к нескольким таблицам. Освоением этого навыка мы сейчас и займёмся ↓

→ Первым делом — знакомимся с датасетом.

В этом модуле мы будем работать с таблицами о футбольных матчах и командах.

Таблицы этого модуля, как и все другие в курсе, лежат в схеме sql в Metabase. Нам понадобятся таблицы teams и matches.

#  2. Соединение таблиц по ключу

✍ Существует несколько способов соединения таблиц. Мы познакомимся со всеми основными операторами, которые используются для этих нужд, но начнём с простого метода объединения таблиц — без операторов.

Чтобы соединить две таблицы между собой, достаточно записать названия таблиц через запятую в разделе from. Что произойдёт в таком случае?

Каждая запись, которая есть в таблице teams, будет соединена с каждой записью в таблице matches.

Это действие также называют декартовым произведением таблиц.
?
Действительно ли это произведение?

Легко проверить! В исходных таблицах teams и matches было 299 и 25083 записей соответственно. Если соединить каждую запись одной таблицы с каждой записью другой, получится 299 * 25083 записей в итоговой таблице.

In [None]:
# SELECT *
# FROM
#     sql.teams,
#     sql.matches

В данном случае соединение таблиц не даёт практической пользы: мы получили очень много записей, которые никак не можем интерпретировать, потому что команды не соответствуют матчам.

Давайте исправим это. В таблице teams есть столбец api_id, а таблица matches содержит столбцы home_team_api_id и away_team_api_id — это ключи таблиц, по которым они соединяются.

Ключ — это поле (столбец) в таблице, которое позволяет однозначно идентифицировать запись (строку).

Чтобы соединить таблицы и получить данные о домашней команде по каждому матчу, добавим условие
where home_team_api_id = api_id.

Аналогично можем получить данные о гостевых командах: необходимо изменить условие на
where away_team_api_id = api_id.

In [None]:
# SELECT *
# FROM
#     sql.teams,
#     sql.matches
# WHERE home_team_api_id = api_id

Вы уже знакомы с ключами по таблице pokemon (там в этой роли выступал столбец id). Ключи нужны для того, чтобы иметь возможность не перепутать между собой различные записи.

→ Например, у нас есть несколько команд с одинаковым названием: Polonia Bytom, Widzew Łódź и Royal Excel Mouscron — хотя это разные команды, с разными id.
Кроме того, как мы уже смогли убедиться, ключи используются для соединения таблиц между собой.

Ключи бывают двух основных типов:

- Primary — первичный ключ — служит для идентификации текущей таблицы и, как правило, идёт первым в списке столбцов. Всегда уникален: повторяющихся значений в основной таблице быть не может.
- Foreign — внешний ключ — представляет собой ссылку на другую таблицу.

Как правило, названия ключей имеют «хвост», который позволяет их идентифицировать: например, _id, _rk, _cd, _pk (от primary_key), _fk (от foreign_key) и другие.

Обратите внимание! В данном датасете ключ api_id таблицы teams может быть использован в разных значениях. Его можно использовать для того, чтобы получить информацию о домашней (home) или гостевой (away) команде.

Вы могли заметить, что в последних двух запросах получилось очень много столбцов. Как и при работе с одиночной таблицей, мы можем выбирать, какие столбцы соединённой таблицы выводить.

С помощью известного нам запроса получим названия команд, игравших домашние матчи, и счёт матчей.

# 3. Знакомимся с JOIN

✍ В прошлом юните для соединения таблиц мы использовали условие в разделе where, чтобы показать принцип работы оператора JOIN.

JOIN — это оператор SQL, который позволяет соединять таблицы по условию.

В качестве примера используем запрос из предыдущего юнита.

In [None]:
# SELECT 
#     long_name,
#     home_team_goals,
#     away_team_goals
# FROM
#     sql.teams,
#     sql.matches
# WHERE home_team_api_id = api_id

In [None]:
# и запишем его с использованием JOIN.
#     long_name,
#     home_team_goals,
#     away_team_goals
# FROM
#     sql.teams
# JOIN sql.matches on home_team_api_id = api_id

### СИНТАКСИС

Оператор JOIN упрощает процесс соединения таблиц.

Его синтаксис можно представить следующим образом:

In [None]:
# SELECT
#       столбец1,
# 	    столбец2,
# 	...
# FROM
# 	    таблица1
# JOIN таблица2 ON условие

Порядок присоединения таблиц в данном случае не важен — результат будет одинаковым.

С помощью JOIN можно соединить и более двух таблиц.

В таблицах, которые мы соединяем, могут быть одинаковые названия столбцов.

→ К примеру, столбец id есть и в таблице matches, и в таблице teams. Такой запрос не будет обработан.

In [1]:
# SELECT
#     id   (Не верно!!!)
# FROM 
#     sql.teams
# JOIN sql.matches ON home_team_api_id = api_id

В результате должно появиться сообщение об ошибке вроде такого: "... column id is ambiguous ...".

?
Что же делать в таком случае?

Можно указать, откуда мы хотим запросить данные, записав название таблицы перед столбцом через точку.

In [None]:
# SELECT
#     teams.id  (Правильно!!!)
# FROM 
#     sql.teams
# JOIN sql.matches ON home_team_api_id = api_id

Зачастую названия таблиц слишком длинные, так что использовать их неудобно.

Упростить обращение к различным таблицам можно, присвоив им сокращённые названия — алиасы (от англ. alias).

Синтаксис для указания алиаса такой же, как и для названия столбца.

In [None]:
# SELECT
#      столбец1,
#      столбец2,
# 	...
# FROM
# 	   таблица1 AS короткое_название_1
# JOIN таблица2 AS короткое_название_2 ON условие

Название записывается без пробелов и операторов.

Если необходимо записать название, в котором используются пробелы ("table 1"), то алиас можно обернуть в кавычки.

Важно! Обращаться по такому алиасу придётся также с помощью кавычек.

Использование таких алиасов считается плохой практикой как минимум по причине того, что обращаться с такими алиасами неудобно.

Вместо алиасов с кавычками рекомендуется давать простое короткое название на латинице, без специальных символов и пробелов. Если таблиц немного и все названия начинаются с разных букв, можно присваивать алиасы по первой букве.

Ключевое слово as, как и в названии столбца, можно опустить в большинстве СУБД.

In [None]:
# SELECT
#       столбец1 новое_название_столбца,
#  	    столбец2 новое_название_столбца,
# 	...
# FROM
# 	   таблица1 короткое_название_1
# JOIN таблица2 короткое_название_2 ON условие

# Задание 3.2
Напишите запрос, который выведет два столбца: id матча (match_id) и id домашней команды (team_id). Отсортируйте по id матча в порядке возрастания значений.

In [None]:
# SELECT
#     matches.id AS match_id,
#     teams.id AS team_id
# FROM 
#     sql.teams
# JOIN 
#     sql.matches 
# ON 
#     sql.teams.api_id = sql.matches.home_team_api_id
# ORDER BY 
#     match_id;


Кажется, теперь мы можем соединить таблицы между собой и создать своё табло со счётом матчей, как на спортивных сайтах!

Давайте с помощью запроса SQL получим таблицу, содержащую:

- название домашней команды;
- количество забитых домашней командой голов;
- количество забитых гостевой командой голов;
- название гостевой команды.

In [None]:
# SELECT
#     h.long_name "домашняя команда",
#     m.home_team_goals "голы домашней команды",
#     m.away_team_goals "голы гостевой команды",
#     a.long_name "гостевая команда" 
# FROM
#     sql.matches m
#     JOIN sql.teams h ON m.home_team_api_id = h.api_id
#     JOIN sql.teams a ON m.away_team_api_id = a.api_id

### Задание 3.3
Напишите запрос, который выведет столбцы:

id матча,
короткое название домашней команды (home_short),
короткое название гостевой команды (away_short).
Отсортируйте запрос по возрастанию id матча.

In [None]:
# SELECT 
#     m.id,
#     t.short_name home_short,
#     t1.short_name away_short
# FROM sql.matches m
# JOIN sql.teams t on t.api_id = m.home_team_api_id
# JOIN sql.teams t1 on t1.api_id = m.away_team_api_id 
# ORDER BY 1


# 4. Фильтрация и агрегатные функции

### РАБОТА С ОБЪЕДИНЁННЫМИ ТАБЛИЦАМИ

✍ Соединять таблицы мы научились, теперь давайте научимся получать необходимые данные из нескольких таблиц ↓
Принцип построения запроса и порядок операторов такой же, как и с обычной таблицей.

Вспомним его:



In [None]:
# SELECT... 
# FROM... 
# WHERE... 
# GROUP BY... 
# ORDER BY... 
# LIMIT...

ФИЛЬТРАЦИЯ ДАННЫХ

К соединённым таблицам применимы функции фильтрации данных.

Например, можно вывести id матчей, в которых команда Arsenal была гостевой.

⛏
ПОПРОБУЙТЕ В METABASE!

In [None]:
# SELECT 
#     m.id
# FROM
#     sql.teams t
#     JOIN sql.matches m ON m.away_team_api_id = t.api_id
# WHERE long_name = 'Arsenal'

### !!!
Принципиальное отличие фильтрации данных по соединённым таблицам от аналогичного действия по одиночным таблицам заключается в том, что, фильтруя записи одной таблицы, мы также будем фильтровать и записи другой таблицы, поскольку соединённые на уровне запроса таблицы по сути являются единой таблицей.

Например, результат запроса

In [None]:
# SELECT 
# 	m.id id_1,
# 	m.season,
#	t.id id_2,
#	t.long_name
# FROM
# 	sql.teams t
# JOIN sql.matches m ON m.away_team_api_id = t.api_id

### Задание 4.1
Напишите запрос, который выведет полное название домашней команды (long_name), количество голов домашней команды (home_goal) и количество голов гостевой команды (away_goal) в матчах, где домашней командой были команды с коротким названием 'GEN'. Отсортируйте запрос по id матча в порядке возрастания.

In [None]:
# SELECT
#     h.long_name AS home_long_name,
#     m.home_team_goals AS home_goal,
#     m.away_team_goals AS away_goal
# FROM
#     sql.matches m
#     JOIN sql.teams h ON m.home_team_api_id = h.api_id
# WHERE
#     h.short_name = 'GEN'
# ORDER BY
#     m.id ASC;

Также мы можем отфильтровать записи сразу по двум таблицам.

⛏
ПОПРОБУЙТЕ В METABASE!

Например, можно оставить только записи, в которых короткое название домашней команды GEN и матчи сезона 2008/2009.

In [None]:
# SELECT *
# FROM    
#     sql.matches m
#     JOIN sql.teams t on t.api_id = m.home_team_api_id
# WHERE
#     t.short_name = 'GEN'
#     AND m.season = '2008/2009'

### Задание 4.2
Напишите запрос, чтобы вывести id матчей, короткое название домашней команды (home_short), короткое название гостевой команды (away_short) для матчей сезона 2011/2012, в которых участвовала команда с названием Liverpool. Отсортируйте по id матча в порядке возрастания.

In [None]:
# SELECT
#     m.id,
#     h.short_name AS home_short,
#     a.short_name AS away_short
# FROM
#     sql.matches m
#     JOIN sql.teams h ON m.home_team_api_id = h.api_id
#     JOIN sql.teams a ON m.away_team_api_id = a.api_id
# WHERE
#     m.season = '2011/2012' AND (
#         h.long_name = 'Liverpool' OR
#         a.long_name = 'Liverpool'
#     )
# ORDER BY
#     m.id ASC;

### АГРЕГАЦИЯ ДАННЫХ

К соединённым таблицам также применимы любые агрегатные функции — самые важные функции для анализа данных.

⛏
ПОПРОБУЙТЕ В METABASE!

Например, мы можем вывести сумму голов матча, забитых командами, агрегированную по гостевым командам (совокупное количество голов в матче, забитых обеими командами, суммированное в разрезе гостевых команд).

In [None]:
# SELECT
#     t.long_name,
#     SUM(m.home_team_goals) + SUM(m.away_team_goals) match_goals
# FROM
#     sql.matches m
#     JOIN sql.teams t ON m.away_team_api_id = t.api_id 
# GROUP BY t.id

Обратите внимание! В данном запросе была использована группировка по столбцу id таблицы teams, хотя этот столбец не выводится в запросе. Это необходимо для того, чтобы команды с одинаковым названием, если такие найдутся, не группировались между собой. Группировка по названию команды в данном запросе будет неверной, так как есть несколько команд с одинаковым полным названием — мы говорили об этом в начале модуля.

Также, применяя агрегатные функции к соединённым таблицам, обращайте внимание на указание алиасов (или таблиц) при группировке и указании столбцов агрегатных функций. В нашей соединённой таблице есть два столбца с названием id, и если бы мы сформировали запрос без указания таблицы, как указано ниже, то...система выдала бы уже знакомую нам ошибку: "... column "id" is ambiguous ...".

Мы можем использовать оператор HAVING для фильтрации сгруппированных данных.

Поставим задачу — вывести таблицу с суммарным количеством забитых голов в матчах по командам и сезонам для команд, в которых суммарное количество голов в матчах сезона больше 100.

⛏
ПОПРОБУЙТЕ В METABASE!

Для начала посчитаем общее количество голов в матчах по сезонам.



In [None]:
# SELECT
#     m.season,
#     SUM(m.home_team_goals) + SUM(m.away_team_goals) total_goalsFROM sql.matches m
# GROUP BY m.season

In [None]:
# SELECT
#     m.season,
#     t.long_name,
#     SUM(m.home_team_goals) + SUM(m.away_team_goals) total_goals
# FROM sql.matches m
# JOIN sql.teams t ON t.api_id = m.home_team_api_id OR t.api_id = m.away_team_api_id
# GROUP BY m.season, t.id
# HAVING SUM(m.home_team_goals) + SUM(m.away_team_goals) > 100

## 5. Способы соединения таблиц
### ОПЕРАТОРЫ

✍ В прошлых юнитах для соединения таблиц мы использовали один оператор — JOIN. В действительности же он не один: существует несколько различных видов соединений (join’ов) — давайте посмотрим, какие ↓


### INNER JOIN

INNER JOIN — это тот же JOIN (слово inner в операторе можно опустить).

Для INNER JOIN работает следующее правило: присоединяются только те строки таблиц, которые удовлетворяют условию соединения. Если в любой из соединяемых таблиц находятся такие строки, которые не удовлетворяют заявленному условию, — они отбрасываются.

Рассмотрим на примере нашего датасета. 

В таблице teams есть данные о 299 различных командах — можем проверить это с помощью запроса.

⛏
ПОПРОБУЙТЕ В METABASE!



In [None]:
# SELECT 
# COUNT(DISTINCT id)
# FROM sql.teams



# SELECT 
# COUNT(DISTINCT api_id)
# FROM sql.teams

Теперь добавим к teams таблицу с матчами.
И в таблице останется уже не 299 команд, а только 292.

In [None]:
# SELECT 
# COUNT(DISTINCT t.id) 
# FROM 
# sql.teams t
# JOIN sql.matches m ON t.api_id = m.home_team_api_id OR t.api_id = m.away_team_api_id

Дело в том, что таблица sql.matches по какой-то причине не содержит информацию о командах Lierse SK, KVC Westerlo, KAS Eupen, Club Brugge KV, KV Oostende, RSC Anderlecht и Hull City, зато они есть в таблице sql.teams. Возможно, эти команды не участвовали ни в одном матче или записи по этим матчам были удалены.

### LEFT OUTER JOIN И RIGHT OUTER JOIN

Также существуют схожие друг с другом типы соединения — LEFT JOIN и RIGHT JOIN (слово outer в операторе можно опустить).

Для LEFT JOIN работает следующее правило: из левой (относительно оператора) таблицы сохраняются все строки, а из правой добавляются только те, которые соответствуют условию соединения. Если в правой таблице не находится соответствия, то значения строк второй таблицы будут иметь значение NULL.

LEFT JOIN может быть полезен, когда соответствующих записей во второй таблице может не быть, но важно сохранить записи из первой таблицы.

?
Почему соответствий может не быть?

Причины могут быть разные, назовём две основные:

1
Различная бизнес-логика таблиц.

Пример: в интернет-магазине почти всегда можно оформить заказ с промокодом. Вполне вероятно, что информация о промокодах хранится в отдельной таблице, но при этом не для каждого заказа будет существовать промокод, поскольку покупку можно оформить и без него.

2
Разное время обновления таблиц.

Пример: клиент зарегистрировался на сайте интернет-магазина и оформил заказ. Данные о регистрации клиентов могут обновляться в базе данных раз в неделю, а о заказах — раз в сутки.

→ Поставим следующую задачу: вывести полные названия команд, данных по которым нет в таблице matches.

Для начала посмотрим на результат запроса после соединения

In [None]:
# SELECT
#     t.long_name,
#     m.id
# FROM sql.teams t
# LEFT JOIN sql.matches m ON t.api_id = m.home_team_api_id OR t.api_id = m.away_team_api_id
# ORDER BY m.id DESC

Вывод: в таблице teams сохранились все записи, а в таблице matches есть пустые строки.

Теперь, чтобы выбрать такие команды, которые не принимали участия в матчах, достаточно добавить условие where m.id is null (или любое другое поле таблицы matches).

In [None]:
# SELECT
#    t.long_name
# FROM 
#    sql.teams t
# LEFT JOIN sql.matches m ON t.api_id = m.home_team_api_id OR t.api_id = m.away_team_api_id
# WHERE m.id IS NULL

### !!!
Обратите внимание! Если мы добавим какой-либо фильтр по отличному от NULL значению для таблицы matches, то LEFT JOIN превратится в INNER JOIN, поскольку для второй таблицы станет необходимым присутствие такого (NOT NULL) значения в строке.

In [None]:
# SELECT
#     t.long_name FROM sql.teams t
# LEFT JOIN sql.matches m ON t.api_id = m.home_team_api_id OR t.api_id = m.away_team_api_id
# WHERE
#     m.season = '2008/2009'
# AND t.long_name = 'KAS Eupen'

В ответе Metabase получим No results!, так как вместе с фильтром m.season = '2008/2009' исчезли все строки, значения которых NULL.

С LEFT JOIN также работают агрегатные функции, что позволяет не потерять значения из левой таблицы. Например, мы можем вывести сумму голов команд по гостевым матчам.

In [None]:
# SELECT
#     t.long_name,
#     SUM(m.away_team_goals) total_goals
# FROM   
#     sql.teams t
# LEFT JOIN sql.matches m ON t.api_id = m.away_team_api_id
# GROUP BY t.id
# ORDER BY 2 DESC

### !!! 
Обратите внимание! При применении функций SUM, MIN, MAX, AVG к полям со значением NULL в результате получится NULL, а не 0. А при использовании функции COUNT, наоборот, получится 0.

### FULL OUTER JOIN
Оператор FULL OUTER JOIN объединяет в себе LEFT и RIGHT JOIN и позволяет сохранить кортежи обеих таблиц. Даже если не будет соответствий, мы сохраним все записи из обеих таблиц.

FULL OUTER JOIN может быть полезен в ситуациях, когда схема данных недостаточно нормализована и не хватает таблиц-справочников.

Пример: в базе данных интернет-магазина есть две таблицы — с зарегистрированными пользователями и пользователями, оформившими заказ. При этом оформить заказ можно без регистрации, а зарегистрироваться — без оформления заказа.

Предположим, что вам необходимо получить полный список пользователей — и оформивших заказ, и зарегистрированных, — но в базе данных этой объединённой таблицы нет. В данном случае можно использовать FULL OUTER JOIN для получения полного списка, соединив таким образом таблицы c заказами и регистрациями по id пользователя.

In [None]:
# Синтаксис FULL OUTER JOIN аналогичен другим JOIN.

# SELECT 
# …
# FROM
# 	table1
# FULL OUTER JOIN table2 ON условие

### CROSS JOIN
На самом деле с этим оператором соединения таблиц вы познакомились в самом начале текущего модуля.

CROSS JOIN соединяет таблицы так, что каждая запись в первой таблице присоединяется к каждой записи во второй таблице, иначе говоря, даёт декартово произведение.

In [None]:
# SELECT *
# FROM
#     sql.teams,
#     sql.matches

## =

In [None]:
# SELECT *
# FROM
#     sql.teams
#     CROSS JOIN sql.matches

CROSS JOIN может быть полезен, когда необходимо создать таблицу фактов.

Например, с помощью такого запроса мы можем получить все возможные комбинации полных названий команд в матчах.

In [None]:
# SELECT
#     DISTINCT
#     t1.long_name home_team, 
#     t2.long_name away_team
# FROM
#     sql.teams t1
#     CROSS JOIN sql.teams t2

### NATURAL JOIN

Ключевое слово natural в начале оператора JOIN позволяет не указывать условие соединения таблиц — для соединения будут использованы столбцы с одинаковым названием из этих таблиц.

NATURAL JOIN можно использовать с любыми видами соединений, которые требуют условия соединения:

- → NATURAL INNER JOIN (возможна запись NATURAL JOIN);
- → NATURAL LEFT JOIN;
- → NATURAL RIGHT JOIN;
- → NATURAL FULL OUTER JOIN.

При использовании NATURAL JOIN прежде всего стоит обратить внимание на ключи таблиц. Для наших таблиц teams и matches этот вид соединения не подойдёт, так как общим для обеих таблиц является столбец id, но таблицы соединяются по другим столбцам.

Когда у таблиц есть несколько столбцов с одинаковыми именами, при NATURAL JOIN условие соединения будет применено на все столбцы с одинаковыми именами.

То есть для таблиц table1 и table2

table1: id, name, ...

table2: id, name, ...

In [None]:
# запрос

# SELECT 
# …
# FROM          table1 NATURAL JOIN table2

# будет равнозначен запросу

# SELECT
# …
# FROM          table1 t1
# INNER JOIN table2 t2 ON t1.id = t2.id AND t1.name = t2.name

### ОБЩАЯ ЛОГИКА ПОСТРОЕНИЯ ЗАПРОСА С JOIN
При построении запроса с несколькими JOIN старайтесь идти слева направо. Сначала выберите таблицу, которая является центральной в соответствии с поставленной задачей, вопросом. Затем добавляйте таблицы поэтапно в зависимости от бизнес-логики запроса.

Например, для ответа на вопрос: «Какая команда сыграла больше всех матчей в сезоне 2010/2011?» в качестве центральной лучше выбрать таблицу с командами.

А для ответа на вопрос: «В каком сезоне участвовало больше всего команд?» — таблицу с матчами.

Стоит отметить, что из рассмотренных видов соединений чаще всего используются INNER JOIN и LEFT JOIN. Другие операторы используются реже, но стоит помнить об их существовании при решении нестандартных задач.

## 6. Итоги. Закрепление знаний
✍ В этом модуле вы познакомились с разными способами вертикального соединения таблиц.

Теперь вы умеете:

- соединять таблицы по ключу;
- соединять таблицы с помощью оператора JOIN;
- использовать разные виды JOIN;
- применять агрегации к объединённым таблицам и фильтровать вывод.

Теперь давайте закрепим полученные знания ↓

Вам предстоит выполнить пять заданий на написание SQL-запросов по определённым условиям.

Если какую-то задачу не получается выполнить с первого раза — не отчаивайтесь. Соединение таблиц — одна из самых сложных тем для освоения и эффективного использования языка SQL.

Если при выполнении заданий возникли трудности, попробуйте вернуться к материалам и посмотреть примеры запросов для разных задач.

### Задание 6.1
Напишите запрос, который выведет список уникальных полных названий команд (long_name), игравших в гостях в матчах сезона 2012/2013. Отсортируйте список в алфавитном порядке.

In [None]:

# SELECT DISTINCT
#     t1.long_name AS away_team
# FROM 
#     sql.teams t1
# JOIN 
#     sql.matches t2 ON t1.api_id = t2.away_team_api_id
# WHERE 
#     t2.season = '2012/2013'
# ORDER BY 
#     t1.long_name ASC;

### Задание 6.2
Напишите запрос, который выведет полное название команды (long_name) и общее количество матчей (matches_cnt), сыгранных командой Inter в домашних матчах.

In [None]:
# SELECT
#     t.long_name AS team_name,
#     COUNT(m.id) AS matches_cnt
# FROM 
#     sql.teams t
# JOIN 
#     sql.matches m ON t.api_id = m.home_team_api_id
# WHERE 
#     t.long_name = 'Inter'
# GROUP BY
#     t.long_name;

### Задание 6.3
Напишите запрос, который выведет топ-10 команд (long_name) по суммарному количеству забитых голов в гостевых матчах. Во втором столбце запроса выведите суммарное количество голов в гостевых матчах (total_goals).

In [None]:
# SELECT
#     t.long_name,
#     SUM(m.away_team_goals) total_goals
# FROM sql.teams t
# JOIN sql.matches m ON t.api_id = m.away_team_api_id
# GROUP BY t.id
# ORDER BY 2 desc
# LIMIT 10


В этом запросе:

- SELECT t.long_name AS team_name, COUNT(m.id) AS matches_cnt выбирает полное название команды и подсчитывает количество матчей, в которых команда была домашней.
- JOIN sql.matches m ON t.api_id = m.home_team_api_id соединяет таблицу teams с таблицей matches по идентификатору домашней команды.
- WHERE t.long_name = 'Real Madrid CF' OR t.long_name = 'FC Barcelona' фильтрует записи для двух команд: "Real Madrid CF" и "FC Barcelona".
- GROUP BY t.long_name группирует результаты по полному названию команды.
- ORDER BY matches_cnt DESC сортирует результаты по количеству матчей в порядке убывания.

### Задание 6.4
Выведите количество матчей между командами Real Madrid CF и FC Barcelona. В поле ниже введите запрос, с помощью которого вы решили задание.

In [None]:
# SELECT
#     COUNT(m.id) AS matches_cnt
# FROM 
#     sql.matches m
# JOIN 
#     sql.teams t1 ON m.home_team_api_id = t1.api_id
# JOIN 
#     sql.teams t2 ON m.away_team_api_id = t2.api_id
# WHERE 
#     (t1.long_name = 'Real Madrid CF' AND t2.long_name = 'FC Barcelona')
#     OR (t1.long_name = 'FC Barcelona' AND t2.long_name = 'Real Madrid CF');

В этом запросе:

- SELECT COUNT(m.id) AS matches_cnt подсчитывает количество матчей.
- JOIN sql.teams t1 ON m.home_team_api_id = t1.api_id соединяет таблицу matches с таблицей teams для домашней команды.
- JOIN sql.teams t2 ON m.away_team_api_id = t2.api_id соединяет таблицу matches с таблицей teams для гостевой команды.
- WHERE (t1.long_name = 'Real Madrid CF' AND t2.long_name = 'FC Barcelona') OR (t1.long_name = 'FC Barcelona' AND t2.long_name = 'Real Madrid CF') фильтрует матчи, где одна команда является домашней, а другая гостевой, и наоборот.

### Задание 6.5 
Напишите запрос, который выведет название команды (long_name), сезон (season) и суммарное количество забитых голов в домашних матчах (total_goals). Оставьте только те строки, в которых суммарное количество голов менее десяти. Отсортируйте запрос по названию команды, а затем — по сезону.

In [None]:
# SELECT
#     t.long_name AS team_name,
#     m.season,
#     SUM(m.home_team_goals) AS total_goals
# FROM 
#     sql.matches m
# JOIN 
#     sql.teams t ON m.home_team_api_id = t.api_id
# GROUP BY
#     t.long_name, m.season
# HAVING
#     SUM(m.home_team_goals) < 10
# ORDER BY 
#     t.long_name, m.season;

В этом запросе:

- SELECT t.long_name AS team_name, m.season, SUM(m.home_team_goals) AS total_home_goals выбирает полное название команды, сезон и сумму голов, забитых командой в домашних матчах.
- JOIN sql.teams t ON m.home_team_api_id = t.api_id соединяет таблицу matches с таблицей teams по идентификатору домашней команды.
- GROUP BY t.long_name, m.season группирует данные по названию команды и сезону.
- HAVING SUM(m.home_team_goals) < 10 фильтрует результаты, оставляя только те команды, которые забили менее 10 голов в домашних матчах за сезон.
- ORDER BY t.long_name, m.season сортирует результаты по названию команды и сезону.





