## → Первым делом — знакомимся с датасетом.

### В этом модуле мы будем работать с таблицами о футбольных матчах и командах.

### Таблицы этого модуля, как и все другие в курсе, лежат в схеме sql в Metabase. Нам понадобятся таблицы teams и matches.

## Таблица teams с данными о командах

### id	* id команды
### api_id	* ключ на таблицу matches
### long_name	* полное название команды
### short_name	* сокращённое название команды

## Таблица matches с данными о матчах

### id	* id матча
### season *	сезон
### date *	дата матча
### home_team_api_id *	api_id домашней команды, ключ на таблицу teams
### away_team_api_id *	api_id гостевой команды, ключ на таблицу teams
### home_team_goals	* количество голов домашней команды
### away_team_goals *	количество голов гостевой команды

In [None]:
# 1.2
'''
select season, sum(home_team_goals) as total_home_goals, sum(away_team_goals) as total_away_goals
from sql.matches
group by season
order by season asc
''' 

# Соединение таблиц по ключу

## ОБЪЕДИНЯЕМ ТАБЛИЦЫ БЕЗ ОПЕРАТОРОВ

### ✍ Существует несколько способов соединения таблиц. Мы познакомимся со всеми основными операторами, которые используются для этих нужд, но начнём с простого метода объединения таблиц — без операторов.

### Чтобы соединить две таблицы между собой, достаточно записать названия таблиц через запятую в разделе from. Что произойдёт в таком случае?



In [None]:
'''
SELECT * /*выбор всех полей*/
FROM
    sql.teams, /*таблица с командами*/
    sql.matches /*таблица с матчами*/
'''

### Каждая запись, которая есть в таблице teams, будет соединена с каждой записью в таблице matches.

### Это действие также называют декартовым произведением таблиц.

![Alt text](https://lms-cdn.skillfactory.ru/assets/courseware/v1/bab33905e69032274d6f7e9f4abced95/asset-v1%3ASkillFactory%2BDSPR-2.0%2B14JULY2021%2Btype%40asset%2Bblock/dst3-u2-md3_2_1.png)

## Действительно ли это произведение?

### Легко проверить! В исходных таблицах teams и matches было 299 и 25083 записей соответственно. Если соединить каждую запись одной таблицы с каждой записью другой, получится 299 * 25083 записей в итоговой таблице.

### В данном случае соединение таблиц не даёт практической пользы: мы получили очень много записей, которые никак не можем интерпретировать, потому что команды не соответствуют матчам.

### Давайте исправим это. В таблице teams есть столбец api_id, а таблица matches содержит столбцы home_team_api_id и away_team_api_id — это ключи таблиц, по которым они соединяются.

## Ключ — это поле (столбец) в таблице, которое позволяет однозначно идентифицировать запись (строку).

### Чтобы соединить таблицы и получить данные о домашней команде по каждому матчу, добавим условие
### ''where home_team_api_id = api_id''.

In [None]:
'''
SELECT * /*выбор всех полей в таблице*/
FROM
    sql.teams, /*таблица с командами*/
    sql.matches /*таблица с матчами*/
WHERE home_team_api_id = api_id /*условие: home_team_api_id таблицы matches равен api_id таблицы teams*/
'''

### Аналогично можем получить данные о гостевых командах: необходимо изменить условие на
### ''where away_team_api_id = api_id''.

In [None]:
'''
SELECT * /*выбор всех полей в таблицы*/
FROM
    sql.teams, /*таблица с командами*/
    sql.matches /*таблица с матчами*/
WHERE away_team_api_id = api_id /*условие: away_team_api_id таблицы matches равен api_id таблицы teams*/
'''

### Итак, мы только что объединили таблицы по ключу.

### Вы уже знакомы с ключами по таблице pokemon (там в этой роли выступал столбец id). Ключи нужны для того, чтобы иметь возможность не перепутать между собой различные записи.

### → Например, у нас есть несколько команд с одинаковым названием: Polonia Bytom, Widzew Łódź и Royal Excel Mouscron — хотя это разные команды, с разными id.
### Кроме того, как мы уже смогли убедиться, ключи используются для соединения таблиц между собой.

## Ключи бывают двух основных типов:

* ### Primary — первичный ключ — служит для идентификации текущей таблицы и, как правило, идёт первым в списке столбцов. Всегда уникален: повторяющихся значений в основной таблице быть не может.
* ### Foreign — внешний ключ — представляет собой ссылку на другую таблицу.

### Как правило, названия ключей имеют «хвост», который позволяет их идентифицировать: например, _id, _rk, _cd, _pk (от primary_key), _fk (от foreign_key) и другие.

### Обратите внимание! В данном датасете ключ api_id таблицы teams может быть использован в разных значениях. Его можно использовать для того, чтобы получить информацию о домашней (home) или гостевой (away) команде.

### Вы могли заметить, что в последних двух запросах получилось очень много столбцов. Как и при работе с одиночной таблицей, мы можем выбирать, какие столбцы соединённой таблицы выводить.

### С помощью известного нам запроса получим названия команд, игравших домашние матчи, и счёт матчей.

In [None]:
'''
SELECT 
    long_name, /*столбец long_name таблицы teams*/
    home_team_goals, /*столбец home_team_goals таблицы matches*/
    away_team_goals /*столбец away_team_goals таблицы matches*/
FROM
    sql.teams, /*таблица с командами*/
    sql.matches /*таблица с матчами*/
WHERE home_team_api_id = api_id /*условие: home_team_api_id таблицы matches равен api_id таблицы teams*/
'''

In [None]:
# 2.2
'''
select
  long_name,
  home_team_goals,
  away_team_goals
from
  sql.matches,
  sql.teams
where away_team_api_id = api_id
'''

In [3]:
!pip install folium

Collecting folium
  Downloading folium-0.14.0-py2.py3-none-any.whl (102 kB)
                                              0.0/102.3 kB ? eta -:--:--
     -----------                             30.7/102.3 kB 1.3 MB/s eta 0:00:01
     -------------------------------------- 102.3/102.3 kB 1.5 MB/s eta 0:00:00
Collecting branca>=0.6.0 (from folium)
  Downloading branca-0.6.0-py3-none-any.whl (24 kB)
Collecting jinja2>=2.9 (from folium)
  Downloading Jinja2-3.1.2-py3-none-any.whl (133 kB)
                                              0.0/133.1 kB ? eta -:--:--
     -------------------------------------- 133.1/133.1 kB 2.6 MB/s eta 0:00:00
Collecting MarkupSafe>=2.0 (from jinja2>=2.9->folium)
  Downloading MarkupSafe-2.1.3-cp311-cp311-win_amd64.whl (17 kB)
Installing collected packages: MarkupSafe, jinja2, branca, folium
Successfully installed MarkupSafe-2.1.3 branca-0.6.0 folium-0.14.0 jinja2-3.1.2
