# Задания на командную строку Linux и SQL

## 1. Linux

1. Подключитесь по ssh к нашему серверу `dc-webdev.bmstu.ru`, используя свой логин и пароль.
2. В домашней директории создайте папку `solutions`. Полный путь к папке должен выглядеть так: `/home/student_username/solutions`, где student_username - ваше имя пользователя на сервере.

Ответы на задания по SQL поместите в файлы `/home/student_username/solutions/NN.sql`, где student_username - ваше имя пользователя на сервере, а NN - всегда двузначный номер задания (т.о. файл с решением задания под номером 5 будет называться `/home/student_username/solutions/05.sql`).

## 2. SQL

Мы будем работать с базой данных о товарах и покупках в магазинах. Структура нашей базы данных следующая:

### Таблица products

Здесь содержится информация о товарах, продающихся в нашей торговой сети. Колонки:

- **product_id**: *INT* - числовой уникальный идентификатор товара в нашей БД
- **name**: *VARCHAR* - название товара
- **category**: *VARCHAR* - название категории товара
- **brand**: *BRAND* - название фирмы-производителя товара

### Таблица stores

Здесь содержится информация о магазинах нашей торговой сети. Колонки:

- **store_id**: *INT* - числовой уникальный идентификатор магазина в нашей БД
- **address**: *VARCHAR* - текстовый адрес магазина
- **region**: *INT* - числовой идентификатор региона, в котором находится магазин

### Таблица customers

Таблица, в которой содержится информация о зарегистрированных клиентах торговой сети. Колонки:

- **customer_id**: *INT* - числовой уникальный идентификатор клиента в БД
- **name**: *VARCHAR* - имя клиента
- **surname**: *VARCHAR* - фамилия клиента
- **birth_date**: *DATE* - дата рождения клиента

### Таблица prices

В этой таблице содержится информация о ценах на товары. Считаем что цена на конкретный товар одинакова в каждом из магазинов, но может меняться во времени. Поэтому цены мы храним в формате товар - дата начала действия цены - дата окончания действия цены. Колонки этой таблицы:

- **price_id**: *INT* - числовой уникальный идентификатор записи о цене
- **product_id**: *INT* - числовой уникальный идентификатор товара в нашей БД - отсылка к таблице **products**
- **price**: *INT* - стоимость товара в конкретный период в условных денежных единицах
- **start_date**: *DATE* - дата начала действия цены на товар (включительно)
- **end_date**: *DATE* - дата окончания действия цены на товар (включительно)

### Таблица sales

В этой таблице содержатся данные о продажах товаров в магазинах. Здесь сознательно не указывается цена, потому что цену продажи определенного товара в определенный день можно узнать из таблицы **prices**. Колонки:

- **sale_id**: *INT* - числовой уникальный идентификатор записи о продаже товара
- **product_id**: *INT* - числовой уникальный идентификатор товара в нашей БД - отсылка к таблице **products**
- **store_id**: *INT* - числовой уникальный идентификатор магазина в нашей БД - отсылка к таблице **stores**
- **customer_id**: *INT* - числовой уникальный идентификатор клиента в нашей БД - отсылка к таблице **customers**. Может быть NULL в случае, если клиент не авторизовался при покупке товара
- **sale_date**: *DATE* - дата продажи товара

В каждой задаче, описанной ниже, вам нужно работать только с одной из таблиц (задачи на объединение таблиц будут позже). Решение задачи - это скрипт, который выбирает нужные данные из таблицы. Его и нужно сохранить в файл с требуемым названием.

## Итак, задачи:

### Базовые запросы 
 
1. Выберите все адреса магазинов, которые хранятся в БД. 
2. Выберите все уникальные номера регионов магазинов. 
3. Выберите все уникальные сочетания имя-фамилия зарегистрированных клиентов. 
4. Мы хотим создать карту, в какие магазины ходит каждый конкретный покупатель. Выберите все пары customer_id, store_id для этого. 
5. Выведите все уникальные бренды товаров в алфавитном порядке. 
6. Мы хотим оценить, какой объем персональных предложений планировать на следующий год. Выведите customer_id и дату рождения клиентов, отсортированные по дате рождения без учета года (от 1 января до 31 декабря). 
7. Мы разделили регионы по возрастанию номера региона на тройки, чтобы провести на них проверку бизнес-гипотез. Выведите тертью тройку номеров регионов. 
8. Выведите самую позднюю дату, на которую хотя бы для одного товара установлена цена. Для решения воспользуйтесь бызовыми операторами. 
 
 
### Запросы на WHERE 
 
9. Выведите все уникальные имена клиентов, фамилия которых Джигурда. 
10. Выведите все уникальные адреса магазинов региона 5 в алфавитном порядке. 
11. Выведите все уникальные product_id, которые были проданы покупателю с customer_id = 69 14 февраля 2020 года. 
12. Выведите все пары product_id - store_id, которые купили зарегистрированные пользователи 14 февраля 2020 года. 
13. Выведите все данные по ценам, которые действовали в течение февраля 2020 года (учтите оба поля start_date и end_date). 
14. Мы хотим сделать акцию к международному дню буквы К и оценить, сколько покупателей могут праздновать этот день. Выведите все customer_id, имена и фамилии покупателей, у которых имя или фамилия начинаются с буквы К (кириллицей). 
15. Выведите все уникальные customer_id покупателей, которые совершали покупки в феврале 2020 года, в порядке возрастания. 
 
 
### Запросы на агрегирующие функции и GROUP BY 
 
16. Посчитайте количество магазинов в регионе 5. Выведите единственное число. 
17. Выведите средннюю цену каждого товара за 2020 год в виде product_id - avg_price, где avg_price - это название колонки со средней ценой. Отсортируйте выборку в порядке возрастания product_id. 
18. Мы хотим изучить, в какие дни у нас было больше всего продаж. Выведите пары дата - количество продаж в те дни, когда их было больше 186000. 
19. Выведите количество дней, в которые количество продаж было больше 186000. 
20. Выведите количество продаж по месяцам в 2020 году. Формат вывода: двузначный номер месяца - количество продаж. 
21. Выведите самый популярный product_id среди незарегистрированных клиентов. 
22. Посчитайте количество однофамильцев для каждой фамилии. Выведите колонки surname, n, где n - это название колонки с количеством людей. 
