# Практика №1
# Базовый SQL

In [None]:
!pip install ipython-sql #не обязательно запускать в colab

Collecting jedi>=0.16 (from ipython->ipython-sql)
  Downloading jedi-0.19.2-py2.py3-none-any.whl.metadata (22 kB)
Downloading jedi-0.19.2-py2.py3-none-any.whl (1.6 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.6/1.6 MB[0m [31m21.0 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: jedi
Successfully installed jedi-0.19.2


In [None]:
%load_ext sql
%sql sqlite://
%config SqlMagic.style = '_DEPRECATED_DEFAULT'

In [None]:
%%sql
SELECT 'Hello, world';

 * sqlite://
Done.


"'Hello, world'"
"Hello, world"


Пара замечаний:
 * Мы используем веб-интерфейс для python, поэтому для запуска SQL запросов необходимо применить ряд вещей:
     * Необходимо подключить расширение SQL через так называемые magic command. [Более подробно здесь](https://ipython.readthedocs.io/en/stable/interactive/magics.html)
     * Для работы с SQL надо вызвать либо %sql для однострочной команды, либо %%sql - для многострочной
     * При использовании выражения SELECT результатом вывода является таблица, но при этом в notebook выводится уже внутреннее представление языка python (объект класса sql.run.resultset, подробности далее), что приводит к ряду несоответствий (например, None вместо NULL)

Давайте создадим таблицу, заполним ее и сделаем какой-нибудь запрос!

## CREATE TABLE, INSERT

In [None]:
%%sql

DROP TABLE IF EXISTS Product;

CREATE TABLE Product(
       pname        varchar(20) PRIMARY KEY,  -- имя продукта
       price        money DEFAULT 0,          -- цена продукта; money = decimal(n,2)
       category     char(20),                 -- категория товара
       manufacturer varchar(20) NOT NULL      -- производитель
);

 * sqlite://
Done.
Done.


[]

Особенности SQLite:
https://www.sqlite.org/datatype3.html

Типы данных:
* TEXT
* NUMERIC
* INTEGER
* REAL
* BLOB

In [None]:
%%sql

INSERT INTO Product (pname, price, category, manufacturer) values
('Тетрадь', 39.99, 'Канцелярия', 'Академия холдинг');

INSERT INTO Product values('Клавиатура', 949.99, 'Техника', 'Sven');

INSERT INTO Product
    values ('Степлер', 129.99, 'Канцелярия', 'Brauberg'),
           ('Батарейка', 39.99, 'Для дома', 'Krona'),
           ('Лампочка', 89.70, 'Для дома', 'Energolux');

 * sqlite://
1 rows affected.
1 rows affected.
3 rows affected.


[]

In [None]:
%%sql
insert into product (pname, category) values ('Веб-камера', 'Техника');

 * sqlite://
(sqlite3.IntegrityError) NOT NULL constraint failed: Product.manufacturer
[SQL: insert into product (pname, category) values ('Веб-камера', 'Техника');]
(Background on this error at: https://sqlalche.me/e/20/gkpj)


In [None]:
%%sql
insert into product (pname, manufacturer) values ('Веб-камера', 'Sven');

 * sqlite://
1 rows affected.


[]

Посмотрим на полученную таблицу.

In [None]:
%sql select * from product;

 * sqlite://
Done.


pname,price,category,manufacturer
Тетрадь,39.99,Канцелярия,Академия холдинг
Клавиатура,949.99,Техника,Sven
Степлер,129.99,Канцелярия,Brauberg
Батарейка,39.99,Для дома,Krona
Лампочка,89.7,Для дома,Energolux
Веб-камера,0.0,,Sven


In [None]:
%%sql
INSERT INTO Product
    values ('Батарейка', 50, 'Для дома', 'Energizer');

 * sqlite://
(sqlite3.IntegrityError) UNIQUE constraint failed: Product.pname
[SQL: INSERT INTO Product
    values ('Батарейка', 50, 'Для дома', 'Energizer');]
(Background on this error at: https://sqlalche.me/e/20/gkpj)


Иногда бывает полезно применять UNIQUE при создании атрибута

## Немного SQL терминологии
* _имя_ таблицы - product.
* Каждая строка таблицы называется _строкой_ или _кортежем_.
* Заметьте, что все кортежи имеют _поля_ или _атрибуты_.
* Количество строк называет _мощностью_, в то время как количество атрибутов _арностью_

## Простые запросы
* Рассмотрим SQL-запросы на примерах


> SELECT <Множество атрибутов><br>
> FROM <список таблиц и условие на соединение><br>
> WHERE <список условий>

Это простейший SELECT-FROM-WHERE (SFW) блок

In [None]:
%%sql
SELECT *
FROM Product
WHERE category = 'Канцелярия' AND manufacturer = 'Brauberg';

 * sqlite://
Done.


pname,price,category,manufacturer
Степлер,129.99,Канцелярия,Brauberg


\* \- обозначает вывод всех полей, которые были описаны в поле FROM

Посмотрим на примеры *проекции*, то есть получим только несколько атрибутов запроса.

In [None]:
%%sql
SELECT Pname,
       Price,
       Manufacturer
  FROM Product;

 * sqlite://
Done.


pname,price,manufacturer
Тетрадь,39.99,Академия холдинг
Клавиатура,949.99,Sven
Степлер,129.99,Brauberg
Батарейка,39.99,Krona
Лампочка,89.7,Energolux
Веб-камера,0.0,Sven


На выходе *все еще* таблица и ее схема -
> Answer(pname, price, manufacturer)

Можно объединять выборку и проекцию + менять результат

In [None]:
%%sql
SELECT Pname, Price * 2 as newname, Manufacturer
FROM Product
WHERE category in ('Техника', 'Канцелярия');

 * sqlite://
Done.


pname,newname,manufacturer
Тетрадь,79.98,Академия холдинг
Клавиатура,1899.98,Sven
Степлер,259.98,Brauberg


In [None]:
%%sql
SELECT pname || '->' || price || '->' || manufacturer as product_concat
FROM Product
WHERE category = 'Техника';

 * sqlite://
Done.


product_concat
Клавиатура->949.99->Sven


На выходе запроса к таблице - снова таблица

In [None]:
%%sql
SELECT manufacturer, price
FROM Product p0
WHERE p0.price < 100.00;

 * sqlite://
Done.


manufacturer,price
Академия холдинг,39.99
Krona,39.99
Energolux,89.7
Sven,0.0


Вложенный запрос

In [None]:
%%sql
SELECT *
FROM
    (SELECT p0.manufacturer, price
     FROM Product p0
     WHERE p0.price < 100.00) p1 -- вложенный запрос
WHERE manufacturer = "Krona"

 * sqlite://
Done.


manufacturer,price
Krona,39.99


Небольшие детали
--------------

* Некоторые элементы регистро-независимые:
  * Одно и то же: SELECT,  Select, select
  * Одно и то же: Product,    product
  * Разные: "Техника",  "техника" (Здесь это строковая константа)



## LIKE



Регулярные выражения (упрощенный вариант)

Опертор LIKE нужен для поиска строк:
    
> SELECT *
> FROM Products
> WHERE pname like '%подстрока%'

* % - сколько угодно символов
* \_ ровно один символ
* оператор LIKE - регистрозависимый

In [None]:
%%sql
SELECT * FROM product
where category LIKE '%ка%';

 * sqlite://
Done.


pname,price,category,manufacturer
Клавиатура,949.99,Техника,Sven


In [None]:
%%sql
SELECT * FROM product
where pname LIKE '_а%';

 * sqlite://
Done.


pname,price,category,manufacturer
Батарейка,39.99,Для дома,Krona
Лампочка,89.7,Для дома,Energolux


## Убрать дубли

Дубли не всегда хорошо, и иногда их стоит убирать
  * Помните, что таблицы - _мультимножества_!

In [None]:
%%sql
SELECT category from product;

 * sqlite://
Done.


category
Канцелярия
Техника
Канцелярия
Для дома
Для дома
""


In [None]:
%%sql
-- чтобы убрать дубли используйте слово DISTINCT
SELECT DISTINCT category from product;

 * sqlite://
Done.


category
Канцелярия
Техника
Для дома
""


In [None]:
%%sql
-- чтобы убрать дубли используйте слово DISTINCT
SELECT DISTINCT category, price from product;

 * sqlite://
Done.


category,price
Канцелярия,39.99
Техника,949.99
Канцелярия,129.99
Для дома,39.99
Для дома,89.7
,0.0


## Сортировка результатов



Так как таблица в SQL - это мультимножество строк, то порядок вывода строк не гарантирован. Иногда необходимо выводить строки в определенном порядке

In [None]:
%%sql
-- сортировка результатов
-- сортировка по умолчанию - ascending
SELECT   pname, price, manufacturer
FROM     Product
WHERE    price < 400
ORDER BY price, manufacturer;

 * sqlite://
Done.


pname,price,manufacturer
Веб-камера,0.0,Sven
Батарейка,39.99,Krona
Тетрадь,39.99,Академия холдинг
Лампочка,89.7,Energolux
Степлер,129.99,Brauberg


In [None]:
%%sql
-- сортировка результатов
-- тип сортировки каждого компонента определяется индивидуально
SELECT   price, manufacturer
FROM     Product
ORDER BY manufacturer ASC, price DESC;

 * sqlite://
Done.


price,manufacturer
129.99,Brauberg
89.7,Energolux
39.99,Krona
949.99,Sven
0.0,Sven
39.99,Академия холдинг


Можно делать сортировку по порядковому номеру, но довольно часто это считается bad practice

In [None]:
%%sql
SELECT   price, manufacturer
FROM     Product
ORDER BY 2 ASC, 1 DESC;

 * sqlite://
Done.


price,manufacturer
129.99,Brauberg
89.7,Energolux
39.99,Krona
949.99,Sven
0.0,Sven
39.99,Академия холдинг


## Ограничение и смещение

Вывести топ 3 товара по дороговизне

In [None]:
%%sql
SELECT * FROM Product
ORDER BY price DESC
LIMIT 3;

 * sqlite://
Done.


pname,price,category,manufacturer
Клавиатура,949.99,Техника,Sven
Степлер,129.99,Канцелярия,Brauberg
Лампочка,89.7,Для дома,Energolux


Вывести 2, 3 и 4 товары по алфавиту

In [None]:
%%sql
SELECT * FROM Product
ORDER BY pname
LIMIT 3 OFFSET 1;

 * sqlite://
Done.


pname,price,category,manufacturer
Веб-камера,0.0,,Sven
Клавиатура,949.99,Техника,Sven
Лампочка,89.7,Для дома,Energolux


## Группировка


Можно осуществлять схлопывание строк в рамках каких-нибудь групп

После схлопывания к группам можно применять агрегатные функции

AVG(<поле>)

SUM(<поле>)

MIN(<поле>)

MAX(<поле>)

COUNT(<поле>)

COUNT(*)

AVG(distinct <поле>)

SUM(distinct <поле>)

COUNT(distinct <поле>)

In [None]:
%%sql
select category, avg(price), min(price), max(price), sum(price)
from Product
group by category;

 * sqlite://
Done.


category,avg(price),min(price),max(price),sum(price)
,0.0,0.0,0.0,0.0
Для дома,64.845,39.99,89.7,129.69
Канцелярия,84.99000000000001,39.99,129.99,169.98000000000002
Техника,949.99,949.99,949.99,949.99


Существует возможность фильтровать не только по строкам, но и по группам. Для этого можно использовать инструкцию HAVING

In [None]:
%%sql
select category, avg(price), min(price), max(price), count(price)
from Product
group by category
having min(price) > 100;

 * sqlite://
Done.


category,avg(price),min(price),max(price),count(price)
Техника,949.99,949.99,949.99,1


In [None]:
%%sql
select category, count(*) as star, count(category) as cat, count(distinct category) as dist
from Product
group by category;

 * sqlite://
Done.


category,star,cat,dist
,1,0,0
Для дома,2,2,1
Канцелярия,2,2,1
Техника,1,1,1


count(*) - кол-во строк

count(<поле>) - кол-во непустых строк

count(distinct <поле>) - кол-во уникальных непустых строк

## Работа с NULL

In [None]:
%%sql
select *
from Product
where category != NULL;

 * sqlite://
Done.


pname,price,category,manufacturer


In [None]:
%%sql
select *
from Product
where category = NULL;

 * sqlite://
Done.


pname,price,category,manufacturer


In [None]:
%%sql
select *
from Product
where category is NULL;

 * sqlite://
Done.


pname,price,category,manufacturer
Веб-камера,0,,Sven


In [None]:
%%sql
select *
from Product
where category is not NULL;

 * sqlite://
Done.


pname,price,category,manufacturer
Тетрадь,39.99,Канцелярия,Академия холдинг
Клавиатура,949.99,Техника,Sven
Степлер,129.99,Канцелярия,Brauberg
Батарейка,39.99,Для дома,Krona
Лампочка,89.7,Для дома,Energolux


In [None]:
%%sql
drop table if exists numbers;

create table numbers(a int, b int);

insert into numbers
  values (1,2), (2,3), (4,null), (null,null), (null,5);

 * sqlite://
Done.
Done.
5 rows affected.


[]

In [None]:
%%sql
select * from numbers;

 * sqlite://
Done.


a,b
1.0,2.0
2.0,3.0
4.0,
,
,5.0


In [None]:
%%sql
select sum(a+b) as sum1,
       sum(a) + sum(b) as sum2
       from numbers;

 * sqlite://
Done.


sum1,sum2
8,17


In [None]:
%%sql
select a || '+' || b as concat
       from numbers;

 * sqlite://
Done.


concat
1+2
2+3
""
""
""


In [None]:
%%sql
select *
  from numbers
where a>0;

 * sqlite://
Done.


a,b
1,2.0
2,3.0
4,
