# `PostgreSQL`

<img src='img/pglogo.png' width=500>

https://www.enterprisedb.com/downloads/postgres-postgresql-downloads

pip install psycopg2

___
## <center> <a>Метакоманды PostgresSQL</a>

|Команда | Описание|
|:--|:--|
|`\l`|Вывод списка баз данных|
|`\c` _название БД_|Подключение к базе данных|
|`\dt`|Получить список всех таблиц в базе данных|
|`\dg`|Получить список всех пользователей и ролей|

___
## <center> <a>Типы данных PostgreSQL</a>

`Числовые типы данных`

|Тип | Псевдоним |Описание| 
|:--|:--|:--|
| serial | | автоинкрементирующееся числовое значение, используется для определения идентификаторов строки  |
| smallint |int2 |хранит числа от -32 768 до +32 767|
|  integer |int, int4 |  хранит числа от -2 147 483 648 до +2 147 483 647 |
| bigint  |int8   |хранит числа от -9 223 372 036 854 775 808 до +9 223 372 036 854 775 807|
| numeric  |  decimal |хранит числа с фиксированной точностью, которые могут иметь до 131 072 знаков в целой части и до 16 383 знаков после запятой |
| real  |  float4 |хранит числа с плавающей точкой из диапазона от 1E-37 до 1E+37|
| double precision  |  float8 |хранит числа с плавающей точкой из диапазона от 1E-307 до 1E+308|

`Символьные  типы данных`

|Тип | Псевдоним |Описание| 
|:--|:--|:--|
| character(n)|char(n) | строка из `фиксированного` количества символов|
|character varying(n) |varchar(n) | строку из `переменной` длины|
| text| |текст произвольной длины. |

`Дата и время`

|Тип |Описание| 
|:--|:--|
| timestamp|  Для дат самое нижнее значение — 4713 г. до н. э., самое верхнее значение — 294 276 г. н. э.|
|date | дата от 4713 г. до н. э. до 5 874 897 г. н | 
|time |  время с точностью до 1 микросекунды без указания часового пояса, от 00:00:00 до 24:00:00| 
| interval| временной интервал| 

- `boolean` : логический тип (true/false)

___
## <center> <a>Логические операторы</a>

`Логические операторы`

|Оператор |Используется| 
|:--|:--|
| ALL| сравнение значения со всеми значениями в другом наборе|
|AND |Допускает существование множества условий в инструкции WHERE--|
|ANY |сравнение значения с любым применимым значением в списке в соответствии с условием |
|BETWEEN |поиск значений, находящихся в пределах набора значений, с учетом минимального и максимального значения |
|EXISTS |проверка, существует ли в указанной таблице строка, которая соответствует определенному критерию |
|IN | сравнение значения со списком уникальных литеральных значений|
|LIKE |  сравнение значения с аналогичными значениями с помощью подстановочных операторов|
| NOT| Меняет на противоположный смысл логического оператора, с которым используется|
|OR | объединение нескольких условий в инструкции WHERE|
|IS NULL | сравнение значения со значением NULL|
|UNIQUE |  проверка каждой строки в указанной таблице на уникальность|

___
## <center> <a>Операторы времени</a>

`Операторы времени`

|Функция |Возвращаемый тип данных| Описание|
|:--|:--|:--|
|CURRENT_DATE|DATE|Возвращает текущую дату |
|CURRENT_TIME |TIMESTAMPTZ | Возвращает текущее время|
|CURRENT_TIMESTAMP | TIMESTAMPTZ| Возвращает текущую дату и время с указанием часового пояса, в котором начинается текущая транзакция|
| DATE_PART|DOUBLE PRECISION	 |Возвращает значение временной метки или интервала — например, год, месяц, день и т. д. |
| DATE_TRUNC| TIMESTAMP|Возвращает временную метку, усеченную с заданной точностью |
| EXTRACT|DOUBLE PRECISION	 | Аналогично DATE_PART() |
|NOW |TIMESTAMPTZ|Возвращает дату и время с указанием часового пояса, в котором начинается текущая транзакция |

`Арифметика операторов времени`
|Арифметика операторов |Возвращаемый тип данных| Описание|
|:--|:--|:--|
|date + integer |date | Добавление количества дней к дате|
| date + interval|timestamp | Добавление интервала к дате|
|date + time |timestamp | Добавление времени суток к дате|
|interval + interval  |interval | Добавление интервалов|
|timestamp + interval  |timestamp | Добавление интервала к метке времени|
|time + interval | time|Добавление интервала ко времени |
| date - date|integer | Вычитаем даты, получая количество прошедших дней|
|date - integer |date | Вычитание количества дней из даты|
|date - interval | timestamp|Вычитание интервала из даты |
| time - time| interval| Вычитание времени|
|time - interval  |time | Вычитание интервала из времени|
| timestamp - interval| timestamp| Вычитание интервала из метки времени|
| interval - interval |interval |Вычитание интервалов |
|timestamp - timestamp |interval | Вычитание временных меток (преобразование 24-часовых интервалов в дни, аналогично justify_hours())|

`Временные константы`
|Константа |Описание|
|:--|:--|
| epoch | возвращает нулевое время отчета Unix-систем |
| infinity | возвращает дату, которая, находится позже любой другой даты |
|today,  now | возвращают текущую дату |
| current_date, current_timestamp | возвращают текущую дату |
| tomorrow | возвращает дату завтрашнего дня |
| yesterday | возвращает дату вчерашнего дня |

`date_trunc` - округляет дату

- microseconds — до микросекунд;
- second — до секунд;
- minute — до минут;
- hour — до часов;
- day — до дней;
- week — до недели;
- month — до месяца;
- quarter — до квартала;
- year — до года;
- decade — до десятилетия;




In [None]:
select 
	date_trunc('month', transaction_date ::date)
from "transaction" t 

___
## <center> <a>Операторы выбора данных</a>

Порядок операторов:

<img src='img/select order.png' width=700>

$\boxed{\text{LIMIT}}$ - ограничение кол-ва записей

In [None]:
select * from transaction
limit 2

$\boxed{\text{WHERE}}$ - выбор по условию

In [24]:
select * from transaction
where product_class = 'low' and  list_price > 100

$\boxed{\text{Агрегатная ф-ция}}$ - $\boxed{\text{GROUP BY}}$ - $\boxed{\text{HAVING}}$ - объединение записей с одинаковыми свойствами и применяет агрегатные функции

In [None]:
select brand, count(*) as Количество  from transaction
group by brand
having count(*)  > 2

$\boxed{\text{ORDER BY}}$ - выбор столбца для сортировки

In [25]:
select * from transaction
where product_class = 'low' and  list_price > 100 
order by list_price

$\boxed{\text{LIKE}}$ - выбор значения по шаблону

- % : заменяет все символы
- _ : заменяет один символ

In [None]:
select * from transaction 
where product_id ::varchar like '%0'

$\boxed{\text{DISTINCT}}$ - выбор уникальных значений

In [None]:
select distinct customer_id from transaction

$\boxed{\text{CASE}}$ -  $\boxed{\text{WHEN}}$ - $\boxed{\text{THEN}}$ - $\boxed{\text{END}}$ - создание колонки со значениями по условию

In [None]:
select list_price 
,case
    when list_price < 100
    then '1'
    when list_price > 1000
    then '3'
    else '2'
end new_column
from transaction

___
## <center> <a>Подзапросы</a>

$\boxed{\text{Правила написания подзапросов}}$

- Подзапросы  заключены в `круглые скобки`
- У подзапроса может быть только `один столбец` в предложении SELECT, если в основном запросе `нет нескольких столбцов` для подзапроса для сравнения его выбранных столбцов.
- ORDER BY `нельзя использовать` в подзапросе
- Оператор BETWEEN не может использоваться `с подзапросом`, но может использоваться `в подзапросе`

$\boxed{\text{SELECT по подзапросу}}$

In [None]:
select * from transaction
where customer_id in 
(select  customer_id from transaction
where list_price > 1000)

$\boxed{\text{INSERT по подзапросу}}$

In [None]:
insert into transaction_BKP
select * from transaction
where transaction_id in 
(select transaction_id from transaction)

$\boxed{\text{UPDATE по подзапросу}}$

In [None]:
update transaction_BKP
set standard_cost = standard_cost * 2
where transaction_id in 
(select transaction_id from transaction
where transaction_id < 10)

$\boxed{\text{DELETE по подзапросу}}$

In [None]:
delete from transaction_BKP
where transaction_id in 
(select transaction_id from transaction_BKP
where transaction_id < 10)

___
## <center> <a>Множественное объединение</a>

`Правила множественного объединения` :

- Число столбцов во всех запросах должно быть `одинаковым`
- Столбцы должны иметь `одинаковый тип`
- Название полей  берется из названий полей `первого запроса`.

$\boxed{\text{UNION}}$ - объединяет запросы с `одинаковой` структурой, `удаляя` дубликаты

In [None]:
SELECT FirstName, LastName, 'Employee' AS Type -- столбец Employee заменен на Type
FROM employees
UNION
SELECT FirstName, LastName, 'Customer'
FROM customers
ORDER BY FirstName, LastName;
-- данные из столбца Customer, в итоговом запросе, добавятся в Type

$\boxed{\text{UNION ALL}}$ - объединяет запросы с `одинаковой` структурой, `не удаляя` дубликаты

In [None]:
select * from transaction_1
union all
select * from transaction_2

___
## <center> <a>Объединение таблиц</a>

<img src='img/joins.png'>

- $\boxed{\text{LEFT JOIN}}$ - возвращаются все элементы из таблицы А и элементы из В, которые есть в А.

- $\boxed{\text{INNER JOIN}}$ - возвращаются те строки, которые находятся и в таблице А, и в таблице В

- $\boxed{\text{FULL OUTER JOIN}}$ - возвращаются все строки из таблиц А и В

In [None]:
select  customer.customer_id,transaction_date, transaction_id, list_price from customer
left join transaction 
on customer.customer_id = transaction.customer_id

___
## <center> <a>Группировка данных</a>

$\boxed{\text{Агрегатная ф-ция}}$ - $\boxed{\text{GROUP BY}}$ - $\boxed{\text{HAVING}}$ - объединение записей с одинаковыми свойствами и применяет агрегатные функции

Число строк сокращается и становится равной кол-ву образованных групп

`Агрегатные` функции :

- `count`() : кол-во строк
- `sum`() : суммаа значений
- `min`() : минимальное значение
- `max`() : максимальное значение
- `avg`() : среднее значение


In [None]:
SELECT transaction_date
, count(*)
, min(list_price)
, max(list_price)
, sum(list_price)
, avg(list_price)
FROM transaction
where product_class = 'low'
group by transaction_date
having count(*) < 50
order by min(list_price), max(list_price)

___
## <center> <a>Оконные функции</a>

Функция , которая создает новый столбец с вычисленными значениями по определенному столбцу (группе столбцов) таблицы, не меняя кол-во строк таблицы

$\boxed{\text{Оконная ф-ция}}$ - $\boxed{\text{OVER}}$ -  $\Big (\boxed{\text{PARTITION BY}}\Big )$

`Ранжирующие оконные` функции :

- `ROW_NUMBER` : порядковая нумерация строк
- `NTILE` : вводится кол-во групп при определении функции и общее кол-во строк разбивается на это кол-во групп
- `RANK` : нумерует по значению, при совпадающих значениях назначает одинаковый ранг, следующий ранг выводит исходя из кол-ва одинаковых значений
    - `Кол-во строк` для расчета функции определяется после `PARTITION BY`
    - `Значения` для ранжирования определяются после `ORDER BY`
- `DENSE_RANK` : нумерует по значению, следующий ранг после повторного, выводит вне зависимости от кол-ва одинаковых значений


In [None]:
SELECT transaction_date, customer_id
,row_number() over (partition by customer_id order by transaction_date)
,rank() over (partition by customer_id order by transaction_date)
,dense_rank () over (partition by customer_id order by transaction_date)
,ntile (2) over (partition by customer_id order by transaction_date)
FROM transaction
where customer_id between 1 and 3

`Агрегатные` функции :

- `count`() : кол-во строк
- `sum`() : суммаа значений
- `min`() : минимальное значение
- `max`() : максимальное значение
- `avg`() : среднее значение

При указания ORDER BY считаются `по-порядку` значения агрегатных функций 

ЕСЛИ ORDER BY не указан, то функции считаются по всему окну и все значения одинаковы

In [None]:
SELECT transaction_date, customer_id, list_price 
,count(list_price) over (partition by customer_id order by transaction_date)
,sum(list_price) over (partition by customer_id order by transaction_date)
,min (list_price) over (partition by customer_id order by transaction_date)
,avg (list_price) over (partition by customer_id order by transaction_date)
FROM transaction
where customer_id = 3

Функции `смещения`:

- `LAG`() : выводится предыдущее значение в столбце, (можно задать кол-во значений назад)
- `LEAD`() : выводится следующее значение в столбце, (можно задать кол-во значений вперед)
- `FIRST_VALUE`() : первое значение в столбце для окна
- `LAST_VALUE`() : последнее значение в столбце для окна
    - Для последнего значения в окне : `range between current row and unbounded following`

In [None]:
SELECT transaction_date, customer_id, list_price 
,lag(list_price, 2) over (partition by customer_id order by transaction_date)
,lead(list_price, 2) over (partition by customer_id order by transaction_date)
,first_value  (list_price) over (partition by customer_id order by transaction_date)
,last_value  (list_price) over (partition by customer_id order by transaction_date range between current row and unbounded following)
FROM transaction
where customer_id = 3 or customer_id = 2

`Аналитические` функции :

- `CUME_DIST` : кумулятивное распределение значений (0 - 1)
- `PERCENT_RANK` :  относительный ранг значений (0 - 1)
- `PERCENTILE_CONT` : вычисляет процентиль на основе постоянного распределения значения столбца.
- `PERCENTILE_DISC` : вычисляет заданный процентиль для отсортированных значений в наборе данных.

In [None]:
SELECT transaction_date, customer_id, list_price 
,cume_dist () over (partition by customer_id order by transaction_date)
,percent_rank () over (partition by customer_id order by transaction_date)
FROM transaction
where customer_id = 3 or customer_id = 2

In [None]:
select  
	percentile_cont(0.5) within group (order by t.list_price) 
	, percentile_disc(0.5) within group (order by t.list_price)
from "transaction" t 

___
## <center> <a>Временные таблицы</a>

`Табличное выражения (CTE)`

$\boxed{\text{WITH}}$ - $\text{название}$ -$\boxed{\text{AS}}$ - $\Big (\text{запрос}\Big )$

In [None]:
with table_name as(
select t.customer_id, t.list_price
from "transaction" t 
)
select * from table_name

`Представление (view)`

$\boxed{\text{CREATE}}$ - $\boxed{\text{VIEW}}$ - $\text{название}$ - $\boxed{\text{AS}}$ - ${\text{запрос}}$

In [None]:
create view view_name as 
select t.customer_id, t.list_price
from "transaction" t; 

select * from view_name

`Временная таблица (temporary table)`

$\boxed{\text{CREATE}}$ - $\boxed{\text{TEMP}}$ - $\boxed{\text{TABLE}}$ -  $\text{название}$ - $\boxed{\text{AS}}$ - ${\text{запрос}}$

In [None]:
create temp table temp_table_name as
select t.customer_id, t.list_price
from "transaction" t;

select * from temp_table_name

___
## <center> <a>План запроса</a>

$\boxed{\text{EXPLAIN}}$ - ${\text{запрос}}$
- `без скобок` : минимальная информация и сам план запроса
- `(ANALYSE)` :  разбивка по времени планирования и времени выполнения
- `(ANALYSE, BUFFERS)` : получение числа строк, читаемых из кэша и диска
- `(ANALYSE, BUFFERS, VERBOSE)` : более подробное получение числа строк, читаемых из кэша и диска
- `(ANALYSE,BUFFERS,VERBOSE,FORMAT JSON)` : выводит план в нужном формате, в данном случае — JSON

In [None]:
explain(ANALYSE, BUFFERS, VERBOSE)
select * from "transaction" t2   
where list_price  = (select  max(list_price)  from "transaction" t)

___
## <center><a>Работа в Python</a>

____
### <a>Подключение к БД</a>

$\boxed{.connect}$
|Параметр |Описание| 
|:--|:--|
|dbname | имя базы данных|
|user |имя пользователя |
|password | пароль пользователя|
|host |хост/адрес сервера |
|port |порт (если не указано, то используется порт по умолчанию — 5432) |

In [1]:
import psycopg2 as pg

conn=pg.connect(
    dbname='postgres',
      user='postgres',
        password= '19435504',
          host='localhost',
          port='5432' )

cursor=conn.cursor()

____
### Методы объекта <a> connection</a>
|Метод |Описание| 
|:--|:--|
|cursor() | Запросы к БД |
|commit() | Подтверждение запроса|
|rollback() | Откатить совершенный запрос|
|close() | Закрыть подключение|

____
### Методы объекта <a>cursor</a>

|Метод |Описание| 
|:--|:--|
|execute() | Выполнение инструкции |
| executemany()| Выполняет параметризированную инструкцию|
| callproc()|Выполняет хранимую функцию |
|fetchone() | Возвращает следующую строку из полученного из БД набора строк в виде кортежа|
|fetchmany() |Возвращает набор строк в виде списка |
|fetchall() | Возвращает все (оставшиеся) строки в виде списка|
|scroll() |перемещает курсор в наборе на позицию value |
 


____
### <center><a>Работа с данными</a>

____
### <a>Создание данных</a>

$\boxed{\text{Создание таблицы}}$

In [86]:
cursor.execute(
    '''
create table 
if not exists 
table_name(
key serial , name varchar, amount float
)
'''
)
conn.commit()

$\boxed{\text{Создание объекта}}$

In [87]:
cursor.execute(
'''
insert into table_name 
values(1, 'U1', 1.2), (2, 'U2', 2.1), (3, 'U3', 3.3)
'''
    )
conn.commit()

$\boxed{\text{Создание колонки}}$

In [88]:
cursor.execute(
'''
alter table table_name
add column added_column boolean
'''
    )
conn.commit()

____
### <a>Изменение данных</a>

$\boxed{\text{Изменение названия таблицы}}$

In [89]:
cursor.execute(
'''
alter table table_name
rename  to table_renamed
'''
    )
conn.commit()

$\boxed{\text{Изменение названия столбца}}$

In [92]:
cursor.execute(
'''
alter table table_renamed
rename  column added_column to renamed_column
'''
    )
conn.commit()

$\boxed{\text{Изменение объекта}}$

In [93]:
cursor.execute(
'''
update table_renamed
set renamed_column = true
where key < 10
'''
    )
conn.commit()

$\boxed{\text{Изменение типа данных}}$

In [100]:
cursor.execute(
'''
alter table table_renamed
alter  column amount type int
'''
    )
conn.commit()

#### <a style='color:gray'>Создание таблицы для последующего удаления</a>

In [94]:
cursor.execute(
'''
create table if not exists table_to_drop(info int)
'''
    )
conn.commit()


____
### <a>Удаление данных</a>
$\boxed{\text{Удаление таблицы}}$

In [96]:
cursor.execute(
'''
drop table if exists table_to_drop
'''
    )
conn.commit()

$\boxed{\text{Удаление объекта}}$

In [101]:
cursor.execute(
'''
delete from table_renamed
where key=2
'''
    )
conn.commit()

`trancate table название таблицы` - удалить данные таблицы (с сохранением структуры таблицы)

$\boxed{\text{Удаление столбца}}$

In [102]:
cursor.execute(
'''
alter table table_renamed
drop  column renamed_column
'''
    )
conn.commit()

____
### <a>Извлечение данных</a>
$\boxed{\text{Возвращение всех объектов таблицы}}$

In [2]:
cursor.execute('select * from table_renamed')
cursor.fetchall()


[(1, 'U1', 1), (3, 'U3', 3)]

____
### <center> <a>Пользователи</a>

____
###  <a>Создание пользователей</a>

In [28]:
cursor.execute(
    '''create user new_user
       password '123' '''
    )

conn.commit()


____
###  <a>Возвращение пользователей</a>

In [119]:
cursor.execute(
    '''select * from pg_catalog.pg_user '''
    )
cursor.fetchall()

[('postgres', 10, True, True, True, True, '********', None, None),
 ('new_user', 16495, False, False, False, False, '********', None, None)]

____
###  <a>Удаление пользователей</a>

In [27]:
cursor.execute(
    '''drop user new_user '''
    )

conn.commit()

____
###  <a>Создание прав пользователей</a>

$\boxed{\text{Список прав}}$

In [121]:
cursor.execute(
    '''grant 
    select, update, insert, delete
    on  table_renamed
    to new_user'''
    )
conn.commit()


$\boxed{\text{Все права для таблицы}}$

In [3]:
cursor.execute(
    '''grant 
    all privileges
    on  table_renamed
    to new_user'''
    )
conn.commit()


$\boxed{\text{Все права для схемы таблиц}}$


In [24]:
cursor.execute(
    '''grant 
    all privileges
    on  all tables in schema public
    to new_user'''
    )
conn.commit()

$\boxed{\text{Все права для схемы таблиц с выдачей прав}}$

In [29]:
cursor.execute(
    '''grant 
    all privileges
    on  all tables in schema public
    to new_user
    with grant option'''
    )
conn.commit()

____
###  <a>Откат прав пользователей</a>

$\boxed{\text{Всех прав для таблицы}}$

In [26]:
cursor.execute(
    '''revoke all
    on  table_renamed
    from new_user'''
    )
conn.commit()

$\boxed{\text{Всех прав для схемы таблиц}}$

In [25]:
cursor.execute(
    '''revoke all
    on schema public
    from new_user'''
    )
conn.commit()