In [13]:
import sqlite3
import pandas as pd

In [64]:
%config SqlMagic.displaycon = False  #отключает вывод результатов запроса через PrettyTable

# КУРС_1

#### Полезные источники

https://www.dofactory.com/sql/where-in  
https://www.w3schools.com/sql/sql_like.asp#:~:text=The%20LIKE%20operator%20is%20used,(_)%20represents%20one%2C%20single%20character  
https://www.postgresql.org/docs/9.5/functions-aggregate.html

In [2]:
#pip install ipython_sql

%load_ext sql

#### Коннектимся (создаем базу)

In [3]:
%sql sqlite:///D:/test.db

#### Создаем таблицу

Удаляем таблицу, если она существует.

In [19]:
%%sql

DROP TABLE IF EXISTS EXAMPLE

 * sqlite:///D:/test.db
Done.


[]

Создадим таблицу, где будем хранить yes/no для is_married:

In [4]:
%%sql

CREATE TABLE IF NOT EXISTS is_marrieds(
    ID int PRIMARY KEY,
    title tinytext    
);

 * sqlite:///D:/test.db
Done.


[]

In [5]:
%%sql
INSERT INTO is_marrieds (ID, title) VALUES
(1, 'yes'),
(2, 'no');

 * sqlite:///D:/test.db
2 rows affected.


[]

In [6]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM is_marrieds;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df_is_marrieds = pd.read_sql_query(query, conn)
conn.close()

df_is_marrieds

Unnamed: 0,ID,title
0,1,yes
1,2,no


Создаем таблицу, если она не существует.

In [7]:
%%sql

CREATE TABLE IF NOT EXISTS EXAMPLE(
    ID int PRIMARY KEY,
    name tinytext NOT NULL,       
    age int NOT NULL,
    start_work_at date,
    email tinytext UNIQUE,
    is_married_id tinytext,
    FOREIGN KEY (is_married_id) REFERENCES is_marrieds(id)
);

 * sqlite:///D:/test.db
Done.


[]

PRIMARY KEY - в SQLite для реализации автоинкрементного столбца (обычно для первичного ключа) используется ключевое слово PRIMARY KEY. Это означает, что при добавлении новых строк, ID будет добавляться автоматически.  
При создании таблицы мы указываем название столбца, тип данных, а также значения по умолчанию.

#### Наполняем таблицу

In [8]:
%%sql
INSERT INTO EXAMPLE VALUES(1, 'Stas', 38, 'yes', '2025-03-15', 'sad@ref.ru');
INSERT INTO EXAMPLE VALUES(2,'Jul', 35, 'yes', '2025-07-16', 'jad@ref.ru');
INSERT INTO EXAMPLE VALUES(3,'Michael', 28, 'no', '2024-02-19', 'mad@ref.ru');
INSERT INTO EXAMPLE VALUES(4,'Jax', 43, 'yes', '2024-05-09', 'jaad@ref.ru');
INSERT INTO EXAMPLE VALUES(5,'Sara', 39, 'yes', '2025-06-12', 'ssad@ref.ru');
INSERT INTO EXAMPLE VALUES(6,'Jesyca', 25, 'no', '2025-08-24', 'jjad@ref.ru');
INSERT INTO EXAMPLE VALUES(7,'Cavin', 50, 'yes', '2025-09-13', 'cad@ref.ru');
INSERT INTO EXAMPLE VALUES(8,'Pit Didi', 44, 'yes', '2025-10-05', 'pad@ref.ru');
INSERT INTO EXAMPLE VALUES(9,'Kruz', 23, 'no', '2025-11-18', 'kad@ref.ru');
INSERT INTO EXAMPLE VALUES(10,'Ann', 36, 'yes', '2025-12-30', 'aad@ref.ru');

 * sqlite:///D:/test.db
1 rows affected.
1 rows affected.
1 rows affected.
1 rows affected.
1 rows affected.
1 rows affected.
1 rows affected.
1 rows affected.
1 rows affected.
1 rows affected.


[]

Другой вариант:

In [8]:
%%sql
INSERT INTO EXAMPLE (ID, name, age, start_work_at, email, is_married_id) VALUES
(1, 'Stas', 38, '2025-03-15', 'sad@ref.ru', 1),
(2,'Jul', 35, '2025-07-16', 'jad@ref.ru', 1),
(3,'Michael', 28, '2024-02-19', 'mad@ref.ru', 2),
(4,'Jax', 43, '2024-05-09', 'jaad@ref.ru', 1),
(5,'Sara', 39, '2025-06-12', 'ssad@ref.ru', 1),
(6,'Jesyca', 25, '2025-08-24', 'jjad@ref.ru', 2),
(7,'Cavin', 50, '2025-09-13', 'cad@ref.ru', 1),
(8,'Pit Didi', 44, '2025-10-05', 'pad@ref.ru', 1),
(9,'Kruz', 23, '2025-11-18', 'kad@ref.ru', 2),
(10,'Ann', 36, '2025-12-30', 'aad@ref.ru', 1);

 * sqlite:///D:/test.db
10 rows affected.


[]

#### Выгружаем таблицу в DF

In [9]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,age,start_work_at,email,is_married_id
0,1,Stas,38,2025-03-15,sad@ref.ru,1
1,2,Jul,35,2025-07-16,jad@ref.ru,1
2,3,Michael,28,2024-02-19,mad@ref.ru,2
3,4,Jax,43,2024-05-09,jaad@ref.ru,1
4,5,Sara,39,2025-06-12,ssad@ref.ru,1
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2
6,7,Cavin,50,2025-09-13,cad@ref.ru,1
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1
8,9,Kruz,23,2025-11-18,kad@ref.ru,2
9,10,Ann,36,2025-12-30,aad@ref.ru,1


In [10]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM is_marrieds;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,title
0,1,yes
1,2,no


#### JOIN

Делаем JOIN is_marrieds к основной таблице

In [11]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE JOIN is_marrieds ON EXAMPLE.is_married_id = is_marrieds.id;"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,age,start_work_at,email,is_married_id,ID.1,title
0,1,Stas,38,2025-03-15,sad@ref.ru,1,1,yes
1,2,Jul,35,2025-07-16,jad@ref.ru,1,1,yes
2,3,Michael,28,2024-02-19,mad@ref.ru,2,2,no
3,4,Jax,43,2024-05-09,jaad@ref.ru,1,1,yes
4,5,Sara,39,2025-06-12,ssad@ref.ru,1,1,yes
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,2,no
6,7,Cavin,50,2025-09-13,cad@ref.ru,1,1,yes
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1,1,yes
8,9,Kruz,23,2025-11-18,kad@ref.ru,2,2,no
9,10,Ann,36,2025-12-30,aad@ref.ru,1,1,yes


#### Изменение данных в таблице

Изменяем в таблице возраст на 36 у строки с ID = 2.

In [30]:
%sql UPDATE EXAMPLE SET age = 36 WHERE ID = 2;

conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

 * sqlite:///D:/test.db
1 rows affected.


Unnamed: 0,ID,name,age,start_work_at,email,is_married_id
0,1,Stas,38,2025-03-15,sad@ref.ru,1
1,2,Jul,36,2025-07-16,jad@ref.ru,1
2,3,Michael,28,2024-02-19,mad@ref.ru,2
3,4,Jax,43,2024-05-09,jaad@ref.ru,1
4,5,Sara,39,2025-06-12,ssad@ref.ru,1
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2
6,7,Cavin,50,2025-09-13,cad@ref.ru,1
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1
8,9,Kruz,23,2025-11-18,kad@ref.ru,2
9,10,Ann,36,2025-12-30,aad@ref.ru,1


Изменяем несколько значений по ID = 3.

In [40]:
%%sql 
UPDATE EXAMPLE SET age = 27, is_married_id = 2, start_work_at = '2025-09-16' WHERE ID = 3;

 * sqlite:///D:/test.db
1 rows affected.


[]

In [41]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,age,start_work_at,email,is_married_id
0,1,Stas,38,2025-03-15,sad@ref.ru,1
1,2,Jul,36,2025-07-16,jad@ref.ru,1
2,3,Michael,27,2025-09-16,mad@ref.ru,2
3,4,Jax,43,2024-05-09,jaad@ref.ru,1
4,5,Sara,39,2025-06-12,ssad@ref.ru,1
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2
6,7,Cavin,50,2025-09-13,cad@ref.ru,1
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1
8,9,Kruz,23,2025-11-18,kad@ref.ru,2
9,10,Ann,36,2025-12-30,aad@ref.ru,1


In [12]:
conn = sqlite3.connect('D:/test.db')
cursor = conn.cursor()

try:
    # Обновление записи
    update_query = "UPDATE EXAMPLE SET age = 27, is_married_id = 2, start_work_at = '2025-09-16' WHERE ID = 3;"
    cursor.execute(update_query)
    conn.commit()  # Важно зафиксировать изменения!

    # Выборка обновленной записи
    select_query = "SELECT * FROM EXAMPLE WHERE ID = 3;"
    cursor.execute(select_query)
    data = cursor.fetchall() # Получаем данные
    column_names = [description[0] for description in cursor.description] # Получаем имена столбцов

    df = pd.DataFrame(data, columns=column_names)  # Создаем DataFrame

    #df

except sqlite3.Error as e:
    print(f"An error occurred: {e}")
    conn.rollback()  # Откатываем транзакцию в случае ошибки

finally:
    conn.close()

df

Unnamed: 0,ID,name,age,start_work_at,email,is_married_id
0,3,Michael,27,2025-09-16,mad@ref.ru,2


#### Выводим таблицу с определенными столбцами и условиями

In [13]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT name, age, is_married_id FROM EXAMPLE WHERE name like 'A%' OR age > 30;"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,name,age,is_married_id
0,Stas,38,1
1,Jul,35,1
2,Jax,43,1
3,Sara,39,1
4,Cavin,50,1
5,Pit Didi,44,1
6,Ann,36,1


#### Изменение названия столбца в таблице

In [14]:
%sql ALTER TABLE EXAMPLE RENAME COLUMN age TO ages;

conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

 * sqlite:///D:/test.db
Done.


Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id
0,1,Stas,38,2025-03-15,sad@ref.ru,1
1,2,Jul,35,2025-07-16,jad@ref.ru,1
2,3,Michael,27,2025-09-16,mad@ref.ru,2
3,4,Jax,43,2024-05-09,jaad@ref.ru,1
4,5,Sara,39,2025-06-12,ssad@ref.ru,1
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2
6,7,Cavin,50,2025-09-13,cad@ref.ru,1
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1
8,9,Kruz,23,2025-11-18,kad@ref.ru,2
9,10,Ann,36,2025-12-30,aad@ref.ru,1


#### Сортировка по столбцам в таблице
ASC - ascending (сортировка по возрастанию).  
DESC - descending (сортировка по убыванию).

1.  SELECT *: Выбирает все столбцы из таблицы EXAMPLE.
2.  FROM EXAMPLE: Указывает, из какой таблицы выбирать данные.
3.  ORDER BY ID ASC, ages DESC: Сортирует результаты следующим образом:
    •   Сначала сортирует по столбцу ID по возрастанию (ASC).  Это означает, что строки с меньшими значениями ID будут идти первыми.
    •   Внутри каждой группы строк с одинаковым значением ID, сортирует по столбцу ages по убыванию (DESC).  Это означает, что строки с большими значениями ages будут идти первыми внутри каждой группы ID.

In [15]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE ORDER BY is_married_id ASC, ages DESC;"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id
0,7,Cavin,50,2025-09-13,cad@ref.ru,1
1,8,Pit Didi,44,2025-10-05,pad@ref.ru,1
2,4,Jax,43,2024-05-09,jaad@ref.ru,1
3,5,Sara,39,2025-06-12,ssad@ref.ru,1
4,1,Stas,38,2025-03-15,sad@ref.ru,1
5,10,Ann,36,2025-12-30,aad@ref.ru,1
6,2,Jul,35,2025-07-16,jad@ref.ru,1
7,3,Michael,27,2025-09-16,mad@ref.ru,2
8,6,Jesyca,25,2025-08-24,jjad@ref.ru,2
9,9,Kruz,23,2025-11-18,kad@ref.ru,2


#### Count and Groupby  

In [16]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT is_married_id, COUNT(ages) AS cnt FROM EXAMPLE GROUP BY is_married_id;"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,is_married_id,cnt
0,1,7
1,2,3


#### Sum 

In [17]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT is_married_id, SUM(ages) AS summ FROM EXAMPLE GROUP BY is_married_id;"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,is_married_id,summ
0,1,285
1,2,75


#### MIN, MAX

Берем столбец is_married, считаем минимум по возрасту, группируем по is_married и сортируем по убыванию.

In [18]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT is_married_id, MIN(ages) AS ages FROM EXAMPLE GROUP BY is_married_id ORDER BY ages DESC;"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,is_married_id,ages
0,1,35
1,2,23


In [19]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT MAX(ages) FROM EXAMPLE;"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,MAX(ages)
0,50


#### Добавление и удаление строк  

Добавляем:

In [20]:
%%sql
INSERT INTO EXAMPLE VALUES(11, 'Roland', 15, '2023-04-18', 'rad@ref.ru', 2);

 * sqlite:///D:/test.db
1 rows affected.


[]

In [21]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id
0,1,Stas,38,2025-03-15,sad@ref.ru,1
1,2,Jul,35,2025-07-16,jad@ref.ru,1
2,3,Michael,27,2025-09-16,mad@ref.ru,2
3,4,Jax,43,2024-05-09,jaad@ref.ru,1
4,5,Sara,39,2025-06-12,ssad@ref.ru,1
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2
6,7,Cavin,50,2025-09-13,cad@ref.ru,1
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1
8,9,Kruz,23,2025-11-18,kad@ref.ru,2
9,10,Ann,36,2025-12-30,aad@ref.ru,1


Удаляем:

In [54]:
%sql DELETE FROM EXAMPLE WHERE name = 'Roland'

conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

 * sqlite:///D:/test.db
1 rows affected.


Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id
0,1,Stas,38,2025-03-15,sad@ref.ru,1
1,2,Jul,36,2025-07-16,jad@ref.ru,1
2,3,Michael,27,2025-09-16,mad@ref.ru,2
3,4,Jax,43,2024-05-09,jaad@ref.ru,1
4,5,Sara,39,2025-06-12,ssad@ref.ru,1
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2
6,7,Cavin,50,2025-09-13,cad@ref.ru,1
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1
8,9,Kruz,23,2025-11-18,kad@ref.ru,2
9,10,Ann,36,2025-12-30,aad@ref.ru,1


#### Добавление столбца 

In [22]:
%sql ALTER TABLE EXAMPLE ADD COLUMN text tinytext DEFAULT 'нет данных';

conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

 * sqlite:///D:/test.db
Done.


Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text
0,1,Stas,38,2025-03-15,sad@ref.ru,1,нет данных
1,2,Jul,35,2025-07-16,jad@ref.ru,1,нет данных
2,3,Michael,27,2025-09-16,mad@ref.ru,2,нет данных
3,4,Jax,43,2024-05-09,jaad@ref.ru,1,нет данных
4,5,Sara,39,2025-06-12,ssad@ref.ru,1,нет данных
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,нет данных
6,7,Cavin,50,2025-09-13,cad@ref.ru,1,нет данных
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1,нет данных
8,9,Kruz,23,2025-11-18,kad@ref.ru,2,нет данных
9,10,Ann,36,2025-12-30,aad@ref.ru,1,нет данных


#### Удаление столбца

In [28]:
%sql ALTER TABLE EXAMPLE DROP COLUMN text;

conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

 * sqlite:///D:/test.db
Done.


Unnamed: 0,ID,name,ages,is_married,start_work_at,email
0,1,Stas,38,yes,2025-03-15,sad@ref.ru
1,2,Jul,36,yes,2025-07-16,jad@ref.ru
2,3,Michael,27,yes,2025-09-16,mad@ref.ru
3,4,Jax,43,yes,2024-05-09,jaad@ref.ru
4,5,Sara,39,yes,2025-06-12,ssad@ref.ru
5,6,Jesyca,25,no,2025-08-24,jjad@ref.ru
6,7,Cavin,50,yes,2025-09-13,cad@ref.ru
7,8,Pit Didi,44,yes,2025-10-05,pad@ref.ru
8,9,Kruz,23,no,2025-11-18,kad@ref.ru
9,10,Ann,36,yes,2025-12-30,aad@ref.ru


#### Модификация типа данных 

In [58]:
%sql ALTER TABLE EXAMPLE MODIFY COLUMN ages float;

conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

 * sqlite:///D:/test.db
(sqlite3.OperationalError) near "MODIFY": syntax error
[SQL: ALTER TABLE EXAMPLE MODIFY COLUMN ages float;]
(Background on this error at: https://sqlalche.me/e/20/e3q8)


Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text
0,1,Stas,38,2025-03-15,sad@ref.ru,1,нет данных
1,2,Jul,36,2025-07-16,jad@ref.ru,1,нет данных
2,3,Michael,27,2025-09-16,mad@ref.ru,2,нет данных
3,4,Jax,43,2024-05-09,jaad@ref.ru,1,нет данных
4,5,Sara,39,2025-06-12,ssad@ref.ru,1,нет данных
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,нет данных
6,7,Cavin,50,2025-09-13,cad@ref.ru,1,нет данных
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1,нет данных
8,9,Kruz,23,2025-11-18,kad@ref.ru,2,нет данных
9,10,Ann,36,2025-12-30,aad@ref.ru,1,нет данных


In [23]:
%sql ALTER TABLE EXAMPLE ADD COLUMN ages_float float DEFAULT 0;

conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

 * sqlite:///D:/test.db
Done.


Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,1,Stas,38,2025-03-15,sad@ref.ru,1,нет данных,0.0
1,2,Jul,35,2025-07-16,jad@ref.ru,1,нет данных,0.0
2,3,Michael,27,2025-09-16,mad@ref.ru,2,нет данных,0.0
3,4,Jax,43,2024-05-09,jaad@ref.ru,1,нет данных,0.0
4,5,Sara,39,2025-06-12,ssad@ref.ru,1,нет данных,0.0
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,нет данных,0.0
6,7,Cavin,50,2025-09-13,cad@ref.ru,1,нет данных,0.0
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1,нет данных,0.0
8,9,Kruz,23,2025-11-18,kad@ref.ru,2,нет данных,0.0
9,10,Ann,36,2025-12-30,aad@ref.ru,1,нет данных,0.0


In [24]:
%sql UPDATE EXAMPLE SET ages_float = ages;

conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

 * sqlite:///D:/test.db
11 rows affected.


Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,1,Stas,38,2025-03-15,sad@ref.ru,1,нет данных,38.0
1,2,Jul,35,2025-07-16,jad@ref.ru,1,нет данных,35.0
2,3,Michael,27,2025-09-16,mad@ref.ru,2,нет данных,27.0
3,4,Jax,43,2024-05-09,jaad@ref.ru,1,нет данных,43.0
4,5,Sara,39,2025-06-12,ssad@ref.ru,1,нет данных,39.0
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,нет данных,25.0
6,7,Cavin,50,2025-09-13,cad@ref.ru,1,нет данных,50.0
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1,нет данных,44.0
8,9,Kruz,23,2025-11-18,kad@ref.ru,2,нет данных,23.0
9,10,Ann,36,2025-12-30,aad@ref.ru,1,нет данных,36.0


#### DISTINCT (дубли)

In [25]:
%%sql
INSERT INTO EXAMPLE VALUES(12, 'Rivaldo', 27, '2023-04-18', 'riad@ref.ru', 1, 'нет данных', 27.0);
INSERT INTO EXAMPLE VALUES(13, 'Ronaldo', 44, '2022-04-04', 'rrrad@ref.ru', 2, 'нет данных', 44.0);
INSERT INTO EXAMPLE VALUES(14, 'Roma', 15, '2021-06-18', 'road@ref.ru', 1, 'нет данных', 15.0);

 * sqlite:///D:/test.db
1 rows affected.
1 rows affected.
1 rows affected.


[]

In [26]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,1,Stas,38,2025-03-15,sad@ref.ru,1,нет данных,38.0
1,2,Jul,35,2025-07-16,jad@ref.ru,1,нет данных,35.0
2,3,Michael,27,2025-09-16,mad@ref.ru,2,нет данных,27.0
3,4,Jax,43,2024-05-09,jaad@ref.ru,1,нет данных,43.0
4,5,Sara,39,2025-06-12,ssad@ref.ru,1,нет данных,39.0
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,нет данных,25.0
6,7,Cavin,50,2025-09-13,cad@ref.ru,1,нет данных,50.0
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1,нет данных,44.0
8,9,Kruz,23,2025-11-18,kad@ref.ru,2,нет данных,23.0
9,10,Ann,36,2025-12-30,aad@ref.ru,1,нет данных,36.0


In [27]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT DISTINCT ages FROM EXAMPLE;"  # Выведи таблицу со всеми столбцами или любой другой запрос
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ages
0,38
1,35
2,27
3,43
4,39
5,25
6,50
7,44
8,23
9,36


#### AND OR NOT

In [28]:
conn = sqlite3.connect('D:/test.db')
query = """SELECT * FROM EXAMPLE 
           WHERE ages > 15 AND is_married_id > 1 OR name like 'R%';"""
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,3,Michael,27,2025-09-16,mad@ref.ru,2,нет данных,27.0
1,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,нет данных,25.0
2,9,Kruz,23,2025-11-18,kad@ref.ru,2,нет данных,23.0
3,11,Roland,15,2023-04-18,rad@ref.ru,2,нет данных,15.0
4,12,Rivaldo,27,2023-04-18,riad@ref.ru,1,нет данных,27.0
5,13,Ronaldo,44,2022-04-04,rrrad@ref.ru,2,нет данных,44.0
6,14,Roma,15,2021-06-18,road@ref.ru,1,нет данных,15.0


In [29]:
conn = sqlite3.connect('D:/test.db')
query = """SELECT * FROM EXAMPLE 
           WHERE name NOT like 'R%';"""
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,1,Stas,38,2025-03-15,sad@ref.ru,1,нет данных,38.0
1,2,Jul,35,2025-07-16,jad@ref.ru,1,нет данных,35.0
2,3,Michael,27,2025-09-16,mad@ref.ru,2,нет данных,27.0
3,4,Jax,43,2024-05-09,jaad@ref.ru,1,нет данных,43.0
4,5,Sara,39,2025-06-12,ssad@ref.ru,1,нет данных,39.0
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,нет данных,25.0
6,7,Cavin,50,2025-09-13,cad@ref.ru,1,нет данных,50.0
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1,нет данных,44.0
8,9,Kruz,23,2025-11-18,kad@ref.ru,2,нет данных,23.0
9,10,Ann,36,2025-12-30,aad@ref.ru,1,нет данных,36.0


In [30]:
conn = sqlite3.connect('D:/test.db')
query = """SELECT * FROM EXAMPLE 
           WHERE NOT ages = 15;"""
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,1,Stas,38,2025-03-15,sad@ref.ru,1,нет данных,38.0
1,2,Jul,35,2025-07-16,jad@ref.ru,1,нет данных,35.0
2,3,Michael,27,2025-09-16,mad@ref.ru,2,нет данных,27.0
3,4,Jax,43,2024-05-09,jaad@ref.ru,1,нет данных,43.0
4,5,Sara,39,2025-06-12,ssad@ref.ru,1,нет данных,39.0
5,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,нет данных,25.0
6,7,Cavin,50,2025-09-13,cad@ref.ru,1,нет данных,50.0
7,8,Pit Didi,44,2025-10-05,pad@ref.ru,1,нет данных,44.0
8,9,Kruz,23,2025-11-18,kad@ref.ru,2,нет данных,23.0
9,10,Ann,36,2025-12-30,aad@ref.ru,1,нет данных,36.0


#### ORDER LIMIT

Вытаскиваем 3 наибольших возраста и сортируем их по убыванию.

In [33]:
conn = sqlite3.connect('D:/test.db')
query = """SELECT * FROM EXAMPLE 
           ORDER BY ages DESC LIMIT 3;"""
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,7,Cavin,50,2025-09-13,cad@ref.ru,1,нет данных,50.0
1,8,Pit Didi,44,2025-10-05,pad@ref.ru,1,нет данных,44.0
2,13,Ronaldo,44,2022-04-04,rrrad@ref.ru,2,нет данных,44.0


#### Среднее (AVG)

In [32]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT AVG(ages) FROM EXAMPLE;"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,AVG(ages)
0,32.928571


#### Количество (COUNT)

In [34]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT COUNT(ages) FROM EXAMPLE;"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,COUNT(ages)
0,14


#### LIKE

Необходимо обязательно брать в % % (в любом месте) часть слова, по которому мы хотим вывести таблицу.

In [35]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE WHERE name LIKE '%sy%';"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,нет данных,25.0


Символ _ показывает скоьлко должно идти символов после части слова.

In [36]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE WHERE name LIKE 'Ro_____';"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,13,Ronaldo,44,2022-04-04,rrrad@ref.ru,2,нет данных,44.0


#### IN

In [37]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE WHERE ages IN (36, 23, 15);"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,9,Kruz,23,2025-11-18,kad@ref.ru,2,нет данных,23.0
1,10,Ann,36,2025-12-30,aad@ref.ru,1,нет данных,36.0
2,11,Roland,15,2023-04-18,rad@ref.ru,2,нет данных,15.0
3,14,Roma,15,2021-06-18,road@ref.ru,1,нет данных,15.0


#### BETWEEN

In [38]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM EXAMPLE WHERE ages BETWEEN 15 AND 35;"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,2,Jul,35,2025-07-16,jad@ref.ru,1,нет данных,35.0
1,3,Michael,27,2025-09-16,mad@ref.ru,2,нет данных,27.0
2,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,нет данных,25.0
3,9,Kruz,23,2025-11-18,kad@ref.ru,2,нет данных,23.0
4,11,Roland,15,2023-04-18,rad@ref.ru,2,нет данных,15.0
5,12,Rivaldo,27,2023-04-18,riad@ref.ru,1,нет данных,27.0
6,14,Roma,15,2021-06-18,road@ref.ru,1,нет данных,15.0


#### GROUP BY

In [39]:
conn = sqlite3.connect('D:/test.db')
query = """SELECT COUNT(is_married_id), is_married_id FROM EXAMPLE 
           GROUP BY is_married_id;"""
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,COUNT(is_married_id),is_married_id
0,9,1
1,5,2


#### EXISTS

In [40]:
conn = sqlite3.connect('D:/test.db')
query = """SELECT * FROM EXAMPLE 
           WHERE EXISTS( SELECT ID FROM is_marrieds WHERE EXAMPLE.is_married_id = is_marrieds.ID AND ID = 2);"""
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,3,Michael,27,2025-09-16,mad@ref.ru,2,нет данных,27.0
1,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,нет данных,25.0
2,9,Kruz,23,2025-11-18,kad@ref.ru,2,нет данных,23.0
3,11,Roland,15,2023-04-18,rad@ref.ru,2,нет данных,15.0
4,13,Ronaldo,44,2022-04-04,rrrad@ref.ru,2,нет данных,44.0


#### ANY, SOME

Такой запрос не работает:

"""SELECT * FROM EXAMPLE 
           WHERE is_married_id = SOME (
               SELECT ID FROM is_marrieds WHERE ID = 2
           );"""  

Необходимо просто оставить равно:

"""SELECT * FROM EXAMPLE 
           WHERE is_married_id = (
               SELECT ID FROM is_marrieds WHERE ID = 2
           );"

In [41]:
conn = sqlite3.connect('D:/test.db')
query = """SELECT * FROM EXAMPLE 
           WHERE is_married_id = (
               SELECT ID FROM is_marrieds WHERE ID = 2
           );"""
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,3,Michael,27,2025-09-16,mad@ref.ru,2,нет данных,27.0
1,6,Jesyca,25,2025-08-24,jjad@ref.ru,2,нет данных,25.0
2,9,Kruz,23,2025-11-18,kad@ref.ru,2,нет данных,23.0
3,11,Roland,15,2023-04-18,rad@ref.ru,2,нет данных,15.0
4,13,Ronaldo,44,2022-04-04,rrrad@ref.ru,2,нет данных,44.0


#### INSERT INTO

In [129]:
%%sql

DROP TABLE IF EXISTS new_table

Done.


[]

In [42]:
%%sql

CREATE TABLE IF NOT EXISTS new_table(
    ID int PRIMARY KEY,
    name tinytext NOT NULL,       
    ages int NOT NULL,
    start_work_at date,
    email tinytext UNIQUE,
    is_married_id tinytext,
    text tinytext,
    ages_float float,
    FOREIGN KEY (is_married_id) REFERENCES is_marrieds(id)
);

 * sqlite:///D:/test.db
Done.


[]

In [43]:
%%sql
INSERT INTO new_table 
SELECT * FROM EXAMPLE
WHERE ages > 33;

 * sqlite:///D:/test.db
8 rows affected.


[]

In [44]:
conn = sqlite3.connect('D:/test.db')
query = "SELECT * FROM new_table"
df = pd.read_sql_query(query, conn)
conn.close()

df

Unnamed: 0,ID,name,ages,start_work_at,email,is_married_id,text,ages_float
0,1,Stas,38,2025-03-15,sad@ref.ru,1,нет данных,38.0
1,2,Jul,35,2025-07-16,jad@ref.ru,1,нет данных,35.0
2,4,Jax,43,2024-05-09,jaad@ref.ru,1,нет данных,43.0
3,5,Sara,39,2025-06-12,ssad@ref.ru,1,нет данных,39.0
4,7,Cavin,50,2025-09-13,cad@ref.ru,1,нет данных,50.0
5,8,Pit Didi,44,2025-10-05,pad@ref.ru,1,нет данных,44.0
6,10,Ann,36,2025-12-30,aad@ref.ru,1,нет данных,36.0
7,13,Ronaldo,44,2022-04-04,rrrad@ref.ru,2,нет данных,44.0


# КУРС_2

#### Библиотеки

In [2]:
import pandas as pd
import psycopg2  # Импортируем psycopg2import psycopg2
import pandas as pd
from sqlalchemy import create_engine

#### Структура запроса

In [None]:
# Структура запроса

SELECT 'столбцы или * для выбора всех столбцов; обязательно'

FROM 'таблица; обязательно'

WHERE 'условие/фильтрация, например, city = 'Moscow'; необязательно'

GROUP BY 'столбец, по которому хотим сгруппировать данные; необязательно'

HAVING 'условие/фильтрация на уровне сгруппированных данных; необязательно'

ORDER BY 'столбец, по которому хотим отсортировать вывод; необязательно'

In [None]:
DECIMAL(4,1) # число с плавающей запятой - 4 знака впереди и 1 после запятой
NUMERIC(6,3) # число с плавающей запятой - 6 знака впереди и 3 после запятой
VARCHAR(10) # текст длиной 10 символов

![image.png](attachment:783b719f-a9a1-40be-bb7c-d83611acda7a.png)

#### Подключение к БД

In [3]:
# Один из вариантов подключения к БД
# Импорты
import psycopg2
import pandas as pd
from sqlalchemy import create_engine

# Подключение через magic command в Jupyter
%load_ext sql
connection_string = "postgresql://postgres:admin@localhost:5432/mydatabase"
%sql $connection_string

# Подключение через SQLAlchemy
engine = create_engine(connection_string)

# Выполняем запрос и загружаем данные в DataFrame
query = "SELECT * FROM book;"
df = pd.read_sql_query(query, engine)

# Выводим результат
df

Unnamed: 0,book_id,title,author,price,amount
0,1,The Lord of the Rings,J.R.R. Tolkien,25.5,10
1,2,Pride and Prejudice,Jane Austen,15.0,5
2,3,Pride and Prejudice_2,Jane Austen,18.0,6
3,4,Pride and Prejudice_3,J.R.R. Tolkien,25.0,15
4,5,Pride and Prejudice_4,George Orwell,55.0,25
5,6,1984,George Orwell,33.75,8


In [3]:
# Загружаем extension.
%load_ext sql

In [4]:
connection_string = "postgresql://postgres:admin@localhost:5432/mydatabase"

In [5]:
%sql $connection_string

Ошибка syntax error at or near "AUTO_INCREMENT" возникает потому, что AUTO_INCREMENT — это конструкция MySQL, а не PostgreSQL. В PostgreSQL для автоматической генерации последовательных ID используется тип данных SERIAL.  
SERIAL:  Заменяет INT PRIMARY KEY AUTO_INCREMENT. SERIAL — это сокращение для создания последовательности (sequence) и установки значения по умолчанию для столбца на следующее значение из этой последовательности.  Он также автоматически создает индекс.

Ты повторяешь ту же ошибку, что и раньше. Ошибка SyntaxError: invalid syntax в строке INSERT INTO book (title, author, price, amount) VALUES возникает из-за отступа. %%sql должна быть первой строкой в ячейке, а остальной SQL-код не должен иметь отступов.

In [5]:
# Параметры подключения
dbname = "mydatabase"
user = "postgres"
password = "admin"  # Замени на свой пароль
host = "localhost"
port = "5432"

# Устанавливаем соединение с базой данных PostgreSQL
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

# Создаем курсор для выполнения SQL-запросов
cursor = conn.cursor()

#### Создание таблицы и вывод

In [23]:
%%sql
DROP TABLE IF EXISTS book

 * postgresql://postgres:***@localhost:5432/mydatabase
Done.


[]

In [24]:
%%sql
CREATE TABLE IF NOT EXISTS book (
    book_id SERIAL PRIMARY KEY,
    title VARCHAR(50),
    author VARCHAR(30),
    price DECIMAL(8, 2),
    amount INT
);

 * postgresql://postgres:***@localhost:5432/mydatabase
Done.


[]

In [25]:
%%sql
INSERT INTO book (title, author, price, amount) 
VALUES
    ('Мастер и Маргарита', 'Булгаков М.А.', 670.99, 3),
    ('Белая гвардия', 'Булгаков М.А.', 540.50, 5),
    ('Идиот', 'Достоевский Ф.М.', 460.00, 10),
    ('Братья Карамазовы', 'Достоевский Ф.М.', 799.01, 2),
    ('Стихотворения и поэмы', 'Есенин С.А.', 650.00, 15);

 * postgresql://postgres:***@localhost:5432/mydatabase
5 rows affected.


[]

In [13]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)
# SQL-запрос
query = "SELECT * FROM book;"

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,book_id,title,author,price,amount
0,1,The Lord of the Rings,J.R.R. Tolkien,25.5,10
1,2,Pride and Prejudice,Jane Austen,15.0,5
2,3,Pride and Prejudice_2,Jane Austen,18.0,6
3,4,Pride and Prejudice_3,J.R.R. Tolkien,25.0,15
4,5,Pride and Prejudice_4,George Orwell,55.0,25
5,6,1984,George Orwell,33.75,8


#### Выбор столбцов

In [29]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = "SELECT author, title, price FROM book;"

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,author,title,price
0,J.R.R. Tolkien,The Lord of the Rings,25.5
1,Jane Austen,Pride and Prejudice,15.0
2,George Orwell,1984,18.75
3,J.R.R. Tolkien,The Lord of the Rings,25.5
4,Jane Austen,Pride and Prejudice,15.0
5,George Orwell,1984,18.75


#### Переименование столбцов

In [None]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title AS Название, author AS Автор 
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

In [31]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title AS Название, author AS Автор, price
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,Название,Автор,price
0,The Lord of the Rings,J.R.R. Tolkien,25.5
1,Pride and Prejudice,Jane Austen,15.0
2,1984,George Orwell,18.75
3,The Lord of the Rings,J.R.R. Tolkien,25.5
4,Pride and Prejudice,Jane Austen,15.0
5,1984,George Orwell,18.75


#### Выбор данных с созданием вычисляемого столбца

In [32]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title, author, price, amount, 
               price * amount AS total 
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,title,author,price,amount,total
0,The Lord of the Rings,J.R.R. Tolkien,25.5,10,255.0
1,Pride and Prejudice,Jane Austen,15.0,5,75.0
2,1984,George Orwell,18.75,8,150.0
3,The Lord of the Rings,J.R.R. Tolkien,25.5,10,255.0
4,Pride and Prejudice,Jane Austen,15.0,5,75.0
5,1984,George Orwell,18.75,8,150.0


In [36]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

p = 1.65

query = """SELECT title, author, price, amount, 
               amount * %s AS total 
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn, params=(p,))  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn, params=(p,))  # Используем pd.read_sql_query


Unnamed: 0,title,author,price,amount,total
0,The Lord of the Rings,J.R.R. Tolkien,25.5,10,16.5
1,Pride and Prejudice,Jane Austen,15.0,5,8.25
2,1984,George Orwell,18.75,8,13.2
3,The Lord of the Rings,J.R.R. Tolkien,25.5,10,16.5
4,Pride and Prejudice,Jane Austen,15.0,5,8.25
5,1984,George Orwell,18.75,8,13.2


•   query = "SELECT title, author, price, amount, amount * %s AS total FROM book;": В SQL-запросе вместо подстановки значения p непосредственно в строку, мы используем %s в качестве плейсхолдера для параметра. %s - это плейсхолдер, который psycopg2 заменит на значение параметра.  
•   df = pd.read_sql_query(query, conn, params=(p,)): В функцию pd.read_sql_query мы передаем параметр params=(p,). params должен быть кортежем. Даже если у тебя только один параметр, его нужно обернуть в кортеж (p,).  psycopg2 безопасно экранирует этот параметр и подставляет его в запрос.

In [37]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

p = 1.65
d = 2

query = """SELECT title, author, price, amount, 
               amount * %s * %s AS total 
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn, params=(p, d))  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn, params=(p, d))  # Используем pd.read_sql_query


Unnamed: 0,title,author,price,amount,total
0,The Lord of the Rings,J.R.R. Tolkien,25.5,10,33.0
1,Pride and Prejudice,Jane Austen,15.0,5,16.5
2,1984,George Orwell,18.75,8,26.4
3,The Lord of the Rings,J.R.R. Tolkien,25.5,10,33.0
4,Pride and Prejudice,Jane Austen,15.0,5,16.5
5,1984,George Orwell,18.75,8,26.4


#### Выбор данных, вычисляемые столбцы, математические функции (ROUND, SQRT и т.д.)

![image.png](attachment:3ad4d38d-5b69-4b60-b3ed-e93f0535fd11.png)

In [38]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title, price, 
               (price*18/100)/(1+18/100) AS tax, 
               price/(1+18/100) AS price_tax 
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,title,price,tax,price_tax
0,The Lord of the Rings,25.5,4.59,25.5
1,Pride and Prejudice,15.0,2.7,15.0
2,1984,18.75,3.375,18.75
3,The Lord of the Rings,25.5,4.59,25.5
4,Pride and Prejudice,15.0,2.7,15.0
5,1984,18.75,3.375,18.75


In [39]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title, 
               price, 
               ROUND((price*18/100)/(1+18/100),2) AS tax, 
               ROUND(price/(1+18/100),2) AS price_tax 
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,title,price,tax,price_tax
0,The Lord of the Rings,25.5,4.59,25.5
1,Pride and Prejudice,15.0,2.7,15.0
2,1984,18.75,3.38,18.75
3,The Lord of the Rings,25.5,4.59,25.5
4,Pride and Prejudice,15.0,2.7,15.0
5,1984,18.75,3.38,18.75


In [41]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title, author, amount, 
               ROUND(price*0.7,2) AS new_price 
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,title,author,amount,new_price
0,The Lord of the Rings,J.R.R. Tolkien,10,17.85
1,Pride and Prejudice,Jane Austen,5,10.5
2,1984,George Orwell,8,13.13
3,The Lord of the Rings,J.R.R. Tolkien,10,17.85
4,Pride and Prejudice,Jane Austen,5,10.5
5,1984,George Orwell,8,13.13


#### Выбор данных, вычисляемые столбцы, логические функции (CASE END, IF)

![image.png](attachment:82afdb02-1014-4e43-8216-186766517c17.png)

In [None]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title, amount, price, 
               IF(amount<4, price*0.5, price*0.7) AS sale
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

Такой вариант IF(amount<4, price*0.5, price*0.7) AS sale в PostgreSQL работать не будет, необходимо использовать вариант ниже:

In [44]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title, amount, price, 
               CASE
                   WHEN amount < 8 THEN price * 0.5
                   ELSE price * 0.7
               END AS sale
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,title,amount,price,sale
0,The Lord of the Rings,10,25.5,17.85
1,Pride and Prejudice,5,15.0,7.5
2,1984,8,18.75,13.125
3,The Lord of the Rings,10,25.5,17.85
4,Pride and Prejudice,5,15.0,7.5
5,1984,8,18.75,13.125


In [45]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title, amount, price, 
               ROUND(
                   CASE
                       WHEN amount <= 5 THEN price * 0.5
                       WHEN amount < 10 THEN price * 0.7
                       ELSE price * 0.9
                   END,
                   2
               ) AS sale
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,title,amount,price,sale
0,The Lord of the Rings,10,25.5,22.95
1,Pride and Prejudice,5,15.0,7.5
2,1984,8,18.75,13.13
3,The Lord of the Rings,10,25.5,22.95
4,Pride and Prejudice,5,15.0,7.5
5,1984,8,18.75,13.13


In [None]:
SELECT title, amount, price,
    ROUND(
     IF(amount < 4, price * 0.5, 
         IF(amount < 11, price * 0.7, price * 0.9)),
     2) AS sale,
    IF(amount < 4, 'скидка 50%', 
      IF(amount < 11, 'скидка 30%', 'скидка 10%')
     ) AS Ваша_скидка
FROM book;

In [None]:
SELECT author, title,
    ROUND(
     IF(author = 'Булгаков М.А.', price * 1.1, 
         IF(author = 'Есенин С.А.', price * 1.05, price * 1)),
     2) AS new_price 
FROM book;

#### Выбор данных по условию (WHERE) и логические операции (OR, AND и т.д.)

In [48]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title, author, price 
           FROM book
           WHERE price > 17 AND author = 'J.R.R. Tolkien';"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,title,author,price
0,The Lord of the Rings,J.R.R. Tolkien,25.5
1,The Lord of the Rings,J.R.R. Tolkien,25.5


In [None]:
# Вывести название, цену  тех книг, которые написал Булгаков или Есенин, ценой больше 600 рублей
SELECT title, author, price 
FROM book
WHERE (author = 'Булгаков М.А.' OR author = 'Есенин С.А.') AND price > 600;

In [None]:
# Вывести название, автора,  цену  и количество всех книг, цена которых меньше 500 или больше 600, 
# а стоимость всех экземпляров этих книг больше или равна 5000.
SELECT title, author, price, amount
FROM book
WHERE (price < 500 OR price > 600) AND price*amount >= 5000;

#### Операторы BETWEEN, IN

Логическое выражение после ключевого слова WHERE может включать операторы  BETWEEN и IN. Приоритет  у этих операторов такой же как у операторов сравнения, то есть они выполняются раньше, чем NOT, AND, OR.

Оператор BETWEEN позволяет отобрать данные, относящиеся к некоторому интервалу, включая его границы.

In [57]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title, author, price 
           FROM book
           WHERE author IN ('J.R.R. Tolkien', 'Jane Austen');"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,title,author,price
0,The Lord of the Rings,J.R.R. Tolkien,25.5
1,Pride and Prejudice,Jane Austen,15.0
2,Pride and Prejudice_2,Jane Austen,18.0
3,Pride and Prejudice_3,J.R.R. Tolkien,25.0


In [None]:
# Вывести название и авторов тех книг, цены которых принадлежат интервалу от 540.50 до 800 (включая границы),  а количество или 2, или 3, или 5, или 7.
SELECT title, author 
FROM book
WHERE (price BETWEEN 540.50 AND 800) AND (amount BETWEEN 2 AND 7);

SELECT title, author 
FROM book
WHERE (price BETWEEN 540.50 AND 800) AND (amount IN (2, 3, 5, 7));

#### Сортировка (ORDER BY)

При выборке можно указывать столбец или несколько столбцов, по которым необходимо отсортировать отобранные строки. Для этого используются ключевые слова ORDER BY, после которых задаются имена столбцов. При этом строки сортируются по первому столбцу. Если указан второй столбец, сортировка осуществляется только для тех строк, у которых значения первого столбца одинаковы. По умолчанию ORDER BY выполняет сортировку по возрастанию. Чтобы управлять направлением сортировки вручную, после имени столбца указывается ключевое слово ASC (по возрастанию) или DESC (по убыванию). 

In [58]:
# Вывести  автора и название  книг, количество которых принадлежит интервалу от 2 до 14 (включая границы). 
# Информацию  отсортировать сначала по авторам (в обратном алфавитном порядке), а затем по названиям книг (по алфавиту).

conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT author, title
           FROM book
           WHERE amount BETWEEN 2 AND 14
           ORDER BY 1 DESC, 2 ASC;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,author,title
0,Jane Austen,Pride and Prejudice
1,Jane Austen,Pride and Prejudice_2
2,J.R.R. Tolkien,The Lord of the Rings
3,George Orwell,1984


#### Оператор LIKE

Оператор LIKE используется для сравнения строк. В отличие от операторов отношения равно (=) и не равно (<>), LIKE позволяет сравнивать строки не на полное совпадение (не совпадение), а в соответствии с шаблоном. Шаблон может включать обычные символы и символы-шаблоны. При сравнении с шаблоном, его обычные символы должны в точности совпадать с символами, указанными в строке. Символы-шаблоны могут совпадать с произвольными элементами символьной строки.

![image.png](attachment:282bdf8d-9bad-481a-a062-fd4eff1da713.png)

In [None]:
# Вывести названия книг, начинающихся с буквы «Б».
SELECT title 
FROM book
WHERE title LIKE 'Б%';

In [None]:
# Вывести название книг, состоящих ровно из 5 букв.
SELECT title FROM book 
WHERE title LIKE '_____'

In [None]:
# Вывести названия книг, которые содержат букву "и" как отдельное слово, если считать, что слова в названии отделяются друг от друга пробелами 
# и не содержат знаков препинания.
SELECT title FROM book 
WHERE   title LIKE '_% и _%' /*отбирает слово И внутри названия */
    OR title LIKE 'и _%' /*отбирает слово И в начале названия */
    OR title LIKE '_% и' /*отбирает слово И в конце названия */
    OR title LIKE 'и' /* отбирает название, состоящее из одного слова И */

In [None]:
# Вывести названия книг, которые состоят ровно из одного слова, если считать, что слова в названии отделяются друг от друга пробелами.
SELECT title FROM book 
WHERE title NOT LIKE "% %"; 

Вывести название и автора тех книг, название которых состоит из двух и более слов, а инициалы автора содержат букву «С». Считать, что в названии слова отделяются друг от друга пробелами и не содержат знаков препинания, между фамилией автора и инициалами обязателен пробел, инициалы записываются без пробела в формате: буква, точка, буква, точка. Информацию отсортировать по названию книги в алфавитном порядке.

In [61]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title, author FROM book 
           WHERE (title LIKE '_% _%') AND (author LIKE '%J.%')
           ORDER BY 1 ASC;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,title,author
0,Pride and Prejudice_3,J.R.R. Tolkien
1,The Lord of the Rings,J.R.R. Tolkien


####  Выбор уникальных элементов столбца (DISTINCT)

In [9]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT DISTINCT author
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,author
0,George Orwell
1,Jane Austen
2,J.R.R. Tolkien


#### Выбор данных, групповые функции SUM и COUNT

COUNT(*) —  подсчитывает  все записи, относящиеся к группе, в том числе и со значением NULL;  
COUNT(имя_столбца) — возвращает количество записей конкретного столбца (только NOT NULL), относящихся к группе.

In [10]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """INSERT INTO book (title, author, price, amount) VALUES ('Черный человек','Есенин С.А.', Null, Null);
           SELECT author, COUNT(author), COUNT(amount), COUNT(*)
           FROM book
           GROUP BY author;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,author,count,count.1,count.2
0,George Orwell,2,2,2
1,Jane Austen,2,2,2
2,Есенин С.А.,1,0,1
3,J.R.R. Tolkien,2,2,2


In [None]:
# Посчитать, количество различных книг и количество экземпляров книг каждого автора , хранящихся на складе.  
# Столбцы назвать Автор, Различных_книг и Количество_экземпляров соответственно.
SELECT author AS Автор, 
    COUNT(title) AS Различных_книг, 
    SUM(amount) AS Количество_экземпляров
FROM book
GROUP BY author;

### Групповые функции ROUND, SUM, MIN, MAX и AVG

In [12]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT author, 
               MIN(price) AS Минимальная_цена,
               MAX(price) AS Максимальная_цена,
               AVG(price) AS Средняя_цена 
           FROM book
           GROUP BY author;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,author,Минимальная_цена,Максимальная_цена,Средняя_цена
0,George Orwell,33.75,55.0,44.375
1,Jane Austen,15.0,18.0,16.5
2,J.R.R. Tolkien,25.0,25.5,25.25


In [13]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT author, 
               ROUND(SUM(price*amount), 2) AS Стоимость,
               ROUND((SUM(price*amount)*18/100)/(1+18/100), 2) AS НДС,
               ROUND(SUM(price*amount)/(1+18/100), 2) AS Стоимость_без_НДС
           FROM book
           GROUP BY author;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,author,Стоимость,НДС,Стоимость_без_НДС
0,George Orwell,1645.0,296.1,1645.0
1,Jane Austen,183.0,32.94,183.0
2,J.R.R. Tolkien,630.0,113.4,630.0


In [15]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT ROUND(MIN(price), 2) AS Минимальная_цена, 
               ROUND(MAX(price), 2) AS Максимальная_цена,
               ROUND(AVG(price), 2) AS Средняя_цена 
           FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,Минимальная_цена,Максимальная_цена,Средняя_цена
0,15.0,55.0,28.71


### Выборка данных по условию (HAVING), групповые функции

Если в запросе с групповыми функциями отсутствует GROUP BY, то для отбора записей используется ключевое слово WHERE.

In [16]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT author,
               MIN(price) AS Минимальная_цена, 
               MAX(price) AS Максимальная_цена
           FROM book
           GROUP BY author
           HAVING SUM(price * amount) > 15 
           ORDER BY Минимальная_цена DESC;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,author,Минимальная_цена,Максимальная_цена
0,George Orwell,33.75,55.0
1,J.R.R. Tolkien,25.0,25.5
2,Jane Austen,15.0,18.0


In [17]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT ROUND(AVG(price), 2) AS Средняя_цена, 
               ROUND(SUM(price*amount), 2) AS Стоимость
           FROM book
           WHERE (amount >= 5) AND (amount <= 14);"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,Средняя_цена,Стоимость
0,23.06,708.0


### Выборка данных по условию, групповые функции (WHERE и HAVING)

Сначала определяется таблица, из которой выбираются данные (FROM), затем из этой таблицы отбираются записи в соответствии с условием  WHERE, выбранные данные агрегируются (GROUP BY),  из агрегированных записей выбираются те, которые удовлетворяют условию после HAVING. Потом формируются данные результирующей выборки, как это указано после SELECT ( вычисляются выражения, присваиваются имена и пр. ). Результирующая выборка сортируется, как указано после ORDER BY.

Важно! Порядок ВЫПОЛНЕНИЯ запросов - это не порядок ЗАПИСИ ключевых слов в запросе на выборку. Порядок записи (синтаксис запроса) остается таким же, как рассматривался ранее в курсе. Порядок ВЫПОЛНЕНИЯ  нужен для того, чтобы понять, почему, например, в WHERE нельзя использовать имена выражений из SELECT. Просто SELECT выполняется компилятором позже, чем WHERE, поэтому ему неизвестно, какое там выражение написано.

In [24]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT author,
               SUM(price * amount) AS Стоимость
           FROM book
           WHERE title NOT IN ('Идиот', 'Белая гвардия')
           GROUP BY author
           HAVING SUM(price * amount) > 200
           ORDER BY SUM(price * amount) DESC;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,author,Стоимость
0,George Orwell,1645.0
1,J.R.R. Tolkien,630.0


### Вложенный запрос

SQL позволяет создавать вложенные запросы. Вложенный запрос (подзапрос, внутренний запрос) – это запрос внутри другого запроса SQL.

Вложенный запрос используется для выборки данных, которые будут использоваться в условии отбора записей основного запроса. Его применяют для:

сравнения выражения с результатом вложенного запроса;  
определения того, включено ли выражение в результаты вложенного запроса;  
проверки того, выбирает ли запрос определенные строки.  
Вложенный запрос имеет следующие компоненты:  

ключевое слово SELECT  после которого указываются имена столбцов или выражения (чаще всего список содержит один элемент);  
ключевое слово FROM и имя таблицы, из которой выбираются данные;  
необязательное предложение WHERE;  
необязательное предложение GROUP BY:  
необязательное предложение HAVING.  
Вложенные запросы  могут включаться в WHERE или HAVING так (в квадратных скобках указаны необязательные элементы, через | – один из элементов):  

WHERE | HAVING выражение оператор_сравнения (вложенный запрос);  
WHERE | HAVING выражение, включающее вложенный запрос;  
WHERE | HAVING выражение [NOT] IN (вложенный запрос);  
WHERE | HAVING выражение  оператор_сравнения  ANY | ALL (вложенный запрос).  
Также вложенные запросы могут вставляться в основной запрос после ключевого слова SELECT.  

In [6]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT author, title, price
           FROM book
           WHERE price <= (
                    SELECT AVG(price) 
                    FROM book
                 )
           ORDER BY price DESC;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,author,title,price
0,J.R.R. Tolkien,The Lord of the Rings,25.5
1,J.R.R. Tolkien,Pride and Prejudice_3,25.0
2,Jane Austen,Pride and Prejudice_2,18.0
3,Jane Austen,Pride and Prejudice,15.0


In [9]:
# Вывести информацию (автора, название и цену) о тех книгах, цены которых превышают минимальную цену книги на складе не более 
# чем на 5 рублей в отсортированном по возрастанию цены виде.

conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT author, title, price 
           FROM book
           WHERE ABS(price - (SELECT MIN(price) FROM book)) <= 5
           ORDER BY price ASC;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,author,title,price
0,Jane Austen,Pride and Prejudice,15.0
1,Jane Austen,Pride and Prejudice_2,18.0


### Вложенный запрос, оператор IN

Оператор IN определяет, совпадает ли значение столбца с одним из значений, содержащихся во вложенном запросе. При этом логическое выражение после WHERE получает значение истина. Оператор NOT IN выполняет обратное действие – выражение истинно, если значение столбца не содержится во вложенном запросе.

In [10]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT  author, title, amount
           FROM book
           WHERE amount IN (
                   SELECT amount
                   FROM book 
                   GROUP BY amount
                   HAVING COUNT(amount) = 1
                 );"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,author,title,amount
0,J.R.R. Tolkien,The Lord of the Rings,10
1,Jane Austen,Pride and Prejudice,5
2,Jane Austen,Pride and Prejudice_2,6
3,J.R.R. Tolkien,Pride and Prejudice_3,15
4,George Orwell,Pride and Prejudice_4,25
5,George Orwell,1984,8


### Вложенный запрос, операторы ANY и ALL

Вложенный запрос, возвращающий несколько значений одного столбца, можно использовать для отбора записей с помощью операторов ANY и ALL совместно с операциями отношения (=, <>, <=, >=, <, >).

Операторы ANY и ALL используются  в SQL для сравнения некоторого значения с результирующим набором вложенного запроса, состоящим из одного столбца. При этом тип данных столбца, возвращаемого вложенным запросом, должен совпадать с типом данных столбца (или выражения), с которым происходит сравнение.

При использовании оператора ANY в результирующую таблицу будут включены все записи, для которых  выражение со знаком отношения верно хотя бы для одного элемента результирующего запроса. Как работает оператор ANY:

amount > ANY (10, 12) эквивалентно amount > 10

amount < ANY (10, 12) эквивалентно amount < 12

amount = ANY (10, 12) эквивалентно (amount = 10) OR (amount = 12), а также amount IN  (10,12)

amount <> ANY (10, 12) вернет все записи с любым значением amount, включая 10 и 12

При использовании оператора ALL в результирующую таблицу будут включены все записи, для которых  выражение со знаком отношения верно для всех элементов результирующего запроса. Как работает оператор ALL:

amount > ALL (10, 12) эквивалентно amount > 12

amount < ALL (10, 12) эквивалентно amount < 10

amount = ALL (10, 12) не вернет ни одной записи, так как эквивалентно (amount = 10) AND (amount = 12)
amount <> ALL (10, 12) вернет все записи кроме тех,  в которыхamount равно 10 или 12

Важно! Операторы ALL и ANY можно использовать только с вложенными запросами. В примерах выше (10, 12) приводится как результат вложенного запроса просто для того, чтобы показать как эти операторы работают. В запросах так записывать нельзя.

In [11]:
# Вывести информацию о книгах(автор, название, цена), цена которых меньше самой большой из минимальных цен, вычисленных для каждого автора.

conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT author, title, price
           FROM book
           WHERE price < ANY (
                   SELECT MIN(price) 
                   FROM book 
                   GROUP BY author 
                 );"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,author,title,price
0,J.R.R. Tolkien,The Lord of the Rings,25.5
1,Jane Austen,Pride and Prejudice,15.0
2,Jane Austen,Pride and Prejudice_2,18.0
3,J.R.R. Tolkien,Pride and Prejudice_3,25.0


### Вложенный запрос после SELECT

In [12]:
# Посчитать сколько и каких экземпляров книг нужно заказать поставщикам, чтобы на складе стало одинаковое количество экземпляров каждой книги, 
# равное значению самого большего количества экземпляров одной книги на складе. Вывести название книги, ее автора, текущее количество экземпляров 
# на складе и количество заказываемых экземпляров книг. Последнему столбцу присвоить имя Заказ. В результат не включать книги, которые заказывать 
# не нужно.
# Вариант 1
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title, author, amount,
                  ABS(amount - (SELECT MAX(amount) FROM book)) AS Заказ
           FROM book
           WHERE ABS(amount - (SELECT MAX(amount) FROM book)) > 0;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,title,author,amount,Заказ
0,The Lord of the Rings,J.R.R. Tolkien,10,15
1,Pride and Prejudice,Jane Austen,5,20
2,Pride and Prejudice_2,Jane Austen,6,19
3,Pride and Prejudice_3,J.R.R. Tolkien,15,10
4,1984,George Orwell,8,17


In [13]:
# Вариант 2
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """SELECT title, author, amount, Заказ
           FROM (
               SELECT title, author, amount,
                      ABS(amount - (SELECT MAX(amount) FROM book)) AS Заказ
               FROM book
           ) AS subquery
           WHERE Заказ > 0;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,title,author,amount,Заказ
0,The Lord of the Rings,J.R.R. Tolkien,10,15
1,Pride and Prejudice,Jane Austen,5,20
2,Pride and Prejudice_2,Jane Austen,6,19
3,Pride and Prejudice_3,J.R.R. Tolkien,15,10
4,1984,George Orwell,8,17


### Запросы корректировки данных

In [26]:
%%sql
CREATE TABLE IF NOT EXISTS supply (
    book_id SERIAL PRIMARY KEY,
    title VARCHAR(50),
    author VARCHAR(30),
    price DECIMAL(8, 2),
    amount INT
);

 * postgresql://postgres:***@localhost:5432/mydatabase
Done.


[]

In [27]:
%%sql
INSERT INTO supply (title, author, price, amount) 
VALUES
    ('Лирика', 'Пастернак Б.Л.', 518.99, 2),
    ('Черный человек', 'Есенин С.А.', 570.20, 6),
    ('Белая гвардия', 'Булгаков М.А.', 540.50, 7),
    ('Идиот', 'Достоевский Ф.М.', 360.80, 3);

 * postgresql://postgres:***@localhost:5432/mydatabase
4 rows affected.


[]

### Добавление записей из другой таблицы (INSERT INTO)

Правила соответствия между полями таблицы и вставляемыми значениями из запроса:

1. количество полей в таблице и количество полей в запросе должны совпадать;
2. должно существовать прямое соответствие между позицией одного и того же элемента в обоих списках, поэтому первый столбец запроса должен относиться к первому столбцу в списке столбцов таблицы, второй – ко второму столбцу и т.д.
3. при добавлении значений SQL пытает преобразовать их к типу данных поля, например, при занесении строки '1' в числовое поле, вставляемое значение преобразуется к целому числу 1, если же попытаться занести строку 'ab' в числовое поле - возникнет ошибка и строка не будет добавлена;
4. но желательно, во избежание ошибок, следовать правилу "типы данных элементов в списке значений должны быть совместимы с типами данных соответствующих столбцов таблицы" (целое число можно занести в поле типа DECIMAL, обратная операция приведет к округлению вещественного значения, что может повлиять на корректность данных);
5. новые значения не рекомендуется добавлять в поля, описанные как PRIMARY KEY AUTO_INCREMENT;
6. рекомендуется заполнять все поля записи, если же поле пропущено, значение этого поля зависит от установленных по умолчанию значений, если значения не установлены в поле вставляется пустое значение (NULL).

In [29]:
# Добавить из таблицы supply в таблицу book, все книги, кроме книг, написанных Булгаковым М.А. и Достоевским Ф.М.

conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """INSERT INTO book (title, author, price, amount) 
           SELECT title, author, price, amount 
           FROM supply
           WHERE author NOT IN ('Булгаков М.А.', 'Достоевский Ф.М.');
           
           SELECT * FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,book_id,title,author,price,amount
0,1,Мастер и Маргарита,Булгаков М.А.,670.99,3
1,2,Белая гвардия,Булгаков М.А.,540.5,5
2,3,Идиот,Достоевский Ф.М.,460.0,10
3,4,Братья Карамазовы,Достоевский Ф.М.,799.01,2
4,5,Стихотворения и поэмы,Есенин С.А.,650.0,15
5,9,Лирика,Пастернак Б.Л.,518.99,2
6,10,Черный человек,Есенин С.А.,570.2,6


In [None]:
# Занести из таблицы supply в таблицу book только те книги, названия которых отсутствуют в таблице book.
INSERT INTO book (title, author, price, amount) 
SELECT title, author, price, amount 
FROM supply
WHERE title NOT IN (
        SELECT title 
        FROM book
      );

SELECT * FROM book;

In [30]:
# Занести из таблицы supply в таблицу book только те книги, авторов которых нет в  book.

conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """INSERT INTO book (title, author, price, amount) 
           SELECT title, author, price, amount 
           FROM supply
           WHERE author NOT IN (
                   SELECT author 
                   FROM book
                 );
           
           SELECT * FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,book_id,title,author,price,amount
0,1,Мастер и Маргарита,Булгаков М.А.,670.99,3
1,2,Белая гвардия,Булгаков М.А.,540.5,5
2,3,Идиот,Достоевский Ф.М.,460.0,10
3,4,Братья Карамазовы,Достоевский Ф.М.,799.01,2
4,5,Стихотворения и поэмы,Есенин С.А.,650.0,15
5,11,Лирика,Пастернак Б.Л.,518.99,2


### Запросы на обновление

Под обновлением данных подразумевается изменение значений в существующих записях таблицы. При этом возможно как изменение значений полей в группе строк (даже всех строк таблицы), так и правка значения поля отдельной строки.  

Изменение записей в таблице реализуется с помощью запроса UPDATE. Простейший запрос на  обновление выглядит так:  

UPDATE таблица SET поле = выражение

где:  
таблица – имя таблицы, в которой будут проводиться изменения;  
поле – поле таблицы, в которое будет внесено изменение;  
выражение – выражение,  значение которого будет занесено в поле.  

In [None]:
# Уменьшить на 30% цену книг в таблице book.
UPDATE book 
SET price = 0.7 * price;

SELECT * FROM book;

# Уменьшить на 30% цену тех книг в таблице book, количество которых меньше 5.
UPDATE book 
SET price = 0.7 * price 
WHERE amount < 5;

SELECT * FROM book;

In [31]:
# Уменьшить на 10% цену тех книг в таблице book, количество которых принадлежит интервалу от 5 до 10, включая границы.

conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

query = """UPDATE book 
           SET price = 0.9 * price 
           WHERE amount BETWEEN 5 AND 10;
           
           SELECT * FROM book;"""

# Читаем данные в pandas DataFrame
df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query

# Закрываем соединение
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query, conn)  # Используем pd.read_sql_query


Unnamed: 0,book_id,title,author,price,amount
0,1,Мастер и Маргарита,Булгаков М.А.,670.99,3
1,4,Братья Карамазовы,Достоевский Ф.М.,799.01,2
2,5,Стихотворения и поэмы,Есенин С.А.,650.0,15
3,2,Белая гвардия,Булгаков М.А.,486.45,5
4,3,Идиот,Достоевский Ф.М.,414.0,10


### Запросы на обновление нескольких столбцов (добавление столбца)

Запросом UPDATE можно обновлять значения нескольких столбцов одновременно. В этом случае простейший запрос будет выглядеть так:  

UPDATE таблица SET поле1 = выражение1, поле2 = выражение2

In [50]:
conn = psycopg2.connect(dbname=dbname, user=user, password=password, host=host, port=port)

cur = conn.cursor()

query1  = """ALTER TABLE book ADD COLUMN IF NOT EXISTS buy INT DEFAULT 0;
             UPDATE book SET buy = 0 WHERE book_id = 1; 
             UPDATE book SET buy = 3 WHERE book_id = 2;
             UPDATE book SET buy = 8 WHERE book_id = 3;
             UPDATE book SET buy = 0 WHERE book_id = 4;
             UPDATE book SET buy = 18 WHERE book_id = 5;
            """

cur.execute(query1)
conn.commit()  # Важно: фиксируем изменения в базе данных

# query2 = """UPDATE book
#             SET price = IF(buy = 0, price * 0.9, price),
#                 buy = IF(buy > amount, amount, buy);
#             """

query2 = """
            UPDATE book
            SET price = CASE WHEN buy = 0 THEN price * 0.9 ELSE price END,
                buy = CASE WHEN buy > amount THEN amount ELSE buy END;
        """

cur.execute(query2)
conn.commit()  # Важно: фиксируем изменения в базе данных

# Выполняем SELECT запрос для чтения данных в DataFrame (после всех UPDATE)
query_select = "SELECT * FROM book;"
df = pd.read_sql_query(query_select, conn) # только для SELECT

# Закрываем курсор и соединение
cur.close()
conn.close()

# Выводим DataFrame
df

  df = pd.read_sql_query(query_select, conn) # только для SELECT


Unnamed: 0,book_id,title,author,price,amount,buy
0,1,Мастер и Маргарита,Булгаков М.А.,603.89,3,0
1,2,Белая гвардия,Булгаков М.А.,540.5,5,3
2,3,Идиот,Достоевский Ф.М.,460.0,10,8
3,4,Братья Карамазовы,Достоевский Ф.М.,719.11,2,0
4,5,Стихотворения и поэмы,Есенин С.А.,650.0,15,15


### Интересные запросы

In [None]:
SELECT author, 'Донцова Дарья' AS author, CONCAT_WS(' ', 'Евлампия романова и', title) AS title, ROUND(price*1.42,2) AS price
FROM book
ORDER BY author DESC, price DESC;