<a href="https://colab.research.google.com/github/Viksilio/DA_plus/blob/master/SQL_WorkShop.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

### Работу выполнил
#### Степанищев Владислав Викторович (DA16_plus)
#### https://t.me/viksilio

### Подключение библиотек

In [None]:
import pandas as pd
from sqlalchemy import create_engine 

### Конфигурация для подключения к локальной базе данных PostreSQL

In [None]:
db_config = {
    'user': 'postgres', # имя пользователя
    'pwd': '1202', # пароль
    'host': 'localhost',
    'port': 5432, # порт подключения
    'db': 'WorkShop' # название базы данных
}  

connection_string = 'postgresql://{}:{}@{}:{}/{}'.format(
    db_config['user'],
    db_config['pwd'],
    db_config['host'],
    db_config['port'],
    db_config['db'],
)

#### Создание подключения

In [None]:
engine = create_engine(connection_string) 

### Задача 1

В таблице total_sales содержится информация о сделках.  
Требуется написать SQL запрос, который к каждой транзакции добавит:
* Дату первой сделки покупателя.
* Дату предыдущей сделки покупателя.
* Покажет общее количество товаров, купленных покупателем.
* Присвоить всем сделкам покупателя / продавца порядковый номер.

In [None]:
## Решение
query='''
select *,
first_value(date) over (partition by buyer_id order by date),
LAG(date) over (partition by buyer_id order by date),
SUM(qty) over (partition by buyer_id),
DENSE_RANK() over (order by buyer_id, sales_id)
from total_sales
order by sales_id
'''

# Проверка данных
first = pd.read_sql_query(query, con=engine) 
first

Unnamed: 0,sales_id,date,buyer_id,seller_id,qty,qty_shipped,first_value,lag,sum,dense_rank
0,25651,2022-06-11,4,f,40,,2022-06-11,,110,5
1,34489,2022-06-18,1,f,30,,2022-04-12,2022-04-12,40,1
2,36044,2022-07-07,2,g,10,10.0,2022-07-06,2022-07-06,80,3
3,40494,2022-04-12,1,m,10,10.0,2022-04-12,,40,2
4,83056,2022-07-06,2,m,70,,2022-07-06,,80,4
5,96498,2022-07-19,4,e,70,70.0,2022-06-11,2022-06-11,110,6


### Задача 2

#### Запрос 1


Схема базы данных
![image.png](attachment:image.png)

Составьте запросы к базе, отвечающие на вопросы:  
* Для каждого покупателя найдите магазин, в котором он совершил
наибольшее количество покупок.  
* Найдите всех покупателей, которые в каждом полном месяце этого года
совершали не менее 3 покупок.  

In [None]:
## Решение
query='''
with count_sales as (
select count(s.sales_id) over(partition by customer_id, s.store_id) as cnt, s.store_id, s.customer_id
from sales s
order by cnt desc, customer_id desc)
select distinct store_nm, customer_id
from (select first_value(store_id) over (partition by customer_id order by cnt desc) as store_id, customer_id 
     from count_sales) ss
left join stores st on st.store_id = ss.store_id 
order by customer_id
'''

# Проверка данных
second_1 = pd.read_sql_query(query, con=engine) 
second_1

Unnamed: 0,store_nm,customer_id
0,store 1,1
1,store 1,2
2,store 2,3
3,store 3,4
4,store 1,5
5,store 1,6
6,store 1,7


In [None]:
## Решение
query='''
select distinct customer_id from (
select distinct customer_id, date_trunc('month', dt), count(sales_id)
from sales s where dt between '01.01.2023' and '28.02.2023'
group by date_trunc('month', dt), customer_id
having COUNT (sales_id) >= 3) aa
order by customer_id
'''

# Проверка данных
second_2 = pd.read_sql_query(query, con=engine) 
second_2

Unnamed: 0,customer_id
0,1
1,2
2,3


#### Запрос 2

Напишите запрос, формирующий ниже представленный отчет
![image.png](attachment:image.png)

In [None]:
## Решение
query='''
SELECT (date_trunc('MONTH', s.dt) + INTERVAL '1 MONTH - 1 day')::date as month_end_dt,
SUM(s.amt) over (partition by (date_trunc('MONTH', dt) + INTERVAL '1 MONTH - 1 day')::date) as company_sales_amt,
st.store_nm,
SUM(s.amt) over (partition by (date_trunc('MONTH', dt) + INTERVAL '1 MONTH - 1 day')::date, st.store_nm) as store_sales_amt,
round(SUM(s.amt) over (partition by (date_trunc('MONTH', dt) + INTERVAL '1 MONTH - 1 day')::date, st.store_nm)/SUM(s.amt) over (partition by (date_trunc('MONTH', dt) + INTERVAL '1 MONTH - 1 day')::date), 2) as store_sales_share
from sales s
left join stores st on s.store_id = st.store_id 
'''

# Проверка данных
second_3 = pd.read_sql_query(query, con=engine) 
second_3.head()

Unnamed: 0,month_end_dt,company_sales_amt,store_nm,store_sales_amt,store_sales_share
0,2023-01-31,1400.0,store 1,660.0,0.47
1,2023-01-31,1400.0,store 1,660.0,0.47
2,2023-01-31,1400.0,store 1,660.0,0.47
3,2023-01-31,1400.0,store 1,660.0,0.47
4,2023-01-31,1400.0,store 1,660.0,0.47


### Задача 3

#### Запрос 1

В таблице calls хранятся данные всех звонков абонентов за отчетный месяц.  
В поле roaming указан факт нахождения абонента в роуминге во время звонка:
* 1 - абонент был в роуминге;
* 0 - абонент не был в роуминге.

НапишитеSQL запрос, определяющий уникальные id абонентов, которые хоть раз
звонили в роуминге за отчетный месяц.

In [None]:
## Решение
query='''
select distinct id_abon
from calls c 
where roaming = 1
order by id_abon 
'''

# Проверка данных
third_1 = pd.read_sql_query(query, con=engine) 
third_1.head()

Unnamed: 0,id_abon
0,1
1,4
2,6
3,7
4,8


#### Запрос 2

В таблице abnt хранятся уникальные id всех абонентов, совершавших звонки за
отчетный месяц.  
В таблице roam хранятся уникальные id абонентов, которые
были в роуминге за отчетный месяц.  
Напишите SQL запрос, результатом которого будут все id абонентов, которые не
были в роуминге в текущем месяце.

In [None]:
## Решение
query='''
select distinct id_abon
from abnt a 
where id_abon not in(
select id_abon
from roam r)
'''

# Проверка данных
third_2 = pd.read_sql_query(query, con=engine) 
third_2.head()

Unnamed: 0,id_abon
0,6
1,1


#### Запрос 3

В таблицах abnt и roam также хранятся данные о тратах абонентов. В таблице
abnt есть все начисления абонентов, в таблице roam начисления в роуминге.  
Напишите SQL запрос, который выведет всех абонентов с начислениями в
домашней сети больше 0.  
Начисления в домашней сети= все начисления (abnt.clc)  - начисления в роуминге
(roam.clc).

In [None]:
## Решение
query='''
select a.id_abon, a.clc - r.clc as clc
from abnt a 
join roam r on r.id_abon = a.id_abon
order by clc desc
'''

# Проверка данных
third_3 = pd.read_sql_query(query, con=engine) 
third_3.head()

Unnamed: 0,id_abon,clc
0,4,300
1,2,0
2,3,0
3,5,0
4,7,0


#### Запрос 4

Используя данные таблицы calls, выведите id всех абонентов, у которых было
больше 5 звонков в роуминге.

In [None]:
## Решение
query='''
select distinct id_abon
from calls c 
where roaming = 1
group by id_abon 
having count(roaming) > 5
'''

# Проверка данных
third_4 = pd.read_sql_query(query, con=engine) 
third_4.head()

Unnamed: 0,id_abon
0,1


#### Запрос 5

Используя данные таблицы calls, выведите периоды нахождения абонентов в
роуминге. Время пребывания в роуминге определяется непрерывной последовательностью звонков в роуминге.

In [None]:
## Решение
query='''
with ol as (select id_abon,
date as day,
lag(date) over (partition by id_abon order by date_trunc('day',date)) as prev_day,
lead(date) over (partition by id_abon order by date_trunc('day',date)) as next_day
from calls c
where roaming = 1
)
select  distinct id_abon, case
when prev_day+1 = day then concat(to_char(prev_day, 'dd.MM'),'-',to_char(day, 'dd.MM'))
when next_day-1 = day then concat(to_char(day, 'dd.MM'),'-',to_char(next_day, 'dd.MM'))
else NULL
end as period_on_roam
from ol
'''

# Проверка данных
third_5 = pd.read_sql_query(query, con=engine) 
third_5.head()

Unnamed: 0,id_abon,period_on_roam
0,1,03.01-04.01
1,1,04.01-05.01
2,1,05.01-06.01
3,1,
4,4,


### Задача 4

У вас есть две таблицы:
* t1 - данные по заявкам на Подбор кредита с сайта Сравни.ру;
* t2 - выгрузка банка о решениях по выдаче кредита.
Напишите SQL-запрос, содержащий всех пользователей, получивших кредит.
![image.png](attachment:image.png)

In [None]:
## Решение
query='''
select t1.*, t2.status 
from t1
left join t2 on t2.id = t1.id
where t2.status = 'выдан'
'''
## лучше вариант с "where t2.status like '%выд%'"

# Проверка данных
fourh = pd.read_sql_query(query, con=engine) 
fourh.head()

Unnamed: 0,id,surname,birthday,amount,salary,status
0,77664,Мамин-Сибиряк,2003-01-20,6000000,58000,выдан
1,52183,Васильев,1956-07-05,750000,98000,выдан
