In [1]:
import pandas as pd
from tqdm import tqdm
from sqlalchemy import create_engine
from sqlalchemy.exc import InterfaceError, OperationalError

In [2]:
import warnings
warnings.filterwarnings('ignore')

In [3]:
engine = create_engine("postgresql://komisarenko.aa:password@host/bd")

In [4]:
dates = pd.date_range(start='2023-05-01', end='2024-11-01', freq='MS')

In [5]:
division = ['-']

In [6]:
df_dis_c = pd.DataFrame()

In [7]:
progress_bar = tqdm(dates, ncols=100, leave=True)
max_retries = 3
retry_delay = 5 
chunksize = 10000
# chanel discount
for dt in progress_bar:
    date = dt.strftime('%Y-%m-%d')
    for div in division:
        q_auc = f'''

WITH loc AS (
	SELECT
		fr."Ссылка" guid_branch,
		fr."ВидФилиала" type_branch,
		t2."Наименование" division
	FROM "Firmy" fr
	JOIN "Goroda" sg on fr.Город = sg.Ссылка
	LEFT JOIN "Firmy.Territorij" it2 ON it2."Ссылка" = fr."Ссылка" AND it2."Уровень" = 2
	LEFT JOIN "Territorii" t2 ON t2."Ссылка" = it2."Территория"
	WHERE t2."Наименование" IN (
								'{div}'
        )),
aic AS (
    SELECT
        drn."Ссылка",
        CASE 
            WHEN (drn."Автор" IN (
                    SELECT sp."Ссылка"
                    FROM "Polzovateli" sp
                    WHERE sp."Должность" IN (
                       'b14aa411-f473-4af9-acc4-3600933ff3ee', '432b7951-da28-4c54-a02b-cdccbe83a270', '9ddebdc2-db29-4e47-9b8e-b5fbe576cd39', 
				'0969b888-2e0c-11eb-a211-00155d03332b', '57e1e5f6-e34a-11ea-a20f-00155df1b805', '87e1cf63-53e0-11eb-a211-00155d03332b', 
				'cb707a30-53e0-11eb-a211-00155d03332b', '59a8ce3f-678f-11eb-a219-00155d03332b', '541953c4-a5b1-4a65-becb-28b498726fa9', 
				'09636579-19d2-11eb-a211-00155d03332b', '4b505796-53df-11eb-a211-00155d03332b', 'fdc0f0fc-678e-11eb-a219-00155d03332b', 
				'd5226d9f-1ef0-4411-9356-1fc14c9c8406', '5b515bb5-4b4c-4f45-9a42-ee74e0e52cad'
                    ))
            OR loc.type_branch = 'ff8bd1ff-6163-4f1c-98e8-0a1c894f1ae7') 
            THEN 'КО'
            WHEN drn."ТипПродажи" = 2 THEN 'Онлайн'
            ELSE 'Розница'
        END AS SalesChannels
    FROM "Nakladnaja" drn
    JOIN loc ON drn."Фирма" = loc.guid_branch
    WHERE drn."ПометкаУдаления" = 0
        AND drn."Проведен" = 1
        AND drn."Сумма_Итог" > 0
        AND date_trunc('month', drn."Дата")::date = '{date}'
)
SELECT 
    date_trunc('month', drn."Дата")::date AS dt,
    loc.division,
    aic.SalesChannels,
    CASE
        WHEN drns.ПричинаИзмененияЦены IN (1, 2, 3, 4, 10, 11, 12) THEN 'Ручные'
        WHEN drns.ПричинаИзмененияЦены = 0 THEN 'Модификатор цены отсутствует'
        ELSE 'Автоматические'
    END AS type_descr,
    CASE
        WHEN drns.ПричинаИзмененияЦены = 1 THEN 'Небольшой дефект'
        WHEN drns.ПричинаИзмененияЦены = 2 THEN 'Несоответствие ценника'
        WHEN drns.ПричинаИзмененияЦены = 3 THEN 'Акционный товар'
        WHEN drns.ПричинаИзмененияЦены = 4 THEN 'Неполная комплектация'
        WHEN drns.ПричинаИзмененияЦены = 10 THEN 'Скидка или подарок (бандл)'
        WHEN drns.ПричинаИзмененияЦены = 11 THEN 'Под ответственность управляющего'
        WHEN drns.ПричинаИзмененияЦены = 12 THEN 'Акция ГЛЦ (Гарантия Лучшей цены)'
        WHEN drns.ПричинаИзмененияЦены = 0 THEN 'Модификатор цены отсутствует'
        ELSE 'Автоматические'
    END AS disc_reason_descr,
    SUM(drns."ЦенаПоПрайсу" * drns."Количество") AS price_sum,
    SUM(drns."Сумма") AS sales_sum,
    CASE 
        WHEN SUM(drns."Сумма") < SUM(drns."ЦенаПоПрайсу" * drns."Количество")
        THEN SUM((drns."ЦенаПоПрайсу" * drns."Количество") - drns."Сумма")
        ELSE 0
    END AS discount
FROM "Nakladnaja" drn
JOIN "Nakladnaja.Sostav" drns ON drn."Ссылка" = drns."Ссылка"
JOIN loc ON drn."Фирма" = loc.guid_branch
JOIN aic ON drn."Ссылка" = aic."Ссылка"
WHERE drn."ПометкаУдаления" = 0
    AND drn."Проведен" = 1
    AND drn."Сумма_Итог" > 0
    AND date_trunc('month', drn."Дата")::date = '{date}'
GROUP BY 
    date_trunc('month', drn."Дата")::date,
    loc.division,
    aic.SalesChannels,
    type_descr,
    disc_reason_descr;
 
'''
     
        attempt = 0
        while attempt < max_retries:
            try:
                df_t = pd.read_sql(sql=q_auc, con=engine.raw_connection())
                df_dis_c = pd.concat([df_dis_c, df_t], ignore_index=True)
    
                progress_bar.set_description(f"Обработка {dt.strftime('%Y-%m')} для {div}")
                progress_bar.set_postfix({'Записей': len(df_dis_c)})
                break  
            except (InterfaceError, OperationalError) as e:
                attempt += 1
                if attempt < max_retries:
                    print(f"Попытка {attempt}/{max_retries} для {dt.strftime('%Y-%m')} не удалась: {e}. Повтор через {retry_delay} секунд.")
                    time.sleep(retry_delay) 
                else:
                    print(f"Ошибка при загрузке данных за {dt.strftime('%Y-%m')}: {e}. Пропуск после {max_retries} попыток.")
                    break 

Обработка 2024-11 для 11. див. Северо-Западный: 100%|█| 19/19 [3:18:33<00:00, 627.02s/it, Записей=43


In [21]:
#df_dis_c.sample(2)

In [19]:
#df_dis_c.to_csv('sda_121.csv', index=False)