In [None]:
import requests
import time
import pandas as pd
from datetime import datetime, timedelta
import os
import logging

# Настройка логирования
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

TOKEN = "d5c3d78fc111d88a0a37b4ab8f83cbd5"
BASE_URL = "https://ows.goszakup.gov.kz"
API_ENDPOINT = "/v3/plans/deleted"
FINAL_FILE = "goszakup_deleted_data.parquet"
TEMP_DIR = "temp_parquet_files"

# Создаём директорию для временных файлов
if not os.path.exists(TEMP_DIR):
    os.makedirs(TEMP_DIR)

headers = {
    "Authorization": f"Bearer {TOKEN}",
    "Content-Type": "application/json"
}

params = {"limit": 500}
next_page = f"{API_ENDPOINT}?limit=500"
seen_ids = set()

# Диапазон дат
START_DATE = datetime.strptime("2024-01-01 00:00:00", "%Y-%m-%d %H:%M:%S")
STOP_DATE = datetime.now()

# Параметры для остановки
MAX_EMPTY_PAGES = 10
empty_page_count = 0
temp_file_count = 0
BATCH_SIZE = 10000

def parse_date(date_str):
    """Парсит дату, поддерживая оба формата."""
    try:
        return datetime.strptime(date_str, "%Y-%m-%dT%H:%M:%S.%f")
    except ValueError:
        try:
            return datetime.strptime(date_str, "%Y-%m-%d %H:%M:%S")
        except ValueError as e:
            raise ValueError(f"Неподдерживаемый формат даты: {date_str}") from e

def save_batch(filtered_items, temp_file_count):
    """Сохраняет батч данных во временный файл."""
    temp_file = os.path.join(TEMP_DIR, f"temp_batch_{temp_file_count}.parquet")
    df = pd.DataFrame(filtered_items)
    df.to_parquet(temp_file, index=False, engine="pyarrow")
    logging.info(f"Сохранён временный файл: {temp_file} с {len(filtered_items)} записями")
    return temp_file_count + 1

def merge_temp_files(final_file):
    """Объединяет временные файлы в итоговый."""
    temp_files = [os.path.join(TEMP_DIR, f) for f in os.listdir(TEMP_DIR) if f.endswith(".parquet")]
    if not temp_files:
        logging.info("Нет данных для объединения.")
        return
    
    combined_df = pd.concat([pd.read_parquet(f) for f in temp_files], ignore_index=True)
    combined_df.to_parquet(final_file, index=False, engine="pyarrow")
    logging.info(f"Все данные объединены в {final_file}, всего записей: {len(combined_df)}")
    
    for f in temp_files:
        os.remove(f)
    os.rmdir(TEMP_DIR)

filtered_items = []
total_records = 0

while next_page:
    try:
        response = requests.get(f"{BASE_URL}{next_page}", headers=headers, timeout=30)
        response.raise_for_status()
        data = response.json()

        items = data.get("items", [])
        if not items:
            logging.info("Загрузка завершена, новых данных нет.")
            break

        logging.info(f"Получено {len(items)} записей на странице.")
        page_filtered_items = []  # Отдельный список для записей текущей страницы
        page_has_relevant_data = False

        for item in items:
            try:
                item_date = parse_date(item["index_date"])
                if START_DATE <= item_date <= STOP_DATE:
                    if item["id"] not in seen_ids:
                        page_filtered_items.append(item)
                        filtered_items.append(item)
                        seen_ids.add(item["id"])
                        page_has_relevant_data = True
                else:
                    logging.debug(f"Пропущена запись ID {item['id']} с датой {item_date} (вне диапазона)")
            except ValueError as e:
                logging.warning(f"Ошибка парсинга даты для записи {item['id']}: {e}")
                continue

        if page_has_relevant_data:
            empty_page_count = 0
            total_records += len(page_filtered_items)
            logging.info(f"Добавлено {len(page_filtered_items)} записей с этой страницы. Всего: {total_records}")
        else:
            empty_page_count += 1
            logging.info(f"На этой странице нет записей в диапазоне дат. Пустых страниц подряд: {empty_page_count}")

        if len(filtered_items) >= BATCH_SIZE:
            temp_file_count = save_batch(filtered_items, temp_file_count)
            filtered_items = []

        if empty_page_count >= MAX_EMPTY_PAGES:
            logging.info(f"Достигнут лимит пустых страниц ({MAX_EMPTY_PAGES}), завершаем загрузку.")
            break

        next_page = data.get("next_page")
        if not next_page:
            logging.info("Достигнута последняя страница, завершаем загрузку.")
            break

        time.sleep(5)

    except requests.exceptions.Timeout:
        logging.error("Таймаут запроса, ждём 30 секунд и пробуем снова...")
        time.sleep(30)
        continue
    except requests.exceptions.ConnectionError as e:
        logging.error(f"Ошибка соединения: {e}, ждём 30 секунд и пробуем снова...")
        time.sleep(30)
        continue
    except requests.exceptions.RequestException as e:
        logging.error(f"Неизвестная ошибка запроса: {e}, ждём 30 секунд и пробуем снова...")
        time.sleep(30)
        continue

# Сохраняем оставшиеся данные
if filtered_items:
    temp_file_count = save_batch(filtered_items, temp_file_count)

# Объединяем временные файлы
merge_temp_files(FINAL_FILE)

if total_records == 0:
    logging.info("Нет данных для сохранения в указанном диапазоне дат.")

2025-03-28 14:11:15,030 - ERROR - Ошибка соединения: HTTPSConnectionPool(host='ows.goszakup.gov.kz', port=443): Read timed out., ждём 30 секунд и пробуем снова...
2025-03-28 14:11:45,623 - INFO - Получено 500 записей на странице.
2025-03-28 14:11:45,647 - INFO - Добавлено 500 записей с этой страницы. Всего: 500
2025-03-28 14:11:51,109 - INFO - Получено 500 записей на странице.
2025-03-28 14:11:51,121 - INFO - Добавлено 500 записей с этой страницы. Всего: 1000
2025-03-28 14:11:56,531 - INFO - Получено 500 записей на странице.
2025-03-28 14:11:56,556 - INFO - Добавлено 500 записей с этой страницы. Всего: 1500
2025-03-28 14:12:01,960 - INFO - Получено 500 записей на странице.
2025-03-28 14:12:01,973 - INFO - Добавлено 500 записей с этой страницы. Всего: 2000
2025-03-28 14:12:07,596 - INFO - Получено 500 записей на странице.
2025-03-28 14:12:07,609 - INFO - Добавлено 500 записей с этой страницы. Всего: 2500
2025-03-28 14:12:13,475 - INFO - Получено 500 записей на странице.
2025-03-28 14:12

2025-03-28 14:18:23,730 - INFO - Добавлено 500 записей с этой страницы. Всего: 24987
2025-03-28 14:18:29,140 - INFO - Получено 500 записей на странице.
2025-03-28 14:18:29,154 - INFO - Добавлено 500 записей с этой страницы. Всего: 25487
2025-03-28 14:18:34,671 - INFO - Получено 500 записей на странице.
2025-03-28 14:18:34,684 - INFO - Добавлено 500 записей с этой страницы. Всего: 25987
2025-03-28 14:18:40,144 - INFO - Получено 500 записей на странице.
2025-03-28 14:18:40,158 - INFO - Добавлено 500 записей с этой страницы. Всего: 26487
2025-03-28 14:18:45,656 - INFO - Получено 500 записей на странице.
2025-03-28 14:18:45,680 - INFO - Добавлено 499 записей с этой страницы. Всего: 26986
2025-03-28 14:18:51,155 - INFO - Получено 500 записей на странице.
2025-03-28 14:18:51,172 - INFO - Добавлено 500 записей с этой страницы. Всего: 27486
2025-03-28 14:19:26,278 - ERROR - Таймаут запроса, ждём 30 секунд и пробуем снова...
2025-03-28 14:19:56,944 - INFO - Получено 500 записей на странице.
202

2025-03-28 14:26:11,993 - INFO - Получено 500 записей на странице.
2025-03-28 14:26:12,006 - INFO - Добавлено 484 записей с этой страницы. Всего: 50438
2025-03-28 14:26:17,611 - INFO - Получено 500 записей на странице.
2025-03-28 14:26:17,624 - INFO - Добавлено 499 записей с этой страницы. Всего: 50937
2025-03-28 14:26:23,155 - INFO - Получено 500 записей на странице.
2025-03-28 14:26:23,176 - INFO - Добавлено 500 записей с этой страницы. Всего: 51437
2025-03-28 14:26:28,584 - INFO - Получено 500 записей на странице.
2025-03-28 14:26:28,600 - INFO - Добавлено 499 записей с этой страницы. Всего: 51936
2025-03-28 14:26:34,021 - INFO - Получено 500 записей на странице.
2025-03-28 14:26:34,034 - INFO - Добавлено 489 записей с этой страницы. Всего: 52425
2025-03-28 14:26:34,080 - INFO - Сохранён временный файл: temp_parquet_files\temp_batch_4.parquet с 10453 записями
2025-03-28 14:26:39,543 - INFO - Получено 500 записей на странице.
2025-03-28 14:26:39,556 - INFO - Добавлено 499 записей с э

2025-03-28 14:34:39,428 - INFO - Добавлено 500 записей с этой страницы. Всего: 74365
2025-03-28 14:34:44,930 - INFO - Получено 500 записей на странице.
2025-03-28 14:34:44,942 - INFO - Добавлено 500 записей с этой страницы. Всего: 74865
2025-03-28 14:34:50,517 - INFO - Получено 500 записей на странице.
2025-03-28 14:34:50,538 - INFO - Добавлено 496 записей с этой страницы. Всего: 75361
2025-03-28 14:34:55,938 - INFO - Получено 500 записей на странице.
2025-03-28 14:34:55,952 - INFO - Добавлено 500 записей с этой страницы. Всего: 75861
2025-03-28 14:35:01,491 - INFO - Получено 500 записей на странице.
2025-03-28 14:35:01,506 - INFO - Добавлено 500 записей с этой страницы. Всего: 76361
2025-03-28 14:35:06,904 - INFO - Получено 500 записей на странице.
2025-03-28 14:35:06,916 - INFO - Добавлено 500 записей с этой страницы. Всего: 76861
2025-03-28 14:35:12,489 - INFO - Получено 500 записей на странице.
2025-03-28 14:35:12,508 - INFO - Добавлено 500 записей с этой страницы. Всего: 77361
202

2025-03-28 14:41:25,553 - INFO - Добавлено 498 записей с этой страницы. Всего: 99681
2025-03-28 14:41:31,325 - INFO - Получено 500 записей на странице.
2025-03-28 14:41:31,335 - INFO - Добавлено 500 записей с этой страницы. Всего: 100181
2025-03-28 14:41:36,876 - INFO - Получено 500 записей на странице.
2025-03-28 14:41:36,880 - INFO - Добавлено 500 записей с этой страницы. Всего: 100681
2025-03-28 14:41:42,378 - INFO - Получено 500 записей на странице.
2025-03-28 14:41:42,382 - INFO - Добавлено 500 записей с этой страницы. Всего: 101181
2025-03-28 14:41:48,000 - INFO - Получено 500 записей на странице.
2025-03-28 14:41:48,006 - INFO - Добавлено 500 записей с этой страницы. Всего: 101681
2025-03-28 14:41:53,867 - INFO - Получено 500 записей на странице.
2025-03-28 14:41:53,874 - INFO - Добавлено 500 записей с этой страницы. Всего: 102181
2025-03-28 14:41:59,419 - INFO - Получено 500 записей на странице.
2025-03-28 14:41:59,426 - INFO - Добавлено 500 записей с этой страницы. Всего: 1026

2025-03-28 14:48:41,049 - ERROR - Таймаут запроса, ждём 30 секунд и пробуем снова...
2025-03-28 14:49:41,465 - ERROR - Ошибка соединения: HTTPSConnectionPool(host='ows.goszakup.gov.kz', port=443): Read timed out., ждём 30 секунд и пробуем снова...
2025-03-28 14:50:12,026 - INFO - Получено 500 записей на странице.
2025-03-28 14:50:12,034 - INFO - Добавлено 500 записей с этой страницы. Всего: 125143
2025-03-28 14:50:17,478 - INFO - Получено 500 записей на странице.
2025-03-28 14:50:17,482 - INFO - Добавлено 499 записей с этой страницы. Всего: 125642
2025-03-28 14:50:17,500 - INFO - Сохранён временный файл: temp_parquet_files\temp_batch_11.parquet с 10488 записями
2025-03-28 14:50:23,143 - INFO - Получено 500 записей на странице.
2025-03-28 14:50:23,148 - INFO - Добавлено 500 записей с этой страницы. Всего: 126142
2025-03-28 14:50:28,609 - INFO - Получено 500 записей на странице.
2025-03-28 14:50:28,618 - INFO - Добавлено 500 записей с этой страницы. Всего: 126642
2025-03-28 14:50:34,101 

2025-03-28 14:56:54,819 - INFO - Получено 500 записей на странице.
2025-03-28 14:56:54,829 - INFO - Добавлено 500 записей с этой страницы. Всего: 147576
2025-03-28 14:57:00,382 - INFO - Получено 500 записей на странице.
2025-03-28 14:57:00,391 - INFO - Добавлено 500 записей с этой страницы. Всего: 148076
2025-03-28 14:57:05,803 - INFO - Получено 500 записей на странице.
2025-03-28 14:57:05,814 - INFO - Добавлено 499 записей с этой страницы. Всего: 148575
2025-03-28 14:57:11,361 - INFO - Получено 500 записей на странице.
2025-03-28 14:57:11,372 - INFO - Добавлено 500 записей с этой страницы. Всего: 149075
2025-03-28 14:57:16,816 - INFO - Получено 500 записей на странице.
2025-03-28 14:57:16,822 - INFO - Добавлено 500 записей с этой страницы. Всего: 149575
2025-03-28 14:57:22,404 - INFO - Получено 500 записей на странице.
2025-03-28 14:57:22,410 - INFO - Добавлено 500 записей с этой страницы. Всего: 150075
2025-03-28 14:57:27,894 - INFO - Получено 500 записей на странице.
2025-03-28 14:5

2025-03-28 15:03:29,686 - INFO - Получено 500 записей на странице.
2025-03-28 15:03:29,694 - INFO - Добавлено 483 записей с этой страницы. Всего: 172451
2025-03-28 15:03:35,128 - INFO - Получено 500 записей на странице.
2025-03-28 15:03:35,135 - INFO - Добавлено 499 записей с этой страницы. Всего: 172950
2025-03-28 15:03:40,635 - INFO - Получено 500 записей на странице.
2025-03-28 15:03:40,644 - INFO - Добавлено 500 записей с этой страницы. Всего: 173450
2025-03-28 15:03:46,065 - INFO - Получено 500 записей на странице.
2025-03-28 15:03:46,069 - INFO - Добавлено 499 записей с этой страницы. Всего: 173949
2025-03-28 15:03:51,489 - INFO - Получено 500 записей на странице.
2025-03-28 15:03:51,495 - INFO - Добавлено 500 записей с этой страницы. Всего: 174449
2025-03-28 15:03:56,940 - INFO - Получено 500 записей на странице.
2025-03-28 15:03:56,951 - INFO - Добавлено 500 записей с этой страницы. Всего: 174949
2025-03-28 15:04:02,324 - INFO - Получено 500 записей на странице.
2025-03-28 15:0

2025-03-28 15:10:05,016 - INFO - Добавлено 500 записей с этой страницы. Всего: 197419
2025-03-28 15:10:10,484 - INFO - Получено 500 записей на странице.
2025-03-28 15:10:10,492 - INFO - Добавлено 500 записей с этой страницы. Всего: 197919
2025-03-28 15:10:16,060 - INFO - Получено 500 записей на странице.
2025-03-28 15:10:16,069 - INFO - Добавлено 497 записей с этой страницы. Всего: 198416
2025-03-28 15:10:21,509 - INFO - Получено 500 записей на странице.
2025-03-28 15:10:21,521 - INFO - Добавлено 500 записей с этой страницы. Всего: 198916
2025-03-28 15:10:21,538 - INFO - Сохранён временный файл: temp_parquet_files\temp_batch_18.parquet с 10491 записями
2025-03-28 15:10:26,986 - INFO - Получено 500 записей на странице.
2025-03-28 15:10:26,993 - INFO - Добавлено 497 записей с этой страницы. Всего: 199413
2025-03-28 15:10:32,473 - INFO - Получено 500 записей на странице.
2025-03-28 15:10:32,483 - INFO - Добавлено 500 записей с этой страницы. Всего: 199913
2025-03-28 15:10:37,878 - INFO - 

2025-03-28 15:15:48,233 - INFO - Получено 500 записей на странице.
2025-03-28 15:15:48,243 - INFO - Добавлено 500 записей с этой страницы. Всего: 222702
2025-03-28 15:15:53,829 - INFO - Получено 500 записей на странице.
2025-03-28 15:15:53,840 - INFO - Добавлено 499 записей с этой страницы. Всего: 223201
2025-03-28 15:15:59,233 - INFO - Получено 500 записей на странице.
2025-03-28 15:15:59,241 - INFO - Добавлено 500 записей с этой страницы. Всего: 223701
2025-03-28 15:16:05,064 - INFO - Получено 500 записей на странице.
2025-03-28 15:16:05,068 - INFO - Добавлено 493 записей с этой страницы. Всего: 224194
2025-03-28 15:16:40,200 - ERROR - Таймаут запроса, ждём 30 секунд и пробуем снова...
2025-03-28 15:17:10,713 - INFO - Получено 500 записей на странице.
2025-03-28 15:17:10,719 - INFO - Добавлено 499 записей с этой страницы. Всего: 224693
2025-03-28 15:17:16,115 - INFO - Получено 500 записей на странице.
2025-03-28 15:17:16,125 - INFO - Добавлено 499 записей с этой страницы. Всего: 2251

2025-03-28 15:24:49,607 - ERROR - Таймаут запроса, ждём 30 секунд и пробуем снова...
2025-03-28 15:25:20,015 - INFO - Получено 500 записей на странице.
2025-03-28 15:25:20,025 - INFO - Добавлено 500 записей с этой страницы. Всего: 247118
2025-03-28 15:25:25,530 - INFO - Получено 500 записей на странице.
2025-03-28 15:25:25,537 - INFO - Добавлено 500 записей с этой страницы. Всего: 247618
2025-03-28 15:26:00,945 - ERROR - Ошибка соединения: HTTPSConnectionPool(host='ows.goszakup.gov.kz', port=443): Read timed out., ждём 30 секунд и пробуем снова...
2025-03-28 15:26:31,505 - INFO - Получено 500 записей на странице.
2025-03-28 15:26:31,514 - INFO - Добавлено 500 записей с этой страницы. Всего: 248118
2025-03-28 15:26:37,346 - INFO - Получено 500 записей на странице.
2025-03-28 15:26:37,354 - INFO - Добавлено 500 записей с этой страницы. Всего: 248618
2025-03-28 15:27:12,759 - ERROR - Ошибка соединения: HTTPSConnectionPool(host='ows.goszakup.gov.kz', port=443): Read timed out., ждём 30 сек

2025-03-28 15:33:57,799 - INFO - Добавлено 500 записей с этой страницы. Всего: 271050
2025-03-28 15:34:03,480 - INFO - Получено 500 записей на странице.
2025-03-28 15:34:03,489 - INFO - Добавлено 500 записей с этой страницы. Всего: 271550
2025-03-28 15:34:09,001 - INFO - Получено 500 записей на странице.
2025-03-28 15:34:09,011 - INFO - Добавлено 500 записей с этой страницы. Всего: 272050
2025-03-28 15:34:09,028 - INFO - Сохранён временный файл: temp_parquet_files\temp_batch_25.parquet с 10482 записями
2025-03-28 15:34:14,573 - INFO - Получено 500 записей на странице.
2025-03-28 15:34:14,583 - INFO - Добавлено 500 записей с этой страницы. Всего: 272550
2025-03-28 15:34:20,161 - INFO - Получено 500 записей на странице.
2025-03-28 15:34:20,167 - INFO - Добавлено 500 записей с этой страницы. Всего: 273050
2025-03-28 15:34:25,551 - INFO - Получено 500 записей на странице.
2025-03-28 15:34:25,557 - INFO - Добавлено 500 записей с этой страницы. Всего: 273550
2025-03-28 15:34:31,026 - INFO - 

2025-03-28 15:41:30,416 - INFO - Добавлено 499 записей с этой страницы. Всего: 295486
2025-03-28 15:41:35,854 - INFO - Получено 500 записей на странице.
2025-03-28 15:41:35,860 - INFO - Добавлено 500 записей с этой страницы. Всего: 295986
2025-03-28 15:41:41,329 - INFO - Получено 500 записей на странице.
2025-03-28 15:41:41,337 - INFO - Добавлено 500 записей с этой страницы. Всего: 296486
2025-03-28 15:41:46,930 - INFO - Получено 500 записей на странице.
2025-03-28 15:41:46,936 - INFO - Добавлено 498 записей с этой страницы. Всего: 296984
2025-03-28 15:41:52,423 - INFO - Получено 500 записей на странице.
2025-03-28 15:41:52,432 - INFO - Добавлено 491 записей с этой страницы. Всего: 297475
2025-03-28 15:41:57,862 - INFO - Получено 500 записей на странице.
2025-03-28 15:41:57,867 - INFO - Добавлено 500 записей с этой страницы. Всего: 297975
2025-03-28 15:42:32,954 - ERROR - Таймаут запроса, ждём 30 секунд и пробуем снова...
2025-03-28 15:43:03,448 - INFO - Получено 500 записей на страниц

2025-03-28 15:48:14,325 - INFO - Добавлено 477 записей с этой страницы. Всего: 320869
2025-03-28 15:48:19,831 - INFO - Получено 500 записей на странице.
2025-03-28 15:48:19,844 - INFO - Добавлено 463 записей с этой страницы. Всего: 321332
2025-03-28 15:48:54,952 - ERROR - Таймаут запроса, ждём 30 секунд и пробуем снова...
2025-03-28 15:49:25,491 - INFO - Получено 500 записей на странице.
2025-03-28 15:49:25,503 - INFO - Добавлено 499 записей с этой страницы. Всего: 321831
2025-03-28 15:50:00,917 - ERROR - Ошибка соединения: HTTPSConnectionPool(host='ows.goszakup.gov.kz', port=443): Read timed out., ждём 30 секунд и пробуем снова...
2025-03-28 15:50:31,310 - INFO - Получено 500 записей на странице.
2025-03-28 15:50:31,331 - INFO - Добавлено 496 записей с этой страницы. Всего: 322327
2025-03-28 15:50:36,781 - INFO - Получено 500 записей на странице.
2025-03-28 15:50:36,794 - INFO - Добавлено 500 записей с этой страницы. Всего: 322827
2025-03-28 15:50:42,215 - INFO - Получено 500 записей 

2025-03-28 15:56:02,303 - INFO - Получено 500 записей на странице.
2025-03-28 15:56:02,319 - INFO - Добавлено 500 записей с этой страницы. Всего: 345719
2025-03-28 15:56:07,853 - INFO - Получено 500 записей на странице.
2025-03-28 15:56:07,866 - INFO - Добавлено 500 записей с этой страницы. Всего: 346219
2025-03-28 15:56:42,967 - ERROR - Таймаут запроса, ждём 30 секунд и пробуем снова...
2025-03-28 15:57:13,462 - INFO - Получено 500 записей на странице.
2025-03-28 15:57:13,481 - INFO - Добавлено 500 записей с этой страницы. Всего: 346719
2025-03-28 15:57:18,990 - INFO - Получено 500 записей на странице.
2025-03-28 15:57:19,003 - INFO - Добавлено 500 записей с этой страницы. Всего: 347219
2025-03-28 15:57:24,625 - INFO - Получено 500 записей на странице.
2025-03-28 15:57:24,638 - INFO - Добавлено 500 записей с этой страницы. Всего: 347719
2025-03-28 15:57:30,176 - INFO - Получено 500 записей на странице.
2025-03-28 15:57:30,189 - INFO - Добавлено 500 записей с этой страницы. Всего: 3482

2025-03-28 16:02:55,597 - INFO - Получено 500 записей на странице.
2025-03-28 16:02:55,610 - INFO - Добавлено 494 записей с этой страницы. Всего: 371120
2025-03-28 16:03:00,982 - INFO - Получено 500 записей на странице.
2025-03-28 16:03:00,995 - INFO - Добавлено 492 записей с этой страницы. Всего: 371612
2025-03-28 16:03:07,051 - INFO - Получено 500 записей на странице.
2025-03-28 16:03:07,063 - INFO - Добавлено 494 записей с этой страницы. Всего: 372106
2025-03-28 16:03:12,604 - INFO - Получено 500 записей на странице.
2025-03-28 16:03:12,616 - INFO - Добавлено 497 записей с этой страницы. Всего: 372603
2025-03-28 16:03:18,604 - INFO - Получено 500 записей на странице.
2025-03-28 16:03:18,617 - INFO - Добавлено 500 записей с этой страницы. Всего: 373103
2025-03-28 16:03:24,088 - INFO - Получено 500 записей на странице.
2025-03-28 16:03:24,101 - INFO - Добавлено 499 записей с этой страницы. Всего: 373602
2025-03-28 16:03:59,599 - ERROR - Ошибка соединения: HTTPSConnectionPool(host='ows

2025-03-28 16:11:47,811 - INFO - Добавлено 500 записей с этой страницы. Всего: 395554
2025-03-28 16:11:53,305 - INFO - Получено 500 записей на странице.
2025-03-28 16:11:53,317 - INFO - Добавлено 493 записей с этой страницы. Всего: 396047
2025-03-28 16:11:59,101 - INFO - Получено 500 записей на странице.
2025-03-28 16:11:59,113 - INFO - Добавлено 500 записей с этой страницы. Всего: 396547
2025-03-28 16:12:04,982 - INFO - Получено 500 записей на странице.
2025-03-28 16:12:04,995 - INFO - Добавлено 499 записей с этой страницы. Всего: 397046
2025-03-28 16:12:10,511 - INFO - Получено 500 записей на странице.
2025-03-28 16:12:10,526 - INFO - Добавлено 500 записей с этой страницы. Всего: 397546
2025-03-28 16:12:10,567 - INFO - Сохранён временный файл: temp_parquet_files\temp_batch_37.parquet с 10479 записями
2025-03-28 16:12:15,960 - INFO - Получено 500 записей на странице.
2025-03-28 16:12:15,972 - INFO - Добавлено 500 записей с этой страницы. Всего: 398046
2025-03-28 16:12:21,511 - INFO - 

2025-03-28 16:17:42,496 - INFO - Добавлено 500 записей с этой страницы. Всего: 420829
2025-03-28 16:17:47,901 - INFO - Получено 500 записей на странице.
2025-03-28 16:17:47,912 - INFO - Добавлено 484 записей с этой страницы. Всего: 421313
2025-03-28 16:17:53,429 - INFO - Получено 500 записей на странице.
2025-03-28 16:17:53,450 - INFO - Добавлено 500 записей с этой страницы. Всего: 421813
2025-03-28 16:17:58,896 - INFO - Получено 500 записей на странице.
2025-03-28 16:17:58,916 - INFO - Добавлено 495 записей с этой страницы. Всего: 422308
2025-03-28 16:18:04,427 - INFO - Получено 500 записей на странице.
2025-03-28 16:18:04,445 - INFO - Добавлено 500 записей с этой страницы. Всего: 422808
2025-03-28 16:18:09,867 - INFO - Получено 500 записей на странице.
2025-03-28 16:18:09,887 - INFO - Добавлено 500 записей с этой страницы. Всего: 423308
2025-03-28 16:18:15,283 - INFO - Получено 500 записей на странице.
2025-03-28 16:18:15,296 - INFO - Добавлено 500 записей с этой страницы. Всего: 423

2025-03-28 16:26:22,619 - INFO - Получено 500 записей на странице.
2025-03-28 16:26:22,631 - INFO - Добавлено 500 записей с этой страницы. Всего: 445703
2025-03-28 16:26:28,043 - INFO - Получено 500 записей на странице.
2025-03-28 16:26:28,065 - INFO - Добавлено 500 записей с этой страницы. Всего: 446203
2025-03-28 16:26:33,564 - INFO - Получено 500 записей на странице.
2025-03-28 16:26:33,577 - INFO - Добавлено 500 записей с этой страницы. Всего: 446703
2025-03-28 16:26:39,995 - INFO - Получено 500 записей на странице.
2025-03-28 16:26:40,009 - INFO - Добавлено 492 записей с этой страницы. Всего: 447195
2025-03-28 16:27:15,081 - ERROR - Таймаут запроса, ждём 30 секунд и пробуем снова...
2025-03-28 16:27:50,231 - INFO - Получено 500 записей на странице.
2025-03-28 16:27:50,245 - INFO - Добавлено 497 записей с этой страницы. Всего: 447692
2025-03-28 16:27:55,952 - INFO - Получено 500 записей на странице.
2025-03-28 16:27:55,963 - INFO - Добавлено 484 записей с этой страницы. Всего: 4481

2025-03-28 16:36:47,615 - INFO - Добавлено 500 записей с этой страницы. Всего: 468437
2025-03-28 16:36:55,134 - INFO - Получено 500 записей на странице.
2025-03-28 16:36:55,150 - INFO - Добавлено 499 записей с этой страницы. Всего: 468936
2025-03-28 16:37:00,678 - INFO - Получено 500 записей на странице.
2025-03-28 16:37:00,691 - INFO - Добавлено 484 записей с этой страницы. Всего: 469420
2025-03-28 16:37:06,213 - INFO - Получено 500 записей на странице.
2025-03-28 16:37:06,234 - INFO - Добавлено 491 записей с этой страницы. Всего: 469911
2025-03-28 16:37:11,756 - INFO - Получено 500 записей на странице.
2025-03-28 16:37:11,768 - INFO - Добавлено 478 записей с этой страницы. Всего: 470389
2025-03-28 16:37:11,827 - INFO - Сохранён временный файл: temp_parquet_files\temp_batch_44.parquet с 10269 записями
2025-03-28 16:37:21,672 - INFO - Получено 500 записей на странице.
2025-03-28 16:37:21,689 - INFO - Добавлено 473 записей с этой страницы. Всего: 470862
2025-03-28 16:37:27,232 - INFO - 

2025-03-28 16:42:57,962 - INFO - Добавлено 499 записей с этой страницы. Всего: 493720
2025-03-28 16:43:04,535 - INFO - Получено 500 записей на странице.
2025-03-28 16:43:04,548 - INFO - Добавлено 500 записей с этой страницы. Всего: 494220
2025-03-28 16:43:10,059 - INFO - Получено 500 записей на странице.
2025-03-28 16:43:10,071 - INFO - Добавлено 500 записей с этой страницы. Всего: 494720
2025-03-28 16:43:16,015 - INFO - Получено 500 записей на странице.
2025-03-28 16:43:16,028 - INFO - Добавлено 499 записей с этой страницы. Всего: 495219
2025-03-28 16:43:21,515 - INFO - Получено 500 записей на странице.
2025-03-28 16:43:21,529 - INFO - Добавлено 498 записей с этой страницы. Всего: 495717
2025-03-28 16:43:26,892 - INFO - Получено 500 записей на странице.
2025-03-28 16:43:26,904 - INFO - Добавлено 500 записей с этой страницы. Всего: 496217
2025-03-28 16:43:32,369 - INFO - Получено 500 записей на странице.
2025-03-28 16:43:32,383 - INFO - Добавлено 493 записей с этой страницы. Всего: 496

2025-03-28 16:50:41,106 - INFO - Получено 500 записей на странице.
2025-03-28 16:50:41,119 - INFO - Добавлено 491 записей с этой страницы. Всего: 518456
2025-03-28 16:50:47,761 - INFO - Получено 500 записей на странице.
2025-03-28 16:50:47,783 - INFO - Добавлено 499 записей с этой страницы. Всего: 518955
2025-03-28 16:50:53,473 - INFO - Получено 500 записей на странице.
2025-03-28 16:50:53,493 - INFO - Добавлено 482 записей с этой страницы. Всего: 519437
2025-03-28 16:50:59,003 - INFO - Получено 500 записей на странице.
2025-03-28 16:50:59,016 - INFO - Добавлено 496 записей с этой страницы. Всего: 519933
2025-03-28 16:51:04,776 - INFO - Получено 500 записей на странице.
2025-03-28 16:51:04,790 - INFO - Добавлено 498 записей с этой страницы. Всего: 520431
2025-03-28 16:51:10,415 - INFO - Получено 500 записей на странице.
2025-03-28 16:51:10,436 - INFO - Добавлено 498 записей с этой страницы. Всего: 520929
2025-03-28 16:51:15,942 - INFO - Получено 500 записей на странице.
2025-03-28 16:5

2025-03-28 16:56:35,746 - INFO - Получено 500 записей на странице.
2025-03-28 16:56:35,767 - INFO - Добавлено 499 записей с этой страницы. Всего: 543469
2025-03-28 16:56:41,784 - INFO - Получено 500 записей на странице.
2025-03-28 16:56:41,798 - INFO - Добавлено 494 записей с этой страницы. Всего: 543963
2025-03-28 16:56:47,318 - INFO - Получено 500 записей на странице.
2025-03-28 16:56:47,334 - INFO - Добавлено 493 записей с этой страницы. Всего: 544456
2025-03-28 16:56:52,851 - INFO - Получено 500 записей на странице.
2025-03-28 16:56:52,863 - INFO - Добавлено 493 записей с этой страницы. Всего: 544949
2025-03-28 16:56:58,322 - INFO - Получено 500 записей на странице.
2025-03-28 16:56:58,337 - INFO - Добавлено 498 записей с этой страницы. Всего: 545447
2025-03-28 16:57:03,835 - INFO - Получено 500 записей на странице.
2025-03-28 16:57:03,855 - INFO - Добавлено 498 записей с этой страницы. Всего: 545945
2025-03-28 16:57:09,738 - INFO - Получено 500 записей на странице.
2025-03-28 16:5

2025-03-28 17:04:25,059 - INFO - Получено 500 записей на странице.
2025-03-28 17:04:25,071 - INFO - Добавлено 500 записей с этой страницы. Всего: 567844
2025-03-28 17:04:30,510 - INFO - Получено 500 записей на странице.
2025-03-28 17:04:30,530 - INFO - Добавлено 500 записей с этой страницы. Всего: 568344
2025-03-28 17:04:35,907 - INFO - Получено 500 записей на странице.
2025-03-28 17:04:35,922 - INFO - Добавлено 500 записей с этой страницы. Всего: 568844
2025-03-28 17:04:41,478 - INFO - Получено 500 записей на странице.
2025-03-28 17:04:41,491 - INFO - Добавлено 500 записей с этой страницы. Всего: 569344
2025-03-28 17:04:47,490 - INFO - Получено 500 записей на странице.
2025-03-28 17:04:47,503 - INFO - Добавлено 500 записей с этой страницы. Всего: 569844
2025-03-28 17:04:53,391 - INFO - Получено 500 записей на странице.
2025-03-28 17:04:53,404 - INFO - Добавлено 500 записей с этой страницы. Всего: 570344
2025-03-28 17:04:58,851 - INFO - Получено 500 записей на странице.
2025-03-28 17:0

2025-03-28 17:12:53,804 - INFO - Добавлено 500 записей с этой страницы. Всего: 591709
2025-03-28 17:12:59,205 - INFO - Получено 500 записей на странице.
2025-03-28 17:12:59,217 - INFO - Добавлено 498 записей с этой страницы. Всего: 592207
2025-03-28 17:13:34,661 - ERROR - Ошибка соединения: HTTPSConnectionPool(host='ows.goszakup.gov.kz', port=443): Read timed out., ждём 30 секунд и пробуем снова...
2025-03-28 17:14:05,166 - INFO - Получено 500 записей на странице.
2025-03-28 17:14:05,180 - INFO - Добавлено 487 записей с этой страницы. Всего: 592694
2025-03-28 17:14:10,695 - INFO - Получено 500 записей на странице.
2025-03-28 17:14:10,716 - INFO - Добавлено 499 записей с этой страницы. Всего: 593193
2025-03-28 17:14:16,224 - INFO - Получено 500 записей на странице.
2025-03-28 17:14:16,238 - INFO - Добавлено 498 записей с этой страницы. Всего: 593691
2025-03-28 17:14:21,932 - INFO - Получено 500 записей на странице.
2025-03-28 17:14:21,946 - INFO - Добавлено 496 записей с этой страницы. 

2025-03-28 17:20:35,935 - INFO - Получено 500 записей на странице.
2025-03-28 17:20:35,948 - INFO - Добавлено 500 записей с этой страницы. Всего: 616581
2025-03-28 17:20:41,698 - INFO - Получено 500 записей на странице.
2025-03-28 17:20:41,715 - INFO - Добавлено 500 записей с этой страницы. Всего: 617081
2025-03-28 17:20:47,487 - INFO - Получено 500 записей на странице.
2025-03-28 17:20:47,502 - INFO - Добавлено 500 записей с этой страницы. Всего: 617581
2025-03-28 17:20:53,012 - INFO - Получено 500 записей на странице.
2025-03-28 17:20:53,025 - INFO - Добавлено 500 записей с этой страницы. Всего: 618081
2025-03-28 17:20:58,537 - INFO - Получено 500 записей на странице.
2025-03-28 17:20:58,554 - INFO - Добавлено 487 записей с этой страницы. Всего: 618568
2025-03-28 17:21:04,106 - INFO - Получено 500 записей на странице.
2025-03-28 17:21:04,127 - INFO - Добавлено 497 записей с этой страницы. Всего: 619065
2025-03-28 17:21:09,832 - INFO - Получено 500 записей на странице.
2025-03-28 17:2

2025-03-28 17:28:25,966 - INFO - Получено 500 записей на странице.
2025-03-28 17:28:25,978 - INFO - Добавлено 500 записей с этой страницы. Всего: 641513
2025-03-28 17:28:31,424 - INFO - Получено 500 записей на странице.
2025-03-28 17:28:31,447 - INFO - Добавлено 500 записей с этой страницы. Всего: 642013
2025-03-28 17:28:36,988 - INFO - Получено 500 записей на странице.
2025-03-28 17:28:37,000 - INFO - Добавлено 500 записей с этой страницы. Всего: 642513
2025-03-28 17:28:42,671 - INFO - Получено 500 записей на странице.
2025-03-28 17:28:42,692 - INFO - Добавлено 500 записей с этой страницы. Всего: 643013
2025-03-28 17:28:48,088 - INFO - Получено 500 записей на странице.
2025-03-28 17:28:48,103 - INFO - Добавлено 500 записей с этой страницы. Всего: 643513
2025-03-28 17:28:53,622 - INFO - Получено 500 записей на странице.
2025-03-28 17:28:53,633 - INFO - Добавлено 497 записей с этой страницы. Всего: 644010
2025-03-28 17:28:59,439 - INFO - Получено 500 записей на странице.
2025-03-28 17:2

2025-03-28 17:34:13,847 - INFO - Получено 500 записей на странице.
2025-03-28 17:34:13,862 - INFO - Добавлено 500 записей с этой страницы. Всего: 666958
2025-03-28 17:34:19,279 - INFO - Получено 500 записей на странице.
2025-03-28 17:34:19,294 - INFO - Добавлено 500 записей с этой страницы. Всего: 667458
2025-03-28 17:34:24,778 - INFO - Получено 500 записей на странице.
2025-03-28 17:34:24,792 - INFO - Добавлено 500 записей с этой страницы. Всего: 667958
2025-03-28 17:34:30,194 - INFO - Получено 500 записей на странице.
2025-03-28 17:34:30,205 - INFO - Добавлено 500 записей с этой страницы. Всего: 668458
2025-03-28 17:34:30,233 - INFO - Сохранён временный файл: temp_parquet_files\temp_batch_63.parquet с 10488 записями
2025-03-28 17:34:36,991 - INFO - Получено 500 записей на странице.
2025-03-28 17:34:37,004 - INFO - Добавлено 500 записей с этой страницы. Всего: 668958
2025-03-28 17:34:42,450 - INFO - Получено 500 записей на странице.
2025-03-28 17:34:42,460 - INFO - Добавлено 500 запис

2025-03-28 17:40:56,974 - INFO - Получено 500 записей на странице.
2025-03-28 17:40:56,988 - INFO - Добавлено 480 записей с этой страницы. Всего: 691872
2025-03-28 17:41:02,515 - INFO - Получено 500 записей на странице.
2025-03-28 17:41:02,530 - INFO - Добавлено 497 записей с этой страницы. Всего: 692369
2025-03-28 17:41:07,940 - INFO - Получено 500 записей на странице.
2025-03-28 17:41:07,953 - INFO - Добавлено 500 записей с этой страницы. Всего: 692869
2025-03-28 17:41:13,354 - INFO - Получено 500 записей на странице.
2025-03-28 17:41:13,370 - INFO - Добавлено 500 записей с этой страницы. Всего: 693369
2025-03-28 17:41:18,895 - INFO - Получено 500 записей на странице.
2025-03-28 17:41:18,905 - INFO - Добавлено 500 записей с этой страницы. Всего: 693869
2025-03-28 17:41:25,153 - INFO - Получено 500 записей на странице.
2025-03-28 17:41:25,166 - INFO - Добавлено 500 записей с этой страницы. Всего: 694369
2025-03-28 17:41:30,528 - INFO - Получено 500 записей на странице.
2025-03-28 17:4

2025-03-28 17:45:46,113 - INFO - Добавлено 500 записей с этой страницы. Всего: 717812
2025-03-28 17:45:51,701 - INFO - Получено 500 записей на странице.
2025-03-28 17:45:51,717 - INFO - Добавлено 500 записей с этой страницы. Всего: 718312
2025-03-28 17:45:58,240 - INFO - Получено 500 записей на странице.
2025-03-28 17:45:58,254 - INFO - Добавлено 500 записей с этой страницы. Всего: 718812
2025-03-28 17:46:03,783 - INFO - Получено 500 записей на странице.
2025-03-28 17:46:03,797 - INFO - Добавлено 500 записей с этой страницы. Всего: 719312
2025-03-28 17:46:09,244 - INFO - Получено 500 записей на странице.
2025-03-28 17:46:09,256 - INFO - Добавлено 500 записей с этой страницы. Всего: 719812
2025-03-28 17:46:14,660 - INFO - Получено 500 записей на странице.
2025-03-28 17:46:14,676 - INFO - Добавлено 500 записей с этой страницы. Всего: 720312
2025-03-28 17:46:14,722 - INFO - Сохранён временный файл: temp_parquet_files\temp_batch_68.parquet с 10465 записями
2025-03-28 17:46:20,382 - INFO - 

2025-03-28 17:52:26,615 - INFO - Получено 500 записей на странице.
2025-03-28 17:52:26,628 - INFO - Добавлено 500 записей с этой страницы. Всего: 742809
2025-03-28 17:52:32,028 - INFO - Получено 500 записей на странице.
2025-03-28 17:52:32,041 - INFO - Добавлено 500 записей с этой страницы. Всего: 743309
2025-03-28 17:53:07,145 - ERROR - Таймаут запроса, ждём 30 секунд и пробуем снова...
2025-03-28 17:53:37,571 - INFO - Получено 500 записей на странице.
2025-03-28 17:53:37,585 - INFO - Добавлено 500 записей с этой страницы. Всего: 743809
2025-03-28 17:53:43,158 - INFO - Получено 500 записей на странице.
2025-03-28 17:53:43,168 - INFO - Добавлено 500 записей с этой страницы. Всего: 744309
2025-03-28 17:53:48,592 - INFO - Получено 500 записей на странице.
2025-03-28 17:53:48,607 - INFO - Добавлено 500 записей с этой страницы. Всего: 744809
2025-03-28 17:53:54,000 - INFO - Получено 500 записей на странице.
2025-03-28 17:53:54,014 - INFO - Добавлено 500 записей с этой страницы. Всего: 7453

2025-03-28 18:00:10,869 - INFO - Добавлено 500 записей с этой страницы. Всего: 767306
2025-03-28 18:00:16,363 - INFO - Получено 500 записей на странице.
2025-03-28 18:00:16,377 - INFO - Добавлено 500 записей с этой страницы. Всего: 767806
2025-03-28 18:00:22,017 - INFO - Получено 500 записей на странице.
2025-03-28 18:00:22,030 - INFO - Добавлено 500 записей с этой страницы. Всего: 768306
2025-03-28 18:00:27,563 - INFO - Получено 500 записей на странице.
2025-03-28 18:00:27,577 - INFO - Добавлено 500 записей с этой страницы. Всего: 768806
2025-03-28 18:00:33,217 - INFO - Получено 500 записей на странице.
2025-03-28 18:00:33,230 - INFO - Добавлено 500 записей с этой страницы. Всего: 769306
2025-03-28 18:00:38,674 - INFO - Получено 500 записей на странице.
2025-03-28 18:00:38,683 - INFO - Добавлено 440 записей с этой страницы. Всего: 769746
2025-03-28 18:00:44,172 - INFO - Получено 500 записей на странице.
2025-03-28 18:00:44,187 - INFO - Добавлено 500 записей с этой страницы. Всего: 770

2025-03-28 18:09:44,601 - INFO - Получено 500 записей на странице.
2025-03-28 18:09:44,615 - INFO - Добавлено 500 записей с этой страницы. Всего: 791745
2025-03-28 18:09:44,653 - INFO - Сохранён временный файл: temp_parquet_files\temp_batch_75.parquet с 10000 записями
2025-03-28 18:09:50,345 - INFO - Получено 500 записей на странице.
2025-03-28 18:09:50,359 - INFO - Добавлено 500 записей с этой страницы. Всего: 792245
2025-03-28 18:09:55,808 - INFO - Получено 500 записей на странице.
2025-03-28 18:09:55,822 - INFO - Добавлено 500 записей с этой страницы. Всего: 792745
2025-03-28 18:10:01,209 - INFO - Получено 500 записей на странице.
2025-03-28 18:10:01,223 - INFO - Добавлено 500 записей с этой страницы. Всего: 793245
2025-03-28 18:10:06,670 - INFO - Получено 500 записей на странице.
2025-03-28 18:10:06,684 - INFO - Добавлено 500 записей с этой страницы. Всего: 793745
2025-03-28 18:10:12,087 - INFO - Получено 500 записей на странице.
2025-03-28 18:10:12,105 - INFO - Добавлено 500 запис

2025-03-28 18:15:21,702 - INFO - Добавлено 500 записей с этой страницы. Всего: 816745
2025-03-28 18:15:27,073 - INFO - Получено 500 записей на странице.
2025-03-28 18:15:27,087 - INFO - Добавлено 500 записей с этой страницы. Всего: 817245
2025-03-28 18:15:32,483 - INFO - Получено 500 записей на странице.
2025-03-28 18:15:32,495 - INFO - Добавлено 500 записей с этой страницы. Всего: 817745
2025-03-28 18:16:08,019 - ERROR - Ошибка соединения: HTTPSConnectionPool(host='ows.goszakup.gov.kz', port=443): Read timed out., ждём 30 секунд и пробуем снова...
2025-03-28 18:16:38,504 - INFO - Получено 500 записей на странице.
2025-03-28 18:16:38,517 - INFO - Добавлено 500 записей с этой страницы. Всего: 818245
2025-03-28 18:16:43,973 - INFO - Получено 500 записей на странице.
2025-03-28 18:16:43,986 - INFO - Добавлено 500 записей с этой страницы. Всего: 818745
2025-03-28 18:16:49,453 - INFO - Получено 500 записей на странице.
2025-03-28 18:16:49,466 - INFO - Добавлено 500 записей с этой страницы. 

2025-03-28 18:22:53,588 - INFO - Добавлено 500 записей с этой страницы. Всего: 841245
2025-03-28 18:22:58,900 - INFO - Получено 500 записей на странице.
2025-03-28 18:22:58,912 - INFO - Добавлено 500 записей с этой страницы. Всего: 841745
2025-03-28 18:22:58,951 - INFO - Сохранён временный файл: temp_parquet_files\temp_batch_80.parquet с 10000 записями
2025-03-28 18:23:04,483 - INFO - Получено 500 записей на странице.
2025-03-28 18:23:04,497 - INFO - Добавлено 500 записей с этой страницы. Всего: 842245
2025-03-28 18:23:09,917 - INFO - Получено 500 записей на странице.
2025-03-28 18:23:09,931 - INFO - Добавлено 500 записей с этой страницы. Всего: 842745
2025-03-28 18:23:15,355 - INFO - Получено 500 записей на странице.
2025-03-28 18:23:15,369 - INFO - Добавлено 500 записей с этой страницы. Всего: 843245
2025-03-28 18:23:20,785 - INFO - Получено 500 записей на странице.
2025-03-28 18:23:20,799 - INFO - Добавлено 500 записей с этой страницы. Всего: 843745
2025-03-28 18:23:26,405 - INFO - 