# Загрузка данных с сайта "Карта ДТП"

Данный скрипт выгружает архивы датасетов с сайта ["Карта ДТП"](https://dtp-stat.ru/opendata), а затем распаковывает их.

## 1. Загрузка библиотек

In [11]:
import requests
from bs4 import BeautifulSoup
import os
import zipfile

## 2. Скачивание архивов с сайта

URL страницы с данными:

In [None]:
url = 'https://dtp-stat.ru/opendata'

Создаем папку для сохранения файлов, если она не существует:

In [None]:
os.makedirs('geojson_files_zip', exist_ok=True)

Получаем содержимое страницы:

In [None]:
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')

Находим все ссылки на файлы ZIP и скачиваем эти файлы:

In [10]:
for link in soup.find_all('a', href=True):
    href = link['href']
    if href.endswith('.zip'):
        # Полный URL файла
        file_url = href if href.startswith('http') else f'https://dtp-stat.ru{href}'
        
        # Скачиваем файл
        print(f'Скачиваем {file_url}')
        file_response = requests.get(file_url)
        
        # Сохраняем файл
        file_name = os.path.join('geojson_files_zip', os.path.basename(href))
        with open(file_name, 'wb') as f:
            f.write(file_response.content)

print('Скачивание завершено.')

Скачиваем https://cms.dtp-stat.ru/media/opendata/amurskaia-oblast.geojson.zip
Скачиваем https://cms.dtp-stat.ru/media/opendata/arkhangelskaia-oblast.geojson.zip
Скачиваем https://cms.dtp-stat.ru/media/opendata/astrakhanskaia-oblast.geojson.zip
Скачиваем https://cms.dtp-stat.ru/media/opendata/belgorodskaia-oblast.geojson.zip
Скачиваем https://cms.dtp-stat.ru/media/opendata/brianskaia-oblast.geojson.zip
Скачиваем https://cms.dtp-stat.ru/media/opendata/vladimirskaia-oblast.geojson.zip
Скачиваем https://cms.dtp-stat.ru/media/opendata/volgogradskaia-oblast.geojson.zip
Скачиваем https://cms.dtp-stat.ru/media/opendata/vologodskaia-oblast.geojson.zip
Скачиваем https://cms.dtp-stat.ru/media/opendata/voronezhskaia-oblast.geojson.zip
Скачиваем https://cms.dtp-stat.ru/media/opendata/evreiskaia-avtonomnaia-oblast.geojson.zip
Скачиваем https://cms.dtp-stat.ru/media/opendata/zabaikalskii-krai.geojson.zip
Скачиваем https://cms.dtp-stat.ru/media/opendata/ivanovskaia-oblast.geojson.zip
Скачиваем https:/

## 3. Распаковка архивов

Путь к папке, содержащей ZIP-файлы:

In [None]:
zip_folder = 'geojson_files_zip'

Путь к папке, куда будут распакованы файлы:

In [None]:
output_folder = 'geojson_files'

Создаем папку для распаковки, если она не существует:

In [None]:
os.makedirs(output_folder, exist_ok=True)

Распаковываем все заархивированные файлы:

In [None]:
for filename in os.listdir(zip_folder):
    if filename.endswith('.zip'):
        zip_path = os.path.join(zip_folder, filename)
        print(f'Распаковываем {zip_path}...')
        
        # Открываем ZIP-файл и распаковываем его содержимое
        with zipfile.ZipFile(zip_path, 'r') as zip_ref:
            zip_ref.extractall(output_folder)

print('Распаковка завершена.')

Удаляем папку с архивами для освобождения места на диске:

In [16]:
if os.path.exists(zip_folder) and os.path.isdir(zip_folder):
    # Проходим по всем файлам и подкаталогам в папке
    for root, dirs, files in os.walk(zip_folder, topdown=False):
        # Удаляем все файлы
        for file in files:
            file_path = os.path.join(root, file)
            os.remove(file_path)
            print(f'Удален файл: {file_path}')
        
        # Удаляем все подкаталоги
        for dir in dirs:
            dir_path = os.path.join(root, dir)
            os.rmdir(dir_path)
            print(f'Удален каталог: {dir_path}')
    
    # Удаляем саму папку
    os.rmdir(zip_folder)
    print(f'Папка "{zip_folder}" была успешно удалена.')
else:
    print(f'Папка "{zip_folder}" не существует.')

Удален файл: geojson_files_zip/sevastopol.geojson.zip
Удален файл: geojson_files_zip/respublika-kareliia.geojson.zip
Удален файл: geojson_files_zip/magadanskaia-oblast.geojson.zip
Удален файл: geojson_files_zip/respublika-adygeia-adygeia.geojson.zip
Удален файл: geojson_files_zip/samarskaia-oblast.geojson.zip
Удален файл: geojson_files_zip/riazanskaia-oblast.geojson.zip
Удален файл: geojson_files_zip/cheliabinskaia-oblast.geojson.zip
Удален файл: geojson_files_zip/irkutskaia-oblast.geojson.zip
Удален файл: geojson_files_zip/tulskaia-oblast.geojson.zip
Удален файл: geojson_files_zip/respublika-altai.geojson.zip
Удален файл: geojson_files_zip/iaroslavskaia-oblast.geojson.zip
Удален файл: geojson_files_zip/ivanovskaia-oblast.geojson.zip
Удален файл: geojson_files_zip/smolenskaia-oblast.geojson.zip
Удален файл: geojson_files_zip/kaliningradskaia-oblast.geojson.zip
Удален файл: geojson_files_zip/pskovskaia-oblast.geojson.zip
Удален файл: geojson_files_zip/respublika-marii-el.geojson.zip
Уда