# Install libs

In [None]:
# !pip install ...

# Import libs

In [1]:
# import ...

# Download Data

In [None]:
import requests
import zipfile
import os
from urllib.parse import urlencode


def download_and_unzip_yandex_disk(public_url, extract_to_folder):
    """
    Скачивает и распаковывает файл с Яндекс.Диска по публичной ссылке.

    :param public_url: Публичная ссылка на файл на Яндекс.Диске.
    :param extract_to_folder: Папка, куда нужно распаковать архив.
    """
    print(f"Начинаю обработку ссылки: {public_url}")

    # 1. Получаем прямую ссылку для скачивания
    base_api_url = "https://cloud-api.yandex.net/v1/disk/public/resources/download?"
    api_url = base_api_url + urlencode(dict(public_key=public_url))

    try:
        response = requests.get(api_url)
        response.raise_for_status()  # Проверяем на ошибки HTTP
        download_url = response.json().get("href")

        if not download_url:
            print(f"Ошибка: Не удалось получить прямую ссылку для {public_url}")
            return

        print("Прямая ссылка на скачивание получена.")

        # 2. Скачиваем файл
        print("Скачивание файла...")
        download_response = requests.get(download_url)
        download_response.raise_for_status()

        # Временное имя для zip файла
        zip_filename = "temp_download.zip"

        with open(zip_filename, "wb") as f:
            f.write(download_response.content)
        print(f"Файл '{zip_filename}' успешно скачан.")

        # 3. Распаковываем архив
        print(f"Распаковка архива в папку '{extract_to_folder}'...")
        if not os.path.exists(extract_to_folder):
            os.makedirs(extract_to_folder)

        with zipfile.ZipFile(zip_filename, "r") as zip_ref:
            zip_ref.extractall(extract_to_folder)
        print(f"Файлы успешно распакованы в '{extract_to_folder}'.")

        # 4. Удаляем скачанный zip-архив
        os.remove(zip_filename)
        print(f"Временный файл '{zip_filename}' удален.")

    except requests.exceptions.RequestException as e:
        print(f"Произошла ошибка сети или API: {e}")
        print("Совет: Убедитесь, что ваша среда имеет доступ к 'cloud-api.yandex.net'.")
    except Exception as e:
        print(f"Произошла непредвиденная ошибка: {e}")


# --- ОСНОВНОЙ КОД ---
# Определяем наши данные
files_to_download = {
    "train": {
        "url": "https://disk.yandex.ru/d/RRXJu9ZtEmSXzQ",  # Используйте стандартную ссылку
        "folder": "train_data",
    },
    "test": {
        "url": "https://disk.yandex.ru/d/TmbB7BsGzg1dQQ",  # Используйте стандартную ссылку
        "folder": "test_data",
    },
}

# Запускаем процесс для каждого файла
for key, data in files_to_download.items():
    download_and_unzip_yandex_disk(data["url"], data["folder"])
    print("-" * 20)

print("\nВсе операции завершены!")


[31mERROR: Could not find a version that satisfies the requirement zipfile (from versions: none)[0m[31m
[0m[31mERROR: No matching distribution found for zipfile[0m[31m
[0mНачинаю обработку ссылки: https://disk.yandex.ru/d/RRXJu9ZtEmSXzQ
Прямая ссылка на скачивание получена.
Скачивание файла...
Файл 'temp_download.zip' успешно скачан.
Распаковка архива в папку 'train_data'...
Файлы успешно распакованы в 'train_data'.
Временный файл 'temp_download.zip' удален.
--------------------
Начинаю обработку ссылки: https://disk.yandex.ru/d/TmbB7BsGzg1dQQ
Прямая ссылка на скачивание получена.
Скачивание файла...
Файл 'temp_download.zip' успешно скачан.
Распаковка архива в папку 'test_data'...
Файлы успешно распакованы в 'test_data'.
Временный файл 'temp_download.zip' удален.
--------------------

Все операции завершены!
