In [4]:
import time
import requests
from io import BytesIO
from PIL import Image
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from selenium.common.exceptions import StaleElementReferenceException

# Настройки Chrome
chrome_options = Options()
chrome_options.add_argument(
    "user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) "
    "AppleWebKit/537.36 (KHTML, like Gecko) "
    "Chrome/90.0.4430.93 Safari/537.36"
)
chrome_options.add_experimental_option("prefs", {"intl.accept_languages": "en-US"})

# Укажите путь к chromedriver
service = Service(executable_path=r"C:\Users\anuar\Downloads\chromedriver-win64\chromedriver-win64\chromedriver.exe")
driver = webdriver.Chrome(service=service, options=chrome_options)

# URL страницы презентации Canva
url = 'https://www.canva.com/design/DAGgAsJboV8/Sq59kN_MQCgAfaxunAQuEw/edit?utlId=h7a792b4383'
driver.get(url)

# Даем время на полную загрузку страницы

# Находим контейнер слайдов (элемент с классами "LGNDdw ogIqug")
try:
    container = driver.find_element(By.CSS_SELECTOR, "div.LGNDdw.ogIqug")
except Exception as e:
    print(f"Контейнер слайдов не найден: {e}")
    driver.quit()
    exit()

# Инициализируем список для сохранения всех найденных ссылок
collected_img_urls = []

# Получаем общую ширину контейнера и устанавливаем начальную позицию прокрутки
container_width = driver.execute_script("return arguments[0].scrollWidth", container)
current_scroll = 0
step = 100  # шаг прокрутки в пикселях

# Прокручиваем контейнер медленно вправо, на каждом шаге собирая новые ссылки
while current_scroll < container_width:
    driver.execute_script("arguments[0].scrollLeft = arguments[1];", container, current_scroll)
    time.sleep(0.5)  # задержка для подгрузки контента

    # Получаем свежий список изображений на каждом шаге
    img_elements = driver.find_elements(By.CSS_SELECTOR, "img.vmQN7A")
    for img in img_elements:
        try:
            src = img.get_attribute('src')
            if src and src not in collected_img_urls:
                collected_img_urls.append(src)
        except StaleElementReferenceException:
            # Если элемент устарел, пропускаем его
            continue

    current_scroll += step
    # Обновляем общую ширину контейнера, если она изменилась
    container_width = driver.execute_script("return arguments[0].scrollWidth", container)

# Дополнительное ожидание для полной загрузки контента
time.sleep(3)

# Выводим собранные ссылки
print(f"Найдено уникальных ссылок: {len(collected_img_urls)}")
for src in collected_img_urls:
    print(src)

# Скачиваем изображения по найденным URL и сохраняем их в список объектов PIL Image
images = []
for img_url in collected_img_urls:
    try:
        response = requests.get(img_url)
        if response.status_code == 200:
            image = Image.open(BytesIO(response.content))
            # Приводим изображение к режиму RGB (требование для сохранения в PDF)
            if image.mode != 'RGB':
                image = image.convert('RGB')
            images.append(image)
        else:
            print(f"Ошибка загрузки изображения {img_url}: {response.status_code}")
    except Exception as e:
        print(f"Ошибка при обработке изображения {img_url}: {e}")

# Если изображения найдены, объединяем их в один PDF-файл
if images:
    pdf_filename = 'presentation.pdf'
    images[0].save(pdf_filename, save_all=True, append_images=images[1:])
    print(f'PDF сохранён как {pdf_filename}')
else:
    print("Изображения не найдены или не удалось их скачать.")

driver.quit()


Найдено уникальных ссылок: 34
https://document-export.canva.com/JboV8/DAGgAsJboV8/8/thumbnail/0001.png?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAQYCGKMUHWDTJW6UD%2F20250311%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20250311T024402Z&X-Amz-Expires=31889&X-Amz-Signature=a324536e51c4c4446e92c7d71bcdefc68597a28784ae924733756df94142d217&X-Amz-SignedHeaders=host&response-expires=Tue%2C%2011%20Mar%202025%2011%3A35%3A31%20GMT
https://document-export.canva.com/JboV8/DAGgAsJboV8/8/thumbnail/0002.png?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAQYCGKMUHWDTJW6UD%2F20250310%2Fus-east-1%2Fs3%2Faws4_request&X-Amz-Date=20250310T235624Z&X-Amz-Expires=44524&X-Amz-Signature=8527acdc452e92687abd141c09f0f7742f4c71ee1d0ed93e6eea9cb021695c24&X-Amz-SignedHeaders=host&response-expires=Tue%2C%2011%20Mar%202025%2012%3A18%3A28%20GMT
https://document-export.canva.com/JboV8/DAGgAsJboV8/12/thumbnail/0003.png?X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Credential=AKIAQYCGKMUHWDTJW6UD%2F20250310%2Fus-e