In [1]:
from selenium import webdriver
import os
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin

# Flask 서버 실행 주소
url = 'http://localhost:5000/display'

# Selenium을 이용하여 JavaScript 렌더링 후의 HTML을 가져오기
driver = webdriver.Chrome()  # 브라우저 드라이버 경로에 맞게 수정
driver.get(url)
html = driver.page_source
driver.quit()

# BeautifulSoup을 사용하여 HTML 파싱
soup = BeautifulSoup(html, 'html.parser')

# 이미지 및 설명 저장을 위한 디렉토리 생성
os.makedirs('images', exist_ok=True)

# 이미지 주소 및 설명 추출 및 저장
for i, (img_tag, desc_tag) in enumerate(zip(soup.find_all('img'), soup.find_all('td', class_=None))):
    img_src = urljoin(url, img_tag.get('src'))
    img_data = requests.get(img_src).content

    # 이미지 저장
    img_filename = os.path.join('images', f"{i}.jpg")
    with open(img_filename, 'wb') as img_file:
        img_file.write(img_data)

    # 설명 저장
    desc_text = desc_tag.get_text(strip=True)
    desc_filename = os.path.join('images', f"{i}_description.txt")
    with open(desc_filename, 'w') as desc_file:
        desc_file.write(desc_text)

    print(f"이미지 주소: {img_src}")
    print(f"이미지 저장: {img_filename}")
    print(f"이미지 설명: {desc_text}")
    print(f"설명 저장: {desc_filename}")
    print("=" * 50)


이미지 주소: http://localhost:5000/static/uploads/image_1.jpg
이미지 저장: images\0.jpg
이미지 설명: 
설명 저장: images\0_description.txt
이미지 주소: http://localhost:5000/static/uploads/image_2.jpg
이미지 저장: images\1.jpg
이미지 설명: not yet...
설명 저장: images\1_description.txt
이미지 주소: http://localhost:5000/static/uploads/image_3.jpg
이미지 저장: images\2.jpg
이미지 설명: 
설명 저장: images\2_description.txt
