In [1]:
import os
import time
import requests
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager

def download_google_image_thumbnails(query_list, limit=50, output_dir='google_thumbnails'):
    # 셀레니움 옵션
    options = Options()
    options.add_argument("window-size=1920x1080")
    options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64)")
    # options.add_argument("--headless")  # 필요 시 사용

    service = Service(ChromeDriverManager().install())
    driver = webdriver.Chrome(service=service, options=options)

    try:
        os.makedirs(output_dir, exist_ok=True)

        for query in query_list:
            print(f"\n🔍 검색어: {query}")
            url = f"https://www.google.com/search?hl=ko&tbm=isch&q={query}"
            driver.get(url)
            time.sleep(2)

            # 스크롤 내려서 더 많은 이미지 로딩
            for _ in range(20):
                driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
                time.sleep(0.5)

            # 이미지 태그 수집
            imgs = driver.find_elements("tag name", "img")
            print(f"🔎 [{query}] 이미지 발견: {len(imgs)}개")

            # 검색어별 하위 폴더 생성
            query_dir = os.path.join(output_dir, query)
            os.makedirs(query_dir, exist_ok=True)

            count = 0
            for img in imgs:
                src = img.get_attribute("src")
                
                # ✅ 첫 번째 로고 필터링
                if not src or not src.startswith("http"):
                    continue
                if "google.com" in src or src.endswith(".gif"):
                    continue  # 로고 또는 gif는 제외

                try:
                    response = requests.get(src, timeout=10)
                    file_ext = src.split('.')[-1].split('?')[0]
                    if len(file_ext) > 5: file_ext = 'jpg'
                    filename = f"{query}_{count+1}.{file_ext}"
                    filepath = os.path.join(query_dir, filename)
                    with open(filepath, 'wb') as f:
                        f.write(response.content)
                    print(f"✅ [{query}] 이미지 {count+1} 저장됨")
                    count += 1
                except Exception as e:
                    print(f"⚠️ [{query}] 다운로드 실패: {e}")

                if count >= limit:
                    break


                if count >= limit:
                    break

            print(f"🎉 [{query}] 다운로드 완료: {count}장")

    finally:
        driver.quit()

if __name__ == "__main__":
    # 여기에 원하는 키워드를 넣으세요
    keywords = ["데못죽", "박문대", "선아현"]
    download_google_image_thumbnails(keywords, limit=30)



🔍 검색어: 데못죽
🔎 [데못죽] 이미지 발견: 21개
✅ [데못죽] 이미지 1 저장됨
✅ [데못죽] 이미지 2 저장됨
✅ [데못죽] 이미지 3 저장됨
✅ [데못죽] 이미지 4 저장됨
✅ [데못죽] 이미지 5 저장됨
✅ [데못죽] 이미지 6 저장됨
✅ [데못죽] 이미지 7 저장됨
✅ [데못죽] 이미지 8 저장됨
✅ [데못죽] 이미지 9 저장됨
✅ [데못죽] 이미지 10 저장됨
✅ [데못죽] 이미지 11 저장됨
✅ [데못죽] 이미지 12 저장됨
✅ [데못죽] 이미지 13 저장됨
✅ [데못죽] 이미지 14 저장됨
✅ [데못죽] 이미지 15 저장됨
✅ [데못죽] 이미지 16 저장됨
✅ [데못죽] 이미지 17 저장됨
✅ [데못죽] 이미지 18 저장됨
✅ [데못죽] 이미지 19 저장됨
✅ [데못죽] 이미지 20 저장됨
🎉 [데못죽] 다운로드 완료: 20장

🔍 검색어: 박문대
🔎 [박문대] 이미지 발견: 21개
✅ [박문대] 이미지 1 저장됨
✅ [박문대] 이미지 2 저장됨
✅ [박문대] 이미지 3 저장됨
✅ [박문대] 이미지 4 저장됨
✅ [박문대] 이미지 5 저장됨
✅ [박문대] 이미지 6 저장됨
✅ [박문대] 이미지 7 저장됨
✅ [박문대] 이미지 8 저장됨
✅ [박문대] 이미지 9 저장됨
✅ [박문대] 이미지 10 저장됨
✅ [박문대] 이미지 11 저장됨
✅ [박문대] 이미지 12 저장됨
✅ [박문대] 이미지 13 저장됨
✅ [박문대] 이미지 14 저장됨
✅ [박문대] 이미지 15 저장됨
✅ [박문대] 이미지 16 저장됨
✅ [박문대] 이미지 17 저장됨
✅ [박문대] 이미지 18 저장됨
✅ [박문대] 이미지 19 저장됨
✅ [박문대] 이미지 20 저장됨
🎉 [박문대] 다운로드 완료: 20장

🔍 검색어: 선아현
🔎 [선아현] 이미지 발견: 21개
✅ [선아현] 이미지 1 저장됨
✅ [선아현] 이미지 2 저장됨
✅ [선아현] 이미지 3 저장됨
✅ [선아현] 이미지 4 저장됨
✅ [선아현] 이미지 5 저장됨
✅ [선아현] 이미지 6 저장됨
✅ [선아현] 이미지 