In [20]:
import requests  # 웹 요청을 보내기 위한 라이브러리
from bs4 import BeautifulSoup  # HTML 파싱을 위한 라이브러리
import os  # 파일 시스템 작업을 위한 라이브러리
import time  # 시간 관련 기능을 위한 라이브러리
from urllib.parse import quote_plus  # URL 인코딩을 위한 함수

def image_crawler(search_query, save_path, duration_minutes):
    # 크롤링 시작 및 종료 시간 설정
    start_time = time.time()  # 현재 시간을 시작 시간으로 설정
    end_time = start_time + (duration_minutes * 60)  # 종료 시간 계산

    # Google 이미지 검색 URL 생성
    base_url = "https://www.google.com/search?q={}&tbm=isch"
    search_url = base_url.format(quote_plus(search_query))  # 검색어를 URL에 안전하게 삽입

    # 이미지를 저장할 디렉토리 생성
    os.makedirs(save_path, exist_ok=True)  # 디렉토리가 이미 존재해도 오류 발생하지 않음

    page = 1  # 페이지 번호 초기화
    while time.time() < end_time:  # 설정된 시간 동안 반복
        # Google 이미지 검색 페이지에 요청 보내기
        
        response = requests.get(search_url + f"&start={page * 20}")
        soup = BeautifulSoup(response.text, 'html.parser')  # HTML 파싱
        img_tags = soup.find_all('img')  # 모든 이미지 태그 찾기

        for img in img_tags[1:]:  # 첫 번째 이미지(Google 로고)를 제외하고 반복
            try:
                img_url = img['src']  # 이미지 URL 추출
                if img_url.startswith('http'):  # http로 시작하는 유효한 URL인지 확인
                    # 이미지 다운로드
                    img_data = requests.get(img_url).content
                    # 이미지 파일명 생성
                    img_name = f"{search_query}_{page}_{img_tags.index(img)}.jpg"
                    # 이미지 저장
                    with open(os.path.join(save_path, img_name), 'wb') as f:
                        f.write(img_data)
                    print(f"이미지 저장됨: {img_name}")
            except Exception as e:
                print(f"이미지 다운로드 중 오류 발생: {e}")

        page += 1  # 다음 페이지로 이동
        if time.time() >= end_time:  # 설정된 시간이 지나면 종료
            break

        time.sleep(2)  # 2초간 대기 (과도한 요청 방지)

    print(f"{duration_minutes}분 동안 크롤링 완료.")

# 사용자 입력 받기
search_query = input("검색어를 입력하세요: ")  # 예: '고양이에게 안전한 식물'
save_path = input("저장할 경로를 입력하세요: ")  # 예: 'images/safe_plants'
duration_minutes = int(input("크롤링 시간(분)을 입력하세요: "))  # 예: 30

# 이미지 크롤러 실행
image_crawler(search_query, save_path, duration_minutes)

이미지 저장됨: 개박하_1_1.jpg
이미지 저장됨: 개박하_1_2.jpg
이미지 저장됨: 개박하_1_3.jpg
이미지 저장됨: 개박하_1_4.jpg
이미지 저장됨: 개박하_1_5.jpg
이미지 저장됨: 개박하_1_6.jpg
이미지 저장됨: 개박하_1_7.jpg
이미지 저장됨: 개박하_1_8.jpg
이미지 저장됨: 개박하_1_9.jpg
이미지 저장됨: 개박하_1_10.jpg
이미지 저장됨: 개박하_1_11.jpg
이미지 저장됨: 개박하_1_12.jpg
이미지 저장됨: 개박하_1_13.jpg
이미지 저장됨: 개박하_1_14.jpg
이미지 저장됨: 개박하_1_15.jpg
이미지 저장됨: 개박하_1_16.jpg
이미지 저장됨: 개박하_1_17.jpg
이미지 저장됨: 개박하_1_18.jpg
이미지 저장됨: 개박하_1_19.jpg
이미지 저장됨: 개박하_1_20.jpg
이미지 저장됨: 개박하_2_1.jpg
이미지 저장됨: 개박하_2_2.jpg
이미지 저장됨: 개박하_2_3.jpg
이미지 저장됨: 개박하_2_4.jpg
이미지 저장됨: 개박하_2_5.jpg
이미지 저장됨: 개박하_2_6.jpg
이미지 저장됨: 개박하_2_7.jpg
이미지 저장됨: 개박하_2_8.jpg
이미지 저장됨: 개박하_2_9.jpg
이미지 저장됨: 개박하_2_10.jpg
이미지 저장됨: 개박하_2_11.jpg
이미지 저장됨: 개박하_2_12.jpg
이미지 저장됨: 개박하_2_13.jpg
이미지 저장됨: 개박하_2_14.jpg
이미지 저장됨: 개박하_2_15.jpg
이미지 저장됨: 개박하_2_16.jpg
이미지 저장됨: 개박하_2_17.jpg
이미지 저장됨: 개박하_2_18.jpg
이미지 저장됨: 개박하_2_19.jpg
이미지 저장됨: 개박하_2_20.jpg
이미지 저장됨: 개박하_3_1.jpg
이미지 저장됨: 개박하_3_2.jpg
이미지 저장됨: 개박하_3_3.jpg
이미지 저장됨: 개박하_3_4.jpg
이미지 저장됨: 개박하_3_5.jpg
이미지 저장됨: 개박하_3_6.jpg
이미지 저장됨: 개박하