In [1]:
from serpapi import GoogleSearch
import json
import requests
from environs import Env
from datetime import datetime


env = Env()
env.read_env("../../.env")
# Clé d'API SerpApi
API_KEY = env.str("SERPAPI_KEY")

def get_images(api_key, search: str, page: int = 1, pays_requete: str = "US"):
    # Paramètres de recherche
    params = {
        "api_key": api_key,
        "q": search,
        "engine": "google_images",
        "cc": pays_requete,
        "ijn": page,  # ce paramètre correspond à la page de google image à télécharger
    }

    # Appel de l'API SerpApi
    search = GoogleSearch(params)  # nous donne la réponse de l'appel api

    results = search.get_dict()  # JSON -> Python dict
    json_object = json.dumps(results, indent=4)

    with open("search_result.json", "w") as outfile:
        outfile.write(json_object)

    return results



def store_images(json_file, destination_folder: str):
    day = datetime.now()

    with open(json_file) as f:
        results = json.load(f)

    # Dossier de destination pour enregistrer les images
    destination_folder = f"../photos_brutes/{destination_folder}"

    # headers pour passer dans certains cas une sécurité qui bloque les algo de scrapping
    headers = {
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3"
    }
    if "error" not in results and "images_results" in results:
        images = results["images_results"]
        for i, image in enumerate(images):
            image_url = image["original"]
            if image_url:
                # num = i + 100 # penser à mettre la bonne centaine ici, cela a pour but de nommer différemment nos images
                file_name = (
                    f"image_{day.strftime('%Y-%m-%d_%H-%M')}_{i}.jpg"  # nom du fichier
                )
                try:
                    response = requests.get(image_url, headers=headers, timeout=10)
                    # Enregistrer l'image dans le dossier de destination
                    if response.status_code == 200:
                        print(f"image : {i}")
                        with open(f"{destination_folder}/{file_name}", "wb") as file:
                            file.write(response.content)
                            print(f"Image enregistrée : {file_name}")
                    else:
                        print(f"Echec du téléchargement de l'image : {image_url}")
                        continue
                except Exception as e:
                    print(e)

In [6]:
res = get_images(API_KEY, "Les temples d’Angkor", page=2, pays_requete="fr")

In [7]:
destination_folder = ["rome_grece", "amerique_sud", "asie_sud_est","chateau_europe", "parthenon", "chateau_bodiam", "angkor"]
store_images("search_result.json", destination_folder[6])
print('requete terminée')

image : 0
Image enregistrée : image_2023-07-08_17-44_0.jpg
image : 1
Image enregistrée : image_2023-07-08_17-44_1.jpg
image : 2
Image enregistrée : image_2023-07-08_17-44_2.jpg
image : 3
Image enregistrée : image_2023-07-08_17-44_3.jpg
image : 4
Image enregistrée : image_2023-07-08_17-44_4.jpg
image : 5
Image enregistrée : image_2023-07-08_17-44_5.jpg
image : 6
Image enregistrée : image_2023-07-08_17-44_6.jpg
image : 7
Image enregistrée : image_2023-07-08_17-44_7.jpg
image : 8
Image enregistrée : image_2023-07-08_17-44_8.jpg
image : 9
Image enregistrée : image_2023-07-08_17-44_9.jpg
image : 10
Image enregistrée : image_2023-07-08_17-44_10.jpg
image : 11
Image enregistrée : image_2023-07-08_17-44_11.jpg
image : 12
Image enregistrée : image_2023-07-08_17-44_12.jpg
image : 13
Image enregistrée : image_2023-07-08_17-44_13.jpg
image : 14
Image enregistrée : image_2023-07-08_17-44_14.jpg
image : 15
Image enregistrée : image_2023-07-08_17-44_15.jpg
image : 16
Image enregistrée : image_2023-07