In [3]:
import requests
import os
from PIL import Image
from io import BytesIO
import json

# Création du dossier 'images'
os.makedirs('images', exist_ok=True)

# Fonction pour obtenir les URL des images depuis Wikidata
def get_image_urls(limit=100):
    query = """
    SELECT ?image WHERE {
      ?item wdt:P18 ?image
      SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
    }
    LIMIT {}
    """.format(limit)

    url = 'https://query.wikidata.org/sparql'
    headers = {'User-Agent': 'GrimoireBot/0.1 (https://example.com/grimoire)'}
    response = requests.get(url, headers=headers, params={'query': query, 'format': 'json'})
    
    if response.status_code == 200:
        results = response.json()['results']['bindings']
        return [result['image']['value'] for result in results]
    else:
        raise Exception("Erreur lors de la récupération des URL d'images depuis Wikidata.")

# Fonction pour télécharger une image et ses métadonnées
def download_image(image_url, image_num):
    try:
        response = requests.get(image_url)
        if response.status_code == 200:
            # Enregistrer l'image
            image_path = f'images/image_{image_num}.jpg'
            with open(image_path, 'wb') as f:
                f.write(response.content)

            # Extraction des métadonnées
            image = Image.open(BytesIO(response.content))
            image_metadata = image._getexif()
            metadata_path = f'images/metadata_{image_num}.json'
            with open(metadata_path, 'w') as f:
                json.dump(image_metadata, f)

            return True
        else:
            return False
    except Exception as e:
        print(f"Erreur lors du téléchargement de l'image {image_num}: {e}")
        return False

# Obtenir les URL des images depuis Wikidata
image_urls = get_image_urls(100)

# Télécharger les images et leurs métadonnées
for i, image_url in enumerate(image_urls):
    success = download_image(image_url, i)
    if not success:
        print(f"Échec du téléchargement de l'image numéro {i}.")


KeyError: '\n      ?item wdt'