### Récupération des bibliothèques essentielles

In [4]:
import os
import requests
import json
import sys
from SPARQLWrapper import SPARQLWrapper, JSON
from PIL import Image
from PIL.ExifTags import TAGS
from io import BytesIO

### Pull de 100 oeuvres d'art (formats png, jpeg, etc.) depuis Wikidata

In [None]:
import os
import sys
import json
import requests
from io import BytesIO
from PIL import Image
from SPARQLWrapper import SPARQLWrapper, JSON

# Crée le dossier pour les images si ce n'est pas déjà fait
def create_images_folder():
    if not os.path.exists("images"):
        os.makedirs("images")
        print("Dossier 'images' créé.")

# Effectue une requête pour récupérer les données depuis Wikidata
def get_wikidata_images(query):
    endpoint_url = "https://query.wikidata.org/sparql"
    user_agent = "WDQS-example Python/%s.%s" % (sys.version_info[0], sys.version_info[1])
    sparql = SPARQLWrapper(endpoint_url, agent=user_agent)
    sparql.setQuery(query)
    sparql.setReturnFormat(JSON)
    return sparql.query().convert()

# Télécharge les images depuis Wikidata et récupère leurs métadonnées
def download_images_from_wikidata(num_images=100):
    query = """
    SELECT ?item ?itemLabel ?title ?artistLabel ?year ?typeLabel ?movementLabel 
           ?materialLabel ?locationLabel ?depictsLabel ?countryLabel ?pic
    WHERE {
      ?item wdt:P31 wd:Q3305213;  # L'œuvre d'art
            wdt:P18 ?pic.         # Image associée

      OPTIONAL { ?item wdt:P1476 ?title. }         # Titre
      OPTIONAL { ?item wdt:P170 ?artist. }         # Artiste
      OPTIONAL { ?item wdt:P571 ?date. }           # Date de création
      OPTIONAL { ?item wdt:P31 ?type. }            # Type d'œuvre
      OPTIONAL { ?item wdt:P135 ?movement. }       # Mouvement artistique
      OPTIONAL { ?item wdt:P186 ?material. }       # Matériau utilisé
      OPTIONAL { ?item wdt:P276 ?location. }       # Lieu de conservation
      OPTIONAL { ?item wdt:P180 ?depicts. }        # Sujet représenté
      OPTIONAL { ?item wdt:P495 ?country. }        # Pays d’origine

      # Extraction de l'année seulement
      BIND(YEAR(?date) AS ?year)

      SERVICE wikibase:label { bd:serviceParam wikibase:language "fr,en". }
    }
    LIMIT 100
    """
    
    results = get_wikidata_images(query)
    image_data = []

    for result in results["results"]["bindings"]:
        # Récupérer les informations de chaque œuvre
        data = {
            "item": result["item"]["value"],
            "title": result.get("title", {}).get("value", ""),
            "artist": result.get("artistLabel", {}).get("value", ""),
            "year": result.get("year", {}).get("value", ""),
            "type": result.get("typeLabel", {}).get("value", ""),
            "movement": result.get("movementLabel", {}).get("value", ""),
            "material": result.get("materialLabel", {}).get("value", ""),
            "location": result.get("locationLabel", {}).get("value", ""),
            "depicts": result.get("depictsLabel", {}).get("value", ""),
            "country": result.get("countryLabel", {}).get("value", ""),
            "pic": result["pic"]["value"]
        }
        
        image_data.append(data)

    # Télécharger les images et les ajouter au fichier metadata.json
    downloaded_images = []
    headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'}

    for idx, data in enumerate(image_data[:num_images]):
        try:
            img_response = requests.get(data["pic"], headers=headers)
            img = Image.open(BytesIO(img_response.content))
            extension = img.format.lower()
            filename = f"images/image_{idx}.{extension}"
            img.save(filename)
            
            # Ajouter les tags dans les métadonnées sous forme de hashtags
            tags = []
            if data["artist"]:
                tags.append(f"#{data['artist'].replace(' ', '')}")
            if data["title"]:
                tags.append(f"#{data['title'].replace(' ', '')}")
            if data["year"]:
                tags.append(f"#{data['year']}")
            if data["type"]:
                tags.append(f"#{data['type'].replace(' ', '')}")
            if data["movement"]:
                tags.append(f"#{data['movement'].replace(' ', '')}")
            if data["material"]:
                tags.append(f"#{data['material'].replace(' ', '')}")
            if data["location"]:
                tags.append(f"#{data['location'].replace(' ', '')}")
            if data["depicts"]:
                tags.append(f"#{data['depicts'].replace(' ', '')}")
            if data["country"]:
                tags.append(f"#{data['country'].replace(' ', '')}")
            
            # Récupérer les autres informations : orientation, taille, format
            img_width, img_height = img.size
            orientation = "Portrait" if img_height > img_width else "Paysage" if img_width > img_height else "Carré"
            metadata = {
                "filename": f"image_{idx}.{extension}",
                "tags": tags,
                "orientation": orientation,
                "size": [img_width, img_height],
                "format": extension,
            }

            # Sauvegarder les métadonnées dans le fichier
            save_metadata(metadata)

            downloaded_images.append(filename)
            print(f"Image enregistrée : {filename}")

        except Exception as e:
            print(f"Erreur lors du téléchargement de {data['pic']}: {e}")
    
    return downloaded_images

# Sauvegarde les métadonnées des images sous forme de tags dans un fichier JSON
def save_metadata(metadata, output_json="metadata.json"):
    try:
        # Ouvrir le fichier en mode append et vérifier si c'est la première image
        file_exists = os.path.exists(output_json)

        with open(output_json, "a", encoding="utf-8") as f:
            if not file_exists:
                f.write("[\n")  # Ajouter l'ouverture de la liste si c'est le premier élément
            else:
                f.write(",\n")  # Ajouter une virgule avant chaque nouvelle entrée
            json.dump(metadata, f, indent=4, ensure_ascii=False)
            f.write("\n")  # S'assurer que chaque objet est sur une nouvelle ligne
        print(f"Métadonnées enregistrées dans {output_json}")
    except Exception as e:
        print(f"Erreur lors de la sauvegarde des métadonnées : {e}")

# Fonction principale : lancer le téléchargement et la sauvegarde des métadonnées
def main():
    create_images_folder()
    images = download_images_from_wikidata()
    if images:
        print(f"{len(images)} images téléchargées.")
    else:
        print("Aucune image téléchargée.")
    
    # Ajoute la fermeture du tableau JSON à la fin du fichier
    with open("metadata.json", "a", encoding="utf-8") as f:
        f.write("\n]")

if __name__ == "__main__":
    main()


Dossier 'images' créé.
Métadonnées enregistrées dans metadata.json
Image enregistrée : images/image_0.jpeg
Métadonnées enregistrées dans metadata.json
Image enregistrée : images/image_1.jpeg
Métadonnées enregistrées dans metadata.json
Image enregistrée : images/image_2.jpeg
Métadonnées enregistrées dans metadata.json
Image enregistrée : images/image_3.jpeg
Métadonnées enregistrées dans metadata.json
Image enregistrée : images/image_4.jpeg
Métadonnées enregistrées dans metadata.json
Image enregistrée : images/image_5.jpeg
Métadonnées enregistrées dans metadata.json
Image enregistrée : images/image_6.jpeg
Métadonnées enregistrées dans metadata.json
Image enregistrée : images/image_7.jpeg
Métadonnées enregistrées dans metadata.json
Image enregistrée : images/image_8.jpeg
Métadonnées enregistrées dans metadata.json
Image enregistrée : images/image_9.jpeg
Métadonnées enregistrées dans metadata.json
Image enregistrée : images/image_10.jpeg
Métadonnées enregistrées dans metadata.json
Image en

### Récupération des couleurs prédominantes sur chaque image

In [None]:
import os
import json
import numpy as np
from PIL import Image
from sklearn.cluster import KMeans
import matplotlib.colors as mcolors

def get_dominant_color(image_path, n_colors=3):
    try:
        # On vérifie si l'image est bien RGB
        img = Image.open(image_path).convert('RGB')
        
        # On redimensionne l'image pour accélérer le traitement
        img = img.resize((img.width // 10, img.height // 10))
        
        # L'image est convertie en tableau numpy
        img_array = np.array(img)
        
        # Construction d'un tableau où chaque ligne équivaut à 1 pixel
        pixels = img_array.reshape(-1, 3)
        
        # Utilisation de KMeans pour trouver les couleurs
        kmeans = KMeans(n_clusters=n_colors)
        kmeans.fit(pixels)
        
        # On récupère les couleurs
        dominant_colors = kmeans.cluster_centers_.astype(int)
        
        # Conversion des couleurs en héxadécimal
        dominant_colors_hex = [mcolors.rgb2hex(c / 255.0) for c in dominant_colors]
        
        return dominant_colors_hex
    except Exception as e:
        print(f"Erreur lors du traitement de l'image {image_path}: {e}")
        return []

def process_images_in_folder(folder_path, n_colors=3):
    dominant_colors_per_image = {}
    
    # On boucle sur les images présentent dans le dossier /images
    for filename in os.listdir(folder_path):
        file_path = os.path.join(folder_path, filename)
        
        # Check si il s'agit bien d'une image (et pas d'un autre type de fichier)
        if filename.lower().endswith(('.png', '.jpg', '.jpeg')):
            try:
                # Appel de la fonction pour déterminer les couleurs dominantes
                dominant_colors = get_dominant_color(file_path, n_colors)
                # Si la fonction détecte bien des couleurs
                if dominant_colors:
                    # Ajout au tableau des couleurs par images
                    dominant_colors_per_image[filename] = dominant_colors
            except Exception as e:
                print(f"Erreur lors du traitement de {filename}: {e}")
    
    return dominant_colors_per_image

def update_metadata_with_colors(metadata_path, folder_path, n_colors=3):
    try:
        # On charge les metadonnées existantes dans metadata.json
        with open(metadata_path, 'r', encoding='utf-8') as f:
            metadata = json.load(f)
    except Exception as e:
        print(f"Erreur lors du chargement de {metadata_path}: {e}")
        return

    # Appel de la fonction qui boucle sur toutes les images du dossier (et qui appel la fonction pour déterminer les couleurs dominantes)
    dominant_colors_per_image = process_images_in_folder(folder_path, n_colors)
    
    # On met à jour les metadonnées
    for entry in metadata:
        # Pour chaque image (= filename)
        if 'filename' in entry:
            filename = entry['filename']
            # Si des couleurs ont bien été trouvées pour cette image/file
            if filename in dominant_colors_per_image:
                # On ajoute le champ "colors" avec les couleurs associées.
                entry['colors'] = dominant_colors_per_image[filename]
        else:
            print(f"Entrée invalide sans 'filename' : {entry}")

    # Sauvegarder les métadonnées mises à jour dans le fichier
    try:
        with open(metadata_path, 'w', encoding='utf-8') as f:
            json.dump(metadata, f, indent=4, ensure_ascii=False)
        print(f"Les métadonnées ont été mises à jour avec les couleurs.")
    except Exception as e:
        print(f"Erreur lors de la sauvegarde des métadonnées : {e}")

def main():
    metadata_path = "metadata.json"  # Chemin vers le fichier metadata
    folder_path = "images"  # Dossier contenant les images
    
    # Check si le répertoire des images existe
    if not os.path.exists(folder_path):
        print(f"Le dossier '{folder_path}' n'existe pas. Vérifiez le chemin.")
        return
    
    # Check si le fichier des métadonnées existe
    if not os.path.exists(metadata_path):
        print(f"Le fichier '{metadata_path}' n'existe pas. Vérifiez le chemin.")
        return
    
    # Appel de la fonction racine pour lancer les programmes spécifiques (ouverture des images, association des couleurs et écriture dans le fichier metadata.json)
    update_metadata_with_colors(metadata_path, folder_path)
    
if __name__ == "__main__":
    main()


image_42.jpeg: ['#110e10', '#bca288', '#553a36']
image_25.jpeg: ['#110e10', '#bca288', '#553a36']
image_16.jpeg: ['#110d10', '#bba187', '#543936']
image_70.jpeg: ['#694039', '#c1baa7', '#9d795b']
image_2.jpeg: ['#553a36', '#110e10', '#bca288']
image_26.jpeg: ['#543936', '#bba187', '#110d10']
image_58.jpeg: ['#7d8675', '#485a4e', '#b7b79c']
image_20.jpeg: ['#110e10', '#553a36', '#bca288']
image_97.jpeg: ['#afa485', '#5a4d3a', '#817860']
image_41.jpeg: ['#110e10', '#553a36', '#bca288']
image_47.jpeg: ['#543936', '#bba187', '#110d10']
image_32.jpeg: ['#110d10', '#bba187', '#543936']
image_17.jpeg: ['#110d10', '#bba187', '#543936']
image_83.jpeg: ['#373222', '#d1cdc9', '#757572']
image_89.jpeg: ['#584c39', '#aea385', '#7f765d']
image_51.jpeg: ['#b4b49a', '#778272', '#43564a']
image_53.jpeg: ['#7d8775', '#485a4e', '#b7b79d']
image_63.jpeg: ['#6a4139', '#9e7a5c', '#c2bba9']
image_29.jpeg: ['#110e10', '#553a36', '#bca288']
image_22.jpeg: ['#bca288', '#110e10', '#553a36']
image_5.jpeg: ['#5439