In [None]:
# FONCTION POUR LA PEINTURE

import csv
import json
import os
from datetime import datetime

# chemins
CSV_FILE = "oeuvres.csv"
OUTPUT_DIR = "json_output"

os.makedirs(OUTPUT_DIR, exist_ok=True)

with open(CSV_FILE, newline="", encoding="utf-8") as csvfile:
    reader = csv.DictReader(csvfile, delimiter=",")

    for row in reader:
        type_oeuvre = row.get("Type d'oeuvre", "").strip().lower()

        # filtrage peinture / gravure
        if type_oeuvre not in ["peinture"]:
            continue

        xml_id = row.get("xml:id", "").strip()
        if not xml_id:
            continue

        creator = []

        # ajout conditionnel du peintre
        peintre = row.get("Artiste (xml:id)", "").strip()
        if peintre:
            creator.append(
                {
                    "xml_id": peintre,
                    "role": "peintre"
                }
            )

        # ajout conditionnel de l'auteur modèle
        auteur_modele = row.get("Auteur modèle", "").strip()
        if auteur_modele:
            creator.append(
                {
                    "xml_id": auteur_modele,
                    "role": "auteur du modèle"
                }
            )

        bibliography = []
        zotero_key = row.get("Ref bibliographie", "")
        if zotero_key:
            bibliography.append(
                {
                    "zotero_key": zotero_key,
                    "location": row.get("Page bibliographie", "")
                }
            )




        data = {
            "id": xml_id,
            "QID_wikidata": row.get("Wikidata", ""),
            "title": row.get("Titre de l'oeuvre", ""),
            "creator": creator,
            "entry_type": "painting",
            "materialsAndTechniques": "",
            "dateCreated": {
                "startYear": "",
                "endYear": "",
                "text": ""
            },
            "holding_institution": {
                "place": "",
                "name": row.get("Institution de conservation", ""),
                "inventory_number": row.get("N° d'inventaire", ""),
                "URL": row.get("Lien image", "")
            },
            "related_works": [],
            "bibliography": bibliography,
            "illustrations": [],
            "commentary": row.get("Note", ""),
            "history": [
                {
                    "date": datetime.now().isoformat(),
                    "type": "created",
                    "author": "Pierre"
                }
            ]
        }

        output_path = os.path.join(OUTPUT_DIR, f"{xml_id}.json")
        with open(output_path, "w", encoding="utf-8") as jsonfile:
            json.dump(data, jsonfile, ensure_ascii=False, indent=2)

print("Conversion terminée.")

Conversion terminée.


In [2]:
# FONCTION POUR L'ARCHITECTURE

import csv
import json
import os
from datetime import datetime

# chemins
CSV_FILE = "oeuvres.csv"
OUTPUT_DIR = "json_output"

os.makedirs(OUTPUT_DIR, exist_ok=True)

with open(CSV_FILE, newline="", encoding="utf-8") as csvfile:
    reader = csv.DictReader(csvfile, delimiter=",")

    for row in reader:
        type_oeuvre = row.get("Type d'oeuvre", "").strip().lower()

        # filtrage peinture / gravure
        if type_oeuvre not in ["architecture"]:
            continue

        xml_id = row.get("xml:id", "").strip()
        if not xml_id:
            continue

        creator = []

        # ajout conditionnel du peintre
        architecte = row.get("Artiste (xml:id)", "").strip()
        if architecte:
            creator.append(
                {
                    "xml_id": architecte,
                    "role": "architecte"
                }
            )

        # ajout conditionnel de l'auteur modèle
        auteur_modele = row.get("Auteur modèle", "").strip()
        if auteur_modele:
            creator.append(
                {
                    "xml_id": auteur_modele,
                    "role": "auteur du modèle"
                }
            )

        bibliography = []
        zotero_key = row.get("Ref bibliographie", "")
        if zotero_key:
            bibliography.append(
                {
                    "zotero_key": zotero_key,
                    "location": row.get("Page bibliographie", "")
                }
            )

        data = {
            "id": xml_id,
            "QID_wikidata": row.get("Wikidata", ""),
            "title": row.get("Titre de l'oeuvre", ""),
            "creator": creator,
            "entry_type": "architecture",
            "typology": "",
            "dateCreated": {
                "startYear": "",
                "endYear": "",
                "text": ""
            },
            "location": {
                "city":"",
                "country": "",
                "coordinates":{
                    "latitude":"",
                    "longitude":""
                }
            },
            "related_works": [],
            "bibliography": bibliography,
            "illustrations": [],
            "description": "",
            "commentary": row.get("Note", ""),
            "history": [
                {
                    "date": datetime.now().isoformat(),
                    "type": "created",
                    "author": "Pierre"
                }
            ]
        }

        output_path = os.path.join(OUTPUT_DIR, f"{xml_id}.json")
        with open(output_path, "w", encoding="utf-8") as jsonfile:
            json.dump(data, jsonfile, ensure_ascii=False, indent=2)

print("Conversion terminée.")

Conversion terminée.


In [1]:
import os
import json

DOSSIER = "../data/entry_peinture"

for fichier in os.listdir(DOSSIER):
    if not fichier.endswith(".json"):
        continue

    chemin = os.path.join(DOSSIER, fichier)
    nom_id = os.path.splitext(fichier)[0]  # enlève .json

    try:
        with open(chemin, "r", encoding="utf-8") as f:
            data = json.load(f)

        json_id = str(data.get("id"))

        if json_id != nom_id:
            print(f"Incohérence : {fichier} → id dans le json = {json_id}")

    except json.JSONDecodeError:
        print(f"JSON invalide : {fichier}")
    except Exception as e:
        print(f"Erreur avec {fichier} : {e}")


Incohérence : LeonXRaphael.json → id dans le json = RaphaelLeonX
Incohérence : RaphaelDelivrancePierre copy.json → id dans le json = RaphaelDelivrancePierre
Incohérence : RaphaelMiracleBolsena.json → id dans le json = RaphaelMesseBolsena
Incohérence : RaphaelTransfiguration copy.json → id dans le json = RaphaelTransfiguration
Incohérence : VeroneseCana copy.json → id dans le json = VeroneseCana


In [5]:
import os
import json
from collections import OrderedDict

DOSSIER = "../data/entry_peinture"

for fichier in os.listdir(DOSSIER):
    if not fichier.endswith(".json"):
        continue

    chemin = os.path.join(DOSSIER, fichier)

    try:
        with open(chemin, "r", encoding="utf-8") as f:
            data = json.load(f, object_pairs_hook=OrderedDict)

        # Si description existe déjà, on ne touche pas
        if "description" in data:
            continue

        new_data = OrderedDict()

        for key, value in data.items():
            if key == "commentary":
                new_data["description"] = ""
            new_data[key] = value

        with open(chemin, "w", encoding="utf-8") as f:
            json.dump(new_data, f, indent=2, ensure_ascii=False)

        print(f"✔ description ajoutée dans {fichier}")

    except json.JSONDecodeError:
        print(f"❌ JSON invalide : {fichier}")
    except Exception as e:
        print(f"❌ Erreur avec {fichier} : {e}")


✔ description ajoutée dans AndreaAndreaniTriompheGrave.json
✔ description ajoutée dans Louvre.json
✔ description ajoutée dans MantegnaTriompheCesar.json


In [6]:
DOSSIER = "../data/entry_peinture"

for fichier in os.listdir(DOSSIER):
    if not fichier.endswith(".json"):
        continue

    chemin = os.path.join(DOSSIER, fichier)

    try:
        with open(chemin, "r", encoding="utf-8") as f:
            data = json.load(f)

        if data.get("entry_type") == "painting":
            data["entry_type"] = "peinture"

            with open(chemin, "w", encoding="utf-8") as f:
                json.dump(data, f, indent=2, ensure_ascii=False)

            print(f"✔ entry_type corrigé dans {fichier}")

    except json.JSONDecodeError:
        print(f"❌ JSON invalide : {fichier}")
    except Exception as e:
        print(f"❌ Erreur avec {fichier} : {e}")


✔ entry_type corrigé dans CarracheGalerieFarnese.json
✔ entry_type corrigé dans CopieLeonardCeneParis.json
✔ entry_type corrigé dans CorregeCoupoleAssomption.json
✔ entry_type corrigé dans DaCarpiVeroniquePaulPierre.json
✔ entry_type corrigé dans LeonardAdamEve.json
✔ entry_type corrigé dans LeonardAdorationMages.json
✔ entry_type corrigé dans LeonardAnghiari.json
✔ entry_type corrigé dans LeonardAssomptionMilan.json
✔ entry_type corrigé dans LeonardCartonBurlington.json
✔ entry_type corrigé dans LeonardCene.json
✔ entry_type corrigé dans LeonardDessinNeptune.json
✔ entry_type corrigé dans LeonardGinevraBenci.json
✔ entry_type corrigé dans LeonardIsabelleEste.json
✔ entry_type corrigé dans LeonardJoconde.json
✔ entry_type corrigé dans LeonardLionMecanique.json
✔ entry_type corrigé dans LeonardMadoneOeillet.json
✔ entry_type corrigé dans LeonardMeduse.json
✔ entry_type corrigé dans LeonardSainteAnne.json
✔ entry_type corrigé dans LeonardViergeRochers.json
✔ entry_type corrigé dans Loges