In [11]:
import xml.etree.ElementTree as ET
import datetime
from rdflib.graph import Graph, Literal, Namespace, URIRef
from rdflib.namespace import Namespace, OWL, RDF, RDFS, FOAF, DCTERMS, XSD, SDO
import pandas as pd


In [21]:
df = pd.read_csv("../CSVS/famille.csv", sep=",", encoding="utf-8").fillna("")
for index, row in df.iterrows():
    label = row["Label"]
    origine = row["Langue_origine"]



Romane Latin
Slave Proto-slave
Germanique Proto-germanique
Celtique Proto-celtique


In [6]:
def createClass(name, parentClass, labelEn, labelFr, comment, graph=graph, onto=onto):
    concept = URIRef(onto[name])
    graph.add((concept, RDF.type, OWL.Class))
    if parentClass is not None:
        graph.add((concept, RDFS.subClassOf, parentClass))
    if labelEn is not None:
        graph.add((concept, RDFS.label, Literal(labelEn, lang="en")))
    if labelFr is not None:
        graph.add((concept, RDFS.label, Literal(labelFr, lang="fr")))
    if comment is not None:
        graph.add((concept, RDFS.comment, Literal(comment)))
    return concept

def createObjectRelation(name, domainType, rangeType, graph=graph, onto=onto):
    rel = URIRef(onto[name])
    graph.add((rel, RDF.type, OWL.ObjectProperty))
    if domainType is not None:
        dom = onto[domainType]
        graph.add((rel, RDFS.domain, dom))
    if rangeType is not None:
        ran = onto[rangeType]
        graph.add((rel, RDFS.range, ran))
    return rel

def addLanguePaysRelation(lang, pays, graph=graph, onto=onto):
    l = URIRef(onto[lang])
    graph.add((l, RDF.type, onto.pays))

    lg = Literal(lang, lang='fr')
    graph.add((l, SDO.lang, lg))

    pays = Literal(pays, datatype=XSD['pays'])
    graph.add((l, SDO['est_parlé_en'], pays))

    return l
def addLangueFamilleRelation(lang, Famille):
    l = URIRef(lang[langue])
    graph.add((l, RDF.type, lang.Famille))

    lg = Literal(lang, lang='fr')
    graph.add((l, SDO.lang, lg))

    # pays = Literal(pays, datatype=XSD['famille'])
    # graph.add((l, SDO['estDansLaFamille'], pays))

    return l

def addLangue(lang):
    lg = URIRef(languesSlaves[lang])
    graph.add((lg, FOAF.givenName, Literal(lang)))
    return lg

def addAlphabet(alph):
    al = URIRef(alphabet[alph])
    graph.add((al, FOAF.givenName, Literal(alph)))
    return al


def addPays(pays):
    p = URIRef(languesSlaves[pays])
    graph.add((p, FOAF.givenName, Literal(pays)))
    return p

# def addLangueFamille(name, family):
#     lg = languesSlaves[name]
#     familyType = languesSlaves[family]
#     graph.add((lg, RDF.type, familyType))
#     return lg



In [None]:
guesSlaves = Namespace("http://www.sorbonne-universite.fr/web_semantique/languesSlaves/ontology#")

graph = Graph()
graph.bind("languesSlaves", languesSlaves)
LanguesSlaves = createClass("LanguesSlaves",None,None,None,None)
pays = createClass("Pays",None,None,None,None)
langue = createClass("Langue",None,None,None,None)
alphabet = createClass("Alphabet",None,None,None,None)
# serbe = createClass("Serbe",None,None,None,None)
# croate = createClass("Croate",None,None,None,None)
# russe = createClass("Russe",None,None,None,None)

estDansLaFamille = createObjectRelation("estDansLaFamille","Langue","LanguesSlaves")
est_parlé_en = createObjectRelation("est_parlé_en","Langue","Pays")

#Alphabets:
latin = addAlphabet("Latin")
cyrillique = addAlphabet("Cyrillique")


#Langues slaves
Serbe = addLangue("Serbe")
Croate = addLangue("Croate")
Russe = addLangue("Russe")
Ukrainien = addLangue("Ukrainien")
Biélorusse = addLangue("Biélorusse")
Polonais = addLangue("Polonais")
Tchèque = addLangue("Tchèque")
Slovaque = addLangue("Slovaque")
Slovène = addLangue("Slovène")
Macédonien = addLangue("Macédonien")
Bulgare = addLangue("Bulgare")

#Pays slaves
Serbie = addPays("Serbie")
Croatie = addPays("Croatie")
Russie = addPays("Fédération_de_la_Russie")
Ukraine = addPays("Ukraine")
Biélorussie = addPays("Biélorussie")
Pologne = addPays("Pologne")
République_Tchèque = addPays("République_Tchèque")
Slovaquie = addPays("Slovaquie")
Slovénie = addPays("Slovénie")
Macédoine_du_Nord = addPays("Macédoine_du_Nord")
Bulgarie = addPays("Bulgarie")

#relation langues-pays
#relation langues-famille de langue
addLanguePaysRelation(Serbe,Serbie)
addLangueFamilleRelation(Serbe,LanguesSlaves)

addLanguePaysRelation(Croate,Croatie)
addLangueFamilleRelation(Croate,LanguesSlaves)

addLanguePaysRelation(Russe,Russie)
addLangueFamilleRelation(Russe,LanguesSlaves)

addLanguePaysRelation(Biélorusse,Biélorussie)
addLangueFamilleRelation(Biélorusse,LanguesSlaves)

addLanguePaysRelation(Ukrainien,Ukraine)
addLangueFamilleRelation(Ukrainien,LanguesSlaves)

addLanguePaysRelation(Polonais,Pologne)
addLangueFamilleRelation(Polonais,LanguesSlaves)

addLanguePaysRelation(Tchèque,République_Tchèque)
addLangueFamilleRelation(Tchèque,LanguesSlaves)

addLanguePaysRelation(Slovaque,Slovaquie)
addLangueFamilleRelation(Slovaque,LanguesSlaves)

addLanguePaysRelation(Slovène,Slovénie)
addLangueFamilleRelation(Slovène,LanguesSlaves)

addLanguePaysRelation(Bulgare,Bulgarie)
addLangueFamilleRelation(Bulgare,LanguesSlaves)

addLanguePaysRelation(Macédonien,Macédoine_du_Nord)
addLangueFamilleRelation(Macédonien,LanguesSlaves)

#print(graph.serialize(format="turtle"))
graph.serialize('OntoSlaves2.ttl', format="turtle")


In [None]:

### Création du graph
OntoSeals = Namespace("http://www.semanticweb.org/alexa/ontologies/2023/2/untitled-ontology-4#")
DBpedia = Namespace("http://dbpedia.org/resource/")
SCHEMA = Namespace("http://schema.org/")
FOAF = Namespace("http://xmlns.com/foaf/0.1/")
DC = Namespace("http://purl.org/dc/elements/1.1/")

graph = Graph()
graph.bind("OntoSeals", OntoSeals)
graph.bind("DBpedia", DBpedia)
graph.bind("schema", SCHEMA)
graph.bind("foaf", FOAF)
graph.bind("dc", DC)



### Créer des instances de classes correspondantes
class Instance:
    def __init__(self, label, graph, classe):
        self.label = label
        self.nom = "_".join(label.split())
        self.uri = URIRef(OntoSeals[self.nom])

        graph.add((self.uri, RDF.type, classe))

class Personne(Instance):
    pass
class Materiau(Instance):
    pass
class Date(Instance):
    pass
class Collection(Instance):
    pass
class Periode(Instance):
    pass
class Titre(Instance):
    pass
class Mention_obligatoire(Instance):
    pass
class Avers(Instance):
    pass
class Revers(Instance):
    pass
class Description(Instance):
    pass
class Bibliographie(Instance):
    pass

    # def contient_article(self, article):
    #     graph.add((self.uri, contient_article, article.uri))
# class Article(Instance):
#     pass

class Inventaire(Instance):
    #ajouter les relations entre les individuals
    def a_date(self, date):
        graph.add((self.uri, OntoSeals.a_date, date.uri))

    def est_de_type(self, titre):
        graph.add((self.uri, OntoSeals.est_de_type, titre.uri))

    def appartient_a(self, personne):
        graph.add((self.uri, OntoSeals.appartient_a, personne.uri))

    def a_materiau(self, materiau):
        graph.add((self.uri, OntoSeals.a_materiau, materiau.uri))

    def est_ds_collection(self, collection):
        graph.add((self.uri, OntoSeals.est_ds_collection, collection.uri))

    def a_periode(self, periode):
        graph.add((self.uri, OntoSeals.a_periode, periode.uri))

    def a_mention_obligatoire(self, mention_obligatoire):
        graph.add((self.uri, OntoSeals.a_mention_obligatoire, mention_obligatoire.uri))

    def contient_avers(self, avers):
        graph.add((self.uri, OntoSeals.contient_avers, avers.uri))

    def contient_revers(self, revers):
        graph.add((self.uri, OntoSeals.contient_revers, revers.uri))

    def a_description(self, description):
        graph.add((self.uri, OntoSeals.a_description, description.uri))

    def a_bibliographie(self, bibliographie):
        graph.add((self.uri, OntoSeals.a_bibliographie, bibliographie.uri))


### les fonctions:
def createClass(name, parentClass, labelEn, labelFr, comment):
    concept = URIRef(OntoSeals[name])
    graph.add((concept, RDF.type, OWL.Class))
    if parentClass is not None:
        graph.add((concept, RDFS.subClassOf, parentClass))
    if labelEn is not None:
        graph.add((concept, RDFS.label, Literal(labelEn, lang="en")))
    if labelFr is not None:
        graph.add((concept, RDFS.label, Literal(labelFr, lang="fr")))
    if comment is not None:
        graph.add((concept, RDFS.comment, Literal(comment)))
    return concept


def createObjectRelation(name, domainType, rangeType):
    rel = URIRef(OntoSeals[name])
    graph.add((rel, RDF.type, OWL.ObjectProperty))
    if domainType is not None:
        dom = OntoSeals[domainType]
        graph.add((rel, RDFS.domain, dom))
    if rangeType is not None:
        ran = OntoSeals[rangeType]
        graph.add((rel, RDFS.range, ran))
    return rel

### Création des classes dans l'ontologie:
titre = createClass("Titre",None, None, None, None)
date = createClass("Date",None, None, None, None)
personne = createClass("Personne",None, None, None, None)
materiau = createClass("Materiau",None, None, None, None)
inventaire = createClass("Inventaire",None, None, None, None)
collection = createClass("Collection",None, None, None, None)
periode = createClass("Periode",None, None, None, None)
mention_obligatoire = createClass("Mention_obligatoire",None, None, None, None)
avers = createClass("Avers",None, None, None, None)
revers = createClass("Revers",None, None, None, None)
description = createClass("Description",None, None, None, None)
bibliographie = createClass("Bibliographie",None, None, None, None)
# article = createClass("Article",None, None, None, None)



# création de relations entre les domaines créées:
est_de_type = createObjectRelation("est_de_type","Inventaire","Titre")
a_date = createObjectRelation("a_date","Inventaire","Date")
appartient_a = createObjectRelation("appartient_a","Inventaire","Personne")
a_materiau = createObjectRelation("a_materiau","Inventaire","Materiau")
est_ds_collection = createObjectRelation("est_ds_collection","Inventaire","Collection")
a_periode = createObjectRelation("a_periode","Inventaire","Periode")
a_mention_obligatoire = createObjectRelation("a_mention_obligatoire","Inventaire","Mention_obligatoire")
contient_avers = createObjectRelation("contient_avers","Inventaire","Avers")
contient_revers = createObjectRelation("contient_revers","Inventaire","Revers")
a_description = createObjectRelation("a_description","Inventaire","Description")
a_bibliographie = createObjectRelation("a_bibliographie","Inventaire","Bibliographie")
# contient_article = createObjectRelation("contient_article","Bibliographie","Article")

#contient_personnages = createObjectRelation("contient_personnages","Inventaire","Personnage")



# Charger le fichier XML
tree = ET.parse('Sceaux byzantins v4.xml')
root = tree.getroot()

### Extraction du contenu des balises :

#création de listes pour stocker le contenu textuel extrait entre les balises
materiaux_lst = []
personnes_lst = []
dates_lst = []
inventaires_lst = []

titres_lst = []
collections_lst = []
periodes_lst = []
mention_obligatoires_lst = []
avers_lst = []
revers_lst = []
descriptions_lst = []
bibliographies_lst= []
# articles_lst = []

#boucle for pour extraire le contenu des balises:
for objet in root.findall('Seal'):
    #trouver les balises du fichier XML et le contenu de ces balises
    objet_materiau = objet.find('Materiaux').text
    objet_personnes = objet.find('Person').text
    objet_dates = objet.find('Date').text
    objet_inventaire = objet.find('Inventaire').text

    objet_titre = objet.find('Titre').text
    objet_collection = objet.find('Collection').text

    try:
        objet_periode = objet.find('Periode').text
    except AttributeError:
        objet_periode = ""

    objet_mention_obligatoire = objet.find('Mention_obligatoire').text

    try:
        objet_avers = objet.find('Avers').text
    except AttributeError:
        objet_avers = ""

    try:
        objet_revers = objet.find('Revers').text
    except AttributeError:
        objet_revers = ""

    try:
        objet_description = objet.find('Description').text
    except AttributeError:
        objet_description = ""

    try:
        objet_bibliographie = objet.find('Bibliographie').text
    except AttributeError:
        objet_bibliographie = ""

    # objet_article = objet.find('Article').text


    objet_dates = objet_dates.split(";")
    objet_personnes = objet_personnes.split(";")


    #On associe chaque instances individuellement au contenu correspondant:

    #pour pouvoir relier chaque balises à chacun des sceaux stocké dans la balise Inventaire
    inv = Inventaire(objet_inventaire, graph, inventaire)
    biblio = Bibliographie(objet_bibliographie, graph, bibliographie)

    #Titre pour le type d'objet
    elt_titre = Titre(objet_titre, graph, titre)
    #print(elt_titre.uri)
    inv.a_date(elt_date)

    #Date
    for elt in objet_dates:
       elt_date =  Date(elt, graph, date)
       inv.a_date(elt_date)

    #Person (Personne)
    for elt in objet_personnes:
        elt_personne = Personne(elt, graph,  personne)
        inv.appartient_a(elt_personne)

    #Materiau
    elt_materiau = Materiau(objet_materiau, graph, materiau)
    inv.a_materiau(elt_materiau)

    #Collection
    elt_collection = Collection(objet_collection, graph, collection)
    inv.est_ds_collection(elt_collection)

    #Periode
    elt_periode = Periode(objet_periode, graph, periode)
    inv.a_periode(elt_periode)

    #Mention_obligatoire
    elt_mentObl = Mention_obligatoire(objet_mention_obligatoire, graph, mention_obligatoire)
    inv.a_mention_obligatoire(elt_mentObl)

    #Avers
    elt_avers = Avers(objet_avers, graph, avers)
    inv.contient_avers(elt_avers)

    #Revers
    elt_revers = Revers(objet_revers, graph, revers)
    inv.contient_revers(elt_revers)

    #Description
    elt_desc = Description(objet_description, graph, description)
    inv.a_description(elt_desc)

    #Bibliographie
    elt_biblio = Bibliographie(objet_bibliographie, graph, bibliographie)
    inv.a_bibliographie(elt_biblio)

    # #Article
    # for elt in objet_article:
    #     elt_article = Article(elt, graph, article)
    #     biblio.contient_article(elt_article)



    #ajouter le contenu dans les variables correspondantes
    # materiaux.append(materiau)
    # personnages_lst.append(personnages)
    # dates_lst.append(dates)
    # inventaires.append(inventaire)



#pour séparer les dates dans une même balise, quand il y en a plusieurs:
# dates = []
# for lst_date in dates_lst:
#     dates += lst_date

# personnages = []
# for lst_perso in personnages_lst:
#     personnages += lst_perso



### Créer des instances de classes pour chaque donnée extraite:
# materiaux_instances = [Materiau(nom, graph, materiau) for nom in set(materiaux)]
# personnages_instances = [Personnage(nom, graph, personnage) for nom in set(personnages)]
# dates_instances = [Date(valeur, graph, date) for valeur in set(dates)]
# inventaires_instances = [Inventaire(valeur, graph, inventaire) for valeur in set(inventaires)]





### Save graph:
#print(graph.serialize(format="turtle"))
#graph.serialize('OntoSeals2.ttl', format="turtle")
graph.serialize('OntoSeals5_XMLoriginal.ttl', format="turtle")
