In [1]:
#!/usr/bin/python
# -*- coding: utf-8 -*-
!pip install rdflib



In [2]:
from Extractors import *
from rdflib import Graph, RDF, URIRef
from rdflib.namespace import RDF, XSD, FOAF, Namespace

In [3]:
graphe = Graph()
graphe.parse(location="TTLFiles/field.ttl", format="turtle")

<Graph identifier=N4f4fc1bbb6b341e5b3cb8182c9993ae1 (<class 'rdflib.graph.Graph'>)>

In [4]:
graphe.parse(location="TTLFiles/author.ttl", format="turtle")
graphe.parse(location="TTLFiles/paper.ttl", format="turtle")
graphe.parse(location="TTLFiles/acemap.ttl", format="turtle")
graphe.parse(location="TTLFiles/affiliation.ttl", format="turtle")
graphe.parse(location="TTLFiles/conference.ttl", format="turtle")
graphe.parse(location="TTLFiles/institute.ttl", format="turtle")
graphe.parse(location="TTLFiles/journal.ttl", format="turtle")

<Graph identifier=N4f4fc1bbb6b341e5b3cb8182c9993ae1 (<class 'rdflib.graph.Graph'>)>

In [5]:
"""
print(graphe)
print("\n-----------------\n")
graphe.bind("ace", "http://www.semanticweb.org/acemap#")
graphe.bind("ptdr", "http://biteurr#")
for index, (s, p, o) in enumerate(graphe):
    print((s, p, o))
    if index == 10 :
        break
file = open("test4.ttl", "w", encoding="utf-8")
file.write(graphe.serialize(format='ttl').decode("utf-8"))
#for field in graphe.subjects(RDF.type, "http://www.semanticweb.org/acemap#Field") :
ace = Namespace('http://www.semanticweb.org/acemap#')
subjects = graphe.subjects(RDF.type, ace.Field)
for subject in subjects :
    print(subject)
"""

'\nprint(graphe)\nprint("\n-----------------\n")\ngraphe.bind("ace", "http://www.semanticweb.org/acemap#")\ngraphe.bind("ptdr", "http://biteurr#")\nfor index, (s, p, o) in enumerate(graphe):\n    print((s, p, o))\n    if index == 10 :\n        break\nfile = open("test4.ttl", "w", encoding="utf-8")\nfile.write(graphe.serialize(format=\'ttl\').decode("utf-8"))\n#for field in graphe.subjects(RDF.type, "http://www.semanticweb.org/acemap#Field") :\nace = Namespace(\'http://www.semanticweb.org/acemap#\')\nsubjects = graphe.subjects(RDF.type, ace.Field)\nfor subject in subjects :\n    print(subject)\n'

In [6]:
def AjouterPrefixe(prefixe, chaine) :
    """
    Fonction qui ajouter un préfixe à une chaine de caractère et remplace les " " par des "_"
    retourne une chaine de caractères avec le préfixe placé devant
    exemple : AjouterPrefixe("AUTH", "Albert Einstein") retourne "AUTH_Albert_Einstein"
    """
    pref = prefixe + "_"
    new_chaine = pref + chaine.replace(" ", "_")
    return new_chaine

def ExtraireAuteurs(graphe) :
    """
    Extrait les identifiants des auteurs et leurs noms présents dans acemap
    prend en paramètre un objet graphe de la RDFlib
    retourne une dictionnaire qui associe authorID à son nom
    """

    IDToAuthors = dict()
    auteurs = graphe.subjects(RDF.type, ace.Author)
    for auteur in auteurs :
        noms = graphe.objects(auteur, ace.author_name)
        for nom in noms :
            IDToAuthors[auteur] = nom
    return IDToAuthors

def ExtraireConceptes(graphe, auteurs):
    """
    Extrait les demaines des auteurs
    prend en paramètre un objet graphe de rdflib et un liste d'id d'autheurs sous forme d'URI
    retourne un dictionnaire associant à un authorID tous les FieldID auxquelles il est rataché
    { authorID : [fieldID, fieldID, fieldID], authorID : [fieldID, ...] ... }
    """
    AuthIDToFieldID = dict()
    for auteur in auteurs :
        domaines = graphe.objects(auteur, ace.Field)
        AuthIDToFieldID[auteur] = []
        for domaine in domaines :
            AuthIDToFieldID[auteur].append(domaine)
    return AuthIDToFieldID

In [7]:
IDtoAuthor = ExtraireAuteurs(graphe)
authToField = ExtraireConceptes(graphe, IDtoAuthor.keys())
print(IDtoAuthor)
print("------------")
print(authToField)

{rdflib.term.URIRef('http://www.semanticweb.org/acemap#218FC062'): rdflib.term.Literal('geoffrey e hinton', datatype=rdflib.term.URIRef('http://www.w3.org/2001/XMLSchema#string'))}
------------
{rdflib.term.URIRef('http://www.semanticweb.org/acemap#218FC062'): []}


In [8]:
for key in IDtoAuthor.keys():
    print(key)
    print(IDtoAuthor[key])
    
print("-----------")

for key in authToField.keys() :
    print(key)
    print(authToField[key])

http://www.semanticweb.org/acemap#218FC062
geoffrey e hinton
-----------
http://www.semanticweb.org/acemap#218FC062
[]


In [25]:
def ExtraireAnnees(graphe, auteurs):
    """
    Extrait les années de publication d'un auteur.
    prend en paramètre un graphe rdf et une liste d'authorID sous forme d'URI
    retourne un dictionnaire associant des authorID à des années de publication 
    { authorID : [année, année, année], authorID : [année, ...] ... }
    """
    authIDToYears = dict()
    for auteur in auteurs :
        authIDToYears[auteur] = []
        #on va générer la liste de toutes les publication qui ont été ecrite par l'auteur en question
        publications = graphe.subjects(ace.paper_is_written_by, auteur)
        for publication in publications :
            annees = graphe.objects(publication, ace.paper_publish_date)
            for annee in annees :
                authIDToYears[auteur].append(annee)
    return authIDToYears

def ExtraireAuteursPubli(graphe) :
    """
    Extrait les auteurs pour toutes les publication
    prend en parametre un graphe rdf
    retourne un dictionnaire qui associe les paperID a tous ses authorID
    { paperID : [authorID, authoID, authorID], paperID : [authorID, ...] ... }
    """
    paperIDToAuthorID = dict()
    publications = graphe.subjects(RDF.type, ace.Paper)
    for publication in publications :
        auteurs = graphe.objects(publication, ace.paper_is_written_by)
        paperIDToAuthorID[publication] = []
        for auteur in auteurs :
            paperIDToAuthorID[publication].append(auteur)
    return paperIDToAuthorID
def AnneeFromDate(date) :
    return date[:4]
autann = ExtraireAnnees(graphe, IDtoAuthor.keys())
for key in autann.keys() :
    for ann in autann[key] :
        print("---------")
        print(key)
        print(ann)
        print(type(ann))
        print(Annee(ann))
        print(type(Annee(ann)))
        
publiAut = ExtraireAuteursPubli(graphe)
for key in publiAut.keys() :
    for aut in publiAut[key]:
        print("-------")
        print(key)
        print(aut)
        print(type(aut))
        print(IDtoAuthor[aut])
    

---------
http://www.semanticweb.org/acemap#218FC062
2014-01-01
<class 'rdflib.term.Literal'>
2014
-------
http://www.semanticweb.org/acemap#7CE9EBAC
http://www.semanticweb.org/acemap#791D05BF
<class 'rdflib.term.URIRef'>


KeyError: rdflib.term.URIRef('http://www.semanticweb.org/acemap#791D05BF')