In [1]:
import pymongo
from pymongo import MongoClient
from bson.son import SON
from bson.objectid import ObjectId
import rdflib

In [2]:
client = MongoClient()
db = client.lobbyradar

Entities = db.entities
Relations = db.relations

person_filter = { 'type' : 'person' }
entity_filter = { 'type' : 'entity' }
persons = Entities.find(person_filter)
entities = Entities.find(entity_filter)

In [3]:
# executive, ececutive, Vorsitzender
directors_board_members = ['Aufsichtsratsmitglied'', ''Board of Directors'', ''Mitglied des Aufsichtsrats'', ''Mitglied im Aufsichtsrat'', ''Lenkungsgruppe'', ''Mitglied des Aufsichtsrates'', ''Anteilseignervertreter'', ''Stellvertretender Vorstandsvorsitzender des Aufsichtsrats']
management_board_members = ['Vorstandsmitglied'', ''Mitglied des Vorstands']
presidial_board_members = ['Präsidialmitglied', 'Mitglied des Präsidiums', 'Präsidiumsmitglied']
chairmen_of_management = ['Vorstandsvorsitz', 'Vorstandsvorsitzender', 'Vorsitzender des Vorstands']
management_members = ['Vorstand']
chairmen_of_directors_board = ['Aufsichtsratsvorsitz', 'Vorsitzender des Aufsichtsrats']
foundation_board_members = ['Mitglied des Stiftungsrats', 'Stiftungsrat']
directors = ['Geschäftsführer', 'Hauptgeschäftsführer', 'CEO', 'Geschäftsführender Vorstand', 'Geschäftsführender Gesellschafter', 'Direktor']
presidents = ['Präsident', 'Vorsitz', 'Vorsitzender', 'Präsidentin']
trustees_board_members = ['Mitglied des Kuratoriums']
advidory_board_members = ['Mitglied im Beirat', 'Mitglied des Beirats', 'Beisitzer des Beirats']
vice_presidents = ['Stellvertretender Vorsitz', 'Vize-Präsident', 'Vizepräsident']
administration_board_members = ['Mitglied des Verwaltungsrats']

In [4]:
# member, activity, position
ordinary_members = ['Ordentliches Mitglied']
representative_members = ['Stellvertretendes Mitglied']
chairmen = ['Obmann']
chairwomen = ['Obfrau']
alliance_members = ['Mitglied im Verband']
honorary_members = ['Ehrenmitglied']

In [5]:
# government, Bundesdatenschutzbeauftragte
ministers = ['Staatsminister', 'Staatsministerin', 'Bundesminister für Umwelt, Naturschutz und Reaktorsicherheit', 'Bundesministerin für Familie, Senioren, Frauen und Jugend', 'Bundesminister für Wirtschaft und Technologie', 'Minister für Inneres und Kommunales', 'Minister für Inneres und Sport', 'Bundesminister für Ernährung, Landwirtschaft und Verbraucherschutz', 'Bundesministerin für Bildung, Wissenschaft, Forschung und Technologie', 'Bundesminister für besondere Aufgaben', 'Bundesminister für Arbeit und Soziales', 'Bundesminister des Auswärtigen', 'Bundesminister des Inneren', 'Minister für Umwelt und Verbraucherschutz', 'Bundesminister für Verbraucherschutz', 'Ernährung und Landwirtschaft', 'Minister der Justiz und für Verbraucherschutz', 'Bundesminister für Verkehr, Bau und Stadtentwicklung', 'Staatsrätin für Bundesangelegenheiten, Europa und Integration', 'Ministerin für Arbeit, Gleichstellung und Soziales', 'Minister für Energie, Infrastruktur und Landesentwicklung', 'Ministerin für Kultus', 'Ministerin für Schule und Berufsbildung', 'Senator für Inneres und Sport', 'Ministerin für Bildung, Wissenschaft, Weiterbildung und Kultur', 'Minister für Wirtschaft, Arbeit und Verkehr', 'Ministerin für Arbeit, Soziales, Gesundheit, Frauen und Familie']
secretaries_of_states = ['Staatssekretär', 'Parlamentarischer Staatssekretär', 'Parlamentarische Staatssekretärin', 'Staatssekretärin']
privy_counselors = ['Staatsrat', 'Staatsrätin']
prime_ministers = ['Ministerpräsident', 'Ministerpräsidentin']
heads_of_state_chancellery = ['Chef der Staatskanzlei']
representatives_of_federal_chancellor = ['Stellvertreter der Bundeskanzlerin']
ministers_of_defense = ['Bundesminister der Verteidigung']
representatives_of_prime_minister = ['Stellvertretender Ministerpräsident', 'Stellvertreter des Ministerpräsidenten', 'Stellvertretende Ministerpräsidentin']
finance_ministers = ['Bundesminister der Finanzen', 'Finanzminister', 'Minister der Finanzen ']
justice_ministers = ['Minister der Justiz', 'Bundesministerin der Justiz', 'Justizministerin']

In [6]:
import rdflib
from rdflib import Graph, Literal, BNode, Namespace, RDF, URIRef
from rdflib.namespace import DC, FOAF, SKOS
ORG = Namespace("http://www.w3.org/ns/org#")
OWN = Namespace("http://example.com/")

# The Graph
g = Graph()
g.bind("dc", DC)
g.bind("foaf", FOAF)
g.bind("org", ORG)
g.bind("skos", SKOS)
g.bind("own", OWN)

g.parse('ontology.ttl', format='turtle')

for entity in Entities.find({}):
    node = BNode()
    # DC
    g.add((node, DC.identifier, Literal(entity["_id"])))
    g.add((node, DC.created, Literal(entity["created"])))
    g.add((node, DC.modified, Literal(entity["updated"])))
    
    # RDF
    if entity['type'] == 'person':
        g.add((node, RDF.type, FOAF.Person))
        g.add((node, FOAF.name, Literal(entity["name"])))

    elif entity['type'] == 'entity':
        g.add((node, RDF.type, ORG.Organization))
        g.add((node, SKOS.prefLabel, Literal(entity["name"])))
        for alias in entity["aliases"]:
            g.add((node, SKOS.altLabel, Literal(alias)))
            
    # FOAF
    for tag in entity['tags']:
        g.add((node, FOAF.topic_intest, Literal(tag)))

In [7]:
# Add executive relations
for rel in Relations.find({ 'type' : { '$in' : ['executive', 'ececutive', 'Vorsitzender'] }}):
    pos = [ attr['value'] for attr in rel['data'] if attr['key'] == 'position' ]
    pos = pos[0].encode('utf-8') if pos else ''.encode('utf-8')
    dest_node = g.value(predicate=DC.identifier, object=Literal(str(rel['entities'][0])))
    target_node = g.value(predicate=DC.identifier, object=Literal(str(rel['entities'][1])))
    
    if dest_node and target_node:
        # dest and target must be here
        dest_type = g.value(subject=dest_node, predicate=RDF.type)
        target_type = g.value(subject=target_node, predicate=RDF.type)
        
        if dest_type != target_type:
            # dest and target can not have the same tye
            if (dest_type == ORG.Organization) and (target_type == FOAF.Person):
                # the subject must be the person
                dest_node, target_node = target_node, dest_node

            if pos in directors_board_members:
                g.add((dest_node, OWN.isDirectorsBoardMemberOf, target_node))
            elif pos in management_board_members:
                g.add((dest_node, OWN.isManagementBoardMemberOf, target_node))
            elif pos in presidial_board_members:
                g.add((dest_node, OWN.isPresidialBoardMemberOf, target_node))
            elif pos in chairmen_of_management:
                g.add((dest_node, OWN.isChairmenOfManagement, target_node))
            elif pos in management_members:
                g.add((dest_node, OWN.isManagementMember, target_node))
            elif pos in chairmen_of_directors_board:
                g.add((dest_node, OWN.isChairmanOfDirectorsBoardOf, target_node))
            elif pos in foundation_board_members:
                g.add((dest_node, OWN.isFoundationBoardMemberOf, target_node))
            elif pos in directors:
                g.add((dest_node, OWN.isDirectorOf, target_node))
            elif pos in presidents:
                g.add((dest_node, OWN.isPresidentOf, target_node))
            elif pos in trustees_board_members:
                g.add((dest_node, OWN.isTrusteesBoardMemberOf, target_node))
            elif pos in advidory_board_members:
                g.add((dest_node, OWN.isAdvisoryBoardMemberOf, target_node))
            elif pos in vice_presidents:
                g.add((dest_node, OWN.isVicePresidentOf, target_node))
            elif pos in administration_board_members:
                g.add((dest_node, OWN.isAdministrationBoardMemberOf, target_node))
            else:
                g.add((dest_node, OWN.isOtherExecutiveOf, target_node))

In [8]:
# Add member relations
for rel in Relations.find({ 'type' : { '$in' : ['member', 'activity', 'position'] }}):
    pos = [ attr['value'] for attr in rel['data'] if attr['key'] == 'position' ]
    pos = pos[0].encode('utf-8') if pos else ''.encode('utf-8')
    if len(rel['entities']) == 2:
        dest_node = g.value(predicate=DC.identifier, object=Literal(str(rel['entities'][0])))
        target_node = g.value(predicate=DC.identifier, object=Literal(str(rel['entities'][1])))

        if dest_node and target_node:
            # dest and target must be here
            dest_type = g.value(subject=dest_node, predicate=RDF.type)
            target_type = g.value(subject=target_node, predicate=RDF.type)

            if dest_type != target_type:
                # dest and target can not have the same tye
                if (dest_type == ORG.Organization) and (target_type == FOAF.Person):
                    # the subject must be the person
                    dest_node, target_node = target_node, dest_node

                if pos in ordinary_members:
                    g.add((dest_node, OWN.isOrdinaryMemberOf, target_node))
                if pos in representative_members:
                    g.add((dest_node, OWN.isRepresentativeMemberOf, target_node))
                elif pos in chairmen:
                    g.add((dest_node, OWN.isChairmanOf, target_node))
                elif pos in chairwomen:
                    g.add((dest_node, OWN.isChairwomanOf, target_node))
                elif pos in alliance_members:
                    g.add((dest_node, OWN.isAllianceMemberOf, target_node))
                elif pos in honorary_members:
                    g.add((dest_node, OWN.isHonoraryMemberOf, target_node))
                else:
                    g.add((dest_node, OWN.isOtherMemberOf, target_node))

In [9]:
# Add government relations
for rel in Relations.find({ 'type' : { '$in' : ['government', 'Bundesdatenschutzbeauftragte'] }}):
    pos = [ attr['value'] for attr in rel['data'] if attr['key'] == 'position' ]
    pos = pos[0].encode('utf-8') if pos else ''.encode('utf-8')
    if len(rel['entities']) == 2:
        dest_node = g.value(predicate=DC.identifier, object=Literal(str(rel['entities'][0])))
        target_node = g.value(predicate=DC.identifier, object=Literal(str(rel['entities'][1])))
    
    if dest_node and target_node:
            # dest and target must be here
            dest_type = g.value(subject=dest_node, predicate=RDF.type)
            target_type = g.value(subject=target_node, predicate=RDF.type)

            if dest_type != target_type:
                # dest and target can not have the same tye
                if (dest_type == ORG.Organization) and (target_type == FOAF.Person):
                    # the subject must be the person
                    dest_node, target_node = target_node, dest_node
    
                if pos in secretaries_of_states:
                    g.add((dest_node, OWN.isSecretaryOfStateOf, target_node))
                elif pos in privy_counselors:
                    g.add((dest_node, OWN.isPrivyCouncilorOf, target_node))
                elif pos in ministers:
                    g.add((dest_node, OWN.isMinisterOf, target_node))
                elif pos in prime_ministers:
                    g.add((dest_node, OWN.isPrimeMinisterOf, target_node))
                elif pos in heads_of_state_chancellery:
                    g.add((dest_node, OWN.isHeadOfStateChancelleryOf, target_node))
                elif pos in representatives_of_federal_chancellor:
                    g.add((dest_node, OWN.isRepresentativeOfFederalChancellor, target_node))
                elif pos in ministers_of_defense:
                    g.add((dest_node, OWN.isMinisterOfDefenseOf, target_node))
                elif pos in representatives_of_prime_minister:
                    g.add((dest_node, OWN.isRepresentativeOfPrimeMinisterOf, target_node))
                elif pos in finance_ministers:
                    g.add((dest_node, OWN.isFinanceMinisterOf, target_node))
                elif pos in justice_ministers:
                    g.add((dest_node, OWN.isJusticeMinisterOf, target_node))
                else :
                    g.add((dest_node, OWN.isOtherwiseRelatedToGovernment, target_node))

In [14]:
test = [s for s,_,o in g.triples((None, OWN.isExecutiveOf, None))]

In [None]:
admin = [s for s,_,o in g.triples((None, OWN.isVicePresidentOf, None))]

In [20]:
# ... add some triples to g somehow ...
qres = g.query(""" 
SELECT DISTINCT ?aname ?bname
    WHERE {
        ?a own:isOtherwiseRelatedToGovernment ?b ;
           own
        ?a foaf:name ?aname .
        ?b skos:prefLabel ?bname .
    }""")

for row in qres:
    print("%s works in %s" % row)

Dilek Kolat works in Senat von Berlin
Angelika Peters works in Staatskanzlei Mecklenburg-Vorpommern
Dr. Hans-Peter Friedrich works in Bundesministerium für Verbraucherschutz, Ernährung und Landwirtschaft
Gerd Hoofe works in Bundesministerium der Verteidigung
Lucia Puttrich works in Hessisches Ministerium für Bundes- und Europaangelegenheiten
Jutta Blankau works in Senat der Hansestadt Hamburg
Carsten Kühl works in Ministerium der Finanzen Rheinland-Pfalz
Dorothee Stapelfeldt works in Senat der Hansestadt Hamburg
Malte Krückels works in Staatskanzlei Thüringen
Michael Müller works in Senat von Berlin
Ulrike Höfken works in Ministerium für Umwelt, Landwirtschaft, Ernährung, Weinbau und Forsten Rheinland-Pfalz
Helmuth Markov works in Ministerium für Justiz, Europa und Verbraucherschutz Brandenburg
Holger Stahlknecht works in Ministerium des Inneren Sachsen-Anhalt
Monika Bachmann works in Ministerium für Inneres und Sport Saarland
Priska Hinz works in Hessisches Ministerium für Umwelt, Kli

In [17]:
# ... add some triples to g somehow ...
qres = g.query(""" 
SELECT DISTINCT ?p
    WHERE {
        ?p rdfs:isSubPropertyOf own:isExecutiveOf .
    }""")

for row in qres:
    print("%s knows %s" % row)

In [None]:
# %load 'ontology.ttl'
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .  
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix org: <http://www.w3.org/ns/org#> .
@prefix foaf: <http://xmlns.com/foaf/0.1/> .
@prefix dcam: <http://purl.org/dc/dcam/> .
@prefix vcard: <http://www.w3.org/2006/vcard/ns#> .
@prefix dc: <http://purl.org/dc/elements/1.1/> .
@prefix : <http://example.org/> .

# T-Box:
:Party a rdfs:Class ;
  rdfs:subClassOf org:Organization .
:Politician a rdfs:Class ;
  rdfs:subClassOf foaf:Person .
:Lobbyist a rdfs:Class ;
  rdfs:subClassOf foaf:Person .
:Source a rdfs:Class ;
  rdfs:subClassOf dc:source .
:Address a rdfs:Class ;
  rdfs:subClassOf vcard:ADR .
:Description a rdfs:Class ;
  rdfs:subClassOf dc:description .
:Topic a rdfs:Class ;
  rdfs:subClassOf foaf:topic .
:LegalForm a rdfs:Class .
:From a rdfs:Class ;
  rdfs:subClassOf dc:date .
:To a rdfs:Class ;
  rdfs:subClassOf dc:date .
:Homepage a rdfs:Class ;
  rdfs:subClassOf foaf:homepage .
:Title a rdfs:Class ;
  rdfs:subClassOf dc:title .
:Photo a rdfs:Class ;
  rdfs:subClassOf foaf:Image .
:FederalState a rdf:Class ;
  rdfs:subClassOf vcard:locality .
:BTCertUID a rdf:Class ;
  rdfs:subClassOf foaf:OnlineAccount .
:Constituency a rdf:Class ;
  rdfs:subClassOf vcard:region .
:Government a rdfs:Class ;
  rdfs:subClassOf org:Organization .

# Member -> data.key: position, type: activity, member, position

:isMemberOf a rdf:Property ; # Mitglied, 
  rdfs:domain foaf:Person ;
  rdfs:range :Organization .
:isExecutiveOf rdfs:isSubPropertyOf :isMemberOf .
:isDonor a rdf:Property ; # -> data.key: position, type: donation, sponsoring
  rdfs:domain foaf:Person ;
  rdfs:range :Party .
:isInBusinessWith a rdf:Property ; # -> data.key: position, type: buisiness
  rdfs:domain foaf:Person ;
  rdfs:range :Party .
:isRelatedTo a rdf:Property ; # -> data.key:position, type: association
  rdfs:domain rdfs:Class ;
  rdfs:range rdfs:Class .
:isSubsidiaryOf a rdf:Property ; # -> data.key:position, type: association, subisdiary, Tochterfirma
  rdfs:domain :Party ;
  rdfs:range :Party .
:isRelatedToGovernment a rdf:Property ;
  rdfs:domain foaf:Person ;
  rdfs:range :Government .

# executive, ececutive, Vorsitzender
:isDirectorsBoardMemberOf rdfs:isSubPropertyOf :isExecutiveOf . # Aufsichtsratsmitglied, Board of Directors, Mitglied des Aufsichtsrats, Mitglied im Aufsichtsrat, Lenkungsgruppe, Mitglied des Aufsichtsrates, Anteilseignervertreter, Stellvertretender Vorstandsvorsitzender des Aufsichtsrats
:isManagementBoardMemberOf rdfs:isSubPropertyOf :isExecutiveOf . # Vorstandsmitglied, Mitglied des Vorstands
:isPresidentalBoardMemberOf rdfs:isSubPropertyOf :isExecutiveOf . # Präsidialmitglied, Mitglied des Präsidiums, Präsidiumsmitglied
:isChairmanOfManagementOf rdfs:isSubPropertyOf :isExecutiveOf . # Vorstandsvorsitz, Vorstandsvorsitzender, Vorsitzender des Vorstands
:isManagementMemberOf rdfs:isSubPropertyOf :isExecutiveOf .  # Vorstand
:isChairmanOfDirectorsBoardOf rdfs:isSubPropertyOf :isExecutiveOf . # Aufsichtsratsvorsitz, Vorsitzender des Aufsichtsrats
:isFoundationBoardMemberOf rdfs:isSubPropertyOf :isExecutiveOf . # Mitglied des Stiftungsrats, Stiftungsrat
:isDirectorOf rdfs:isSubPropertyOf :isExecutiveOf . # Geschäftsführer, Hauptgeschäftsführer, CEO, Geschäftsführender Vorstand, Geschäftsführender Gesellschafter, Direktor
:isPresidentOf rdfs:isSubPropertyOf :isExecutiveOf . # Präsident, Vorsitz, Vorsitzender, Präsidentin
:isTrusteesBoardMemberOf rdfs:isSubPropertyOf :isExecutiveOf . # Mitglied des Kuratoriums
:isAdvisoryBoardMemberOf rdfs:isSubPropertyOf :isExecutiveOf . # Mitglied im Beirat, Mitglied des Beirats, Beisitzer des Beirats
:isVicePresidentOf rdfs:isSubPropertyOf :isExecutiveOf . # Stellvertretender Vorsitz, Vize-Präsident, Vizepräsident
:isAdministrationBoardMemberOf rdfs:isSubPropertyOf :isExecutiveOf . # Mitglied des Verwaltungsrats
:isOtherExecutiveOf rdfs:isSubPropertyOf :isExecutiveOf . # ...

# member, activity, position
:isOrdinaryMemberOf rdfs:isSubPropertyOf :isMemberOf . # Ordentliches Mitglied
:isRepresentativeMemberOf rdfs:isSubPropertyOf :isMemberOf . # Stellvertretendes Mitglied
:isChairmanOf rdfs:isSubPropertyOf :isMemberOf . # Obmann
:isChairwomanOf rdfs:isSubPropertyOf :isMemberOf . # Obfrau
:isAllianceMemberOf rdfs:isSubPropertyOf :isMemberOf . # Mitglied im Verband
:isHonoraryMemberOf rdfs:isSubPropertyOf :isMemberOf . # Ehrenmitglied
:isOtherMemberOf rdfs:isSubPropertyOf :isMemberOf . # ...
 
# government, Bundesdatenschutzbeauftragte
:isSecretaryOfStateOf rdfs:isSubPropertyOf :isRelatedToGovernment . #Staatssekretär, Parlamentarischer Staatssekretär, Parlamentarische Staatssekretärin, Staatssekretärin, 
:isPrivyCouncilorOf rdfs:isSubPropertyOf :isRelatedToGovernment . # Staatsrat, Staatsrätin
:isMinisterOf rdfs:isSubPropertyOf :isRelatedToGovernment . # Staatsminister, Staatsministerin, Bundesminister für Umwelt, Naturschutz und Reaktorsicherheit, Bundesministerin für Familie, Senioren, Frauen und Jugend, Bundesminister für Wirtschaft und Technologie, Minister für Inneres und Kommunales, Minister für Inneres und Sport, Bundesminister für Ernährung, Landwirtschaft und Verbraucherschutz, Bundesministerin für Bildung, Wissenschaft, Forschung und Technologie, Bundesminister für besondere Aufgaben, Bundesminister für Arbeit und Soziales, Bundesminister des Auswärtigen, Bundesminister des Inneren, Minister für Umwelt und Verbraucherschutz, Bundesminister für Verbraucherschutz, Ernährung und Landwirtschaft, Minister der Justiz und für Verbraucherschutz, Bundesminister für Verkehr, Bau und Stadtentwicklung, Staatsrätin für Bundesangelegenheiten, Europa und Integration, Ministerin für Arbeit, Gleichstellung und Soziales, Minister für Energie, Infrastruktur und Landesentwicklung, Ministerin für Kultus, Ministerin für Schule und Berufsbildung, Senator für Inneres und Sport, Ministerin für Bildung, Wissenschaft, Weiterbildung und Kultur, Minister für Wirtschaft, Arbeit und Verkehr, Ministerin für Arbeit, Soziales, Gesundheit, Frauen und Familie 
:isPrimeMinisterOf rdfs:isSubPropertyOf :isRelatedToGovernment . # Ministerpräsident, Ministerpräsidentin
:isHeadOfStateChancelleryOf rdfs:isSubPropertyOf :isRelatedToGovernment . # Chef der Staatskanzlei
:isRepresentativeOfFederalChancellor rdfs:isSubPropertyOf :isRelatedToGovernment . # Stellvertreter der Bundeskanzlerin
:isMinisterOfDefenseOf rdfs:isSubPropertyOf :isRelatedToGovernment . # Bundesminister der Verteidigung
:isRepresentativeOfPrimeMinisterOf rdfs:isSubPropertyOf :isRelatedToGovernment . # Stellvertretender Ministerpräsident, Stellvertreter des Ministerpräsidenten, Stellvertretende Ministerpräsidentin
:isFinanceMinisterOf rdfs:isSubPropertyOf :isRelatedToGovernment . # Bundesminister der Finanzen, Finanzminister, Minister der Finanzen 
:isJusticeMinisterOf rdfs:isSubPropertyOf :isRelatedToGovernment . # Minister der Justiz, Bundesministerin der Justiz, Justizministerin
:isOtherwiseRelatedToGovernment rdfs:isSubPropertyOf :isRelatedToGovernment . #


In [None]:
ids