In [1]:
from os import listdir
from os.path import join, isfile
from rdflib import URIRef, term, Graph, Literal, Namespace
from rdflib.namespace import OWL,RDF, RDFS, SKOS, XSD
# from src_eiopa.features.generator_utils import encode,add_quotation_marks,strip_brackets
# from sacremoses import MosesTokenizer,MosesDetokenizer

In [2]:
EIOPA_DATA_PATH = join("..", "data", "eiopa", "1_external", "eiopa")
GLEIF_DATA_PATH = join("..", "data", "eiopa", "1_external", "gleif")

# Read EIOPA Register in RDF

In [3]:
g = Graph()

with open(join(EIOPA_DATA_PATH,'eiopa_register.ttl'), "rb") as fp:
    g.parse(data = fp.read(), format = 'turtle')

with open(join(GLEIF_DATA_PATH,'gleif-L1-extract.ttl'), "rb") as fp:
    g.parse(data = fp.read(), format = 'turtle')
    
with open(join(GLEIF_DATA_PATH,'EntityLegalFormData.ttl'), "rb") as fp:
    g.parse(data = fp.read(), format = 'turtle')

print("graph has {} statements.".format(len(g)))

graph has 375390 statements.


# Example SPARQL queries

In [4]:
# function to visualize the name of the uri without namespace
def get_name(uri):
    if isinstance(uri, term.URIRef):
        return uri.n3().split("/")[-1][0:-1]
    else:
        return uri

In [9]:
# if A is a legal name

# In what jurisdiction does <A> operate?
# In what country does <A> operate?
# What is <A>'s jurisdiction?
# What is the jurisdiction of <A>?
# Where does <A> operate?
# Jurisdiction of <A>?

query = """SELECT DISTINCT ?o
           WHERE {?e eiopa-Base:hasIdentifyingName "achmea zorgverzekeringen n.v.". 
                  ?e eiopa-Base:hasEUCountryWhereEntityOperates ?o .
}"""

# SELECT DISTINCT ?o WHERE {?e eiopa-Base:hasIdentifyingName <A>. ?e eiopa-Base:hasEUCountryWhereEntityOperates ?o.}
results = g.query(query)

for row in results:
    print(get_name(row[0]))
    
generator_query = """ select distinct ?a where{
                  ?s gleif-L1:hasLegalName ?a . 
                  ?e gleif-Base:identifies ?s .
                  ?e eiopa-Base:hasEUCountryWhereEntityOperates CountryCodes:NL.
}"""

results = g.query(generator_query)
for row in results:
    print(get_name(row[0]))

NL
KMU Verzekeringen N.V.
VIVAT Schadeverzekeringen N.V.
Onderlinge Steenwijker Brandassurantie Vereniging U.A.
Leidsche Verzekering Maatschappij N.V.
Brand New Day Levensverzekeringen N.V.
ABN AMRO Schadeverzekering N.V.
Onderlinge Waarborgmaatschappij Centrale Zorgverzekeraars groep, Aanvullende Verzekering Zorgverzekeraar u.a.
NN Non-Life Insurance N.V.
Onderlinge Verzekerings Maatschappij "De Onderlingen" U.A.
N.V. Zorgverzekeraar UMC
Woningborg N.V.
AEGON Levensverzekering N.V.
N.V. Univé Zorg
N.V. Schadeverzekeringsmaatschappij Maas Lloyd
Achmea Pensioen- en Levensverzekeringen N.V.
N.V. Levensverzekering-Maatschappij "De Hoop"
OVM Onderlinge Verzekeringen U.A.
Monuta Verzekeringen N.V.
Interpolis Zorgverzekeringen N.V.
Centrale Ziektekostenverzekering NZV N.V.
N.V. Univé Schade
N.V. Schadeverzekering Metaal en Technische Bedrijfstakken
ONVZ Aanvullende Verzekering N.V.
Actua Schadeverzekering N.V.
VvAA Levensverzekeringen N.V.
BNP PARIBAS CARDIF SCHADEVERZEKERINGEN N.V.
N.V. Ver

In [10]:
# if A is an insurance ID

# In what jurisdiction does A operate?
# In what country does A operate?
# What is <A>'s jurisdiction?
# What is the jurisdiction of <A>?
# Where does <A> operate?
# Jurisdiction of <A>?

query = """SELECT DISTINCT ?o
           WHERE {?e eiopa-Base:hasEUCountryWhereEntityOperates ?o .
                  ?e eiopa-Base:hasInsuranceUndertakingID "W1686".
}"""
results = g.query(query)

for row in results:
    print(get_name(row[0]))

generator_query = """ select distinct ?a where{
                  ?e eiopa-Base:hasEUCountryWhereEntityOperates CountryCodes:NL .
                  ?e eiopa-Base:hasInsuranceUndertakingID ?a.
}"""

results = g.query(generator_query)
for row in results:
    print(get_name(row[0]))

NL
W1972
W0083
W0186
L0151
L0182
W1219
W1423
W1680
W0192
W1909
W1940
L0077
W1877
W0319
L0180
H0088
W0355
L0104
W1911
W1619
W1875
W1727
W1886
W1702
L0093
W1840
W0064
W1969
W1910
W1978
N0015
W0060
W1977
W1104
W0143
L0215
W0302
W1986
W1642
L0116
L0046
W0219
R161589
W1743
W0065
W1976
L0216
H0089
R161237
W1988
W0145
W0132
W1711
W1031
W1938
W0389
W0174
W0164
W0393
W0087
W1650
L0017
W1752
W0281
W1805
W1913
W1749
W1767
W1943
W1817
W1710
W1889
H0073
W1958
H0132
W1961
W0128
W1942
L0025
W0344
W1899
H0125
W1576
W1487
R161238
W1258
W0449
W1921
L0155
W1292
W0123
L0171
W1706
W1589
W1090
L0008
W1922
R140252
R162036
W1806
W1974
W0109
H0134
W1497
W1908
W1027
W1954
W1788
N0042
L0131
W1920
W1963
H0133
L0119
W1825
L0029
H0074
W1789
W1906
W1981
W0035
W0147
L0187
W1868
L0150
R140256
L0058
W1983
W1686
N0048
W0010
W1973
W1902
W0301
W1709
W1860
L0129
W1904


In [12]:
# Who is the supervisor of <A>?
# Who is <A>'s supervisor?
# Supervisor of <A>?

query = """SELECT DISTINCT ?o
           WHERE {?e eiopa-Base:hasIdentifyingName "achmea schadeverzekeringen n.v." .
                  ?e eiopa-Base:hasNCA ?o .
}"""
results = g.query(query)

# SELECT DISTINCT ?o WHERE {?e eiopa-Base:hasIdentifyingName <A>. ?e eiopa-Base:hasNCA ?o.}

for row in results:
    print(row[0])

generator_query = """ select distinct ?a where{
                  ?s gleif-L1:hasLegalName ?a . 
                  ?e gleif-Base:identifies ?s .
                  ?e eiopa-Base:hasEUCountryWhereEntityOperates CountryCodes:NL.
                  ?e eiopa-Base:hasNCA [].
}"""

results = g.query(generator_query)
for row in results:
    print(get_name(row[0]))

De Nederlandsche Bank
KMU Verzekeringen N.V.
VIVAT Schadeverzekeringen N.V.
Onderlinge Steenwijker Brandassurantie Vereniging U.A.
Leidsche Verzekering Maatschappij N.V.
Brand New Day Levensverzekeringen N.V.
ABN AMRO Schadeverzekering N.V.
Onderlinge Waarborgmaatschappij Centrale Zorgverzekeraars groep, Aanvullende Verzekering Zorgverzekeraar u.a.
NN Non-Life Insurance N.V.
Onderlinge Verzekerings Maatschappij "De Onderlingen" U.A.
N.V. Zorgverzekeraar UMC
Woningborg N.V.
AEGON Levensverzekering N.V.
N.V. Univé Zorg
N.V. Schadeverzekeringsmaatschappij Maas Lloyd
Achmea Pensioen- en Levensverzekeringen N.V.
N.V. Levensverzekering-Maatschappij "De Hoop"
OVM Onderlinge Verzekeringen U.A.
Monuta Verzekeringen N.V.
Interpolis Zorgverzekeringen N.V.
Centrale Ziektekostenverzekering NZV N.V.
N.V. Univé Schade
N.V. Schadeverzekering Metaal en Technische Bedrijfstakken
ONVZ Aanvullende Verzekering N.V.
Actua Schadeverzekering N.V.
VvAA Levensverzekeringen N.V.
BNP PARIBAS CARDIF SCHADEVERZEKER

In [13]:
# What is the register name of <A>?
# What is <A>'s register name?
# What is the relatienummer of <A>?
# What is <A>'s relatienummer?
# Register name of <A>?
# Relatienummer of <A>?

query = """SELECT DISTINCT ?a
           WHERE {?e eiopa-Base:hasIdentifyingName "achmea schadeverzekeringen n.v." .
                  ?e eiopa-Base:hasInsuranceUndertakingID ?a .
}"""
results = g.query(query)

# SELECT DISTINCT ?a WHERE {?e eiopa-Base:hasIdentifyingName <A>. ?e eiopa-Base:hasInsuranceUndertakingID ?a .}

for row in results:
    print(row[0])

generator_query = """ select distinct ?a where{
                  ?s gleif-L1:hasLegalName ?a . 
                  ?e gleif-Base:identifies ?s .
                  ?e eiopa-Base:hasInsuranceUndertakingID [].
                  ?e eiopa-Base:hasEUCountryWhereEntityOperates CountryCodes:NL.
}"""

results = g.query(generator_query)
for row in results:
    print(get_name(row[0]))

W1686
KMU Verzekeringen N.V.
VIVAT Schadeverzekeringen N.V.
Onderlinge Steenwijker Brandassurantie Vereniging U.A.
Leidsche Verzekering Maatschappij N.V.
Brand New Day Levensverzekeringen N.V.
ABN AMRO Schadeverzekering N.V.
Onderlinge Waarborgmaatschappij Centrale Zorgverzekeraars groep, Aanvullende Verzekering Zorgverzekeraar u.a.
NN Non-Life Insurance N.V.
Onderlinge Verzekerings Maatschappij "De Onderlingen" U.A.
N.V. Zorgverzekeraar UMC
Woningborg N.V.
AEGON Levensverzekering N.V.
N.V. Univé Zorg
N.V. Schadeverzekeringsmaatschappij Maas Lloyd
Achmea Pensioen- en Levensverzekeringen N.V.
N.V. Levensverzekering-Maatschappij "De Hoop"
OVM Onderlinge Verzekeringen U.A.
Monuta Verzekeringen N.V.
Interpolis Zorgverzekeringen N.V.
Centrale Ziektekostenverzekering NZV N.V.
N.V. Univé Schade
N.V. Schadeverzekering Metaal en Technische Bedrijfstakken
ONVZ Aanvullende Verzekering N.V.
Actua Schadeverzekering N.V.
VvAA Levensverzekeringen N.V.
BNP PARIBAS CARDIF SCHADEVERZEKERINGEN N.V.
N.V. 

In [14]:
# What is the legal name of <A>?
# What is <A>'s legal name?
# Legal name of <A>?
# <A>'s legal name?

query = """SELECT DISTINCT ?o
           WHERE {?s gleif-L1:hasLegalName ?o . 
                  ?e gleif-Base:identifies ?s .
                  ?e eiopa-Base:hasInsuranceUndertakingID "W1686" .
}"""
results = g.query(query)

# SELECT DISTINCT ?o WHERE {?s gleif-L1:hasLegalName ?o . ?e gleif-Base:identifies ?s . ?e eiopa-Base:hasInsuranceUndertakingID <A> .}

for row in results:
    print(row[0])
    
generator_query = """ select distinct ?a where{
                  ?e eiopa-Base:hasEUCountryWhereEntityOperates CountryCodes:NL .
                  ?e eiopa-Base:hasInsuranceUndertakingID ?a.
                  ?e gleif-Base:identifies ?s.
                  ?s gleif-L1:hasLegalName [].
}"""

results = g.query(generator_query)
for row in results:
    print(get_name(row[0]))

Achmea Schadeverzekeringen N.V.
W1972
W0083
W0186
L0151
L0182
W1219
W1423
W1680
W0192
W1909
W1940
L0077
W1877
W0319
L0180
H0088
W0355
L0104
W1911
W1619
W1875
W1727
W1886
W1702
L0093
W1840
W0064
W1969
W1910
W1978
N0015
W0060
W1977
W1104
W0143
L0215
W0302
W1986
W1642
L0116
L0046
W0219
R161589
W1743
W0065
W1976
L0216
H0089
R161237
W1988
W0145
W0132
W1711
W1031
W1938
W0389
W0174
W0164
W0393
W0087
W1650
L0017
W1752
W0281
W1805
W1913
W1749
W1767
W1943
W1817
W1710
W1889
H0073
W1958
H0132
W1961
W0128
W1942
L0025
W0344
W1899
H0125
W1576
W1487
R161238
W1258
W0449
W1921
L0155
W1292
W0123
L0171
W1706
W1589
W1090
L0008
W1922
R140252
R162036
W1806
W1974
W0109
H0134
W1497
W1908
W1027
W1954
W1788
N0042
L0131
W1920
W1963
H0133
L0119
W1825
L0029
H0074
W1789
W1906
W1981
W0035
W0147
L0187
W1868
L0150
R140256
L0058
W1983
W1686
N0048
W0010
W1973
W1902
W0301
W1709
W1860
L0129
W1904


In [15]:
# What is the cross border status of <A>?
# What is <A>'s cross border status?
# Cross border status of <A>?
# <A>'s cross border status

query = """SELECT DISTINCT ?o
           WHERE {?e eiopa-Base:hasIdentifyingName "achmea schadeverzekeringen n.v.".
                  ?e eiopa-Base:hasCrossBorderStatus ?o .
}"""
results = g.query(query)

# SELECT DISTINCT ?o WHERE {?e eiopa-Base:hasIdentifyingName <A>. ?e eiopa-Base:hasCrossBorderStatus ?o .}

for row in results:
    print(row[0])
    
generator_query = """ select distinct ?a where{
                  ?s gleif-L1:hasLegalName ?a . 
                  ?e gleif-Base:identifies ?s .
                  ?e eiopa-Base:hasCrossBorderStatus [].
                  ?e eiopa-Base:hasEUCountryWhereEntityOperates CountryCodes:NL.
}"""

results = g.query(generator_query)
for row in results:
    print(get_name(row[0]))

Domestic undertaking
KMU Verzekeringen N.V.
VIVAT Schadeverzekeringen N.V.
Onderlinge Steenwijker Brandassurantie Vereniging U.A.
Leidsche Verzekering Maatschappij N.V.
Brand New Day Levensverzekeringen N.V.
ABN AMRO Schadeverzekering N.V.
Onderlinge Waarborgmaatschappij Centrale Zorgverzekeraars groep, Aanvullende Verzekering Zorgverzekeraar u.a.
NN Non-Life Insurance N.V.
Onderlinge Verzekerings Maatschappij "De Onderlingen" U.A.
N.V. Zorgverzekeraar UMC
Woningborg N.V.
AEGON Levensverzekering N.V.
N.V. Univé Zorg
N.V. Schadeverzekeringsmaatschappij Maas Lloyd
Achmea Pensioen- en Levensverzekeringen N.V.
N.V. Levensverzekering-Maatschappij "De Hoop"
OVM Onderlinge Verzekeringen U.A.
Monuta Verzekeringen N.V.
Interpolis Zorgverzekeringen N.V.
Centrale Ziektekostenverzekering NZV N.V.
N.V. Univé Schade
N.V. Schadeverzekering Metaal en Technische Bedrijfstakken
ONVZ Aanvullende Verzekering N.V.
Actua Schadeverzekering N.V.
VvAA Levensverzekeringen N.V.
BNP PARIBAS CARDIF SCHADEVERZEKERI

In [17]:
# When did <A> start?
# From when did <A> start?
# What is the starting date of <A>?
# What is <A>'s starting date?
# What is the operation starting date of <A>?
# What is <A>'s operation starting date?

query = """SELECT DISTINCT ?o
           WHERE {?e eiopa-Base:hasIdentifyingName "achmea schadeverzekeringen n.v.".
                  ?e eiopa-Base:hasOperationStartDate ?o .
}"""
results = g.query(query)

# SELECT DISTINCT ?o WHERE {?e eiopa-Base:hasIdentifyingName <A>. ?e eiopa-Base:hasOperationStartDate ?o.}

for row in results:
    print(row[0])
    
generator_query = """ select distinct ?a where{
                  ?s gleif-L1:hasLegalName ?a . 
                  ?e gleif-Base:identifies ?s .
                  ?e eiopa-Base:hasOperationStartDate [] .
                  ?e eiopa-Base:hasEUCountryWhereEntityOperates CountryCodes:NL.
}"""

results = g.query(generator_query)
for row in results:
    print(get_name(row[0]))

23/12/1991 01:00:00
KMU Verzekeringen N.V.
VIVAT Schadeverzekeringen N.V.
Onderlinge Steenwijker Brandassurantie Vereniging U.A.
Leidsche Verzekering Maatschappij N.V.
Brand New Day Levensverzekeringen N.V.
ABN AMRO Schadeverzekering N.V.
Onderlinge Waarborgmaatschappij Centrale Zorgverzekeraars groep, Aanvullende Verzekering Zorgverzekeraar u.a.
NN Non-Life Insurance N.V.
Onderlinge Verzekerings Maatschappij "De Onderlingen" U.A.
N.V. Zorgverzekeraar UMC
Woningborg N.V.
AEGON Levensverzekering N.V.
N.V. Univé Zorg
N.V. Schadeverzekeringsmaatschappij Maas Lloyd
Achmea Pensioen- en Levensverzekeringen N.V.
N.V. Levensverzekering-Maatschappij "De Hoop"
OVM Onderlinge Verzekeringen U.A.
Monuta Verzekeringen N.V.
Interpolis Zorgverzekeringen N.V.
Centrale Ziektekostenverzekering NZV N.V.
N.V. Univé Schade
N.V. Schadeverzekering Metaal en Technische Bedrijfstakken
ONVZ Aanvullende Verzekering N.V.
Actua Schadeverzekering N.V.
VvAA Levensverzekeringen N.V.
BNP PARIBAS CARDIF SCHADEVERZEKERIN

In [19]:
# Where is <A> located and what is the registration number?

query = """ select distinct ?a ?b where{ ?e eiopa-Base:hasIdentifyingName "achmea zorgverzekeringen n.v." . ?e gleif-Base:identifies ?x .?e eiopa-Base:hasInsuranceUndertakingID ?b. ?x gleif-L1:hasLegalAddress/gleif-base:hasCity ?a.}
        """
results = g.query(query)

for row in results:
    for item in row:
        print(get_name(item), end = " ")
    print("\n")
    
generator_query = """
                    select distinct ?a where{ ?x gleif-L1:hasLegalName ?a.?e gleif-Base:identifies ?x .?e eiopa-Base:hasInsuranceUndertakingID []. ?x gleif-L1:hasLegalAddress/gleif-base:hasCity [].?e eiopa-Base:hasEUCountryWhereEntityOperates CountryCodes:NL.}
                  """

results = g.query(generator_query)
for row in results:
    for item in row:
        print(get_name(item), end = " ")
    print("\n")

Leiden W1825 

KMU Verzekeringen N.V. 

VIVAT Schadeverzekeringen N.V. 

Onderlinge Steenwijker Brandassurantie Vereniging U.A. 

Leidsche Verzekering Maatschappij N.V. 

Brand New Day Levensverzekeringen N.V. 

ABN AMRO Schadeverzekering N.V. 

Onderlinge Waarborgmaatschappij Centrale Zorgverzekeraars groep, Aanvullende Verzekering Zorgverzekeraar u.a. 

NN Non-Life Insurance N.V. 

Onderlinge Verzekerings Maatschappij "De Onderlingen" U.A. 

N.V. Zorgverzekeraar UMC 

Woningborg N.V. 

AEGON Levensverzekering N.V. 

N.V. Univé Zorg 

N.V. Schadeverzekeringsmaatschappij Maas Lloyd 

Achmea Pensioen- en Levensverzekeringen N.V. 

N.V. Levensverzekering-Maatschappij "De Hoop" 

OVM Onderlinge Verzekeringen U.A. 

Monuta Verzekeringen N.V. 

Interpolis Zorgverzekeringen N.V. 

Centrale Ziektekostenverzekering NZV N.V. 

N.V. Univé Schade 

N.V. Schadeverzekering Metaal en Technische Bedrijfstakken 

ONVZ Aanvullende Verzekering N.V. 

Actua Schadeverzekering N.V. 

VvAA Levensverzekering