In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from rdflib import URIRef, Literal, RDF, Graph, Namespace, XSD

In [2]:
# Load the data
Sag = pd.read_pickle('../data/raw/Sag.pkl')
Subset = Sag[0:500]
Dokument = pd.read_pickle('../data/raw/Dokument.pkl')
SagDokument = pd.read_pickle('../data/raw/SagDokument.pkl')
SagDokumentRolle = pd.read_pickle('../data/raw/SagDokumentRolle.pkl')
Aktør = pd.read_pickle('../data/raw/Aktør.pkl')
Aktørtype = pd.read_pickle('../data/raw/Aktørtype.pkl')
SagAktør = pd.read_pickle('../data/raw/SagAktør.pkl')
SagAktørRolle = pd.read_pickle('../data/raw/SagAktørRolle.pkl')
DokumentAktør = pd.read_pickle('../data/raw/DokumentAktør.pkl')
DokumentAktørRolle = pd.read_pickle('../data/raw/DokumentAktørRolle.pkl')
Emneord = pd.read_pickle('../data/raw/Emneord.pkl')
EmneordSag = pd.read_pickle('../data/raw/EmneordSag.pkl')
EmneordsType = pd.read_pickle('../data/raw/EmneordsType.pkl')

In [3]:
g = Graph()

In [4]:
# Define the namespaces for your graph
EX = Namespace("http://XAINLP.com/")
SAG = Namespace("http://XAINLP.com/sag/")
DOKUMENT = Namespace("http://XAINLP.com/dokument/")
AKTØR = Namespace("http://XAINLP.com/aktør/")
SAGAKTØRROLLE = Namespace("http://XAINLP.com/sagaktørrolle/")
DOKUMENTAKTØRROLLE = Namespace("http://XAINLP.com/dokumentaktørrolle/")
SAGDOKUMENTROLLE = Namespace("http://XAINLP.com/sagdokumentrolle/")
EMNEORD = Namespace("http://XAINLP.com/emneord/")
EMNEORDSAG = Namespace("http://XAINLP.com/emneordsag/")
EMNEORDSTYPE = Namespace("http://XAINLP.com/emneordstype/")
# Create a new graph

g.bind("ex", EX)
g.bind("sag", SAG)
g.bind("dokument", DOKUMENT)
g.bind("aktør", AKTØR)
g.bind("sagaktørrolle", SAGAKTØRROLLE)
g.bind("dokumentaktørrolle", DOKUMENTAKTØRROLLE)
g.bind("sagdokumentrolle", SAGDOKUMENTROLLE)
g.bind("emneord", EMNEORD)
g.bind("emneordsag", EMNEORDSAG)

In [5]:
# Iterate over each row of the Sag dataframe
from tqdm import tqdm
for _, row in tqdm(Sag.iterrows(), total=len(Sag)):

    # Define the URI for the Sag node
    sag_uri = SAG[str(row["id"])]
    #print(sag_uri)

    # Add the node type
    g.add((sag_uri, RDF.type, EX["Sag"]))

    # Add the attributes as properties of the Sag node
    g.add((sag_uri, SAG["typeid"], Literal(row["typeid"], datatype=XSD.integer)))
    g.add((sag_uri, SAG["kategoriid"], Literal(row["kategoriid"], datatype=XSD.integer)))
    g.add((sag_uri, SAG["statusid"], Literal(row["statusid"], datatype=XSD.integer)))
    g.add((sag_uri, SAG["titel"], Literal(row["titel"])))
    g.add((sag_uri, SAG["titelkort"], Literal(row["titelkort"])))
    g.add((sag_uri, SAG["offentlighedskode"], Literal(row["offentlighedskode"])))
    g.add((sag_uri, SAG["nummer"], Literal(row["nummer"])))
    g.add((sag_uri, SAG["nummerprefix"], Literal(row["nummerprefix"])))
    g.add((sag_uri, SAG["nummernumerisk"], Literal(row["nummernumerisk"])))
    g.add((sag_uri, SAG["nummerpostfix"], Literal(row["nummerpostfix"])))
    g.add((sag_uri, SAG["resume"], Literal(row["resume"])))
    g.add((sag_uri, SAG["afstemningskonklusion"], Literal(row["afstemningskonklusion"])))
    g.add((sag_uri, SAG["periodeid"], Literal(row["periodeid"], datatype=XSD.integer)))
    g.add((sag_uri, SAG["afgørelsesresultatkode"], Literal(row["afgørelsesresultatkode"])))
    g.add((sag_uri, SAG["baggrundsmateriale"], Literal(row["baggrundsmateriale"])))
    g.add((sag_uri, SAG["opdateringsdato"], Literal(row["opdateringsdato"], datatype=XSD.dateTime)))
    g.add((sag_uri, SAG["statsbudgetsag"], Literal(row["statsbudgetsag"], datatype=XSD.boolean)))
    g.add((sag_uri, SAG["begrundelse"], Literal(row["begrundelse"])))
    g.add((sag_uri, SAG["paragrafnummer"], Literal(row["paragrafnummer"])))
    g.add((sag_uri, SAG["paragraf"], Literal(row["paragraf"])))
    g.add((sag_uri, SAG["afgørelsesdato"], Literal(row["afgørelsesdato"], datatype=XSD.dateTime)))
    g.add((sag_uri, SAG["afgørelse"], Literal(row["afgørelse"])))
    g.add((sag_uri, SAG["rådsmødedato"], Literal(row["rådsmødedato"], datatype=XSD.dateTime)))
    g.add((sag_uri, SAG["lovnummer"], Literal(row["lovnummer"])))
    g.add((sag_uri, SAG["lovnummerdato"], Literal(row["lovnummerdato"], datatype=XSD.dateTime)))
    g.add((sag_uri, SAG["retsinformationsurl"], Literal(row["retsinformationsurl"])))
    g.add((sag_uri, SAG["fremsatundersagid"], Literal(row["fremsatundersagid"])))
    g.add((sag_uri, SAG["deltundersagid"], Literal(row["deltundersagid"])))

100%|██████████| 88851/88851 [01:09<00:00, 1278.84it/s]


In [6]:
#Adding dokument nodes
for _, row in tqdm(Dokument.iterrows(), total=len(Dokument)):
    dokument_uri = DOKUMENT[str(row["id"])]
    g.add((dokument_uri, RDF.type, EX["Dokument"]))
    g.add((dokument_uri, DOKUMENT["typeid"], Literal(row["typeid"], datatype=XSD.integer)))
    g.add((dokument_uri, DOKUMENT["kategoriid"], Literal(row["kategoriid"], datatype=XSD.integer)))
    g.add((dokument_uri, DOKUMENT["statusid"], Literal(row["statusid"], datatype=XSD.integer)))
    g.add((dokument_uri, DOKUMENT["titel"], Literal(row["titel"])))
    g.add((dokument_uri, DOKUMENT["dato"], Literal(row["dato"], datatype=XSD.dateTime)))
    g.add((dokument_uri, DOKUMENT["spørgsmålsid"], Literal(row["spørgsmålsid"], datatype=XSD.integer)))
    g.add((dokument_uri, DOKUMENT["spørgsmålstitel"], Literal(row["spørgsmålstitel"])))
    g.add((dokument_uri, DOKUMENT["paragraf"], Literal(row["paragraf"])))
    

100%|██████████| 871023/871023 [03:53<00:00, 3728.37it/s]


In [7]:
#Adding aktør nodes
for _, row in tqdm(Aktør.iterrows(), total=len(Aktør)):
  aktør_uri = AKTØR[str(row["id"])]
  g.add((aktør_uri, RDF.type, EX["Aktør"]))
  g.add((aktør_uri, AKTØR["typeid"], Literal(row["typeid"], datatype=XSD.integer)))
  g.add((aktør_uri, AKTØR["navn"], Literal(row["navn"])))
  g.add((aktør_uri, AKTØR["gruppenavnkort"], Literal(row["gruppenavnkort"])))
  g.add((aktør_uri, AKTØR["entity_type"], Literal(row["entity_type"])))

100%|██████████| 17659/17659 [00:02<00:00, 7388.17it/s]


In [8]:
SagDokumentRolle_dict = {i: rolle for i, rolle in enumerate(SagDokumentRolle["rolle"].unique(), 1)}
SagDokumentRolle_dict = {i: rolle.replace(" ", "_") for i, rolle in SagDokumentRolle_dict.items()}
SagDokumentRolle_dict


{1: 'Tidl._jour._på',
 2: 'Parallelomdelt_på',
 3: 'På_sagstrin',
 4: 'Hovedtilknytning',
 5: 'Se_også',
 6: 'Relation',
 7: 'Child'}

In [9]:
SagDokument.iloc[0]

id                                         21
sagid                                    4496
dokumentid                               7913
bilagsnummer                                 
frigivelsesdato           2013-10-16 14:54:51
opdateringsdato    2014-09-16 06:16:53.990000
rolleid                                     4
Name: 0, dtype: object

In [10]:
### Adding edges between sag and dokument,

# Iterate over each row of the Sag dataframe
for _, row in tqdm(SagDokument.iterrows(), total=len(SagDokument)):
    # Define the URI for the Sag node
    sag_uri = SAG[str(row["sagid"])]
    dokument_uri = DOKUMENT[str(row["dokumentid"])]
    
    # Add the edge type
    g.add((sag_uri, EX["hasDokument"], dokument_uri))
    g.add((sag_uri, EX["isAktørOf"], aktør_uri))
    rolle = SagDokumentRolle_dict[int(row["rolleid"])]
    g.add((sag_uri, SAGDOKUMENTROLLE[rolle], dokument_uri))


100%|██████████| 593091/593091 [00:53<00:00, 11006.05it/s]


In [11]:
#create a dict that maps the rolle to intgers starting at 1

SagAktørRolle_dict = {i: rolle for i, rolle in enumerate(SagAktørRolle['rolle'].unique(), 1)}


In [12]:
SagAktør["rolleid"].value_counts()

9     74452
6     65801
14    64126
17    53104
10    52164
11    27209
16    21455
12    11166
19     4642
4      3746
15     3722
5       881
18      352
2        75
3        37
8        32
13       11
7         2
1         1
Name: rolleid, dtype: int64

In [13]:
#replace space with underscore
SagAktørRolle_dict = {i: rolle.replace(" ", "_") for i, rolle in SagAktørRolle_dict.items()}
SagAktørRolle_dict

{1: 'Taler',
 2: 'Ordfører_for_forslagsstillerne',
 3: 'Tidligere_henvist_til',
 4: 'Af',
 5: 'Medspørger',
 6: 'Ministerområde',
 7: 'Privatist',
 8: 'Kopi_sendt_til',
 9: 'Relevant_for',
 10: 'Spørger',
 11: 'Henvist_til',
 12: 'Udsteder',
 13: 'Optaget_af',
 14: 'Minister',
 15: 'Forespørger',
 16: 'Forslagsstiller_(priv.)',
 17: 'Til',
 18: 'Afgivet_af',
 19: 'Forslagsstiller_(reg.)',
 20: 'Orlovssøgende',
 21: 'Stedfortræder',
 22: 'Statsrevisor_inhabil',
 23: 'Besvaret_af'}

In [14]:
# Doing the same for Sag and Aktør
for _, row in tqdm(SagAktør.iterrows(), total=len(SagAktør)):
    sag_uri = SAG[str(row["sagid"])]
    aktør_uri = AKTØR[str(row["aktørid"])]
    g.add((sag_uri, EX["hasAktør"], aktør_uri))
    g.add((aktør_uri, EX["isAktørOf"], sag_uri))
    rolle = SagAktørRolle_dict[int(row["rolleid"])]
    g.add((sag_uri, SAGAKTØRROLLE[rolle], aktør_uri))
    

100%|██████████| 382978/382978 [00:28<00:00, 13280.81it/s]


In [15]:

#First creating a dict that maps the rolle to intgers starting at 1
DokumentAktørRolle_dict = {i: rolle for i, rolle in enumerate(DokumentAktørRolle['rolle'].unique(), 1)}
DokumentAktørRolle_dict = {i: rolle.replace(" ", "_") for i, rolle in DokumentAktørRolle_dict.items()}
DokumentAktørRolle_dict

{1: 'Afsender',
 2: 'Kopi_til',
 3: 'Stiller/MFU',
 4: 'Besvaret_af',
 5: 'Minister',
 6: 'Spørger',
 7: 'Medspørger',
 8: 'Til',
 9: 'Ministerområde',
 10: 'Adressat',
 11: 'Modtager',
 12: 'Stiller',
 13: 'Relevant_for',
 14: 'Afgivet_af',
 15: 'BCC',
 16: 'Kontakt',
 17: 'Deltager',
 18: 'Behandles_i',
 19: 'Forslagsstiller',
 20: 'Ordfører_for_forslagsstillerne',
 21: 'Ordfører_for_forespørgerne',
 22: 'Ordfører',
 23: 'Taler'}

In [16]:
#Doing the same for Dokument and Aktør

for _, row in tqdm(DokumentAktør.iterrows(), total=len(DokumentAktør)):
    dokument_uri = DOKUMENT[str(row["dokumentid"])]
    aktør_uri = AKTØR[str(row["aktørid"])]
    g.add((dokument_uri, EX["hasAktør"], aktør_uri))
    g.add((aktør_uri, EX["isAktørOf"], dokument_uri))
    rolle = DokumentAktørRolle_dict[int(row["rolleid"])]
    g.add((dokument_uri, DOKUMENTAKTØRROLLE[rolle], aktør_uri))

100%|██████████| 933647/933647 [01:22<00:00, 11294.79it/s]


In [17]:
#Creating Emneordstype dict
EmneordsType_dict = {i: emneordstype for i, emneordstype in enumerate(EmneordsType["type"].unique(), 1)}

EmneordsType_dict

{1: 'Sagsområde',
 2: 'Ukontrolleret',
 3: 'Kontrolleret',
 4: 'Lovsagsnavn',
 5: 'Thesaurus',
 6: 'Kontonummer',
 7: 'Retsgrundlag'}

In [18]:
Emneord.iloc[0]

id                                          1
typeid                                      1
emneord                 økonomisk redegørelse
opdateringsdato    2014-12-16 18:44:04.673000
Name: 0, dtype: object

In [19]:
#adding emneord as nodes?
for _, row in tqdm(Emneord.iterrows(), total=len(Emneord)):
    emneord_uri = EMNEORD[str(row["id"])]
    g.add((emneord_uri, RDF.type, EX["Emneord"]))
    g.add((emneord_uri, EMNEORD["emneord"], Literal(row["emneord"])))
    emneordstype = EmneordsType_dict[int(row["typeid"])]
    

100%|██████████| 48826/48826 [00:03<00:00, 13514.40it/s]


In [20]:
#Linking Sag and Emneord
for _, row in tqdm(EmneordSag.iterrows(), total=len(EmneordSag)):
    sag_uri = SAG[str(row["sagid"])]
    emneord_uri = EMNEORD[str(row["emneordid"])]
    g.add((sag_uri, EX["hasEmneord"], emneord_uri))
    g.add((emneord_uri, EX["isEmneordOf"], sag_uri))
    emneordstypdid = Emneord["typeid"][Emneord["id"] == row["emneordid"]]
    emneordtype = EmneordsType_dict[int(emneordstypdid)]
    g.add((sag_uri, EMNEORDSTYPE[emneordtype], emneord_uri))

100%|██████████| 252987/252987 [01:02<00:00, 4063.66it/s]


In [21]:
sag_nodes = sorted([sag for sag in g.subjects(RDF.type, EX["Sag"])])
if len(sag_nodes) >= 2:
    sag_node = sag_nodes[1]

    # Print the attributes of the second Sag node
    for s, p, o in g.triples((sag_node, None, None)):
        if isinstance(o, Literal):
            print(f"{p}: {o.value}")
        else:
            print(f"{p}: {o}")
else:
    print("There are not enough Sag nodes in the graph.")

http://www.w3.org/1999/02/22-rdf-syntax-ns#type: http://XAINLP.com/Sag
http://XAINLP.com/sag/typeid: 7
http://XAINLP.com/sag/kategoriid: <NA>
http://XAINLP.com/sag/statusid: 54
http://XAINLP.com/sag/titel: Forslag til Europa-Parlamentets og Rådets direktiv om foreløbig retshjælp til mistænkte eller tiltalte, der frihedsberøves, og retshjælp i sager angående europæiske arrestordrer
http://XAINLP.com/sag/titelkort: Forslag til Europa-Parlamentets og Rådets direktiv om foreløbig retshjælp til mistænkte eller tiltalte, der frihedsberøves, og retshjælp i sager angående europæiske arrestordrer
http://XAINLP.com/sag/offentlighedskode: O
http://XAINLP.com/sag/nummer: KOM (2013) 0824
http://XAINLP.com/sag/nummerprefix: KOM
http://XAINLP.com/sag/nummernumerisk: 824
http://XAINLP.com/sag/nummerpostfix: 
http://XAINLP.com/sag/resume: <div>


<p>
<strong>Forslaget er modtaget</strong> af Folketinget i dansk sprogudgave 
 den&nbsp;18. december&nbsp;2013, jf. <a href="http://www.euo.dk/upload/applica

In [22]:
sag_nodes = sorted([sag for sag in g.subjects(RDF.type, EX["Sag"])])
if len(sag_nodes) >= 2:
    sag_node = sag_nodes[1]

    # Print the attributes of the second Sag node
    for s, p, o in g.triples((sag_node, None, None)):
        if isinstance(o, Literal):
            print(f"{p}: {o.value}")
        else:
            print(f"{p}: {o}")
else:
    print("There are not enough Sag nodes in the graph.")

http://www.w3.org/1999/02/22-rdf-syntax-ns#type: http://XAINLP.com/Sag
http://XAINLP.com/sag/typeid: 7
http://XAINLP.com/sag/kategoriid: <NA>
http://XAINLP.com/sag/statusid: 54
http://XAINLP.com/sag/titel: Forslag til Europa-Parlamentets og Rådets direktiv om foreløbig retshjælp til mistænkte eller tiltalte, der frihedsberøves, og retshjælp i sager angående europæiske arrestordrer
http://XAINLP.com/sag/titelkort: Forslag til Europa-Parlamentets og Rådets direktiv om foreløbig retshjælp til mistænkte eller tiltalte, der frihedsberøves, og retshjælp i sager angående europæiske arrestordrer
http://XAINLP.com/sag/offentlighedskode: O
http://XAINLP.com/sag/nummer: KOM (2013) 0824
http://XAINLP.com/sag/nummerprefix: KOM
http://XAINLP.com/sag/nummernumerisk: 824
http://XAINLP.com/sag/nummerpostfix: 
http://XAINLP.com/sag/resume: <div>


<p>
<strong>Forslaget er modtaget</strong> af Folketinget i dansk sprogudgave 
 den&nbsp;18. december&nbsp;2013, jf. <a href="http://www.euo.dk/upload/applica

### The SPARQL for selecting dokuments linked to sag id works

In [40]:
#Save the graph
#g.serialize(destination='../data/graph.ttl', format='turtle')

<Graph identifier=Ne5fd941128014243bc6ddef7c1d9fd9e (<class 'rdflib.graph.Graph'>)>

In [78]:
from rdflib import Graph, Literal
from rdflib.namespace import RDF, RDFS, FOAF, XSD
from rdflib.plugins.sparql import prepareQuery


def get_linked_dokument_ids(g, sagid):
    # Define the URI for the Sag node
    sag_uri = SAG[str(sagid)]

    # Prepare the SPARQL query
    query_str = """
        PREFIX ex: <http://XAINLP.com/>
        SELECT ?dokument WHERE {{
            <{sag_uri}> ex:hasDokument ?dokument .
            ?dokument a ex:Dokument .
        }}
    """.format(sag_uri=sag_uri)
    print(query_str)
    query = prepareQuery(query_str, initNs={"ex": EX})

    # Execute the query and retrieve the results
    result = g.query(query)

    # Extract the dokument IDs from the results
    dokument_ids = [str(row["dokument"].split("/")[-1]) for row in result]

    return dokument_ids


In [79]:
test = get_linked_dokument_ids(g, 2)
print(test)


        PREFIX ex: <http://XAINLP.com/>
        SELECT ?dokument WHERE {
            <http://XAINLP.com/sag/2> ex:hasDokument ?dokument .
            ?dokument a ex:Dokument .
        }
    
['2', '3']


In [80]:
from SPARQLBurger.SPARQLQueryBuilder import *

# Create a graph pattern
pattern = SPARQLGraphPattern()

# Add a couple of triples to the pattern
pattern.add_triples(
        triples=[
            Triple(subject="?person", predicate="rdf:type", object="ex:Person"),
            Triple(subject="?person", predicate="ex:hasName", object="?name")
        ]
    )

# Let's print this graph pattern
print(pattern.get_text())

{
   ?person rdf:type ex:Person . 
   ?person ex:hasName ?name . 
}



In [81]:
from SPARQLBurger.SPARQLQueryBuilder import *



#sag_uri = SAG[str(2)]

# Create an object of class SPARQLSelectQuery and set the limit for the results to 100
select_query = SPARQLSelectQuery(distinct=False, limit=100)

# Add a prefix
select_query.add_prefix(
    prefix=Prefix(prefix="ex", namespace="http://XAINLP.com/")
)

#EX = Namespace("http://XAINLP.com/")

# Add the variables we want to select
select_query.add_variables(variables=["?dokument"])

# Create a graph pattern to use for the WHERE part and add some triples
where_pattern = SPARQLGraphPattern()
where_pattern.add_triples(
        triples=[
            Triple(subject="INSERT", predicate="ex:hasDokument", object="?dokument"),
            Triple(subject="?dokument", predicate="rdf:type", object="ex:Dokument") #rdf:type or a is the same
            #Triple(subject="?aktør", predicate="ex:isAktørOf", object="?sag"),
            #Triple(subject="?person", predicate="ex:address", object="?address"),
        ]
    )

# Set this graph pattern to the WHERE part
select_query.set_where_pattern(graph_pattern=where_pattern)



# Print the query we have defined
print(select_query.get_text())
burger = select_query.get_text()

PREFIX ex: <http://XAINLP.com/>

SELECT ?dokument
WHERE {
   INSERT ex:hasDokument ?dokument . 
   ?dokument rdf:type ex:Dokument . 
}
LIMIT 100


In [82]:
from rdflib import Graph, Literal
from rdflib.namespace import RDF, RDFS, FOAF, XSD
from rdflib.plugins.sparql import prepareQuery


def get_linked_dokument_ids(g, sagid, burger):
    # Define the URI for the Sag node
    sag_uri = SAG[str(sagid)]

    # Prepare the SPARQL query. Replace INSERT with sag_uri
    query_str = burger.replace("INSERT", "<"+sag_uri+">")
    print(query_str)
    query = prepareQuery(query_str, initNs={"ex": EX})

    # Execute the query and retrieve the results
    result = g.query(query)

    # Extract the dokument IDs from the results
    dokument_ids = [str(row["dokument"].split("/")[-1]) for row in result]

    return dokument_ids

test = get_linked_dokument_ids(g, 2, burger)
print(test)

<http://XAINLP.com/sag/2 does not look like a valid URI, trying to serialize this will break.
<http://XAINLP.com/sag/2> does not look like a valid URI, trying to serialize this will break.


PREFIX ex: <http://XAINLP.com/>

SELECT ?dokument
WHERE {
   <http://XAINLP.com/sag/2> ex:hasDokument ?dokument . 
   ?dokument rdf:type ex:Dokument . 
}
LIMIT 100
['2', '3']


### Now attempting to select all sager with a given emneord

Currently the graph contains:
* Sager with atrributes
* Dokumenter with attributes
* Aktører with attributes
* SagDokument links with rollenavn
* SagAktør links with rollenavn
* DokumentAktør links with rollenav
* EmneordSag links with emneordstype

Missing:
* SagKategori perhaps

In [69]:
def get_sag_titel_from_emneordid(g, emneordid):
    emneord_uri = EMNEORD[str(emneordid)]
    select_query = SPARQLSelectQuery(distinct=False, limit=100)
    select_query.add_prefix(
        prefix=Prefix(prefix="ex", namespace="{EX}")
    )
    select_query.add_prefix(
        prefix=Prefix(prefix="sag", namespace="{SAG}")
    )
    select_query.add_variables(variables=["?sag", "?titel"])
    where_pattern = SPARQLGraphPattern()
    where_pattern.add_triples(
        triples=[
            Triple("?sag", "ex:hasEmneord", "{emneord_uri}"),
            Triple("?sag", "rdf:type", "ex:Sag"),
            Triple("?sag", "sag:titel", "?titel")]
    )

    select_query.set_where_pattern(graph_pattern=where_pattern)

    burger = select_query.get_text()
    query_str = f"{burger.replace('{EX}', EX).replace('{SAG}', SAG).replace('{emneord_uri}', '<' + emneord_uri + '>')}"
    query_str = query_str.encode('utf-8')
    print(query_str)
    query = prepareQuery(query_str, initNs={"ex": EX, "sag": SAG})
    result = g.query(query)

    return result

count = 0
for row in get_sag_titel_from_emneordid(g, 33101):
    count += 1
    if count <5:
        print(f"Title is {row[1]}")
        print(f"Sag ID is {row[0]}")

<http://XAINLP.com/emneord/33101 does not look like a valid URI, trying to serialize this will break.
<http://XAINLP.com/emneord/33101> does not look like a valid URI, trying to serialize this will break.


b'PREFIX ex: <http://XAINLP.com/>\nPREFIX sag: <http://XAINLP.com/sag/>\n\nSELECT ?sag ?titel\nWHERE {\n   ?sag ex:hasEmneord <http://XAINLP.com/emneord/33101> . \n   ?sag rdf:type ex:Sag . \n   ?sag sag:titel ?titel . \n}\nLIMIT 100'
Title is Forslag til RÅDETS FORORDNING om ændring af forordning (EF) nr. 798/2004 om forlængelse af de restriktive foranstaltninger over for Burma/Myanmar, for så vidt angår finansieringen af visse virksomheder 
Sag ID is http://XAINLP.com/sag/28715
Title is Forslag til Rådets afgørelse om undertegnelse og midlertidig anvendelse af en protokol til Euro-Middelhavsaftalen mellem De Europæiske Fællesskaber og deres medlemsstater på den ene side og Staten Israel på den anden side for at tage hensyn til Den Tjekkiske Republiks, Republikken Estlands, Republikken Cyperns, Republikken Letlands, Republikken Litauens, Republikken Ungarns, Republikken Maltas,...

Sag ID is http://XAINLP.com/sag/30683
Title is Rådsmøde nr. 2638 (Økofin) 17/2-2005
Sag ID is http://XAI

### Attempting to find sag nodes based on aktør ids

In [72]:
def get_sag_titel_from_aktør_ids(g, aktør_ids):
    select_query = SPARQLSelectQuery(distinct=False, limit=100)
    select_query.add_prefix(
        prefix=Prefix(prefix="ex", namespace="{EX}")
    )
    select_query.add_prefix(
        prefix=Prefix(prefix="sag", namespace="{SAG}")
    )
    select_query.add_prefix(
        prefix=Prefix(prefix="aktør", namespace="{AKTØR}")
    )
    select_query.add_variables(variables=["?sag", "?titel"])
    where_pattern = SPARQLGraphPattern()

    aktør_uris = ", ".join(f"<{AKTØR}{aktør_id}>" for aktør_id in aktør_ids)
    filter_clause = f"(?aktør IN ({aktør_uris}))"

    where_pattern.add_triples(
        triples=[
            Triple("?sag", "ex:hasAktør", "?aktør"),
            Triple("?sag", "rdf:type", "ex:Sag"),
            Triple("?sag", "sag:titel", "?titel")]
    )
    where_pattern.add_filter(filter=Filter(expression=filter_clause))

    select_query.set_where_pattern(graph_pattern=where_pattern)

    burger = select_query.get_text()
    query_str = f"{burger.replace('{EX}', EX).replace('{SAG}', SAG).replace('{AKTØR}', AKTØR)}"
    query_str = query_str.encode('utf-8')
    query = prepareQuery(query_str, initNs={"ex": EX, "sag": SAG, "aktør": AKTØR})
    result = g.query(query)

    return result


In [74]:
aktør_ids = [1,2,3]
count = 0
for row in get_sag_titel_from_aktør_ids(g, aktør_ids):
    count += 1
    if count <5:
        print(f"Title is {row[1]}")
        print(f"Sag ID is {row[0]}")


Title is FIU alm. del
Sag ID is http://XAINLP.com/sag/1
Title is FIU alm. del
Sag ID is http://XAINLP.com/sag/1
Title is Forslag til Europa-Parlamentets og Rådets afgørelse om makrofinansiel bistand til Den Tunesiske Republik
Sag ID is http://XAINLP.com/sag/4
Title is Mener ministeren, at det er fair, at det offentlige på den ene side stiller krav til borgere og virksomheder om at skulle kunne kommunikere digitalt med det offentlige, når det offentlige ikke selv giver mulighed for digital kommunikation, som det er tilfældet med den manglende mulighed for digital aftaleindgåelse om NemID medarbejdersignatur for andre virksomheder end personligt ejede?
Sag ID is http://XAINLP.com/sag/8
