# Übung - Metadaten suchen & filtern

*In diesem Abschnitt:*  

- *Eingrenzung der Suche nach offenen Daten auf das Wort „Baumkataster“*
- *Eingrenzung der Suche nach offenen Daten „Baumkataster“ auf den Zeitraum 2010-2015 (2017 ist etwas random...)*
- *Dann durch Erinnern an Gesetz Änderung des Zeitraums auf 2015-2025*

In dieser Übung wollen wir mit Hilfe von SPARQL Metadaten suchen und filtern, wie im vorherigen Abschnitt gezeigt. Dabei unterstützen wir Dr. Amir Weber in seinem Untersuchungsauftrag, zu prüfen, welche offen verfügbaren Daten existieren, die dazu beitragen können, den Baumbestand in einer bestimmten Region zu ermitteln.

Nachdem wir im letzten Abschnitt nach offenen Daten im Allgemeinen gesucht haben, gilt es nun, die Suche zu verfeinern bzw. die Suchergebnisse zu filtern. Dazu werden wir in einem ersten Schritt nach Datensätzen suchen, die das Wort "Baumkataster" im Titel beinhalten. In einem weiteren Schritt werden wir das Ergebnis danach auf einen Zeitabschnitt beschränken.

## Suche nach "Baumkataster"

**Erklärung des Codes**

Als erstes setzen wir mit

`(%endpoint https://data.europa.eu/sparql)` 

wieder unsere Verknüpfung zur Schnittstelle des europäischen Datenportals data.europa.eu. 

Auch die PREFIXES kennen Sie bereits aus dem vorigen Abschnitt:

Mit dem PREFIX

`(dct: <http://purl.org/dc/terms/>)`

kürzen wir Verweise auf die angegebene Adresse (der Namensraum der Dublic Core Metadata Initiative) auf *dct* (dublin core term).

Mit dem PREFIX 

`(dcatde: <http://dcat-ap.de/def/dcatde/>)` 

kürzen wir Verweise aus dem Namensraum von DCAT-AP auf *dcatde* (data catalog vocabulary deutschland).

Mit den SELECT-Befehlen geben wir die Eigenschaften an, die wir sehen wollen. Die wären lediglich als Spalten zu sehen, nur wenn wir die in der SELECT-Zeile angeben.

Dann ...

mit den FILTER-Befehlen, z.B.

`FILTER(isURI(?contributorid))`

führen wir zusätzliche Bedingungen ein, die die Datensätze erfüllen müssen, um aufgelistet zu werden. Damit geben wir an, dass nur Ergebnisse angezeigt werden sollen, bei denen der Bereitsteller als URI-Link angegeben ist.

Die Funktion `strstarts` zusammen mit dem angegebenen Wert legt fest, mit welcher Zeichenfolge die Angabe beginnen muss.

**Code und Output** Vorsicht: Übung teilen: erst Suche nach Baumkataster + in einem neuem Fenster Suche nach Zeitabschnitt...

Als nächstes wollen wir uns alle Datensätze ansehen die im Titel das Wort "Baumkataster" beinhalten.

In [6]:
%endpoint https://data.europa.eu/sparql
PREFIX dct: <http://purl.org/dc/terms/>
PREFIX dcatde: <http://dcat-ap.de/def/dcatde/>

SELECT ?uri ?title ?contributorid ?modified WHERE {
    {
        SELECT ?uri ?title ?contributorid ?modified WHERE {
            ?uri dct:title ?title .
            ?uri dcatde:contributorID ?contributorid .
            ?uri dct:modified ?modified .
            FILTER(isURI(?contributorid))
            FILTER(strstarts(str(?contributorid), "http://dcat-ap.de/def/contributors/"))       
            FILTER(CONTAINS(LCASE(?title), "baumkataster"))
        }
    }
}

uri,title,contributorid,modified
http://data.europa.eu/88u/dataset/fcdceb2e-d16d-410c-ba0f-521ba8c6effa,Fachpläne - Baumkataster,http://dcat-ap.de/def/contributors/datenBW,2025-01-03T08:49:41.490922
http://data.europa.eu/88u/dataset/c1c61928-c602-4e37-af31-2d23901e2540,Straßenbaumkataster Hamburg,http://dcat-ap.de/def/contributors/transparenzportalHamburg,2025-01-25T23:05:06.709577
http://data.europa.eu/88u/dataset/19676799-fedb-4d1a-a89a-26fba887b3f0~~2,Straßenbaumkataster Hamburger Hafen,http://dcat-ap.de/def/contributors/transparenzportalHamburg,2025-01-24T21:38:49.974593
http://data.europa.eu/88u/dataset/fb87ef77-86bf-444f-8f43-d73ef0708e42,D30 Baumkataster der Kreisstadt Bergheim,http://dcat-ap.de/def/contributors/openNRW,2021-09-08T08:02:44+02:00
http://data.europa.eu/88u/dataset/5f0aaf45-f380-49b3-87be-51abaddacbe0,Baumkataster Norderstedt,http://dcat-ap.de/def/contributors/schleswigHolstein,2022-04-12T07:58:22.519048
http://data.europa.eu/88u/dataset/cfbe70e6-6078-42db-8c9b-f8745ee8916e,Baumkataster,http://dcat-ap.de/def/contributors/schleswigHolstein,2023-06-09T05:25:52.631385
http://data.europa.eu/88u/dataset/b16bb333-26ca-4743-9663-723d63f57259,Digitales Baumkataster Münster,http://dcat-ap.de/def/contributors/openNRW,2025-03-13T13:28:04+01:00
http://data.europa.eu/88u/dataset/200e532c-a381-4611-ba05-4ed7afc31230,Baumkataster des ASG Wesel,http://dcat-ap.de/def/contributors/openNRW,2024-05-28T11:46:06.401383
http://data.europa.eu/88u/dataset/baumkataster_stadt_wuerzburg-wuerzburg,Baumkataster der Stadt Würzburg,http://dcat-ap.de/def/contributors/openDataBayern,2024-11-14T13:33:38.241Z
http://data.europa.eu/88u/dataset/https-registry-gdi-de-org-id-de-sn-stlp-cee75d75-4b4e-4bea-9d24-8b5993b54479,"Baumkataster, Stadt Leipzig",http://dcat-ap.de/def/contributors/freistaatSachsen,2025-02-19


## Eingrenzung auf einen Zeitraum

Nachdem wir uns mit der obigen Abfrage offene Daten deutscher Bereitsteller, die das Wort "Baumkataster" beinhalten, haben anzeigen lassen, wollen wir das Ergebnis nun auf einen Zeitraum eingrenzen.

Dr. Weber hat erstmal den Zeitraum 2010-2015 gewählt. 

In [5]:
%endpoint https://data.europa.eu/sparql
PREFIX dct: <http://purl.org/dc/terms/>
PREFIX dcatde: <http://dcat-ap.de/def/dcatde/>

SELECT ?uri ?title ?contributorid ?modified WHERE {
    {
        SELECT ?uri ?title ?contributorid ?modified WHERE {
            ?uri dct:title ?title .
            ?uri dcatde:contributorID ?contributorid .
            ?uri dct:modified ?modified .
            FILTER(isURI(?contributorid))
            FILTER(strstarts(str(?contributorid), "http://dcat-ap.de/def/contributors/"))       
            FILTER(CONTAINS(LCASE(?title), "baumkataster"))
            FILTER(
                CONTAINS(STR(?modified), "2010") || 
                CONTAINS(STR(?modified), "2011") || 
                CONTAINS(STR(?modified), "2012") || 
                CONTAINS(STR(?modified), "2013") || 
                CONTAINS(STR(?modified), "2014") || 
                CONTAINS(STR(?modified), "2015") 
                )
        }
    }
}

uri,title,contributorid,modified


## Anpassen der Abfrage

Nachdem er sich die Ausgabe angesehen hat, fällt Dr. Amir Weber ein, dass im Sommer 2017 das sog. Open-Data-Gesetz in Kraft getreten ist. Damit wurden Behörden der unmittelbaren Bundesverwaltung dazu verpflichtet, Datensätze "open", also offen und für alle zugänglich, bereitzustellen.

Er vermutet daher einen Anstieg der eingepflegten Daten nach 2017 und passt seine SPARQL-Abrage dementsprechend an. Wir wollen daher nun Daten aus den Jahren 2015 bis 2025 suchen.

**Code und Output**

In [8]:
%endpoint https://data.europa.eu/sparql
PREFIX dct: <http://purl.org/dc/terms/>
PREFIX dcatde: <http://dcat-ap.de/def/dcatde/>

SELECT ?uri ?title ?contributorid ?modified WHERE {
    {
        SELECT ?uri ?title ?contributorid ?modified WHERE {
            ?uri dct:title ?title .
            ?uri dcatde:contributorID ?contributorid .
            ?uri dct:modified ?modified .
            FILTER(isURI(?contributorid))
            FILTER(strstarts(str(?contributorid), "http://dcat-ap.de/def/contributors/"))       
            FILTER(CONTAINS(LCASE(?title), "baumkataster"))
            FILTER(
                CONTAINS(STR(?modified), "2015") ||
                CONTAINS(STR(?modified), "2016") ||
                CONTAINS(STR(?modified), "2017") ||
                CONTAINS(STR(?modified), "2018") ||
                CONTAINS(STR(?modified), "2019") ||
                CONTAINS(STR(?modified), "2020") ||
                CONTAINS(STR(?modified), "2021") ||
                CONTAINS(STR(?modified), "2022") ||
                CONTAINS(STR(?modified), "2023") ||
                CONTAINS(STR(?modified), "2024") ||
                CONTAINS(STR(?modified), "2025")
            )
        }
    }
}


uri,title,contributorid,modified
http://data.europa.eu/88u/dataset/fcdceb2e-d16d-410c-ba0f-521ba8c6effa,Fachpläne - Baumkataster,http://dcat-ap.de/def/contributors/datenBW,2025-01-03T08:49:41.490922
http://data.europa.eu/88u/dataset/c1c61928-c602-4e37-af31-2d23901e2540,Straßenbaumkataster Hamburg,http://dcat-ap.de/def/contributors/transparenzportalHamburg,2025-01-25T23:05:06.709577
http://data.europa.eu/88u/dataset/19676799-fedb-4d1a-a89a-26fba887b3f0~~2,Straßenbaumkataster Hamburger Hafen,http://dcat-ap.de/def/contributors/transparenzportalHamburg,2025-01-24T21:38:49.974593
http://data.europa.eu/88u/dataset/fb87ef77-86bf-444f-8f43-d73ef0708e42,D30 Baumkataster der Kreisstadt Bergheim,http://dcat-ap.de/def/contributors/openNRW,2021-09-08T08:02:44+02:00
http://data.europa.eu/88u/dataset/5f0aaf45-f380-49b3-87be-51abaddacbe0,Baumkataster Norderstedt,http://dcat-ap.de/def/contributors/schleswigHolstein,2022-04-12T07:58:22.519048
http://data.europa.eu/88u/dataset/cfbe70e6-6078-42db-8c9b-f8745ee8916e,Baumkataster,http://dcat-ap.de/def/contributors/schleswigHolstein,2023-06-09T05:25:52.631385
http://data.europa.eu/88u/dataset/b16bb333-26ca-4743-9663-723d63f57259,Digitales Baumkataster Münster,http://dcat-ap.de/def/contributors/openNRW,2025-03-13T13:28:04+01:00
http://data.europa.eu/88u/dataset/200e532c-a381-4611-ba05-4ed7afc31230,Baumkataster des ASG Wesel,http://dcat-ap.de/def/contributors/openNRW,2024-05-28T11:46:06.401383
http://data.europa.eu/88u/dataset/baumkataster_stadt_wuerzburg-wuerzburg,Baumkataster der Stadt Würzburg,http://dcat-ap.de/def/contributors/openDataBayern,2024-11-14T13:33:38.241Z
http://data.europa.eu/88u/dataset/https-registry-gdi-de-org-id-de-sn-stlp-cee75d75-4b4e-4bea-9d24-8b5993b54479,"Baumkataster, Stadt Leipzig",http://dcat-ap.de/def/contributors/freistaatSachsen,2025-02-19


## Zusammenfassung

In diesem Abschnitt haben wir uns dem Forschungsauftrag von Dr. Weber gewidmet und unsere Suche nach offenen deutschen Behördendaten auf solche eingegrenzt, die das Wort Baumkataster im Titel tragen. Anschließend haben wir die Suche auf einen bestimmten Zeitraum eingegrenzt und diesen verschoben. 

Dabei haben wir die Kenntnisse der Befehle PREFIX, SELECT und WHERE gefestigt und die FILTER-Funktion kennengelernt.

Im nächsten Abschnitt wird die Anzeige des Ergebnisses so angepasst, dass wir uns anzeigen lassen können, welche Datenbereitsteller am produktivsten sind und welche Formate verwendet werden.