# Open Data - Was, wie und wozu?

Anlässlich des Open Data Day 2023 möchten wir praktisch und plastisch vorstellen
- was offene Daten sind, 
- wie sie zur Anzeige gebracht werden und
- wozu sie beispielhaft dienen können.

Hierbei konzentrieren wir uns auf zwei Datenquellen:
1. Das Open Data-Portal der Stadt Bielefeld
2. Die offenen Daten des Projekts sensor.community

Für den Workshop ist kein besonderes Vorwissen nötig, lediglich eine stabile Internetverbindung und das Interesse, ein wenig Programmiercode näher gebracht zu bekommen. Insbesondere ist der Workshop auch für alle Open Data-Neulinge geeignet. 

***

Agenda:

1. Sehr kurze Einführung in Python
2. Visualisierung eines Datensatzes des Open Data-Portals der Stadt Bielefeld
3. Zugriff auf Daten der Feinstaubsensoren in Bielefeld
4. Zeichnen einer interaktiven Karte

## Sehr kurze Einführung in Python
Python ist eine sehr verbreitete Programmiersprache zur Auswertung und Visualisierung von Daten jeglicher Art.

**Achtung**: Die Strukturierung und damit die richtige Funktionsweise von Code-Teilen wird nicht wie bei einigen anderen Programmiersprachen über Klammern geregelt, sondern über die Einrückungen des Codes. Entsprechend wichtig ist es auf die Leerzeichen am Anfang einer Zeile zu achten.

Bei der Programmierung in Python gibt es verschiedene Grundobjekte und eingebaute Funktionen, welche genutzt werden können. So wird durch `a = 1` einer Variablen `a` der Zahlenwert `1` zugewiesen. Oder duch `b='Bielefeld'` steht die Variable `b` für die Zeichenfolge `Bielefeld`.

### Bausteine
Ähnlich wie in anderen Programmiersprachen gibt es eine Reihe an Grundfunktionen und -objekten, auf denen alles aufgebaut ist. Dazu gehören unter anderem Schleifen, Datentypen wie Ganzzahlen und Zeichenfolgen, sowie Listen. Eine Übersicht findet sich [hinter diesem Link](https://www.python-kurs.eu/python3_variablen.php), wir beschränken uns auf Beispiele. 

In [None]:
# for-Schleife
for i in [1, 2, 3, 4]:
    print(i)

In [None]:
#  while-Schleife
i = 1
while i <= 4:
    print(i)
    i += 1    

In [None]:
# If-Else-Bedingungen
# Code innerhalb der if-Bedingung wird nur ausgeführt, wenn die if-Bedingung wahr ist.
for i in [0, 1]:
    if i == 1:
        print(i, ': ', True)
    else:
        print(i, ': ', False)

### Funktionen
Zur besseren Strukturierung, Wiederverwendbarkeit und Lesbarkeit sollten klar abgrenzbare Codeschnipsel mit wohldefinierten Methodennamen in Funktionen gezogen werden. Eine Methode kann Übergabeparameter entgegennehmen, die innerhalb der Methode genutzt und / oder verändert werden. Gleichzeitig kann die Methode zum Schluss keinen, einen oder mehrere Werte als Rückgabeparameter über das Wort "return" zurückgeben.

In [None]:
# Methode definieren
def get_center_value(values: [int]):
    center_index: int = int(len(values) / 2)
    return values[center_index]

# Übergabeparameter definieren
values = [1, 2, 3, 4, 5]

# Methode aufrufen
center_value = get_center_value(values)
print('Center value: ', center_value)

## Pakete
Auf Basis obiger Funktionalitäten werden sogenannte Pakete (engl. Packages) programmiert, welche bestimmte Aufgaben erfüllen. Wir werden insbesondere die Pakete [pandas]() und [plotly]() verwenden. Hierbei dient `pandas` der Verarbeitung, Verwaltung und Analyse von Daten, während die Visualisierung über `plotly` erfolgt.

In [None]:
! pip install pandas plotly

In [None]:
# Zur späteren Verwendung eines Pakets muss es in die aktuelle Umgebung importiert werden.
import pandas as pd
import plotly.express as px

## Visualisierung eines Datensatzes des Open Data-Portals der Stadt Bielefeld

[<img src="img/OpenDataBielefeld.png">](https://open-data.bielefeld.de/)

Zunächst möchten wir uns Daten des Portals zur Anzeige bringen. Hierzu verwenden wir die [Wahlergebnisse der NRW-Landtagswahl 2022](https://open-data.bielefeld.de/dataset/landtagswahl-2022).

Ein Hauptmerkmal von Offenen Daten ist es, dass sie in einem Format vorliegen, welche maschinell eingelesen werden können. Die Wahlergebnisse hier werden als CSV-Datei bereitgestellt, die zugehörige URL kann angezeigt werden, indem mit der Maus über die Schaltfläche *Herunterladen* gegangen wird.

[<img src="img/OpenDataBielefeld_2.png">](https://open-data.bielefeld.de/dataset/landtagswahl-2022)

Mit dieser URL als Einstieg können wir nun die Wahlergebnisse analysieren und visualisieren. In kleinen Schritten werden wir nun den Datensatz so aufbereiten, dass wir die Erst- und Zweitstimmen des Stadtbezirks *Mitte* in einem Tortendiagramm darstellen können.

In [None]:
# Speichere die URL zum Datensatz in eine Variable
url_landtagswahl2022 = 'https://open-data.bielefeld.de/sites/default/files/Landtagswahl_2022.csv'

# Lies die Daten mithilfe von pandas und der URL ein
df = pd.read_csv(url_landtagswahl2022)

In [None]:
# Ausgabe der ersten 5 Zeilen
df.head(5)

In [None]:
# Hier scheint etwas nicht zu stimmen. Trotz des CSV-Formats (CSV steht für Comma-seperated values) ist das Trennzeichen ein ';', 
# welches wir in der Einlesefunktion verwenden müssen
df = pd.read_csv(
    url_landtagswahl2022,
    sep = ";"
)


In [None]:
# Ausgabe der ersten 50 Zeilen
df.head(50)

Der Datensatz hat 56 Spalten, welche nicht alle angezeigt werden. Daher lassen wir uns die Liste aller Spaltennamen ausgeben, damit wir im Anschluss nur die relevanten Spalten berücksichtigen.

In [None]:
# Ausgabe aller Spaltennamen
df.columns

Nun bereiten wir in mehreren kleinen Schritten die Tabelle, welche den `pandas`-Typ `DataFrame` besitzt, zur grafischen Darstellung auf. Ziel ist es, sowohl die Erst- als auch die Zweitstimmen für den Stadtbezirk *Mitte* anzeigen zu lassen.

In [None]:
# Erzeuge einen gesonderten DataFrame für den Stadtbezirk Mitte
df_mitte = df[ df['Stadtbezirk'] == 'Mitte' ]

In [None]:
# Ausgabe der ersten 10 Zeilen
df_mitte.head(10)

In [None]:
# Wir haben oben gesehen, dass die Spalten mit 'D' am Anfang die Erststimmen, und diejenigen mit 'F' am Anfang die Zweitstimmen repräsentieren.
# Entsprechend erzeugen wir neue DataFrames.
df_mitte_erststimme = df_mitte[[col_name for col_name in df_mitte.columns if col_name.startswith('D')]]
df_mitte_zweitstimme = df_mitte[[col_name for col_name in df_mitte.columns if col_name.startswith('F')]]

In [None]:
# Ausgabe der ersten 10 Zeilen
df_mitte_erststimme.head(10)

In [None]:
# Nun müssen wir jeweils noch (a) die Spalte mit den gültigen Gesamtstimmen entfernen, 
# (b) für den Stadtbezirk alle Stimmen der Stimmbezirke aufsummieren und 
# (c) die Spaltennamen anpassen.
df_mitte_erststimme_summen = df_mitte_erststimme.sum(axis=0).to_frame()
df_mitte_erststimme_summen.drop('D - Gültige Erststimmen', inplace=True)
df_mitte_erststimme_summen['Partei'] = [ partei.split('-')[1].replace('Erststimmen','').replace('Erstimmen','').strip() for partei in df_mitte_erststimme_summen.index]
df_mitte_erststimme_summen.columns = ['Erststimmen', 'Partei']

df_mitte_zweitstimme_summen = df_mitte_zweitstimme.sum(axis=0).to_frame()
df_mitte_zweitstimme_summen.drop('F - Gültige Zweitstimmen', inplace=True)
df_mitte_zweitstimme_summen['Partei'] = [ partei.split('-')[1].replace('Zweitstimmen','').strip() for partei in df_mitte_zweitstimme_summen.index]
df_mitte_zweitstimme_summen.columns = ['Zweitstimmen', 'Partei']

In [None]:
# Ausgabe der ersten 10 Zeilen
df_mitte_erststimme_summen.head(10)

In [None]:
fig = px.pie(df_mitte_erststimme_summen, values='Erststimmen', names='Partei', title='Stadtbezirk Mitte - Erststimmen')
fig.show()

In [None]:
fig = px.pie(df_mitte_zweitstimme_summen, values='Zweitstimmen', names='Partei', title='Stadtbezirk Mitte - Zweitstimmen')
fig.show()

Das war unser erster Datensatz des Workshops. Wir haben gesehen, dass eine CSV-Datei unter Angabe einer URL eingelesen, in kleinen Schritten die Inhalte gefiltert und für die Anzeige in einem Tortendiagramm vorbereitet werden können.

Das gleiche Ergebnis hätte sich auch mit Hilfe eines Programms wie Excel erzeugen lassen - das Potenzial der maschinellen Verarbeitet zeigt sich beispielhaft an unserem nächsten Datensatz.

## Zugriff auf Daten der Feinstaubsensoren in Bielefeld

Im Rahmen von [Code for Bielefeld](https://codefor.de/bielefeld) beschäftigen wir uns unter anderem mit der Erhebung und Auswertung von Feinstaubdaten im Stadtgebiet. Wer sich einen Eindruck über die aktuell im Einsatz befindlichen Sensoren machen möchte, der kann diese auf [sensor.community](https://sensor.community/de/) nachschauen.

[<img src="img/SensorCommunity_1.png">](https://sensor.community/de/)

Wer selbst Interesse hat einen Feinstaubsensor in Betrieb zu nehmen, der findet [hier](https://sensor.community/de/sensors/airrohr/) eine Anleitung oder kann sich den [NW-Beitrag](https://www.nw.de/lokal/bielefeld/mitte/22873870_Sich-einfach-mal-selbst-einen-Feinstaubsensor-bauen-und-auch-aufhaengen.html) zu unserem Familienworkshop Anfang Oktober 2020 Jahres durchlesen.

Die Sensoren übermitteln per WLAN die Messdaten alle 5 Minuten an die Plattform von [sensor.community](https://sensor.community/de/), welche wir im Folgenden nutzen.

Zunächst laden wir notwendige weitere Pakete.

In [None]:
import requests

Zum einen haben wir die Möglichkeit, die Daten der letzten 5 Minuten eines beliebigen Sensors per Schnittstelle - eine sogenannte REST-API - abzufragen.

Wir haben uns auf der interaktiven Karte der [sensor.community](https://sensor.community/de/) einen Sensor in der Innenstadt mit der ID `19366` herausgesucht.

[<img src="img/SensorCommunity_2.png">](https://sensor.community/de/)

In [None]:
url = "https://data.sensor.community/airrohr/v1/sensor/49366/"
res = requests.get(url)
print(res.text)

In [None]:
df_49366 = pd.read_json(res.text)
df_49366

In [None]:
df_49366_values = pd.DataFrame(df_49366['sensordatavalues'][0])
df_49366_values

Eine zweite Möglichkeit besteht darin, bereits archivierte Daten von dem [Archiv](https://archive.sensor.community/) der [sensor.community](https://sensor.community/de/) abzufragen.

In [None]:
df_sensor_49366 = pd.read_csv('https://archive.sensor.community/2023-02-23/2023-02-23_sds011_sensor_49366.csv', sep=';')
df_sensor_49366

Für die zukünftige Nutzung müssen wir den Zeitstempel in einen gültigen Datentyp konvertieren.

In [None]:
df_sensor_49366['timestamp'] = pd.to_datetime(df_sensor_49366['timestamp'], format='%Y-%m-%dT%H:%M:%S')
df_sensor_49366

### Plotly zur Datenvisualisierung

Zur Darstellung der Messdaten verwenden wir die Bibliothek [https://plotly.com/python/](Plotly). Eine Vielzahl von Beispielen wie verschiedene Datentypen zur Anzeige gebracht werden können, sind dort zu finden.

In [None]:
import plotly.express as px

Als ersten Plot stellen wir die Daten der Spalte `P1` zum Zeitstempel dar:

In [None]:
fig = px.line(df_sensor_49366, x='timestamp', y="P1", template="plotly_white")
fig.show()

An dieser Stelle sei erwähnt, dass die Spalte `P1` für die Feinstaubdaten des Typs `PM10` stehen, und `P2` für die des Typs `PM2.5`. Dementsprechend handelt es sich bei `P2` um die gesundheitlich schädlicheren Daten, da diese Partikel besonders fein sind und in die Lunge eindringen können.

Bilden wir also `P1` und `P2` gemeinsam ab:

In [None]:
fig = px.line(
    df_sensor_49366[['timestamp','P1','P2']], 
    x="timestamp",
    y=df_sensor_49366[['timestamp','P1','P2']].columns,
    title='Feinstaubdaten des Sensors 49366 am 23.02.2023')
fig.show()

### Entwicklung von Funktionen zur Verarbeitung von Zeiträumen

Wenn wir nicht nur einzelne Tage betrachten wollen, sondern ganze Zeitspannen, dann ist das händische Vorgehen von oben sehr müßig.  <br>Entsprechend bauen wir uns nun schrittweise eigene Funktionen zusammen, welche uns eine gebündelte Auswertung ermöglichen.

Wir starten mit der Frage: "Was müssen wir tun, um alle Daten seit dem Beginn von 2023 abzurufen?" <br>
Nun, wir müssen wir jeden Tag die entsprechende URL generieren, die einzelnen Datensätze herunterladen und zuletzt zusammensetzen. Gehen wir es also an.

Zunächst generieren wir alle Tage seit Jahresbeginn und formatieren diese entsprechend der Ziel-URL.

Als Zwischenschritt - und weil wir die Daten zu einem späteren Zeitpunkt benötigen werden - rufen wir alle Sensoren im Bielefelder Stadtgebiet über die API ab.

In [None]:
import json

# Alle Sensordaten im Bereich Bielefeld runterladen
url = 'https://data.sensor.community/airrohr/v1/filter/box=51.9,8.3,52.1,8.7'
res = requests.get(url)
data = json.loads(res.text)

# Daten als pandas DataFrame laden
df_sensor_bielefeld = pd.json_normalize(data)

df_sensor_bielefeld

Zurück also zur Generierung der URL's für den Datendownload...

In [None]:
from datetime import datetime
start = datetime(2023, 1, 1)
end = datetime.today()
list_dates = pd.date_range(start, end).tolist()
list_dates = [x.strftime("%Y-%m-%d") for x in list_dates]
list_dates[:5]

Dann erzeugen wir eine Liste mit allen URLs unter zu Hilfe nahme der obigen Datumsliste:

In [None]:
url_front = 'https://archive.sensor.community/'
url_back = '_sds011_sensor_49366.csv'
list_url = [url_front + x + '/' + x + url_back for x in list_dates]
list_url[:5]

Da Daten erst mit einem Tag Versatz archiviert werden, müssen wir die letzte URL ausschließen, welche auf den heutigen Tag zugreifen würde:

In [None]:
list_url.pop()

Wir sehen, dass wir in obiger URL neben der Sensor-ID auch den Sensortyp - im Beispiel hier also `sds011` benötigen. In unserem bereits eingeladenen Datensatz gibt es hierfür eine entsprechende Spalte.

In [None]:
# Sensortyp des Sensors 49366 für Download URL holen
sensor_type_49366 = df_sensor_49366['sensor_type'].iloc[0].lower()
sensor_type_49366

Wir legen uns eine Funktion an, welche um anhand der Daten und der Sensor ID überprüftn, ob der Sensor 'indoor' ist. Diese Information wird im Positivfall an die Download URL gehängt. Dies deckt also einen Spezialfall ab. 

In [None]:
def is_indoor(id: int, data: pd.DataFrame):
    indoor = data[data['sensor.id'] == id]['location.indoor'].unique()[0]
    if indoor == 0:
        return False
    else:
        return True

is_indoor(56514, df_sensor_bielefeld)

Obige Schritte fassen wir in einer Funktion zusammen, sodass wir sie einfacher verwenden können:

In [None]:
def get_sensor_data_download_urls(id: int, dates: [str], sensor_type: str, indoor: bool):
    url_front = 'https://archive.sensor.community/'
    indoor_param = ''
    if indoor:
        indoor_param = '_indoor'
    url_back = '_sensor_' + str(id) + indoor_param + '.csv'
    
    # URL Beginn für alle Daten generieren (ohne Sensortyp und Sensor ID)
    list_url = [url_front + date + '/' + date + '_' + sensor_type + url_back for date in dates]
    list_url.pop()
    return list_url

# Sensortyp vom Sensor 
sensor_id = 49366
list_urls_sensor_49366 = get_sensor_data_download_urls(sensor_id, list_dates, sensor_type_49366, is_indoor(sensor_id, df_sensor_bielefeld))
list_urls_sensor_49366[:5]

In [None]:
sensor_id = 56514
list_urls_sensor_56514 = get_sensor_data_download_urls(sensor_id, list_dates, df_sensor_type_49366, is_indoor(sensor_id, df_sensor_bielefeld))
list_urls_sensor_56514[:5]

Im Anschluss verwenden wir eine `for`-Schleife um die Daten einzeln abzurufen und fügen sie im Anschluss zusammen.

ACHTUNG: Durch die Masse an Daten im Archiv dauert der Download eine gewisse Zeit.

In [None]:
list_df_sensor_49366 = list()
for url in list_urls_sensor_49366:
    list_df_sensor_49366.append(pd.read_csv(url, sep=';'))
df_sensor_49366 = pd.concat(list_df_sensor_49366)
df_sensor_49366

Auch diese Prozessschritte fassen wir in einer Funktion zusammen:

In [None]:
def get_sensor_data_by_url(urls: [str]):
    list_df_sensor = list()
    for url in urls:
        try:
            result = pd.read_csv(url, sep=';')
            list_df_sensor.append(result)
        except:
            None
    if len(list_df_sensor) == 0:
        return None
    df = pd.concat(list_df_sensor)
    df['timestamp'] = pd.to_datetime(df['timestamp'], format='%Y-%m-%dT%H:%M:%S')
    return df
    
df_sensor_49366 = get_sensor_data_by_url(list_urls_sensor_49366)
df_sensor_49366

Wie zuvor können wir uns die Daten in einem Diagramm zur Anzeige bringen und 

In [None]:
df_sensor_49366['timestamp'] = pd.to_datetime(df_sensor_49366['timestamp'], format='%Y-%m-%dT%H:%M:%S')
fig = px.line(
    df_sensor_49366[['timestamp','P1','P2']], 
    x="timestamp",
    y=df_sensor_49366[['timestamp','P1','P2']].columns,
    template="plotly_white",
    title='Frainstaubbelastung seit Anfang 2023 für Sensor 49366')
fig.show()

## Thinking BIG

Was können wir - als interessierte BürgerInnen - nun mit diesen Daten weiter anfangen, welche Schlüsse können wir ziehen?

Die Sensoren der [sensor.community](https://sensor.community/de/) sind nicht geeicht und werden durch keine offizielle Stelle gewartet. Entsprechend kann die Nulllinie eines jeden Sensors unterschiedlich sein, aber der Unterschied in der Kennlinie eine jeden Sensors erlaubt uns qualitative Vergleiche anzustellen.

Es lassen sich zum Beispiel folgende Fragen formulieren:
- Wie stark ist die Feinstaubbelastung zu besonderen Anlässen wie Silvester, Kirmes oder durch Baustellenarbeiten?
- Wie verteilt sich die Belastung auf die unterschiedlichen Stadtteile?

Besonders interessant wäre etwa eine Auswertung, wie die Feinstaubbelastung in den Stadtteilen Gadderbaum und Brackwede von den unterschiedlichen Verkehrsinfrastrukturen beeinflusst wird. Wie hoch ist also der Einfluss von Güter- oder ICE-Zügen und welchen Beitrag besitzt der OWD?

Wir möchten hier der Frage nachgehen, wie stark die Feinstaubbelastung durch Silvester ist

Wir holen uns alle Sensor IDs für Bielefeld - hierfür hatten wir uns zuvor eine Tabelle mit allen Sensoren im Bielefelder Stadtgebiet abgerufen.

In [None]:
# Alle Sensor IDs für Bielfeld
sensor_ids_bielefeld = df_sensor_bielefeld['sensor.id'].unique()

sensor_ids_bielefeld

Da wir nun wissen, wie die Daten aussehen, können wir uns eine Methode schreiben, um den Namen des Sensortypen eines Sensors holen können.

Übersicht des Dataframes für Bielefeld...

In [None]:
df_sensor_bielefeld

In [None]:
# Sensortyp für Sensor ID holen
def get_sensor_type_name_by_id(id: int, data: pd.DataFrame):
    sensor_type = data[data['sensor.id'] == id]['sensor.sensor_type.name']
    sensor_type = sensor_type.iloc[0].lower()
    return sensor_type

get_sensor_type_name_by_id(23236, df_sensor_bielefeld)

Bevor wir uns um die Silvester-Frage kümmern können, probieren wir aus, wie wir die Daten für mehrere Sensoren gleichzeitig abrufen können.

In [None]:
# Filter die Sensordaten nach dem aktuellen Jahr
df_sensor_bielefeld['timestamp'] = pd.to_datetime(df_sensor_bielefeld['timestamp'], format='%Y-%m-%dT%H:%M:%S')
df_sensor_bielefeld_2023 = df_sensor_bielefeld[df_sensor_bielefeld['timestamp'].dt.year == 2023]
df_sensor_bielefeld_2023

In [None]:
# Figur für einen Sensor erstellen

def create_sensor_figure(data: pd.DataFrame, sensor_id: int):
    return px.line(
        data[['P1', 'P2', 'timestamp']], 
        x='timestamp',
        y=data[['P1', 'P2', 'timestamp']].columns,
        title='Luftdaten Bielefeld 2021 - ' + str(sensor_id),
        template="plotly_white")

fig = create_sensor_figure(df_sensor_49366, 49366)
fig.show()

In [None]:
list_df_sensor_bielefeld = list()
for sensor in sensor_ids_bielefeld[:5]:
    sensor_type = get_sensor_type_name_by_id(int(sensor), df_sensor_bielefeld)
    download_urls = get_sensor_data_download_urls(sensor, list_dates, sensor_type, is_indoor(sensor, df_sensor_bielefeld))
    sensor_data = get_sensor_data_by_url(download_urls)
    list_df_sensor_bielefeld.append(sensor_data)

df_sensor_bielefeld_2023 = pd.concat(list_df_sensor_bielefeld)
df_sensor_bielefeld_2023  

Entfernen der nicht validen "nan" Werte...

In [None]:
df_sensor_bielefeld_2023 = df_sensor_bielefeld_2023.dropna(subset=['sensor_id', 'timestamp', 'P1', 'P2'])
df_sensor_bielefeld_2023

In [None]:
# Plot mit P1
fig = px.line(
        df_sensor_bielefeld_2023, 
        x="timestamp", y="P1", color="sensor_id", line_group="sensor_id", hover_name="sensor_id",
        line_shape="spline", render_mode="svg", template="plotly_white"
)
fig.show()

In [None]:
# Plot mit P2
fig = px.line(
        df_sensor_bielefeld_2023, 
        x="timestamp", y="P2", color="sensor_id", line_group="sensor_id", hover_name="sensor_id",
        line_shape="spline", render_mode="svg", template="plotly_white"
)
fig.show()

## Analyse der Feinstaubveränderungen in Bielefeld zu Silvester 2019 / 2020

Wir erstellen eine Liste mit den Tagen für den Zeitraum von Mitte Dezember 2019 bis Mitte Januar 2020.

In [None]:
from datetime import datetime
start = datetime(2019, 12, 15)
end = datetime(2020, 1, 15)
list_dates_silvester_19_20 = pd.date_range(start, end).tolist()
list_dates_silvester_19_20 = [x.strftime("%Y-%m-%d") for x in list_dates_silvester_19_20]
list_dates_silvester_19_20[:5]

Da wir nur die aktuellen Sensor IDs aus den letzten 5 Minuten ziehen können, verändern wir die get_sensor_data_by_url Methode ein wenig...

In [None]:
def get_sensor_data_by_url(urls: [str]):
    list_df_sensor = list()
    try:
        for url in urls:
            result = pd.read_csv(url, sep=';')
            list_df_sensor.append(result)
    except:
        print('Sensor für gegebenen Zeitraum nicht verfügbar:', url)
    if len(list_df_sensor) == 0:
        return None
    df = pd.concat(list_df_sensor)
    df['timestamp'] = pd.to_datetime(df['timestamp'], format='%Y-%m-%dT%H:%M:%S')
    return df

Wir holen uns die Daten für Bielefeld mithilfe dieser Datumsliste

In [None]:
list_df_sensor_bielefeld_silvester_19_20 = list()
for sensor in sensor_ids_bielefeld[10:]:
    try:
        sensor_type = get_sensor_type_name_by_id(int(sensor), df_sensor_bielefeld)
        download_urls = get_sensor_data_download_urls(sensor, list_dates_silvester_19_20, sensor_type, is_indoor(sensor, df_sensor_bielefeld))
        sensor_data = get_sensor_data_by_url(download_urls)
        if sensor_data is not None:
            list_df_sensor_bielefeld_silvester_19_20.append(sensor_data)
    except:
        None
df_sensor_bielefeld_silvester_19_20 = pd.concat(list_df_sensor_bielefeld_silvester_19_20)
df_sensor_bielefeld_silvester_19_20 

In [None]:
# Plot mit P1
fig = px.line(
        df_sensor_bielefeld_silvester_19_20, 
        x="timestamp", y="P1", color="sensor_id", line_group="sensor_id", hover_name="sensor_id",
        line_shape="spline", render_mode="svg", template="plotly_white"
)
fig.show()

In [None]:
# Plot mit P2
fig = px.line(
        df_sensor_bielefeld_silvester_19_20, 
        x="timestamp", y="P2", color="sensor_id", line_group="sensor_id", hover_name="sensor_id",
        line_shape="spline", render_mode="svg", template="plotly_white"
)
fig.show()

<span style="font-size:4em;">Danke für das Interesse und die Aufmerksamkeit!</span>

<span style="font-size:4em;">Happy Coding :)</span>