In [9]:
import pandas as pd
import altair as alt

In [10]:
# Aktuelle Pfade
file_paths = [
     "data/rad_2022_tage_19_06_23_r.csv",
     "data/rad_2021_tage_19_06_23_r.csv",
     "data/rad_2020_tage_19_06_23_r.csv",
     "data/rad_2019_tage_19_06_23_r.csv",
     "data/rad_2018_tage_19_06_23_r.csv",
     "data/rad_2017_tage_19_06_23_r.csv",
     "data/rad_2016_tage_19_06_23_r.csv",
     "data/rad_2015_tage_19_06_23_r.csv",
     "data/rad_2014_tage_19_06_23_r.csv",
     "data/rad_2013_tage_19_06_23_r.csv",
     "data/rad_2012_tage_19_06_23_r.csv",
     "data/rad_2011_tage_19_06_23_r.csv",
     "data/rad_2010_tage_19_06_23_r.csv",
     "data/rad_2009_tage_19_06_23_r.csv",
     "data/rad_2008_tage_19_06_23_r.csv"
]

# Anzahl der Radfahrer über gesamten Zeitraum

In [11]:
# Funktion: Erstellen eines Diagramms aus allen Dateipfaden
def create_chart(file_paths):
    # Gesamtsummen aus den CSV-Dateien berechnen
    gesamt_summen = [pd.read_csv(file_path)['gesamt'].sum() for file_path in file_paths]
    #print(gesamt_summen)
    
    # Jahre aus der jeweiligen Spalte 'datum' extrahieren
    jahre = [pd.to_datetime(pd.read_csv(file_path)['datum']).dt.year.iloc[0] for file_path in file_paths]
    
    # Altair-Diagramm erstellen
    chart = alt.Chart(pd.DataFrame({'Jahr': jahre, 'Anzahl Radfahrer': gesamt_summen})).mark_bar().encode(
        alt.X('Jahr:O'), # O, because time is ordinal
        alt.Y('Anzahl Radfahrer:Q'), # scale does nothing here # Q because the sum is quantitative
        tooltip=['Jahr', 'Anzahl Radfahrer']  # tooltip = text to show, when user's cursor is over a mark
    ).properties(
        title='Anzahl Radfahrer pro Jahr von 2008 bis 2022',
        width=400,
        height=150
    )

    return chart

# Diagramm erstellen
chart = create_chart(file_paths)

# Diagramm anzeigen
chart

# Anzahl der gemessenen Tage der Zählstellen pro Jahr
#### -> stabile Daten ab 2012 circa

In [12]:
# Liste für DataFrames erstellen
df_list = []

# Daten aus Dateien lesen und in df_list speichern
for file_path in file_paths:
    df_temp = pd.read_csv(file_path)
    # Nur Zeilen auswählen, bei denen 'gesamt' nicht den Wert NA hat
    df_temp = df_temp[df_temp['gesamt'].notna()]
    df_list.append(df_temp[['datum', 'zaehlstelle', 'gesamt']])

# Einzelne DataFrames zu einem Gesamt-DataFrame zusammenführen
df_combined = pd.concat(df_list, ignore_index=True)

# Jahr aus dem 'datum' extrahieren
df_combined['jahr'] = pd.to_datetime(df_combined['datum']).dt.year

# Anzahl der Zählstellen pro Jahr zählen
zaehlstellen_pro_jahr = df_combined.groupby(['jahr', 'zaehlstelle']).size().reset_index(name='anzahl_zaehlstellen')

# Plot mit Altair
chart = alt.Chart(zaehlstellen_pro_jahr).mark_bar().encode(
    x=alt.X('jahr:N', title='Jahr'),
    y=alt.Y('anzahl_zaehlstellen:Q', title='Anzahl der gemessenden Tage der Zählstellen'),
    color=alt.Color('zaehlstelle:N', legend=alt.Legend(title='Zählstellen',  orient="right")),
    tooltip=['jahr:N', 'zaehlstelle:N', 'anzahl_zaehlstellen:Q']
).properties(
    width=600,
    height=400,
    title='Anzahl der gemessenden Tage der Zählstellen pro Jahr gestapelt nach Zählstellen'
)

# Diagramm anzeigen
chart

# Anzahlen berechnen

### Gesamtsumme aufgezeichneter Radfahrer

In [15]:
# Einzelne DataFrames zu einem Gesamt-DataFrame zusammenführen
df = pd.concat(df_list, ignore_index=True)

# Berechnung der Gesamtsumme der Spalte "gesamt"
gesamt_summe = df['gesamt'].sum()

print('Summe gemessener Radfahrer insgesamt:', gesamt_summe)

Summe gemessener Radfahrer insgesamt: 4355837.0


In [11]:
# in 2021 gefahrene Radfahrer: 4355837.0
# in 2022 gefahrene Radfahrer: 4797843.0
# über den Gesamten Zeitraum: 46242791.0

In [7]:
# Zuwachs in % von 2021 auf 2022
wert = ((4797843.0 - 4355837.0) / 4797843.0 ) *100
wert

9.21259824466953

In [8]:
prognose_2023 = (4797843.0 * 1.0921)
prognose_2023

5239724.3403

In [12]:
# Liste für DataFrames erstellen
df_list = []

# Daten aus Dateien lesen und in df_list speichern
for file_path in file_paths:
    df_temp = pd.read_csv(file_path)
    df_list.append(df_temp[['datum', 'gesamt']])

# Einzelne DataFrames zu einem Gesamt-DataFrame zusammenführen
df_combined = pd.concat(df_list, ignore_index=True)

# Monat aus dem 'datum' extrahieren
df_combined['monat'] = pd.to_datetime(df_combined['datum']).dt.month

# Filtere die Datensätze, bei denen 'gesamt' gleich 0 ist
df_zero_values = df_combined[df_combined['gesamt'] == 0]

# Anzahl der 0-Werte pro Monat zählen
zero_values_per_month = df_zero_values.groupby('monat').size().reset_index(name='anzahl_zero_values')

# Plot mit Altair
chart = alt.Chart(zero_values_per_month).mark_bar().encode(
    x=alt.X('monat:N', title='Monat'),
    y=alt.Y('anzahl_zero_values:Q', title='Anzahl 0-Werte'),
    tooltip=['monat:N', 'anzahl_zero_values:Q']
).properties(
    width=600,
    height=400,
    title='Anzahl 0-Werte pro Monat'
)

# Diagramm anzeigen
chart

In [7]:
df_combined

Unnamed: 0,datum,gesamt,monat
0,2022-01-01,444.0,1
1,2022-01-02,476.0,1
2,2022-01-03,752.0,1
3,2022-01-04,603.0,1
4,2022-01-05,578.0,1
...,...,...,...
29676,2008-12-27,,12
29677,2008-12-28,,12
29678,2008-12-29,,12
29679,2008-12-30,,12
