# Anzahl Radfahrer pro Zählstelle

In [8]:
import pandas as pd
import altair as alt
import math

In [9]:
# Aktuelle Pfade
file_paths = [
     "data/rad_2022_tage_19_06_23_r.csv",
     "data/rad_2021_tage_19_06_23_r.csv",
     "data/rad_2020_tage_19_06_23_r.csv",
     "data/rad_2019_tage_19_06_23_r.csv",
     "data/rad_2018_tage_19_06_23_r.csv",
     "data/rad_2017_tage_19_06_23_r.csv",
     "data/rad_2016_tage_19_06_23_r.csv",
     "data/rad_2015_tage_19_06_23_r.csv",
     "data/rad_2014_tage_19_06_23_r.csv",
     "data/rad_2013_tage_19_06_23_r.csv",
     "data/rad_2012_tage_19_06_23_r.csv"
]

# Anzahl Radfahrer pro Zählstelle im Jahr 2022

In [3]:
df = pd.read_csv("data/rad_2022_tage_19_06_23_r.csv")

# Gruppiere nach 'zaehlstelle' und summiere die 'gesamt'-Werte.
sum_per_counting_point = df.groupby('zaehlstelle')['gesamt'].sum().reset_index()

# Plot mit Altair
chart = alt.Chart(sum_per_counting_point).mark_bar().encode(
    x='zaehlstelle:N',
    y='gesamt:Q',
    color=alt.Color('zaehlstelle:O', scale=alt.Scale(scheme='category10'))
).properties(
    width=600,
    height=400,
    title='Anzahl Radfahrer pro Zählstelle im Jahr 2022'
)

# Diagramm anzeigen
chart

# Anzahl der Radfahrer pro Zählstelle von 2012 - 2012

In [4]:
df_list = []

for file_path in file_paths:
    df_temp = pd.read_csv(file_path)
    df_list.append(df_temp[['datum', 'zaehlstelle', 'gesamt']])

# Einzelne DataFrames zu einem Gesamt-DataFrame zusammenführen
df_combined = pd.concat(df_list, ignore_index=True)


# Gruppiere nach 'zaehlstelle' und summiere die 'gesamt'-Werte.
sum_per_counting_point = df_combined.groupby('zaehlstelle')['gesamt'].sum().reset_index()

# Plot mit Altair
chart = alt.Chart(sum_per_counting_point).mark_bar().encode(
    x='zaehlstelle:N',
    y='gesamt:Q',
    color=alt.Color('zaehlstelle:O', title='Zählstellen', scale=alt.Scale(scheme='category10')),
    tooltip=['zaehlstelle:N', 'gesamt:Q'] # um genaue Anzahl herauslesen zu können
).properties(
    width=600,
    height=400,
    title='Anzahl Radfahrer pro Zählstelle von 2012 bis 2022'
)

# Diagramm anzeigen
chart

In [5]:
df_list

[           datum zaehlstelle  gesamt
 0     2022-01-01      Arnulf   444.0
 1     2022-01-02      Arnulf   476.0
 2     2022-01-03      Arnulf   752.0
 3     2022-01-04      Arnulf   603.0
 4     2022-01-05      Arnulf   578.0
 ...          ...         ...     ...
 2185  2022-12-27     Olympia   684.0
 2186  2022-12-28     Olympia   821.0
 2187  2022-12-29     Olympia   880.0
 2188  2022-12-30     Olympia   860.0
 2189  2022-12-31     Olympia  1102.0
 
 [2190 rows x 3 columns],
            datum zaehlstelle  gesamt
 0     2021-01-01      Arnulf     NaN
 1     2021-01-02      Arnulf     NaN
 2     2021-01-03      Arnulf     NaN
 3     2021-01-04      Arnulf     NaN
 4     2021-01-05      Arnulf     NaN
 ...          ...         ...     ...
 2185  2021-12-27     Olympia   705.0
 2186  2021-12-28     Olympia   408.0
 2187  2021-12-29     Olympia   731.0
 2188  2021-12-30     Olympia   689.0
 2189  2021-12-31     Olympia  1172.0
 
 [2190 rows x 3 columns],
            datum zaehlstelle  g

# Anzahl Radfahrer pro Zählstelle gestacked pro Jahr

In [10]:
# Liste für DataFrames erstellen
df_list = []

# Daten aus Dateien lesen und in df_list speichern
for file_path in file_paths:
    df_temp = pd.read_csv(file_path)
    df_list.append(df_temp[['datum', 'zaehlstelle', 'gesamt']])

# Einzelne DataFrames zu einem Gesamt-DataFrame zusammenführen
df_combined = pd.concat(df_list, ignore_index=True)

# Jahr aus dem 'datum' extrahieren
df_combined['Jahr'] = pd.to_datetime(df_combined['datum']).dt.year

# Gruppieren Sie nach 'zaehlstelle' und 'Jahr' und summiere die 'gesamt' Werte
sum_per_counting_point_year = df_combined.groupby(['zaehlstelle', 'Jahr'])['gesamt'].sum().reset_index()

# Plot mit Altair
chart = alt.Chart(sum_per_counting_point_year).mark_bar().encode(
    x='zaehlstelle:N',
    y='gesamt:Q',
    color=alt.Color('Jahr:O', legend=alt.Legend(title="Jahre")).scale(scheme="blueorange"),
    tooltip=[ 'zaehlstelle:N', 'gesamt:Q', 'Jahr:O']
).properties(
    width=600,
    height=400,
    title='Anzahl Radfahrer pro Zählstelle von 2008 bis 2022'
)

# Diagramm anzeigen
chart

# Berechnen des Radverkehrsaufkommen pro Jahr

In [8]:
# Erzeuge Pivot-Tabelle
pivot_df = df_combined.pivot_table(index='zaehlstelle', columns='Jahr', values='gesamt', aggfunc='sum')

# Behalte die Spalten für 2021 und 2022
pivot_df = pivot_df[[2021, 2022]]

# Prozentuale Änderungen berechnen 
pivot_df['Veränderung in %'] = ((pivot_df[2022] - pivot_df[2021]) / pivot_df[2021]) * 100

# Mittleres Verkehrsaufkommen pro Tag berechnen
pivot_df['Durchschnitt pro Tag 2021'] = pivot_df[2021] / 365
pivot_df['Durchschnitt pro Tag 2022'] = pivot_df[2022] / 365

# Runde die Werte in den Spalten auf die gewünschte Genauigkeit
pivot_df[2021] = pivot_df[2021].round(0) # Rundet auf ganze Zahlen
pivot_df[2022] = pivot_df[2022].round(0) # Rundet auf ganze Zahlen
pivot_df['Veränderung in %'] = pivot_df['Veränderung in %'].round(2) # Rundet auf zwei Nachkommastellen
pivot_df['Durchschnitt pro Tag 2021'] = pivot_df['Durchschnitt pro Tag 2021'].round(0) # Rundet auf zwei Nachkommastellen
pivot_df['Durchschnitt pro Tag 2022'] = pivot_df['Durchschnitt pro Tag 2022'].round(0) # Rundet auf zwei Nachkommastellen


# Benenne Spalten um - Hier klappt die Umbenennung in 'Zählstelle' nicht bzw. wird später durch Index wieder aufgehoben?
pivot_df.rename(columns={2021: 'Anzahl Radfahrer 2021', 2022: 'Anzahl Radfahrer 2022'}, inplace=True)
# Füge Gesamtsummen hinzu
pivot_df.loc['Zählstellen insgesamt', ['Anzahl Radfahrer 2021', 'Anzahl Radfahrer 2022']] = pivot_df[['Anzahl Radfahrer 2021', 'Anzahl Radfahrer 2022']].sum()
# Hier bitte in der Zeile mit Index 'Gesamtanzahl' bei der Spalte 'Veränderung in %' prozentuale Änderung der Gesamtanzahl von 2021 zu 2022 berechnen
pivot_df.loc['Zählstellen insgesamt', 'Veränderung in %'] = ((pivot_df.loc['Zählstellen insgesamt', 'Anzahl Radfahrer 2022'] - pivot_df.loc['Zählstellen insgesamt', 'Anzahl Radfahrer 2021']) / pivot_df.loc['Zählstellen insgesamt', 'Anzahl Radfahrer 2021']) * 100

# Mittlere Anzahl der Radfahrer pro Tag
pivot_df.loc['Zählstellen insgesamt', 'Durchschnitt pro Tag 2021'] = pivot_df['Durchschnitt pro Tag 2021'].mean()
pivot_df.loc['Zählstellen insgesamt', 'Durchschnitt pro Tag 2022'] = pivot_df['Durchschnitt pro Tag 2022'].mean()

# Benenne den Indexnamen um
pivot_df.index.names = ['Zählstelle']

# Dann setzen Sie den Index wie gewohnt zurück:
#pivot_df.reset_index(inplace=True)



# Letzte Zeile mit fettgedruckter Schrift
def highlight_last_row(s):
    last_row_color = 'font-weight: bold'
    return [last_row_color if i == len(s)-1 else '' for i in range(len(s))]

styled_df = pivot_df.style.apply(highlight_last_row)

styled_df

Jahr,Anzahl Radfahrer 2021,Anzahl Radfahrer 2022,Veränderung in %,Durchschnitt pro Tag 2021,Durchschnitt pro Tag 2022
Zählstelle,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
Arnulf,48747.0,454852.0,833.09,134.0,1246.0
Erhardt,1707769.0,1739359.0,1.85,4679.0,4765.0
Hirsch,518369.0,545476.0,5.23,1420.0,1494.0
Kreuther,247175.0,250790.0,1.46,677.0,687.0
Margareten,1157363.0,1294375.0,11.84,3171.0,3546.0
Olympia,676414.0,512991.0,-24.16,1853.0,1405.0
Zählstellen insgesamt,4355837.0,4797843.0,10.147441,1989.0,2190.5


In [9]:
# Erzeuge Pivot-Tabelle
pivot_df = df_combined.pivot_table(index='zaehlstelle', columns='Jahr', values='gesamt', aggfunc='sum')

# Behalte die Spalten für 2021 und 2022
pivot_df = pivot_df[[2021, 2022]]

# Prozentuale Änderungen berechnen 
pivot_df['Veränderung in %'] = ((pivot_df[2022] - pivot_df[2021]) / pivot_df[2021]) * 100

# Mittleres Verkehrsaufkommen pro Tag berechnen
pivot_df['Durchschnitt pro Tag 2021'] = pivot_df[2021] / 365
pivot_df['Durchschnitt pro Tag 2022'] = pivot_df[2022] / 365

# Runde die Werte in den Spalten auf ganze Zahlen (aufrunden)
pivot_df[2021] = pivot_df[2021].round(0).apply(math.ceil).astype(int)
pivot_df[2022] = pivot_df[2022].round(0).apply(math.ceil).astype(int)
pivot_df['Veränderung in %'] = pivot_df['Veränderung in %'].apply(math.ceil).astype(float)  # Hier float statt int für eine Dezimalstelle
pivot_df['Durchschnitt pro Tag 2021'] = pivot_df['Durchschnitt pro Tag 2021'].apply(math.ceil).astype(int)
pivot_df['Durchschnitt pro Tag 2022'] = pivot_df['Durchschnitt pro Tag 2022'].apply(math.ceil).astype(int)

# Benenne Spalten um
pivot_df.rename(columns={2021: 'Anzahl Radfahrer 2021', 2022: 'Anzahl Radfahrer 2022'}, inplace=True)
# Füge Gesamtsummen hinzu
pivot_df.loc['Zählstellen insgesamt', ['Anzahl Radfahrer 2021', 'Anzahl Radfahrer 2022']] = pivot_df[['Anzahl Radfahrer 2021', 'Anzahl Radfahrer 2022']].sum()
# Hier bitte in der Zeile mit Index 'Gesamtanzahl' bei der Spalte 'Veränderung in %' prozentuale Änderung der Gesamtanzahl von 2021 zu 2022 berechnen
pivot_df.loc['Zählstellen insgesamt', 'Veränderung in %'] = ((pivot_df.loc['Zählstellen insgesamt', 'Anzahl Radfahrer 2022'] - pivot_df.loc['Zählstellen insgesamt', 'Anzahl Radfahrer 2021']) / pivot_df.loc['Zählstellen insgesamt', 'Anzahl Radfahrer 2021']) * 100

# Mittlere Anzahl der Radfahrer pro Tag
pivot_df.loc['Zählstellen insgesamt', 'Durchschnitt pro Tag 2021'] = pivot_df['Durchschnitt pro Tag 2021'].mean()
pivot_df.loc['Zählstellen insgesamt', 'Durchschnitt pro Tag 2022'] = pivot_df['Durchschnitt pro Tag 2022'].mean()

# Runde die Werte in den Spalten auf ganze Zahlen
pivot_df['Durchschnitt pro Tag 2021'] = pivot_df['Durchschnitt pro Tag 2021'].apply(math.ceil).astype(int)
pivot_df['Durchschnitt pro Tag 2022'] = pivot_df['Durchschnitt pro Tag 2022'].apply(math.ceil).astype(int)

# Benenne den Indexnamen um
pivot_df.index.names = ['Zählstelle']

# Dann setzen Sie den Index wie gewohnt zurück:
#pivot_df.reset_index(inplace=True)

# Letzte Zeile mit fettgedruckter Schrift
def highlight_last_row(s):
    last_row_color = 'font-weight: bold'
    return [last_row_color if i == len(s)-1 else '' for i in range(len(s))]

# Anpassung für eine Dezimalstelle in 'Veränderung in %'

styled_df = pivot_df.style.apply(highlight_last_row).format({'Veränderung in %': '{:.1f}%', 'Anzahl Radfahrer 2021': '{:.0f}', 'Anzahl Radfahrer 2022': '{:.0f}', 'Durchschnitt pro Tag 2021': '{:.0f}', 'Durchschnitt pro Tag 2022': '{:.0f}'})

styled_df


Jahr,Anzahl Radfahrer 2021,Anzahl Radfahrer 2022,Veränderung in %,Durchschnitt pro Tag 2021,Durchschnitt pro Tag 2022
Zählstelle,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
Arnulf,48747,454852,834.0%,134,1247
Erhardt,1707769,1739359,2.0%,4679,4766
Hirsch,518369,545476,6.0%,1421,1495
Kreuther,247175,250790,2.0%,678,688
Margareten,1157363,1294375,12.0%,3171,3547
Olympia,676414,512991,-24.0%,1854,1406
Zählstellen insgesamt,4355837,4797843,10.1%,1990,2192


## Download der Tabelle:

In [86]:
import dataframe_image as dfi

dfi.export(styled_df, 'Pivot_Tabelle_1601.png')

# Überprüfen, ab wann Zählstellen aktiv waren

In [24]:
# Aktuelle Pfade
all_file_paths = [
     "data/rad_2022_tage_19_06_23_r.csv",
     "data/rad_2021_tage_19_06_23_r.csv",
     "data/rad_2020_tage_19_06_23_r.csv",
     "data/rad_2019_tage_19_06_23_r.csv",
     "data/rad_2018_tage_19_06_23_r.csv",
     "data/rad_2017_tage_19_06_23_r.csv",
     "data/rad_2016_tage_19_06_23_r.csv",
     "data/rad_2015_tage_19_06_23_r.csv",
     "data/rad_2014_tage_19_06_23_r.csv",
     "data/rad_2013_tage_19_06_23_r.csv",
     "data/rad_2012_tage_19_06_23_r.csv",
     "data/rad_2011_tage_19_06_23_r.csv",
     "data/rad_2010_tage_19_06_23_r.csv",
     "data/rad_2009_tage_19_06_23_r.csv",
     "data/rad_2008_tage_19_06_23_r.csv"
]

In [25]:
# Liste für DataFrames erstellen
df_list = []

# Daten aus Dateien lesen und in df_list speichern
for file_path in all_file_paths:
    df_temp = pd.read_csv(file_path)
    df_list.append(df_temp[['datum', 'zaehlstelle', 'gesamt']])

# Einzelne DataFrames zu einem Gesamt-DataFrame zusammenführen
df_combined = pd.concat(df_list, ignore_index=True)

# Jahr aus dem 'datum' extrahieren
df_combined['jahr'] = pd.to_datetime(df_combined['datum']).dt.year

# Anzahl der Zählstellen pro Jahr zählen
zaehlstellen_pro_jahr = df_combined.groupby(['jahr', 'zaehlstelle']).size().reset_index(name='anzahl_zaehlstellen')

# Anzahl der Zählstellen pro Jahr anzeigen
print(zaehlstellen_pro_jahr)


    jahr zaehlstelle  anzahl_zaehlstellen
0   2008      Arnulf                  214
1   2008      Hirsch                  214
2   2008    Kreuther                  214
3   2008     Olympia                  214
4   2009      Arnulf                  365
..   ...         ...                  ...
79  2022     Erhardt                  365
80  2022      Hirsch                  365
81  2022    Kreuther                  365
82  2022  Margareten                  365
83  2022     Olympia                  365

[84 rows x 3 columns]


## FALSCH, weil hier NA-Werte in der gesamt-Spalte mitgezählt werden

In [26]:
# Liste für DataFrames erstellen
df_list = []

# Daten aus Dateien lesen und in df_list speichern
for file_path in all_file_paths:
    df_temp = pd.read_csv(file_path)
    df_list.append(df_temp[['datum', 'zaehlstelle', 'gesamt']])

# Einzelne DataFrames zu einem Gesamt-DataFrame zusammenführen
df_combined = pd.concat(df_list, ignore_index=True)

# Jahr aus dem 'datum' extrahieren
df_combined['jahr'] = pd.to_datetime(df_combined['datum']).dt.year

# Anzahl der Zählstellen pro Jahr zählen
zaehlstellen_pro_jahr = df_combined.groupby(['jahr', 'zaehlstelle']).size().reset_index(name='anzahl_zaehlstellen')

# Plot mit Altair
chart = alt.Chart(zaehlstellen_pro_jahr).mark_bar().encode(
    x=alt.X('jahr:N', title='Jahr'),
    y=alt.Y('anzahl_zaehlstellen:Q', title='Anzahl Zählstellen'),
    color='zaehlstelle:N',
    tooltip=['jahr:N', 'zaehlstelle:N', 'anzahl_zaehlstellen:Q']
).properties(
    width=600,
    height=400,
    title='Anzahl Zählstellen pro Jahr gestapelt nach Zählstellen'
)

# Diagramm anzeigen
chart


## RICHTIG:
### weil hier nur Zeilen ausgewählt werden, die nicht den Wert NA haben 
### wenn gesamt=0, dann wird das schon gezählt
### Filterung: Wie viele Werte hat eine Zählstelle gesammelt bzw. an wie vielen Tagen war eine Zählstelle messfähig/ in Betrieb.

In [23]:
# Liste für DataFrames erstellen
df_list = []

# Daten aus Dateien lesen und in df_list speichern
for file_path in all_file_paths:
    df_temp = pd.read_csv(file_path)
    # Nur Zeilen auswählen, bei denen 'gesamt' nicht den Wert NA hat
    df_temp = df_temp[df_temp['gesamt'].notna()]
    df_list.append(df_temp[['datum', 'zaehlstelle', 'gesamt']])

# Einzelne DataFrames zu einem Gesamt-DataFrame zusammenführen
df_combined = pd.concat(df_list, ignore_index=True)

# Jahr aus dem 'datum' extrahieren
df_combined['jahr'] = pd.to_datetime(df_combined['datum']).dt.year

# Anzahl der Zählstellen pro Jahr zählen
zaehlstellen_pro_jahr = df_combined.groupby(['jahr', 'zaehlstelle']).size().reset_index(name='anzahl_zaehlstellen')

# Plot mit Altair
chart = alt.Chart(zaehlstellen_pro_jahr).mark_bar().encode(
    x=alt.X('jahr:N', title='Jahr'),
    y=alt.Y('anzahl_zaehlstellen:Q', title='Anzahl der gemessenden Tage der Zählstellen'),
    color=alt.Color('zaehlstelle:N', legend=alt.Legend(title='Zählstellen',  orient="right")),
    tooltip=['jahr:N', 'zaehlstelle:N', 'anzahl_zaehlstellen:Q']
).properties(
    width=600,
    height=400,
    title='Anzahl der gemessenden Tage der Zählstellen pro Jahr gestapelt nach Zählstellen'
)

# Diagramm anzeigen
chart


# Ab hier wieder Zählstellen-Analyse

## Vollständiges Diagramm

In [15]:
df_list = []

for file_path in file_paths:
    df_temp = pd.read_csv(file_path)
    df_temp['Jahr'] = pd.to_datetime(df_temp['datum']).dt.to_period("Y").dt.to_timestamp()
    df_list.append(df_temp[['Jahr', 'zaehlstelle', 'gesamt']])

# Einzelne DataFrames zu einem Gesamt-DataFrame zusammenführen
df_combined = pd.concat(df_list, ignore_index=True)

# Gruppiere nach 'zaehlstelle' und summiere die 'gesamt'-Werte.
sum_per_counting_point = df_combined.groupby('zaehlstelle')['gesamt'].sum().reset_index()

'''
# Plot mit Altair
chart = alt.Chart(sum_per_counting_point).mark_bar().encode(
    y=alt.Y('zaehlstelle:N', title='Zählstelle', sort=alt.EncodingSortField(field='gesamt', order='descending')),
    x=alt.X('gesamt:Q', title='Anzahl Radfahrer'),
    color=alt.Color('zaehlstelle:O', title='Zählstellen', scale=alt.Scale(scheme='category10')),
    tooltip=['zaehlstelle:N', 'gesamt:Q']
).properties(
    width=600,
    height=400,
    title='Anzahl Radfahrer pro Zählstelle von 2012 bis 2022'
)

# Diagramm anzeigen
chart
'''


# Plot with Altair
bars = alt.Chart(sum_per_counting_point).mark_bar().encode(
    y=alt.Y('zaehlstelle:N', title='Zählstelle', sort=alt.EncodingSortField(field='gesamt', order='descending')),
    x=alt.X('gesamt:Q', title='Anzahl Radfahrer'),
    color=alt.Color('zaehlstelle:O', title='Zählstellen', scale=alt.Scale(scheme='category10')),
    tooltip=['zaehlstelle:N', 'gesamt:Q']
)

# Text layer for annotations
text = bars.mark_text(
    align='center',
    baseline='middle',
    fontWeight='bold',
    dx=3
).encode(
    text='gesamt:Q',  # Use 'gesamt' as the text value
    color=alt.value('black')  # Textfarbe auf Schwarz setzen
)

# Combine bars and text layers
chart = (bars + text).properties(
    width=600,
    height=400,
    title='Anzahl Radfahrer pro Zählstelle von 2012 bis 2022'
)

# Show the chart
chart

In [11]:
df_list = []

for file_path in file_paths:
    df_temp = pd.read_csv(file_path)
    df_temp['Jahr'] = pd.to_datetime(df_temp['datum']).dt.to_period("Y").dt.to_timestamp()

    # Neue Spalte 'interval' basierend auf den gewünschten Intervallen erstellen
    df_temp['interval'] = pd.cut(df_temp['Jahr'].dt.year, bins=[2010, 2016, 2022], labels=['2011-2016', '2017-2022'])

    df_list.append(df_temp[['Jahr', 'zaehlstelle', 'gesamt', 'interval']])

# Einzelne DataFrames zu einem Gesamt-DataFrame zusammenführen
df_combined = pd.concat(df_list, ignore_index=True)

# Gruppiere nach 'zaehlstelle' und 'interval' und summiere die 'gesamt'-Werte.
sum_per_counting_point = df_combined.groupby(['zaehlstelle', 'interval'])['gesamt'].sum().reset_index()

# Plot mit Altair
chart = alt.Chart(sum_per_counting_point).mark_bar().encode(
    x='zaehlstelle:N',
    y='gesamt:Q',
    color=alt.Color('interval:N', scale=alt.Scale(scheme='category10')),
    column='interval:N',  # Separate columns for each interval
    tooltip=['zaehlstelle:N', 'gesamt:Q', 'interval:N']
).properties(
    width=300,
    height=400,
    title='Anzahl Radfahrer pro Zählstelle in den Intervallen 2011-2016 und 2017-2022'
)

# Diagramm anzeigen
chart

In [12]:
df_list = []

# Schleife über die Dateipfade
for file_path in file_paths:
    # DataFrame aus CSV-Datei lesen
    df_temp = pd.read_csv(file_path)
    
    # 'Jahr'-Spalte erstellen und auf das Jahr extrahieren
    df_temp['Jahr'] = pd.to_datetime(df_temp['datum']).dt.to_period("Y").dt.to_timestamp()

    # Neue Spalte 'interval' basierend auf den gewünschten Intervallen erstellen
    df_temp['interval'] = pd.cut(
        df_temp['Jahr'].dt.year,
        bins=[2008, 2010, 2016, 2022],  # Intervalle anpassen, um 2008-2010 einzuschließen
        labels=['2008-2010', '2011-2016', '2017-2022']
    )

    # Benötigte Spalten auswählen und zum DataFrame-Liste hinzufügen
    df_list.append(df_temp[['Jahr', 'zaehlstelle', 'gesamt', 'interval']])

# DataFrames zu einem Gesamt-DataFrame zusammenführen
df_combined = pd.concat(df_list, ignore_index=True)

# Nach 'zaehlstelle' und 'interval' gruppieren und die 'gesamt'-Werte summieren
sum_per_counting_point = df_combined.groupby(['zaehlstelle', 'interval'])['gesamt'].sum().reset_index()

# Diagramm mit Altair erstellen
chart = alt.Chart(sum_per_counting_point).mark_bar().encode(
    x='zaehlstelle:N',
    y='gesamt:Q',
    color=alt.Color('interval:N', scale=alt.Scale(scheme='category10')),
    column='interval:N',  # Separate Spalten für jedes Intervall
    tooltip=['zaehlstelle:N', 'gesamt:Q', 'interval:N']
).properties(
    width=300,
    height=400,
    title=alt.TitleParams(
        text='Anzahl Radfahrer pro Zählstelle in den Intervallen 2008-2010, 2011-2016 und 2017-2022',
        align='center',  # Titel zentrieren
        fontSize=14  # Schriftgröße bei Bedarf anpassen
    )
)

# Diagramm anzeigen
chart


In [13]:
file_path_2022 = "/Users/andreaheigl/Documents/BA/data/rad_2022_tage_export_09_02_23_r.csv"
file_path_2021 = "/Users/andreaheigl/Documents/BA/data/rad_2021_tage_export_09_02_23_r.csv"
file_path_2020 = "/Users/andreaheigl/Documents/BA/data/rad_2020_tage_export_09_02_23_r.csv"

# DataFrames für 2022, 2021 und 2020 erstellen
df_2022 = pd.read_csv(file_path_2022)
df_2021 = pd.read_csv(file_path_2021)
df_2020 = pd.read_csv(file_path_2020)

# 'datum' in ein DateTime-Objekt umwandeln
df_2022['datum'] = pd.to_datetime(df_2022['datum'])
df_2021['datum'] = pd.to_datetime(df_2021['datum'])
df_2020['datum'] = pd.to_datetime(df_2020['datum'])

# Monatsnamen aus dem Datum extrahieren
df_2022['monat'] = df_2022['datum'].dt.strftime('%B')
df_2021['monat'] = df_2021['datum'].dt.strftime('%B')
df_2020['monat'] = df_2020['datum'].dt.strftime('%B')

# Gesamtsummen pro Monat und Jahr berechnen
gesamtsummen_2022 = df_2022.groupby(['monat', df_2022['datum'].dt.year])['gesamt'].sum().reset_index()
gesamtsummen_2021 = df_2021.groupby(['monat', df_2021['datum'].dt.year])['gesamt'].sum().reset_index()
gesamtsummen_2020 = df_2020.groupby(['monat', df_2020['datum'].dt.year])['gesamt'].sum().reset_index()

# Reihenfolge der Monate festlegen
monatsreihenfolge = [
    'January', 'February', 'March', 'April', 'May', 'June',
    'July', 'August', 'September', 'October', 'November', 'December'
]

# Kombinierte Daten für das Diagramm erstellen
gesamtsummen_combined = pd.concat([gesamtsummen_2022, gesamtsummen_2021, gesamtsummen_2020], ignore_index=True)

# Altair-Diagramm erstellen
chart = alt.Chart(gesamtsummen_combined).mark_bar().encode(
    x=alt.X('monat:N', sort=monatsreihenfolge),
    y='gesamt:Q',
    color=alt.Color('datum:N', legend=alt.Legend(title='Jahr')).scale(scheme="category10"),
    column=alt.Column('datum:N', title='Jahr'),  # Separate Spalten für jedes Jahr
    tooltip=['datum:N', 'monat:N', 'gesamt:Q']
).properties(
    title='Anzahl Radfahrer pro Monat in 2022, 2021 und 2020',
    width=200, 
    height=300
)

# Diagramm anzeigen
chart


# Monatlicher Verlauf 2012 - 2022

In [14]:

# Funktion zum Laden der Daten für ein bestimmtes Jahr
def load_data(year):
    file_path = f"/Users/andreaheigl/Documents/BA/data/rad_{year}_tage_19_06_23_r.csv"
    df = pd.read_csv(file_path)
    df['datum'] = pd.to_datetime(df['datum'])
    df['monat'] = df['datum'].dt.strftime('%B')
    return df.groupby(['monat', df['datum'].dt.year])['gesamt'].sum().reset_index()

# Jahre für die Analyse
years = list(range(2019, 2023))  # Ändere dies entsprechend deinem Bedarf

# Gesamtsummen für jedes Jahr laden und kombinieren
gesamtsummen_combined = pd.concat([load_data(year) for year in years], ignore_index=True)

# Reihenfolge der Monate festlegen
monatsreihenfolge = [
    'Januar', 'Februar', 'März', 'April', 'Mai', 'Juni',
    'Juli', 'August', 'September', 'Oktober', 'November', 'Dezember'
]

# Altair-Diagramm erstellen
chart = alt.Chart(gesamtsummen_combined).mark_bar().encode(
    x=alt.X('monat:N', title='Monat', sort=alt.EncodingSortField(field='monat')),
    y=alt.Y('gesamt:Q', title='Anzahl Radfahrer'),
    color=alt.Color('datum:N', legend=alt.Legend(title='Jahr')).scale(scheme="category10"),
    column=alt.Column('datum:N', title='Jahr'),  # Separate Spalten für jedes Jahr
    tooltip=['datum:N', 'monat:N', 'gesamt:Q']
).properties(
    title='Anzahl Radfahrer pro Monat in den Jahren 2012 bis 2022',
    width=200, 
    height=300
)

# Diagramm anzeigen
chart

In [15]:
import altair as alt
import pandas as pd

# Funktion zum Laden der Daten für ein bestimmtes Jahr
def load_data(year):
    file_path = f"/Users/andreaheigl/Documents/BA/data/rad_{year}_tage_19_06_23_r.csv"
    df = pd.read_csv(file_path)
    df['datum'] = pd.to_datetime(df['datum'])
    df['monat'] = df['datum'].dt.strftime('%B')
    df['monat'] = df['monat'].str.replace('January', 'Januar').str.replace('February', 'Februar').str.replace('March', 'März').str.replace('April', 'April').str.replace('May', 'Mai').str.replace('June', 'Juni').str.replace('July', 'Juli').str.replace('August', 'August').str.replace('September', 'September').str.replace('October', 'Oktober').str.replace('November', 'November').str.replace('December', 'Dezember')
    return df.groupby(['monat', df['datum'].dt.year])['gesamt'].sum().reset_index()


# Jahre für die Analyse
years = list(range(2019, 2023))  # Ändere dies entsprechend deinem Bedarf

# Gesamtsummen für jedes Jahr laden und kombinieren
gesamtsummen_combined = pd.concat([load_data(year) for year in years], ignore_index=True)

# Reihenfolge der Monate festlegen
monatsreihenfolge = [
    'Januar', 'Februar', 'März', 'April', 'Mai', 'Juni',
    'Juli', 'August', 'September', 'Oktober', 'November', 'Dezember'
]

# Altair-Diagramm erstellen
chart = alt.Chart(gesamtsummen_combined).mark_bar().encode(
    x=alt.X('monat:N', title='Monat', sort=monatsreihenfolge),
    y=alt.Y('gesamt:Q', title='Anzahl Radfahrer'),
    color=alt.Color('datum:N', legend=alt.Legend(title='Jahr')).scale(scheme="category10"),
    column=alt.Column('datum:N', title='Jahr'),  # Separate Spalten für jedes Jahr
    tooltip=['datum:N', 'monat:N', 'gesamt:Q']
).properties(
    title=alt.TitleParams(
        text='Anzahl Radfahrer pro Monat von 2019 bis 2022',
        align='center',  # Zentrieren des Titels
        anchor='middle'  # Verankerung im Mittelpunkt
    ),
    width=200, 
    height=300
)

# Diagramm anzeigen
chart


## Vollständiges Diagramm

In [6]:
# Funktion zum Laden der Daten für ein bestimmtes Jahr
def load_data(year):
    file_path = f"/Users/andreaheigl/Documents/BA/data/rad_{year}_tage_19_06_23_r.csv"
    df = pd.read_csv(file_path)
    df['datum'] = pd.to_datetime(df['datum'])
    df['monat'] = df['datum'].dt.strftime('%B')
    df['monat'] = df['monat'].str.replace('January', 'Januar').str.replace('February', 'Februar').str.replace('March', 'März').str.replace('April', 'April').str.replace('May', 'Mai').str.replace('June', 'Juni').str.replace('July', 'Juli').str.replace('August', 'August').str.replace('September', 'September').str.replace('October', 'Oktober').str.replace('November', 'November').str.replace('December', 'Dezember')
    return df.groupby(['monat', df['datum'].dt.year])['gesamt'].sum().reset_index()

# Jahre für die Analyse
years = list(range(2019, 2023))  # Ändere dies entsprechend deinem Bedarf

# Gesamtsummen für jedes Jahr laden
data_frames = [load_data(year) for year in years]

# Reihenfolge der Monate festlegen
monatsreihenfolge = [
    'Januar', 'Februar', 'März', 'April', 'Mai', 'Juni',
    'Juli', 'August', 'September', 'Oktober', 'November', 'Dezember'
]

# Diagramme erstellen
charts = []
for i, year in enumerate(years):
    chart = alt.Chart(data_frames[i]).mark_bar().encode(
        x=alt.X('monat:N', title="Monat", sort=monatsreihenfolge),
        y=alt.Y('gesamt:Q', title='Anzahl Radfahrer'),
        color=alt.Color('datum:N', legend=alt.Legend(title='Jahr')).scale(scheme="category10"),
        tooltip=['datum:N', 'monat:N', 'gesamt:Q']
    ).properties(
        width=300, 
        height=300
    )
    charts.append(chart)

# Diagramme in der gewünschten Anordnung anordnen
final_chart = alt.vconcat(
    alt.hconcat(charts[0], charts[1],
        title=alt.TitleParams(
        text='Anzahl Radfahrer pro Monat von 2019 bis 2022',
        align='center',  # Zentrieren des Titels
        anchor='middle'  # Verankerung im Mittelpunkt
        ),
    ),
    alt.hconcat(charts[2], charts[3])
).resolve_scale(x='independent')  # sicherstellen, dass die X-Achsen unabhängig sind

# Diagramm anzeigen
final_chart

In [18]:
# Funktion zum Laden der Daten für ein bestimmtes Jahr
def load_data(year):
    file_path = f"/Users/andreaheigl/Documents/BA/data/rad_{year}_tage_19_06_23_r.csv"
    df = pd.read_csv(file_path)
    df['datum'] = pd.to_datetime(df['datum'])
    df['monat'] = df['datum'].dt.strftime('%B')
    df['monat'] = df['monat'].str.replace('January', 'Januar').str.replace('February', 'Februar').str.replace('March', 'März').str.replace('April', 'April').str.replace('May', 'Mai').str.replace('June', 'Juni').str.replace('July', 'Juli').str.replace('August', 'August').str.replace('September', 'September').str.replace('October', 'Oktober').str.replace('November', 'November').str.replace('December', 'Dezember')
    return df.groupby(['monat', df['datum'].dt.year])['gesamt'].sum().reset_index()

# Jahre für die Analyse
years = list(range(2019, 2023))  # Ändere dies entsprechend deinem Bedarf

# Gesamtsummen für jedes Jahr laden
data_frames = [load_data(year) for year in years]

# Diagramme erstellen
charts = []
for i, year in enumerate(years):
    chart = alt.Chart(data_frames[i]).mark_bar().encode(
        x=alt.X('monat:N', title="Monat", sort=monatsreihenfolge),
        y=alt.Y('gesamt:Q', title='Anzahl Radfahrer'),
        color=alt.Color('datum:N', legend=alt.Legend(title='Jahr')).scale(scheme="category10"),
        tooltip=['datum:N', 'monat:N', 'gesamt:Q']
    ).properties(
        width=300, 
        height=300,
        title=alt.TitleParams(
            text=f'Anzahl Radfahrer pro Monat {year}',
            align='center',  # Zentrieren des Titels
            anchor='middle'  # Verankerung im Mittelpunkt
        )
    )
    charts.append(chart)

# Diagramme in der gewünschten Anordnung anordnen
final_chart = alt.vconcat(
    alt.hconcat(charts[0], charts[1]),
    alt.hconcat(charts[2], charts[3])
).resolve_scale(x='independent')  # sicherstellen, dass die X-Achsen unabhängig sind

# Diagramm anzeigen
final_chart

