In [1]:
import pandas as pd
import numpy as np

# Erzeuge einen Datumsbereich für 60 Tage ab dem 1. Januar 2025
# freq='D' steht für tägliche Frequenz (Day)
datums_index = pd.date_range(start='2025-01-01', periods=60, freq='D')

# Erzeuge zufällige Besucherzahlen
anzahl_besucher = np.random.randint(low=500, high=2000, size=60)

# Erstelle den DataFrame mit dem Datums_index als Index
df = pd.DataFrame({'Besucher': anzahl_besucher}, index=datums_index)

print("--- Zeitreihen-DataFrame (Ausschnitt) ---")
print(df.head()) # Zeigt die ersten 5 Tage
print("\nTyp des Index:", type(df.index))

--- Zeitreihen-DataFrame (Ausschnitt) ---
            Besucher
2025-01-01       920
2025-01-02       696
2025-01-03      1443
2025-01-04      1658
2025-01-05      1474

Typ des Index: <class 'pandas.core.indexes.datetimes.DatetimeIndex'>


In [8]:
# Wähle alle Daten aus dem Monat Januar aus
januar_daten = df.loc['2025-01']
print("--- Alle Daten für Januar 2025 (letzte 5 Tage) ---")
print(januar_daten.tail())


# Wähle einen exakten Datumsbereich aus
# (beide Grenzen sind inklusive)
zeitraum = df['2025-02-10':'2025-02-15']
print("\n--- Daten für den Zeitraum 10. Feb bis 15. Feb 2025 ---")
print(zeitraum)

--- Alle Daten für Januar 2025 (letzte 5 Tage) ---
            Besucher  7-Tage-Schnitt
2025-01-27       799     1051.000000
2025-01-28      1134     1043.857143
2025-01-29      1433     1008.857143
2025-01-30      1885     1173.571429
2025-01-31      1410     1282.857143

--- Daten für den Zeitraum 10. Feb bis 15. Feb 2025 ---
            Besucher  7-Tage-Schnitt
2025-02-10      1097     1061.428571
2025-02-11      1327     1102.428571
2025-02-12      1495     1199.285714
2025-02-13       818     1193.428571
2025-02-14      1858     1196.285714
2025-02-15      1016     1227.857143


In [3]:
# Resample die täglichen Daten auf eine monatliche Frequenz ('M' = Monatsende)
# und berechne die Summe für jeden Monat.
monatliche_summe = df['Besucher'].resample('M').sum()

print("--- Monatliche Gesamt-Besucherzahlen ---")
print(monatliche_summe)

# Man kann auch den Mittelwert pro Woche berechnen ('W' = Wochen-Sonntag)
wöchentlicher_durchschnitt = df['Besucher'].resample('W').mean()
print("\n--- Wöchentliche Durchschnitts-Besucherzahlen ---")
print(wöchentlicher_durchschnitt.head())

--- Monatliche Gesamt-Besucherzahlen ---
2025-01-31    38113
2025-02-28    32410
2025-03-31      837
Freq: ME, Name: Besucher, dtype: int64

--- Wöchentliche Durchschnitts-Besucherzahlen ---
2025-01-05    1238.200000
2025-01-12    1247.000000
2025-01-19    1190.714286
2025-01-26    1171.000000
2025-02-02    1132.285714
Freq: W-SUN, Name: Besucher, dtype: float64


  monatliche_summe = df['Besucher'].resample('M').sum()


In [4]:
# Resample auf eine stündliche Frequenz ('H' = Hourly)
stündlich = df['Besucher'].resample('H')

# .asfreq() zeigt die NaN-Werte
# print(stündlich.asfreq().head()) # Viele NaN-Werte

# Fülle die Lücken, indem der letzte bekannte Wert fortgeschrieben wird ('forward fill')
stündlich_gefüllt = stündlich.ffill()

print("\n--- Stündliche Daten (mit ffill gefüllt, Anfang) ---")
print(stündlich_gefüllt.head())


--- Stündliche Daten (mit ffill gefüllt, Anfang) ---
2025-01-01 00:00:00    920
2025-01-01 01:00:00    920
2025-01-01 02:00:00    920
2025-01-01 03:00:00    920
2025-01-01 04:00:00    920
Freq: h, Name: Besucher, dtype: int64


  stündlich = df['Besucher'].resample('H')


In [5]:
# Berechne den gleitenden Durchschnitt über ein Fenster von 7 Tagen
df['7-Tage-Schnitt'] = df['Besucher'].rolling(window=7).mean()

print("--- DataFrame mit gleitendem 7-Tage-Durchschnitt ---")
# Die ersten 6 Werte sind NaN, da das Fenster noch nicht voll ist.
print(df.head(10))

--- DataFrame mit gleitendem 7-Tage-Durchschnitt ---
            Besucher  7-Tage-Schnitt
2025-01-01       920             NaN
2025-01-02       696             NaN
2025-01-03      1443             NaN
2025-01-04      1658             NaN
2025-01-05      1474             NaN
2025-01-06      1458             NaN
2025-01-07      1992     1377.285714
2025-01-08      1305     1432.285714
2025-01-09      1450     1540.000000
2025-01-10       638     1425.000000
