In [None]:
import pandas as pd
from pathlib import Path

# Pfad zur Originaldatei
path = Path("dataset/311_Service_Requests.csv")

# Neuer Dateiname mit _2024
output_path = path.with_name(path.stem + "_2024.csv")

print(f"Eingabedatei: {path}")
print(f"Ausgabe wird erstellt unter: {output_path}")

# 1. Datensatz einlesen
df = pd.read_csv(path)

# 2. Datumsspalte konvertieren
df["CREATED_DATE"] = pd.to_datetime(df["CREATED_DATE"], errors="coerce")

# 3. Nur Zeilen mit Jahr 2024 behalten
df_2024 = df[df["CREATED_DATE"].dt.year == 2024].copy()

# 4. Als neue CSV speichern (identischer Aufbau)
df_2024.to_csv(output_path, index=False)

print(f"Fertig! Gefilterte Datei gespeichert unter: {output_path}")
print(f"Zeitraum: {df_2024['CREATED_DATE'].min()} → {df_2024['CREATED_DATE'].max()}")
print(f"Anzahl Zeilen: {len(df_2024):,}")


Eingabedatei: dataset\311_Service_Requests.csv
Ausgabe wird erstellt unter: dataset\311_Service_Requests_2024.csv


  df = pd.read_csv(path)


Fertig! Gefilterte Datei gespeichert unter: dataset\311_Service_Requests_2024.csv
Zeitraum: 2024-01-01 00:00:12 → 2024-12-31 23:59:43
Anzahl Zeilen: 1,913,929
