In [None]:
import os
import glob
import pandas as pd

def merge_csv_files(input_path, output_path):
    """
    Liest alle CSV-Dateien im Ordner <input_path> ein, kombiniert sie zu einem DataFrame,
    filtert Zeilen, in denen in der Spalte 'BETREIBER_ABK' der String "VBZ" enthalten ist,
    und speichert das Ergebnis als CSV unter <output_path>.

    Parameter:
      input_path (str): Pfad zum Ordner mit den CSV-Dateien.
      output_path (str): Pfad inkl. Dateiname für die Ausgabedatei.
    """
    # Finde alle CSV-Dateien im Ordner
    csv_files = glob.glob(os.path.join(input_path, "*.csv"))


    # Lese und kombiniere alle CSV-Dateien
    df_merged = pd.concat((pd.read_csv(file, sep=None) for file in csv_files), ignore_index=True)

    # Filtere Zeilen, in denen 'BETREIBER_ABK' "VBZ" enthält
    df_merged_filtered_vbz = df_merged[df_merged["BETREIBER_ABK"].str.contains("VBZ")]

    # Speichere das zusammengeführte DataFrame als CSV
    df_merged_filtered_vbz.to_csv(output_path, index=False)

In [None]:
def filter_single_csv(input_path, output_path):
    """
    Liest eine CSV-Datei ein, filtert Zeilen, in denen in der Spalte 'BETREIBER_ABK' der String "VBZ" enthalten ist,
    und speichert das Ergebnis als CSV unter <output_file>.

    Parameter:
      input_file (str): Pfad zur CSV-Datei.
      output_file (str): Pfad inkl. Dateiname für die Ausgabedatei.
    """
    # CSV-Datei einlesen (ggf. Separator anpassen, falls nicht Komma-getrennt)
    df = pd.read_csv(input_path, sep=",", low_memory=False)

    # Nur Zeilen behalten, in denen "VBZ" in der Spalte BETREIBER_ABK enthalten ist
    df_filtered = df[df["BETREIBER_ABK"].str.contains("VBZ")]

    # Gefilterte Daten speichern
    df_filtered.to_csv(output_path, index=False)

    print(f"Gefilterte Datei wurde gespeichert unter: {output_path}")