In [4]:
import pandas as pd
import numpy as np
from typing import List, Tuple

In [5]:
def _time_to_seconds(t: str) -> float:
    """
    Konvertiert 'hh:mm:ss' (oder 'mm:ss' / 'ss') in Sekunden (float).
    """
    t = t.strip()
    if not t:
        raise ValueError("Leerer Zeit-String übergeben.")

    parts = t.split(":")
    parts = [float(p) for p in parts]
    if len(parts) == 3:
        h, m, s = parts
    elif len(parts) == 2:
        h = 0.0
        m, s = parts
    elif len(parts) == 1:
        h = 0.0
        m = 0.0
        s = parts[0]
    else:
        raise ValueError(f"Ungültiges Zeitformat: {t}")
    return h * 3600 + m * 60 + s


def label_csv_segments(
    input_csv: str,
    segments: List[Tuple[str, str, str]],
    output_csv: str
) -> tuple[pd.DataFrame, int]:
    """
    Lädt ein CSV, labelt die angegebenen Zeitbereiche (hh:mm:ss) anhand der Spalte 'timestamp'
    und speichert ein neues CSV.

    segments ist eine Liste von:
        (label, start_time, end_time)

    Zusätzlich werden zwei Spalten angelegt:
        - SegmentID: laufende Nummer der Segmente (1..N, in Reihenfolge der Liste)
        - LabelInstance: laufende Nummer pro Label (Kurve #1, Kurve #2, ...)
    """

    df = pd.read_csv(input_csv)

    if "timestamp" not in df.columns:
        raise KeyError("Spalte 'timestamp' wurde im CSV nicht gefunden.")

    # sicherstellen, dass timestamp numerisch ist (Sekunden)
    df["timestamp"] = pd.to_numeric(df["timestamp"], errors="coerce")

    if "Label" not in df.columns:
        df["Label"] = "None"
    else:
        df["Label"] = df["Label"].fillna("None")

    # SegmentID & LabelInstance initialisieren
    if "SegmentID" not in df.columns:
        df["SegmentID"] = np.nan
    if "LabelInstance" not in df.columns:
        df["LabelInstance"] = np.nan

    label_counter: dict[str, int] = {}

    # --- Zeitsegmente anwenden ---
    for seg_idx, (label, start_str, end_str) in enumerate(segments, start=1):
        start_sec = _time_to_seconds(start_str)
        end_sec   = _time_to_seconds(end_str)

        if start_sec > end_sec:
            print(f"Ungültiger Bereich {start_str}>{end_str} – übersprungen.")
            continue

        mask = (df["timestamp"] >= start_sec) & (df["timestamp"] <= end_sec)
        n_marked = int(mask.sum())

        if n_marked == 0:
            print(f"Keine Frames im Bereich {start_str}–{end_str} für Label '{label}' gefunden.")
            continue

        # Label-Instance-Zähler pro Label
        label_counter[label] = label_counter.get(label, 0) + 1
        inst_id = label_counter[label]

        df.loc[mask, "Label"] = label
        df.loc[mask, "SegmentID"] = seg_idx
        df.loc[mask, "LabelInstance"] = inst_id

        first_idx = df.index[mask][0]
        last_idx  = df.index[mask][-1]
        print(
            f"Label '{label}' (SegmentID={seg_idx}, LabelInstance={inst_id}) "
            f"für Zeit {start_str}–{end_str} (Frames {first_idx}–{last_idx}, {n_marked} Frames) gesetzt."
        )

    # --- Ungelabelte Frames zählen & Bereiche anzeigen ---
    unlabeled_mask = (df["Label"] == "None") | (df["Label"].isna())
    unlabeled_count = int(unlabeled_mask.sum())

    if unlabeled_count > 0:
        print(f"{unlabeled_count} Frames ohne Label.")

        gaps = []
        run_start = None

        for i, is_unlabeled in enumerate(unlabeled_mask.to_numpy()):
            if is_unlabeled and run_start is None:
                run_start = i
            elif not is_unlabeled and run_start is not None:
                gaps.append((run_start, i - 1))
                run_start = None

        if run_start is not None:
            gaps.append((run_start, len(df) - 1))

        if gaps:
            preview = ", ".join(f"{a}-{b}" for a, b in gaps[:5])
            if len(gaps) > 5:
                preview += f", … (+{len(gaps) - 5} weitere)"
            print(f"Ungelabelte Bereiche: {preview}")
    else:
        print("Alle Frames sind gelabelt.")

    # Frame-Index explizit als Spalte aufnehmen
    df_out = df.reset_index().rename(columns={"index": "Frame"})

    df_out.to_csv(output_csv, index=False, float_format="%.6f")
    print(f"Gespeichert: {output_csv}")

    return df_out, unlabeled_count

In [6]:
# die run1.csv hat eine tabelle timestamp welche in Sekunden angibt zu welchem zeit punkt der frame aufgenommen wurde
# eingeben werden die zeiten aber im format hh:mm:ss
# die funktion die eingebenen zeit in sekunden umwandeln und dann alle entsprechenden frames labeln anhand der spalte timestamp

segments = [
    # (Label,           Start,      Ende)
    ("Stehen",          "00:01:21", "00:01:31"),
    ("Fahren bis Ampel","00:01:31", "00:02:00"),
    ("Stehen",          "00:02:00", "00:02:05"),
    ("Kurve",           "00:02:05", "00:02:16"),
    ("Gerade fahren",   "00:02:16", "00:02:34"),
    ("Spurwechsel",     "00:02:34", "00:02:38"),
    ("Gerade fahren",   "00:02:38", "00:02:45"),
    ("Kurve",           "00:02:45", "00:02:52"),
    ("Gerade fahren",   "00:02:52", "00:03:04"),
    ("Doppel Kurve",    "00:03:04", "00:03:22"),
    ("Gerade fahren",   "00:03:22", "00:03:40"),
    ("Spurwechsel",     "00:03:40", "00:03:45"),
    ("Gerade fahren",   "00:03:45", "00:03:50"),
    ("Kurve",           "00:03:50", "00:03:57"),
    ("Gerade fahren",   "00:03:57", "00:04:03"),
    ("Doppel Kurve",    "00:04:03", "00:04:19"),
    ("Gerade fahren",   "00:04:19", "00:04:26"),
    ("Kurve",           "00:04:26", "00:04:33"),
    ("Gerade fahren",   "00:04:33", "00:04:52"),
    ("Doppel Kurve",    "00:04:52", "00:05:05"),
    ("Kreisverkehr nähern","00:05:05", "00:05:15"),
    ("Kreisverkehr",    "00:05:15", "00:05:28"),
    ("Kurve",           "00:05:28", "00:05:34"),
    ("Gerade fahren",   "00:05:34", "00:05:49"),
    ("Kurve",           "00:05:49", "00:05:59"),
    ("Gerade fahren",   "00:05:59", "00:06:02"),
    ("Kurve",           "00:06:02", "00:06:10"),
    ("Gerade fahren",   "00:06:10", "00:06:22"),
    ("Stehen",          "00:06:22", "00:06:24"),
    ("Gerade fahren",   "00:08:26", "00:08:36"),
    ("Abbiegen",        "00:08:36", "00:08:41"),
    ("Gerade fahren",   "00:08:41", "00:08:54"),
    ("Kurve",           "00:08:54", "00:08:57"),
    ("Gerade fahren",   "00:08:57", "00:09:05"),
    ("Kreisverkehr nähern","00:09:05", "00:09:07"),
    ("Kreisverkehr",    "00:09:07", "00:09:15"),
    ("Gerade fahren",   "00:09:15", "00:09:20"),
    ("Spurwechsel",     "00:09:20", "00:09:23"),
    ("Gerade fahren",   "00:09:23", "00:09:55"),
    ("Doppel Kurve",    "00:09:55", "00:10:41"),
]


label_csv_segments(
    input_csv="run2.csv",
    segments=segments,
    output_csv="run2_labeled.csv"
)

  df = pd.read_csv(input_csv)


Label 'Stehen' (SegmentID=1, LabelInstance=1) für Zeit 00:01:21–00:01:31 (Frames 7921–8919, 999 Frames) gesetzt.
Label 'Fahren bis Ampel' (SegmentID=2, LabelInstance=1) für Zeit 00:01:31–00:02:00 (Frames 8920–11819, 2900 Frames) gesetzt.
Label 'Stehen' (SegmentID=3, LabelInstance=2) für Zeit 00:02:00–00:02:05 (Frames 11820–12319, 500 Frames) gesetzt.
Label 'Kurve' (SegmentID=4, LabelInstance=1) für Zeit 00:02:05–00:02:16 (Frames 12320–13419, 1100 Frames) gesetzt.
Label 'Gerade fahren' (SegmentID=5, LabelInstance=1) für Zeit 00:02:16–00:02:34 (Frames 13420–15219, 1800 Frames) gesetzt.
Label 'Spurwechsel' (SegmentID=6, LabelInstance=1) für Zeit 00:02:34–00:02:38 (Frames 15220–15619, 400 Frames) gesetzt.
Label 'Gerade fahren' (SegmentID=7, LabelInstance=2) für Zeit 00:02:38–00:02:45 (Frames 15620–16319, 700 Frames) gesetzt.
Label 'Kurve' (SegmentID=8, LabelInstance=2) für Zeit 00:02:45–00:02:52 (Frames 16320–17019, 700 Frames) gesetzt.
Label 'Gerade fahren' (SegmentID=9, LabelInstance=3) 

(       Frame wheel_position wheel_adas_position_K_p wheel_adas_position_K_D  \
 0          0              -                       -                       -   
 1          1              0                       0                       0   
 2          2     -0.0163363                       7                       0   
 3          3     -0.0163363                       7                       0   
 4          4     -0.0163363                       7                       0   
 ...      ...            ...                     ...                     ...   
 58992  58992       0.024661                       7                       0   
 58993  58993       0.024661                       7                       0   
 58994  58994       0.024661                       7                       0   
 58995  58995       0.024661                       7                       0   
 58996  58996       0.024661                       7                       0   
 
       wheel_adas_velocity_K_v_FF whee