# Was macht das Skript?

- **Durchsucht den Ordner mit Ground-Truth-Bildern (`imagesTr`)**
    - Jedes Bild hat einen Dateinamen, der mit "AW" und einer Nummer beginnt (z.B. AW002-...).
- **Vergleicht diese Präfixe mit denen im Karies-Label-Ordner (`labelsTr`)**
    - Auch die Label-Dateien beginnen mit "AW" und einer Nummer, gefolgt von weiteren Zeichen, die ignoriert werden.
- **Erzeugt eine Liste aller relevanten Präfixe aus den Label-Dateien**
    - Zum Beispiel: AW002, AW003 etc.
- **Kopiert jedes Ground-Truth-Bild in den Zielordner (`imagesTr` von Karies)**
    - Nur wenn der Präfix des Bildes auch im Label-Ordner vorkommt.
    - Dadurch werden nur Trainingsbilder verwendet, für die tatsächlich eine Karies-Segmentierung vorhanden ist.
    
## Nutzen
- Kontrollierte Datenübernahme: Es landen nur die Bilder im Trainingsordner, die eine passende Annotation haben.
- Die Dateinamen müssen nicht exakt übereinstimmen – nur der relevante Anfang zählt.
- Reduziert fehlerhafte Trainingsdatensätze im KI-Projekt auf ein Minimum.

In [2]:
import os
import shutil
import re

def get_aw_prefix(filename):
    """Extrahiert das Präfix 'AW' plus folgende Zahl am Anfang des Dateinamens."""
    match = re.match(r'(AW\d+)', filename)
    if match:
        return match.group(1)
    return None

def filter_and_copy_by_prefix(gt_img_folder, karies_label_folder, karies_img_target_folder):
    os.makedirs(karies_img_target_folder, exist_ok=True)

    # Erstelle Set der Präfixe (AW+Zahl) der Karies Labels (ohne Extensions)
    karies_prefixes = set()
    for f in os.listdir(karies_label_folder):
        prefix = get_aw_prefix(f)
        if prefix:
            karies_prefixes.add(prefix)

    for filename in os.listdir(gt_img_folder):
        prefix = get_aw_prefix(filename)
        if prefix and prefix in karies_prefixes:
            src = os.path.join(gt_img_folder, filename)
            dst = os.path.join(karies_img_target_folder, filename)
            shutil.copy2(src, dst)
            print(f"Kopiert: {filename}")

# Beispiel-Pfade anpassen
groundtruth_image_folder = r"C:\Users\Nxtae\Desktop\Segmentierung-von-CT-Aufnahmen-extrahierter-Z-hne-mittels-Deep-Learning\data\nnuNet_raw_data\Task001_GroundTruth\imagesTr"
karies_label_folder = r"C:\Users\Nxtae\Desktop\Segmentierung-von-CT-Aufnahmen-extrahierter-Z-hne-mittels-Deep-Learning\data\nnuNet_raw_data\Task002_Karies\labelsTr"
karies_image_target_folder = r"C:\Users\Nxtae\Desktop\Segmentierung-von-CT-Aufnahmen-extrahierter-Z-hne-mittels-Deep-Learning\data\nnuNet_raw_data\Task002_Karies\imagesTr"

filter_and_copy_by_prefix(groundtruth_image_folder, karies_label_folder, karies_image_target_folder)


Kopiert: AW002-C0005280.nii.gz
Kopiert: AW003-C0005281.nii.gz
Kopiert: AW005-C0005283.nii.gz
Kopiert: AW006-C0005284.nii.gz
Kopiert: AW007-C0005404.nii.gz
Kopiert: AW008-C0005300.nii.gz
Kopiert: AW011-C0005304.nii.gz
Kopiert: AW014-C0005330.nii.gz
Kopiert: AW015-C0005331.nii.gz
Kopiert: AW017-C0005333.nii.gz
Kopiert: AW018-C0005339.nii.gz
Kopiert: AW019-C0005340.nii.gz
Kopiert: AW021-C0005342.nii.gz
Kopiert: AW023-C0005344.nii.gz
Kopiert: AW025-C0005347.nii.gz
Kopiert: AW026-C0005350.nii.gz
Kopiert: AW027-C0005351.nii.gz
Kopiert: AW028-C0005352.nii.gz
Kopiert: AW029-C0005353.nii.gz
Kopiert: AW030-C0005354.nii.gz
Kopiert: AW031-C0005355.nii.gz
Kopiert: AW032-C0005357.nii.gz
Kopiert: AW033-C0005358.nii.gz
Kopiert: AW036-C0005361.nii.gz
Kopiert: AW037-C0005365.nii.gz
Kopiert: AW040-C0005368.nii.gz
Kopiert: AW043-C0005374.nii.gz
Kopiert: AW045-C0005383.nii.gz
Kopiert: AW046-C0005384.nii.gz
Kopiert: AW048-C0005386.nii.gz
Kopiert: AW049-C0005387.nii.gz
Kopiert: AW050-C0005388.nii.gz
Kopiert: