# üñºÔ∏è 1. Datensatz vorbereiten

Jede Gruppe erh√§lt einen Ordner mit **Rohbildern**. Diese sollen in [Makesense.ai](https://www.makesense.ai) annotiert werden.

## üîß Schritt 1: Annotation mit Makesense.ai
0. Ladet die Rohbilder mit eurer Gruppennummer unter folgender [URL](https://github.com/MrZinken/Hackathon-Bonn) runter
1. √ñffnet [https://www.makesense.ai](https://www.makesense.ai)
2. Bilder hochladen
3. Modus: **Object Detection**
4. Klasse: z.‚ÄØB. `baum`, `√ºberdachung`
5. Starten und rechts unten Polygon ausw√§hlen
6. Flei√üig sein. Alle Objekte der Klasse m√ºssen in dem Bild annotiert werden. Nicht vollst√§ndig annotierte Bilder verschlechtern die Performance signifikant.
7. Export: "Actions" -> "Export Annotations" -> "Single file in COCO JSON Format" 
8. Annotations File umbennen in "annotations.json" und zusammen mit den annotierten Bilder in den Ordner datensatz kopieren

üëâ Jetzt bitte euren Ordner mit den annotierten Bildern hier per Drag and Drop hochladen.


In [None]:
from pycocotools.coco import COCO
import matplotlib.pyplot as plt
import matplotlib.patches as patches
from PIL import Image
import numpy as np
import os
import json
from IPython.display import display


# Arbeitsverzeichnis dynamisch zusammensetzen
annotations_file = f"datensatz/annotations.json"
images_dir = f"datensatz"

# COCO laden mit Fehlerbehandlung
try:
    coco = COCO(annotations_file)
except Exception as e:
    print(f"‚ùå Fehler beim Laden der COCO-Datei: {e}")
    raise

# Bild- und Annotationen-Pr√ºfung
missing_files = []
invalid_annotations = []

print("üîç Pr√ºfe Bilder und Annotationen...")
for img in coco.dataset["images"]:
    file_path = os.path.join(images_dir, img["file_name"])
    if not os.path.isfile(file_path):
        missing_files.append(img["file_name"])
    
    ann_ids = coco.getAnnIds(imgIds=img["id"])
    anns = coco.loadAnns(ann_ids)
    for ann in anns:
        if "category_id" not in ann:
            invalid_annotations.append({
                "image_file": img["file_name"],
                "annotation_id": ann.get("id", "unknown"),
                "annotation": ann
            })

# Fehlerberichte ausgeben
if missing_files:
    print(f"\n‚ùå Fehlende Bilddateien ({len(missing_files)}):")
    for f in missing_files:
        print(f" - {f}")
else:
    print("‚úÖ Alle referenzierten Bilder sind vorhanden.")

if invalid_annotations:
    print(f"\n‚ùå Annotationen ohne g√ºltige 'category_id' ({len(invalid_annotations)}):")
    for ann in invalid_annotations:
        print(f" - Bild: {ann['image_file']} | Annotation-ID: {ann['annotation_id']} ‚Üí fehlt 'category_id'")
else:
    print("‚úÖ Alle Annotationen enthalten eine g√ºltige 'category_id'.")

# Falls kritische Fehler: abbrechen
if missing_files or invalid_annotations:
    print("\n‚ö†Ô∏è Bitte korrigiere die Fehler in deiner JSON-Datei, bevor du weitermachst.")
else:
    print("\n‚úÖ Alles sieht gut aus. Starte Visualisierung...")

    # Erstes Bild anzeigen (optional)
    image_ids = coco.getImgIds()
    if image_ids:
        img_id = image_ids[0]
        img_info = coco.loadImgs(img_id)[0]
        img_path = os.path.join(images_dir, img_info['file_name'])

        # Bild laden
        image = Image.open(img_path)

        # Plot vorbereiten
        fig = plt.figure(figsize=(8, 8))
        plt.imshow(image)
        ax = plt.gca()

        # Annotations laden
        ann_ids = coco.getAnnIds(imgIds=img_id)
        anns = coco.loadAnns(ann_ids)

        # Maske zeichnen
        for ann in anns:
            if 'category_id' not in ann:
                continue  # Ung√ºltige Annotation √ºberspringen
            if 'segmentation' in ann and isinstance(ann['segmentation'], list):
                for seg in ann['segmentation']:
                    poly = np.array(seg).reshape((len(seg) // 2, 2))
                    patch = patches.Polygon(poly, fill=False, edgecolor='red', linewidth=2)
                    ax.add_patch(patch)

        plt.title(img_info['file_name'])
        plt.axis('off')
        plt.show()


## üìà Datensatz-Erweiterung durch Augmentation

Um die **Robustheit und Generalisierungsf√§higkeit** des Modells zu verbessern, wurde der urspr√ºngliche Datensatz durch gezielte Bildaugmentierung erweitert. Dabei wurden f√ºr jedes bestehende Bild **bis zu zwei zus√§tzliche Varianten** erzeugt. Die Auswahl und Kombination der Augmentierungsschritte erfolgte **zuf√§llig**, jedoch auf Basis definierter Wahrscheinlichkeiten und Begrenzungen.

### Eingesetzte Augmentierungsschritte

Die folgenden Transformationen wurden mit einer festgelegten Wahrscheinlichkeit pro Bild angewendet:

- **Horizontales Spiegeln** (z.‚ÄØB. Dachkanten von links nach rechts gespiegelt)
- **Vertikales Spiegeln**
- **Zuf√§llige 90¬∞-Rotation** (0¬∞, 90¬∞, 180¬∞ oder 270¬∞)
- **Helligkeit und Kontrast**: zuf√§llige √Ñnderung innerhalb von ¬±10‚ÄØ%
- **Farbverschiebung (HSV)**:
  - **Hue (Farbton)**: ¬±10
  - **Saturation (S√§ttigung)**: ¬±10
  - **Value (Helligkeit)**: ¬±10

Die jeweilige Kombination wurde pro Augmentierungsdurchlauf neu gew√§hlt, sodass **unterschiedliche Transformationen je Bild** m√∂glich sind. Dieser Zufallsfaktor erh√∂ht die Datenvielfalt und minimiert die Gefahr von Overfitting.

### Segmentierungs-Masken

Die zugeh√∂rigen **Segmentierungsmasken wurden synchron mit den Bildern transformiert**, um die Konsistenz zwischen Bild und Annotation zu erhalten. Dadurch bleiben die semantischen Informationen trotz visueller Ver√§nderung vollst√§ndig erhalten.

### Ausgabeformat

Die augmentierten Bilder und ihre Annotations wurden im Anschluss gemeinsam mit den Originaldaten in einem **neuen COCO-kompatiblen Datensatz** gespeichert. Dieser kann nahtlos f√ºr Trainingszwecke in Frameworks wie Detectron2, MMDetection oder YOLOv8 weiterverwendet werden.

---

## ‚öôÔ∏è Erkl√§rung der Augmentierungsparameter

| Variable             | Beschreibung                                                         |
|----------------------|----------------------------------------------------------------------|
| `AUGS_PRO_BILD`      | Anzahl augmentierter Bilder, die pro Original erzeugt werden (z.‚ÄØB. 2) |
| `BRIGHTNESS_LIMIT`   | Max. relative Helligkeits√§nderung, z.‚ÄØB. 0.1 = ¬±10‚ÄØ%                 |
| `CONTRAST_LIMIT`     | Max. relative Kontrast√§nderung, analog zu `BRIGHTNESS_LIMIT`         |
| `HUE_SHIFT`          | Max. Verschiebung des Farbtons (z.‚ÄØB. ¬±10 in HSV-Farbraum)           |
| `SAT_SHIFT`          | Max. √Ñnderung der Farbs√§ttigung (z.‚ÄØB. ¬±10)                          |
| `VAL_SHIFT`          | Max. √Ñnderung der Helligkeit im HSV-Modell                           |
| `p` bei jedem Schritt| Wahrscheinlichkeit, mit der dieser Schritt ausgef√ºhrt wird          |



In [None]:
import albumentations as A
import cv2
import json
import os
import numpy as np
import shutil
from tqdm import tqdm
import random

# === üìã EINSTELLUNGEN (ANPASSBARER BEREICH) ===
AUGS_PRO_BILD = 2
BRIGHTNESS_LIMIT = 0.1
CONTRAST_LIMIT = 0.1
HUE_SHIFT = 10
SAT_SHIFT = 10
VAL_SHIFT = 10

# === üîÅ AUGMENTIERUNGEN ===
AUGMENTATIONS = [
    ("flipH", lambda: A.HorizontalFlip(p=1.0)),
    ("flipV", lambda: A.VerticalFlip(p=1.0)),
    ("rot90", lambda: A.RandomRotate90(p=1.0)),
    ("brightness", lambda: A.RandomBrightnessContrast(
        brightness_limit=BRIGHTNESS_LIMIT,
        contrast_limit=CONTRAST_LIMIT,
        p=1.0)),
    ("hue", lambda: A.HueSaturationValue(
        hue_shift_limit=HUE_SHIFT,
        sat_shift_limit=SAT_SHIFT,
        val_shift_limit=VAL_SHIFT,
        p=1.0))
]

# === üìÇ VERZEICHNISSE ===
source_dir = "datensatz"
target_dir = "datensatz_augmented"
os.makedirs(target_dir, exist_ok=True)

# === üìñ JSON LADEN ===
with open(os.path.join(source_dir, "annotations.json"), "r") as f:
    coco_data = json.load(f)

extended_data = {
    "images": list(coco_data["images"]),
    "annotations": list(coco_data["annotations"]),
    "categories": coco_data["categories"]
}

# Originalbilder kopieren
for img_entry in coco_data["images"]:
    src = os.path.join(source_dir, img_entry["file_name"])
    dst = os.path.join(target_dir, img_entry["file_name"])
    if not os.path.exists(dst):
        shutil.copy(src, dst)

# ID-Offsets
next_image_id = max(img["id"] for img in coco_data["images"]) + 1
next_ann_id = max(ann["id"] for ann in coco_data["annotations"]) + 1

# Zuordnung Bild ‚Üí Annotationen
img_to_anns = {}
for ann in coco_data["annotations"]:
    img_to_anns.setdefault(ann["image_id"], []).append(ann)

# === AUGMENTIERUNG ===
for img_entry in tqdm(coco_data["images"], desc="Augmentiere Bilder"):
    file_name = img_entry["file_name"]
    img_path = os.path.join(source_dir, file_name)
    img = cv2.imread(img_path)
    if img is None:
        print(f"‚ö†Ô∏è Fehler beim Laden: {file_name}")
        continue
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

    anns = img_to_anns.get(img_entry["id"], [])
    if not anns:
        continue

    # Bin√§rmasken erzeugen
    masks = []
    for ann in anns:
        for seg in ann["segmentation"]:
            pts = np.array(seg).reshape(-1, 2)
            mask = np.zeros(img.shape[:2], dtype=np.uint8)
            cv2.fillPoly(mask, [pts.astype(np.int32)], 1)
            masks.append(mask)

    # AUGS_PRO_BILD neue Versionen
    for aug_nr in range(AUGS_PRO_BILD):
        name, aug_fn = random.choice(AUGMENTATIONS)
        transform = A.Compose([aug_fn()])
        transformed = transform(image=img, masks=masks)

        aug_img = transformed["image"]
        aug_masks = transformed["masks"]
        new_filename = f"{name}_{aug_nr}_{file_name}"
        new_path = os.path.join(target_dir, new_filename)
        cv2.imwrite(new_path, cv2.cvtColor(aug_img, cv2.COLOR_RGB2BGR))

        extended_data["images"].append({
            "id": next_image_id,
            "file_name": new_filename,
            "width": aug_img.shape[1],
            "height": aug_img.shape[0]
        })

        for mask in aug_masks:
            contours, _ = cv2.findContours(mask.astype(np.uint8), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
            for contour in contours:
                if len(contour) < 3:
                    continue
                polygon = contour.squeeze().reshape(-1).tolist()
                if len(polygon) >= 6:
                    bbox = cv2.boundingRect(contour)  # (x, y, w, h)
                    area = float(cv2.contourArea(contour))
                    extended_data["annotations"].append({
                        "id": next_ann_id,
                        "image_id": next_image_id,
                        "category_id": 1,
                        "segmentation": [polygon],
                        "area": area,
                        "bbox": [bbox[0], bbox[1], bbox[2], bbox[3]],
                        "iscrowd": 0
                    })
                    next_ann_id += 1
        next_image_id += 1

# === SPEICHERN ===
out_path = os.path.join(target_dir, "annotations_augmented.json")
with open(out_path, "w") as f:
    json.dump(extended_data, f)

print("\n‚úÖ Augmentierung abgeschlossen.")
print(f"üìÇ Bilder: {target_dir}")
print(f"üìÑ Annotations: {out_path}")


## Visualisierung der Augmentation

In [None]:
from pycocotools.coco import COCO
import matplotlib.pyplot as plt
import matplotlib.patches as patches
from PIL import Image
import numpy as np
import os
from IPython.display import display
from pycocotools import mask as mask_utils

# Pfade
json_path = f"{target_dir}/annotations_augmented.json"
img_dir = target_dir

# COCO laden
coco = COCO(json_path)
images = coco.dataset["images"]

# üìå Nur augmentierte Bilder ausw√§hlen (z.‚ÄØB. "flipH_", "flipV_", "rot90_")
aug_images = [img for img in images if img["file_name"].startswith(("flip", "rot", "flipH", "flipV"))]

# Den Original-Dateinamen merken ‚Äì angenommen, du wei√üt ihn z.‚ÄØB. von oben:
original_file_name = coco.loadImgs(coco.getImgIds()[0])[0]["file_name"]

# Passendes augmentiertes Bild finden (das denselben Dateinamen am Ende tr√§gt)
matched_aug_images = [
    img for img in aug_images if img["file_name"].endswith(original_file_name)
]

if not matched_aug_images:
    raise ValueError(f"‚ùå Kein augmentiertes Bild gefunden, das auf {original_file_name} basiert.")

img_info = matched_aug_images[0]  # Nimm das erste passende

img_path = os.path.join(img_dir, img_info["file_name"])
image = Image.open(img_path)

# Masken laden
ann_ids = coco.getAnnIds(imgIds=img_info["id"])
anns = coco.loadAnns(ann_ids)

# Plot
fig, ax = plt.subplots(figsize=(8, 8))
ax.imshow(image)

for ann in anns:
    seg = ann["segmentation"]
    
    if isinstance(seg, list):  # Polygon
        for s in seg:
            poly = np.array(s).reshape((len(s) // 2, 2))
            patch = patches.Polygon(poly, fill=False, edgecolor='red', linewidth=2)
            ax.add_patch(patch)
    elif isinstance(seg, dict) and "counts" in seg:  # RLE
        rle = {
            "counts": seg["counts"].encode("utf-8"),
            "size": seg["size"]
        }
        mask = mask_utils.decode(rle)
        ax.contour(mask, colors='red', linewidths=2)

ax.set_title(f"Augmentiertes Bild: {img_info['file_name']}")
ax.axis("off")
display(fig)
plt.close(fig)

## Datensatz pr√ºfen

In [None]:
import os
import json


# üìñ JSON laden
with open(json_path, "r") as f:
    data = json.load(f)

# üîé Bildnamen aus JSON
json_images = {img["file_name"] for img in data["images"]}
json_image_ids = {img["id"] for img in data["images"]}

# üîé Bilddateien im Ordner
folder_images = {f for f in os.listdir(img_dir) if f.lower().endswith((".jpg", ".png"))}

# üîé IDs aus Annotations
referenced_ids = {ann["image_id"] for ann in data["annotations"]}

# ‚úÖ Checks
missing_files = json_images - folder_images
unreferenced_files = folder_images - json_images
annotations_without_images = referenced_ids - json_image_ids

# üñ®Ô∏è Ergebnis
print("üìÅ Bilder in JSON, aber nicht im Ordner:", missing_files if missing_files else "‚úÖ Keine")
print("üìÅ Bilder im Ordner, aber nicht in JSON:", unreferenced_files if unreferenced_files else "‚úÖ Keine")
print("üìõ Annotations mit fehlenden Bild-IDs:", annotations_without_images if annotations_without_images else "‚úÖ Keine")


## Datensatz Hochladen

In [None]:
import os
import requests
from getpass import getpass
from tqdm import tqdm

# üî¢ Gruppennummer eintragen
gruppen_nummer = ""  # z.‚ÄØB. "1", "17", "60"

# üìÇ Lokaler Ordner mit den exportierten JSONs/Bildern
target_dir = f"datensatz_augmented"

# üåê Ziel: annotierte_daten innerhalb der Gruppenstruktur
webdav_base = f"https://mrzinken.duckdns.org/remote.php/dav/files/hackathon2025/HackathonBonn/Gruppe{gruppen_nummer}/annotierte_daten"

# üîê Zugangsdaten
username = "hackathon2025"
password = "upload2025"

# üì§ Upload-Schleife
for fname in tqdm(os.listdir(target_dir), desc="üì§ Upload l√§uft"):
    fpath = os.path.join(target_dir, fname)
    if os.path.isfile(fpath):
        remote_url = f"{webdav_base}/{fname}"
        with open(fpath, "rb") as f:
            r = requests.put(remote_url, data=f, auth=(username, password))
        if r.status_code in [200, 201, 204]:
            print(f"‚úÖ Hochgeladen: {fname}")
        else:
            print(f"‚ùå Fehler bei {fname}: {r.status_code} {r.text}")

print("üèÅ Upload abgeschlossen.")
