# 🖼️ 1. Datensatz vorbereiten

Jede Gruppe erhält einen Ordner mit **Rohbildern**. Diese sollen in [Makesense.ai](https://www.makesense.ai) annotiert werden.

## 🔧 Schritt 1: Annotation mit Makesense.ai
0. Ladet die Rohbilder mit eurer Gruppennummer unter folgender [URL](https://databox.bonn.de/public/upload-shares/YhXlVGe57thQAg8WUjVlZFNK6z4LORiq) runter
1. Öffnet [https://www.makesense.ai](https://www.makesense.ai)
2. Bilder hochladen
3. Modus: **Segmentation**
4. Klasse: z. B. `baum`, `überdachung`
5. Export: Format `Pascal VOC Segmentation (PNG masks)`

👉 Jetzt bitte eure annotierten Masken und Bilder wieder hochladen. Verwende folgenden Platzhalter:


In [None]:
from pycocotools.coco import COCO
import matplotlib.pyplot as plt
import matplotlib.patches as patches
from PIL import Image
import numpy as np
import os

# Für stabile Anzeige in JupyterLab
from IPython.display import display

# Arbeitsverzeichnis
annotations_file = "datensatz_gruppe1/annotations.json"
images_dir = "datensatz_gruppe1"

# COCO laden
coco = COCO(annotations_file)
image_ids = coco.getImgIds()

# Nimm das erste Bild
img_id = image_ids[0]
img_info = coco.loadImgs(img_id)[0]
img_path = os.path.join(images_dir, img_info['file_name'])

# Bild laden
image = Image.open(img_path)

# Plot vorbereiten
fig = plt.figure(figsize=(8, 8))
plt.imshow(image)
ax = plt.gca()

# Annotations laden
ann_ids = coco.getAnnIds(imgIds=img_id)
anns = coco.loadAnns(ann_ids)

# Maske zeichnen
for ann in anns:
    if 'segmentation' in ann and isinstance(ann['segmentation'], list):
        for seg in ann['segmentation']:
            poly = np.array(seg).reshape((len(seg) // 2, 2))
            patch = patches.Polygon(poly, fill=False, edgecolor='red', linewidth=2)
            ax.add_patch(patch)

plt.title(img_info['file_name'])
plt.axis('off')

## 📈 Datensatz-Erweiterung durch Augmentation

Um die Robustheit und Generalisierungsfähigkeit des Modells zu verbessern, wurde der Datensatz durch gezielte Bildaugmentierung erweitert. Dabei wurde zu jedem bestehenden Bild **eine sinnvolle Transformation** erzeugt.

Die angewendeten Augmentierungsschritte umfassen:
- **Horizontales Spiegeln**
- **Leichte Rotation (±15°)**
- **Änderung von Helligkeit und Kontrast**

Für jedes Originalbild wurde ein neues Bild generiert. Die zugehörigen Segmentierungs-Masken wurden dabei korrekt mittransformiert. Die augmentierten Bilder und Masken wurden zusammen mit den Originalen in einer neuen COCO-kompatib


In [None]:
import albumentations as A
import cv2
import json
import os
import numpy as np
from pycocotools import mask as mask_utils
import uuid
from tqdm import tqdm

# 📂 Verzeichnisse
source_dir = "datensatz_gruppe1"
target_dir = "datensatz_gruppe1_augmented"
os.makedirs(target_dir, exist_ok=True)

# 📖 Originaldaten laden
with open(os.path.join(source_dir, "annotations.json"), "r") as f:
    coco_data = json.load(f)

# Neue COCO-Struktur
aug_data = {
    "images": [],
    "annotations": [],
    "categories": coco_data["categories"]
}

# ID-Offsets
next_image_id = 10000
next_ann_id = 50000

# Bild-ID → Annotations
img_to_anns = {}
for ann in coco_data["annotations"]:
    img_to_anns.setdefault(ann["image_id"], []).append(ann)

# ✅ Nur sichere Augmentierungen (keine schwarzen Ränder)
transform_options = [
    ("flipH", A.HorizontalFlip(p=1.0)),
    ("flipV", A.VerticalFlip(p=1.0)),
    ("rot90", A.RandomRotate90(p=1.0))
]

for img_entry in tqdm(coco_data["images"], desc="Augmentiere Bilder"):
    file_name = img_entry["file_name"]
    img_path = os.path.join(source_dir, file_name)
    img = cv2.imread(img_path)
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

    anns = img_to_anns.get(img_entry["id"], [])
    if not anns:
        continue

    # Segmentierungen → Masken
    masks = []
    for ann in anns:
        for seg in ann["segmentation"]:
            pts = np.array(seg).reshape(-1, 2)
            mask = np.zeros(img.shape[:2], dtype=np.uint8)
            cv2.fillPoly(mask, [pts.astype(np.int32)], 1)
            masks.append(mask)

    # ✅ Augmentation auswählen
    aug_name, transform = A.OneOf([
        (A.HorizontalFlip(p=1.0), 1),
        (A.VerticalFlip(p=1.0), 1),
        (A.RandomRotate90(p=1.0), 1),
    ], p=1.0)(image=img, masks=masks).items()

    transformed = transform
    aug_img = transformed["image"]
    aug_masks = transformed["masks"]

    # Speichern
    new_filename = f"{aug_name}_{file_name}"
    new_img_path = os.path.join(target_dir, new_filename)
    cv2.imwrite(new_img_path, cv2.cvtColor(aug_img, cv2.COLOR_RGB2BGR))

    # COCO-Eintrag für Bild
    aug_data["images"].append({
        "id": next_image_id,
        "file_name": new_filename,
        "width": aug_img.shape[1],
        "height": aug_img.shape[0]
    })

    # COCO-Annotations
    for mask in aug_masks:
        rle = mask_utils.encode(np.asfortranarray(mask.astype(np.uint8)))
        area = mask_utils.area(rle).item()
        bbox = mask_utils.toBbox(rle).tolist()

        seg = mask_utils.encode(np.asfortranarray(mask))
        seg["counts"] = seg["counts"].decode("utf-8")

        aug_data["annotations"].append({
            "id": next_ann_id,
            "image_id": next_image_id,
            "category_id": 1,
            "segmentation": seg,
            "area": area,
            "bbox": bbox,
            "iscrowd": 0
        })
        next_ann_id += 1

    next_image_id += 1

# Speichern
json_out = os.path.join(target_dir, "annotations_augmented.json")
with open(json_out, "w") as f:
    json.dump(aug_data, f)

print(f"✅ Augmentierung abgeschlossen. Neue Bilder in '{target_dir}', JSON gespeichert als '{json_out}'")


## Visualisierung der Augmentation

In [None]:
from pycocotools.coco import COCO
import matplotlib.pyplot as plt
import matplotlib.patches as patches
from PIL import Image
import numpy as np
import os
from IPython.display import display

# Augmentiertes COCO laden
coco_aug = COCO("datensatz_gruppe1_augmented/annotations_augmented.json")
images_aug = coco_aug.dataset["images"]

# Erstes augmentiertes Bild
img_info = images_aug[0]
img_path = os.path.join("datensatz_gruppe1_augmented", img_info["file_name"])
image = Image.open(img_path)

# Maske laden
ann_ids = coco_aug.getAnnIds(imgIds=img_info["id"])
anns = coco_aug.loadAnns(ann_ids)

# Plot
fig, ax = plt.subplots(figsize=(8, 8))
ax.imshow(image)

for ann in anns:
    if 'segmentation' in ann:
        rle = {
            "counts": ann["segmentation"]["counts"].encode("utf-8"),
            "size": ann["segmentation"]["size"]
        }
        mask = mask_utils.decode(rle)
        ax.contour(mask, colors='red', linewidths=2)

ax.set_title(f"Augmentiertes Bild: {img_info['file_name']}")
ax.axis("off")
display(fig)


: 