
# Fiktives Datenaugmentierungs-Toolkit

Dieses Projekt ist ein vollständig erfundenes Beispiel, das zeigt, wie man ein Datenaugmentierungs-Toolkit für **fiktive Weltraum-Sensordaten** aufbauen könnte.  
Es orientiert sich in der **Struktur** am Projekt *hiwistanzen*, verwendet jedoch komplett neue Inhalte und Code.

---

## Projektübersicht

- **Ziel:** Demonstration von Signalverarbeitungs- und Trainingspipelines an ausgedachten Daten.
- **Datenquelle:** Simulierte Sensoren an Bord eines imaginären Mars-Forschungsroboters.
- **Anwendungsfall:** Klassifizierung von Signalsequenzen, um Betriebszustände zu erkennen.



## Datensatzstruktur

Die Daten bestehen aus **Zeitreihen** (einfache Arrays), gespeichert in `.npy`-Dateien.  
Jede Datei enthält:
1. Eine fiktive Signalspur (`signal`).
2. Ein Label (`state`), das den Betriebszustand angibt.

**Beispielhafte Dateistruktur:**

```
data/
 ├── train/
 │    ├── sample_0001.npy
 │    ├── sample_0002.npy
 │    └── ...
 ├── val/
 │    ├── sample_1001.npy
 │    └── ...
 └── test/
      ├── sample_2001.npy
      └── ...
```


In [None]:

import numpy as np
import matplotlib.pyplot as plt
from pathlib import Path

# Fiktive Beispieldaten erzeugen
Path("data/train").mkdir(parents=True, exist_ok=True)

for i in range(5):
    signal = np.sin(np.linspace(0, 10, 100)) + np.random.normal(0, 0.1, 100)
    label = np.random.choice(["OK", "WARNUNG", "ALARM"])
    np.save(f"data/train/sample_{i:04d}.npy", {"signal": signal, "label": label})

# Beispiel laden
example = np.load("data/train/sample_0000.npy", allow_pickle=True).item()
plt.plot(example["signal"])
plt.title(f"Beispielsignal – Label: {example['label']}")
plt.show()



## Experimentelles Setup

Wir teilen die Daten in **Training**, **Validierung** und **Test** auf.  
Ziel ist es, ein einfaches neuronales Netz zu trainieren, das anhand der Signalform den Zustand vorhersagt.

**Split:**  
- Train: 70 %  
- Val: 15 %  
- Test: 15 %



## Modellarchitektur

Das Modell ist ein kleines **1D-CNN** mit:
- 2 Faltungsschichten
- 1 Dense-Schicht für die Klassifikation


In [None]:

import torch
import torch.nn as nn
import torch.nn.functional as F

class Simple1DCNN(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv1d(1, 8, kernel_size=3, padding=1)
        self.conv2 = nn.Conv1d(8, 16, kernel_size=3, padding=1)
        self.fc = nn.Linear(16*100, 3)  # 3 Klassen
        
    def forward(self, x):
        x = F.relu(self.conv1(x))
        x = F.relu(self.conv2(x))
        x = x.view(x.size(0), -1)
        return self.fc(x)

model = Simple1DCNN()
print(model)



## Training & Evaluation

Wir verwenden hier nur ein Mini-Beispiel-Training mit fiktiven Daten.


In [None]:

# Dummy-Training
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)
criterion = nn.CrossEntropyLoss()

# Fiktive Eingabe & Labels
inputs = torch.randn(10, 1, 100)  # 10 Signale, Länge 100
labels = torch.randint(0, 3, (10,))

for epoch in range(3):
    optimizer.zero_grad()
    outputs = model(inputs)
    loss = criterion(outputs, labels)
    loss.backward()
    optimizer.step()
    print(f"Epoche {epoch+1}, Verlust: {loss.item():.4f}")



## Ergebnisse

In einem echten Experiment würden wir hier:
- Trainings- und Validierungsverluste über Epochen plotten.
- Konfusionsmatrizen zeigen.
- Beispielvorhersagen darstellen.

Da unser Beispiel rein fiktiv ist, dienen die obigen Ausgaben nur zur Illustration.



## Fazit

- Die Struktur dieses Notebooks ist an reale Machine-Learning-Projekte angelehnt.
- Alle Daten, Signale und Ergebnisse sind vollständig erfunden.
- Ziel: Demonstrieren, wie man ein strukturiertes GitHub-Notebook aufbauen kann.

---
