# Große Datensätze für Deep Learning

Große Datensätze sind ein zentraler Bestandteil der Entwicklung und Verbesserung von Deep-Learning-Modellen, insbesondere für Computer Vision (Bildverarbeitung). Hier sind einige wichtige Gründe, warum große Datensätze entscheidend sind:

* __Bessere Generalisierung__: Ein großes und vielfältiges Datenset hilft einem Modell, allgemeine Muster zu lernen, anstatt sich auf spezifische Trainingsdaten zu überanpassen (Overfitting).
* ___Ermöglicht tiefere Netzwerke__: Komplexe neuronale Netzwerke mit Millionen von Parametern benötigen viele Beispiele, um effektiv zu lernen und nicht nur zu memorisieren.
* __Verbesserte Robustheit__: Große Datensätze mit Variationen in Beleuchtung, Perspektive und Hintergrund machen das Modell robuster gegenüber unbekannten Daten.
* __Förderung des Transfer Learning__: Große Datensätze werden oft genutzt, um vorgefertigte Modelle (Pretrained Models) zu trainieren, die dann für andere spezifische Aufgaben weiterverwendet werden können.
* __Benchmarking und Vergleichbarkeit__: Standardisierte große Datensätze ermöglichen es Forschern, unterschiedliche Modelle direkt miteinander zu vergleichen, indem sie dieselben Testsets nutzen.

## Bekannte Bilddatensätze für Deep Learning

#### MNIST (Modified National Institute of Standards and Technology)



* Typ: Handgeschriebene Ziffern (0-9)
* Größe: 70.000 Bilder (60.000 Training, 10.000 Test)
* Auflösung: 28×28 Pixel, Graustufen
* Verwendung: Einsteiger-Datensatz für Mustererkennung, oft für Convolutional Neural Networks (CNNs)

#### CIFAR-10 (Canadian Institute for Advanced Research)

* Typ: Farbbilder aus 10 Kategorien (z. B. Autos, Hunde, Flugzeuge)
* Größe: 60.000 Bilder (50.000 Training, 10.000 Test)
* Auflösung: 32×32 Pixel, RGB
* Verwendung: Klassifikation kleiner Objekte, oft für CNN-Experimente

#### CIFAR-100 (Canadian Institute for Advanced Research)

* Typ: Ähnlich wie CIFAR-10, aber mit 100 Klassen
* Größe: 60.000 Bilder
* Auflösung: 32×32 Pixel, RGB
* Verwendung: Komplexere Klassifikationsaufgaben

#### ImageNet

* Typ: Hochauflösende Bilder aus 1.000 Klassen
* Größe: Über 14 Millionen Bilder
* Auflösung: Unterschiedlich, meist hochauflösend
* Verwendung: Wichtigster Benchmark für Deep Learning in der Bildverarbeitung, Grundlage für viele Pretrained-Modelle (z. B. ResNet, VGG, EfficientNet)
* Link: [ImageNet](https://www.image-net.org/)

#### COCO (Common Objects in Context)

* Typ: Bilder mit mehreren Objekten in realen Szenarien
* Größe: 330.000 Bilder mit über 1,5 Millionen annotierten Objekten
* Auflösung: Unterschiedlich
* Verwendung: Objekterkennung, Bildsegmentierung und Bildunterschriftengenerierung
* Link: [COCO](https://cocodataset.org/#home)

#### Open Images Datase

* Typ: Bilder mit mehreren Objekten und detaillierten Annotationen
* Größe: 9 Millionen Bilder
* Auflösung: Hochauflösend
* Verwendung: Objekterkennung, Bildbeschreibung und Kontextanalyse

#### Pascal VOC

* Typ: Bilder mit Objekten in 20 Kategorien
* Größe: Ca. 11.000 Bilder
* Auflösung: Unterschiedlich
* Verwendung: Benchmark für Objekterkennung und Segmentierung

#### LFW (Labeled Faces in the Wild)

* Typ: Gesichtserkennungs-Datensatz
* Größe: 13.000 Bilder
* Auflösung: Unterschiedlich
* Verwendung: Gesichtserkennung und Verifikation
* Links: [LFW - Kaggle](https://www.kaggle.com/datasets/jessicali9530/lfw-dataset) und [LFW - Scikit-learn](https://scikit-learn.org/0.19/datasets/labeled_faces.html)

#### CelebA (Celeb Faces Attributes Dataset)

* Typ: Prominenten-Gesichter mit Attribut-Labels (z. B. Brille, Bart, Lächeln)
* Größe: 200.000 Bilder
* Verwendung: Gesichtserkennung und Style-Transfer
* Link: [CelebA](https://mmlab.ie.cuhk.edu.hk/projects/CelebA.html)

### Zusammenfassung

Große Bilddatensätze sind essenziell für das Training leistungsfähiger Deep-Learning-Modelle. Während MNIST und CIFAR-10 für kleine Experimente genutzt werden, dienen ImageNet und COCO als Basis für hochentwickelte neuronale Netzwerke. In spezialisierten Bereichen wie Gesichtserkennung oder Objekterkennung sind Datensätze wie CelebA oder Pascal VOC entscheidend.

### Links


* [WordNet](https://wordnet.princeton.edu/)