# Auswahl geeigneter Datenstrukturen

## mögliche Kriterien

1. abstrakter Datentyp oder Datenstruktur?
2. dynamisch vs. statisch
3. Operationen (notwendig/häufig)
4. Komplexität
5. Kombination

1. ADT vs. DS
  - abstrakter Datentyp (z.B. Liste oder Baum) ergibt sich oft automatisch aus Art der Daten
  - konkrete Datenstruktur (z.B. verkettete Liste) ergibt sich aus weiteren Anforderungen
2. dynamisch vs. statisch
  - veränderliche Daten vs. veränderliche Struktur
  - Datenzuwachs?
3. Operationen
  - daraus ergibt sich meist schon ob statisch oder dynamisch (z.B. Einfügen/Löschen)
  - aber auch Durchlaufen, Suche, Sortierung, Min/Max
  - wesentlich: nur notwendig (z.B. Entfernen) oder auch häufig?
4. Komplexität
  - oft eines der wesentlichen Kriterien
  - entscheidend bei großen Daten und vielen Zugriffen
  - siehe [7 Komplexität](7_Komplexitaet.ipynb) und [8 Operationen auf Datenstrukturen](8_Operationen_auf_Datenstrukturen.ipynb)
5. Kombination
  - z.B. Hashtabelle mit verketteter Liste um Durchlaufen zu ermöglichen

Im Allgemeinen: umso spezifischer/komplexer Anforderungen, desto weniger Wahlmöglichkeiten (Feld ↚→ Baum)

## Vorgehen

- Do you need **random access**?
- Do you perform a lot of **insertions**? How about **deletions**?
- Do you allow **duplicates**?
- Are you **searching** for elements frequently?
- Does your data need to be **ordered**?
- Would you need to **traverse** the elements?
- How **big** is your data?

Quelle: http://dtkachenko.blogspot.com/2011/11/data-structures-and-algorithms-when-to.html

| Anforderung        | statisches Feld | verkettete Liste | Hashtabelle |
|--------------------|-----------------|------------------|-------------|
| wahlfreier Zugriff |                 |                  |             |
| viele Einfügungen  |                 |                  |             |
| viele Löschungen   |                 |                  |             |
| Duplikate          |                 |                  |             |
| häufige Suche      |                 |                  |             |
| Sortierung         |                 |                  |             |
| Durchlaufen        |                 |                  |             |
| Datengröße         |                 |                  |             |

| Anforderung        | statisches Feld | verkettete Liste | Hashtabelle |
|--------------------|-----------------|------------------|-------------------|
| wahlfreier Zugriff | ✅              | ❌               | ✅                |
| viele Einfügungen  | ❌              | ❌               | ✅                |
| viele Löschungen   | ❌              | ❌               | ✅                |
| Duplikate          | ✅              | ✅               | ❌                |
| häufige Suche      | ❌              | ❌               | ✅                |
| Sortierung         | ❌              | ✅               | ❌                |
| Durchlaufen        | ✅              | ✅               | ❌                |
| Datengröße         | ✅              | ❌               | ❌                |

✅ = (effizient) möglich, ❌ = nicht oder nur mit Einschränkungen möglich (z.B. ineffizient)

Fazit: Abhängigkeit von konkreten Anforderungen und [Komplexität](8_Operationen_auf_Datenstrukturen.ipynb)  oft entscheidend

## Anmerkungen zu den ❌

### statisches Feld
- Einfügungen/Löschungen nur im Sinne von Schreiben und Überschreiben
- Suche: binäre Suche langsam
- Sortierung: für statische Daten

### verkettete Liste
- wahlfreier Zugriff: nicht effizient
- Einfügungen/Löschungen: nur schnell am Anfang/Ende
- Suche: binäre Suche langsam
- Datengröße: Overhead durch Pointer, dafür dynamisches Feld besser geeignet

### Hashtabelle
- Duplikate: nur spezielle Implementierungen z.B. durch Liste als Wert
- Suche: meint eher "Lesen" (Suche nach Wert ist ❌)
- Sortierung: nur spezielle Implementierungen z.B. in Kombination mit einer verketteten Liste (dann Effizienz wie bei verketteter Liste!)
- Durchlaufen: nur spezielle Implementierungen z.B. in Kombination mit einer verketteten Liste
- Datengröße: Vergrößerung bei sehr großen Daten langsam

## (Weitere) Quellen

- https://medium.com/build-and-learn/choosing-data-structures-a-guide-for-the-confused-18b5042e750b
- https://web.archive.org/web/20180403090554/http://home.deib.polimi.it/morzenti/Info3/notes.pdf
- http://dtkachenko.blogspot.com/2011/11/data-structures-and-algorithms-when-to.html