# Syllabus

Understand various data storage methods and their appropriate applications.

# Datenspeicherlösungen

Die Art der Datenspeicherlösung ist abhängig von den Anforderungen und der Größe der zu speichernden Daten:

<br>

1. **Relationale Datenbanken (RDBMS)**:
  - speichern Daten in Tabellen mit festen Strukturen
  - Beispiele: MySQL, PostgreSQL, Microsoft SQL Server.

<br>

2. **NoSQL-Datenbanken**: 
- bieten mehr Flexibilität in der Datenstruktur, da sie nicht tabellenbasiert sind
- Beispiele: MongoDB, Cassandra

<br>

3. **Dateibasierte Speicherung**: 
- Dateien werden lokal oder auf Servern gespeichert
- z.B. als CSV, JSON, Excel
- häufig für den Datentransfer verwendet

<br>

4. **Data Warehouses**: 
- spezieller Typ von Datenbank für die Analyse großer Mengen historischer Daten
- speichert strukturierte und aggregierte Daten aus verschiedenen Quellen an einem Ort

<br>

5. **Data Lakes**: 
- Speicher für Rohdaten, meist unstrukturiert oder semistrukturier
- Daten können später für Analysen verwendet werden

<br>

6. **Cloud-Speicher**: 
- externe Speicherlösungen, die über das Internet zugänglich sind
- z.B. Amazon S3, Google Cloud Storage, Microsoft Azure Blob Storage

<br>

**Beispiel**:
- Ein Unternehmen könnte seine täglichen Verkaufsdaten in einer relationalen Datenbank wie MySQL speichern und große Mengen historischer Daten für Analysen in einem Data Warehouse wie Google BigQuery.

---

# Welche Anforderungen beeinflussen die Wahl der Datenspeicherlösung?


1. **Datenmenge (Skalierbarkeit):** 
   - **Anforderung:** Größe und Wachstum der Datenmenge.
   - **Einfluss:** Große unstrukturierte Daten benötigen NoSQL-Datenbanken oder Data Lakes. 
   - **Beispiel:** Unternehmen, das täglich Terabytes an Log-Daten sammelt, nutzt wahrscheinlich NoSQL.

<br>

2. **Zugriffsgeschwindigkeit (Performance):**
   - **Anforderung:** Schnelligkeit der Datenabfrage.
   - **Einfluss:** Systeme für Echtzeitanalysen erfordern hohe Abfragegeschwindigkeit, oft durch Data Warehouses oder In-Memory-Datenbanken.
   - **Beispiel:** E-Commerce benötigt schnelle Datenzugriffe, was relationale oder hochperformante NoSQL-Datenbanken erforderlich macht.

<br>

3. **Datenkomplexität:**
   - **Anforderung:** Komplexität der Datenstrukturen.
   - **Einfluss:** Relationale Datenbanken sind ideal für strukturierte Daten, während NoSQL für unstrukturierte oder semistrukturierte Daten besser geeignet ist.
   - **Beispiel:** Soziale Netzwerke profitieren von Graph-Datenbanken, während einfache Anwendungen RDBMS nutzen.

<br>

4. **Verfügbarkeit und Zuverlässigkeit:**
   - **Anforderung:** Kontinuierliche Datenverfügbarkeit und Datenschutz.
   - **Einfluss:** Anwendungen mit hohen Verfügbarkeitsanforderungen benötigen Cloud-Speicher oder verteilte Datenbanken mit Redundanz.
   - **Beispiel:** Bankensysteme erfordern hochverfügbare Datenbanklösungen wie AWS RDS.

<br>

5. **Flexibilität und Anpassbarkeit:**
   - **Anforderung:** Anpassungsfähigkeit an veränderte Datenanforderungen.
   - **Einfluss:** Flexible Lösungen wie NoSQL oder Data Lakes sind nötig, um unterschiedliche Datenformate zu unterstützen.
   - **Beispiel:** Forschungsinstitute benötigen Data Lakes zur Speicherung variabler Rohdaten.

<br>

6. **Sicherheitsanforderungen:**
   - **Anforderung:** Sicherheits- und Datenschutzanforderungen.
   - **Einfluss:** Hohe Sicherheitsstandards erfordern oft verschlüsselte Speicherlösungen oder Cloud-Dienste mit robusten Sicherheitsmaßnahmen.
   - **Beispiel:** Krankenhäuser verwenden Cloud-Lösungen mit Sicherheitsfeatures wie Verschlüsselung.

<br>

7. **Kosten (Budget):**
   - **Anforderung:** Verfügbares Budget für die Speicherlösung.
   - **Einfluss:** Cloud-Lösungen bieten flexible Kostenmodelle, während lokale Lösungen oft höhere Anfangsinvestitionen erfordern.
   - **Beispiel:** Start-ups wählen häufig Cloud-Speicher aufgrund der geringeren Anfangskosten.

<br>

8. **Compliance und gesetzliche Anforderungen:**
   - **Anforderung:** Einhaltung gesetzlicher Vorschriften und Branchenstandards.
   - **Einfluss:** Speicherlösungen müssen strengen regulatorischen Anforderungen gerecht werden, besonders in sensiblen Branchen.
   - **Beispiel:** Finanzdienstleister benötigen spezialisierte Cloud-Lösungen zur Einhaltung von Vorschriften.

<br><br>


| **Anforderung**            | **Speicherlösung**                                  | **Beispiel**                                                 |
|----------------------------|----------------------------------------------------|--------------------------------------------------------------|
| **Datenmenge**              | Skalierbare Cloud-Speicher, Data Lakes             | AWS S3, Azure Data Lake                                      |
| **Zugriffsgeschwindigkeit** | Relationale Datenbanken, In-Memory-Datenbanken     | MySQL, Redis                                                 |
| **Datenkomplexität**        | NoSQL-Datenbanken, Data Lakes                      | MongoDB, Hadoop                                              |
| **Verfügbarkeit**           | Cloud-Speicher mit hoher Verfügbarkeit             | Google Cloud Storage, Amazon RDS                             |
| **Flexibilität**            | NoSQL-Datenbanken, Data Lakes                      | Cassandra, Azure Data Lake                                   |
| **Sicherheit**              | Cloud-Speicher mit Verschlüsselung und Zugriffskontrollen | Amazon S3, Azure Blob Storage                                |
| **Kosten**                  | Günstige Cloud-Lösungen, Pay-as-you-go             | Google Cloud Storage, AWS S3                                 |
| **Compliance**              | Zertifizierte Cloud-Lösungen                       | AWS GovCloud, Microsoft Azure Government                      |


---