# Verbindungsmethoden von SQL-Daten mit Power BI

In dieser Lektion vertiefen wir unser Wissen darüber, wie Power BI sich mit SQL-Datenbanken (z. B. Azure SQL) verbindet. Es gibt grundsätzlich drei Methoden, die sich in der Art des Datenzugriffs unterscheiden: **Import**, **DirectQuery** und **Dual**. Jede Methode hat spezifische Einsatzgebiete, Vor- und Nachteile. Im Folgenden wird ausführlich erklärt, was diese Methoden sind, wann und warum sie eingesetzt werden sollten, wie sie implementiert werden und welche Besonderheiten zu beachten sind.

---

## 1. Import

### Was ist die Import-Methode?
Beim **Import** verbindet sich Power BI mit der SQL-Datenbank und erstellt eine lokale Kopie der ausgewählten Datensätze. Das importierte Datenmodell wird in Power BI gespeichert und kann ohne ständige Verbindung zur Originaldatenbank transformiert, berechnet und visualisiert werden.

### Wann und warum wird Import verwendet?
- **Wann?**
  - Für Szenarien, in denen sich die Daten nicht in Echtzeit ändern müssen.
  - Bei Daten, die sich häufig transformieren oder umfangreich bearbeitet werden sollen.
  - Wenn eine stabile, wiederholbare Analyse notwendig ist und eine regelmäßige Aktualisierung (z. B. per geplanten Refresh) ausreicht.
- **Warum?**
  - **Leistung & Flexibilität:** Lokale Datenmodelle erlauben schnelle Transformationen und Berechnungen, da keine laufenden Datenbankabfragen notwendig sind.
  - **Offline-Verfügbarkeit:** Nach dem Import können Berichte und Dashboards auch ohne aktive Verbindung zur Datenquelle genutzt werden.
  - **Unabhängigkeit:** Die Daten stehen lokal zur Verfügung, wodurch temporäre Netzwerkprobleme oder langsame Datenbankverbindungen keine unmittelbare Auswirkung haben.

### Wie funktioniert der Import?
1. **Verbindung aufbauen:**  
   In Power BI Desktop wählt man über **Get Data > SQL-Datenbank** die Option, sich mit der Datenbank zu verbinden.
2. **Daten auswählen:**  
   In der daraufhin erscheinenden Liste werden die gewünschten Tabellen oder Abfragen ausgewählt.
3. **Importprozess:**  
   Power BI importiert die Daten und speichert sie im internen Datenmodell.
4. **Transformation & Visualisierung:**  
   Über den Power Query Editor können die Daten weiter bereinigt und transformiert werden. Anschließend werden die Daten in Berichten visualisiert.

### Vorteile der Import-Methode
- **Hohe Verarbeitungsgeschwindigkeit:** Lokale Daten ermöglichen schnelle Abfragen und Berechnungen.
- **Erweiterte Transformationsmöglichkeiten:** Komplexe Berechnungen und Datenbereinigungen können lokal durchgeführt werden.
- **Unabhängigkeit vom Internet:** Nach dem Import ist keine ständige Verbindung zur Datenbank nötig.

### Nachteile der Import-Methode
- **Begrenzter Arbeitsspeicher:** Bei sehr großen Datenmengen kann die Leistung beeinträchtigt werden oder es kann zu Speicherengpässen kommen.
- **Datenaktualität:** Die Daten sind nur so aktuell wie der letzte Import, wodurch Echtzeit-Informationen nicht möglich sind.
- **Sicherheitsrisiken:** Sensible Daten werden lokal gespeichert, was in bestimmten Umgebungen unerwünscht sein kann.

### Beispiel-Szenario (Import)
Ein Vertriebsreport, der monatliche Verkaufszahlen darstellt, nutzt die Import-Methode. Die Daten aus der SQL-Datenbank werden einmalig importiert, in Power Query bereinigt und transformiert. Da sich die Verkaufszahlen innerhalb eines Monats kaum ändern, genügt eine regelmäßige Aktualisierung (z. B. wöchentlich) – dies ermöglicht umfangreiche Berechnungen, Aggregationen und Visualisierungen, ohne eine dauerhafte Datenbankabfrage.

---

## 2. DirectQuery

### Was ist DirectQuery?
**DirectQuery** ermöglicht es Power BI, auf Daten zuzugreifen, ohne diese lokal zu speichern. Stattdessen werden die Abfragen in Echtzeit direkt an die SQL-Datenbank weitergeleitet, sodass immer die aktuellsten Daten verwendet werden.

### Wann und warum wird DirectQuery verwendet?
- **Wann?**
  - Wenn es notwendig ist, stets mit den aktuellsten Daten zu arbeiten.
  - Bei sehr großen Datenmengen, bei denen eine lokale Kopie ineffizient wäre.
  - Für Dashboards und Berichte, die Echtzeit-Überwachung erfordern.
- **Warum?**
  - **Echtzeit-Daten:** Alle Änderungen in der Datenbank werden sofort im Bericht sichtbar.
  - **Ressourceneffizienz:** Da keine vollständige lokale Kopie erstellt wird, wird der lokale Arbeitsspeicher entlastet.
  - **Zentrale Datenpflege:** Alle Datenänderungen erfolgen an der Quelle, wodurch eine einheitliche und konsistente Datenbasis gewährleistet wird.

### Wie funktioniert DirectQuery?
1. **Verbindung aufbauen:**  
   Wählt über **Get Data > SQL-Datenbank** die DirectQuery-Option anstelle des Imports.
2. **Definition der Abfragen:**  
   Die Abfragen werden so konfiguriert, dass sie bei jedem Laden oder Aktualisieren eines Visuals direkt an die SQL-Datenbank gesendet werden.
3. **Echtzeitvisualisierung:**  
   Da jede Abfrage in Echtzeit erfolgt, zeigt das Dashboard immer die aktuellsten Daten an.

### Vorteile von DirectQuery
- **Aktualität:** Direkter Zugriff auf aktuelle Daten, ideal für Echtzeit-Dashboards.
- **Effiziente Verarbeitung großer Datenmengen:** Es wird keine vollständige Kopie im lokalen Modell erstellt.
- **Zentralisierte Datenverwaltung:** Alle Änderungen werden in der Datenbank vorgenommen, was Konsistenz sicherstellt.

### Nachteile von DirectQuery
- **Abhängigkeit von der Netzwerkverbindung:** Eine stabile und schnelle Internet- bzw. Datenbankverbindung ist unabdingbar.
- **Leistungseinbußen:** Komplexe Abfragen können zu längeren Ladezeiten führen, da die Datenbank die Abfragen in Echtzeit verarbeiten muss.
- **Eingeschränkte Transformationsmöglichkeiten:** Da die Daten nicht lokal vorliegen, können manche Transformationen in Power BI limitiert sein.

### Beispiel-Szenario (DirectQuery)
Ein Produktions-Dashboard, das den Echtzeit-Status von Maschinen in einer Fabrik anzeigt, verwendet DirectQuery. Jede Statusänderung in der Produktionsdatenbank wird sofort im Dashboard reflektiert, sodass Führungskräfte umgehend reagieren können. Hier ist es entscheidend, dass keine Verzögerung entsteht und immer aktuelle Daten vorliegen.

---

## 3. Dual-Modus

### Was ist der Dual-Modus?
Der **Dual-Modus** kombiniert die Vorteile von Import und DirectQuery. Dabei werden bestimmte Tabellen oder Felder als lokale Kopie importiert (z. B. statische Dimensionstabellen), während andere Daten (z. B. Faktentabellen) per DirectQuery abgefragt werden.

### Wann und warum wird der Dual-Modus eingesetzt?
- **Wann?**
  - Wenn manche Daten relativ statisch sind, während andere häufig aktualisiert werden.
  - Bei hybriden Szenarien, in denen sowohl schnelle lokale Berechnungen als auch Echtzeit-Datenabfragen erforderlich sind.
- **Warum?**
  - **Flexibilität:** Ermöglicht es, das Datenmodell optimal an die jeweiligen Anforderungen anzupassen.
  - **Optimierung:** Statische Daten können für schnelle Analysen lokal verarbeitet werden, während dynamische Daten in Echtzeit abgerufen werden.
  - **Best-of-Both-Worlds:** Kombiniert die Vorteile beider Methoden, um sowohl Leistung als auch Aktualität sicherzustellen.

### Wie funktioniert der Dual-Modus?
1. **Modellierung:**  
   Beim Erstellen des Datenmodells in Power BI wird für einzelne Tabellen festgelegt, ob sie als Import oder als DirectQuery geladen werden sollen.
2. **Beziehung herstellen:**  
   Es müssen konsistente Beziehungen zwischen den importierten Daten und den per DirectQuery abgerufenen Daten definiert werden.
3. **Synchronisation:**  
   Durch sorgfältige Modellierung wird sichergestellt, dass beide Datenzugriffsarten nahtlos zusammenarbeiten und konsistente Ergebnisse liefern.

### Vorteile des Dual-Modus
- **Flexibilität in der Datenmodellierung:** Ermöglicht die Nutzung beider Methoden innerhalb eines einzigen Berichts.
- **Optimierte Performance:** Statische Daten werden lokal verarbeitet, während dynamische Daten in Echtzeit abgerufen werden.
- **Erweiterte Analysefunktionen:** Bietet die Möglichkeit, umfangreiche Transformationen auf lokal gespeicherte Daten anzuwenden und gleichzeitig stets aktuelle Daten zu nutzen.

### Nachteile des Dual-Modus
- **Komplexität:** Das Erstellen und Warten eines Dual-Modus-Modells erfordert ein tiefgehendes Verständnis der Datenquellen und deren Zusammenhänge.
- **Synchronisationsprobleme:** Mögliche Herausforderungen bei der Abstimmung zwischen importierten und DirectQuery-Daten.
- **Modellmanagement:** Fehlerhafte Konfigurationen können zu Inkonsistenzen oder Leistungsproblemen führen.

### Beispiel-Szenario (Dual)
Ein Finanzreport kann den Dual-Modus nutzen, um historische Finanzdaten und statische Dimensionen (wie Kunden- oder Produktinformationen) lokal zu speichern, während aktuelle Transaktionsdaten per DirectQuery abgerufen werden. Dies ermöglicht einerseits die Durchführung komplexer Analysen und Berechnungen auf den historischen Daten und andererseits die Anzeige stets aktueller Transaktionsdaten.

---

# Wann benutze ich welche Methode?

### Query Performance
- **Import:** Bei langsamen Datenbanken überwiegt die Möglichkeit, die Daten lokal zu speichern und komplexe Transformationen ohne wiederholte Abfragen durchzuführen.
- **DirectQuery:** Wenn die Datenbank sehr leistungsfähig ist und schnelle Abfragen in Echtzeit ermöglicht.

### Große Datenmengen
- **DirectQuery:** Bei sehr großen Datenmengen sollte DirectQuery bevorzugt werden, da der lokale Arbeitsspeicher beim Import überlastet werden könnte. Außerdem können bei Importen Timeout-Fehler auftreten, wenn die Datenmenge zu groß wird.

### Datenaktualisierung
- **DirectQuery:** Bietet aufgrund der Echtzeit-Abfrage eine optimale Lösung, um immer die aktuellste Version der Daten zu erhalten.
- **Import:** Ist geeignet, wenn Datenaktualisierungen in regelmäßigen, geplanten Intervallen erfolgen können.

### Achtung
- **Standardoption:** Die Standardoption in Power BI ist der Import.  
- **Flat Files:** Dateien wie Excel oder CSV können nur über den Import eingebunden werden, da DirectQuery für diese Quellen nicht unterstützt wird.

---

# Übungen

1. **Modellansicht und Speichermodus überprüfen:**  
   - Öffne Power BI Desktop und wechsle in die Modellansicht.  
   - Suche nach den Tabellen „SalesLT Product“ und „SalesLT ProductCategory“.  
   - Beobachte die Verbindungen zwischen den Tabellen (Linien), die auf definierte Beziehungen hinweisen.
   - Klicke auf eine der Tabellen und öffne im rechten Bereich unter „Eigenschaften“ den Abschnitt **Erweitert**.  
   - Überprüfe, dass als **Speichermodus** standardmäßig „Import“ ausgewählt ist.  
   - Versuche, den Speichermodus zu ändern: Beachte, dass von DirectQuery zu Import gewechselt werden kann, aber der Wechsel in die andere Richtung (Import zu DirectQuery) nur bei neuen Verbindungen möglich ist.

2. **DirectQuery Demonstration:**  
   - Klicke auf **Get Data** und verbinde dich mit einem SQL Server.  
   - Wähle beispielsweise die Tabelle „SalesLT Address“ aus.  
   - Beim Laden wähle die Option **DirectQuery** anstelle von Import.  
   - Gehe in die Modellansicht und stelle fest, dass der Header der neuen Tabelle (z. B. durch eine blaue Linie) anzeigt, dass DirectQuery verwendet wird.  
   - Öffne die Eigenschaften der Tabelle und bestätige, dass als Speichermodus „DirectQuery“ angegeben ist.  
   - Versuche, den Speichermodus auf Import zu wechseln, sofern dies möglich ist, und beobachte die Veränderungen im Datenmodell.

