# √úbung Interaktive Datenvisualisierung 

22.11.2025

Wir √ºben interaktive Datenvisualisierung mit **Plotly Express** anhand des Gapminder-Datensatzes
und stellen diese den statischen Visualisierungen mit **plotnine** (Grammar of Graphics) gegen√ºber.

Im Fokus steht das Informationsvisualisierungs-Mantra von Ben Shneiderman:

> *Overview first, zoom and filter, then details-on-demand*

---

## Lernziele

Nach der Bearbeitung dieser √úbung solltest du:

1. interaktive Scatterplots und Histogramme mit **Plotly Express** erstellen k√∂nnen,
2. Animationen, Achsentransformationen (z.‚ÄØB. log-Skala) und einfache Interaktionsmechanismen wie Dropdown-Men√ºs (updatemenus) einsetzen k√∂nnen,
3. statische Grafiken mit **plotnine** im Sinne der *Grammar of Graphics* erzeugen und mit interaktiven Plotly-Grafiken vergleichen k√∂nnen,
4. das Mantra *‚ÄûOverview first, zoom and filter, then details-on-demand‚Äú* auf konkrete Visualisierungen anwenden und kritisch reflektieren k√∂nnen,
5. deine eigenen Interpretationen und Einsichten zu den Visualisierungen formulieren k√∂nnen.

Dont worry, √úbung macht den Meister! Viel Erfolg!  üöÄ

## Vorbereitung

F√ºhre die folgende Zelle aus, um die ben√∂tigten Pakete zu importieren und den Gapminder-Datensatz zu laden.


In [None]:
# Optional
#%pip install plotly pandas gapminder

In [None]:
import plotly.express as px
import plotly.graph_objects as go
import pandas as pd

### Daten laden aus gapminder

In [None]:
# Gapminder-Daten laden
df = px.data.gapminder()

In [None]:
# Kurzer Blick auf die Daten
df.info()


df.head()

In [None]:
df.describe().T

### Datenfilter auf Jahr 2007 f√ºr sp√§tere √úbungen

In [None]:
df_2007 = df[df["year"] == 2007]

---
## √úbung 1: Univariate Verteilung ‚Äì Histogramm mit *plotnine* und Plotly

### Ziel

Untersuche die **Verteilung der Lebenserwartung** (`lifeExp`) im Jahr 2007 mit:

1. einem statischen Histogramm in **plotnine** (Grammar of Graphics),
2. einem interaktiven Histogramm in **Plotly Express**.

Reflektiere dabei die Unterschiede zwischen einer statischen Grammar-of-Graphics-Syntax und einer interaktiven Plotly-Variante.


### Vorbereitung: plotnine importieren

F√ºhre diese Zelle einmal aus, um `plotnine` zu importieren.


In [None]:
from plotnine import ggplot, aes, geom_histogram, labs, theme_minimal

### Hinweis zum Vorgehen

1. Nutze erneut `df_2007 = df[df["year"] == 2007]`.
2. Erzeuge ein Histogramm der Variable `lifeExp`:
   - **plotnine**: `ggplot(df_2007, aes(x="lifeExp")) + geom_histogram(...)`  
   - **Plotly**: `px.histogram(df_2007, x="lifeExp", ...)`
3. Vergleiche Achsenbeschriftungen, Titel und die M√∂glichkeiten zur Interaktivit√§t (Zoom, Hover) zwischen beiden Varianten.


### Code mit plotnine

In [None]:
# Code

### Code mit Plotly Express

In [None]:
# Code

### Interpretation (eigene Notizen)

- Welche Form hat die Verteilung der Lebenserwartung im Jahr 2007 (symmetrisch, schief, multimodal)?
- Wie unterscheiden sich das **statische** plotnine-Histogramm und das **interaktive** Plotly-Histogramm in ihrer Nutzung? Was ist der Mehrwert der Interaktivit√§t (siehe Bins)?
- Wann w√ºrdest du welches Werkzeug f√ºr deine eigene Arbeit bevorzugen?

*(Schreibe hier deine Gedanken auf.)*

---
## √úbung 2: Bivariate Beziehung ‚Äì Bubble Chart mit *plotnine* und Plotly

### Ziel

Untersuche die Beziehung zwischen **BIP pro Kopf** (`gdpPercap`) und **Lebenserwartung** (`lifeExp`) im Jahr 2007,
wobei die **Bev√∂lkerung** (`pop`) √ºber die Punktgr√∂√üe (Bubble) kodiert wird und der Kontinent √ºber die Farbe.

Erstelle dazu:

1. einen Bubble Chart mit **plotnine** (statisch),
2. einen Bubble Chart mit **Plotly Express** (interaktiv).


### Hinweis zum Vorgehen

1. Verwende erneut `df_2007` als Datengrundlage.
2. Setze im Scatterplot:
   - x-Achse: `gdpPercap` (ggf. log-Skala),
   - y-Achse: `lifeExp`,
   - Punktgr√∂√üe: `pop`,
   - Farbe: `continent`.
3. **plotnine**:
   - `geom_point(aes(size="pop", color="continent"), alpha=0.7)`,
   - ggf. `scale_x_log10()` f√ºr log-Skala,
   - `scale_size_continuous` zum Anpassen der Punktgr√∂√üen.
4. **Plotly**:
   - `px.scatter` mit `size="pop"`, `color="continent"`, `log_x=True`,
   - `hover_name="country"` f√ºr Details-on-demand.


### Code mit plotnine

In [None]:
from plotnine import (
    ggplot,
    aes,
    geom_point,
    labs,
    theme_minimal,
    scale_x_log10,
    scale_size
)

In [None]:
# Plotnine code

### Code mit Plotly Express

In [None]:
# Plotly code

### Interpretation (eigene Notizen)

- Welche Beziehung erkennst du zwischen BIP pro Kopf und Lebenserwartung im Jahr 2007?
- Welche zus√§tzlichen Informationen liefert die Kodierung √ºber **Punktgr√∂√üe** (Bev√∂lkerung) und **Farbe** (Kontinent)?
- Wie unterst√ºtzen Interaktionen (Zoom, Hover, Auswahl) in Plotly das Verst√§ndnis im Vergleich zur statischen plotnine-Grafik?
- In welchem Kontext w√ºrdest du eine solche bivariate Bubble-Grafik einsetzen?

*(Schreibe hier deine Gedanken auf.)*

---
## √úbung 3: Vom Kontinent-√úberblick zu L√§nder-Details (Dropdown)

### Ziel

Erstelle einen interaktiven Scatterplot f√ºr **ein ausgew√§hltes Jahr** (z.‚ÄØB. 2007), der mithilfe eines **Dropdown-Men√ºs**
zwischen folgenden Ansichten umschalten kann:

- **Alle Kontinente** (globaler √úberblick),
- **Einzelner Kontinent** (gefilterte Detailansicht).

Auch hier soll das Mantra sichtbar werden:

- **Overview first:** Ansicht ‚ÄûAlle Kontinente‚Äú,
- **zoom and filter:** Auswahl eines Kontinents √ºber das Dropdown, zus√§tzlich Zoom/Pan,
- **details-on-demand:** Hover-Infos zu einzelnen L√§ndern.


### Hinweis zum Vorgehen

1. Filtere den Datensatz auf ein Jahr, z.‚ÄØB. `year = 2007`.
2. Erzeuge mit `px.scatter` einen Plot f√ºr alle Kontinente.
3. Erzeuge mit `fig.update_layout(updatemenus=[...])` ein Dropdown-Men√º, das:
   - in der ersten Option **alle Kontinente** sichtbar macht,
   - in weiteren Optionen jeweils nur **einen Kontinent** anzeigt.
4. Nutze `hover_data`, um zus√§tzliche Informationen wie `pop` und `year` einzublenden.


### Code

In [None]:
# Code

### Interpretation (eigene Notizen)

- **Overview first:** Wie unterst√ºtzt die Dropdown-Ansicht ‚ÄûAlle Kontinente‚Äú den √úberblick?
- **Zoom and filter:** Wie ver√§ndert sich dein Blick auf die Daten, wenn du einzelne Kontinente ausw√§hlst?
- **Details-on-demand:** Welche Rolle spielen die Hover-Infos in der gefilterten Ansicht?
- Reflektiere, ob diese Art der Interaktion die Daten *verst√§ndlicher* oder vielleicht auch *komplexer* macht.

*(Schreibe hier in Markdown deine Gedanken auf.)*

---
## √úbung 4: Zeitliche Entwicklung mit Slider und Buttons (Linienchart)

### Ziel

Untersuche die **durchschnittliche Lebenserwartung nach Kontinent √ºber die Zeit**.
Erstelle dazu ein **interaktives Liniendiagramm** mit:

- einem **Slider auf der X-Achse (Year Range Slider)**, um den sichtbaren Zeitraum zu ver√§ndern,
- Buttons, mit denen du schnell auf
  - die **letzten 10 Jahre**,
  - die **letzten 20 Jahre**,
  - **alle Jahre**
  springen kannst.

√úberlege, wie hier das Mantra sichtbar wird:

- **Overview first:** Alle Jahre im √úberblick,
- **zoom and filter:** Fokus auf die letzten 10/20 Jahre oder ein manuell eingestellter Ausschnitt,
- **details-on-demand:** ggf. Hover-Infos zu einzelnen Linienpunkten.


### Hinweis zum Vorgehen

1. Aggregiere die Daten nach Jahr und Kontinent, z. B. mit `groupby` und `mean` auf `lifeExp`.
2. Erzeuge ein Liniendiagramm mit `px.line`, wobei
   - `x="year"`,
   - `y="lifeExp"`,
   - `color="continent"`,
   - `markers=True`
   gesetzt werden.
3. Aktiviere einen Range-Slider auf der X-Achse √ºber `fig.update_xaxes(rangeslider=dict(visible=True))`.
4. F√ºge Buttons (`updatemenus`) hinzu, die die X-Achsen-Range so setzen, dass
   - alle Jahre,
   - die letzten 20 Jahre,
   - die letzten 10 Jahre
   sichtbar sind.


### Code

In [None]:
# Code

### Interpretation (eigene Notizen)

- **Overview first:** Wie hilft dir die Standardansicht (alle Jahre) beim Verst√§ndnis der langfristigen Entwicklung?
- **Zoom and filter:** Welche neuen Einsichten erh√§ltst du, wenn du √ºber Range-Slider oder Buttons auf die letzten 10 bzw. 20 Jahre gehst?
- **Details-on-demand:** Welche zus√§tzlichen Informationen erh√§ltst du durch Hover-Infos oder durch das Fokussieren auf einzelne Kontinente?

*(Schreibe hier in Markdown deine Gedanken auf.)*

---
## √úbung 5: Vergleich mehrerer L√§nder im Zeitverlauf mit ausw√§hlbarer Kennzahl

### Ziel

Untersuche die Entwicklung wichtiger Indikatoren f√ºr mehrere L√§nder √ºber die Zeit.
Nutze dazu einen interaktiven Linienschart, in dem du

- √ºber die **Legende** L√§nder ein- und ausblendest,
- √ºber ein **Dropdown-Men√º** zwischen verschiedenen Kennzahlen wechselst (z. B. Lebenserwartung, BIP pro Kopf, Bev√∂lkerung),
- √ºber **Range-Selector-Buttons** und einen **Range-Slider** am unteren Rand den betrachteten Zeitraum steuerst.

Reflektiere dabei erneut das Mantra:

- **Overview first:** Viele L√§nder und alle Jahre sichtbar,
- **zoom and filter:** Fokussierung auf wenige L√§nder und bestimmte Zeitfenster,
- **details-on-demand:** Details pro Land/Jahr √ºber Hover.


### Hinweis zum Vorgehen

1. Verwende den bereits vorbereiteten `gapminder`-Datensatz und erg√§nze eine Datumsspalte (`year_date`).
2. Erzeuge f√ºr jedes Land:
   - eine eigene `x`-Zeitreihe (Jahre als Datum),
   - f√ºr jede Kennzahl (`lifeExp`, `gdpPercap`, `pop`) die entsprechende `y`-Zeitreihe.
3. Lege ein **Dictionary** `metrics` an, das die Spaltennamen (`lifeExp`, `gdpPercap`, `pop`) auf lesbare Achsentitel abbildet.
4. Erstelle mit `go.Figure()` einen **Trace pro Land** und blende zun√§chst nur einige L√§nder (z. B. Deutschland und √ñsterreich) sichtbar ein; die anderen sollen √ºber die Legende aktivierbar sein.
5. Baue ein **Dropdown-Men√º** (`updatemenus`), mit dem du zwischen den Kennzahlen wechseln kannst (die `y`-Daten aller Traces werden entsprechend umgeschaltet).
6. Erg√§nze am `xaxis` einen **Range-Selector** (z. B. ‚Äûletzte 20 Jahre‚Äú, ‚Äûalle‚Äú) sowie einen **Range-Slider**.


In [None]:
# Code

### Interpretation (eigene Notizen)

- **Overview first:** Wie unterst√ºtzt diese Visualisierung den √úberblick √ºber die Entwicklung vieler L√§nder gleichzeitig?
- **Zoom and filter:**
  - Wie nutzt du den Range-Selector (‚Äûletzte 20 Jahre‚Äú, ‚Äûalle‚Äú) und den Range-Slider?
  - Wie ver√§ndert sich dein Verst√§ndnis, wenn du nur einige L√§nder in der Legende aktiv l√§sst?
- **Details-on-demand:** Welche zus√§tzlichen Einsichten erh√§ltst du √ºber Hover-Infos und den Wechsel der Kennzahl (Lebenserwartung, BIP pro Kopf, Bev√∂lkerung)?
- In welchen praktischen Kontexten (z. B. Journalismus, Policy, Unternehmensreports) w√§re eine solche Visualisierung sinnvoll?

*(Schreibe hier deine Gedanken auf.)*


#### Bonus Deutschalnd und Nigeria vergleichen. Nigeria hat 1987 bei der Bev√∂lkerung Deutschland erstmalig √ºberholt. 

Aufgabe: F√ºge eine Annotation in das Linienchart ein, die auf den Zeitpunkt hinweist, an dem Nigeria Deutschland bei der Bev√∂lkerungszahl √ºberholt hat (1987). Nutze dazu `fig.add_annotation(...)` und positioniere die Annotation passend.

In [None]:
# Code

---
## √úbung 6: Zwei verkn√ºpfte Grafiken mit gemeinsamem Filter (vereinfachtes Brushing & Linking)

### Ziel

Erstelle zwei **verkn√ºpfte Visualisierungen** f√ºr das Jahr 2007:

1. Links: ein Scatterplot **BIP pro Kopf vs. Lebenserwartung** (Punkte = L√§nder),
2. Rechts: ein Histogramm der **Lebenserwartung**.

Beide Grafiken sollen √ºber einen **gemeinsamen Filter (Dropdown)** gesteuert werden:

- Auswahl ‚ÄûAlle Kontinente‚Äú zeigt alle L√§nder,
- Auswahl eines Kontinents filtert **beide** Grafiken auf diesen Kontinent.

Damit setzt du eine einfache Form von *Brushing & Linking* um: Eine **Filterinteraktion** wirkt gleichzeitig auf mehrere Ansichten (koordinierte Filterung).


### Hinweis zum Vorgehen

1. Filtere den Gapminder-Datensatz auf das Jahr 2007: `df_2007 = df[df["year"] == 2007]`.
2. Verwende `make_subplots`, um zwei Plots nebeneinander darzustellen:
   - links: `go.Scatter` (x = `gdpPercap`, y = `lifeExp`),
   - rechts: `go.Histogram` (x = `lifeExp`).
3. Lege ein Dictionary oder eine Liste mit DataFrames pro Filterwert an, z. B.:
   - `"Alle Kontinente"` ‚Üí kompletter Datensatz,
   - `"Africa"`, `"Americas"`, ‚Ä¶ ‚Üí gefilterte DataFrames.
4. Erzeuge ein `updatemenus`-Dropdown, das:
   - f√ºr jeden Kontinent die `x`-/`y`-Daten des Scatterplots aktualisiert,
   - gleichzeitig die `x`-Daten des Histogramms aktualisiert.
5. Achte darauf, dass die `x`-/`y`-Listen in `args[0]` zur **Reihenfolge der Traces** passen.


In [None]:
# Code

### Interpretation (eigene Notizen)

- **Overview first:** Welche Informationen erh√§ltst du, wenn ‚ÄûAlle Kontinente‚Äú ausgew√§hlt sind und beide Charts gleichzeitig sichtbar sind?
- **Zoom and filter:** Was √§ndert sich, wenn du den Filter nacheinander auf einzelne Kontinente setzt?
  - Welche Muster werden im Scatterplot deutlicher?
  - Wie ver√§ndert sich die Verteilung der Lebenserwartung im Histogramm?
- **Details-on-demand:** Welche zus√§tzlichen Einsichten bekommst du durch Hover-Infos im Scatterplot?
- Wo w√ºrdest du in deinen eigenen Projekten zwei oder mehr Visualisierungen durch einen gemeinsamen Filter verkn√ºpfen wollen?

*(Schreibe hier deine Gedanken auf.)*


---
## √úbung 7: Anteile der Kontinente an der Weltbev√∂lkerung ‚Äì Treemap, Pie & Donut

### Ziel

Stelle die **Anteile der Kontinente an der Weltbev√∂lkerung** f√ºr ein ausgew√§hltes Jahr (z. B. 2007) dar und vergleiche drei unterschiedliche Diagrammtypen:

1. **Treemap**
2. **Kuchendiagramm (Pie Chart)**
3. **Donut Chart**

Im Hover sollen zus√§tzlich die **absoluten Bev√∂lkerungszahlen** *und* die **prozentualen Anteile** angezeigt werden ‚Äì auch **in der Treemap**.

Erstelle eine interaktive Visualisierung, in der du √ºber **Buttons** zwischen den drei Diagrammtypen umschalten kannst. Reflektiere, wie sich die Wahrnehmung der Anteile je nach Diagrammtyp ver√§ndert.


### Hinweis zum Vorgehen

1. W√§hle ein Jahr, z. B. `year = 2007`, und filtere den Datensatz:  
   `df_2007 = df[df["year"] == 2007]`.
2. Aggregiere die Bev√∂lkerung nach Kontinent:  
   `df_agg = df_2007.groupby("continent", as_index=False)["pop"].sum()`.
3. Erzeuge mit `go.Figure()` drei Traces:
   - `go.Treemap` (Labels = Kontinente, Values = Bev√∂lkerung),
   - `go.Pie` mit `hole=0` (klassisches Pie Chart),
   - `go.Pie` mit `hole=0.5` (Donut Chart).
4. Setze zun√§chst **nur die Treemap** auf `visible=True`, die anderen auf `visible=False`.
5. F√ºge ein `updatemenus` mit `type="buttons"` hinzu, das:
   - die `visible`-Einstellung der drei Traces steuert,
   - den Titel der Grafik passend zum Diagrammtyp setzt.


In [None]:
# Code

### Interpretation (eigene Notizen)

- Wie wirken die **Anteile der Kontinente** in der Treemap im Vergleich zu Pie und Donut?
- In welchem Diagramm erkennst du kleine Anteile (z. B. Ozeanien) am besten?
- Wie unterst√ºtzt die Prozentanzeige im Hover dein Verst√§ndnis?
- F√ºr welche Zielgruppe w√§re welcher Diagrammtyp am geeignetsten?
  - Forschende
  - Journalismus
  - Management / KPI-Dashboards

*(Schreibe hier deine Gedanken auf.)*


### Bonusaufgabe Bev√∂lkerungsanteile der L√§nder in Europa (nach gleichem Muster wie √úbung 7)

Erstelle eine √§hnliche interaktive Visualisierung wie in √úbung 7, aber diesmal f√ºr die **Bev√∂lkerungsanteile der L√§nder in Europa** im Jahr 2007. Nutze ebenfalls die drei Diagrammtypen: Treemap, Pie Chart und Donut Chart, und erm√∂gliche das Umschalten √ºber Buttons. Achte darauf, dass im Hover sowohl die absoluten Bev√∂lkerungszahlen als auch die prozentualen Anteile angezeigt werden.

In [None]:
# Code

### Interpretation (eigene Notizen)

- Welche L√§nder dominieren die europ√§ische Bev√∂lkerung, und wie klar wird das in den drei Diagrammtypen sichtbar?
- Wie gut kannst du kleinere L√§nder in Treemap vs. Pie vs. Donut erkennen?
- Welcher Diagrammtyp unterst√ºtzt deinen Vergleich von L√§ndern am besten ‚Äì und warum?
- Welche Rolle spielt der Hover mit absoluten Zahlen und Prozentanteilen f√ºr dein Verst√§ndnis?

*(Schreibe hier deine Gedanken auf.)*


---
## Abschlussreflexion

- Wo siehst du Grenzen des Mantras ‚ÄûOverview first, zoom and filter, then details-on-demand‚Äú?
- Fallen dir Beispiele ein, in denen eine andere Dramaturgie (z.‚ÄØB. direkt mit Details beginnen) sinnvoller w√§re?
- F√ºr welche Personas w√§ren solche interaktiven Visualisierungen besonders n√ºtzlich?
- Wie w√ºrdest du √§hnliche Interaktionen in deinem eigenen Projekt / deiner Dom√§ne einsetzen?

*(Schreibe hier deine Gedanken auf.)*
