# Übung Interaktive Datenvisualisierung 

Wir üben interaktive Datenvisualisierung mit **Plotly Express** anhand des Gapminder-Datensatzes
und stellen diese den statischen Visualisierungen mit **plotnine** (Grammar of Graphics) gegenüber.

Im Fokus steht das Informationsvisualisierungs-Mantra von Ben Shneiderman:

> *Overview first, zoom and filter, then details-on-demand*

---

## Lernziele

Nach der Bearbeitung dieses Notebooks solltest du:

1. interaktive Scatterplots und Histogramme mit **Plotly Express** erstellen können,
2. Animationen, Achsentransformationen (z. B. log-Skala) und einfache Interaktionsmechanismen wie Dropdown-Menüs (updatemenus) einsetzen können,
3. statische Grafiken mit **plotnine** im Sinne der *Grammar of Graphics* erzeugen und mit interaktiven Plotly-Grafiken vergleichen können,
4. das Mantra *„Overview first, zoom and filter, then details-on-demand“* auf konkrete Visualisierungen anwenden und kritisch reflektieren können,
5. deine eigenen Interpretationen und Einsichten zu den Visualisierungen formulieren können.


## Vorbereitung

Führe die folgende Zelle aus, um die benötigten Pakete zu importieren und den Gapminder-Datensatz zu laden.


In [None]:
# Optional
#%pip install plotly pandas gapminder

In [None]:
import plotly.express as px
import plotly.graph_objects as go
import pandas as pd

# Gapminder-Daten laden
df = px.data.gapminder()

### Daten laden aus gapminder

In [None]:
# Gapminder-Daten laden
df = px.data.gapminder()

In [None]:
# Kurzer Blick auf die Daten
df.info()


df.head()

In [None]:
df.describe().T

### Datenfilter auf Jahr 2007 für spätere Übungen

In [None]:
df_2007 = df[df["year"] == 2007]

---
## Übung 1: Univariate Verteilung – Histogramm mit *plotnine* und Plotly

### Ziel

Untersuche die **Verteilung der Lebenserwartung** (`lifeExp`) im Jahr 2007 mit:

1. einem statischen Histogramm in **plotnine** (Grammar of Graphics),
2. einem interaktiven Histogramm in **Plotly Express**.

Reflektiere dabei die Unterschiede zwischen einer statischen Grammar-of-Graphics-Syntax und einer interaktiven Plotly-Variante.


### Vorbereitung: plotnine importieren

Führe diese Zelle einmal aus, um `plotnine` zu importieren.


In [None]:
from plotnine import ggplot, aes, geom_histogram, labs, theme_minimal

### Hinweis zum Vorgehen

1. Nutze erneut `df_2007 = df[df["year"] == 2007]`.
2. Erzeuge ein Histogramm der Variable `lifeExp`:
   - **plotnine**: `ggplot(df_2007, aes(x="lifeExp")) + geom_histogram(...)`  
   - **Plotly**: `px.histogram(df_2007, x="lifeExp", ...)`
3. Vergleiche Achsenbeschriftungen, Titel und die Möglichkeiten zur Interaktivität (Zoom, Hover) zwischen beiden Varianten.


### Musterlösung – Code mit plotnine

In [None]:
# Daten für 2007 (falls noch nicht definiert)
df_2007 = df[df["year"] == 2007]

# Statisches Histogramm mit plotnine (Grammar of Graphics)
(
    ggplot(df_2007, aes(x="lifeExp"))
    + geom_histogram(bins=25, color="black", fill="lightgray")
    + labs(
        title="Verteilung der Lebenserwartung (lifeExp) im Jahr 2007",
        x="Lebenserwartung (Jahre)",
        y="Anzahl Länder"
    )
    + theme_minimal()
)

### Musterlösung – Code mit Plotly Express

In [None]:
fig = px.histogram(
    df_2007,
    x="lifeExp",
    nbins=25,
    title="Verteilung der Lebenserwartung (lifeExp) im Jahr 2007 – interaktiv",
    labels={
        "lifeExp": "Lebenserwartung (Jahre)",
        "count": "Anzahl Länder"
    }
)

fig.show()


### Interpretation (eigene Notizen)

- Welche Form hat die Verteilung der Lebenserwartung im Jahr 2007 (symmetrisch, schief, multimodal)?
- Wie unterscheiden sich das **statische** plotnine-Histogramm und das **interaktive** Plotly-Histogramm in ihrer Nutzung? Was ist der Mehrwert der Interaktivität (siehe Bins)?
- Wann würdest du welches Werkzeug für deine eigene Arbeit bevorzugen?

*(Schreibe hier deine Gedanken auf.)*

---
## Übung 2: Bivariate Beziehung – Bubble Chart mit *plotnine* und Plotly

### Ziel

Untersuche die Beziehung zwischen **BIP pro Kopf** (`gdpPercap`) und **Lebenserwartung** (`lifeExp`) im Jahr 2007,
wobei die **Bevölkerung** (`pop`) über die Punktgröße (Bubble) kodiert wird und der Kontinent über die Farbe.

Erstelle dazu:

1. einen Bubble Chart mit **plotnine** (statisch),
2. einen Bubble Chart mit **Plotly Express** (interaktiv).


### Hinweis zum Vorgehen

1. Verwende erneut `df_2007` als Datengrundlage.
2. Setze im Scatterplot:
   - x-Achse: `gdpPercap` (ggf. log-Skala),
   - y-Achse: `lifeExp`,
   - Punktgröße: `pop`,
   - Farbe: `continent`.
3. **plotnine**:
   - `geom_point(aes(size="pop", color="continent"), alpha=0.7)`,
   - ggf. `scale_x_log10()` für log-Skala,
   - `scale_size_continuous` zum Anpassen der Punktgrößen.
4. **Plotly**:
   - `px.scatter` mit `size="pop"`, `color="continent"`, `log_x=True`,
   - `hover_name="country"` für Details-on-demand.


### Musterlösung – Code mit plotnine

In [None]:
from plotnine import (
    ggplot,
    aes,
    geom_point,
    labs,
    theme_minimal,
    scale_x_log10,
    scale_size
)

In [None]:
# Daten für 2007 (falls noch nicht vorhanden)
df_2007 = df[df["year"] == 2007]

# Bubble Chart mit plotnine
(
    ggplot(df_2007, aes(x="gdpPercap", y="lifeExp", size="pop", color="continent"))
    + geom_point(alpha=0.7)
    + scale_x_log10()
    + scale_size(name="Bevölkerung", range=(1, 10))
    + labs(
        title="BIP pro Kopf vs. Lebenserwartung (Bubble Chart, 2007)",
        x="BIP pro Kopf (log-Skala)",
        y="Lebenserwartung (Jahre)",
        color="Kontinent"
    )
    + theme_minimal()
)


### Musterlösung – Code mit Plotly Express

In [None]:
fig = px.scatter(
    df_2007,
    x="gdpPercap",
    y="lifeExp",
    size="pop",
    color="continent",
    hover_name="country",
    log_x=True,
    title="BIP pro Kopf vs. Lebenserwartung (Bubble Chart, 2007) – interaktiv", 
    labels={
        "lifeExp": "Lebenserwartung (Jahre)",
        "gdpPercap": "BIP pro Kopf (log-Skala)"
    }
)

fig.show()

### Interpretation (eigene Notizen)

- Welche Beziehung erkennst du zwischen BIP pro Kopf und Lebenserwartung im Jahr 2007?
- Welche zusätzlichen Informationen liefert die Kodierung über **Punktgröße** (Bevölkerung) und **Farbe** (Kontinent)?
- Wie unterstützen Interaktionen (Zoom, Hover, Auswahl) in Plotly das Verständnis im Vergleich zur statischen plotnine-Grafik?
- In welchem Kontext würdest du eine solche bivariate Bubble-Grafik einsetzen?

*(Schreibe hier deine Gedanken auf.)*

---
## Übung 3: Vom Kontinent-Überblick zu Länder-Details (Dropdown)

### Ziel

Erstelle einen interaktiven Scatterplot für **ein ausgewähltes Jahr** (z. B. 2007), der mithilfe eines **Dropdown-Menüs**
zwischen folgenden Ansichten umschalten kann:

- **Alle Kontinente** (globaler Überblick),
- **Einzelner Kontinent** (gefilterte Detailansicht).

Auch hier soll das Mantra sichtbar werden:

- **Overview first:** Ansicht „Alle Kontinente“,
- **zoom and filter:** Auswahl eines Kontinents über das Dropdown, zusätzlich Zoom/Pan,
- **details-on-demand:** Hover-Infos zu einzelnen Ländern.


### Hinweis zum Vorgehen

1. Filtere den Datensatz auf ein Jahr, z. B. `year = 2007`.
2. Erzeuge mit `px.scatter` einen Plot für alle Kontinente.
3. Erzeuge mit `fig.update_layout(updatemenus=[...])` ein Dropdown-Menü, das:
   - in der ersten Option **alle Kontinente** sichtbar macht,
   - in weiteren Optionen jeweils nur **einen Kontinent** anzeigt.
4. Nutze `hover_data`, um zusätzliche Informationen wie `pop` und `year` einzublenden.


### Musterlösung – Code

In [None]:
# Jahr auswählen
year = 2007
df_2007 = df[df["year"] == year]

# Basis-Scatterplot
fig = px.scatter(
    df_2007,
    x="gdpPercap",
    y="lifeExp",
    color="continent",
    hover_name="country",
    hover_data={"pop": True, "year": True, "continent": False, "gdpPercap": False, "lifeExp": False, "iso_alpha": True},
    log_x=True,
    title=f"Lebenserwartung vs. BIP pro Kopf ({year}) – alle Kontinente"
)

fig.update_layout(
    xaxis_title="BIP pro Kopf (log-Skala)",
    yaxis_title="Lebenserwartung (Jahre)"
)

# Kontinente in der Reihenfolge, wie sie in den Traces vorkommen
continent_order = [trace.name for trace in fig.data]

buttons = []

# Button 0: Alle Kontinente
buttons.append(
    dict(
        label="Alle Kontinente",
        method="update",
        args=[
            {"visible": [True] * len(fig.data)},  # alle Traces sichtbar
            {"title": f"Lebenserwartung vs. BIP pro Kopf ({year}) – alle Kontinente"}
        ],
    )
)

# Buttons 1..n: Einzelne Kontinente
for i, cont in enumerate(continent_order):
    visible = [False] * len(fig.data)
    visible[i] = True  # nur der i-te Kontinent sichtbar

    buttons.append(
        dict(
            label=cont,
            method="update",
            args=[
                {"visible": visible},
                {"title": f"Lebenserwartung vs. BIP pro Kopf ({year}) – {cont}"}
            ],
        )
    )

# Dropdown-Menü ins Layout einfügen
fig.update_layout(
    updatemenus=[
        dict(
            type="dropdown",
            active=0,
            buttons=buttons,
            x=1.05,
            y=1.15,
            xanchor="right",
            yanchor="top",
        )
    ]
)

fig.show()

### Interpretation (eigene Notizen)

- **Overview first:** Wie unterstützt die Dropdown-Ansicht „Alle Kontinente“ den Überblick?
- **Zoom and filter:** Wie verändert sich dein Blick auf die Daten, wenn du einzelne Kontinente auswählst?
- **Details-on-demand:** Welche Rolle spielen die Hover-Infos in der gefilterten Ansicht?
- Reflektiere, ob diese Art der Interaktion die Daten *verständlicher* oder vielleicht auch *komplexer* macht.

*(Schreibe hier in Markdown deine Gedanken auf.)*

---
## Übung 4: Zeitliche Entwicklung mit Slider und Buttons (Linienchart)

### Ziel

Untersuche die **durchschnittliche Lebenserwartung nach Kontinent über die Zeit**.
Erstelle dazu ein **interaktives Liniendiagramm** mit:

- einem **Slider auf der X-Achse (Year Range Slider)**, um den sichtbaren Zeitraum zu verändern,
- Buttons, mit denen du schnell auf
  - die **letzten 10 Jahre**,
  - die **letzten 20 Jahre**,
  - **alle Jahre**
  springen kannst.

Überlege, wie hier das Mantra sichtbar wird:

- **Overview first:** Alle Jahre im Überblick,
- **zoom and filter:** Fokus auf die letzten 10/20 Jahre oder ein manuell eingestellter Ausschnitt,
- **details-on-demand:** ggf. Hover-Infos zu einzelnen Linienpunkten.


### Hinweis zum Vorgehen

1. Aggregiere die Daten nach Jahr und Kontinent, z. B. mit `groupby` und `mean` auf `lifeExp`.
2. Erzeuge ein Liniendiagramm mit `px.line`, wobei
   - `x="year"`,
   - `y="lifeExp"`,
   - `color="continent"`,
   - `markers=True`
   gesetzt werden.
3. Aktiviere einen Range-Slider auf der X-Achse über `fig.update_xaxes(rangeslider=dict(visible=True))`.
4. Füge Buttons (`updatemenus`) hinzu, die die X-Achsen-Range so setzen, dass
   - alle Jahre,
   - die letzten 20 Jahre,
   - die letzten 10 Jahre
   sichtbar sind.


### Musterlösung – Code

In [None]:
# Durchschnittliche Lebenserwartung nach Jahr und Kontinent berechnen
df_mean = (
    df.groupby(['year', 'continent'], as_index=False)
      .agg({'lifeExp': 'mean'})
)

year_min = df_mean['year'].min()
year_max = df_mean['year'].max()

# Liniendiagramm mit Range Slider
fig = px.line(
    df_mean,
    x="year",
    y="lifeExp",
    color="continent",
    markers=True,
    title="Durchschnittliche Lebenserwartung nach Kontinent und Jahr",
    labels={
        "year": "Jahr",
        "lifeExp": "Lebenserwartung (Jahre)",
        "continent": "Kontinent"
    }
)

# Range Slider auf der X-Achse aktivieren
fig.update_xaxes(rangeslider=dict(visible=True))

# Buttons für Zeitfenster definieren
buttons = []

# Alle Jahre
buttons.append(
    dict(
        label="Alle Jahre",
        method="relayout",
        args=[{
            "xaxis.range": [year_min, year_max]
        }]
    )
)

# Letzte 20 Jahre
buttons.append(
    dict(
        label="Letzte 20 Jahre",
        method="relayout",
        args=[{
            "xaxis.range": [max(year_min, year_max - 20), year_max]
        }]
    )
)

# Letzte 10 Jahre
buttons.append(
    dict(
        label="Letzte 10 Jahre",
        method="relayout",
        args=[{
            "xaxis.range": [max(year_min, year_max - 10), year_max]
        }]
    )
)

# Buttons ins Layout einfügen
fig.update_layout(
    updatemenus=[
        dict(
            type="buttons",
            direction="right",
            x=0.5,
            y=1.15,
            xanchor="center",
            yanchor="top",
            buttons=buttons,
            showactive=True
        )
    ]
)

fig.show()

### Interpretation (eigene Notizen)

- **Overview first:** Wie hilft dir die Standardansicht (alle Jahre) beim Verständnis der langfristigen Entwicklung?
- **Zoom and filter:** Welche neuen Einsichten erhältst du, wenn du über Range-Slider oder Buttons auf die letzten 10 bzw. 20 Jahre gehst?
- **Details-on-demand:** Welche zusätzlichen Informationen erhältst du durch Hover-Infos oder durch das Fokussieren auf einzelne Kontinente?

*(Schreibe hier in Markdown deine Gedanken auf.)*

---
## Übung 5: Vergleich mehrerer Länder im Zeitverlauf mit auswählbarer Kennzahl

### Ziel

Untersuche die Entwicklung wichtiger Indikatoren für mehrere Länder über die Zeit.
Nutze dazu einen interaktiven Linienschart, in dem du

- über die **Legende** Länder ein- und ausblendest,
- über ein **Dropdown-Menü** zwischen verschiedenen Kennzahlen wechselst (z. B. Lebenserwartung, BIP pro Kopf, Bevölkerung),
- über **Range-Selector-Buttons** und einen **Range-Slider** am unteren Rand den betrachteten Zeitraum steuerst.

Reflektiere dabei erneut das Mantra:

- **Overview first:** Viele Länder und alle Jahre sichtbar,
- **zoom and filter:** Fokussierung auf wenige Länder und bestimmte Zeitfenster,
- **details-on-demand:** Details pro Land/Jahr über Hover.


### Hinweis zum Vorgehen

1. Verwende den bereits vorbereiteten `gapminder`-Datensatz und ergänze eine Datumsspalte (`year_date`).
2. Erzeuge für jedes Land:
   - eine eigene `x`-Zeitreihe (Jahre als Datum),
   - für jede Kennzahl (`lifeExp`, `gdpPercap`, `pop`) die entsprechende `y`-Zeitreihe.
3. Lege ein **Dictionary** `metrics` an, das die Spaltennamen (`lifeExp`, `gdpPercap`, `pop`) auf lesbare Achsentitel abbildet.
4. Erstelle mit `go.Figure()` einen **Trace pro Land** und blende zunächst nur einige Länder (z. B. Deutschland und Österreich) sichtbar ein; die anderen sollen über die Legende aktivierbar sein.
5. Baue ein **Dropdown-Menü** (`updatemenus`), mit dem du zwischen den Kennzahlen wechseln kannst (die `y`-Daten aller Traces werden entsprechend umgeschaltet).
6. Ergänze am `xaxis` einen **Range-Selector** (z. B. „letzte 20 Jahre“, „alle“) sowie einen **Range-Slider**.


In [None]:
import pandas as pd
import plotly.graph_objects as go
from gapminder import gapminder

# ----------------------------
# Daten laden & vorbereiten
# ----------------------------
df = gapminder.copy()
df["year_date"] = pd.to_datetime(df["year"], format="%Y")

countries = sorted(df["country"].unique())

# Variablen, die per Dropdown gewählt werden können
metrics = {
    "lifeExp": "Lebenserwartung",
    "gdpPercap": "BIP pro Kopf",
    "pop": "Bevölkerung"
}

start_metric = "lifeExp"
default_countries = ["Germany", "Austria"]

# ----------------------------
# Daten pro Land & Variable vorbereiten
# ----------------------------
x_data = []  # Jahresachsen pro Land
data_per_metric = {m: [] for m in metrics.keys()}  # y-Daten pro Variable & Land

for country in countries:
    df_c = df[df["country"] == country].sort_values("year")
    x_data.append(df_c["year_date"])
    for m in metrics.keys():
        data_per_metric[m].append(df_c[m])

# ----------------------------
# Figure initialisieren – ein Trace pro Land
# ----------------------------
fig = go.Figure()

for i, country in enumerate(countries):
    # Nur Germany & Austria initial einblenden, Rest über Legende wählbar
    visible_state = True if country in default_countries else "legendonly"
    fig.add_trace(
        go.Scatter(
            x=x_data[i],
            y=data_per_metric[start_metric][i],
            mode="lines+markers",
            name=country,
            visible=visible_state,
            hovertemplate=(
                "Land: " + country +
                "<br>Jahr: %{x|%Y}" +
                "<br>Wert: %{y:.2f}<extra></extra>"
            )
        )
    )

# ----------------------------
# Dropdown-Menü für Variable
# ----------------------------
metric_buttons = []
for metric_key, metric_label in metrics.items():
    metric_buttons.append(
        dict(
            label=metric_label,
            method="update",
            args=[
                # y-Daten aller Traces auf die gewählte Variable setzen
                {"y": data_per_metric[metric_key]},
                # Achsentitel & Plot-Titel anpassen
                {
                    "yaxis": {"title": metric_label},
                    "title": f"{metric_label} in ausgewählten Ländern"
                }
            ]
        )
    )

# ----------------------------
# Layout + Slider + Selector
# ----------------------------
fig.update_layout(
    title=f"{metrics[start_metric]} in ausgewählten Ländern",
    xaxis=dict(
        rangeselector=dict(
            buttons=list([
                dict(
                    count=20,
                    label="letzte 20 Jahre",
                    step="year",
                    stepmode="backward"
                ),
                dict(step="all", label="alle")
            ])
        ),
        rangeslider=dict(visible=True),
        type="date",
        title="Jahr"
    ),
    yaxis=dict(
        title=metrics[start_metric]
    ),
    updatemenus=[
        dict(
            type="dropdown",
            buttons=metric_buttons,
            x=1.15,
            y=1.0,
            xanchor="left",
            yanchor="top",
            showactive=True
        )
    ],
    height=500
)

fig.show()


### Interpretation (eigene Notizen)

- **Overview first:** Wie unterstützt diese Visualisierung den Überblick über die Entwicklung vieler Länder gleichzeitig?
- **Zoom and filter:**
  - Wie nutzt du den Range-Selector („letzte 20 Jahre“, „alle“) und den Range-Slider?
  - Wie verändert sich dein Verständnis, wenn du nur einige Länder in der Legende aktiv lässt?
- **Details-on-demand:** Welche zusätzlichen Einsichten erhältst du über Hover-Infos und den Wechsel der Kennzahl (Lebenserwartung, BIP pro Kopf, Bevölkerung)?
- In welchen praktischen Kontexten (z. B. Journalismus, Policy, Unternehmensreports) wäre eine solche Visualisierung sinnvoll?

*(Schreibe hier deine Gedanken auf.)*


#### Bonus Deutschalnd und Nigeria vergleichen. Nigeria hat 1987 bei der Bevölkerung Deutschland erstmalig überholt. 

Aufgabe: Füge eine Annotation in das Linienchart ein, die auf den Zeitpunkt hinweist, an dem Nigeria Deutschland bei der Bevölkerungszahl überholt hat (1987). Nutze dazu `fig.add_annotation(...)` und positioniere die Annotation passend.

In [None]:
import pandas as pd
import plotly.graph_objects as go
from gapminder import gapminder

# ----------------------------
# Daten laden
# ----------------------------
df = gapminder.copy()

countries = sorted(df["country"].unique())
default_countries = ["Nigeria", "Germany"]

# ----------------------------
# Figure initialisieren – ein Trace pro Land
# ----------------------------
fig = go.Figure()

for country in countries:
    df_c = df[df["country"] == country].sort_values("year")

    # Standardmäßig nur Nigeria & Deutschland anzeigen
    visible_state = True if country in default_countries else "legendonly"

    fig.add_trace(
        go.Scatter(
            x=df_c["year"],
            y=df_c["pop"],
            mode="lines+markers",
            name=country,
            visible=visible_state,
            hovertemplate=(
                "Land: " + country +
                "<br>Jahr: %{x}" +
                "<br>Bevölkerung: %{y:,}<extra></extra>"
            )
        )
    )

# ----------------------------
# Annotation: Nigeria überholt Deutschland (1987)
# ----------------------------
nigeria_1987 = df[(df["country"] == "Nigeria") & (df["year"] == 1987)].iloc[0]

anno_x = nigeria_1987["year"]
anno_y = nigeria_1987["pop"]

fig.add_annotation(
    x=anno_x,
    y=anno_y,
    xanchor="center",
    yanchor="bottom",
    showarrow=True,
    arrowhead=2,
    arrowsize=1,
    arrowwidth=1.5,
    ax=40,
    ay=-40,
    text="1987: Nigeria überholt Deutschland <br> erstmalig bei der Bevölkerungszahl",
)

# ----------------------------
# Layout
# ----------------------------
fig.update_layout(
    title="Bevölkerungsentwicklung – Nigeria, Deutschland und weitere Länder",
    xaxis_title="Jahr",
    yaxis_title="Bevölkerung",
    height=500
)

fig.show()


---
## Übung 6: Zwei verknüpfte Grafiken mit gemeinsamem Filter (vereinfachtes Brushing & Linking)

### Ziel

Erstelle zwei **verknüpfte Visualisierungen** für das Jahr 2007:

1. Links: ein Scatterplot **BIP pro Kopf vs. Lebenserwartung** (Punkte = Länder),
2. Rechts: ein Histogramm der **Lebenserwartung**.

Beide Grafiken sollen über einen **gemeinsamen Filter (Dropdown)** gesteuert werden:

- Auswahl „Alle Kontinente“ zeigt alle Länder,
- Auswahl eines Kontinents filtert **beide** Grafiken auf diesen Kontinent.

Damit setzt du eine einfache Form von *Brushing & Linking* um: Eine **Filterinteraktion** wirkt gleichzeitig auf mehrere Ansichten (koordinierte Filterung).


### Hinweis zum Vorgehen

1. Filtere den Gapminder-Datensatz auf das Jahr 2007: `df_2007 = df[df["year"] == 2007]`.
2. Verwende `make_subplots`, um zwei Plots nebeneinander darzustellen:
   - links: `go.Scatter` (x = `gdpPercap`, y = `lifeExp`),
   - rechts: `go.Histogram` (x = `lifeExp`).
3. Lege ein Dictionary oder eine Liste mit DataFrames pro Filterwert an, z. B.:
   - `"Alle Kontinente"` → kompletter Datensatz,
   - `"Africa"`, `"Americas"`, … → gefilterte DataFrames.
4. Erzeuge ein `updatemenus`-Dropdown, das:
   - für jeden Kontinent die `x`-/`y`-Daten des Scatterplots aktualisiert,
   - gleichzeitig die `x`-Daten des Histogramms aktualisiert.
5. Achte darauf, dass die `x`-/`y`-Listen in `args[0]` zur **Reihenfolge der Traces** passen.


In [None]:
import pandas as pd
import plotly.graph_objects as go
from plotly.subplots import make_subplots
from gapminder import gapminder

# ----------------------------
# Daten laden & auf Jahr 2007 filtern
# ----------------------------
df = gapminder.copy()
df_2007 = df[df["year"] == 2007]

# Liste der Kontinente + "Alle"
continents = ["Alle Kontinente"] + sorted(df_2007["continent"].unique())

# Hilfsstruktur: pro Filterwert ein DataFrame
df_by_filter = {
    "Alle Kontinente": df_2007
}
for cont in sorted(df_2007["continent"].unique()):
    df_by_filter[cont] = df_2007[df_2007["continent"] == cont]

# ----------------------------
# Subplots anlegen: Scatter (links) + Histogram (rechts)
# ----------------------------
fig = make_subplots(
    rows=1, cols=2,
    subplot_titles=(
        "BIP pro Kopf vs. Lebenserwartung (2007)",
        "Verteilung der Lebenserwartung (2007)"
    )
)

df_all = df_by_filter["Alle Kontinente"]

# Trace 0: Scatter links
fig.add_trace(
    go.Scatter(
        x=df_all["gdpPercap"],
        y=df_all["lifeExp"],
        mode="markers",
        text=df_all["country"],
        marker=dict(size=8, opacity=0.7),
        hovertemplate=(
            "Land: %{text}"
            "<br>BIP/Kopf: %{x:.0f}"
            "<br>Lebenserwartung: %{y:.1f} Jahre<extra></extra>"
        ),
        name="Länder",
    ),
    row=1, col=1
)

# Trace 1: Histogramm rechts
fig.add_trace(
    go.Histogram(
        x=df_all["lifeExp"],
        nbinsx=20,
        name="Lebenserwartung",
        opacity=0.8
    ),
    row=1, col=2
)

# ----------------------------
# Dropdown für koordinierte Filterung (vereinfachtes Brushing & Linking)
# ----------------------------
buttons = []
for cont in continents:
    d = df_by_filter[cont]
    label = cont

    buttons.append(
        dict(
            label=label,
            method="update",
            args=[
                # args[0]: Daten-Update für alle Traces in Reihenfolge
                {
                    "x": [
                        d["gdpPercap"],  # Trace 0 (Scatter)
                        d["lifeExp"]     # Trace 1 (Histogram)
                    ],
                    "y": [
                        d["lifeExp"],    # Trace 0 (Scatter)
                        None             # Trace 1 (Histogram nutzt nur x)
                    ]
                },
                # args[1]: Layout-Update (z. B. Titel)
                {
                    "title": f"Brush & Link: Filter = {label}"
                }
            ]
        )
    )

fig.update_layout(
    title="Brush & Link: Filter = Alle Kontinente",
    xaxis=dict(
        title="BIP pro Kopf (log-Skala)",
        type="log"
    ),
    yaxis=dict(
        title="Lebenserwartung (Jahre)"
    ),
    xaxis2=dict(
        title="Lebenserwartung (Jahre)"
    ),
    yaxis2=dict(
        title="Anzahl Länder"
    ),
    updatemenus=[
        dict(
            type="dropdown",
            buttons=buttons,
            x=0.5,
            y=1.2,
            xanchor="center",
            yanchor="top",
            showactive=True
        )
    ],
    bargap=0.1,
    height=500
)

fig.show()


### Interpretation (eigene Notizen)

- **Overview first:** Welche Informationen erhältst du, wenn „Alle Kontinente“ ausgewählt sind und beide Charts gleichzeitig sichtbar sind?
- **Zoom and filter:** Was ändert sich, wenn du den Filter nacheinander auf einzelne Kontinente setzt?
  - Welche Muster werden im Scatterplot deutlicher?
  - Wie verändert sich die Verteilung der Lebenserwartung im Histogramm?
- **Details-on-demand:** Welche zusätzlichen Einsichten bekommst du durch Hover-Infos im Scatterplot?
- Wo würdest du in deinen eigenen Projekten zwei oder mehr Visualisierungen durch einen gemeinsamen Filter verknüpfen wollen?

*(Schreibe hier deine Gedanken auf.)*


---
## Übung 7: Anteile der Kontinente an der Weltbevölkerung – Treemap, Pie & Donut

### Ziel

Stelle die **Anteile der Kontinente an der Weltbevölkerung** für ein ausgewähltes Jahr (z. B. 2007) dar und vergleiche drei unterschiedliche Diagrammtypen:

1. **Treemap**
2. **Kuchendiagramm (Pie Chart)**
3. **Donut Chart**

Im Hover sollen zusätzlich die **absoluten Bevölkerungszahlen** *und* die **prozentualen Anteile** angezeigt werden – auch **in der Treemap**.

Erstelle eine interaktive Visualisierung, in der du über **Buttons** zwischen den drei Diagrammtypen umschalten kannst. Reflektiere, wie sich die Wahrnehmung der Anteile je nach Diagrammtyp verändert.


### Hinweis zum Vorgehen

1. Wähle ein Jahr, z. B. `year = 2007`, und filtere den Datensatz:  
   `df_2007 = df[df["year"] == 2007]`.
2. Aggregiere die Bevölkerung nach Kontinent:  
   `df_agg = df_2007.groupby("continent", as_index=False)["pop"].sum()`.
3. Erzeuge mit `go.Figure()` drei Traces:
   - `go.Treemap` (Labels = Kontinente, Values = Bevölkerung),
   - `go.Pie` mit `hole=0` (klassisches Pie Chart),
   - `go.Pie` mit `hole=0.5` (Donut Chart).
4. Setze zunächst **nur die Treemap** auf `visible=True`, die anderen auf `visible=False`.
5. Füge ein `updatemenus` mit `type="buttons"` hinzu, das:
   - die `visible`-Einstellung der drei Traces steuert,
   - den Titel der Grafik passend zum Diagrammtyp setzt.


In [None]:
import pandas as pd
import plotly.graph_objects as go
from gapminder import gapminder

# ----------------------------
# Daten laden & aggregieren
# ----------------------------
df = gapminder.copy()

year = 2007
df_2007 = df[df["year"] == year]

df_agg = (
    df_2007
    .groupby("continent", as_index=False)["pop"]
    .sum()
    .sort_values("pop", ascending=False)
)

# Prozentanteile berechnen
total_pop = df_agg["pop"].sum()
df_agg["percent"] = df_agg["pop"] / total_pop * 100

continents = df_agg["continent"]
values = df_agg["pop"]
percents = df_agg["percent"]

# Labels für die Treemap mit Prozentanteil
hover_text_treemap = [
    f"{cont}<br>Bevölkerung: {val:,}<br>Anteil: {pct:.2f}%"
    for cont, val, pct in zip(continents, values, percents)
]

# ----------------------------
# Figure mit drei Diagrammtypen
# ----------------------------
fig = go.Figure()

# Trace 0: Treemap (mit Prozent)
fig.add_trace(
    go.Treemap(
        labels=continents,
        parents=[""] * len(continents),
        values=values,
        textinfo="label+percent entry",
        hovertext=hover_text_treemap,
        hoverinfo="text",
        name="Treemap",
        visible=True
    )
)

# Trace 1: Pie Chart
fig.add_trace(
    go.Pie(
        labels=continents,
        values=values,
        name="Pie",
        visible=False,
        hole=0.0,
        hovertemplate="Kontinent: %{label}<br>Anteil: %{percent}<extra></extra>"
    )
)

# Trace 2: Donut Chart
fig.add_trace(
    go.Pie(
        labels=continents,
        values=values,
        name="Donut",
        visible=False,
        hole=0.5,
        hovertemplate="Kontinent: %{label}<br>Anteil: %{percent}<extra></extra>"
    )
)

# ----------------------------
# Buttons zum Umschalten
# ----------------------------
buttons = [
    dict(
        label="Treemap",
        method="update",
        args=[
            {"visible": [True, False, False]},
            {"title": f"Anteile der Kontinente an der Weltbevölkerung ({year}) – Treemap"}
        ],
    ),
    dict(
        label="Pie",
        method="update",
        args=[
            {"visible": [False, True, False]},
            {"title": f"Anteile der Kontinente an der Weltbevölkerung ({year}) – Pie Chart"}
        ],
    ),
    dict(
        label="Donut",
        method="update",
        args=[
            {"visible": [False, False, True]},
            {"title": f"Anteile der Kontinente an der Weltbevölkerung ({year}) – Donut Chart"}
        ],
    ),
]

fig.update_layout(
    title=f"Anteile der Kontinente an der Weltbevölkerung ({year}) – Treemap",
    updatemenus=[
        dict(
            type="buttons",
            direction="right",
            x=0.5,
            y=1.15,
            xanchor="center",
            yanchor="top",
            showactive=True,
            buttons=buttons
        )
    ],
    height=500
)

fig.show()


### Interpretation (eigene Notizen)

- Wie wirken die **Anteile der Kontinente** in der Treemap im Vergleich zu Pie und Donut?
- In welchem Diagramm erkennst du kleine Anteile (z. B. Ozeanien) am besten?
- Wie unterstützt die Prozentanzeige im Hover dein Verständnis?
- Für welche Zielgruppe wäre welcher Diagrammtyp am geeignetsten?
  - Forschende
  - Journalismus
  - Management / KPI-Dashboards

*(Schreibe hier deine Gedanken auf.)*


### Bonusaufgabe Bevölkerungsanteile der Länder in Europa (nach gleichem Muster wie Übung 7)

Erstelle eine ähnliche interaktive Visualisierung wie in Übung 7, aber diesmal für die **Bevölkerungsanteile der Länder in Europa** im Jahr 2007. Nutze ebenfalls die drei Diagrammtypen: Treemap, Pie Chart und Donut Chart, und ermögliche das Umschalten über Buttons. Achte darauf, dass im Hover sowohl die absoluten Bevölkerungszahlen als auch die prozentualen Anteile angezeigt werden.

In [None]:
import pandas as pd
import plotly.graph_objects as go
from gapminder import gapminder

# ----------------------------
# Daten laden & auf Europa + Jahr filtern
# ----------------------------
df = gapminder.copy()

year = 2007
df_eu = df[df["continent"] == "Europe"]
df_eu_2007 = df_eu[df_eu["year"] == year]

df_agg = (
    df_eu_2007
    .groupby("country", as_index=False)["pop"]
    .sum()
    .sort_values("pop", ascending=False)
)

# Prozentanteile berechnen
total_pop = df_agg["pop"].sum()
df_agg["percent"] = df_agg["pop"] / total_pop * 100

countries = df_agg["country"]
values = df_agg["pop"]
percents = df_agg["percent"]

# Hover-Text für Treemap mit Prozent
hover_text_treemap = [
    f"{country}<br>Bevölkerung: {val:,}<br>Anteil an Europa: {pct:.2f}%"
    for country, val, pct in zip(countries, values, percents)
]

# ----------------------------
# Figure mit drei Diagrammtypen
# ----------------------------
fig = go.Figure()

# Trace 0: Treemap
fig.add_trace(
    go.Treemap(
        labels=countries,
        parents=[""] * len(countries),
        values=values,
        textinfo="label+percent entry",
        hovertext=hover_text_treemap,
        hoverinfo="text",
        name="Treemap",
        visible=True
    )
)

# Trace 1: Pie Chart
fig.add_trace(
    go.Pie(
        labels=countries,
        values=values,
        name="Pie",
        visible=False,
        hole=0.0,
        hovertemplate=(
            "Land: %{label}"
            "<br>Anteil an Europa: %{percent}"
            "<extra></extra>"
        )
    )
)

# Trace 2: Donut Chart
fig.add_trace(
    go.Pie(
        labels=countries,
        values=values,
        name="Donut",
        visible=False,
        hole=0.5,
        hovertemplate=(
            "Land: %{label}"
            "<br>Anteil an Europa: %{percent}"
            "<extra></extra>"
        )
    )
)

# ----------------------------
# Buttons zum Umschalten
# ----------------------------
buttons = [
    dict(
        label="Treemap",
        method="update",
        args=[
            {"visible": [True, False, False]},
            {"title": f"Bevölkerungsanteile der Länder in Europa ({year}) – Treemap"}
        ],
    ),
    dict(
        label="Pie",
        method="update",
        args=[
            {"visible": [False, True, False]},
            {"title": f"Bevölkerungsanteile der Länder in Europa ({year}) – Pie Chart"}
        ],
    ),
    dict(
        label="Donut",
        method="update",
        args=[
            {"visible": [False, False, True]},
            {"title": f"Bevölkerungsanteile der Länder in Europa ({year}) – Donut Chart"}
        ],
    ),
]

fig.update_layout(
    title=f"Bevölkerungsanteile der Länder in Europa ({year}) – Treemap",
    updatemenus=[
        dict(
            type="buttons",
            direction="right",
            x=0.5,
            y=1.15,
            xanchor="center",
            yanchor="top",
            showactive=True,
            buttons=buttons
        )
    ],
    height=600
)

fig.show()


### Interpretation (eigene Notizen)

- Welche Länder dominieren die europäische Bevölkerung, und wie klar wird das in den drei Diagrammtypen sichtbar?
- Wie gut kannst du kleinere Länder in Treemap vs. Pie vs. Donut erkennen?
- Welcher Diagrammtyp unterstützt deinen Vergleich von Ländern am besten – und warum?
- Welche Rolle spielt der Hover mit absoluten Zahlen und Prozentanteilen für dein Verständnis?

*(Schreibe hier deine Gedanken auf.)*


---
## Abschlussreflexion

- Wo siehst du Grenzen des Mantras „Overview first, zoom and filter, then details-on-demand“?
- Fallen dir Beispiele ein, in denen eine andere Dramaturgie (z. B. direkt mit Details beginnen) sinnvoller wäre?
- Für welche Personas wären solche interaktiven Visualisierungen besonders nützlich?
- Wie würdest du ähnliche Interaktionen in deinem eigenen Projekt / deiner Domäne einsetzen?

*(Schreibe hier deine Gedanken auf.)*
