# Skript: Interaktive Plots mit Plotly

---

Was ist eigentlich Interaktivität?

> Ermöglichung von nicht-linearen Abläufen und Einstellungsmöglichkeiten für den Nutzer durch (grafische) Oberflächen.

Bsp.: Würfel der sich einmal als GIF um die eigene Achse dreht vs. Würfel, den der Nutzer selbst so drehen kann, wie er es will.

## Plotly

Plotly ist eine **JavaScript**-Grafikbibliothek, die nicht nur von Python aus, sondern auch von Julia, R, MATLAB, Perl und vielen anderen Sprachen bedient werden kann. Wenn es um Python geht, ist Plotly "Marktführer" im Bereich Interaktivität und Bereitstellung von Plots über das Internet.

Plotly besteht aus mehreren Komponenten:

* **`plotly.express`** bietet ähnlich zu seaborn viele konventionelle Plot-Funktionen mit denen viele Visualisierungen schnell gelöst werden können
* `plotly.graph_objects` bietet einzelne Grafikobjekte (Tabelle, Liniengraphen, etc.), die maßgeschneidert werden können.
* `plotly.subplots` für mehr Werkzeuge zum Anordnen von Unterplots.

Schließlich bietet Plotly auch mit **`Dash`**, einen Service, um Plotly-Plots direkt als Dashboard-Internetseite bereitzustellen. Das Modul stützt sich auf `flask` als Python-Webserver.

In [None]:
# Unsere Imports heute:
import numpy as np
import pandas as pd
import seaborn as sns

import plotly
import plotly.express as px  # "Schnelle" Plot Funktionen
import plotly.graph_objects as go  # Grafikobjekte
import \
    plotly.figure_factory as ff  # Für Zusammenstellung von Grafiken, die sonst schwer zu machen sind

In [None]:
rng = np.random.default_rng(1234)  # Zufallsgenerator

# 1 Plotly Express

Plotly express ist innerhalb von Plotly die schnellste Möglichkeit zum Erstellen von Plots.

Express Plots sind dank HTML / CSS Rendering bereits voll interaktiv (Sichtfeld-Anpassung mittels Zoom, Pan, Select) und können in vielen Umgebungen einfach eingebunden werden.

In [None]:
# loc=Mittelwert, scale=Standardabweichung, size=Anzahl Punkte
data = rng.normal(0, 1, 10)
data

In [None]:
# Alle herkömmlichen Plot-Arten verfügbar
line_fig = px.line(y=data)
line_fig.show()

scatter_fig = px.scatter(y=data)
scatter_fig.show()


## 1.1 Plotstil

### 1.1.1 Templates

In Plotly express kann allen Plot-Befehlen ein `template`-Argument mitgegeben werden. Dieses erhält entweder den Namen eines [vordefinierten Plotly Stils](https://plotly.com/python/templates/) oder ein selbst definiertes Template-Objekt (dazu erst später mehr). 

In [None]:
x_werte = [0, 1, 2, 3, 4]
y_werte = [0, 1, 4, 9, 16]
px.scatter(x=x_werte,
           y=y_werte,
           template='ggplot2')

In [None]:
templates = plotly.io.templates
templates

In [None]:
# Über alle verfügbaren Templates loopen...
for template in templates:
    print(template)

In [None]:
for template in templates:
    print(template)

    fig = px.scatter(x=x_werte,
                     y=y_werte,
                     template=template)
    fig.show()

### 1.1.2 Weitere Stil-Anpassungen

Viele Stil-Anpassungen sind mit `plotly.express` erst im Nachhinein anhand des `fig`-Objektes möglich (Rückgabe der Plot-Funktion).

Mit `fig.update_traces` lassen sich die Datenreihen, die in einer Abbildung vorhanden sind, verändern. Als Argument übergibt man normalerweise verschachtelte Dictionaries. Diese können aber auch mit Unterstrichen verbunden als Keyword-Argumente eingebaut werden.


In [None]:
# Beispieldiagramm:
n = 500

x = rng.normal(0, 8, n)
y = rng.normal(0, 20, n)

In [None]:
fig = px.scatter(x, y)
fig.show()

In [None]:
# {} - Stil
fig.update_traces(marker={'color': 'red',
                          'line': {'color': 'black',
                                   'width': 2}})

In [None]:
# dict() - Stil
fig = px.scatter(x, y)
fig.update_traces(marker=dict(color='red',
                              line=dict(color='black',
                                        width=2)))

In [None]:
# _ - Stil
fig = px.scatter(x, y)
fig.update_traces(marker_color='red',
                  marker_line_color='black',
                  marker_line_width=2,
                  marker_size=12,
                  marker_opacity=0.5)

In [None]:
# Felix' Versuch (Mischform von beidem):
fig = px.scatter(x, y)
fig.update_traces(marker=dict(line_color='black', line_width=2))

In [None]:
''  # Übersicht über alle Anpassungsmöglichkeiten gibt es in der
# (sehr langen) Reference Page von Plotly

# https://plotly.com/python/reference/

In [None]:
# marker_symbol bietet ganz viele Symbole als Strings:
# hexagon
fig = px.scatter(x, y)
fig.update_traces(marker_color='red',
                  marker_line_color='black',
                  marker_line_width=2,
                  # Viel Spaß beim Rumspielen mit Symbolen:
                  marker_symbol='diamond-wide',
                  marker_size=10,
                  marker_opacity=0.5)

### 📝 Übung 1:

1. Erstelle mit plotly-Express ein Balkendiagramm. Darin sollen die Kategorien: "A","B","C" mit den Werten 5,10,20 dargestellt werden.

2. Wähle einen Plot-Stil für diese Abbildung

3. Füge eine Rahmenlinie für die Bars ein


In [None]:
bars = ['A', 'B', 'C']
heights = [5, 10, 20]

fig = px.bar(x=bars,
             y=heights,
             width=600,
             template='ggplot2')

fig.update_traces(marker_line_color='black',
                  marker_line_width=2)

fig.show()

### 1.1.3 Beschriftungen

Der Abbildungstitel kann unter `title` verändert werden. Die Achsenbeschriftungen sind als Dictionary unter `labels` zu verändern. <br>Die Schlüssel des Dictionaries müssen dabei die Variablennamen (Spaltennamen) aus dem DataFrame sein und die Werte müssen die Titel sein, die sie bekommen sollen.
<br>Wurde ohne DataFrame gearbeitet, müssen für die Achsen "x" und "y" als Schlüssel verwendet werden.

In [None]:
# Titel- und Labelbeschriftungen
px.scatter(x=x,
           y=y,
           title='Streuwolke von normalverteilten Zufallswerten',
           labels=dict(x='Test-X',
                       y='Test-Y')
           )

In [None]:
# Manchmal kommt man mit dem Unterstrich nicht weiter:
# px.scatter(x=x,
#            y=y,
#            title='Streuwolke von normalverteilten Zufallswerten',
#            labels_x='Test-X',
#            labels_y='Test-Y')

In [None]:
# Vorwegnahme: Titel zentrieren
fig = px.scatter(x=x,
                 y=y,
                 title='Streuwolke von normalverteilten Zufallswerten',
                 labels=dict(x='Test-X',
                             y='Test-Y')
                 )

fig.update_layout(title_x=0.5)

In [None]:
# Formatanpassungen:
fig.update_layout(title_font_size=40,
                  title_font_color='purple',
                  title_font_family='Comic Sans MS')

In [None]:
fig.update_layout(title_font=dict(
    size=40,
    color='purple',
    family='Comic Sans MS')
)

## 1.2 DataFrames

Wie bei Seaborn sind auch in Plotly (express) nützliche Standard-Datensätze verfügbar.

Wie bei Seaborn lassen sich alle von Plotlys Funktionen sowohl mit Arrays/Listen als auch mit DataFrames und Spaltennamen bedienen.


In [None]:
gapminder = px.data.gapminder()
gapminder.head()

In [None]:
# Verlauf der Lebenserwartungen und Bruttoinlandsprodukte zweier Länder
# 1. Länderdaten selektieren (Deutschland und Japan)

gapminder[
    (gapminder['country'] == 'Germany') | (gapminder['country'] == 'Japan')]

In [None]:
# Lesbarkeit bei solchem Code erhöhen:
is_germany = gapminder['country'] == 'Germany'
is_japan = gapminder['country'] == 'Japan'

two_countries = gapminder[is_germany | is_japan]
two_countries

In [None]:
fig = px.line(
    two_countries,
    x='gdpPercap',
    y='lifeExp',
    color='country',
    width=800,
    # Beschriftung für individuelle Punkte über "text" - Spaltenname oder Fixtext
    text='year',
    title='Daten zu Deutschland und Japan',
    labels={'gdpPercap': 'BIP pro Person',
            'lifeExp': 'Lebenserwartung (Jahre)'}
)

fig.update_traces(textposition='middle left')
fig.show()

## 1.3 Statistische Plots

In [None]:
tips = px.data.tips()
tips.head()

In [None]:
tips['tip_per_person'] = tips['tip'] / tips['size']

In [None]:
tips.head()

In [None]:
# Marginal fügt zusätzlichen Plot oberhalb des eigentlich Plots hinzu:
px.histogram(
    tips,
    x='total_bill',
    y='tip',
    color='smoker',
    opacity=0.7,
    width=800,
    marginal='rug',
    barmode='overlay'
)

In [None]:
# Man kann auch mehrere Marginals haben!
px.scatter(
    tips,
    x='total_bill',
    y='tip_per_person',
    color='smoker',
    width=800,
    opacity=0.7,
    trendline='ols',
    # ordinary least squares (minimale Summe quadrierter Abweichungen)
    marginal_x='histogram',
    marginal_y='violin',
)

In [None]:
# Mehr Info: https://plotly.com/python/marginal-plots/

In [None]:
# Histogramm und Dichte mit figure_factory
# Vorarbeit: die einzelnen zu visualisierenden Variablen aus Datensatz herausholen
iris = px.data.iris()

x1 = iris['petal_length']
x2 = iris['sepal_length']
x3 = iris['petal_width']
x4 = iris['sepal_width']

# Listen von Variablen + zugehörigen Labels und Farben erstellen
data = [x1, x2, x3, x4]
labels = ['Blütenblattlänge', 'Kelchblattlänge', 'Blütenblattbreite',
          'Kelchblattbreite']

colors = ['blue', 'red', 'green', 'orange']

In [None]:
# Jetzt kommt figure_factory ins Spiel
fig = ff.create_distplot(
    data,
    group_labels=labels,
    colors=colors,
    show_rug=False,
    bin_size=0.2,
)

fig.update_layout(
    title_text='Histogramm und Dichtefunktionen des Schwertlilien-Datensatzes',
    width=800,
    legend_title_text='Maße in mm',
    legend_bordercolor='orange',
    legend_borderwidth=2,
    legend_font_color='blue',
    legend_bgcolor='yellow'
)

fig.show()
# Mehr zu figure factory: https://plotly.com/python/figure-factories/

In [None]:
# Wäre der kürzeste Weg zu data gewesen:
iris.iloc[:, 0:4]

In [None]:
# Mehr hier: https://plotly.com/python/reference/layout/

## Übung 2
### Erstelle mit Plotly einen Scatterplot, der die sepal_length gegen die sepal_width des Datensatzes iris aufträgt (inklusive Trendlinie). Außerdem sollen die Spezies durch verschiedene Farben aufgetrennt sein. Des Weiteren sollen am rechten Rand Boxplots dargestellt werden und am oberen Rand Violinplots.

## 1.4 Zusätzliche Plot-Typen

### 1.4.1 Gantt Chart

`ff.create_gant`

* **In `plotly.figure_factory` verfügbar**
* Nicht in `plotly.express` verfügbar (nur kompliziert über `bar`) erstellbar.
* Erwartet "Task", "Start" und "Finish" Spalten für jeden Task-Eintrag.
* Mit "Resource" kann Zuständigkeit / Gruppe eingetragen werden.

In [None]:
# Aufgabenliste erstellen (by the way: muss kein DataFrame sein!)
process1 = dict(
    Task='Neue Waschmaschine bestellen und anschließen',
    Start='2023-08-15',
    Finish='2023-08-18'
)

process2 = dict(
    Task='Angehäufte Wäscheberge waschen',
    Start='2023-08-18',
    Finish='2023-08-21'
)

process3 = dict(
    Task='Wäsche einsortieren',
    Start='2023-08-18',
    Finish='2023-08-23'
)

In [None]:
gantt_df = pd.DataFrame([process1, process2, process3])
gantt_df

In [None]:
# Gantt-Chart erstellen
fig = ff.create_gantt(gantt_df)
fig.update_yaxes(autorange='reversed')
fig.show()

In [None]:
# Zuständigkeit / Gruppe über "Resource"
process1 = dict(
    Task='Neue Waschmaschine bestellen und anschließen',
    Start='2023-08-15',
    Finish='2023-08-18',
    Resource='Andy'
)

process2 = dict(
    Task='Angehäufte Wäscheberge waschen',
    Start='2023-08-18',
    Finish='2023-08-21',
    Resource='Andy'
)

process3 = dict(
    Task='Wäsche einsortieren',
    Start='2023-08-18',
    Finish='2023-08-23',
    Resource='Wendy'
)

gantt_df = pd.DataFrame([process1, process2, process3])
gantt_df

In [None]:
# RGB Farben angeben
color_set = {'Andy': 'rgb(0, 100, 255)',
             'Wendy': 'rgb(255, 50, 20)'}

fig = ff.create_gantt(gantt_df,
                      colors=color_set,
                      index_col='Resource')

fig.update_yaxes(autorange='reversed')
fig.show()

### 1.4.2 Tabellen

`go.Table`

* **In `plotly.graph_objects` verfügbar**
* Zur Einbindung von Tabellen in Präsentationen / Dashboards / Reports


In [None]:
# Jetzt geht's in die graph-objects rüber
# Info: https://plotly.com/python/graph-objects/

In [None]:
# Grafisch schönere und interaktive Tabelle
header = dict(values=['Spalte A', 'Spalte B'])

cells = dict(values=[[1, 2, 3, 4], [5, 6, 7, 8]])

table = go.Table(header=header, cells=cells)

fig = go.Figure(data=table)

fig.show()

In [None]:
# Wenn man das nicht mit der dict-Schreibweise schreiben würde:
# header = {'values': ['Spalte A', 'Spalte B']}
# cells = {'values': [[1, 2, 3, 4], [5, 6, 7, 8]]}

In [None]:
# Mehr hier: https://plotly.com/python/table/

In [None]:
# Visuelle Darstellung anpassen
header = dict(values=['Spalte A', 'Spalte B'],
              fill_color='red')

cells = dict(values=[[1, 2, 3, 4], [5, 6, 7, 8]],
             align='left')

table = go.Table(header=header, cells=cells)

fig = go.Figure(data=table)

fig.show()

In [None]:
header = dict(values=iris.columns,
              fill_color="paleturquoise",
              line_color='darkblue',
              align='left')

# values kann einfach eine Liste aller Spalten sein
# nach Schreibweise iris['sepal_length'],... usw..
# Oder wir nutzen List comprehension, um Platz zu
# sparen, wie im Folgenden zu sehen:

cells = dict(values=[iris[column] for column in iris.columns],
             fill_color='lavender',
             line_color='grey',
             align='left')

table = go.Table(header=header,
                 cells=cells)

fig = go.Figure(data=table)
# fig.write_html('meine_tabelle.html')
fig.show()

### 1.4.3 3D-Scatterplots

`px.scatter_3d`

* **In `plotly.express` verfügbar**


In [None]:
penguins = sns.load_dataset('penguins')
penguins.head()

In [None]:
# Interaktiver 3D-Plot
fig = px.scatter_3d(
    penguins,
    x='bill_depth_mm',
    y='bill_length_mm',
    z='body_mass_g'
)

fig.write_html('penguin_cube.html')

### 1.4.4 Dropdown-Menüs (Ausblick interaktive Updates)   

In [None]:
# Infos zu Buttons: https://plotly.com/python/custom-buttons/
# Infos zu Shapes: https://plotly.com/python/reference/layout/shapes/

In [None]:
# Datengrundlage erstellen

# Streuwolke 1:
x0 = np.random.normal(1, 0.5, 100)
y0 = np.random.normal(1, 0.5, 100)

# Streuwolke 2:
x1 = np.random.normal(3, 0.5, 100)
y1 = np.random.normal(3, 0.5, 100)

# Streuwolke 3:
x2 = np.random.normal(6, 0.5, 100)
y2 = np.random.normal(6, 0.5, 100)

In [None]:
# Die drei einzelnen Scatterplots erstellen
scatter0 = go.Scatter(
    name='unteres Cluster',
    x=x0,
    y=y0,
    mode='markers',
    marker=dict(color='darkorange'),
    hoverinfo='none'
)

scatter1 = go.Scatter(
    name='mittleres Cluster',
    x=x1,
    y=y1,
    mode='markers',
    marker=dict(color='darkgreen'),
    hoverinfo='name',
)

scatter2 = go.Scatter(
    name='oberes Cluster',
    x=x2,
    y=y2,
    mode='markers',
    marker=dict(color='darkcyan'),
    hoverinfo='x+y'
)

# Plotgrundlage erstellen
fig = go.Figure()

# Scatterplots zur Figur hinzufügen
fig.add_trace(scatter0)
fig.add_trace(scatter1)
fig.add_trace(scatter2)

# Umrandung der Punkte
circle0 = dict(type='circle',
               xref='x',
               yref='y',
               x0=min(x0),
               x1=max(x0),
               y0=min(y0),
               y1=max(y0),
               line=dict(color='darkorange'))

circle1 = dict(type='circle',
               xref='x',
               yref='y',
               x0=min(x1),
               x1=max(x1),
               y0=min(y1),
               y1=max(y1),
               line=dict(color='darkgreen'))

circle2 = dict(type='circle',
               xref='x',
               yref='y',
               x0=min(x2),
               x1=max(x2),
               y0=min(y2),
               y1=max(y2),
               line=dict(color='darkcyan'))

fig.update_traces(hoverlabel_namelength=20)  # default: 15 Zeichen max

fig.update_layout(updatemenus=[
    dict(buttons=list([
        dict(label='Nichts tun', method='relayout', args=['shapes', []]),
        dict(label='unteres Cluster', method='relayout', args=['shapes', [circle0]]),
        dict(label='mittleres Cluster', method='relayout', args=['shapes', [circle1]]),
        dict(label='oberes Cluster', method='relayout', args=['shapes', [circle2]]),
        dict(label='alle Cluster', method='relayout', args=['shapes', [circle0, circle1, circle2]]),
    ]))
])

fig.show()