# Visualisierung mit Plotly & Dash #

Nachfolgend eine kleine Einführung in die Visualisierung mit Plotly und Dash.

Dash ist ein produktives Python-Framework zum Erstellen von Webanwendungen. Dash wurde auf Flask, Plotly.js und React.js geschrieben und ist ideal zum Erstellen von Datenvisualisierungs-Apps mit hochgradig benutzerdefinierten Benutzeroberflächen in reinem Python. 
Dash-Apps werden im Webbrowser gerendert. Sie können Ihre Apps auf Servern bereitstellen und sie dann über URLs freigeben. Da Dash-Apps im Webbrowser angezeigt werden, ist Dash von Natur aus plattformübergreifend und mobil einsetzbar.
Quelle: [Plotly Dash](https://dash.plot.ly/introduction)

## Einführung in Plotly ##

Bevor wir uns mit Dash beschäftigen ist es ratsam eine kurze Einführung in Plotly selbst zu machen. Auf der folgenden Webseite finden wir sehr viele Beispiele welche Art von Plots wir mit Plotly erstellen können. 

https://plot.ly/python

### Aufbau ###

Bevor wir uns nun mit den einzelnen Plots beschäftigen ist es wichtig mal zuerst den generellen Aufbau zu verstehen. Plotly besteht aus folgenden Objekten:

* Data - Hier werden immer die Daten und ihre Attribute definiert bspw. Plotart (Scatter, Bar usw.) x, y, Mode, Marker usw.)
* Layout - In diesem Element wird das grundsätzliche Erscheinungsbild des Plots bspw. Titel, Axenbeschrieftungen, Hovermode usw.


### Scatter Plots ###

Der Scatter Plot ist ein unverzichtbarer Graph wenn es darum geht Korrelationen zwischen zwei Variablen zu finden.

Referenz zu Scatter Plot ([Link](https://plotly.com/python/reference/#scatter))

In [3]:
import pandas as pd
import plotly.offline as pyo
import plotly.graph_objs as go

# Datenimport 

datloc = 'https://raw.githubusercontent.com/sakuronohana/cas_StatDaVi/master/Semesterarbeit/Daten/wb_total_population.csv'
wpop = pd.read_csv(datloc)

wpop.set_index('Country Name',inplace=True)

x = wpop['1994']
y = wpop['2015']

# Nun ploten wir die Daten. Wichtig dabei ist, es handelt sich um eine Liste
data = [go.Scatter(
    x=x, 
    y=y, 
    mode='markers', # Form der Datenpunkte 
    marker=dict( # Konfiguration der Datenpunkte
        size=12, # Datenpunkte auf Grösse 12
        color='red', #Datenpunkte in Rot
        symbol= 'pentagon', # Form der Datenpunkte
        line = dict(width=2), # Linienbreite der Datenpunkte
    ))]

# Nun defineren wir das Layout unserere Plots. Layout ist keine Liste
layout = go.Layout(
        title='Mein Plotly Scatter Plot',
        # Hier die erste Methode einer Axenbeschriftung
        xaxis= {'title':'Werte der Axe x'},
        # Zweite Methode einer Axenbeschrifung
        yaxis=dict(title='Werte der Axe y'),
        hovermode='closest')

# Nun fassen wir alles in einer Variablen zusammen
fig = go.Figure(data=data, layout=layout)

# Führen wir nun diesen Plot aus wird ein Browser geöffnet
fig.show() 

# Als alternative können den Plot Offline bzw. als HTML speichern und ausführen.
# pyo.plot(fig, filename = 'scatter.html')

### Line Plots ###

Wenn es darum geht stetige Daten in eine Zeitreihe aufzuzeigen, dann führt nichts an einem gute Line Plot vorbei.

In [15]:
import plotly.offline as pyo
import plotly.graph_objs as go
import numpy as np

np.random.seed(56)
x_values = np.linspace(0, 1, 100) # 100 evenly spaced values
y_values = np.random.randn(100)   # 100 random values

# create traces
trace0 = go.Scatter(
    x = x_values,
    y = y_values+5,
    mode = 'markers',
    name = 'markers'
)
trace1 = go.Scatter(
    x = x_values,
    y = y_values,
    mode = 'lines+markers',
    name = 'lines+markers'
)
trace2 = go.Scatter(
    x = x_values,
    y = y_values-5,
    mode = 'lines',
    name = 'lines'
)
data = [trace0, trace1, trace2]  # assign traces to data
layout = go.Layout(
    title = 'Line chart showing three different modes'
)
fig = go.Figure(data=data,layout=layout)
fig.show()

Und hier noch ein Line Plot mit richtigen Daten

In [0]:
import pandas as pd
import plotly.offline as pyo
import plotly.graph_objs as go

# Datenimport 

datloc = 'https://raw.githubusercontent.com/Pierian-Data/Plotly-Dashboards-with-Dash/master/Data/population.csv'
pop = pd.read_csv(datloc)

# Um die Selektion einfacher zu gestalten setzten wir den Index neu
pop.set_index('Name', inplace=True)

data = [go.Scatter(x=pop.columns, 
                   y=pop.loc[name], 
                   mode='lines', 
                   name=name,) for name in pop.index]

fig = go.Figure(data=data)

fig.show()


### Bar Plots ###

Möchte man kategorische Daten (x) mit ihren Werten (y) oder mehrere Merkmale auf einer definierten Zeitachse darstellen, dann ist der Bar Plot (Balkendiagramm) ideal dafür. 


In [0]:
olym

In [24]:
import pandas as pd
import plotly.offline as pyo
import plotly.graph_objs as go

datloc = 'https://raw.githubusercontent.com/Pierian-Data/Plotly-Dashboards-with-Dash/master/Data/2018WinterOlympics.csv'
olym = pd.read_csv(datloc)

trace1 = go.Bar(
          x=olym['NOC'], 
          y=olym['Gold'],
          name='Gold',
          marker={'color':'#FFD700'})

trace2 = go.Bar(
          x=olym['NOC'], 
          y=olym['Silver'],
          name='Silver',
          marker={'color':'#9EA0A1'})

trace3 = go.Bar(
          x=olym['NOC'], 
          y=olym['Bronze'],
          name='Bronze',
          marker={'color':'#CD7F32'})

data = [trace1,trace2,trace3]
layout = go.Layout(title='Medals',
                   barmode='stack') # Mit dieser Zeile erstellen wir eine gestapeltes Bankendiagramm.

fig = go.Figure(data=data, layout=layout)
fig.show()


### Bubble Plot ###

Ein Bubble Plot (Blasendiagramm) ähnlich wie eine Scatter Plot. Der wesentliche Unterschied dabei ist, dass wir mit der Grösse der Bubbles auch die Werteverhältnisse anzeigen können. Die Bubble Plots waren bei Hans Rosling (bekannter schwedischer Arzt und Statistiker) eine sehr beliebtes Instrument um verschiedenen Datensätze miteinander zu vergleichen.


In [35]:
import pandas as pd
import plotly.graph_objs as go
import plotly.offline as pyo

datloc = 'https://raw.githubusercontent.com/Pierian-Data/Plotly-Dashboards-with-Dash/master/Data/mpg.csv'
cars = pd.read_csv(datloc)

# Umrechung Gallone auf Liter (1 Gallone = 3.78541 Liter)
mpglit = cars['mpg']/3.78

data = [go.Scatter(
        x=cars['horsepower'],
        y=mpglit,
        mode='markers',
        marker=dict(size=2*cars['cylinders']))]

layout = go.Layout(title='Bubble Plot',
                  xaxis=dict(title='Anzahl Pferdestärken'),
                  yaxis=dict(title='Liter pro Meile'))

fig = go.Figure(data=data, layout=layout)
fig.show()

