## Plotly


Eine ganz andere Möglichkeit zur Visualisierung bietet [plotly](https://plotly.com/python).

Vorteile sind Interaktivität und gute Defaults, Nachteile schwierige Anpassung im Detail.

Wir nutzen das einfachere Subset in `plotly.express`.

### Data Exploration

In [None]:
import plotly.express as px

df = px.data.gapminder().query('year == 2007')
df

In [None]:
px.strip(df, x='lifeExp')

In [None]:
px.strip(df, x='lifeExp', hover_name='country')

In [None]:
px.strip(df, x='lifeExp', hover_name='country', color='continent')

Üblich für eine Variable auch: Histogramm.

In [None]:
px.histogram(df, x='lifeExp', hover_name='country', color='continent')

In [None]:
px.histogram(df, x='lifeExp', hover_name='country', color='continent', marginal="rug")

In [None]:
px.histogram(
    df, 
    x='lifeExp', 
    y='pop',
    hover_name='country', 
    color='continent', 
    marginal="rug",
)

In [None]:
px.histogram(
    df, 
    x='lifeExp', 
    y='pop',
    hover_name='country', 
    color='continent', 
    marginal='rug',
    facet_col='continent', 
)

In [None]:
px.bar(
    df, 
    x='pop', 
    y='continent',
    hover_name='country', 
    color='lifeExp', 
)

Analyse als Teile eines Ganzen - Länder sind Teile eines Kontinents.

In [None]:
px.sunburst(
    df, 
    color='lifeExp', 
    values='pop',
    hover_name='country', 
    path=['continent', 'country']
)

In [None]:
px.treemap(
    df, 
    color='lifeExp', 
    values='pop',
    hover_name='country', 
    path=['continent', 'country']
)

In [None]:
px.choropleth(
    df, 
    color='lifeExp', 
    locations='iso_alpha',
    hover_name='country', 
)

Hypothese: Wohlstand und Gesundheit hängen zusammen?

In [None]:
px.scatter(
    df, 
    x='gdpPercap', 
    y='lifeExp', 
    hover_name='country',
    color='continent',
    size='pop',
    )

In [None]:
px.scatter(
    df, 
    x='gdpPercap', 
    y='lifeExp', 
    hover_name='country',
    color='continent',
    size='pop',
    size_max=60,
    log_x=True,
    )

Diese Visualisierung ist durch den schwedischen Arzt Hans Rosling berühmt geworden.

Das Datenset ist nach seiner Stiftung, der [Gapminder Foundation](https://www.gapminder.org/) benannt.

### Plotly anpassen

In [None]:
fig = px.scatter(
    df, 
    x='gdpPercap', 
    y='lifeExp', 
    hover_name='country',
    color='continent',
    size='pop',
    size_max=60,
    log_x=True,
    )

Plotlys Figureobjekte sind intern JSON, das macht sie etwas leichter verständlich.

Alle Attribute hier können angepasst werden:

In [None]:
print(fig.to_json(pretty=True))

In [None]:
fig = px.scatter(
    df, 
    x='gdpPercap', 
    y='lifeExp', 
    hover_name='country',
    color='continent',
    size='pop',
    size_max=60,
    log_x=True,
    height=600,
    width=1000,
    template='simple_white',
    color_discrete_sequence=px.colors.qualitative.G10,
    title="Health vs Wealth 2007",
    labels={
        'continent': 'Continent',
        'pop': 'Population',
        'gdpPercap': 'GDP per Capita (US$ PPP)',
        'lifeExp': 'Life Expectancy (years)',
    },
)

fig.update_layout(
    font_family='Rockwell',
    legend={
        'orientation': 'h',
        'title': '',
        'y': 1.1,
        'x': 1,
        'xanchor': 'right',
        'yanchor': 'bottom',
    }
)
fig.update_xaxes(tickprefix='$', range=[2, 5], dtick=1)
fig.update_yaxes(range=[30, 90])
# Linien zeigen gewichtete Durchschnitte.
fig.add_hline((df['lifeExp']*df['pop']).sum() / df['pop'].sum(), line_width=1, line_dash='dot')
fig.add_vline((df['gdpPercap']*df['pop']).sum() / df['pop'].sum(), line_width=1, line_dash='dot')
fig.show()

### Übung

Reproduziere den Plot mit den Fluggastzahlen 2020 aus dem Matplotlib-Teil.

Hinweis:
- Nutze px.line für einen Linienplot.

Daten sind gegeben:

In [None]:
import plotly.express as px
import pandas as pd

tsa_melted_holiday_travel = pd.read_csv(
    '../data/tsa_melted_holiday_travel.csv', 
    parse_dates=True, index_col='date'
)
tsa_2020 = tsa_melted_holiday_travel.loc['2020'].copy().drop(columns=['year'])
tsa_2020['7D mean'] = tsa_2020.rolling('7D').travelers.mean()
tsa_2020['YTD mean'] = tsa_2020.expanding().travelers.mean()

# Lösung hier...

.

.

.

.

.

.

.

.

.

.

.

.

In [None]:
fig = px.line(tsa_2020, y=['travelers', '7D mean', 'YTD mean'])
fig.update_layout({"xaxis_title": "Date", "yaxis_title": "Travelers"})
fig.show()