# Datenvisualisierung mit Plotly

Plotly gibt es auch für Python: https://plotly.com/python/ 

```
pip install plotly
```

## Basisbeispiel 

mit Gapminder Dataset von hier: https://plotly.com/python/bubble-charts/


In [40]:
import plotly.express as px

# Plotly Express bringt selbst schon einige Datensätze mit: 
df = px.data.gapminder()

df.head()

Unnamed: 0,country,continent,year,lifeExp,pop,gdpPercap,iso_alpha,iso_num
0,Afghanistan,Asia,1952,28.801,8425333,779.445314,AFG,4
1,Afghanistan,Asia,1957,30.332,9240934,820.85303,AFG,4
2,Afghanistan,Asia,1962,31.997,10267083,853.10071,AFG,4
3,Afghanistan,Asia,1967,34.02,11537966,836.197138,AFG,4
4,Afghanistan,Asia,1972,36.088,13079460,739.981106,AFG,4


In [42]:
# Was ist da denn jetzt bei rausgekommen? 
type(df)

pandas.core.frame.DataFrame

In [43]:
# Jetzt machen wir einen coolen Scatter Plot mit Bubbles

fig = px.scatter(df.query('year==2007'), x='gdpPercap', y='lifeExp', 
                 size='pop', color='continent', 
                 hover_name='country', log_x=True, size_max=60, 
                 title='Life expectancy by GDP per capita for each country in 2007', 
                 labels=dict(gdpPercap="GDP per capita", lifeExp='Life expectancy', continent='Continent'))
fig.show()

In [44]:
# Und was ist diese Figure jetzt eigentlich?
type(fig)

plotly.graph_objs._figure.Figure

## Glassdoor Beispiel

mit Gender Pay Gap Dataset von hier: https://www.kaggle.com/nilimajauhari/glassdoor-analyze-gender-pay-gap

In [37]:
import pandas as pd

# Hier muss man natürlich noch anpassen an sein Working Directory: 
da = pd.read_csv('data/Glassdoor_Gender_Pay_Gap.csv')

da.head()


Unnamed: 0,JobTitle,Gender,Age,PerfEval,Education,Dept,Seniority,BasePay,Bonus
0,Graphic Designer,Female,18,5,College,Operations,2,42363,9938
1,Software Engineer,Male,21,5,College,Management,5,108476,11128
2,Warehouse Associate,Female,19,4,PhD,Administration,5,90208,9268
3,Software Engineer,Male,20,5,Masters,Sales,4,108080,10154
4,Graphic Designer,Male,26,5,Masters,Engineering,5,99464,9319


In [38]:
# Und jetzt ein Scatter Plot mit ein paar ganz wenigen Tweaks: 

fig = px.scatter(da, x ='Age', y='BasePay', color='Gender', hover_name='JobTitle', 
                 title='Annual basepay by age and gender')
fig.show()

In [39]:
# Und ein Boxplot für die verschiedenen "Departments"

fig = px.box(da, x='Dept', y='BasePay', color='Gender', 
             title='Gender differences in pay distribution per department')
fig.show()