# 02 Formatting

* Sortierung von Achsen
* Datatypes für Altair
* Farben
* Formatierung


In [None]:
#import libraries
import altair as alt
import pandas as pd


### Order
Mit `alt.Y('col', sort='-x' )` können wir Achsen sortieren. 

In [None]:
# Order
alt.Chart(df_top_height).mark_bar().encode(
    x = 'height_m',
    y = alt.Y('name', sort='-x'), 
)


### Datatypes
Wir können Altair mitgeben, als was für einen Datentypen er eine Spalte behandeln soll.

* `Q`: quantitative data - numeric values
* `O`: ordinal data - ordered categories (e.g. Generation 1,2,3)
* `N`: nominal data - categories with no order (e.g. type1 seed, rock, water...)
* `T`: temporal data

In [None]:
df_top_height = df.sort_values('height_m', ascending = False).head(10)
df_top_height.head(2)

In [None]:
# Bar chart: wir fügen Farbe hinzu
alt.Chart(df_top_height).mark_bar().encode(
    x = 'height_m',
    y = alt.Y('name', sort='-x' ), 
    color='height_m:Q'
)

## Farben

`alt.Color('col').scale(scheme='your_scheme')` können wir Farbschemas festlegen. 

Eine Auswahl
* viridis
* magma
* plasma
* turbo
* yelloworangebrown
* purplered
* purplebluegreen
* blueorange

[Mehr Farbschemas](https://vega.github.io/vega/docs/schemes/)

In [None]:
alt.Chart(df_top_height).mark_bar().encode(
    x = 'height_m',
    y = alt.Y('name', sort='-x' ), 
    color=alt.Color('height_m:Q').scale(scheme='purplered')
)

### Eigene Farbskalen

Wir können je eine Liste für die Werte die eingefärtbt werden (domain) und eine mit den Farben erstellen (range). Und Altair macht uns daraus eine eigene Farbskala. 

Wichtig: beide Listen müssen gleich lang sein.

In [None]:
df.head(1)

In [None]:
df['speed'].min()

In [None]:
domain = [15, 150]
range = ['blue', 'orange']

alt.Chart(df).mark_point().encode(
    x = 'speed', 
    y = 'height_m', 
    color = alt.Color('speed').scale(domain=domain, range=range)
)

#### Mit Farben Werte gruppieren
Wir können unter color eine zusätzliche Spalte angeben, nach Welcher die Werte eingefärbt werden. 

In [None]:
alt.Chart(df).mark_bar().encode(
    x = 'height_m',
    y = alt.Y('type1', sort='-x' ), 
    color='is_legendary:N'
)

In [None]:
df

### Quizz



df `df_generation_type` unten zeigt für jede Generation von Pokemons an, wie viele Wasser, Normale, Gift-Pokemon es gab. 
1. Mache einen Barchart mit Generation 1 - 7 auf der Y Achse und Anzahl Pokemon insgesamt auf der X Achse. (Tip: Datentypen)
2. Füge Farbe nach type1 hinzu. Experimentiere mit Datentypen bei der Farbe
3. Ändere das Farbschema. 

In [94]:
df_raw = pd.read_csv("data/pokemon.csv")
df_generation_type = df_raw.groupby('generation')['type1'].value_counts().reset_index()
df_generation_type

Unnamed: 0,generation,type1,count
0,1,water,28
1,1,normal,22
2,1,poison,14
3,1,bug,12
4,1,grass,12
...,...,...,...
109,7,dragon,3
110,7,steel,2
111,7,ground,2
112,7,fairy,1


In [93]:
alt.Chart(df_generation_type).mark_bar().encode(
    x = 'count', 
    y = 'generation:N',
    color = alt.Color('type1:N').scale(scheme = 'blueorange')
)

4. Kehre den Plot um und plotte 
* X-Achse: count, 
* Y-Achse: type1
* Farbe: generation

5. Sortiere die Y-Achse absteigend nach den Werten der X-Achse

In [99]:
alt.Chart(df_generation_type).mark_bar().encode(
    x = 'count', 
    y = alt.Y('type1', sort='-x'),
    color = alt.Color('generation').scale(scheme = 'blueorange')
)

6. Erstelle deine eigene Farbskala für den plot und färbe damit Generation 1-7 ein. <br>
... Teste auch hier verschiedene Datentypen für die Farbe. 

In [130]:
domain = [1, 3.5, 7]
range = ['lightgreen', 'orange', 'purple']

In [131]:
alt.Chart(df_generation_type).mark_bar().encode(
    x = 'count', 
    y = alt.Y('type1', sort='-x'),
    color = alt.Color('generation:Q').scale(domain=domain, range = range)
)

## Formatierung

In [132]:
alt.Chart(df_generation_type).mark_bar().encode(
    x = 'count', 
    y = alt.Y('type1', sort='-x'),
    color = alt.Color('generation').scale(domain=domain, range = range)
).properties(
    width = 600, 
    height = 350, 
    title = "Pokemon nach Typ und Generation" 
    
)

#### Mehr Formatierung

Hier gibt es eine [Dokumentation für mehr Formatierung](https://altair-viz.github.io/user_guide/customization.html#adjusting-the-title)

Achsen
* `.scale(zero=False)`: schneidet Achse auf effektive Werte zu (statt bei 0 anzufangen)
* `.title('<Achsenname>')`: lässt uns Achsen neu bennenen
Titel
* `alt.Title()`: Damit können wir Subtitel einfügen und die Platzierung des Titels bestimmen
Legende
* `legend(orient="left")`: Orientierung der Legende
* `.title('<name>')`: Name der Legende, `None` für keinen Titel

In [140]:
# Mehr Formatierung 
alt.Chart(df_generation_type).mark_bar().encode(
    x = alt.X('count').title('Anzahl'), 
    y = alt.Y('type1', sort='-x').title('Pokemontyp'),
    color = alt.Color('generation').scale(domain=domain, range = range).legend(orient="left").title(None)
).properties(
    width = 600, 
    height = 350, 
    title = alt.Title("Pokemon nach Typ und Generation",
       subtitle="Inklusive Subtitel",
       anchor='start', # <- rechts- oder links-bündig
       orient='top', # <- oben/ unten
       offset=20 # <- Abstand zum Chart
       )
)
