Es gibt viele Arten von Grafiken, mit denen man seine Daten visualisieren kann.

Man sollte immer wissen, welche Grafik momentan geeignet ist, wobei es meistens nur von den Daten abhängig ist, aber auch zum Teil von der eigenen Vorliebe.

### Kreisdiagramme    


# Kreisdiagramme (oder Tortendiagramme) sind neben Säulen- und Balkendiagrammen eine gute Möglichkeit um wenige kategorische Werte grafisch darzustellen.

# Bei ihnen bildet der Gesamte Kreis 100%, bei dem die einzelnen Kategorien in Tortenstücken entsprechend ihrem prozentualen Anteil dargestellt werden.

# In plotly.express können wir ein Kreisdiagramm durch pie() erzeugen.

# names gibt hierbei den Namen der Spalte an (im Idealfall eine kategorische Spalte), dessen Kategorien prozentual dargestellt werden.
# Auch pie() besitzt den Parameter title um einen Titel zu erzeugen.

In [1]:
import pandas as pd
import plotly.express as px

df_pie = pd.DataFrame({'Kategorie': ['Elektronik', 'Kleidung', 'Lebensmittel', 'Kleidung', 'Elektronik', 'Kleidung', 'Lebensmittel', 'Haushalt', 'Elektronik', 'Kleidung'],
                       'Wert': [50, 25, 15, 10, 40, 30, 10, 5, 35, 25]})

fig_pie = px.pie(df_pie, names='Kategorie', title="Anteile der Produktkategorien")
fig_pie.show()

# Liniendiagramme
# Ein Liniendiagramm zeichnet eine Verlaufkurve von Datenpunkt zu Datenpunkt.

# Es ist dabei eine zweidimensionale Grafik, soll heißen: Wir brauchen Spalten sowohl für die x-, als auch für die y-Achse.
 
# In plotly.express können wir ein Liniendiagramm durch line() erzeugen.

# Hierbei haben wir die selben Parameter, wie bei bar():

# x weißt der Grafik eine Spalte für die x-Achse zu
# y weißt der Grafik eine Spalte für die y-Achse zu
# title erzeugt einen Titel

In [2]:
df_line = pd.DataFrame({'Monat': ["Januar", "Februar", "März", "April", "Mai", "Juni", "Juli", "August", "September", "Oktober", "November", "Dezember"],
                        'Umsatz': [8533, 8943, 9765, 10951, 11213, 12067, 13253, 13629, 13412, 14235, 15987, 19432]})

px.line(df_line, x="Monat", y="Umsatz", title="Umsatz pro Monat")

## Datensätze
# Es ist sehr mühselig sich eigene DataFrames zum Üben zu erstellen.

# Einige Module bieten deshalb Datensätze an, die für die verschiedensten Übungen geeignet sind.

# So bietet plotly.express ein weiteres Untermodul namens data an, aus dem einige Datensätze geladen werden können.

# Wir laden als Beispiel den Datansatz iris(), welcher 150 Iris-Blumen und deren Daten enthält:

In [3]:
df = px.data.iris()
df.head()

Unnamed: 0,sepal_length,sepal_width,petal_length,petal_width,species,species_id
0,5.1,3.5,1.4,0.2,setosa,1
1,4.9,3.0,1.4,0.2,setosa,1
2,4.7,3.2,1.3,0.2,setosa,1
3,4.6,3.1,1.5,0.2,setosa,1
4,5.0,3.6,1.4,0.2,setosa,1


Blumenarten: Setosa, Versicolor, Virginica

Feature	Beschreibung
Sepal Length	Länge des Kelchblattes
Sepal Width	Breite des Kelchblattes
Petal Length	Länge des Blütenblattes
Petal Width	Breite des Blütenblattes
Species	Art der Blume
