# Lektion 11: Plotten mit der Matplotlib

----

Ziel der Lektion

 * Plotten mit `matplotlib`
 * `homogenize_plot.py`
 
----

Für die Datenvisualisierung nutzen wir die Python-Bibliothek `matplotlib`, die sich nahtlos an die `numpy`-Bibliothek anschliesst.

### 1. `matplotlib` in Jupyter-Notebooks

Bevor wir anfangen, Plots zu erzeugen, müssen einige Vorbereitungen geschaffen werden, damit die Plots überhaupt klappen können. In Jupyter-Notebooks brauchen wir immer wiederkehrende Befehle als `Präambel` in den Code-Zellen:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt

Damit wird die `matplotlib` mit dem Alias `plt` geladen und die Magic-Zeile am Anfang `%matplotlib inline` schaltet die `matplotlib` sinnvoll für die Notebooks um (klappt __nicht__ in Scripten!).

Die nächsten Zeilen sind Standards für die Erstellung von Plots und sollten immer beherzigt werden:

In [None]:
%matplotlib inline
# Präambel

import matplotlib.pyplot as plt

# configure plot

fig, ax = plt.subplots()       # create a figure with axes

ax.plot([1,2,3],[4,5,6])       # example plot

# use always useful labels and titles
ax.set_xlabel('Numbers')       # label for x axes 
ax.set_ylabel('More numbers')  # label for y axes
ax.set_title('Numbers-Plot')   # title for the plot

An diesem Beispiel sind die letzten 3 Zeilen wichtig: jeder Plot sollte *sinnvolle* Achsenbeschriftungen und einen Titel haben, damit man weis, was gegen was und warum geplottet wird! (Dieses sind Standard für jedes Plot-Programm, siehe gnuplot!)

----

### 2. Verschiedene Plot-Typen

Es gibt viele Möglichkeiten, Daten zu visualisieren. Wir beschränken uns hier auf die wichtigsten Plot-Typen um sog. xy-Daten zu visualisieren. Sie können jederzeit die `matplotlib`-[Galerie](https://matplotlib.org/stable/gallery/index.html) aufrufen und nach einem geeigneten Plot-Typ für Ihre Ideen suchen. Die Galerie bietet in der Regel immer ein paar Demos mit Programm-Codes an, die Sie dann übernehmen können! Zudem wollen wir hier *nur* die __statischen nicht-interaktiven__ Plots zeigen, die in der Regel vollkommen ausreichend sind.

Zum Vergleich der verschiedenen Plot-Typen erzeugen wir erstmal Daten:

In [None]:
import numpy as np

x = np.array([1,2,3,4,5])
wx = np.array([4,2,3,1,5])
y = np.array([1,1.2,3,2.5,3.3])
x_err = np.array([0.05,0.01,0.02,0.1,0.04])
y_err = np.array([0.2,0.25,0.21,0.15,0.19])

Wir nutzen beim Plotten __immer__ `numpy`-Arrays, die `matplotlib` kann auch python-Listen darstellen!

#### 2.1 Linien-Plot

Als einfachen Plot können Sie die Daten $x$ gegen $y$ auftragen, wobei die Punkte durch *gerade* Linien verbunden werden:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt

fig, ax = plt.subplots()       

ax.plot(x,y)                    # line plot

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Line-Plot')

Wichtig ist hierbei, dass jeweils benachbarte Punkte mit einer Linie verbunden werden, dazu sollten die $x$-Werte aufsteigend sortiert sein, sonst gibt es Verwirrungen:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt

fig, ax = plt.subplots()

ax.plot(wx,y)                   # wrong line plot

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Wrong-Line-Plot')

#### 2.2 Scatter-Plot

Dieser Plot-Typ zeigt alle Datenpunkte ohne diese zu verbinden:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt

fig, ax = plt.subplots()

ax.scatter(x,y)                 # scatter-Plot

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Scatter-Plot')

#### 2.3 Fehlerbalken-Plot

Ein Fehlerbalken-Plot ist ein wenig aufwendiger, als erstes ein Plot mit Fehlern für die $y$-Werte:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt

fig, ax = plt.subplots()

ax.errorbar(x,y,y_err, marker='o', capsize=3, linestyle='--')       # errorbar-Plot

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Errorbar-Plot 1')

oder mit $x$- und $y$-Fehlern (und __keiner__ Linie zwischen den Punkten):

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt

fig, ax = plt.subplots()

ax.errorbar(x,y,xerr=x_err, yerr=y_err,  marker='o', capsize=3, linestyle='')       # errorbar-Plot

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Errorbar-Plot 2')

#### 2.4 Balken-Plots

Nützlich sind auch Balken-Plots:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt

fig, ax = plt.subplots()

ax.bar(x,y)               # bar-Plot

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Bar-Plot 1')

Man kann auch die Breite der `bars` wählen:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt

fig, ax = plt.subplots()

ax.bar(x,y, width=1.)              # bar-Plot

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Bar-Plot 2')

----

### 3. Farben und Stile

Neben den Typen der Plots bietet die `matplotlib` viele Möglichkeiten der Anpassung und der Verschönerung. 

In dem Fall, dass z.B. mehrere Plots übereinander dargestellt werden sollen, z.B. verschiedene Kurven, ist es notwendig, wenn sich diese Kurven durch verschiedene Farben und Stile unterscheiden. `matplotlib` generiert bei übereinanderliegenden Kurven jeweils eine andere Farbe:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt
import numpy as np

fig, ax = plt.subplots()


x = np.linspace(0,2*np.pi,1000)


ax.plot(x, np.sin(x))
ax.plot(x, np.cos(x))

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Color-Plot 1')

Möchten Sie den ersten Plot **rot** und den zweiten Plot **grün** haben, so können Sie das auch vorgeben:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt
import numpy as np

fig, ax = plt.subplots()


x = np.linspace(0,2*np.pi,1000)


ax.plot(x, np.sin(x), color='red')
ax.plot(x, np.cos(x), color='green')

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Color-Plot 2')

Das gleiche betrifft auch den Stil der Linien. Als Grundunterscheidung setzt `matplotlib` erstmal  auf Farben, aber man diesen Stil auch verändern:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt
import numpy as np

fig, ax = plt.subplots()


x = np.linspace(0,2*np.pi,1000)


ax.plot(x, np.sin(x), linestyle='--')   # is equal to dashed
ax.plot(x, np.cos(x), linestyle='dotted')

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Color-Plot 3')

Für einen Plot, in dem einzelne Punkte hervorgehoben werden sollen, Scatter, Errorbar usw., kann man auch den Stil des *Punktes* (Marker) definieren:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt
import numpy as np

fig, ax = plt.subplots()

x = np.array([1,2,3,4,5])
y = np.array([1,1.2,3,2.5,3.3])

ax.scatter(x,y, marker='o')                 # scatter-Plot
ax.scatter(x,y+0.5, marker='.')   
ax.scatter(x,y+1.0, marker='x')   
ax.scatter(x,y+1.5, marker='>')   
ax.scatter(x,y+2.0, marker='^')   

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Scatter-Plot 1')

Eine Mischung der Farben und Stile ist natürlich möglich!

----

### 4. Beschriftungen und Legenden

#### 4.1 Beschriftungen

Grundsätzlich sollen ja alle Achsen beschriftet und ein Titel gesetzt werden. In vielen Fällen sollen/müssen dort Formeln oder Formel-Fragmente benutzt werden. Dazu verwendet man in der `matplotlib` sog. Raw-Strings, die mit `r'...'` eingeleitet werden. Die Raw-Strings werden dann besonders interpretiert und man kann dort $\LaTeX$-Code verwenden. Für das erste sollen diese Beispiele reichen:

* Variablen und Formeln werden in `$...$` geschrieben
* Hochgestellt wird mit `^`, Tiefergestellt mit `_`; wird mehr als ein Zeichen *verstellt*, so muss der Ausdruck in `{...}` geschrieben werden
* Einheiten werden nicht in besonders formatiert
* sollen Wörter verstellt werden, so nutzte man `{\mbox{}

Beispiele:
* `r'$x$` -> $x$
* `r'$x^2$'` -> $x^2$
* `r'$x_n$'` -> $x_n$
* `r'$T$ [K]'`  -> $T$ [K]
* `r'$T_{\mathrm{eff}}$'` -> $T_{\mathrm{eff}}$

#### 4.2 Legenden

In Fällen, wo mehrere Plots übereinandere liegen, sollte man diese in sog. *Legenden* besonders deutlich machen:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt
import numpy as np

fig, ax = plt.subplots()


x = np.linspace(0,2*np.pi,1000)


ax.plot(x, np.sin(x), linestyle='-', label=r'$\sin(x)$')   # is equal to dashed
ax.plot(x, np.cos(x), linestyle='dotted', label='$\cos(x)$')

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Color-Plot 3')
ax.legend(loc='upper right')

Wie Sie sehen, setzt `matplotlib` alle Stile zur Identifikation ein!

Man erkennt hier leider auch, dass die Legenden-Box den eigentlichen Plot überdeckt. Dazu kann man den y-Plot-Bereich verändern:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt
import numpy as np

fig, ax = plt.subplots()


x = np.linspace(0,2*np.pi,1000)


ax.plot(x, np.sin(x), linestyle='-', label=r'$\sin(x)$')   # is equal to dashed
ax.plot(x, np.cos(x), linestyle='dotted', label='$\cos(x)$')

ax.set_ylim(-1.2,1.6)   # adjust the plot region for the y axes
ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Color-Plot 3')
ax.legend(loc='upper right')

`ax.set_ylim(...,...)` erwartet 2 Argumente für den unteren und oberen Bereich. Analog könnte man auch den Bereich für die $x$-Achse beschränken.

----

### 5. Multiple Plots

An vielen Stellen ist es sinnvoll, mehrere Plots nicht nur übereinander, sondern auch nebeneinander zu erstellen. Die `matplotlib` bietet dafür beim Erzeugen der `figure`-Umgebung die Möglichkeit, Plot-Slots zu erzeugen, dazu kann man `plt.subplots(...)` mit Argumenten versehen. Der erste Parameter definiert, wieviele Zeilen für Plots reserviert werden und der zweite Parameter, wieviele Plots in einer Zeile sich befinden. Der dritte Parameter `figsize=(...,...)` gibt die Größe bzw. Seitenverhältnisse der `figure`-Umgebung an:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt
import numpy as np

fig, ax = plt.subplots(1,2, figsize=(15,5))


x = np.linspace(0,2*np.pi,1000)


ax[0].plot(x, np.sin(x), linestyle='-', label=r'$\sin(x)$')   # is equal to dashed
ax[1].plot(x, np.cos(x), linestyle='dotted', label='$\cos(x)$')

ax[0].set_xlabel(r'$x$')
ax[0].set_ylabel(r'$y$')
ax[0].set_title(r'$\sin (x)$')
ax[1].set_xlabel(r'$x$')
ax[1].set_ylabel(r'$y$')
ax[1].set_title(r'$\cos (x)$')

Wichtig ist hierbei, dass Sie für jeden Plot-Slot eine __Achse__ als Python-Liste zurückbekommen, die Sie dann speziell ansprechen können, um dort den Plot zu estellen!

----

### 6. Spezielle Plots

#### 6.1 Torten-Diagramme

Torten-Diagramme sind in manchen Fällen nützlich, um Zusammensetzungen darzustellen:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt


# Daten aus dem MSCI-World Index
countries = {
    'Canada' : 0.032,
    'France' : 0.0316,
    'Japan' : 0.0645,
    'UK'    : 0.0396,
    'USA'   : 0.6931,
    'Other' : 0.1393
}
print(countries)


# Pie chart, where the slices are plot counter-clockwise:
explode = (0, 0, 0, 0.1, 0, 0)  # only "explode" the 4th slice (i.e. 'UK')
colors = ['blue', 'red', 'yellow', 'violet', 'green']


# important parameters
# labels: the labels of the wedges
# colors: colors of the wedges
# autopct: format of the value written in the wedge
# shadow: paint a shadow around the pie
# startangle: change the startangle (counter clockwise)
# radius: radius of the pie

# Create 2 pie charts side-by-side. ax is a list with 2 elements.
fig, ax = plt.subplots(1, 2, figsize=(10,5))
_ = ax[0].pie(list(countries.values()), labels=list(countries.keys()), autopct='%1.1f%%',
        shadow=True, startangle=90);
#ax[0].axis('equal')  # Equal aspect ratio ensures that pie is drawn as a circle.

_ = ax[1].pie(list(countries.values()), labels=list(countries.keys()), autopct='%1.1f%%',
        radius=1.5, explode=explode, colors=colors)
#ax[1].axis('equal')

#### 6.1 Histogramme

Histogramme spielen in der Statistik eine große Rolle. Nehmen wir einfach mal eine große Menge von Zufallszahlen:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt

import numpy as np
import numpy.random as nr

data = nr.normal(loc=5, scale=0.5, size=10000)

fig, ax = plt.subplots()
                 
vals, bins, _ = ax.hist(data, bins=30)

`ax.hist(...)` erzeugt aus den Daten ein Histogram und gibt die Werte dann in den Variablen `vals` und `bins` zurück. 

In [None]:
print(vals)
print(bins)

In `bins` werden die gewählten Bereiche der Bins und in `vals` die Anzahl der Werte, die in den Binbereich fallen, zurückgegeben.

Die Bins in `ax.hist(...)` lassen sich auf verschiedene Weisen erzeugen:
 * `bins=XXX`  Anzahl XXX bins
 * `bins=[1,2,3,4,5]` z.B. 5 bins, wobei die Werte jeweils die Bin-Grenzen (halboffene Intervalle) darstellen

Man kann auch das Histogramm normieren `density=True`:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt
import numpy as np

import numpy as np
import numpy.random as nr

data = nr.normal(loc=5, scale=0.5, size=10000)

fig, ax = plt.subplots()
                 
vals, bins, _ = ax.hist(data, bins=30, density=True)

Viele Möglichkeiten kann man auch mit der `numpy`-Funktion `np.histogram` erreichen, wobei die gleichen Rückgabe-Werte erzeugt werden, das Histogram natürlich nicht geplottet wird!

----

### 7. Plots abspeichern und `homogenize_plot.py`

Haben Sie einen Plot fertiggestellt, so möchten Sie diesen auch abspeichern und dann weiter verwenden. `matplotlib` stellt dazu den Befehl `plt.savefig` zur Verfügung:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt
import numpy as np

fig, ax = plt.subplots()


x = np.linspace(0,2*np.pi,1000)


ax.plot(x, np.sin(x), color='red')
ax.plot(x, np.cos(x), color='green')

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Nice plot')

plt.savefig('niceplot.png')

Als Argument wird dabei nur ein Dateiname benötigt. `plt.savefig` kann anhand der Dateiendungen das Format bestimmen, so können Sie auch eine `pdf`- oder `jpeg`-Datei erzeugen. 

Mit dem Parameter `dpi=XXX` können Sie die Größe beeinflussen:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt

fig, ax = plt.subplots()


x = np.linspace(0,2*np.pi,1000)


ax.plot(x, np.sin(x), color='red')
ax.plot(x, np.cos(x), color='green')

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Nice plot')

plt.savefig('niceplot2.png', dpi=600)

Mit diesen Funktionen können Sie Ihre Plots schon mal sehr gut abspeichern. Wollen Sie diese Plots allerdings in Text-Dokumente einbetten, so kommen Sie schnell zu dem Problem, dass Plot-Größe und Beschriftungen meistens nicht gut aufeinander abgestimmt sind. 

Abhilfe schafft ein spezielles Modul `homogenize_plot.py` welches angepasste Graphiken erzeugt:

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt
import numpy as np

import code2.homogenize_plot as hp


hp.set_params(fig_width=2.8)   # use the homogenize_plot modul

fig, ax = plt.subplots()


x = np.linspace(0,2*np.pi,1000)


ax.plot(x, np.sin(x), color='red')
ax.plot(x, np.cos(x), color='green')

ax.set_xlabel(r'$x$')
ax.set_ylabel(r'$y$')
ax.set_title('Nice plot')

plt.savefig('niceplot_hp.png')

hp.revert_params() # reset all parameters

**Beispiel für $\LaTeX$:**

Wenn Sie die obigen Zeilen ausgeführt haben, haben Sie zwei Dateien `niceplot.png` und `niceplot_hp.png` erzeugt. In dem Materialien  finden Sie die $\LaTeX$-Quell-Datei `data/latex.tex` . Sie können diese Datei mit den beiden Plots in eine $\LaTeX$-Umgebung kopieren und dann übersetzen. Passen Sie evt. den Pfad zu den Bildern in dem Quelltext an. Dann sehen Sie den Unterschied, den `homogenize_plot.py` mit den Plots erzeugt. 

In der Regel werden Sie erstmal nur einspaltige Dokumente erzeugen, wobei Sie dann `fig_width=7` nutzen können.

----