_Softwarepraktikum Blockkurs März 2020 (WS2019/20)_ 

# Visualisierung mit matplotlib[<sup>1</sup>](#fn1)

[Jörn Behrens](https://www.math.uni-hamburg.de/numgeo/) (joern.behrens@uni-hamburg.de)

## 1. Einführung und Ziel

Dieses Notebook führt einige einfache Methoden zur Datenvisualisierung ein. Wir werden in vielen Fällen Listen von Daten (arrays) verwenden. Solche Arrays werden am sinnvollsten im numerischen Paket `numpy` definiert, das wir daher am Anfang einführen. 

### Voraussetzung

Ein inzwischen gut gesicherter Umgang mit Python als Programm-Umgebung und Grundlegendes Verständnis von Funktionen und Graphen.

## 2. Exkurs: Kurze Einführung in NumPy Arrays

In diesem kurzen Teil werden wir `numpy` verwenden, um einfache Datenstrukturen für die Visualisierung zu erzeugen. Ein `array` ist eine Liste von Objekten (in unserem Falle meist Zahlen). Die Objekte sind - ganz analog zu einem Vektor - über einen Index addressierbar:

$$
\mathbf{a} = (a_0, a_1, \ldots, a_n).
$$

### Arrays erzeugen und Eigenschaften ermitteln

In Python laden wir zunächst die `numpy` Umgebung und deklarieren dann das Array `a`.

In [None]:
import numpy as np
a = np.array([1,2,3,4,5])
print(a)

Nun können wir verschiedene Informationen über dieses Array bekommen:
* `shape`: gibt die Form des Arrays zurück, es kann auch mehrdimensional sein
* `size` : gibt die Größe des Arrays zurück
* `ndim` : gibt die Anzahl der Dimensionen zurück


In [None]:
print(a.shape)
print(a.size)
print(a.ndim)

Ein sehr großes Array kann man auch automatisch erzeugen mit dem `arange` Befehl. Ein Array aus Zufallszahlen lässt sich mit `random.rand` erzeugen:

In [None]:
x = np.arange(100)
print(x.shape, x.size, x.ndim)
y = np.random.rand(20,5)
print(y.shape, y.size, y.ndim)

### Form des Arrays manipulieren

Die Form des Arrays lässt sich ändern, indem man dem `shape`-Befehl entsprechende Angaben macht:

In [None]:
x = np.arange(100)
print(x.shape, x.size, x.ndim)
x.shape = (2,50)
print(x.shape, x.size, x.ndim)

Man kann Python auch die Größe in einer Dimension automatisch ermitteln lassen:

In [None]:
y.shape = (4,5,-1)
print(y.shape, y.size, y.ndim)

### Indizierung

Um nun einzelne Einträge im Array zu addressieren verwenden wir die folgenden Ausdrücke:

In [None]:
print(a[0], a[2])

Wir können auch eine Teilmenge aus dem Array ausschneiden:

In [None]:
print(a[0:3])

Um mit dem Array $x$ noch etwas besser umgehen zu können werden wir es nochmals in der Form verändern.

In [None]:
x.shape = (20,5)

Nun können wir verschiedene Konstrukte demonstrieren:

In [None]:
print("Die ersten 4 Zeilen\n", x[:4])
print("Zeile 18 bis zum Ende\n", x[18:])
print("Die letzten 4 Zeilen\n", x[-5:])
print("Die Zeilen umgekehrt\n", x[::-1])
print("Die erste Spalte\n", x[:,0])

Logische Konstrukte zur Indizierung - Beispielsweise nur die geraden Einträge (der `%`-Befehl ist die Modulo Funktion):

In [None]:
print(x[(x % 2) == 0])

Schließlich können wir auch Permutationen durchführen. Beachten Sie, dass wir dazu doppelte eckige Klammern verwenden, denn wir benötigen eine Liste von Indizes:

In [None]:
print(a[[2,0,4,1,3]])

### Rang-Erweiterungen (Broadcasting)

Eine sehr nützliche Funktion in NumPy (natürlich ist das eigentlich eine Eigenschaft der numerischen Linearen Algebra) ist das sogenannte Broadcasting. Dabei kann man Arrays dazu verwenden die Dimensionszahl zu erhöhen und somit Gitterfunktionen zu erzeugen. Hier folgen ein paar einfache Beispiele, bevor wir den kurzen Exkurs in NumPy beenden.

In [None]:
u = np.arange(100)
u.shape = (20,5)
v = np.random.rand(4,20,5)
print("Form von u:", u.shape)
print("Form von v:", v.shape)
w1= u+v
print("Form von w1:", w1.shape)

Die Erweiterungsdimension kann kontrolliert werden:

In [None]:
w2 = u[np.newaxis, :, :] + v
print("Form von w2:", w2.shape)
w3 = np.tile(u, (4,1,1)) + v
print("Form von w3:", w3.shape)

Sind diese Erweiterungen jetzt identisch?

In [None]:
print("Vergleich w1 mit w2: Identisch? ", np.all(w1 == w2))
print("Vergleich w1 mit w3: Identisch? ", np.all(w1 == w3))

Zu guter letzt noch ein Rang-1 Update (entspricht der Multiplikation eines Spaltenvektors mit einem Zeilenvektor):

In [None]:
x = np.arange(-5, 5, 0.1)  # Array von -5 bis 5 mit Schrittweite 0.1
y = np.arange(-8, 8, 0.25) # Array von -8 bis 8 mit Schrittweite 0.25
print(x.shape, y.shape)
z = x[np.newaxis, :] * y[:, np.newaxis]
print(z.shape)
print(z[:5,:5])

## 3. Erste Schritte mit matplotlib

Zunächst überprüfen wir die Versionsnummer und die Plot-Umgebung. Dabei gibt es verschiedene Umgebungen, die wir nutzen können. Per Default ist in Jupyter Notebook die Umgebung `ipykernel.pylab.backend_inline` eingestellt. Eine andere sinnvolle Umgebung heißt `nbagg`. Wir werden jedoch zunächst mit dem Default arbeiten.

**Beachten Sie:** Wenn Sie die `nbagg` Umgebung verwenden, dann erscheint eine Graphik erst, wenn der Befehl `show()` Ausgeführt wurde.

In [None]:
import matplotlib
print(matplotlib.__version__)
print(matplotlib.get_backend())
# matplotlib.use('nbagg')
# print(matplotlib.get_backend())

Um nun wirklich etwas darstellen zu können müssen wir das Modul `pyplot` aus der `matplotlib` laden. Anschließend lässt sich eine Funktion - beispielsweise die $\sin$-Funktion darstellen (wir verwenden dabei das oben definierte Intervall $x=(-5,5)$).

In [None]:
import matplotlib.pyplot as plt
y=np.sin(x)
plt.plot(x,y); # Verwende ein Semikolon, um die Ausgabe von Plot zu unterdrücken!

Sehr schön, unser erster Plot der $\sin$-Funktion. 

### Achsen, Titel, Legende, etc.

Aber wir haben die Achsen nicht beschriftet und auch ein Titel fehlt. Gerne wollen wir auch jetzt ein besseres Intervall auswählen, vielleicht noch die Linienstärke bestimmen und die Farbe auswählen. Eine Legende wäre auch nicht schlecht. Die folgenden Befehle ermöglichen das:

In [None]:
x = np.arange(0,2*np.pi,0.1)
y = np.sin(2*x)
plt.plot(x,y,'r-',lw=2,label='Sinus') # r-: rote durchgezogene linie; lw=2 Linienweite = 2pt
plt.xlabel('x-Achse')
plt.ylabel('y-Aches')
plt.title('Sinus-Funktion')
plt.legend(loc = 'upper right');

### Arbeiten mit mehreren Graphen

Bevor wir in einem weiteren Arbeitsblatt auf Details der Visualisierung eingehen, werden wir nun noch kennen lernen, wie wir mehrere Graphiken verwenden und verschiedene Funktionen in einer Graphik unterbringen können. 

Um mehrere Achsen auf einem Ausgabepanel unter zu bringen, benötigen wir den Befehl `subplot`. Mehrere Funktionen kann man einfach durch das mehrfache Aufrufen des Befehls `plot`. Um zusätzlich noch die Achsen zu skalieren müssen wir mit handeln arbeiten. Diese werden durch den Befehl `subplot` erzeugt und zurück gegeben.

Das folgende Beispiel zeigt zwei Graphen mit jeweils eigenem Achsensystem übereinander. 

In [None]:
ax1 = plt.subplot(211)
ax1.plot(x,y,'b-')

ax2 = plt.subplot(212)
ax2.plot(2*x,np.sin(x*x),'r-');

Wir können die Graphiken auch nebeneinander platzieren und mit dem Befehl `set_title` mit Titeln versehen. Auch die Achsenbeschriftungen lassen sich so einfügen, dazu verwenden wir `set_xlabel`,`set_ylabel` und `legend` jeweils angewandt auf den Handle

In [None]:
ax1 = plt.subplot(121)
ax1.plot(x,y,'b-')
ax1.set_title('sin(x)')
ax1.set_xlabel('x-Achse')
ax1.set_ylabel('y-Achse')

ax2 = plt.subplot(122)
ax2.plot(x,(x*x*np.cos(x)),'r-', label='func')
ax2.set_title('$x^2$ * sin(x)')
ax2.legend(loc='upper left')
ax2.set_xlabel('x');

## 4. Erweiterte Plot-Funktionen und mehrdimensionale Darstellung

### Verschiedene Graphen-Typen

Bislang haben wir Liniengraphen kennen gelernt. Natürlich gibt es eine große Vielfalt weiterer Typen:

* `plot` erzeugt Liniengraphen
* `scatter` erzeugt Punktwolken
* `bar` erzeugt Balkendiagramme
* `fill` oder `stackplot` erzeugt mit Farbe ausgefüllte Graphen.

Für Funktionsgraphen oder Punktwolken können die Linien und die Marker (also die Symbole) gewählt werden. Hier sind ein paar Beispiele:

* `linestyle` = '--', ':', '-.' erzeugt eine gestrichelte, gepunktete, gestrichpunktete Linie
* `marker`= 'o', '^', 's' erzeugt punktförmige, dreieckige und quadratische (square) Markierungen

Als Beispiel können wir auf zwei verschiedene Weisen die Bevölkerungsstruktur Deutschlands (Jahr 2020, geschätzt nach [UN World Population Prospects](https://population.un.org/wpp/)) darstellen:

In [None]:
ref = ('0-24','25-49','50-74','75-90','90+') # Beschriftung der Altersgruppen
pop = np.array([20365,25939,37480,9513,982]) # Werte
x   = np.arange(np.size(pop))                # Einfache x-Zuordnungen für die Plots
fig = plt.figure()                           # Erzeuge Handle für die Graphik als Ganzes
ax1 = fig.add_subplot(121)                   # --- Erzeuge linkes Achsensystem ---
ax1.barh(x,pop)                              # Horizontales Balkendiagramm
ax1.set_yticks(x)                            # Erzeuge Markierungen für jeden Balken (und nur so viele)
ax1.set_yticklabels(ref)                     # Beschrifte die Markierungen mit den Altersgruppen
ax1.set_title('Bevökerungspyramide')         # Titel
ax1.set_xlabel('Tausend Individuen')         # x-Achse
ax1.set_ylabel('Altersgruppe')               # y-Achse

ax2 = fig.add_subplot(122)                   # --- Erzeuge rechtes Achsensystem ---
ax2.plot(x,pop/1000,linestyle=':',marker='o')# Liniengraphik mit Markern
ax2.set_xticks(x)                            # Erzeuge Markierungen an der x-Achse für jede Altersgruppe
ax2.set_xticklabels(ref)                     # Beschrifte x-Achsen Markierungen
ax2.set_title('Bevölkerungszahlen')          # Titel
ax2.set_xlabel('Altersgruppe')               # x-Achse
ax2.set_ylabel('Millionen')                  # y-Achse

fig.set_size_inches(10,5)                    # Definiere Graphik-Größe
fig.tight_layout(pad=2.);                    # Erhöhe Abstand zwischen Achsen

### Mehrdimensionale Graphen

Wir wollen nun Graphiken erzeugen, die von $(x,y)\in\mathbb{R}^2$ abhängen. Zunächst erzeugen wir uns ein Gitter im Einheitsquadrat, auf dem wir dann eine Funktion darstellen wollen. Dazu verwenden wir die NumPy Befehle `linspace` und `meshgrid`. Ersterer erzeugt ein Intervall mit 100 Gitterpunkten, und mit `meshgrid` wird aus zwei $x$- und $y$-Intervallen ein Gitter erzeugt, auf das mit Hilfe der Koordinaten $(x,y)$ zugegriffen werden kann.

Anschließend erzeugen wir die Werte für die Funktion
$$
f(x,y) = sin(2\pi x) * sin(2\pi y),
$$
welche wiederum zunächst mit Hilfe von `imshow` bzw. `contour` dargestellt werden soll.

In [None]:
X = np.linspace(0,1,100)                      # x-Koordinaten
Y = np.linspace(0,1,100)                      # y-Koordinaten
X,Y = np.meshgrid(X,Y)                        # (x,y)-Gitter
f = np.sin(2*np.pi*X) * np.sin(2*np.pi*Y)     # Funktion f(x,y)

fig2 = plt.figure()                           # Erzeuge Handle für die Graphik als Ganzes
ax1 = fig2.add_subplot(121)                   # --- Erstes Achsensystem ---
ax1.imshow(f)                                 # Farbdarstellung der Funktion in der (x,y)-Ebene

ax2 = fig2.add_subplot(122)                   # --- Zweites Achsensystem ---
#ax2.contourf(f)                              # gefüllte Kontouren
cont = ax2.contour(f, cmap='viridis');        # Höhenlinien
ax2.clabel(cont,fontsize=8);                  # Zahldarstellung an den Höhenlinien

fig2.set_size_inches(10,5)                    # Definiere Graphik-Größe
fig2.tight_layout(pad=2.);                    # Erhöhe Abstand zwischen Achsen

Ein dreidimensionaler Graph lässt sich aus diesen Daten erzeugen. Dazu wollen wir einerseits die Funktion `surf` zur Darstellung einer Oberfläche verwenden. Andererseits müssen wir für die `figure`-Umgebung eine drei-dimensionale Projektion wählen.

In [None]:
fig3 = plt.figure()                      # Erzeuge Graphik
ax1 = fig3.gca(projection='3d')          # Definiere 3D Projektion

ax1.plot_surface(X,Y,f,cmap='viridis');  # Plotte 3D Oberfläche
fig3.set_size_inches(10,5);              # Definiere Graphik-Größe

Als letztes wollen wir diese 3D Graphik noch beleuchten, damit sie realistischer daher kommt. Dazu verwenden wir die `LightSource`-Umgebung:

In [None]:
from matplotlib import cm                    # importiere ColorMap Umgebung
from matplotlib.colors import LightSource    # importiere LightSource
ls = LightSource(azdeg=340, altdeg=45)       # Definiere den Einstrahlwinkel der Lichtquelle

fig3 = plt.figure()                          # Erzeuge Graphik
ax1 = fig3.gca(projection='3d')              # Definiere 3D Projektion

rgb = ls.shade(f, cmap=cm.viridis, vert_exag=1, blend_mode='soft') # ls.shade erzeugt die Schattenwürfe
ax1.plot_surface(X,Y,f,facecolors=rgb);      # Plotte 3D Oberfläche
fig3.set_size_inches(10,5);                  # Definiere Graphik-Größe

## 5. Animationen

Animationen sind etwas aufwändiger zu erzeugen. Wichtig ist dabei die folgende Struktur:
1. Eine Funktion (oder ein Programmteil) beschreibt das Aussehen des eigentlichen Plots;
2. Eine Funktion beschreibt in Abhängigkeit eines Iterationszählers die Veränderung von Bild zu Bild;
3. Die Funktion `FuncAnimation` aus dem Paket `animation` erzeugt dann die Animation.

Hier ist ein Beispiel, das ich aus dem [matplotlib Tutorial](https://matplotlib.org/gallery/animation/simple_anim.html) entnommen habe:

In [None]:
import matplotlib.animation as animation      # lade das animation Paket
from IPython.display import HTML              # zur Darstellung im Jupyter Notebook benötigen wir diese Umgebung

fig, ax = plt.subplots()                      # erzeuge die Graphik

x = np.linspace(0,2*np.pi,100)                # -- der eigentliche Plot, ein einfacher Sinus
line, = ax.plot(x, np.sin(x));                # wir erhalten einen handle für die Linie der y-Werte

def animate(i):                               # wir definieren eine Funktion für die verschiedenen Frames
    line.set_ydata(np.sin(x + i / (5*np.pi))) # Dabei wird die Linie verschoben...
    return line,

                                              # -- es folgt die Animation
ani = animation.FuncAnimation(
    fig, animate, interval=20, blit=True, save_count=100)

HTML(ani.to_jshtml())                         # diesen Befehl benötigen wir zur Darstellung in Jupyter
#ani.save("movie.mp4")                        # um ein Video zu speichern, kann save verwendet werden

## 6. Aufgaben

1. Aufgabe: Die Funktionen $f(x)=sin(x)$ und $g(x)=x$ sind sich in der Nähe der Null recht ähnlich. Das wollen wir uns graphisch veranschaulichen, indem wir die beiden Funktionsgraphen im Intervall $[-\frac{1}{2},\frac{1}{2}]$ plotten. Stellen Sie $f$ in rot und $g$ in blau dar und plotten Sie beide in das selbe Achsensystem. Eine Legende wäre schön, damit ein:e Betrachter:n weiß, welche Farbe zu welcher Funktion gehört.

2. Aufgabe: Erstellen Sie eine Graphik, in der die Funktion
$$
f: [0,2\pi]^2 \rightarrow \mathbb{R},\ (x,y) \mapsto \sin(x)*\cos(x)*x^2
$$
in dreidimensionaler Projektion dargestellt wird. Wählen Sie sinnvolle Achsenbeschriftungen, und einen Titel. Versuchen Sie eine Farbpalette zu wählen, die von blau zu rot übergeht (Hinweis: 'cool').

---
1) <span id="fn1">Copyright Notice:
    
    Visualisierung mit matplotlib, Copyright (C) 2020  Jörn Behrens
    
        Prof. Dr. Jörn Behrens
        Universität Hamburg, Dept. Mathematik
        Bundesstrasse 55
        20146 Hamburg, Germany
        joern.behrens@uni-hamburg.de

    This program is free software; you can redistribute it and/or modify
    it under the terms of the GNU General Public License as published by
    the Free Software Foundation; either version 2 of the License, or
    (at your option) any later version.

    This program is distributed in the hope that it will be useful,
    but WITHOUT ANY WARRANTY; without even the implied warranty of
    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
    GNU General Public License for more details.

    You should have received a copy of the GNU General Public License along
    with this program; if not, write to the Free Software Foundation, Inc.,
    51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA.


</span>