# Visualisierung von Daten mittels matplotlib
Neben der Aufnahme von Daten ist die Visualisierung der aufgezeichneten und daraus berechneten Daten ein weiterer Schritt bei der Datenanalyse. Im Folgenden werden wir die durch Numpy Arrays gespeicherten Daten visualisieren. Die hier verwendete Bibliothek ist `matplotlib` / `pylab`.
Beachten Sie im Folgenden auch, dass man zentral, z.B. am Beginn eines Skriptes die Schriftarten und Größen der Zeichnungen verändern kann. Besonders für Bachelor / Masterarbeiten in Latex ist dies interessant.

In [None]:
import numpy as np
import pylab as pl
import matplotlib

#Veränderung der Größe der Schrifte in den plots
font = {'family' : 'normal',
        'weight' : 'bold',
        'size'   : 22}

matplotlib.rc('font', **font)


In [None]:
xvalues = np.linspace(0,20,25) # 25 punkte, linear zwischen 0 und 20 verteilt

pl.figure() # Zeichenfläche erstellen
pl.plot(xvalues) # Linienplot in zeichenfläche einfügen
pl.plot(np.linspace(20,0,25)) # zweite linie, von links oben, nach rechts unten
pl.grid() # gitternetz
pl.xlabel('x Achse')
pl.ylabel('y Achse')
pl.show() # Zeige die Zeichenfläche

Matplotlib hat eine Vielzahl von Darstellungsmöglichkeiten. So können die vorher gezeichneten Linien auch als Scatterplot dargestellt werden. Es werden also nur die Datenpunkte selbst visualisiert - es findet keine Verbindung der Punkte statt. Sollen Tupel - also (x,y) Paare gezeichnet werden, so müssen die x und y Komponenten separat gezeichnet werden:

In [None]:
pl.figure(figsize=(12,8)) # größer der Zeichenfläche ändern
pl.plot(np.linspace(-1,1,100),np.tan(np.linspace(-1,1,100)),'.r') # Tangens zweischen -1 und und 1 Zeichnen - 100 Punkte, keine Linie, Farbe: rot
pl.grid()
pl.xlabel('x Werte')
pl.ylabel('y Werte')
pl.show()
#ACHTUNG:Dimension von x und y muss gleich groß sein! (Gleiche Anzahl an x und y Komponenten)

### Aufgabe: 
Schreiben Sie eine Funktion `getSinValues(amp,offset,phaseshift)`, die abhängig von der Amplitude $amp$, dem y- Offset $offset$ und der Phasenverschiebung $phaseshift$ zwischen 0 und 2 pi 300 Werte berechnet und zurückgibt.
* Zeichnen Sie 3 verschiedene Kurven in einer Zeichnen.
* Suchen Sie nach einer Möglichkeit, die einzelnen Kurven zu bezeichnen und zu beschriften.


-------------
## Datenanalysen
Matplotlib bietet eine Vielzahl von Zeichnungstypen an, neben den Scatterplots und Artverwandten Linientypen sind Histogramme zur Visualisierung von Verteilungen sehr gute Möglichkeiten. Neben den Default Werten kann beim Histogramm außerdem die Anzahl an zu zählenden Elementen eingestellt werden. 


In [None]:
data = []
for i in range(0,10000):
    data.append(np.random.normal())
data = np.array(data)
pl.figure()
pl.hist(data, bins=60) # 60 slots für die sortierung
pl.grid()
pl.xlabel('Value')
pl.ylabel('# Aufkommen')
pl.show()

## Aufgabe
Gegeben Sei folgender Code. Die Variable `points` ist ein 2D Array mit (x,y) Tuppel. Erweitern Sie die Zeichnungs o, dass man rechts und über dem Scatter Plot die Verteilungen der x und y Komponenten sieht. (vgl https://i.stack.imgur.com/VSw1z.png) Welche Verteilung wird hier abgebildet?

In [None]:
def getPoints(numberOfPoints,xlim,ylim):
    (xmin,xmax)=xlim
    (ymin,ymax)=ylim
    pointsList=[]
    for n in range(0,numberOfPoints):
        x = np.random.randint(xmin,xmax)
        y = np.random.randint(ymin,ymax)
        pointsList.append(np.array([x,y]))
    return np.array(pointsList)

points = getPoints(200,(0,100),(0,100))

pl.figure(figsize=(8,8))
pl.plot(points[:,0],points[:,1],'.')
pl.grid()
pl.xlabel('x Achse')
pl.ylabel('y Achse')
pl.show()
        

## Mehrere Plots in einem Gesamtbild
Matplotlib erlaubt das Zeichnen von Bildern in mehreren Subplots.
Dazu muss zuerst die Gesamtzeichenfläche erstellt werden. Achten Sie darauf, dass diese groß genug ist (`figsize`!). 
Mittels `pl.subplot(zeilenAnzahl,spaltenanzahl,nummer)` kann eine neue Zeichenfläche erstellt werden. Der Aufrufparameter `nummer` zählt den neuen Subplot von obenlinks zeilenweise durch.
Es wird so lange in den aktuellen Zeichenbereich gezeichnet bis ein neuer `subplot` Aufruf eine neue Zeichenfläche anlegt.

Um das Bild zu exportieren gibt es in `matplotlib` die `savefig(DATEINAME.ENDUNG)` Funktion. Die Endung gibt dabei den Exporttyp von Standardbildtypen an (z.B. JPG, PNG, GIF, PDF). Für Latex ist PDF eine sehr gut Möglichkeit, die exportierten Dateien sind entsprechend beliebig skalierbar.

In [None]:


pl.figure(figsize=(14,14))
pl.subplot(2,2,1) #oben links
pl.plot(np.linspace(0,10,15))
pl.title("oben links - (2,2,1)")
pl.subplot(2,2,2) # oben rechts
pl.plot(np.linspace(10,0,15))
pl.title("oben rechts - (2,2,2)")
pl.subplot(2,2,3) # unten links
pl.plot(np.linspace(20,30,10))
pl.title("unten links - (2,2,3)")
pl.subplot(2,2,4)
pl.plot(np.linspace(30,20,10))
pl.title("unten rechts - (2,2,3)")

pl.suptitle("Der Übertitel!")

#Um ein Bild zu speicher: savefig. Die Endung gibt den Dateityp an. 
#pl.savefig("subplots.pdf")
#pl.savefig("subplots.png")
pl.show()



## Aufgabe:
* Zeichnen Sie eine Sinus und eine Kosinus Funktion untereinander in 2 separate Plots. Berechnen Sie dazu die Werte der Kurven zwischen -3*Pi und + 3*Pi.
* Suchen Sie nach einer Möglichkeit, dass die beiden Plots die gleiche x Achse verwenden. Beschriften Sie die Achsen. 
* Limitieren Sie den x Achsen Wert auf das Interval [-1, 1].
* Untersuchen Sie desweiteren, was beim Export der Zeichnung passiert, wenn Sie vor dem Speichern ein pl.tight_layout() einfügen. Warum könnte das nützlich sein?