# Plotten

Nachdem ihr nun in der Lage seid Daten auszulesen wollen wir uns nun mit deren Darstellung beschäftigen.
Die Funktionen „plot“ und „scatter“ aus dem Modul „matplotlib.pyplot“ kennt ihr bereits.
Bevor wir uns nun etwas näher mit ihnen beschäftigen, 
soll noch einmal auf ihren Verwendungszweck hingewiesen werden.
Da „plot“ eine durchgehende Linie erstellt sollte es für die Darstellung mathematischer Gesetzmäßigkeiten verwendet werden oder wenn die Daten sehr klar eine Kurve beschreiben,
um dem Leser zu helfen diese zu erkennen.
Folgen die Daten keiner klaren Gesetzmäßigkeit oder streuen stark so sollte „scatter“ verwendet werden.
Im Idealfall stellt man sowohl die Datenpunkte, sowie den vermutetet Zusammenhang dar.
Um dieses Ziel zu erreichen beginnen wir mit einer kleinen Wiederholung und lesen  „data15.csv“ ein.

In [None]:
# Wir beginnen mit dem importieren der Module
import matplotlib.pyplot as plt
import csv
# Nun geben wir den Namen unseres files an um es später leichter ändern zu können
filename = "data15.csv"
with open(filename) as csv_file:
    # Jetzt legen wir Listen für die Werte an
    X = []
    Y = []
    # Nun folgt noch die einlese Konfiguration
    readCSV = csv.reader(csv_file, delimiter=',')
    Header = 1
    for row in readCSV:
        if Header > 0:
            Header -= 1
            continue
        # Und am Ende das anfügen an die Listen
        X.append(float(row[0]))
        Y.append(float(row[2]))

Nun wollen wir die X und Y Werte darstellen.

In [None]:
plt.scatter(X,Y)
plt.show()

Natürlich fehlt diesem Diagramm noch einiges.
Ein „Titel“ zum Beispiel. 
Diesen können wir mit „plt.titel“ erzeugen.

In [None]:
plt.scatter(X,Y)
plt.title("$X^2$ mit Fehlern")
plt.show()

Die Formulierung „$x^2$“ entstammt der Textbeschreibungssprache „TeX“.
Da uns die Zeit fehlt auf diese näher einzugehen hier die Grundlagen:
* „\\$ Formel \\$“ ist die Mathematikumgebung und ermöglicht das setzen von Formeln.
* „{}“ schließen einzelne Teile einer mathematischen Formel ein.
* „{Basis}^{Exponent}“ wird dargestellt als ${Basis}^{Exponent}$.
* „{Basis}_{Index}“ wird dargestellt als ${Basis}_{Index}$.
* Mit „\frac{Zähler}{Nenner}“  kann mann Brüche darstellen:$\frac{Zähler}{Nenner}$
* Mit „\mathrm{Text}“ lässt sich nicht kursiver Text setzen:  $\mathrm{Text}$

Jedoch sollte in den meisten Fällen gewöhnlicher Text genügen.

Es wäre auch schön unserer Achsenzu  beschriften.
Hierfür verwenden wir „plt.xlabel“ bzw. „plt.ylabel“.

In [None]:
plt.scatter(X,Y)
plt.title("$X^2$ mit Fehlern")
plt.xlabel("X-Werte")
plt.ylabel("Y-Werte")
plt.show()

Damit ihr etwas Übung bekommt würde ich euch nun bitten diese Kenntnisse anzuwenden,
um den Sinus im Intervall (0, 2$\pi$) darzustellen.
Beschriftet die Achsen und gebt dem Diagramm eine Überschrift.

In [None]:
# Erzeugen der Daten
import numpy as np
X_sin = np.arange(0, 2*np.pi, 0.1)
Y_sin = np.sin(X_sin)

# Fügt hier bitte eure Lösung ein

Nehmen wir nun an wir müssten von den in  „data15.csv“ gegebenen Y-Werten einen konstanten Untergrund abziehen
und wollten die neuen sowie die Originaldaten im gleichen Diagramm darstellen.
Dann könnten wir 2 mal „plt.scatter“ rufen.

In [None]:
# Zuerst importieren wir wieder die Module und lesen die CSV-Datei ein
import matplotlib.pyplot as plt
import csv
filename = "data15.csv"
with open(filename) as csv_file:
    X = []
    Y = []
    readCSV = csv.reader(csv_file, delimiter=',')
    Header = 1
    for row in readCSV:
        if Header > 0:
            Header -= 1
            continue
        X.append(float(row[0]))
        Y.append(float(row[2]))
        
    # Nun ziehen wir den Untergrund ab
    Background = 10
    Y_Corrected = []
    for y in Y:
        Y_Corrected.append(y - Background)
        
    # Nun kommen wir zur Darstellung
    plt.title("$X^2$ Messung")
    plt.xlabel("X-Werte")
    plt.ylabel("Y-Werte")
    plt.scatter(X, Y)
    plt.scatter(X, Y_Corrected)
    plt.show()

Was uns jetzt noch fehlt ist eine Legende um beide Datenmengen zu unterscheiden.
Um diese zu erzeugen müssen wir unsere Daten in  „plt.scatter“ (oder auch  „plt.plot“) benennen 
und anschließend „plt.legend“ rufen.
Dafür verwenden wir in „plt.scatter“ den Parameter „label“.
Hierbei handelt es sich um einen optionalen Parameter, welchen wir mit seinem Namen rufen.

In [None]:
    plt.title("$X^2$ Messung")
    plt.xlabel("X-Werte")
    plt.ylabel("Y-Werte")
    # Hier werden die Graphen benannt, bzw gelabelt
    plt.scatter(X, Y, label = "Original Daten")
    plt.scatter(X, Y_Corrected, label = "Korrigierte Daten" )
    plt.legend() 
    # plt.legend hat einen optinalen parameter loc für location, welcher zum Beispiel so gerufen würde.
    # plt.legend(loc="lower left")
    plt.show()

Manchmal kann es auch sinnvoll sein die Achsen zu verändern.
Um zum Beispiel Distanzen in unsinnigen Einheiten anzugeben
oder den einen bestimmten Bereich zu fokussieren.
Um dies zu deonstrieren, wird unser Beispiel nun mittels „plt.xlim“ bzw. „plt.ylim“ fixiert
und anschließend eine 2. Achse mit „plt.twinx“ erzeugt.

In [None]:
plt.title("$X^2$ Messung")
plt.xlabel("X-Werte in [cm]")
plt.ylabel("Y-Werte")
plt.scatter(X, Y, label = "Original Daten")
plt.scatter(X, Y_Corrected, label = "Korrigierte Daten" )
# Nun schränken wir die X- und Y-Werte ein
# Die Syntax lautet plt.xlim(Beginn, Ende, Schrittweite)
plt.xlim(0, 10, 2)
# Dies können wir auch missbrauchen um unsere Achse zu invertieren
plt.ylim(160, -20, -20)
plt.legend()
# Nun verdoppeln wir die X-Achse
plt.twiny()
plt.xlim(0, 10*0.39, 2)
plt.xlabel("X-Werte in [Zoll]")
# Natürlich geht dies auch mit der Y-Achse
plt.twinx()
plt.ylim(0.16, -0.02, 0.02)
plt.ylabel("X-Werte in Tausend")
plt.show()

Nützlicher ist die Möglichkeit die Skalierung der Achsen anzupassen.

In [None]:
plt.title("$X^2$ Messung")
plt.xlabel("X-Werte")
plt.ylabel("Y-Werte")
# Aufgrund eines bugs funktioniert es dies nicht mit plt.scatter
plt.yscale("log")
plt.plot(X, Y, label = "Plot")
# Statdessen kann man Scatter folgendermaßen nachahmen
plt.plot(X, Y, label = "Pseudo-Scatter", marker = "o", linestyle="none")
plt.yscale("log")
plt.legend()
plt.show()

Natürlich gibt es noch weiter Möglichkeiten ein Diagramm zu verunstalten.
Meist empfiehlt es sich jedoch einfach 2 Diagramme zu verwenden.
Hierfür können wir die Funktion „plt.subplot“ nutzen.

In [None]:
# plt.subplot erzeugt ein Gitter und ordnet darin die Diagramme von links oben nach rechts unten ein.
# Wir wollen ein Gitter mit der Höhe 1 und Breite 2 erzeugen also schreiben wir
plt.subplot(1, 2, 1)
plt.title("$X^2$ Messung")
plt.title("Original Daten")
plt.xlabel("X-Werte")
plt.ylabel("Y-Werte")
plt.scatter(X, Y)
plt.subplot(1, 2, 2)
# Der neue plot muss ebenfalls mit Titel und Achsenbeschriftungen versehen werden
plt.title("Korrigierte Daten")
plt.xlabel("X-Werte")
plt.ylabel("Y-Werte")
plt.scatter(X, Y_Corrected)
plt.show()

Es ist auch möglich die Diagramme in Figuren zusammenzufassen, welche über eine eigene Überschrift verfügen.

In [None]:
# Zuerst erzeugen wir die Figur
plt.figure()
# Nun legen wir ihre Überschrift fest
plt.suptitle("$X^2$ Messung in 2 Diagrammen")

# Jetzt erst folgen die plots.
plt.subplot(1, 2, 1)
plt.title("Original Daten")
plt.xlabel("X-Werte")
plt.ylabel("Y-Werte")
plt.scatter(X, Y)
plt.subplot(1, 2, 2)
plt.title("Korrigierte Daten")
plt.xlabel("X-Werte")
plt.ylabel("Y-Werte")
plt.scatter(X, Y_Corrected)

#Natürlich können wir auch eine 2 Figur erzeugen
plt.figure()
plt.suptitle("$X^2$ Messung in einem Diagramm")
plt.title("$X^2$ Messung")
plt.xlabel("X-Werte")
plt.ylabel("Y-Werte")
plt.scatter(X, Y, label = "Original Daten")
plt.scatter(X, Y_Corrected, label = "Korrigierte Daten" )
plt.legend() 
plt.show()

Wendet dieses Wissen nun an um den Sinus und Cosinus in 2 Figuren darzustellen.
1. Figur: Daten im selben Diagramm.
2. Figur: Daten in 2 verschiedenen Diagrammen.

In [None]:
# Erzeugen der Daten
import numpy as np
X_sin = np.arange(0, 2*np.pi, 0.1)
Y_sin = np.sin(X_sin)
Y_cos = np.cos(X_sin)

# Fügt hier bitte eure Lösung ein

Kehren wir nun zu unserem Beispiel zurück,
so stellen wir fest, dass die Daten Fehlerwerte enthalten.
Um diese darzustellen können wir „plt.errorbar“ verwenden.

In [None]:
import matplotlib.pyplot as plt
import csv
filename = "data15.csv"
with open(filename) as csv_file:
    X = []
    X_Fehler = []
    Y = []
    Y_Fehler = []
    readCSV = csv.reader(csv_file, delimiter=',')
    Header = 1
    for row in readCSV:
        if Header > 0:
            Header -= 1
            continue
        X.append(float(row[0]))
        X_Fehler.append(float(row[1]))
        Y.append(float(row[2]))
        Y_Fehler.append(float(row[3]))
        
    # Die Syntax für Errorbar lautet
    # plt.errorbar(X, Y, Y_Fehler, X_Fehler)
    # Was uns eine "plot" artige Darstellung liefern würden
    # Deshalp rufen wir
    plt.errorbar(X, Y, Y_Fehler, X_Fehler, fmt = "p")
    # fmt steht für plot-formating-string.
    # Um nur Kreuze zu erhalten können wir fmt = "none" verwenden
    plt.show()

Vermutlich werdet ihr „plt.errorbar“ während des Praktikums häufiger anwenden müssen.
Übt deshalb an „data16.csv“.

In [None]:
# Fügt hier bitte eure Lösung ein

Ein weiterer wichtige Möglichkeit Daten darzustellen ist das Histogramm.
Nehmen wir an, in einem Verusch untersuchen wir die Anzahl an Photonen,
welche von einem Photodetektor erfasst werden.
Dieses fiktive Beispiel findet sich in „data17.csv“.
Um uns einen Überblick zu verschaffen stellen wir die Daten in einem Histogram dar.

In [None]:
import matplotlib.pyplot as plt
import csv
filename = "data17.csv"
with open(filename) as csv_file:
    Values = []
    readCSV = csv.reader(csv_file, delimiter=',')
    Header = 1
    for row in readCSV:
        if Header > 0:
            Header -= 1
            continue
        Values.append(float(row[1]))
    
    # Um ein Histogramm zu erstellen rufen wir plt.hist(Daten, Anzahl bins)
    # Dies kann uns auch einige Daten zurückgeben
    Werte, Bins, Patches = plt.hist(Values, 10)
    # Werte sind die Einträge in die bins (die Y-Werte gewissermaßen)
    # Bins zeigt uns die Grenzen dergewählten bins an
    print(Bins)
    plt.show()

Wie wir im oberen Beispiel sehen ist die Wahl der Bin-Grenzen nicht optimal,
um dieses Problem zu beheben können wir statt der Anzahl der Bins/Schubladen auch direkt
deren Weite angeben:

In [None]:
# Hierfür könnten wir foglende Liste verwenden:
# Bins = [0, 10, 20 , 25, 30, 35, 40, 45, 50, 55, 60, 65]
# Oder sie uns selbst generieren
Bins = list(range(0, 80,5))
Werte, Bins, Patches = plt.hist(Values, Bins)
plt.show()

Während „Patches“ für uns einen eher geringeren Nutzen hat.
Können wir die anderen beiden Werte verwenden um eine Annäherungslinie zeichnen zu lassen.

In [None]:
Bins = list(range(0, 80,5))
Werte, Bins, Patches = plt.hist(Values, Bins)
# Um unseren plot anzupassen müssen wir ihn zentrieren(weshalb wir ihn um 0.5 Binweiten nach rechts schieben)
for i in range(0, len(Bins)):
    Bins[i] -= 2.5
# und links einen leeren Wert hinzufügen
plt.plot(Bins, [0] + list(Werte))
plt.show()

Jetzt müssen wir das ganze nur noch abspeichern hierzu verwenden wir „plt.savefig“.

In [None]:
Bins = list(range(0, 80,5))
Werte, Bins, Patches = plt.hist(Values, Bins)
plt.savefig("Histogram.png")

In euren Notebook sollte nun „Histogram.png“ aufgetaucht sein. 
Wenn ihr wollt könnt ihr sie euch herunterladen und betrachten.

Natürlich verwendet man „plot“ üblicherweise mit der genäherten Verteilung.
Weshalb wir uns im nächsten Kapitel mit fitten beschäftigen werden.
Zuvor jedoch würde ich euch bitten die Daten in „data18.csv“ in einem Histogramm darzustellen und abzuspeichern.

In [None]:
# Fügt hier bitte eure Lösung ein

Bevor wir uns nun mit fitten beschäftigen könnten ihr noch einen kurzen Blick auf die Gallerie werfen,
um euch die Möglichkeiten zu veranschaulichen (https://matplotlib.org/3.1.1/gallery/index.html).
Wenn ihr wollt könnt ihr auch den folgenden Code ausführen, welcher die Schritte zur Erstellung einer Kochschenflocke in einer gif-Datei dokumentiert und abspeichert.

In [None]:
import matplotlib
import matplotlib.pyplot as plt
import numpy as np
import imageio

def KochKurve(points, start, end, depth):
    if len(points) <= 0:
        points.append(start)
    if depth <= 0:
        points.append(end)
    else:
        xdif = end[0] - start[0]
        ydif = end[1] - start[1]
        p1 = (start[0] + (xdif / 3), start[1] + (ydif / 3))
        p2 = (start[0] + (xdif/2) - (ydif/3), start[1] + (ydif/2) + xdif/3)
        p3 = (start[0] + (xdif * 2 / 3), start[1] + (ydif * 2 / 3))
        KochKurve(points, start, p1, depth-1)
        KochKurve(points, p1, p2, depth-1)
        KochKurve(points, p2, p3, depth-1)
        KochKurve(points, p3, end, depth-1)

def plot_for_offset(power):
    # Data for plotting
    points = []
    KochKurve(points, (-1, 0), (1,0), power)
    KochKurve(points, (1, 0), (0, -3**(1/2)), power)
    KochKurve(points, (0, -3**(1/2)), (-1,0), power)
    x = []
    y = []
    for point in points:
        x.append(point[0])
        y.append(point[1])

    fig, ax = plt.subplots(figsize=(10,10))
    ax.plot(x, y)

    # IMPORTANT ANIMATION CODE HERE
    # Used to keep the limits constant
    ax.axis("equal")
    ax.set_ylim(-2, 1)
    ax.set_xlim(-1.5, 1.5)

    # Used to return the plot as an image rray
    fig.canvas.draw()       # draw the canvas, cache the renderer
    image = np.frombuffer(fig.canvas.tostring_rgb(), dtype='uint8')
    image = image.reshape(fig.canvas.get_width_height()[::-1] + (3,))

    return image

kwargs_write = {'fps':1.0, 'quantizer':'nq'}
imageio.mimsave('./Kochsche.gif', [plot_for_offset(i) for i in range(7)], fps=1)

# TODO
## Fitten

In [None]:
#Writing data
import numpy as np
import matplotlib.pyplot as plt
import csv
import random as rnd

def f(x, a=0, b=0, c=0): 
    return np.sin(x*2*np.pi/10)

def gauss():
    a = 0
    if rnd.uniform(0,1) > 0.5:
        a = rnd.gauss(25, 10)
    else:
        a = rnd.gauss(-25, 10)
    return round(a)

X = [x/10 for x in range(-100,100)]
XE = 0.1
YE = 0.1
XR = [rnd.gauss(x, XE*x) for x in X]
Y = [rnd.gauss(f(x), YE*f(x))  for x in XR]
data =  [[X[i], XE, Y[i], YE] for i in range(0, len(X))]
data = [[i, gauss()] for i in range(0, 1000)]

filename = "data19.csv"
with open(filename, "w") as csv_file:
    writer = csv.writer(csv_file, delimiter=',')
    writer.writerow(["Messung Nr", "Photonen"])
    for point in data:
        writer.writerow(point)

Values, bins, patches = plt.hist([point[1] for point in data], 10)


plt.show()