# Numpy -- Fortsetzung

## Wiederholung von letzter Vorlesung

`numpy` ist eine Bibliothek, mit der in Python große Datenmengen schnell verarbeitet werden können. Die Bibliothek wird mit

    import numpy as np
    
geladen. `numpy`-Arrays werden z.B. mit

    a = np.arange(0,100,1)
    
erzeugt und können wie im folgenden Beispiel verarbeitet werden:

In [None]:
import numpy as np

a = np.arange(0,100,1)
b = np.linspace(0,10,100)

c = a**b
print(c)

## Zweidimensionales Array: Beispiel

Das untenstehende Beispiel erzeugt ein zweidimensionales `numpy`-Array. Dieses kann über `matshow` als 2D-Diagramm dargestellt werden. Auf der x-Achse ist der Sinus, auf der y-Achse der Cosinus dargestellt.

In [None]:
%matplotlib inline
import numpy as np
import matplotlib.pyplot as plt

plt.figure(figsize=(10,10))

a = np.zeros(shape=(100,100))

x = np.linspace(0.0, 2* np.pi, 100)
y = np.linspace(0.0, 2* np.pi, 100)

x_pos = 0
for i in x:
    y_pos=0
    for j in y:
        a[x_pos, y_pos] = np.cos(i)*np.sin(j)
        y_pos += 1
    x_pos += 1
      
print(a)        
        
plt.matshow(a)
plt.colorbar()

plt.show()

In [None]:
plt.plot(a[40,:])
#plt.plot(a[:,30])
#plt.plot(a[20,:])
#plt.plot(a[65,:])
#plt.plot(a[:,35])
plt.show()

In [None]:
plt.plot(a[:,55:70:2])
plt.show()

In [None]:
plt.matshow(a[20:50,35:60])
plt.show()

# Fancy Indexing und Maskierung

Fancy Indexing (zu deutsch etwa "ausgefallene Indizierung") und Maskierung sind zwei weitere geschickte Methoden bestimmte Elemente aus einem `numpy`-Array zu extrahieren.

### Fancy Indexing

Fancy Indexing kann verwendet werden um bestimmte Elemente aus einem Array zu extrahieren. Dazu muss ein weiterer `numpy`-Array angelegt werden, welcher die __Indices der zu extrahierenden Elemente__ enthält. Hier muss wieder beachtet werden, dass die Nummerierung der Indices eines Arrays bei __0__ beginnt!

Im folgenden Beispiel wird ein Array `x` mit den Zahlen 1 bis 10 angelegt. Aus diesem sollen nur bestimmte Zahlen extrahiert werden. Dazu wird der Array `ind` definiert, der die Indices dieser Elemente enthält. Die Teil-Liste wird dann extrahiert, indem der Befehl

    b = x[ind]
    
eingegeben wird. Hierbei ist `b` die neue Teil-Liste.

In [None]:
import numpy as np

x = np.arange(1, 10, 1)
print(x)

In [None]:
ind = np.array([0, 2, 3, 7]) # indices of elements we would like to extract
b = x[ind]
print(b)

### Indexing mit einem boolschen Array

Eine weitere Möglichkeit bestimmte Elemente auszuwählen kann über einen Array, welcher nur _boolsche Variablen_, also `True` oder `False` enthält, gemacht werden. Hier wird ein Array benötigt, der dieselbe Größe wie der Ursprungsarray hat. Jedem Element des Arrays `x` wird so ein Element des Arrays `ind` zugewiesen. Nur wenn das entsprechende Element `True` enthält, wird es als Element des neuen Teil-Arrays `b` ausgegeben.

In [None]:
# Note that boolean-indexing is usually never done explicitely
# but indirectly via masking (see below). We show the explicit
# boolean masking for demonstration purposes here.
import numpy as np

x = np.arange(1, 5, 1)
print(x)
# we access indices that are 'True' in a boolean array
# of the same size as x:
ind = np.array([True, False, True, True])
b = x[ind]
print(b)

### Maskierung

Maskierung kann für Fälle verwendet werden, in denen nur Elemente, die eine bestimmte Bedingung erfüllen ausgewählt werden sollen. Das kann z.B. notwendig sein, wenn man den Logarithmus der Elemente berechnen will und dazu alle Elemente auswählen muss, welche größer als 0 sind. Die _Maske_ ist dabei eine einfache Bedingung wie z.B. ` y = (x > 0)`. Die Maske wird dann analog zu oben über 

    y = x[mask1]
    
auf den Ursprungsarray `x` angewendet um das Teil-Array `y` zu erhalten.    


Im untenstehenden Beispiel wird ein `numpy`-Array über die Funktion `randint()` erzeugt. Diese Funktion erzeugt Zufallszahlen. Der Aufruf ist der folgende

    x = nr.randint(start, end, number)
    
wobei die Anzahl an Zufallszahlen (`number`) zwischen den Werten `start` und `end` erzeugt werden sollen. Anschließend werden verschiedene Masken definiert und auf das Array angewendet.

In [None]:
import numpy as np
import numpy.random as nr

x = nr.randint(-10, 10, 10)
print('Ursprungsarray mit Zufallszahlen: ', x)

In [None]:
mask1 = (x > 0)  # mask is a bool array
y = x[mask1]     # extract the values from x where mask = True
print('Alle Werte groesser als 0: ',y)

In [None]:
mask2 = (x > 0) & (x < 4)  # combined mask (and condition)
mask3 = (x < -5) | ( x > 5) # combined mask (or condition)
print('Alle Werte zwischen 0 und 4: ', x[mask2])
print('Alle Werte kleiner -5 oder groesser als +5: ', x[mask3])

## Wichtige Bemerkungen

- Im Gegensatz zu dem Zerschneiden von Arrays werde beim Fancy Indexing und bei der Maskierung immer Kopien des Ursprungsarray zurückgegeben. Dies ist ein Unterschied zu den Standard-Listen von Python! Hier werden beim Zerschneiden von Listen auch immer Kopien zurückgegeben!


In [None]:
import numpy as np

a = np.arange(0, 11, 1)

b = a[::2] # get each second number of a
print('Teil-Liste b: ',b)

# create the 'same' array with fancy indexing:
c = a[np.array([0, 2, 4, 6, 8, 10])]
print('Teil-Liste c: ',c)

# create again the 'same' array with masking:
d = a[a%2 == 0]
print('Teil-Liste d: ',d)

In [None]:
# only a modification in b also modifies a!
b[0] = 5
print('Ursprungsliste: ', a, 'Teil-Liste b: ', b)

In [None]:
c[1] = 100
print('Ursprungsliste: ', a,'Teil-Liste c: ', c)

In [None]:
d[2] = 1000
print('Ursprungsliste: ', a,'Teil-Liste d: ', d)

- Sowohl Fancy Indexing, als auch Maskierung kann auch auf der __linken Seite__ einer Zuweisung verwendet werden. Es muss nicht als Extra-Befehl ausgeführt werden.

In [None]:
import numpy as np

a = np.arange(0, 11, 1)
print(a)
ind = np.array([0, 2, 4])
a[ind] = 1000
print(a)

In [None]:
b = np.arange(0, 11, 1)
print(b)
b[b%2 == 0] = 1000
print(b)

---
# Matplotlib

Matplotlib ist eine Bibliothek die viele Möglichkeiten zur Darstellung von Funktionen und Daten zur Verfügung stellt. Die Bibliothek wird über

    import matplotlib.pyplot as plt
  
geladen. Damit hier im Jupyter Notebook auch die Histogramme dargestellt werden können, wird noch die Zeile

    %matplotlib inline

benötigt. Für "normale" Python-Programme ist das nicht notwendig!

## Darstellen von Funktionen

Wir hatten einfache Darstellung von Funktionen oder Datenpunkten schon in den Übungen und letzte Woche gesehen.

Wenn Sie die  Abbildung speicher wollen, verwenden Sie bitte das Kommando:

    plt.savefig('/pfad/dateiname.png')

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt

plt.figure(figsize=(10,6))

# Note that you can use LaTeX in for labels, titles
# etc.
plt.xlabel(r"$x$")
plt.ylabel(r"$y$")
plt.title(r"The $\sin(x)$ and $\cos(x)$ functions")

x = np.linspace(0.0, 2.0 * np.pi, 100)
sinx = np.sin(x)
cosx = np.cos(x)

# a simple x-y plot
plt.plot(x, sinx, "*-")
plt.plot(x, cosx, "ro")
plt.show()

#plt.savefig('/pfad/dateiname.png')

### Darstellung von Linien und Füllungen

Wenn Funktionen dargestellt werden sollen, wird das über den Befehl

    plt.plot(x, sinx, "*-")
    
gemacht. Dabei ist als dritter Parameter die Darstellungweise der Funktion angegeben. Dieser ist optional (kann weggelassen werden) und nimmt die folgenden Parameter:    

|Symbol |	Farbe|
| --- | --- |
|`b` |	blue|
|`c` |	cyan|
|`g` |	green|
|`m` |	magenta|
|`r` |	red|
|`y` |	yellow|
|`k` |	black|
|`w` |	white|

|Symbol |	Form|
| --- | ---|
|`-` |	Durchgezogene Linie |
|`--` |	Gestrichelte Linie |
|`-.` |	Abwechselnd gestrichelte und gepunktete Linie |
|`:` |	Gepunktete Linie |
|`o` |	Einzelne Punkte, Darstellung als farbige Kreise |
|`s` |	Einzelne Punkte, Darstellung als farbige Rechtecke |
|`D` |	Einzelne Punkte, Darstellung als Diamant-Form|
|`^` |	Einzelne Punkte, Darstellung als farbige Dreiecke|
|`x` |	Einzelne Punkte, Darstellung als farbige x-Zeichen|
|`*` |	Einzelne Punkte, Darstellung als farbige *-Zeichen|
|`+` |	Einzelne Punkte, Darstellung als farbige +-Zeichen|

In [None]:
plt.figure(figsize=(10,6))

plt.xlabel(r"$x$")
plt.ylabel(r"$y$")
plt.title(r"Just some functions")

x = np.linspace(0.0, 2.0 * np.pi, 100)
fkt1 = np.sin(x)**3
fkt2 = np.cos(2.5*x)

# a simple x-y plot
plt.plot(x, fkt1, "c--")
plt.plot(x, fkt2, "m-.")
plt.show()

Über den Befehl `fill_between` kann auch die Fläche über, unter oder zwischen Funktionen gefüllt werden:

In [None]:
plt.figure(figsize=(10,6))

plt.xlabel(r"$x$")
plt.ylabel(r"$y$")
plt.title(r"Just some functions")

plt.fill_between(x, 0, fkt1, color='blue', alpha=.1)
plt.fill_between(x, -1, fkt2, color='orange', alpha=.1)

plt.plot(x, fkt1, "--")
plt.plot(x, fkt2, "-.")
plt.show()

In [None]:
plt.figure(figsize=(10,4))

plt.xlabel(r"$x$")
plt.ylabel(r"$y$")
plt.title(r"Just some functions")

plt.fill_between(x, fkt1, fkt2, color='blue', alpha=0.1)

plt.plot(x, fkt1, "--")
plt.plot(x, fkt2, "-.")
plt.show()

### Achsen

Auch die Achsen können nach belieben formatiert werden. Dazu kann, wie in den folgenden zwei Beispielen gezeigt, sowohl der Bereich der Achsen, als auch die Positon und die Bezeichnung der Skalierung modifiziert werden.

In [None]:
plt.figure(figsize=(10,6))

plt.xlabel(r"$x$")
plt.ylabel(r"$y$")
plt.title(r"Just some functions")

x = np.linspace(-2.0 * np.pi, 2.0 * np.pi, 100)
fkt1 = 3*np.sin(x)**3
fkt2 = np.cos(2.5*x)


plt.axis([0, 5, -10, 10]) # values: xmin, xmax, ymin, ymax

plt.plot(x, fkt1, "--")
plt.plot(x, fkt2, "-.")
plt.show()

In [None]:
plt.figure(figsize=(10,6))

plt.xlabel(r"$x$")
plt.ylabel(r"$y$")
plt.title(r"Just some functions")

x = np.linspace(-2.0 * np.pi, 2.0 * np.pi, 100)
fkt1 = 3*np.sin(x)**3
fkt2 = np.cos(2.5*x)

plt.xticks( [-6.28, -3.14, 0, 3.14, 6.28],
        [r'$-2\pi$', r'$-\pi$', 0, r'$+\pi$', r'$+2\pi$'])
plt.yticks([-3, -1, 0, +1, 3])

plt.plot(x, fkt1, "--")
plt.plot(x, fkt2, "-.")
plt.show()

Etwas aufwändiger ist die Verschiebung der Position der Achsen. Dies kann über die Befehle im untenstehenden Beispiel geschehen:

In [None]:
plt.figure(figsize=(10,6))

plt.xlabel(r"$x$")
plt.ylabel(r"$y$")
plt.title(r"Just some functions")

x = np.linspace(-2.0 * np.pi, 2.0 * np.pi, 100)
fkt1 = 3*np.sin(x)**3
fkt2 = np.cos(2.5*x)

ax = plt.gca() #gca: get the current Axes
ax.spines['top'].set_color('none')
ax.spines['right'].set_color('none')
ax.spines['bottom'].set_position(('data',0))
ax.spines['left'].set_position(('data',0))

plt.xticks( [-6.28, -3.14, 0, 3.14, 6.28],
        [r'$-2\pi$', r'$-\pi$', 0, r'$+\pi$', r'$+2\pi$'])
plt.yticks([-3, -1, 0, +1, 3])

plt.plot(x, fkt1, "--")
plt.plot(x, fkt2, "-.")
plt.show()

Eine häufig genutzte Funktionalität ist die logarithmische Darstellung. Damit können mit dem Befehlen

    plt.xscale('log') 
    plt.yscale('log') 
    
eine oder beide Achsen zu einer logartihmischen Achse modifiziert werden.

In [None]:
plt.figure(figsize=(10,6))

plt.xlabel(r"$x$")
plt.ylabel(r"$y$")
plt.title(r"Just some functions")

x = np.linspace(-2.0 * np.pi, 2.0 * np.pi, 100)
fkt1 = 23*x**3
fkt2 = 2.5*x**2

plt.yscale('log') 

plt.plot(x, fkt1, "--")
plt.plot(x, fkt2, "-.")
plt.show()

Zum besseren Ablesen von Funktionswerten aus den Diagrammen kann auch ein Gitter eingezeichnet werden. Dies geschieht über den Befehl

    plt.grid()
    
wobei viele verschiedene Modifikationsmöglichkeiten zur Verfügung stehen.

In [None]:
plt.figure(figsize=(10,6))

plt.xlabel(r"$x$")
plt.ylabel(r"$y$")
plt.title(r"Just some functions")

x = np.linspace(-2.0 * np.pi, 2.0 * np.pi, 100)
fkt1 = 23*x**3
fkt2 = 2.5*x**2

plt.yscale('log') 

plt.grid(color='b', alpha=0.5, linestyle='dashed', linewidth=0.5)

plt.plot(x, fkt1, "--")
plt.plot(x, fkt2, "-.")
plt.show()

## Histogramme

Histogramme werden verwendet, wenn z.B. verschiedene Meßwerte aufgenommen wurden und deren Häufigkeitsverteilung untersucht werden soll.

In [None]:
import matplotlib.pyplot as plt
import numpy as np

plt.figure(figsize=(10,6))

gaussian_numbers = np.random.normal(size=10000)

print(gaussian_numbers)

plt.hist(gaussian_numbers)

plt.title("Gaussian Histogram")
plt.xlabel("Wert")
plt.ylabel("Häufigkeit")

plt.show()

In [None]:
plt.figure(figsize=(10,6))

plt.title("Gaussian Histogram")
plt.xlabel("Wert")
plt.ylabel("Häufigkeit")

gaussian_numbers = np.random.normal(size=10000)
gaussian_numbers2 = np.random.normal(size=10000)

plt.hist(gaussian_numbers, bins=100, color="red",alpha=0.2)
plt.hist(gaussian_numbers2+1, bins=100, color="blue",alpha=0.2)
plt.show()

## Streudiagramme

Streudiagramme werden zur Darstellung verwendet, wenn z.B. korrelierte Daten vorliegen oder xy-Koordinaten.

In [None]:
import matplotlib.pyplot as plt
import numpy as np

plt.figure(figsize=(6,6))

numbers_x = np.random.normal(size=1000)
numbers_y = np.random.normal(size=1000)

plt.scatter(numbers_x,numbers_y)

plt.title("Gaussian Histogram")
plt.xlabel("x-Werte")
plt.ylabel("y-Werte")

plt.show()

---
# Funktionen

Wir werden in diesem Tutorial zwei verschiedene Typen von Funktionen kennenlernen: zum Einen von Python vorgegebene Funktionen, zum Anderen selbstgeschriebene Funktionen.

Von Python vogegebene Funktionen sind z.B:

In [None]:
print("Hallo")

Funktionsname ist `print`, beim Aufrufen wird als Option `"Hallo"` mitgegeben. Die Funktion liefert eine Ausgabe.

In [None]:
import numpy as np
x = np.linspace(-1.0, 2.0, 51)

Funktionsname ist `linspace`, die Optionen sind hier `-1.0`,`2.0`,`51` und der Rückgabewert ist ein `numpy`-Array.

Eine selbstgeschriebene Funktion ist folgendermaßen aufgebaut:
- Eine Funktion wird über das Schlüsselwort `def` eingeleitet.
- Sie besitzt einen Namen, z.B. `printstatement`.
- Sie kann keinen, einen oder mehrere Eingabeparameter besitzen, z.B. `param1` und `param2`. Diese werden in runden Klammern hinter dem Namen der Funktion angegeben.
- Die Funktion besitzt einen Funktionscode. In unserem ersten Beispiel ist das lediglich eine Ausgabe mit dem Befehl `print`.
- Sie besitzt eine Rückgabeparameter. Dieser kann auch bei Bedarf leer bleiben, in diesem Fall wird der Rückgabeparameter `None` verwendet. Der Rückgabeparameter ist mit dem Schlüsselwort `return` gekennzeichnet.

Die Funktion aus unserem Beispiel würde damit so aussehen:

In [None]:
def printstatement(param1, param2):
    print("Hello World")
    return None

## Parameter

Jede Funktion kann keinen, einen oder mehrere Parameter beim Aufruf erhalten.

Eine Funktion ohne Parameter:

In [None]:
def funktion_ohne_parameter():
    print("Ich gebe nur Text aus...")

In [None]:
funktion_ohne_parameter()

Eine Funktion mit mehreren Parametern:

In [None]:
def twelvedays(day,text):
    print("On the ", day, ". day of Christmas, my true love sent to me: ",text)

In [None]:
twelvedays(1,"A partridge in a pear tree.")
twelvedays(2,"Two turtle doves.")
twelvedays(3,"Three French hens.")

Die Parameter können auch optional sein, d.h. man kann sie angeben, muss man aber nicht. Dazu muss bei der Funktionsdefinition der Wert des Parameters mitgegeben werden, falls er nicht gesetzt wurde.

In [None]:
def xhochy(x,y=2):
    print(x**y)

In [None]:
xhochy(5,3)
xhochy(5)

# Rückgabewerte
Häufig haben Sie schon Konstrukte benutzt wie

    value = funktionsname(optionen)
    
Dies kann durch die Rückgabewerte einer Funktion realisiert werden. Dazu wird das Code-Wort `return` verwendet. Der Wert, der nach dem `return` angegeben ist, wird von der Funktion _zurückgegeben_.

In [None]:
def xhochy(x,y=2):
    return x**y

In [None]:
value = xhochy(6,3)
print(value)

__Hinweis:__<br>
Jede Funktion hat einen Rückgabewert. Wenn Sie diesen aber nicht setzen, wird er als `None`, also "Nichts" angenommen. Korrekterweise sollte man immer ein `return`-Statement in einer Funktion haben. Falls Sie nichts zurückgeben wollen, dann mit 
    
    return None

Bei Python ist es auch möglich mehrere Rückgabewerte zu haben. Diese werden hinter dem Schlüsselwort `return` durch Komma separiert angegeben.

In [None]:
def trigonometrie(val):
    return (np.sin(val),np.cos(val))

(val1,val2) = trigonometrie(0.34)
print(val1,val2)

(val1,val2) = trigonometrie(0.62)
print(val1,val2)

## Beispiel einer selbstgeschriebenen Funktion
Funktion zur Berechnung der Temperatur in Grad Celsius:

In [None]:
def fahrenheit(T_in_celsius):
    """ returns the temperature in degrees Fahrenheit """
    return (T_in_celsius * 9 / 5) + 32

In [None]:
val = fahrenheit(42)
print(val)

In [None]:
for t in (22.6, 25.8, 27.3, 29.8):
    print(t, ": ", fahrenheit(t))

---
# Beispiel einer _richtigen_ Datenanalyse

In der ersten Übung im neuen Jahr soll eine Datenanalyse durchgeführt werden. Dazu wurden die Daten eines Experiments aus der Vorlesung "Particle Detectors and Instrumentation" verwendet. Ziel der Vorlesung war es, ein Experiment selbst aufzubauen und dann am Beschleuniger ELSA durchzuführen.
Ziel des Experiments war es hierbei die folgende Reaktion zu messen:
$$\gamma p \to \Delta^+ \to p \pi^0$$
mit dem Zerfall des $\pi^0$ Mesons in zwei Photonen:
$$\pi^0 \to \gamma \gamma$$

<img src="protonpi0gg.png" width=400px/>

Die beiden Photonen aus dem Zerfall des $\pi$-Mesons sollten mit zwei Detektorblöcken gemessen werden. Diese Blöcke waren so aufgebaut:

<img src="studexp_setup.png" width=700px/>

Jeder Detektorblock bestand aus 9 Kristallen (CsI(Tl)) und wurde über APDs ausgelesen.

<img src="9erblock_cad.jpg" width=600px/>

In einer Strahlzeit von 2 Tagen konnten Daten genommen werden, welche in einem Seminar im darauffolgenden Semester analysiert wurden. Um die Qualität der Daten abschätzen zu müssen, wurden Computersimulationen durchgeführt, in denen das gesamte Experiment nachgebaut war.

<img src="simulation.jpg" width=600px/>

Die Analyse (eines kleinen Teils) dieser Computersimulationen wird die Aufgabe der ersten Übung nach den Weihnachtsferien sein!

---
# Und zuletzt:

In [None]:
#%matplotlib notebook
%matplotlib inline

In [None]:
# coding: utf-8
"""
Draw a minimalist Christmas tree with Python and their awesome libraries.
Code inspired by a StackEchange post and the Christmas spirit.
http://codegolf.stackexchange.com/questions/15860/make-a-scalable-christmas-tree/16358#16358
Author: Franz Navarro - CAChemE.org 
License: MIT 
Dependencies: Python, NumPy, matplotlib
"""
 
import matplotlib as mpl
from mpl_toolkits.mplot3d import Axes3D
import numpy as np
import matplotlib.pyplot as plt

fig.figsize=(10,10)
 
# Calculate spiral coordinates for the Xmas tree
theta = np.linspace(-8 * np.pi, 8 * np.pi, 200) 
z = np.linspace(-3, 0, 200)
r = 5
x = r * np.sin(theta)*z
y = r * np.cos(theta)*z
 
# Use matplotib and its OOP interface to draw it 
fig = plt.figure() # Create figure
ax = fig.gca(projection='3d') # It's a 3D Xmas tree!
ax.view_init(15, 0) # Set a nice view angle
ax._axis3don = False # Hide the 3d axes
 
# Plot the Xmas tree as a line
ax.plot(x, y, z,
        c='green', linewidth=2.5)
 
# Every Xmas tree needs a star
ax.scatter(0, 0, 0.2,
           c='yellow', s=250, marker='*')

for i in range(0,200,15):
    ax.scatter(x[i], y[i], z[i],
           c='red', s=150, marker='o')

# Type here your best whishes
ax.set_title(u"Frohe Weihnachten und ein gutes neues Jahr!")
 

    
plt.show()