## Kapitel 3: NumPy

### 3.1 Python-Listen und Matrizen

#### Adressierung von Listen

In [None]:
matrix = [[1.1, 2.2, 3.3], [4.4, 5.5, 6.6], [7.7, 8.8, 9.9]]

In [None]:
matrix[0]

In [None]:
matrix[0][2]

In [None]:
matrix[0][:]

#### Wir bekommen eine Zeile, aber keine Spalte.

In [None]:
matrix[:][0]

### 3.2 NumPy-Arrays

#### Zum Umgang mit Matrizen eignen sich NumPy-Arrays viel besser.

In [None]:
import numpy as np

#### Ein Blick in die Dokumentation

In [None]:
np.lookfor('create array')

In [None]:
help(np.array)

In [None]:
matrix = [[0, 1, 2],
          [3, 4, 5],
          [6, 7, 8]]
myarray = np.array(matrix)
myarray

In [None]:
type(myarray)

#### NumPy-Arrays haben eine Reihe von Eigenschaften:

In [None]:
matrix = np.arange(16)

In [None]:
def array_attributes(a):
    for attr in ('ndim', 'size', 'itemsize', 'dtype', 'shape', 'strides'):
        print('{:8s}: {}'.format(attr, getattr(a, attr)))

In [None]:
array_attributes(matrix)

In [None]:
matrix.nbytes

In [None]:
np.arange(1, 160, 10, dtype=np.int8)

Erzeugen Sie mit Hilfe von `np.array()` Arrays mit
 * Gleitkommazahlen
 * komplexen Zahlen
 * Wahrheitswerten
 * Zeichenketten
 
und überprüfen Sie das Attribut `dtype`.

#### Man kann die Sicht auf diese Daten modifizieren ohne die Daten zu ändern.

In [None]:
matrix.shape = (4, 4)
matrix

In [None]:
matrix.strides

#### Allerdings wirkt sich eine Änderung der Daten entsprechend aus.

In [None]:
m1 = np.arange(16)
m1

In [None]:
m2 = m1.reshape(4, 4)
m2

In [None]:
m1[0] = 99
m1

In [None]:
m2

#### Transponieren liefert nur eine andere Sicht.

In [None]:
m2.strides

In [None]:
m2.T

In [None]:
m2.T.strides

#### Man kann auch die Strides direkt ändern …

In [None]:
matrix.shape = (4, 4)

In [None]:
matrix1 = np.lib.stride_tricks.as_strided(matrix, strides=(16, 16))
matrix1

#### … ist aber für die Folgen selbst verantwortlich.

In [None]:
matrix2 = np.lib.stride_tricks.as_strided(matrix, shape=(4, 4), strides=(16, 4))
matrix2

### 3.3 Erzeugung von NumPy-Arrays

#### Ein leeres Array vorgegebener Größe

In [None]:
matrix1 = np.zeros((2, 2))
matrix1, matrix1.dtype

In [None]:
np.zeros((2, 2), dtype=np.int)

#### Wenn man das Array erst später füllt, geht auch

In [None]:
np.empty((3, 3))

#### Ein Array mit einem festen Eintrag

In [None]:
2*np.ones((2, 3))

#### Einheitsmatrizen und verwandte Matrizen

In [None]:
np.identity(3)

In [None]:
np.eye(2, 4)

In [None]:
np.eye(4, k=1)-np.eye(4, k=-1)

#### Diagonalmatrix

In [None]:
np.diag([1, 2, 3, 4])

In [None]:
np.diag([1, 2, 3, 4], k=1)

In [None]:
np.diag(np.arange(16).reshape(4, 4))

#### Erzeugen eines Arrays aus einer Funktion

In [None]:
np.fromfunction(lambda i, j: (i+1)*(j+1), (6, 6), dtype=np.int)

#### Lineare und logarithmische eindimensionale Arrays

In [None]:
np.arange(1, 2, 0.1)

In [None]:
np.arange(1, 1.5, 0.1)

In [None]:
np.arange(1, 1.6, 0.1)

In [None]:
np.arange(1, 1.601, 0.1)

In [None]:
np.linspace(1, 2, 11)

In [None]:
np.linspace(1, 2, 4, retstep=True)

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt

In [None]:
x = np.linspace(0, 2*np.pi, 100)
y = np.sin(x)

In [None]:
plt.plot(x, y)

In [None]:
np.logspace(0, 3, 6)

In [None]:
np.logspace(0, 3, 4, base=2)

#### Gitter zur Funktionsauswertung

In [None]:
xvals, yvals = np.meshgrid([-1, 0, 1], [2, 3, 4])

In [None]:
xvals

In [None]:
yvals

In [None]:
xvals, yvals = np.mgrid[-10:10:0.1, -10:10:0.1]

In [None]:
xvals

In [None]:
yvals

In [None]:
plt.imshow(np.sin(xvals*yvals))

#### Erzeugen eines Arrays aus einer Datei

Erzeugen einer Datei    
**Achtung**: Falls eine Datei ``x_von_t.dat`` bereits existiert, wird sie bei Ausführung der nächsten Zelle überschrieben!

In [None]:
%%bash
cat > x_von_t.dat
# Zeit  Ort
   0.0  0.0
   0.1  0.1
   0.2  0.4
   0.3  0.9

In [None]:
np.loadtxt('x_von_t.dat')

Aufräumen der Datei   
**Achtung**: Die Datei ``x_von_t.dat`` wird bei Ausführung der nächsten Zelle wieder gelöscht.

In [None]:
!rm x_von_t.dat

#### Erzeugung von  Zufallszahlen

In [None]:
np.random.rand(2, 5)

In [None]:
np.random.seed(1234)
np.random.rand(2, 5)

In [None]:
data = np.random.rand(20, 20)
plt.imshow(data, cmap=plt.cm.hot, interpolation='none')
plt.colorbar()

In [None]:
wuerfe = np.random.randint(1, 7, (100, 3))
plt.hist(wuerfe, np.linspace(0.5, 6.5, 7))

### 3.4 Adressierung von NumPy-Arrays

#### Slices von eindimensionalen Arrays

In [None]:
a = np.arange(10)

In [None]:
a

In [None]:
a[:]

In [None]:
a[::2]

In [None]:
a[1:4]

In [None]:
a[6:-2]

In [None]:
a[::-1]

#### Slices von zweidimensionalen Arrays

In [None]:
a = np.arange(36).reshape(6, 6)
a

In [None]:
a[:, :]

In [None]:
a[2:4, 2:4]

In [None]:
a[2:4, 3:5]

In [None]:
a[::2, ::2]

In [None]:
a[2::2, ::2]

In [None]:
a[2:4]

#### Eine Spalte aus einem Array

In [None]:
a[:, 0:1]

In [None]:
a[:, 0]

#### Summierung über verschiedene Achsen und über das gesamte Array

In [None]:
a.sum(axis=0)

In [None]:
a.sum(axis=1)

In [None]:
a.sum()

#### Dreidimensionale Arrays

In [None]:
b = np.arange(27).reshape(3, 3, 3)
b

In [None]:
b[0:1]

In [None]:
b[:, 0:1]

In [None]:
b[:, :, 0:1]

In [None]:
b[..., 0:1]

#### Hinzufügen von Achsen

In [None]:
c = np.arange(5)
c

In [None]:
c[:, np.newaxis]

In [None]:
c[np.newaxis, :]

#### Fancy indexing

In [None]:
a = np.arange(10, 20)
a[[0, 3, 0, 5]]

In [None]:
a[np.array([[0, 2], [1, 4]])]

#### Fancy indexing für mehrdimensionale Arrays

In [None]:
a = np.arange(16).reshape(4, 4)
a

In [None]:
a[[0, 1, 2]]

In [None]:
a[[0, 1, 2], [1, 2, 3]]

#### Fancy indexing mit booleschen Arrays

In [None]:
threshold = 0.3
a = np.random.random(12)
print(a)
print('-'*30)
indexarray = a < threshold
print(indexarray)
a[indexarray] = threshold
print(a)

#### Broadcasting

In [None]:
a = np.arange(5)
a*3

In [None]:
a*np.array([3, 3, 3, 3, 3])

#### Von der letzten Achse beginnend müssen die Achsen gleich lang sein oder eine Achse die Länge Eins besitzen.

In [None]:
a = np.arange(20).reshape(4, 5)
a

In [None]:
a*np.arange(5)

In [None]:
a*np.arange(4)

#### Das erweiterte Array hat folgende Form:

In [None]:
np.ones(shape=(4, 5), dtype=int)*np.arange(5)

#### Im obigen Fehlerfall müsste man folgendermaßen vorgehen:

In [None]:
b = np.arange(4)[:, np.newaxis]
b

In [None]:
b.shape

In [None]:
a*b

### 3.5 Universelle Funktionen

#### Funktionen aus dem ``math``-Modul können nicht auf Arrays angewandt werden.

In [None]:
import math
math.sin(np.linspace(0, math.pi, 11))

#### Numpy stellt solche Funktionen, universelle Funktionen genannt, zur Verfügung.

In [None]:
np.sin(np.linspace(0, math.pi, 11))

#### Diese Funktionen akzeptieren auch mehrdimensionale Arrays

In [None]:
np.sin(math.pi/6*np.arange(12).reshape(2, 6))

#### Eine Reihe von Funktionen aus ``scipy.special``, aber nicht alle, sind ebenfalls als universelle Funktionen implementiert.

In [None]:
import scipy.special
scipy.special.gamma(np.linspace(1, 5, 9))

#### Häufig möchte man die Funktionen auf einem Gitter auswerten.

In [None]:
np.mgrid[0:3, 0:3]

In [None]:
np.mgrid[0:3:7j, 0:3:7j]

#### Mit Broadcasting geht es auch schlanker:

In [None]:
np.ogrid[0:3:7j, 0:3:7j]

#### Ein Anwendungsbeispiel

In [None]:
thetavals, phivals = np.ogrid[0:np.pi:5j, 0:2*np.pi:9j]
n, m = 5, 2
resultat = scipy.special.sph_harm(m, n, phivals, thetavals)
resultat

#### Die folgende Lösung funktioniert nicht:

In [None]:
thetavals = np.linspace(0, np.pi, 5)
phivals = np.linspace(0, 2*np.pi, 9)
n, m = 5, 2
resultat = scipy.special.sph_harm(m, n, phivals, thetavals)
resultat

#### Universelle Funktionen bei großen Arrays deutlich schneller sein.

In [None]:
nmax = 100000

In [None]:
%%timeit
for n in range(nmax):
    x = 2*math.pi*n/(nmax-1)
    y = math.sin(x)

In [None]:
%%timeit
x = np.linspace(0, 2*np.pi, nmax)
y = np.sin(x)

In [None]:
%%timeit
prefactor = 2*math.pi/(nmax-1)
for n in range(nmax):
    y = math.sin(prefactor*n)

### 3.6 Lineare Algebra

In [None]:
import numpy.linalg as LA

#### ``*`` ist eine elementweise Multiplikation, keine Matrixmultiplikation.

In [None]:
a1 = np.array([[1, -3], [-2, 5]])
a2 = np.array([[3, -6], [2, -1]])
a1*a2

#### Matrixmultiplikation

In [None]:
np.dot(a1, a2)

#### Berechnung der Norm

In [None]:
vec = np.array([1, -2, 3])
LA.norm(vec)

In [None]:
LA.norm(vec)**2

#### Lösung eines inhomogenen Gleichungssystems

In [None]:
a = np.array([[2, -1], [-3, 2]])
b = np.array([1, 2])

In [None]:
LA.det(a)

In [None]:
np.dot(LA.inv(a), b)

#### oder direkt:

In [None]:
LA.solve(a, b)

#### Behandlung von Eigenwertproblemen

In [None]:
a = np.array([[1, 3], [4, -1]])
evals, evecs = LA.eig(a)
evals

In [None]:
evecs

In [None]:
for n in range(evecs.shape[0]):
    print(np.dot(a, evecs[:, n]), evals[n]*evecs[:, n])

#### Bei symmetrischen oder hermiteschen Matrizen kann ``eigh`` Zeit sparen:

In [None]:
dim = 500
a = np.random.random(dim*dim).reshape(dim, dim)
a = a+a.T

In [None]:
%timeit LA.eig(a)

In [None]:
%timeit LA.eigh(a)