![Numpy](https://upload.wikimedia.org/wikipedia/commons/1/1a/NumPy_logo.svg)

- Numpy steht für *Num*erical *Py*thon und ist die Grundlage für wissenschaftliche Datenverarbeitung
- Stellt viele algebraische Methoden zur Verfügung

Motivation:
- Meist hat man nach in einer Auswertung Datenpunkte, die verarbeitet werden müssen
- Numpy ist eine Python-Bibliothek, die den Umgang mit Datenpunkten enorm vereinfacht

In [None]:
%%javascript
$.getScript('https://kmahelona.github.io/ipython_notebook_goodies/ipython_notebook_toc.js')

# Inhalt

<div id="toc"></div>

# Grundlagen

In [None]:
import numpy as np

- Grunddatentyp von Numpy: das Array
- Kann man sich als effizientere Liste vorstellen
- Idee von Numpy: Man kann ein Array ähnlich wie eine Zahl verwenden. Operationen werden dann auf allen Elementen ausgeführt
- Am besten versteht man das mit einigen Beispielen:

In [None]:
# convert list to array
x = np.array([1, 2, 3, 4, 5])

In [None]:
2 * x

In [None]:
x**2

In [None]:
x**x

In [None]:
np.cos(x)

Achtung: Man brauch die `cos` Methode aus numpy!

In [None]:
import math
math.cos(x)

Bei großen Datensätzen ist die *Laufzeit* relevant:

In [None]:
%%timeit
xs = [42] * 10000
xs2 = [x**2 for x in xs]

In [None]:
%%timeit 
x = np.full(10000, 42)
x2 = x**2

Selbstgeschriebene Funktionen, die nur für eine Zahl geschrieben wurden, funktionieren oft ohne Änderung mit Arrays!

In [None]:
def poly(y):
    return y + 2 * y**2 - y**3

poly(x)

In [None]:
poly(np.pi)

In [None]:
# this also works:
def poly(x):
    return x + 2 * x**2 - x**3

poly(x)

Das erlaubt es einem unter anderem, sehr leicht physikalische Formeln auf seine Datenpunkte anzuwenden.

Arrays können beliebige Dimension haben:

In [None]:
# two-dimensional array
y = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

y + y

Das erlaubt es z.B. eine ganze Tabelle als ein Array abzuspeichern.

Mit Arrays sind auch Matrixoperationen möglich:

In [None]:
A = np.array([[1,1],
              [0,1]])
B = np.array([[2,0],
              [3,4]])

# element-wise product
print(A * B)

# matrix product
print(A @ B)

# also with one-dimensional vectors
np.array([1, 2, 3]) @ np.array([4, 5, 6])

# Dimension von Arrays

In Numpy werden Dimensionen auch *Achsen* genannt.

In [None]:
a = np.array([1.5, 3.0, 4.2])
b = np.array([[1, 2], [3, 4]])

print(f'Array a \n a.ndim   {a.ndim} \n a.shape  {a.shape} \n a.size   {a.size} \n a.dtype  {a.dtype}')
print(f'Array b \n b.ndim   {b.ndim} \n b.shape  {b.shape} \n b.size   {b.size} \n b.dtype  {b.dtype}')

# Erstellen von Arrays

Es gibt viele nützliche Funktionen, die bei der Erstellung von Arrays helfen:

In [None]:
np.zeros(10)

In [None]:
np.ones((5, 2))

In [None]:
np.linspace(0, 1, 11)

In [None]:
# like range() for arrays:
np.arange(0, 10)

In [None]:
np.logspace(-4, 5, 10)

# Numpy Indexing

Numpy erlaubt einem sehr bequem bestimmte Elemente aus einem Array auszuwählen

In [None]:
x = np.arange(0, 10)
print(x)

# like lists:
x[4]

In [None]:
# all elements with indices ≥1 and <4:
x[1:4]

In [None]:
# negative indices count from the end
x[-1], x[-2]

In [None]:
# combination:
x[3:-2]

In [None]:
# step size
x[::2]

In [None]:
# trick for reversal: negative step
x[::-1]

![Indexing1D](images/Indexing1D.svg)

In [None]:
y = np.array([x, x + 10, x + 20, x + 30])
y

In [None]:
# comma between indices
y[3, 2:-1]

In [None]:
# only one index ⇒ one-dimensional array
y[2]

In [None]:
# other axis: (: alone means the whole axis)
y[:, 3]

In [None]:
# inspecting the number of elements per axis:
y.shape

![Indexing2D](images/Indexing2D_code.svg)

Ausgewählten Elementen kann man auch direkt einen Wert zuweisen

In [None]:
y

In [None]:
y[:, 3] = 0
y

Man kann Indexing sogar gleichzeitig auf der linken und rechten Seite benutzen

In [None]:
y[:,0] = x[3:7]
y

Transponieren des Arrays kehrt die Reihenfolge der Indizes um:

In [None]:
y

In [None]:
y.shape

In [None]:
y.T

In [None]:
y.T.shape

# Masken
Oft will man Elemente auswählen, die eine bestimmte Bedingung erfüllen.

Hierzu erstellt man zuerst eine Maske (Arrays aus True/False-Werten).

Diese kann man in eckigen Klammern übergeben.

In [None]:
a = np.linspace(0, 2, 11)
b = a**2

print(a)

# create a mask for all elements >= 1
mask = a >= 1
print(mask)

print(a[mask])
# do it in one step:
print(a[a>=1])

# Reduzieren von Arrays

Viele Rechenoperationen reduzieren ein Array auf einen einzelnen Wert

In [None]:
x

In [None]:
y

Summe aller Elemente

In [None]:
np.sum(x)

Bei vielen Methoden kann die Dimension (Achse) mit angegeben werden

In [None]:
np.sum(y, axis=1)  # sum of each row

Multiplikation aller Elemente

In [None]:
np.prod(x)

Mittelwert der Einträge

In [None]:
np.mean(x)

Standardabweichung der Einträge

In [None]:
np.std(x)

Fehler des Mittelwerts (geht auch einfacher):

In [None]:
np.std(x, ddof=1) / np.sqrt(len(x))

Schätzer der Standardabweichung

In [None]:
np.std(x, ddof=1)

Differenzen zwischen benachbarten Elementen

In [None]:
z = x**2
print('z ', z)

np.diff(z)

# Input / Output

Einlesen aus Textdateien: `genfromtxt`

Sie gibt den Inhalt einer Textdatei als Array zurück.

Das Gegenstück ist `savetxt`.

In [None]:
n = np.arange(11)
x = np.linspace(0, 1, 11)

np.savetxt('test.txt', [n, x])

In [None]:
# see exercise 1-python/6-readwrite

with open('test.txt', 'r') as f:
    print(f.read())

In [None]:
data = np.array([n, x])

np.savetxt('test.txt', np.column_stack([n, x]))

with open('test.txt', 'r') as f:
    print(f.read())

Man sollte aber immer erklären, was man da abspeichert:

In [None]:
n = np.arange(11)
x = np.linspace(0, 1, 11)

# header schreibt eine Kommentarzeile in die erste Zeile der Datei
np.savetxt('test.txt', np.column_stack([n, x]), header="n x")
with open('test.txt', 'r') as f:
    print(f.read())

Einlesen der Werte mit `genfromtxt` :

In [None]:
a, b = np.genfromtxt('test.txt', unpack=True)
a, b

Um die Datentypen zu erhalten, muss `fmt` angegeben werden:

In [None]:
np.savetxt(
    'test.txt',
    np.column_stack([n, x]),
    fmt=['%d', '%.4f'],       # first column integer, second 4 digits float
    delimiter=',',
    header='n,x',
)

In [None]:
data = np.genfromtxt(
    'test.txt',
    dtype=None,    # guess data types
    delimiter=',', 
    names=True,
)

data ist ein besonderes array, das sich ähnlich wie ein `dict` verhält:

In [None]:
data

In [None]:
data['n'], data.shape, data.dtype