# Numerisches Python

Numerisches Python (engl. *Numeric Python*) soll eine Andeutung auf numerisches Programmieren und das python-spezifische Modul `NumPy` sein. Python ist in Wissenschaft und Forschung weit verbreitet, was nicht zuletzt an den hervorragenden Möglichkeiten liegt, mit Python große Datenmengen elegant und *effizient* zu verarbeiten. 

Sobald es um die Lösung numerischer Probleme geht, ist die Leistungsfähigkeit von Algorithmen von höchster Wichtigkeit, sowohl was die Geschwindigkeit als auch den Speicherverbrauch betrifft. Reines Python - also wie bisher, ohne den Einsatz irgendwelcher Spezialmodule - würde sich nicht eignen für Aufgaben, für die z.B. MATLAB gemacht ist.

Nutzen Sie Python in Kombination mit den Modulen `NumPy`,`SciPy`, `Matplotlib` und `Pandas`, dann gehört die Programmiersprache zu den führenden numerischen Programmiersprachen und ist mindestens so effizient wie MATLAB.

- `NumPy` ist ein Modul, das grundlegende Datenstrukturen zur Verfügung stellt, die auch von `Matplotlib`, `SciPy` und `Pandas` benutzt werden. Es implementiert mehrdimensionale Arrays und Matrizen, und gibt wesentliche Funktionalitäten an die Hand, mit denen sich diese Datenstrukturen erzeugen und verändern lassen.

- `SciPy` baut auf `NumPy` auf, d.h. es baut auf den Datenstrukturen auf. Es erweitert die Leistungsfähigkeit mit weiteren Funktionalitäten wie beispielsweise Regression, Fourier-Transformation, Lösen von LGS und viele weitere.

- `Pandas` ist das "jüngste Kind" in dieser Modulfamilie. Es benutzt alle bisher genannten Module und baut auf diesen auf. Der Fokus besteht darin, Datenstrukturen und Operationen zur Verarbeitung von Tabellen und Zeitreihen bereitzustellen. Der Name ist von "Panel data" abgeleitet. Es eignet sich daher z.B. bestens, um mit Tabellendaten, wie sie von Excel erzeugt werden, zu arbeiten.

- Menschen sind unheimlich gut darin, Bilder zu interpretieren, Computer haben ihre Stärke in der Auswertung von Zahlen. Um nun die Früchte der Datenverarbeitung mit Python zu ernten, will man oft die Daten als graphische Plots ausgeben. Am einfachsten lässt sich dies in Python mit dem Modul `Matplotlib` bzw. dessen Untermodul `PyPlot` realisieren. 

**Python als Alternative zu MATLAB**

Ein wesentlicher Nachteil von MATLAB gegenüber Python sind die Kosten. Python mit all seinen Modulen ist kostenlos, wohingegen MATLAB recht teuer ist und je nach Toolbox noch viel teurer werden kann. Bei Python handelt es sich aber nicht nur um *kostenlose*, sondern auch um *freie* Software, d.h. ihr Einsatz ist nicht durch irgendwelche Lizenzmodelle eingeschränkt.

![](anhang/pythonVSmatlab.png)

<sub>Quelle: B. Klein, „Numerisches Python“, Carl Hanser Verlag GmbH & Co. KG, 2023, S. 5 </sub>

## 9. NumPy

### 9.1 Einführung

**Zusammenfassung und Vergleich von NumPy-Datenstrukturen und Python**

generelle Vorteile von Python-Datenstrukturen:

- `int` und `float` sind als mächtige Klassen implementiert. Daher können z.B. `int`-Zahlen beinnahe "unendlich" groß oder klein werden.
- Mit `list` hat man effiziente Methoden zum Einfügen, Anhängen und Löschen von Elementen
- `dict` bieten einen schnellen *Lookup* 

Vorteile von NumPy-Datenstrukturen gegenüber Python:

- Array-basierte Berechnungen
- effizient implementierte mehrdimensionale Arrays
- gemacht für wissenschaftliche Berechnungen

**Ein einfaches Beispiel**

Zuerst muss das Modul `numpy` mit dem Befehl `import numpy as np` importiert werden. Dabei hat sich der Alias `np` als Konvention durchgesetzt. **Vermeiden** Sie `from numpy import *`.

In [None]:
# einfache Beispiele
# TODO Modul importieren

# Temperaturwerte in Grad Celsius
cvalues = [20.8, 21.9, 22.5, 22.7, 22.3, 21.0, 21.2, 20.9, 20.1]

# TODO Erzeugen eines eindimensionalen NumPy-Arrays


# TODO Temperaturwerte in Grad Fahrenheit umrechnen


# TODO Umrechnung mit reiner Python-Lösung


# TODO Ausgabe des NumPy-Typs



`ndarray` steht für *n-dimensional array* und wird synonym zur Bezeichnung *Array* verwendet.

**Einfache Visualisierung von Werten**

Auch wenn das Modul `Matplotlib` erst später im Detail besprochen wird, soll die einfachste Anwendung des Moduls - die zum Plotten der obigen Werte - an dieser Stelle bereits gezeigt werden. Dazu wir das Paket `pyplot` aus `matplotlib` benötigt. Speziell in Jupyter Notebook (oder in der ipyhton-Shell) sollte man zusätzlich `%matplotlib inline` schreiben. `inline` impliziert, dass der Plot im Notebook selber erscheint. Ein reines `%matplotlib` erzeugt ein neues Fenster mithilfe des jeweils konfigurierten GUI-Backend. 

In [None]:
# TODO Temperaturwerte plotten



Die Funktion `plot()` benutzt das Array `C` als Werte für die y-Achse. Als Werte für die x-Achse wurden die Indizes des Arrays `C` verwendet.

### 9.2 Arrays in NumPy

Wie in [9.1](#91-einführung) gesehen, kann man mit der Funktion `array()` ein Array-Objekt aus einer beliebigen Zahlenfolge (z.B. Liste oder Tupel) erzeugen. Bei der Ausgabe mit der Standard-`print()`-Funktion liefert Python eine Darstellung, die der mathematischen Schreibweise für Matrizen sehr ähnelt. Beachten Sie: Zwischen den Zahlen sind keine Kommas.

Mehrdimensionale Arrays lassen sich beispielsweise mit verschachtelten Listen erzeugen:

In [None]:
# TODO mehrdimensionale Arrays

# das zweite Argument gibt den Datentyp vor


Neben mehrdimensionalen Arrays lassen sich auch "0-dimensionale" erzeugen. Man spricht dann auch von Skalaren. 

In [None]:
# TODO 0-dimensionales Array


Die Dimension lässt sich entweder über das Attribut `ndim` oder über die Methode `np.ndim()` bestimmen. Diese ist gleichbedeutend mit der Anzahl der Achsen.

**Spezielle Arrays**:

In [None]:
# Arrays aus Nullen oder Einsen
print(np.ones((2,3), int))
print(np.zeros((4,5) ,int))



#### 9.2.1 Arrays erzeugen mit `arange()`

Der Syntax von `arange()` lautet:

```python
arange([start=0,] stop[, step=1][, dtype = None])
```

wobei:

- *gleichmäßig verteilte* Werte innerhalb der halb-offenen Intervalls `[start, stop)` generiert werden
- als Argumente sowohl `int` als auch `float` Werte übergeben werden können
- mit `dtype` der Type des Arrays bestimmt werden kann, wird nichts angegeben, wird der Type anhand der Eingabewerte ermittelt

Wird `dtype = int` gesetzt, ist die Funktion `arange()` beinahe äquivalent zur built-in Funktion `range()`. Der Unterschied liegt im Rückgabeobjekt. `arange()` liefert ein `ndarry` zurück, während `range()` ein `range`-Objekt, welches ein *Iterator* ist, zurückliefert.

In [None]:
# TODO Beispiel zu arange()


# im Vergleich dazu range():
x = range(1,7)
print(x)
print(list(x))

# TODO weitere arange-Beispiele


# seltsame Beispiele
print("\nSeltsame Beispiel")
b = np.arange(12.04, 12.84, 0.08)
print("b, ",b)
c = np.arange(0.6, 10.4, 0.71, int)
print("c: ",c)
d = np.arange(0.28, 5, 0.71, int)
print("d: ",d)
#help(np.arange)

#### 9.2.2 Arrays erzeugen mit `linspace()`

Der Syntax von `linspace()` lautet:

```python
linspace(start, stop[, num=50][, endpoint = True][, retstep=False])
```

wobei:

- `endpoint` vorgibt, ob der Wert `stop` noch mitausgegeben wird oder nicht. Default = `True`
- `num` die Anzahl der *gleichmäßig verteilten* Werte aus dem Intervall `[start, stop]`vorgibt. Default = `50`
- für `retstep=True` noch zusätzlich der Abstand der zurückgegebenen Werte des Arrays mit zurückgegeben wird. Default = `False`

In [None]:
# TODO Beispiele zu linspace()
# optional zur "Verschönerung"
np.set_printoptions(linewidth=65, precision=3)



Wofür braucht es den Parameter `retstep` überhaupt? Kann man nicht einfach die Differenz zweier benachbarten Werte berechnen?

In [None]:
# Beispiel, warum retstep Sinn macht
a, spacing = np.linspace(4, 23, endpoint=False, retstep=True)
print(a[:6])
# Abstände zwischen den ersten 6 Array-Elementen:
for i in range(6):
    print(a[i + 1] - a[i])
print(f"{spacing=}")

##### Vergleich von  `arange()` und `linspace()`

Laufzeitvergleich:

In [None]:
#import laufzeitvergleich
%run laufzeitvergleich.py

Attribute (*flags*) geben Informationen über das *Memory Layout* des Arrays:

In [None]:
# Attributvergleich 
arr = np.arange(20, 30)
linsp = np.linspace(20, 30, 10, endpoint=False)

print(arr)
print(linsp)

print("Flags von arange():\n", arr.flags)
print("Flags von linspace():\n", linsp.flags)

Interessant ist hierbei das Attribut `OWNDATA` (s. später in [9.2.4](#924-form-eines-arrays-verändern)):

> The array owns the memory it uses (True) or borrows it from another object (False).

#### 9.2.3 Form eines Arrays ermitteln

Neben der Methode `np.dim()` gibt es zur Bestimmung der Größe bzw. Gestalt eines Arrays die Methoden `shape()` und `size()`. Die erste Methode liefert ein Tupel mit der Anzahl der Elemente pro Achse (Dimension). Es gibt auch eine äquivalente Array-Property `shape`. Die zweite gibt die absolute Anzahl der Elemente eines Arrays zurück.

![](https://predictivehacks.com/wp-content/uploads/2020/08/numpy_arrays.png)
<sub>Quelle: F. Neumann. "Introduction to numpy and matplotlib". TU Berlin. [fneum.github.io](https://fneum.github.io/data-science-for-esm/02-workshop-numpy.html)</sub>

In [None]:
# Beispiel zu shape()
x = np.array([[67, 63, 87], 
              [77, 69, 59], 
              [85, 87, 99], 
              [79, 72, 71], 
              [63, 89, 93], 
              [68, 92, 78]])

y = np.array([[[111, 112], [121, 122]], 
              [[211, 212], [221, 222]], 
              [[311, 312], [321, 322]]]) 

z = np.array([1, 2, 3, 4, 5])

# TODO Form ermitteln


#### 9.2.4 Form eines Arrays verändern

`numpy` Arrays besitzen Methoden, die eine *Sicht* (*view*) mit neuer Form kontruieren: `reshape()` und `ravel()`. Dabei ist die neue Form kein eigenes unabhängiges Objekt, sonder eine *Sicht*, die mit dem Original-Array verbunden bleibt. Wenn das Original-Array verändert wird, ändert sich auch die *Sicht*.

- Beim Aufruf von `reshape()` werden natürliche Zahlen übergeben, die die Form der gewünschten Sicht beschreiben

- `ravel()` liefert eine *verflachte* Sicht, ein eindimensionales Array, in dem alle Elemente des Original-Arrays hintereinander geschrieben sind.

In [None]:
# TODO Beispiel zu reshape() und ravel()


Mit der Methode `resize()` wird das Array (und dessen Größe) verändert. Die Argumente sind Zahlen, die die gewünschte Form beschreiben. Wenn die neue Form größer ist, werden Nullen ergänzt. Allerdings wird empfohlen, die Methode über `np.resize(array, (newsize))`, anstatt es über das `ndarray` direkt über `ndarray.resize((newsize))` aufzurufen. Vor allem bei über `linspace()` erzeugte Arrays kann es sonst zu Fehlermeldungen führen. Hierbei wird solange mit wiederholten Kopien des Arrays aufgefüllt, bis die gewünschte Größe erreicht ist (s. auch [Dokumentation](https://numpy.org/doc/stable/reference/generated/numpy.resize.html#numpy-resize))

In [None]:
# TODO Array verändern



#### 9.2.5 Indizierung und Slicing

Um auf einzelne Elemente zuzugreifen, verwendet man wie bei *Sequenzen* den `[]`-Operator:

In [None]:
# Zugriff auf Elemente eines Arrays
f = np.array([1, 7, 2, 3, 5, 8, 13, 21])
print(f[0]) # erstes Element
print(f[1]) # zweites Element
print(f[-1])# letztes Element

In [None]:
# Mehrdimensionale Arrays indizieren
y = np.array([[[111, 112], [121, 122]], 
              [[211, 212], [221, 222]], 
              [[311, 312], [321, 322]]]) 

print(y[0][1][0])   # wie bei verschachtelten Listen
print(y[0, 1, 0])   # funktioniert genauso

Auch das *Slicing* funktioniert ähnlich wie bei normalen Python-Sequenzen nach dem Syntax `[start:stop:step]`. **Achtung**: Während bei Listen und Tupel neue Objekte erzeugt werden, generiert der Teilsbereichtoperator bei NumPy nur eine *Sicht* auf das Original-Array. Um ein Array zu kopieren, benötigt man die Methode `copy()`.

In [None]:
# Einige Beispiele
a = np.arange(9)
print(a)
print(a[1:4])
print(a[:4])
print(a[4:])
print(a[::2])
b = a[:]    # Sicht auf a
print(b)
b[0] = 99
print(a)

# TODO (Teil-)Array kopieren


In [None]:
# Gleiche Operationen bei einer Liste
lst = [0, 1, 2, 3, 4, 5, 6, 7, 8]
print(lst)
print(lst[1:4])
print(lst[:4])
print(lst[4:])
print(lst[::2])
lst2 = lst[:]   # flache Kopie 
lst2[0] = 99
print(lst)

Im Zweifel kann man mithilfe der Methode `np.may_share_memory()` prüfen, ob zwei Arrays auf den gleichen Speicherbereich zugreifen.

In [None]:
# Prüfe Speicherbereich
print(np.may_share_memory(a, b))
print(np.may_share_memory(a, c))

Bei dreidimensionalen Arrays ist der Zugriff etwas schwerer vorstellbar. Aus diesem Grund soll folgendes Beispiel genauer betrachtet werden

In [None]:
# dreidimensionales Array
X = np.array([[[3, 1, 2],
               [4, 2, 2]],
               
               [[-1, 0, 1],
                [1, -1, -2]],
                
                [[3, 2, 2],
                 [4, 4, 3]],
                 
                 [[2, 2, 1],
                  [3, 1, 3]]])

# zuerst selber überlegen
print(X.shape)

![](anhang/mehrdimensional.png)

<sub>Quelle: B. Klein, „Numerisches Python“, Carl Hanser Verlag GmbH & Co. KG, 2023, S. 30 </sub>

#### 9.2.6 Darstellung von Matrizen und Vektoren

Zur Darstellung von Matrizen und Vektoren werden zweidimensionale Arrays genutzt.

Beispiel zu Vektoren:

In [None]:
# TODO Vektoren mit numpy realisieren


Für Matrizen bietet sich die Kombination aus der Erstellung einer Zahlenfolge und der Methode `reshape()` an:


In [None]:
# TODO Möglichkeit, Matrix darzustellen


Zur Erzeugung einer Einheitsmatrix gibt es zwei Möglichkeiten:

1. `eye(n[, m[, k[, dtype]]])`: `n`: Anzahl der $1$ er auf der Hauptdiagonalen; `m`: Optional. Anzahl der Spalten, falls Matrix nicht quadratisch; `k`: Optional. Anzahl der $0$ er Spalten *vor* der Diagonalen aus $1$.
2. `identity(n[, dtype])`: liefert quadratische Einheitsmatrix der Form n x n.

In [None]:
# TODO Einheitsmatrix
i = np.identity(3, dtype = int)
print(i)

e =np.eye(3, 7, 1, dtype = int)
print(e)

Die Methode `transpose()` liefert eine transponierte Darstellung als *Sicht*. Arrays besitzen alternativ auch das Attribut `T`, das ebenfalls eine *Sicht* auf die transponierte Darstellung enthält.

In [None]:
# TODO mit Beispielen von oben


# transponierter Vektor


#### 9.2.7 Konkatenation von Arrays

Syntax der Funktion `concatenate`:

```python
concatenate((a1, a2, ...), axis=0,
            out=None, dtype=None)
```

In [None]:
# Beispiel zur Konkatenation
# eindimensionale Arrays
x = np.array([11, 22])
y = np.array([18, 7, 6])
z = np.array([1, 3, 5])
c = np.concatenate((x, y, z))
print(c)

In [None]:
# mehrdimensionale Arrays, axis=0
x = np.array(range(8))
x = x.reshape((2, 4))
y = np.array(range(100, 112))
y = y.reshape((3, 4))
z = np.concatenate((x, y)) # axis=1 geht nicht
print(f'x:\n{x}\n\ny:\n{y}\n\nz:\n{z}')

In [None]:
# mehrdimensionale Arrays, axis=1
x = np.array(range(8)).reshape((4, 2))
y = np.array(range(100, 112)).reshape((4, 3))
z = np.concatenate((x, y), axis=1)
print(f'x:\n{x}\n\ny:\n{y}\n\nz:\n{z}')

&rarr; bei der Konkatenation mehrdimensionaler Arrays entlang einer bestimmten Achse muss sichergestellt sein, dass die *shape* **aller anderen Dimensionen** gleich sind. 

In [None]:
# dreidimensionales Beispiel
x = np.array(range(24)).reshape((2, 3, 4))
y = np.array(range(100, 116)).reshape((2, 2, 4))
z = np.concatenate((x, y), axis=1)
print(f'x:\n{x}\n\ny:\n{y}\n\nz:\n{z}')

#### 9.2.8 Vergleiche

Zwei Arrays können mit den üblichen Vergleichsoperatoren (`<, <=, >, >=, ==, !=`) elementweise verglichen werden. Das Ergebnis ist ein Array mit Wahrheitswerten:

In [None]:
# TODO Arrays vergleichen
a = np.array([[1, 2], [2, 0]])
b = np.array([[1, 2], [2, 3]])


Mit den Methoden `logical_or()` und `logical_and()` können Sie zusammengesetzte Bedingungen konstruieren. Die normalen logischen Operatoren wie `&` oder `|` können nicht verwendet werden:

In [None]:
# Bedingungen verknüpfen
a = np.arange(8)
b = np.logical_and(a >= 3, a <= 5)
print(b)

#### 9.2.9 weitere Methoden und Attribute

Allgemein:

|Attribut oder Methode|Erklärung|
|:----|:----|
|`dtype`| Datentyp der Elemente des Arrays|
|`fill(x)`| Das gesamte Array wird mit dem Skalar *x* gefüllt|
|`round([decimals])`| Alle Zahlen im Array werden gerundet. Das optionale Argument gibt die Anzahl der Nachkommastellen an|
|`sort()`| In-Place-Sortierung der Elemente des Arrays|
|`tolist()`|Liefert eine (eventuell verschachtelte) Liste, die das Array repräsentiert|

Aus dem Modul `numpy.random`:

|Attribut oder Methode|Erklärung|
|:----|:----|
|`rand(...)`|Liefert ein Array mit gleichverteilten Zufallszahlen zwischen $0$ und $1$. Im Argument wird die Form übergeben.
|`randint(low, high, shape)`|Liefert ein Array mit ganzen Zufallszahlen zwischen *low* (einschließlich) und *high* (ausschließlich). Das Argument *shape* gibt die Form des Arrays an.|
|`randn(...)`|Liefert eine Matrix mit Zufallszahlen in gaußscher Normalverteilung mit Mittelwert $0$ und Varianz $1$.|
|`seed(n)`|*Seed* der Zufallsroutine wird auf *n* gesetzt|

In [None]:
# TODO Beispiel zu seed()


#### 9.2.10 Datentypen

|Datentyp| Beschreibung|
|:----|:----|
|`int8`| Byte (-128 … 127), 1 Byte
|`int16`| Integer (-32768 … 32767), 2 Bytes
|`int32`| Integer (-2147483648 … 2147483647), 4 Bytes
|`int64` |Integer (-9223372036854775808 … 9223372036854775807), 8 Bytes
|`uint8` |Unsigned integer (0 … 255), 1 Byte
|`uint16` |Unsigned integer (0 … 65535), 2 Bytes
|`uint32` |Unsigned integer (0 … 4294967295), 4 Bytes
|`uint64` |Unsigned integer (0 … 18446744073709551615), 8 Bytes
|`float16` |Half precision float: Vorzeichenbit, 5 Exponentenbits, 10 Mantissenbits
|`float32` |Single precision float: Vorzeichenbit, 8 Exponentenbits, 23 Mantissenbits
|`float64` |Double precision float: Vorzeichenbit, 11 Exponentenbits, 52 Mantissenbits
|`complex64` |Komplexe Zahl, Real- und Imaginärteil sind jeweils 32-bit floats
|`complex128` |Komplexe Zahl, Real- und Imaginärteil sind jeweils 64-bit floats

In [None]:
# Nähere Informationen über Datentypen
print(np.finfo(np.float16))
print(np.finfo(np.float32))
print(np.finfo(np.float64))