# Numpy Einführung

In [19]:
import numpy as np

The history saving thread hit an unexpected error (OperationalError('attempt to write a readonly database')).History will not be written to the database.


## Erstellen eines Numpy Arrays

In [14]:
# Die Elemente eines Numpy nd-Arrays sollten immer vom selben Datentyp sein
...

### Array Dimension, Shape, Datentyp und Size

In [13]:
# Array-Dimension, Shape, Datentyp und Size
...

In [15]:
# Ein Array mit Integer und Floats. Numpy bildet alle Werte als float64 Bit ab
...

## Vektoren

#### Spaltenvektor (m × 1-Matrix)
Ein Spaltenvektor ist eine Matrix mit genau einer Spalte
$
 \vec{e}_1= \left(\begin{array}{c} 1 \\ 0 \\ 1 \end{array}\right)
$


#### Zeilenvektor ( 1 × n-Matrix)
 (Numpy Arrays sind per default Zeilenvektoren)   
da ein Zeilenvektor die transponierte form eines Spaltenvektors ist, tragen sie das T im Namen:    
$
 \vec{x}{^T} = (x \; y \; z) 
$

## Matrizen

Eine Matrix ist eine rechteckige Anordnung von Zahlen, Symbolen oder Ausdrücken, die in Zeilen und Spalten organisiert ist. Sie wird verwendet, um Daten kompakt darzustellen und erleichtert Berechnungen in Bereichen wie Algebra, Physik, Informatik und maschinellem Lernen.

Eine 2x3 Matrix würde mathematisch so notiert werden:

$ M = \left( \begin{matrix} 1 & 2 & 3 \\ 3 & 4 & 4 \end{matrix} \right) $



In [18]:
# Dimension und Shape eines 2-dimensionales Arrays. shape(2, 3) bedeutet: 2 Reihen, 3 Spalten
...

## Axis - der Achsenbegriff



## Arrays erstellen

### Array mit gemischten Datentypen int und float

In [13]:
M = np.array([1.1, 2.2, 4, 2])
print(M)
print("shape: ", M.shape)
print("dim: ", M.ndim)
print("dtype: ", M.dtype)

[1.1 2.2 4.  2. ]
shape:  (4,)
dim:  1
dtype:  float64


### Explizit Datentyp beim Erstellen des Arrays angeben

In [14]:
M = np.array([1, 2, 4, 2], dtype="float32")
print(M)
print("dtype: ", M.dtype)

[1. 2. 4. 2.]
dtype:  float32


### Null Matrix (intrinsic numpy array)

#### 2 x 2 Null-Matrix
$ \left( \begin{matrix} 0 & 0 \\ 0 & 0 \end{matrix} \right) $

In [15]:
N = np.zeros(shape=(2,2))
N

array([[0., 0.],
       [0., 0.]])

In [16]:
# eindimensionale Null-Matrix und Datentyp int32
N = np.zeros(shape=(11,), dtype="int32")
N

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], dtype=int32)

In [17]:
# dreidimensionale Null-Matrix (Tensor)
N = np.zeros(shape=(2,2,2), dtype="int32")
N

array([[[0, 0],
        [0, 0]],

       [[0, 0],
        [0, 0]]], dtype=int32)

## Einheitsmatrix
Eine spezielle Form ist die n × n-Einheitsmatrix, welche eine `Diagonalmatrix ist, deren Hauptdiagonalelemente alle gleich 1 sind`.

Die Einheitsmatrix wird mit E bezeichnet.


#### Einheitsmatrix 3. Ordnung
$ E = \left( \begin{matrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{matrix} \right) $

In [18]:
E = np.identity(3)
E

array([[1., 0., 0.],
       [0., 1., 0.],
       [0., 0., 1.]])

## Matrix mit Default-Werten

$ M = \left( \begin{matrix} 42 & 42 & 42 \\ 42 & 42 & 42 \\ 42 & 42 & 42 \end{matrix} \right) $

In [19]:
M = np.full(shape=(3,3), fill_value=42, dtype="int16")
M

array([[42, 42, 42],
       [42, 42, 42],
       [42, 42, 42]], dtype=int16)

## Diagonal-Matrix
Als  m  ×  n-Diagonalmatrix  D  =  (dij)  wird  eine  Matrix  bezeichnet,  deren  Elemente
außerhalb der Hauptdiagonale Null sind, bei der also gilt: dij = 0 für alle i ≠ j

#### 3 x 3 Diagonalmatrix
$\left(  \begin{array}{rrrr} 
2 & 0 & 0 \\ 
0 & 3 & 0 \\ 
0 & 0 & 1 \\ 
\end{array} \right) $

In [20]:
D = np.diag([2, 3, 1])
D

array([[2, 0, 0],
       [0, 3, 0],
       [0, 0, 1]])

## Reihe anlegen mit Range
Wir können mit Numpy ählich wie der range-Funktion aus Python auch eine Reihe anlegen. Dazu können wir die numpy-Methode `arange` nutzen, die identisch zur range-Funktion die drei Parameter Start, Stop (exklusive) und Schrittweite hat.

Mit arange erstellte Arrays sind stehts eindimensional, haben also den Shape (n, ).

In [21]:
R = np.arange(0, 10, 2)
R, R.shape

(array([0, 2, 4, 6, 8]), (5,))

## Intervall anlegen mit linspace
mit der Numpy-Methode `linspace` lässt sich einfach ein Intervall anlegen. Wichtige Argumente sind hier `endpoint`, das angibt, ob das Interval halboffen sein soll und `num`, dass die Anzahl der gleichgroßen Werte zwischen den Intervall-Grenzen angibt, d.h. die Abstände der Punkte sind gleichgroß. Defaultwert für num ist 50.

In [22]:
# halboffenes Intervall zwischen 1 und 2 mit 20 Werten
I = np.linspace(1, 2, num=20, endpoint=False)
I

array([1.  , 1.05, 1.1 , 1.15, 1.2 , 1.25, 1.3 , 1.35, 1.4 , 1.45, 1.5 ,
       1.55, 1.6 , 1.65, 1.7 , 1.75, 1.8 , 1.85, 1.9 , 1.95])

In [23]:
# geschlossenes Intervall zwischen 1 und 2 mit 20 Werten
I = np.linspace(1, 2, num=10)
I

array([1.        , 1.11111111, 1.22222222, 1.33333333, 1.44444444,
       1.55555556, 1.66666667, 1.77777778, 1.88888889, 2.        ])

## Übungsaufgaben
Erstelle eine 3 x 4 Null-Matrix     
Erstelle ein geschlossenes Interval zwischen 1 und 20 mit 70 Abständen     
Erstelle eine Diagonalmatrix mit den Werten 4, 2, 8, 1 auf der Diagonalen     

In [None]:
SIZE = 100

# Create a Python List with 100 Integers
mylist = range(SIZE)

sys.getsizeof(1) # size of an integer in Python is 28 Bytes
sys.getsizeof(1)* SIZE  # 2800

# create a Numpy array
numpy_array = np.arange(SIZE)
numpy_array.itemsize # size of an integer in numpy is 4 Bytes
numpy_array.itemsize  * SIZE # 400