<a href="https://datamics.com/de/courses/"><img src=../../DATA/bg_datamics_top.png></a>

<em text-align:center>© Datamics</em>
# NumPy Indexing und Selection

In dieser Lektion werden wir diskutieren, wie man Elemente oder Gruppen von Elementen aus einem Array auswählt.

In [1]:
import numpy as np

In [2]:
# Ein Beispielarray erstellen
arr = np.arange(0,11)

In [3]:
# Anzeigen
arr

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

## Indexing und Selection mit Klammern

Der einfachste Weg um ein oder mehrere Element(e) aus einem Array auszuwählen sieht dem bei einer Liste sehr ähnlich:

In [4]:
# Wert mit seinem Index erhalten
arr[8]

8

In [5]:
# Erhalte die Werte in einem Bereich
arr[1:5]

array([1, 2, 3, 4])

In [6]:
# Erhalte die Werte in einem Bereich
arr[0:5]

array([0, 1, 2, 3, 4])

## Broadcasting

NumPy Arrays unterscheiden sich von normalen Python Listen durch ihre Fähigkeit des [Broadcasting](https://docs.scipy.org/doc/numpy/user/basics.broadcasting.html).

In [7]:
# Einen Wert durch einen Index-Bereich festlegen (Broadcasting)
arr[0:5]=100

# Anzeigen
arr

array([100, 100, 100, 100, 100,   5,   6,   7,   8,   9,  10])

In [8]:
# Das Array zurücksetzen. Warum das nötig ist sehen wir gleich
arr = np.arange(0,11)

# Anzeigen
arr

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [9]:
# Ein Stück des Arrays wählen
stueck_des_arr = arr[0:6]

# Anzeigen
stueck_des_arr

array([0, 1, 2, 3, 4, 5])

In [10]:
# Das Stück bearbeiten
stueck_des_arr[:]=99

# Das Stück erneut anzeigen
stueck_des_arr

array([99, 99, 99, 99, 99, 99])

Achtet darauf, wie diese Änderung auch im originalen Array auftaucht!

In [11]:
arr

array([99, 99, 99, 99, 99, 99,  6,  7,  8,  9, 10])

Die Daten wurden hier nicht kopiert. Das erzeugte Teilstück ist eine Betrachtung des originalen Arrays. Das vermeidet Speicherprobleme.

In [12]:
# Um eine Kopie zu erzeugen, müssen wir das explizit anweisen
arr_kopie = arr.copy()

arr_kopie

array([99, 99, 99, 99, 99, 99,  6,  7,  8,  9, 10])

## Indexing in 2D Arrays (Matrizen)

Das allgemeine Format ist arr_2d[row][col] oder arr_2d[row,col]. Ich empfehle normalerweise die Komma-Notation für mehr Klarheit.

In [13]:
arr_2d = np.array(([5,10,15],[20,25,30],[35,40,45]))

# Anzeigen
arr_2d

array([[ 5, 10, 15],
       [20, 25, 30],
       [35, 40, 45]])

In [14]:
# Die Reihe indexieren
arr_2d[1]

array([20, 25, 30])

In [15]:
# Das Format ist arr_2d[row][col] oder arr_2d[row,col]

# Einzelne Elemente auswählen
arr_2d[1][0]

20

In [16]:
# Einzelne Elemente auswählen
arr_2d[1,0]

20

In [17]:
# 2D Array Stücke auswählen

# Form (2,2) von oben rechts
arr_2d[:2,1:]

array([[10, 15],
       [25, 30]])

In [18]:
# Form untere Reihe
arr_2d[2]

array([35, 40, 45])

In [19]:
# Form untere Reihe
arr_2d[2,:]

array([35, 40, 45])

### Raffiniertes Indexing

Raffiniertes Indexing erlaubt es uns ganze Reihen oder Spalten entgegen ihrer Reihenfolge zu wählen. Um das zu verdeutlichen erstellen wir zunächst ein NumPy Array:

In [20]:
# Eine Matrix erstellen
arr2d = np.zeros((10,10))

In [21]:
# Länge des Array
arr_laenge = arr2d.shape[1]

In [22]:
# Das Array erstellen

for i in range(arr_laenge):
    arr2d[i] = i
    
arr2d

array([[0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [1., 1., 1., 1., 1., 1., 1., 1., 1., 1.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [3., 3., 3., 3., 3., 3., 3., 3., 3., 3.],
       [4., 4., 4., 4., 4., 4., 4., 4., 4., 4.],
       [5., 5., 5., 5., 5., 5., 5., 5., 5., 5.],
       [6., 6., 6., 6., 6., 6., 6., 6., 6., 6.],
       [7., 7., 7., 7., 7., 7., 7., 7., 7., 7.],
       [8., 8., 8., 8., 8., 8., 8., 8., 8., 8.],
       [9., 9., 9., 9., 9., 9., 9., 9., 9., 9.]])

Raffiniertes Indexing erlaubt uns nun folgendes:

In [23]:
arr2d[[2,4,6,8]]

array([[2., 2., 2., 2., 2., 2., 2., 2., 2., 2.],
       [4., 4., 4., 4., 4., 4., 4., 4., 4., 4.],
       [6., 6., 6., 6., 6., 6., 6., 6., 6., 6.],
       [8., 8., 8., 8., 8., 8., 8., 8., 8., 8.]])

In [24]:
# Und das in jeder Reihenfolge
arr2d[[6,4,8,2]]

array([[6., 6., 6., 6., 6., 6., 6., 6., 6., 6.],
       [4., 4., 4., 4., 4., 4., 4., 4., 4., 4.],
       [8., 8., 8., 8., 8., 8., 8., 8., 8., 8.],
       [2., 2., 2., 2., 2., 2., 2., 2., 2., 2.]])

### Mehr Hilfe beim Indexing

Indexing in einer 2D Matrix kann anfangs etwas verwirrend sein. Bei Google Bilder findet man nützliche Bilder, die einem dabei helfen. Bspw. das folgende:

<img src= 'http://memory.osu.edu/classes/python/_images/numpy_indexing.png' width=500/>

## Selection

Lass uns jetzt noch kurz anschauen, wie wir Klammern nutzen können, um eine Selection basieren auf Vergleichsoperatoren durchzuführen.

In [25]:
arr = np.arange(1,11)
arr

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [26]:
arr > 4

array([False, False, False, False,  True,  True,  True,  True,  True,
        True])

In [27]:
bool_arr = arr>4
bool_arr

array([False, False, False, False,  True,  True,  True,  True,  True,
        True])

In [28]:
arr[bool_arr]

array([ 5,  6,  7,  8,  9, 10])

In [29]:
arr[arr>2]

array([ 3,  4,  5,  6,  7,  8,  9, 10])

In [30]:
x=2
arr[arr>x]

array([ 3,  4,  5,  6,  7,  8,  9, 10])

# Gut gemacht!