In [2]:
import numpy as np
import matplotlib.pyplot as plt

# Arrays indexieren DOZENT

Wir können auf Elemente eines Numpy Arrays ebenso wie in Python-Listen (oder Arrays aus anderen Programmiersprachen) per Index zugreifen. Auf das letzte Element können wir mit -1 zugreifen, wie wir das auch von Python-Listen gewohnt sind.

## Indizieren von eindimensionalen Arrays

In [3]:
M = np.array([1, 2, 3, 4])
first_element = M[0]
last_element = M[-1]
second_element = M[1]

first_element, last_element, second_element

(1, 4, 2)

## Indizieren von zweidimensionalen Arrays (Matrizen)
Um ein Elment in einer Matrix zu indizieren, können wir mit dem Format `row,column` arbeiten.

In [6]:
M = np.diag([1, 2, 3])
print(M)
print("element in der ersten Zeile, zweiten Spalte: ", M[0,1])
print("element in der ersten Zeile, zweiten Spalte (Alternative): ", M[1][0])
print("element in der zweiten Zeile, zweiten Spalte: ", M[1,1])
print("element in der dritten Zeile, dritte Spalte: ", M[2,2])

[[1 0 0]
 [0 2 0]
 [0 0 3]]
element in der ersten Zeile, zweiten Spalte:  0
element in der ersten Zeile, zweiten Spalte (Alternative):  0
element in der zweiten Zeile, zweiten Spalte:  2
element in der dritten Zeile, dritte Spalte:  3


## Integer array indexing
Wir können beim Indexing auch einen Array mit Index-Positionen angeben

In [12]:
M = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
# Element in Zeile 1 und Spalte 3 indizieren (klassisch)
print(M[0,2])

# 1 Zeile und dritte Zeile mit Array Indexing
print(M, "\n", M[[0,2]])

3
[[1 2 3]
 [4 5 6]
 [7 8 9]] 
 [[1 2 3]
 [7 8 9]]


## Aufgabe

- Erstelle eine 2 x 3 Matrix M.
- Gebe den Shape des Arrays aus.
- Gebe den Wert in der zweiten Zeile und der ersten Spalte aus
- Gebe den Datentyp des Arrays aus
- Gebe die 2. Reihe aus

$ M = \left( \begin{matrix} 1 & 12 & 13 \\ 42 & 51 & 62 \end{matrix} \right) $

In [16]:
M = np.array([[1, 12, 13], [42, 51, 62]])
M, M.shape, M[1,0], M[1][0], M.dtype, M[1]

(array([[ 1, 12, 13],
        [42, 51, 62]]),
 (2, 3),
 np.int64(42),
 np.int64(42),
 dtype('int64'),
 array([42, 51, 62]))

## Zufällige Datenpunkte aus einer zweidimensionalen, normalverteilten Liste
Gegeben ist eine Liste mit Datenpunkte, die jeweils zwei Features haben. wir wollen aus dieser Liste zwei zufällige Datenpunkte ausschneiden.

In [19]:
mean = [0, 0]
cov = [[1, 0], [0, 100]]
x = np.random.multivariate_normal(mean, cov, size=10)

# zufällige Indizies erstellen
random_idx = np.random.randint(low=0, high=x.shape[0], size=2)
print(x)
print(x.shape)
print(random_idx)

# Datenpunkte aus Liste indizieren
data_samples = x[random_idx]
print(data_samples)

[[ -0.99742573  -2.35870877]
 [  1.28113186  -7.05268286]
 [ -0.66971248 -11.20867266]
 [ -0.09666762  12.69760773]
 [ -0.35345757  14.04966481]
 [  0.53155974  -0.67034931]
 [ -0.07049946   3.85068605]
 [  1.85170657  14.42901578]
 [ -1.59560439 -11.47171682]
 [  0.69255248  10.69003822]]
(10, 2)
[4 9]
[[-0.35345757 14.04966481]
 [ 0.69255248 10.69003822]]


# Arrays Slicing (Ausschneiden von Werten aus Arrays)
Generell erzeugen Slicing Operationen in Numpy keinen neuen Array, sondern bieten einen sogenannten View auf das Ursprungsarray. verändert man die geslicte Submenge, verändert man auch die Originaldaten. Verhindern kann man das mit copy (siehe weiter unten).

## von eindimensionalen Arrays (Vektoren)
Eindimensionale Arrays lassen sich wie in Python mit dem Slicing-Operator sclicen. Schema `Start:End:Schrittweite`.

In [29]:
x = np.array([8, 1, 2, 3, 4, 5, 6])
v = x[0:4]
v[1] = 99 # x wird verändert
# v = v * 99 # x wird nicht verändert, gensauso wenig wie v * 99
v.sort() # x wird verändert
v, x
# id(v[1]), id(x[1]) => haben die selbe ID

(133875927852688, 133875927852688)

In [9]:
x[3:5]

array([4, 5])

## von zweidimensionalen Arrays (Matritzen)
Zweidimensionale Arrays lassen sich wie in Python mit dem Slicing-Operator sclicen. 
Schema `Zeile von:Zeile bis, Spalte von:Spalte bis`.

$ M = \left( \begin{matrix} 1 & 2 & 3 \\ 4 & 5 & 6 \end{matrix} \right) $

In [10]:
M = np.array([[1, 2, 3], [4, 5, 6]])
M

array([[1, 2, 3],
       [4, 5, 6]])

### alle Zeilen, die ersten beiden Spalten 

Um eine Matrix nach folgendem Schema aus M "auszuschneiden"
$ M = \left( \begin{matrix} 1 & 2 \\ 4 & 5 \end{matrix} \right) $

In [11]:
M = np.array([[1, 2, 3], [4, 5, 6]])
M2 = M[:,:2]
M2

array([[1, 2],
       [4, 5]])

### ersten zwei Zeilen, erste Spalte

In [12]:
#  (Slicing der ersten beiden Zeilen, Indexing der Spalte 0)
M = np.array([[1, 2, 3], [4, 5, 6]])
M2 = M[:,0]
M2

array([1, 4])

### alle Zeilen und die erste und dritte Spalte mit Multiindexing

In [13]:
M = np.array([[1, 2, 3], [4, 5, 6]])
M3 = M[:, [0,2]]
M3

array([[1, 3],
       [4, 6]])

### Diagonale aus zweidimensionalem Array

In [6]:
M = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
M, M.diagonal()

(array([[1, 2, 3],
        [4, 5, 6],
        [7, 8, 9]]),
 array([1, 5, 9]))

## Aufgabe
$X =  \left(  \begin{array}{rrrr} 
2 & 3 & 8 \\ 
1 & 22 & 22 \\ 
4 & 22 & 22 \\ 
\end{array} \right) $

a) Erstelle das zweidimensionale Array   
b) Schneide den Block mit den 22 aus (2 x 2 Matrix)    
c) Schneide die diagonalen Werte aus (als Vektor mit shape(3,) [2, 22, 22])

In [36]:
M = np.array([[2, 3, 8], [1, 22, 22], [4, 22, 22]])
print(M)
print(M[1:, 1:])
print(M.diagonal())

# Gegediagonale
M2 = M[::-1, :]
print("M2:\n", M2.diagonal()[::-1])

# hier nochmal erklären, dass nur View. 
x = M[1:, 1:]
x[0] = [99,199]
x[1] = x[1] * 20
M

[[ 2  3  8]
 [ 1 22 22]
 [ 4 22 22]]
[[22 22]
 [22 22]]
[ 2 22 22]
M2:
 [ 8 22  4]


array([[  2,   3,   8],
       [  1,  99, 199],
       [  4, 440, 440]])

## copy
Um eine tatsächliche Kopie durch Slicing von einem Array zu erstellen, muss man die Methode Copy nutzen.
Falls der Datentyp "Object" (d.h. Python Objekte) genutzt wird, gilt das gleiche, wie in Python: dann besser tiefe Kopie nutzen via copy.deepcopy()

In [45]:
# ohne copy: Verändern von Index 0 bei P_copy verändert auch P
P = np.array([[2, 3, 4], [3, 45, 23]])
P_copy = P[:, 2]
P_copy[0] = 100
P_copy, P

(array([100,  23]),
 array([[  2,   3, 100],
        [  3,  45,  23]]))

In [46]:
# mit copy: Z bleibt unverändert
Z = np.array([[2, 3, 4], [3, 45, 23]])
Z_copy = Z[:, 2].copy()
Z_copy[0] = 100
Z_copy, Z

(array([100,  23]),
 array([[ 2,  3,  4],
        [ 3, 45, 23]]))

In [47]:
X_copy = Z[0:2, 0:2].copy()
X_copy[0,1] =  99
X_copy 

array([[ 2, 99],
       [ 3, 45]])

In [48]:
# object (aus der doku von .copy())
a = np.array([1, 'm', [2, 3, 4]], dtype=object)
b = a.copy()
b[2][0] = 10
a

array([1, 'm', list([10, 3, 4])], dtype=object)