# Indizierung von Arrays

Da Arrays für die Programmierung numerischer Algorithmen fundamental sind, ist es wichtig, vertraut im Umgang mit ihnen zu sein. 
Der erste Schritt ist das Zugreifen oder Verweisen auf Elemente eines Arrays, auch Indizierung genannt.
Die Indizierung erlaubt es, Elemente eines Arrays auszulesen oder zu verändern.
Die Position eines Wertes innerhalb eines Arrays nennt man *Index*. In Python beginnt die Indizierung bei $0$, das bedeutet das erste Element hat den Index $0$, das zweite den Index $1$, das dritte den Index $2$ und so weiter.

In diesem Unterkapitel werden Sie mit dem eindimensionalen Array `alter` und zweidimensionalem Array `data` arbeiten. Der folgende, versteckte Code initialisiert sowohl `alter` als auch `data` automatisch sobald Sie den Live-Code-Modus starten.

In [None]:
import numpy as np
import pandas as pd

url = "https://www4.stat.ncsu.edu/~boos/var.select/diabetes.tab.txt"

diabetes_data_raw = pd.read_csv(url, sep="\t", skiprows=0, header=0, engine="python")
diabetes_data_raw.columns = diabetes_data_raw.columns.str.strip()

data = diabetes_data_raw.to_numpy()[0:15, [0,2,3,7,9]]
data[:7, -1] = np.nan

alter = data[:, 0]
alter[2] = np.nan

In `data` sind Daten von 15 verschiedenen Diabetespatientinnen hinterlegt. Eine Zeile entspricht einem oder einer Patienten/in und eine Spalte den verschiedene Daten, die erhoben worden sind. Es stehen folgende Daten zur Verfügung:

:::{list-table}

* - Spalte 0
  - Alter in Jahren
* - Spalte 1
  - Body Mass Index (BMI)
* - Spalte 2
  - Blutdruck
* - Spalte 3
  - Cholesterinwerte
* - Spalte 4
  - Blutzuckerwerte
:::

In `alter` ist das Alter der Patientinnen in Jahren hinterlegt.

## Einzelne Arrayelemte extrahieren
Um ein einzelnes Element eines eindimensionalen Array `x` auszulesen (zu vergleichen mit einem *Vektor*), nutzt man die Syntax `x[idx]`. Möchte man beispielsweise das dritte Element von `x` auslesen, so ist dies mit `x[2]` möglich.

```{figure} img/array_single_value.jpeg
    :figclass: center 
    :width: 75%
```
Um Elemente aus einem zweidimensional Array `A` auszulesen (zu vergleichen mit einer *Matrix*), benötigen man zwei Indizes. Der erste gibt die Zeile, der zweite die Spalte an: `A[zeile, spalte]`. Beispielsweise gibt `A[0, 2]` den Wert in der ersten Zeile und der dritten Spalte zurück.

:::{admonition} Aufgabe 1.1
Speichern Sie das Alter von Patientin 4 also das vierte Element des Arrays `alter` in einer Variablen `patient_a`.
:::

In [None]:
# Ihr Code 

:::{admonition} Hinweis
:class: note dropdown

Beachten Sie, dass in Python die Indizierung bei $0$ beginnt. Verwenden Sie `[]` zur Indizierung in `alter`.  
:::

:::{admonition} Lösung
:class: tip dropdown

``` python
patient_a = alter[3]
```
:::

<br>

:::{admonition} Aufgabe 1.2
Speichern Sie ebenfalls den BMI von Patientin 4 also das Element in der vierten Zeile und zweiten Spalte des Arrays `data` in einer Variablen `patient4_bmi`.
:::


In [None]:
# Ihr Code 

:::{admonition} Hinweis
:class: note dropdown

Beachten Sie, dass in Python die Indizierung bei $0$ beginnt. Verwenden Sie $1$ und $3$ zur Indizierung in `data`.  
:::

:::{admonition} Lösung
:class: tip dropdown

``` python
patient4_bmi = data[3, 1]
```
:::

<br>



Python ermöglicht es Ihnen $-1$ als Index bei Arrays zuverwenden, um auf das letzte Element zugreifen.
Möchten Sie zum Beispiel auf das letzte Elemente des eindimensionalen Arrays `x` zugreifen, geht dies mit der Syntax `x[-1]`. 
Bei zweidimensionalen Arrays müssen Sie zudem einen zweiten Index angeben. So gibt `A[-1, 3]` beispielsweise den Eintrag in der letzten Zeile und 4. Spalte zurück.

```{figure} img/array_last_element.jpeg
    :figclass: center 
    :width: 75%
```

Die Verwendung des Index $-1$ um auf das letzte Element zuzugreifen, ist Teil der allgemeinen Indexierungslogik in Python, bei der negative Indizes verwendet werden, um Elemente von hinten aus zu zählen. Das bedeutet:

- *Positive Indizes* beginnen am Anfang des Arrays und zählen nach rechts: $0, 1, 2,\ldots$
- *Negative Indizes* beginnen am Ende des Arrays und zählen nach links: $-1, -2, -3,\ldots$


:::{admonition} Aufgabe 1.3
Extrahieren Sie den Wert in der 2. Zeile und der letzten Spalte von `data`, indem Sie die Syntax `-1` verwenden. Weisen Sie anschließend diesen Wert einer Variablen mit dem Namen `patient3_blutzucker` zu.
:::

In [None]:
# Ihr Code 

:::{admonition} Lösung
:class: tip dropdown

``` python
patient2_blutzucker = data[2, -1]
```
:::

<br>

:::{admonition} Aufgabe 1.4
Erstellen Sie eine Variable `patient_b_alter`, die das Alter der vorletzten Patentin, also das vorletzte Element von `alter` enthält. Nutzen Sie negative Indizes! 
:::

In [None]:
# Ihr Code 

:::{admonition} Lösung
:class: tip dropdown

``` python
patient_b_alter = alter[-2]
```
:::

<br>

## Mehre Arrayelemente extrahieren

Oft benötigt man eine ganze Zeile oder eine ganze Spalte eines zweidimensionales Arrays `A`. In diesem Fall kann der Doppelpunkt-Operator `:` als Index verwenden, was Python als "alle Zeilen" oder "alle Spalten" interpretiert. Zum Beispiel liefert `A[0, :]` die erste Zeile von `A` und `A[:, 1]` die zweite Spalte von `A`.

```{figure} img/array_row_col.jpeg
    :figclass: center 
    :width: 75%
```

:::{admonition} Aufgabe 2.1
Erstellen Sie einen Spaltenvektor mit dem Namen `blutdruck`, der alle Elemente aus der 3. Spalte des Arrays `data` enthält.
:::

In [None]:
# Ihr Code 

:::{admonition} Hinweis
:class: note dropdown

Verwenden Sie den Operator `:` als ersten Index. Mit diesem Operator werden alle Zeilen extrahiert. Verwenden Sie $2$ als zweiten Index. Dieser Index gibt die dritte Spalte an.
:::


:::{admonition} Lösung
:class: tip dropdown

``` python
blutdruck = data[:, 2]
```
:::

<br>

Sie können den Doppelpunkt-Operator ebenfalls verwenden, um einen Wertebereich anzugeben um so mehrere aufeinanderfolgende Elemente auszulesen.
Der Code `x[1:4]` extrahiert das zweite, dritte und vierte Element des Arrays `x`. Der fünfte Wert `x[4]` wird dabei nicht mit ausgelesen. Die Syntax `start:end` ist also als das halboffenes Intervall $[\texttt{start}, \texttt{end})$ zu verstehen.

```{figure} img/array_indexrange.jpeg
    :figclass: center
    :width: 75% 
```

Genauso liefert `A[0:3, 2]` das erste, zweite und dritte Element der dritten Spalte von `A`. 


:::{admonition} Aufgabe 2.2
Extrahieren Sie aus dem eindimensionalen Array `alter` das der Patienten 5 bis 12 und speichern Sie das Ergebnis in der Variablen `teilgruppe_alter`.
:::


In [None]:
# Ihr Code

:::{admonition} Lösung
:class: tip dropdown

``` python
print(data.shape) # sollte (15, 5) liefern
teilgruppe_alter = alter[5:13]
```
:::

<br>

:::{admonition} Aufgabe 2.3
Erstellen Sie die Variable `blutwerte`, die die letzten beiden Spalten von `data` enthält. 
:::

In [None]:
# Ihr Code 

:::{admonition} Lösung
:class: tip dropdown

``` python
print(data.shape) # sollte (15, 5) liefern
blutwerte = data[:, 3:5]
```
:::

<br>

Python stellt außderdem eine komfortable Methode zur Verfügung, um alle Elemente ausgehend von einem Startindex zu extrahieren: `x[3:]`. Dieses Beispiel gibt die Teilmenge der Elemente von `x` beginnend Index $3$ bis zum Ende des Vektors zurück.

Umgekehrt gibt der Code `x[:4]` die Teilmenge der Elemente von `x` beginned bei Index $0$ bis einschließlich Index $3$. Das Ende des Wertebereichts ist also wieder als offene Intervallgrenze zu verstehen.

```{figure} img/array_from_index_to_end.jpeg
    :figclass: center
    :width: 75% 
```

Zusammen mit einem weiteren Index funktioniert diese Syntax auch für zweidimensionale Array vollkommen analog.


:::{admonition} Aufgabe 2.4
Erstellen Sie eine Array mit dem Namen `testgruppe_a`, welches alle Daten der ersten sieben Patientinnen, sprich die ersten 7 Zeilen und allte Spalten des Array `data` enthält.
:::

In [None]:
# Ihr Code 

:::{admonition} Lösung
:class: tip dropdown

``` python
testgruppe_a = data[:7, :]

# alternativ bzw- äquvalent
testgruppe_a = data[0:7, :]
```
:::

<br>

:::{admonition} Zusatzaufgabe
Bei Indizes kann es sich auch um nicht aufeinanderfolgende Zahlen handeln. Beispielsweise können Sie zum Extrahieren der ersten, dritten und sechsten Elemente von `alter` den Index `[0, 2, 5]` verwenden. 

Aber Achtung: Hier ist es wichtig, dass Sie die eckigen Klammern um die Indizes `0, 2, 5` beim Einsetzen nicht vergessen!
:::


In [None]:
# Ihr Code

<br>

**Zusammenfassung** 

In Python beginnt die Indizierung bei $0$ anstatt bei $1$. Bei Angabe von Indexbereichen mittels `:` ist die rechte Intervalgrenze offen, das heißt `i:j` umfasst die Indizes $[i, j)$.

:::{list-table}
* - einzelnes Element
  - `x[idx]` oder `A[zeile, spalte]`
* - letztes Element
  - $\{$`idx`, `zeile`, `spalte`$\} = -1$ 
* - alle Zeilen bzw. Spalten
  - `A[:, spalte]` bzw. `A[zeile, :]`
* - alle Werte ab Index $i$
  - `i:`
* - alle Werte bis Index $i$
  - `:(i+1)`
* - alle Werte zwischen Index $i$ und $j$
  - `i:(j+1)`
:::


## Arraywerte modifizieren

Zum Modifizieren von Arrayelementen kann die gleiche Syntax kann verwendet werden wie um den Wert eines Elements auszulesen. Zum Beispiel ändert `x[2] = -2` das dritte Element des eindimensionalen Array `x` von $0$ zu $-2$. Für zweidimensionale Arrays ist das Vorgehen analog. Zum Beispiel ändert `A[2, 3] =  42` das Element in der 3. Zeile und 4. Spalte von $7$ zu $42$. 

```{figure} img/array_modify.jpeg
    :figclass: center
    :width: 75% 
```

Leider ist beim Eintragen der Patientinnendaten ein Fehler unterlaufen, sodass das Alter von Patentinn $3$ nicht eingetragen wurde (gekennzeichent durch nan, engl. **N**ot **a N**umber).

```{figure} img/vector_nan.jpg
    :figclass: center 
    :width: 60%
```


:::{admonition} Aufgabe 3.1
Ändern Sie das dritte Element von `alter` von `nan` zu $72$.
:::


In [None]:
# Ihr Code 


:::{admonition} Lösung
:class: tip dropdown

``` python
alter[2] = 72
```
:::


Python erlaubt es außerdem auch direkt mehrere Werte aufeinmal zu ändern, genauso wie es möglich ist mehrere Werte aufeinmal auszulesen.

```{figure} img/array_modify2.jpeg
    :figclass: center
    :width: 75% 
```

Ähnlich wie eine Lücke in den Altersdaten der Patienten, ist auch eine Lücke bei den Blutzuckerwerten zu verzeichnen.

```{figure} img/matrix_nan.jpg
    :figclass: center 
    :width: 50%
```

:::{admonition} Aufgabe 3.2
Erstellen Sie das Array `testgruppe_a_werte` mit den Einträgen 

$$
    \begin{pmatrix} 
        87 & 69 & 85 & 89 & 80 & 68 & 82
    \end{pmatrix}.
$$

:::


In [None]:
# Ihr Code 


:::{admonition} Lösung
:class: tip dropdown

``` python
testgruppe_a_werte = np.array([87, 69, 85, 89, 80, 68, 82])
```
:::

<br>

:::{admonition} Aufgabe 3.3
Tragen Sie die Blutzuckerwerte der Testgruppe A nach, indem Sie den ersten 7 Einträge der letzen Spalten des Arrays `data` das Array `testgruppe_a_werte` zu weisen.
:::


In [None]:
# Ihr Code 

:::{admonition} Hinweis
:class: note dropdown

Greifen Sie zuerst auf die Einträge in der letzten Spalte und den ersten sieben Zeilen in `data` zu. Nutzen Sie anschließen den Zuweisungsoperator `=` zusammen mit `testgruppe_a_werte`. 
:::

:::{admonition} Lösung
:class: tip dropdown

``` python
data[:7, -1] = testgruppe_a_werte

# alternativ
data[0:7, -1] = testgruppe_a_werte
```
:::