# For-Schleifen

Im Kontext der Numerik kommen for-Schleifen wenn feste Anzahl an Iterationen oder über matrix spalten/zeilen um matrixzerlegung zu bestimmen.

:::{admonition} Bemerkung
:class: warning

Wenn Code eine feste Anzahl wiederholt werden soll, bzw. der selbe Code für verschiedene Werte, dann verwenden Sie eine for-Schleife.
:::


## Die Syntax

```{figure} img/for_syntax.jpeg
   :figclass: center
   :width: 60%
   :alt: Img 1
```

Der Code im Schleifenrumpf einer for-Schleife wird so lange ausgeführt, bis alle Elemente des Iterationsbereichs - in diesem Fall $\texttt{range(N)}$ vollständig durchlaufen worden sind.  In jedem Schleifendurchlauf nimmt die *Schleifenvariable* (auch *Iterationsvariable* genannt) $\texttt{var}$ nacheinander die Werte aus dem Iterationsbereich an. Mit jedem dieser Werte wird der Schleifenrumpf erneut durchlaufen.
Die Schleife endet automatisch, wenn das Ende des Iterationsbereichs erreicht worden ist. Anschließend wird der Code $\texttt{another}$ $\texttt{statement 1, 2}$ ausgeführt.
Wie auch bei der [while-Schleife](../programmablaeufe/while_loops.ipynb) kennzeichnet der Doppelpunkt den Beginn des Schleifenrumpfs. Der eigentliche Schleifenrumpf wird, wie in Python üblich, eingerückt.

Der Iterations ist nicht auf $\texttt{range()}$ beschränkt. Auch Listen, Tupel oder andere Datenstrukturen können durchlaufen werden. Besonders in der Numerik werden wir häufig über Zahlenbereiche iterieren.

:::{list-table}
:header-rows: 1

* - Python
  - Mathematik
  - Beispiel
* - $\texttt{range(b)}$ 
  - $\{0, 1, \cdots, b-1\}$
  - $\texttt{range(5)} = \{0,1,2,3,4\}$
* - $\texttt{range(a, b)}$
  - $\{a, a+1, \dots, b - 1\}$ 
  - $\texttt{range(5, 9)} = \{5, 6, 7, 8 \}$
* - $\texttt{range(a, b, s)}$
  - $\{a + i \cdot s < b \, \mid \, i \in \mathbb{N}\}$
  - $ \texttt{range(5, 11, 2)} = \{5, 7, 9\}$
:::

<br>

## Ein Code-Beispiel
Angenommen Sie wollen die Summe der ersten $ n$ natürlichen Zahlen bestimmen. Dann können Sie eine for-Schleife schreiben,  $\texttt{summe} = 0$ initialisieren und im Schleifenrumpfs auf $\texttt{summe} $ und $i$ addieren für $ i= 0, \ldots, n$. Am Ende der for-Schleife entspricht $\texttt{summe}$ der gewünschten Summe.

::::{tab-set} 

:::{tab-item} 1
```{figure} img/while_loop_example1.jpeg
   :figclass: center
   :width: 60%
   :alt: Img 1
```
Die Variable $n$ wird mit $n=0$ initialisiert. Außderdem wird die Variable $y$ erstellt und mit $ y = \frac{x}{2^0} = x$ initialisiert, um Zwischenrechnungen zu speichern.
:::

:::{tab-item} 2
```{figure} img/while_loop_example2.jpeg
   :figclass: center
   :width: 60%
   :alt: Img 1
```
Zu Beginn der while-Schleife wird die Bedingung $ y > 1$, also $ \frac{x}{2^n} > 1$ ausgewertet.
:::
::::

<br>

Nun sind Sie an der Reihe

::::{tab-set} 

:::{tab-item} Aufgabe 1.1
Schreiben Sie eine for-Schleife, welche die ersten vier Elemente von $x$ ausgibt. Nennen Sie die Schleifenvariable `idx`.
:::

:::{tab-item} Aufgabe 1.2
Passen Sie die for-Schleife so an, dass die Schleifenvariable `idx` bei $6$ beginnt, bei $14$ endet und um $2$ erhöht wird.
:::
::::

In [None]:
import numpy as np

x = np.arange(5, 21)

print(x[idx])

:::{admonition} Hinweis A1.1
:class: note dropdown

Schreiben Sie die for-Schleifen mithilfe der Schlüsselwörter `for` und `range`. Das Schlüsselwort `for` sollte über dem `print`-Befehl stehen. Bedenken Sie das Arrays in Python bei dem Index $0$ beginnen.
:::

:::{admonition} Lösung A1.1
:class: tip dropdown

``` python
x = np.arange(5, 21) 

for idx in range(4):
    print(x[idx])
```
:::

:::{admonition} Lösung A1.2
:class: tip dropdown

``` python
x = np.arange(5, 21) 

for idx in range(6, 14, 2):
    print(x[idx])
```
:::

## Beispiel - Fibonacci-Zahlen

Im Folgenden wollen wir mithilfe von Python die ersten $n$ Fibonacci-Zahlen bestimmen. Die Fibonacci-Zahlen $f_k$ sind rekursiv definiert durch:

$$
    f_0 = 0, \quad f_1 = 1, \quad f_k = f_{k-1} + f_{k-2} \quad \text{für } k \ge 2.
$$

::::{tab-set} 

:::{tab-item} Aufgabe 2.1
Passen Sie den nachfolgenden Code so an, dass die ersten $n$ Fibonacci-Zahlen berechnet und in `fib` gespeichert werden.
Ergänzen Sie dazu eine for-Schleife mit Schleifenvariable $k$.
:::

:::{tab-item} Aufgabe 2.2
Führen Sie den Code für unterschiedliche $n$ aus. Welchen Effekt hat das Verändern der Schleifenvaraible auf das Ergebnis?
:::
::::


In [None]:
import numpy as np
import matplotlib.pyplot as plt

n = 102
fib = np.ones(n)

fib[k] = fib[k-1] + fib[k-2]

plt.figure()
plt.plot(fib)
plt.xlabel("k")
plt.ylabel("Fibonacci Zahlen")
plt.show()


:::{admonition} Hinweis A2.1
:class: note dropdown
Benutzen Sie eine for-Schleife der Form:
``` python
for k in range(2, n):
    # Code
```
:::

:::{admonition} Lösung A2.1
:class: tip dropdown

``` python
n = 102
fib = np.ones(n)

for k in range(2, n):
    fib[k] = fib[k-1] + fib[k-2]

plt.figure()
plt.plot(fib)
plt.xlabel("k")
plt.ylabel("Fibonacci Zahlen")
plt.show()
```
:::


## Beispiel - Erneuerbarer Energien

Als nächstes sollen Sie die Entwicklung erneuerbarer Energien für verschiedene Länder analysieren. Die entsprechenden Daten stammen von der öffentlichen Plattform [*Our World in Data*](https://ourworldindata.org/) und enthalten umfassende Informationen über den Energieverbrauch verschiedener Länder - unter anderem auch über den prozentualen Anteil erneuerbarer Energien am Gesamtenergieverbrauch.

Der nachfolgende, versteckte Code extrahiert die für uns wichtigen Daten. Sie müssen nicht nachvollziehen wie die Rohdaten im Hintergrund verarbeitet und vorbereitet werden. Für Sie ist nur wichtig wie die aufbereiteten Daten aussehen:
- $\texttt{years}$ - Vektor, welcher die Jahre 2005 bis 2023 enthält
- $\texttt{countries}$ - Vektor, welcher die verschiedenen Länder enthält
- $\texttt{renewables}$ - Matrix, welche die Daten zum Anteil erneuerbarer Energien der Länder enthält. Eine Zeile entspricht einem Jahr, eine Spalte einem Land.


In [None]:
import pandas as pd

# Datenquelle
url = "https://raw.githubusercontent.com/owid/energy-data/master/owid-energy-data.csv"
df = pd.read_csv(url)

# Auswahlparameter
countries = [
    "Germany",
    "United States",
    "China",
    "Norway",
    "Brazil",
    "Italy",
    "France",
    "Netherlands",
    "Sweden",
    "Switzerland",
    "Belgium",
]
variable = "renewables_share_energy"

# Daten filtern und auf relevante Spalten reduzieren
df_filtered = df[(df["country"].isin(countries)) & (df["year"] >= 2005)]
df_pivot = df_filtered.pivot(index="year", columns="country", values=variable)

# Nur vollständige Zeilen und relevante Länder
df_selected = df_pivot[countries].dropna()

# Jahr als eigene Spalte
df_selected_with_years = df_selected.copy()
df_selected_with_years.insert(0, "year", df_selected.index)

# Umwandeln in NumPy-Array
years = df_selected_with_years.to_numpy()[:, 0]
renewables = df_selected_with_years.to_numpy()[:, 1:]
countries = countries.to_numpy()

__Vorbereitung: Größe von Arrays__

Bevor Sie sich der Aufgabe widmen, wollen wir nocheinmal auf das Kapitel zu [Funktionsaufrufen und -rückgaben](../functions/funktionsaufrufe.ipynb) verweisen und geeignete Ergänzungen machen mit dem Ziel die Größe eines Vektor oder einer Matrix bestimmen zu können.



Wenn Sie von einer Matrix nur die Zeilen- oder nur die Spaltenanzahl benötigen, stehen Ihnen verschiedene Optionen zur Verfügung. Gegeben sei also eine Matrix $A$ in Form eines zwei-dimensionalen $\texttt{numpy}$-Arrays und ein Vektor $x$ in Form eines ein-dimensionalen $\texttt{numpy}$-Arrays.



- num_cols, _ = np.shape(A)
- num_cols = np.shape(A)[0]
- num_cols = np.size(A, axis = 0)

Beachten Sie, dass der Aufruf $\texttt{np.shape(x)}$ zu dem Ergebnis $\texttt{(n,)}$ führt. Die Rückgabe ist also ein Tupel mit nur einem Element und kein Skalar. Möchten Sie mit der größe wie mit einem Skalar rechnen, müssen Sie erst das element aus dem Tupel extrahieren.

Sie können die Größe eines Vektors also analog zu der Zeilenanzahl einer Matrix bestimmen. Alternativ - und Häufig verwendet man allergings die Funktion $\texttt{len(x)}$ um die Länge - also Größe eines Vektor zu bestimmen.

size(x)
len(x)



:::{admonition} Aufgabe 4b
Create variables named m and n which respectively contain the number of rows and columns of the variable prices.
:::

If you just want to return the size of a particular dimension, specify the dimension in the call to size.

yRow = size(Year,1)
yRow =
    19
yCol = size(Year,2)
yCol =
     1

:::{admonition} Aufgabe 4c
    Create a variable named nCols containing the number of columns in prices.
:::

:::{admonition} Aufgabe 4d
Create a variable named N containing the number of elements in prices.
:::

:::{admonition} Aufgabe 4e
Create a variable named len containing the length of countries.
:::




__Zurück zur eigentlichen Aufgabe__

Ein gängiger Ansatz um eine for-Schleife zu schreiben, besteht darin den Schleifenrumpf zunächst für einen festen Wert der Schleifenvaiable zu programmieren. Sobald Code wie gewünscht läuft, wird der feste Wert durch die for-Schleife ersetzt.

Der nachfolgende Code generiert den Trend für den Anteil der erneuerbaren Energien am Gesamtenergieverbrauch der ersten Landes in $\texttt{countries}$ sowie die Realdaten. Der Code funktioniert bereits, sodass Ihre Aufgabe darin besteht die Zuweisung $\texttt{k = 1}$ durch eine for-Schleife zu ersetzen, die durch alle Elemente in $\texttt{countries}$ iteriert.

:::{admonition} Aufgabe 3
Passen Sie den Code so an, dass die lineare Regression für alle Länder in $\texttt{countries}$ bestimmt wird.
:::

In [None]:
import numpy as np
import matplotlib.pyplot as plt

plt.figure()

k = 1

# berechnen der Regression für land k
p1, p0 = np.polyfit(years, renewables[:, k], 1)
linfit = p1 * years + p0

# plotten der Regression und der Daten für Land k
plt.plot(years, renewables[:, k], "k--", alpha=0.25)
plt.plot(years, linfit, label=countries[k])

# Achsenbeschriftung und Legende (muss nur einmal ausgeführt werden)
plt.legend(loc=(1.04, 0))
plt.xlabel("Jahre")
plt.ylabel("Anteil erneuerbarer Energien (%)")
plt.show()


:::{admonition} Hinweis
:class: note dropdown
Der Befehl $\texttt{plt.plot}$ kann auch innerhalb einer Schleife ausgeführt werden.
:::

:::{admonition} Lösung
:class: tip dropdown

``` python
plt.figure()

for k in range(len(countries)):
    p1, p0 = np.polyfit(years, renewables[:, k], 1)
    linfit = p1 * years + p0

    plt.plot(years, renewables[:, k], "k--", alpha=0.25)
    plt.plot(years, linfit, label=countries[k])

plt.legend(loc=(1.04, 0))
plt.xlabel("Jahre")
plt.ylabel("Anteil erneuerbarer Energien (%)")
plt.show()
```
:::