# Vektorisierung

In der numerischen Mathematik spielt die Effizienz von Algorithmen eine zentrale Rolle. Eine der wichtigsten Techniken zur Beschleunigung von Berechnungen in `Python` ist die `Vektorisierung`, die durch die Verwendung von `numpy-Arrays` anstelle von expliziten Schleifen erreicht wird. Vektorisierte Operationen sind in der Regel um ein Vielfaches schneller als Schleifen in `Python`, da `Numpy` diese Operationen in optimierten, vorcompilierten `C-Routinen` ausführen. Klassische Beispiele für Vektorisierung sind die Additon von zwei Vektoren

In [None]:
import numpy as np
import time

n = 100
a = np.arange(1,n+1)
b = 3*np.ones(n)

# Variante mit Schleife
startzeit = time.time()
c_schleife = np.zeros(n)
for i in range(n):
    c_schleife[i] = a[i] + b[i]
endzeit = time.time()
print(f"Schleifenzeit: {endzeit - startzeit:.5f} Sekunden")

# Vektorisierte Variante
startzeit = time.time()
c_vektorisierung = a + b
endzeit = time.time()
print(f"Vektorisierte Zeit: {endzeit - startzeit:.5f} Sekunden")

oder die elementarweise Anwendung der Wurzel auf einen Vektor

In [None]:
x = np.arange(1,n+1)

# Variante mit Schleife
startzeit = time.time()
sqrt_schleife = np.zeros(n)
for i in range(n):
    sqrt_schleife[i] = np.sqrt(x[i])
endzeit = time.time()
print(f"Schleifenzeit: {endzeit - startzeit:.5f} Sekunden")

# Vektorisierte Variante
startzeit = time.time()
sqrt_vektorisierung = np.sqrt(x)
endzeit = time.time()
print(f"Vektorisierte Zeit: {endzeit - startzeit:.5f} Sekunden")

Mit dem Befehl `time.time()` kann die aktuelle Zeit abgerufen werden. Indem man die Zeit zum Startzeitpunkt mit der zum Endzeitpunkt der Rechnungen vergleicht, kann man die Rechendauer beider Varianten evaluieren. Dies wurde in beiden Beispielen für Sie gemacht. Bevor Sie sich den kommenden Aufgaben widmen, bei denen Sie selbst eine vektorisierte Variante erarbeiten, ändern Sie die Variable `n` in den vorherigen Beispielen. Wie verändert sich der Unterschied der Rechenzeiten beider Varianten?

:::{admonition} Aufgabe 1.1
Der folgende Code soll die euklidische Norm jeder Zeile einer $(m \times n)$ Matrix berechnen. Für die vektorisierte Variante soll dabei der Befehl `np.linalg.norm` verwendet werden. Machen Sie sich mit einer beliebigen Suchmaschine oder künstlichen Intelligenz mit dem Begriff vertraut und ergänzen Sie den fehlenden Code. 
:::

In [None]:
m, n = 1000, 100
A = np.random.rand(m, n)

# Variante mit Schleife
startzeit = time.time()
# Ihr Code 



endzeit = time.time()
print(f"Schleifenzeit: {endzeit - startzeit:.5f} Sekunden")

# Vektorisierte Variante
startzeit = time.time()
# Ihr Code 

endzeit = time.time()
print(f"Vektorisierte Zeit: {endzeit - startzeit:.5f} Sekunden")


:::{admonition} Hinweis
:class: note dropdown

Nutzen Sie für die Schleifen-Variante eine `for-Schleife` über `range(m)`. Für die Vektorisierung verwenden Sie den Befehl `np.linalg.norm(,axis = 1)`.
:::

:::{admonition} Lösung
:class: tip dropdown

``` python
m, n = 1000, 100
A = np.random.rand(m, n)

# Variante mit Schleife
startzeit = time.time()
norm_schleife = np.zeros(m)
for i in range(m):
    norm_schleife[i] = np.sqrt(np.sum(A[i, :] ** 2))
endzeit = time.time()
print(f"Schleifenzeit: {endzeit - startzeit:.5f} Sekunden")

# Vektorisierte Variante
startzeit = time.time()
norm_vektorisierung = np.linalg.norm(A, axis=1)
endzeit = time.time()
print(f"Vektorisierte Zeit: {endzeit - startzeit:.5f} Sekunden")
```
:::

Die vektorisierte Variante der Addition lässt sich auch auf Matrizen und Vektoren erweitern. Angenommen wir haben den Vektor 

$$
\begin{pmatrix}
0 \\
10 \\
20 \\
30\\
\end{pmatrix}
$$
und

$$
\begin{pmatrix}
0 & 1 & 2\\
\end{pmatrix}.
$$
Unser Ziel ist es aus diesen Vektoren die Matrix 

$$
\begin{pmatrix}
0 & 1 & 2 \\
10 & 11 & 12 \\
20 & 21 & 22 \\
30 & 31 & 32 \\
\end{pmatrix}
$$
zu erzeugen. Auch hier hilft uns Vektorisierung Zeit zu sparen, denn es ist möglich einen Vektor spaltenweise und zeilenweise auf eine Matrix und einen anderen Vektor zu addieren. In unserem Beispiel kann das wie folgt aussehen.

```{figure} numpy_broadcasting.png
:name: fig-meinbild
:width: 90%
spaltenweise Addition
<p style="font-size: 80%; text-align: center; margin-top: 0; padding-top: 0;">
<strong>Quelle:</strong> <a href="https://scipy-lectures.org/intro/numpy/operations.html">scipy lectures</a>
</p>
```

Für alle Methoden genügt es die Vektoren und Matrizen miteinander zu addieren. Bei der zweiten Methode muss allerdings sichergestellt sein, dass die Anzahl der Spalten des Vekors und der Matriz übereinstimmen.

:::{admonition} Achtung
:class: warning

Die spaltenweise oder zeilenweise Addition funktioniert nur, wenn die Anzahl der Zeilen oder Spalten der Matrix und des Vektors identisch sind. 
:::

Bei der dritten Variante erstellt `Python` automatisch eine Matrix, die so viele Zeilen hat, wie der Zeilenvektor, und so viele Spalten wie der Spaltenvektor. 

In [None]:
matrix = np.array([[0, 0, 0],[10, 10, 10],[20, 20, 20],[30, 30, 30]])
zeilenvektor = np.array([[0, 1, 2]])
spaltenvektor = np.array([[0, 10, 20, 30]]).T
print(matrix + zeilenvektor)
print(spaltenvektor + zeilenvektor)

Ganz analog zu Addition funktioniert auch die zeilenweise bzw. spaltenweise Multiplikation. Dazu betrachten wir das folgenden Beispiel. Angenommen, wir haben eine Matrix der historischen Renditen von vier Aktien über drei Jahre:

$$
R = \begin{pmatrix}
0.05 & 0.02 & -0.01 & 0.03 \\
0.07 & 0.04 & 0.00  & 0.05 \\
-0.03 & 0.01 & 0.02  & 0.01 \\
\end{pmatrix}
$$

Nun möchten wir für jedes Jahr einen unterschiedlichen Steuerfaktor anwenden. Die Steuerfaktoren sind:

$$
\text{Steuerfaktoren} = \begin{pmatrix}
0.9\\
0.88\\
0.92\\
\end{pmatrix}.
$$

Die Matrix der Renditen nach Anwendung des jeweiligen Steuerfaktors für jedes Jahr ergibt sich durch die Multiplikation der Zeilen der Matrix $R$ mit dem Vektor der Steuerfaktoren. 

:::{admonition} Aufgabe 1.2
Berechnen Sie mit Hilfe der Zeilenweise Multiplikation die tatsächlichten Renditen nach der Steuer und speichern Sie das Ergebnis in der Matrix `R_steuer` 
:::

In [None]:
# Ihr Code

:::{admonition} Hinweis
:class: note dropdown

Achten Sie auf die richtigen Dimensionen. 
:::

:::{admonition} Lösung
:class: tip dropdown

``` python
# Renditenmatrix (3 Jahre x 4 Aktien)
R = np.array([
    [0.05, 0.02, -0.01, 0.03],  # 2019
    [0.07, 0.04, 0.00, 0.05],   # 2020
    [-0.03, 0.01, 0.02, 0.01]   # 2021
])

# Steuerfaktoren für jedes Jahr
steuerfaktoren = np.array([0.9, 0.88, 0.92])

# Anwendung der Steuerfaktoren auf die entsprechenden Zeilen der Matrix
R_steuer = R * steuerfaktoren

print("Matrix der Renditen nach Anwendung der Steuerfaktoren:")
print(R_steuer)
```
:::

:::{admonition} Aufgabe 1.3
Nutzen Sie ihr neu hinzugewonnenes Wissen, um effizient (ohne Schleife) die Summer der Quadrate der ersten 100 natürlichen Zahlen zu berechnen.
:::

In [None]:
# Ihr Code

:::{admonition} Hinweis
:class: note dropdown
Die Funktion `np.sum` könnte hilfreich sein. 
:::

:::{admonition} Lösung
:class: tip dropdown

``` python

n = 100
zahlen = np.arange(1, n + 1)  # Erstellen eines Arrays mit Zahlen von 1 bis n
summe_quadrate = np.sum(zahlen**2)  # Berechnung der Summe der Quadrate

print(f"Die Summe der Quadrate der ersten {n} natürlichen Zahlen ist: {summe_quadrate}")
```
:::

Erinnern Sie sich an das Beispiel aus Kapitel [Arrayserstellung](../../chapter03_spezialisierung/debugging/error_signs.ipynb) zurück, bei dem Produkte gemäß Gewichte im Bezug auf sechs verschiedene Merkmale bewertet werden sollten. 

In [None]:
def score_berechnung(P, w):
    """
    Berechnet die gewichteten Scores für Produkte.
    EINGABE:
     - P: numpy Array mit Produktinformationen (erste Spalte sind Nummern, restliche Spalten sind Merkmale)
     - w: numpy Array mit Gewichtungen für jedes Merkmal
    AUSGABE:
     - scores: numpy Array mit Produktnummern und gewichteten Scores
    """
    ids = P[:, 0]  # Produktnummern
    values = P[:, 1:]  # Merkmale

    # Normalisierung der Merkmale
    for i in range(values.shape[1]):
        values[:, i] = values[:, i] / np.max(values[:, i])

    # Berechnung der Scores mit einer Schleife
    scores = np.zeros(len(ids))  # Initialisiere ein Array für die Scores
    for i in range(len(ids)):
        for j in range(len(w)):
            scores[i] += values[i, j] * w[j]  # Gewichtetes Merkmal aufsummieren

    # Kombiniere Produktnummern mit Scores
    product_scores = np.column_stack((ids, scores))

    return product_scores

# Beispiel-Daten
products = np.array([
    [1, 90, 85, 30, 80, 500, 1200],
    [2, 80, 90, 20, 85, 200, 1500],
    [3, 85, 80, 25, 90, 1000, 800],
    [4, 70, 75, 40, 75, 250, 500],
    [5, 95, 90, 15, 97, 400, 1300],
    [6, 97, 80, 35, 80, 300, 1200],
    [7, 80, 85, 30, 85, 500, 1400],
    [8, 75, 78, 28, 85, 350, 1100],
    [9, 88, 82, 32, 88, 600, 1600],
    [10, 76, 82, 30, 80, 350, 1100]
], dtype=float)

# Gewichtungen (für jedes Merkmal)
weights = np.array([0.4, 0.25, -0.15, 0.15, 0.05, 0.05])

# Berechnung der Scores
product_scores = score_berechnung(products, weights)

# Ausgabe der Produktnummern und Scores
for product, score in product_scores:
    print(f"Produkt {int(product)}: {score:.2f}")

:::{admonition} Aufgabe 1.4
Vektorisieren Sie die Funktion `score_berechnung(P, w)`. Lassen Sie den Code zunächst ohne Bearbeitung durchlaufen, um sich zu vergewissern, welche Werte herauskommen sollten. 
:::

In [None]:
# Ihr Code

:::{admonition} Hinweis
:class: note dropdown
Die Funktionen `np.max` und `np.dot` könnten hilfreich sein. 
:::

:::{admonition} Lösung
:class: tip dropdown

``` python

def score_berechnung(P, w):
    """
    Berechnet die gewichteten Scores für Produkte.
    EINGABE:
     - P: numpy Array mit Produktinformationen (erste Spalte sind Nummern, restliche Spalten sind Merkmale)
     - w: numpy Array mit Gewichtungen für jedes Merkmal
    AUSGABE:
     - scores: numpy Array mit Produktnummern und gewichteten Scores
    """
    ids = P[:, 0]  # Produktnummern
    values = P[:, 1:]  # Merkmale

    # Normalisierung der Merkmale (nur einmal pro Merkmal)
    values = values / np.max(values, axis=0)

    # Berechnung der Scores mit vektorisierten Operationen
    scores = np.dot(values, w)  # Gewichtete Merkmale aufsummieren

    # Kombiniere Produktnummern mit Scores
    product_scores = np.column_stack((ids, scores))

    return product_scores
```
:::

Zum Abschluss dieses Kapitels geben wir Ihnen eine Übersicht von vielen verschiedenen Methoden, um seinen Code effizienter zu gestalten. Die Tabelle ist lediglich für Sie in der Zukunft als Nachschlagewerk gedacht.

| Funktion / Mechanismus                | Beschreibung                                                                 | Beispiel                                                                 |
|---------------------------------------|-----------------------------------------------------------------------------|--------------------------------------------------------------------------|
| **Broadcasting**                      | Ermöglicht es, Operationen auf Arrays unterschiedlicher Größe anzuwenden, indem kleinere Arrays automatisch auf die Form des größeren Arrays angepasst werden. | `np.add(arr1, arr2)` wenn `arr1` (3,1) und `arr2` (1,3) sind.           |
| **Array-Operationen**                 | Mathematische Operationen wie Addition, Subtraktion, Multiplikation und Division werden auf ganze Arrays angewendet, ohne explizite Schleifen. | `np.array([1, 2, 3]) + 10` ergibt `array([11, 12, 13])`.                |
| **Vektorisiertes Rechnen mit `np.vectorize()`** | Mit `np.vectorize()` können benutzerdefinierte Funktionen auf ganze Arrays angewendet werden, ohne explizite Schleifen. | `np.vectorize(lambda x: x ** 2)(arr)` berechnet das Quadrat jedes Elements im Array `arr`. |
| **Trigonometric Funktionen**         | NumPy bietet eine Vielzahl von trigonometrischen Funktionen wie `np.sin()`, `np.cos()`, `np.tan()` usw. für jedes Element im Array. | `np.sin(arr)` berechnet den Sinus jedes Elements im Array `arr`.         |
| **Matrixmultiplikation `np.matmul()`**| Führt eine Matrixmultiplikation durch. Ähnlich wie `np.dot()`, aber speziell für 2D-Arrays optimiert. | `np.matmul(A, B)` berechnet das Matrixprodukt der Matrizen `A` und `B`. |
| **Elementweise Multiplikation `np.multiply()`** | Berechnet die elementweise Multiplikation zwischen Arrays. | `np.multiply(arr1, arr2)` multipliziert die Arrays `arr1` und `arr2` elementweise. |
| **Ufuncs (Universal Functions)**     | Ufuncs sind vektorisierte Funktionen, die auf ganze Arrays angewendet werden und elementweise Operationen effizient ausführen. | - `np.sqrt(arr)`: Berechnet die Quadratwurzel jedes Elements im Array. <br> - `np.log(arr)`: Berechnet den natürlichen Logarithmus für jedes Element im Array. <br> - `np.exp(arr)`: Berechnet die Exponentialfunktion jedes Elements im Array. <br> - `np.abs(arr)`: Berechnet den Absolutwert jedes Elements im Array. <br> - `np.floor(arr)`: Rundet jedes Element im Array auf die nächste ganze Zahl nach unten. <br> - `np.ceil(arr)`: Rundet jedes Element im Array auf die nächste ganze Zahl nach oben. <br> - `np.round(arr)`: Rundet jedes Element im Array auf die nächstgelegene ganze Zahl. <br> - `np.log10(arr)`: Berechnet den Logarithmus zur Basis 10 für jedes Element im Array. |
