# Min-Max-Normalisierung

In [None]:
Warum benötigt man Normalisierung

# Min Max Normalisierung

Die **Min-Max-Normalisierung** ist eine Technik, um Werte in einem Datensatz in einen bestimmten Bereich zu skalieren, meistens zwischen 0 und 1. Dazu wird jeder Wert so transformiert, dass der kleinste Wert der Spalte auf 0 und der größte Wert auf 1 abgebildet wird. Dies ist besonders hilfreich in der Datenanalyse und beim Maschinellen Lernen, da es verhindert, dass große Werte die Ergebnisse dominieren und das Modell robust gegenüber unterschiedlich großen Wertebereichen macht.

# Rechnung

### Formel

Für jeden Wert $x$ wird die normalisierte Version $x_{norm}$ wie folgt berechnet:

$$
x_{norm} = \frac{x - \text{min}(x)}{\text{max}(x) - \text{min}(x)}
$$

Dabei:
- $\text{min}(x)$: der kleinste Wert im Datensatz,
- $\text{max}(x)$: der größte Wert im Datensatz.

Der normalisierte Wert $x_{norm}$ liegt dann immer zwischen 0 und 1.

# Praktisches Beispiel

## Beispiel 1

Angenommen, du hast die Werte: 10, 20, 30, 40, und 50. 
Um diese Werte zu normalisieren verwenden wir die Formel von oben.

$$
x_{\text{norm}} = \frac{x - x_{\text{min}}}{x_{\text{max}} - x_{\text{min}}}
$$

- Wir finden den kleinsten ($\text{min}(x) = 10$) und den größten Wert ($\text{max}(x) = 50$) in der Liste und setze sie in die Formel ein.

$$
x_{norm} = \frac{x - 10}{50 - 10} = \frac{10}{40} = ?
$$

- Dann berechnen wir das Ergebnis für einen gegebenen Wert, z. B. $x = 20$:

$$
x_{norm} = \frac{20 - 10}{50 - 10} = \frac{10}{40} = 0.25
$$

Durch die Min-Max-Normalisierung werden alle Werte des Datensatzes im Bereich von 0 bis 1 liegen, ohne die Struktur des Datensatzes zu verändern.


### In Python Code:

In [3]:
import numpy as np

# Beispiel-Daten
daten = [10, 15, 20, 25, 30]

# Minimum und Maximum berechnen
min_wert = min(daten)
max_wert = max(daten)

# Min-Max-Normalisierung anwenden
normalisierte_daten = [(x - min_wert) / (max_wert - min_wert) for x in daten]

print("Normalisierte Daten:", normalisierte_daten)

Normalisierte Daten: [0.0, 0.25, 0.5, 0.75, 1.0]


Die Ausgabe zeigt die normalisierten Werte im Bereich 0 bis 1

## Beispiel 2

In [3]:
import numpy as np
from sklearn.preprocessing import MinMaxScaler

# Beispiel-Daten: Verkaufszahlen von Produkten in verschiedenen Regionen
data = np.array([[150, 200, 300],
                 [250, 300, 400],
                 [100, 150, 200],
                 [400, 500, 600],
                 [350, 450, 550]])

# Min-Max-Skalierung auf den Bereich 0-1 anwenden
scaler = MinMaxScaler()
normalized_data = scaler.fit_transform(data)

print("Min-Max normalisierte Daten:")
print(normalized_data)

Min-Max normalisierte Daten:
[[0.16666667 0.14285714 0.25      ]
 [0.5        0.42857143 0.5       ]
 [0.         0.         0.        ]
 [1.         1.         1.        ]
 [0.83333333 0.85714286 0.875     ]]
