# Einführung in NumPy

NumPy (Numerical Python) ist die fundamentale Bibliothek für Datenanalyse, wissenschaftliches Rechnen, Bildverarbeitung und Maschinelles Lernen in Python. 
Sie bietet:
- Leistungsstarke N-dimensionale Arrays
- Mathematische Funktionen für Arrays
- Tools für lineare Algebra, Fourier-Transformation und Zufallszahlen
- Effizienz durch C-implementierte Operationen


## 1. NumPy importieren

Die Konvention ist, NumPy als `np` zu importieren:

In [1]:
import numpy as np

# Version überprüfen
print(f"NumPy Version: {np.__version__}")

NumPy Version: 2.2.5


## 2. Arrays erstellen

NumPy-Arrays sind das Herzstück der Bibliothek. Sie sind homogene, mehrdimensionale Container für Daten.

In [2]:
# 1D-Array aus einer Liste
arr1d = np.array([1, 2, 3, 4, 5])
print("1D-Array:", arr1d)
print("Shape:", arr1d.shape)
print("Datentyp:", arr1d.dtype)
print()

# 2D-Array (Matrix)
arr2d = np.array([[1, 2, 3], [4, 5, 6]])
print("2D-Array:\n", arr2d)
print("Shape:", arr2d.shape)
print("Dimensionen:", arr2d.ndim)

1D-Array: [1 2 3 4 5]
Shape: (5,)
Datentyp: int64

2D-Array:
 [[1 2 3]
 [4 5 6]]
Shape: (2, 3)
Dimensionen: 2


### Spezielle Arrays erstellen

In [3]:
# Array mit Nullen
zeros = np.zeros((3, 4))
print("Nullen:\n", zeros)
print()

# Array mit Einsen
ones = np.ones((2, 3))
print("Einsen:\n", ones)
print()

# Einheitsmatrix
identity = np.eye(3)
print("Einheitsmatrix:\n", identity)
print()

# Gleichmäßig verteilte Werte
linear = np.linspace(0, 10, 5)  # 5 Werte zwischen 0 und 10
print("Linspace:", linear)
print()

# Bereich von Werten
range_arr = np.arange(0, 10, 2)  # Start, Stop, Schritt
print("Arange:", range_arr)

Nullen:
 [[0. 0. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]

Einsen:
 [[1. 1. 1.]
 [1. 1. 1.]]

Einheitsmatrix:
 [[1. 0. 0.]
 [0. 1. 0.]
 [0. 0. 1.]]

Linspace: [ 0.   2.5  5.   7.5 10. ]

Arange: [0 2 4 6 8]


## 3. Array-Operationen

NumPy unterstützt _elementweise_ Operationen, die sehr effizient sind.

In [4]:
a = np.array([1, 2, 3, 4])
b = np.array([10, 20, 30, 40])
print("a =", a)
print("b =", b)

# Arithmetische Operationen
print("a + b =", a + b)
print("a - b =", a - b)
print("a * b =", a * b)
print("a / b =", a / b)
print("a ** 2 =", a ** 2)
print()

# Mit Skalaren
print("a * 10 =", a * 10)
print("a + 5 =", a + 5)

a = [1 2 3 4]
b = [10 20 30 40]
a + b = [11 22 33 44]
a - b = [ -9 -18 -27 -36]
a * b = [ 10  40  90 160]
a / b = [0.1 0.1 0.1 0.1]
a ** 2 = [ 1  4  9 16]

a * 10 = [10 20 30 40]
a + 5 = [6 7 8 9]


## 4. Indexing und Slicing

Arrays können ähnlich wie Python-Listen indexiert werden, aber mit erweiterten Möglichkeiten.

In [5]:
arr = np.array([10, 20, 30, 40, 50])
print("arr =", arr)

# Einzelne Elemente
print("Element bei Index 0:", arr[0])
print("Letztes Element:", arr[-1])
print()

# Slicing
print("arr[1:4]:", arr[1:4])
print("arr[:3]:", arr[:3])
print("arr[2:]:", arr[2:])
print()

# 2D-Indexing
matrix = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print("Matrix:\n", matrix)
print()
print("Element (0,1):", matrix[0, 1])
print("Erste Zeile:", matrix[0, :])
print("Zweite Spalte:", matrix[:, 1])

arr = [10 20 30 40 50]
Element bei Index 0: 10
Letztes Element: 50

arr[1:4]: [20 30 40]
arr[:3]: [10 20 30]
arr[2:]: [30 40 50]

Matrix:
 [[1 2 3]
 [4 5 6]
 [7 8 9]]

Element (0,1): 2
Erste Zeile: [1 2 3]
Zweite Spalte: [2 5 8]


### Filtern

Arrays können mit booleschen Masken gefiltert werden:

In [6]:
data = np.array([1, 5, 3, 8, 2, 9, 4])

# Boolesche Maske erstellen
mask = data > 4
print("Maske (data > 4):", mask)
print()

# Filtern
filtered = data[mask]
print("Gefilterte Daten:", filtered)
print()

# Direktes Filtern
print("Werte < 5:", data[data < 5])
print("Gerade Zahlen:", data[data % 2 == 0])

Maske (data > 4): [False  True False  True False  True False]

Gefilterte Daten: [5 8 9]

Werte < 5: [1 3 2 4]
Gerade Zahlen: [8 2 4]


## 5. Statistische Funktionen

NumPy bietet viele mathematische und statistische Funktionen:

In [7]:
data = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print("data =", data)

print("Summe:", np.sum(data))
print("Mittelwert:", np.mean(data))
print("Median:", np.median(data))
print("Standardabweichung:", np.std(data))
print("Minimum:", np.min(data))
print("Maximum:", np.max(data))
print()

# Achsen bei mehrdimensionalen Arrays
matrix = np.array([[1, 2, 3], [4, 5, 6]])
print("Matrix:\n", matrix)
print("Summe aller Elemente:", np.sum(matrix))
print("Summe pro Spalte (axis=0):", np.sum(matrix, axis=0))
print("Summe pro Zeile (axis=1):", np.sum(matrix, axis=1))

data = [ 1  2  3  4  5  6  7  8  9 10]
Summe: 55
Mittelwert: 5.5
Median: 5.5
Standardabweichung: 2.8722813232690143
Minimum: 1
Maximum: 10

Matrix:
 [[1 2 3]
 [4 5 6]]
Summe aller Elemente: 21
Summe pro Spalte (axis=0): [5 7 9]
Summe pro Zeile (axis=1): [ 6 15]


## 6. Array-Manipulation

Arrays können umgeformt und kombiniert werden:

In [8]:
# Reshape
arr = np.arange(12)
print("Original:", arr)
reshaped = arr.reshape(3, 4)
print("Reshaped (3x4):\n", reshaped)
print()

# Transponieren
print("Transponiert:\n", reshaped.T)
print()

# Flatten (zurück zu 1D)
flat = reshaped.flatten()
print("Flatten:", flat)
print()

# Arrays verbinden (Stacking)
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])
print("a =", a)
print("b =", b)
print("Horizontal verbinden:", np.hstack([a, b]))
print("Vertikal verbinden:\n", np.vstack([a, b]))

Original: [ 0  1  2  3  4  5  6  7  8  9 10 11]
Reshaped (3x4):
 [[ 0  1  2  3]
 [ 4  5  6  7]
 [ 8  9 10 11]]

Transponiert:
 [[ 0  4  8]
 [ 1  5  9]
 [ 2  6 10]
 [ 3  7 11]]

Flatten: [ 0  1  2  3  4  5  6  7  8  9 10 11]

a = [1 2 3]
b = [4 5 6]
Horizontal verbinden: [1 2 3 4 5 6]
Vertikal verbinden:
 [[1 2 3]
 [4 5 6]]


## 7. Broadcasting

"Broadcasting" ermöglicht Operationen zwischen Arrays unterschiedlicher Formen. 

Der Anwendungsprogrammierer muss hierzu nichts weiter tun, aber wissen, dass diese 
Operationen in NumPy erlaubt sind.

In [9]:
# Skalar mit Array
arr = np.array([[1, 2, 3], [4, 5, 6]])
print("Array:\n", arr)
print("Array + 10:\n", arr + 10)
print()

# 1D-Array mit 2D-Array
vector = np.array([10, 20, 30])
print("Vector:", vector)
print("Array + Vector:\n", arr + vector)
print()

# Spaltenvektor mit Zeilenvektor
col = np.array([[1], [2], [3]])
row = np.array([10, 20, 30])
print("Spaltenvektor:\n", col)
print("Zeilenvektor:", row)
print("Produkt (Broadcasting):\n", col * row)

Array:
 [[1 2 3]
 [4 5 6]]
Array + 10:
 [[11 12 13]
 [14 15 16]]

Vector: [10 20 30]
Array + Vector:
 [[11 22 33]
 [14 25 36]]

Spaltenvektor:
 [[1]
 [2]
 [3]]
Zeilenvektor: [10 20 30]
Produkt (Broadcasting):
 [[10 20 30]
 [20 40 60]
 [30 60 90]]


## 8. Zufallszahlen

NumPy bietet umfangreiche Funktionen für Zufallszahlen:

In [10]:
# Zufallszahlen-Generator (empfohlene Methode)
rng = np.random.default_rng()
# rng = np.random.default_rng(seed=42) # reproduzierbare Ergebnisse mit "seed"

# Gleichverteilte Zufallszahlen (0 bis 1)
uniform = rng.random(5)
print("Gleichverteilt (0-1):", uniform)
print()

# Ganzzahlen
integers = rng.integers(1, 100, size=10)
print("Zufällige Ganzzahlen:", integers)
print()

# Normalverteilung
normal = rng.normal(loc=0, scale=1, size=1000)
print("Normalverteilt (Mittelwert, Std):", np.mean(normal), np.std(normal))
print()

# 2D-Array mit Zufallszahlen
random_matrix = rng.random((3, 4))
print("Zufällige Matrix:\n", random_matrix)

Gleichverteilt (0-1): [0.34850908 0.00876327 0.40863961 0.75965005 0.99503448]

Zufällige Ganzzahlen: [ 6 32 51 84  7 86  5  8 48 27]

Normalverteilt (Mittelwert, Std): -0.00025266288642994807 0.9841148501876795

Zufällige Matrix:
 [[0.36375449 0.89203497 0.26332552 0.12823957]
 [0.68799294 0.30063302 0.31950333 0.98471533]
 [0.63536711 0.52157375 0.56971572 0.59805098]]


## 9. Praktisches Beispiel: Temperaturanalyse

Simulieren wir Temperaturmessungen über eine Woche:

In [11]:
# Temperaturmessungen für eine Woche (7 Tage, 24 Stunden)
# rng = np.random.default_rng(seed=100)  # Mit 'seed' sind Ergbnisse reproduzierbar 
rng = np.random.default_rng()
temperatures = rng.normal(loc=10, scale=5, size=(7, 24))

print("Shape der Temperaturdaten:", temperatures.shape)
print()

# Durchschnittstemperatur pro Tag
daily_avg = np.mean(temperatures, axis=1)
print("Durchschnitt pro Tag:", np.round(daily_avg, 2))
print()

# Durchschnitt pro Stunde (über alle Tage)
hourly_avg = np.mean(temperatures, axis=0)
print("Wärmste Stunde im Durchschnitt:", np.argmax(hourly_avg), "Uhr")
print("Kälteste Stunde im Durchschnitt:", np.argmin(hourly_avg), "Uhr")
print()

# Höchst- und Tiefsttemperatur
print("Höchsttemperatur:", np.round(np.max(temperatures), 2), "°C")
print("Tiefsttemperatur:", np.round(np.min(temperatures), 2), "°C")
print()

# Anzahl der Messungen über 15°C
hot_count = np.sum(temperatures > 15)
print(f"Anzahl Messungen > 15°C: {hot_count} von {temperatures.size}")

Shape der Temperaturdaten: (7, 24)

Durchschnitt pro Tag: [11.3   8.93  9.83 11.06 10.37  8.59 10.96]

Wärmste Stunde im Durchschnitt: 2 Uhr
Kälteste Stunde im Durchschnitt: 14 Uhr

Höchsttemperatur: 23.91 °C
Tiefsttemperatur: -2.56 °C

Anzahl Messungen > 15°C: 28 von 168


## 10. Performance-Vergleich: NumPy vs. Python

NumPy ist deutlich schneller als native Python-Listen:

In [12]:
import time

size = 1000000

# Python-Liste
python_list = list(range(size))
start = time.time()
result_list = [x * 2 for x in python_list]
time_list = time.time() - start

# NumPy-Array
numpy_array = np.arange(size)
start = time.time()
result_numpy = numpy_array * 2
time_numpy = time.time() - start

print(f"Python-Liste: {time_list:.4f} Sekunden")
print(f"NumPy-Array: {time_numpy:.4f} Sekunden")
print(f"Speedup: {time_list/time_numpy:.1f}x schneller mit NumPy")

Python-Liste: 0.0191 Sekunden
NumPy-Array: 0.0008 Sekunden
Speedup: 24.5x schneller mit NumPy


## Zusammenfassung

NumPy ist essentiell für:
- *Effiziente numerische Berechnungen* (viel schneller als Python-Listen)
- *Multidimensionale Datenstrukturen* (Arrays/Matrizen)
- *Wissenschaftliche Anwendungen* (Datenanalyse, Machine Learning, Bildverarbeitung)
- *Einfache Syntax* für komplexe Operationen

### Wichtige Funktionen im Überblick:
- `np.array()` - Array erstellen
- `np.zeros()`, `np.ones()`, `np.eye()` - Spezielle Arrays
- `np.arange()`, `np.linspace()` - Wertesequenzen
- `np.mean()`, `np.sum()`, `np.std()` - Statistik
- `np.reshape()`, `np.flatten()` - Form ändern
- Boolean Indexing - Filtern
- Broadcasting - Operationen mit unterschiedlichen Shapes

### Weiterführende Themen:
- Lineare Algebra (`np.linalg`)
- Fourier-Transformation (`np.fft`)
- Polynome (`np.poly`)
- Datei-I/O (`np.load`, `np.save`)