# Inhaltsverzeichnis

1. [Regressionsmodelle](#Regressionsmodelle)
   1. [Lineare Regression](#Lineare-Regression)
2. [MAE und R²](#MAE-und-R²)
3. [Matrizen und Transponierte Matrizen](#Matrizen-und-Transponierte-Matrizen)
4. [Bibliotheken und ihre Funktionen](#Bibliotheken-und-ihre-Funktionen)
   1. [NumPy](#NumPy)
   2. [Pandas](#Pandas)
   3. [Matplotlib](#Matplotlib)
   4. [SciPy](#SciPy)
   5. [TensorFlow / Keras](#TensorFlow-/-Keras)
   6. [Andere Python-Funktionen](#Andere-Python-Funktionen)

# Regressionsmodelle

- **Definition**: Ein Regressionsmodell ist ein statistisches Modell zur Untersuchung der Beziehung zwischen einer abhängigen Variable und einer oder mehreren unabhängigen Variablen.

- **Ziel**: Vorhersage der abhängigen Variable basierend auf den Werten der unabhängigen Variablen.

- **Typen**: Lineare Regression (geradlinige Beziehung), Multiple Regression (mehrere unabhängige Variablen), Nichtlineare Regression (nichtlineare Beziehung).

- **Koeffizienten**: Bestimmung der Gewichtungen (Koeffizienten) für die unabhängigen Variablen, um die beste Anpassung der Daten zu erreichen.

- **Anwendung**: Datenanalyse, Vorhersage, Identifizierung von Zusammenhängen und Trends.

## Lineare Regression

- **Definition**: Statistische Methode zur Modellierung der Beziehung zwischen abhängiger und unabhängiger Variable(n).
  
- **Modellgleichung**: $y = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + ... + \beta_n x_n$.
  
- **Ziel**: Finden einer linearen Gleichung, die die Datenpunkte am besten beschreibt.

- **Koeffizientenberechnung**: Minimierung der Differenz zwischen vorhergesagten und tatsächlichen Werten, meist durch die Methode der kleinsten Quadrate.

- **Annahmen**: Lineare Beziehung, normalverteilte Residuen, konstante Fehler-Varianz (Homoskedastizität), unabhängige Residuen.

- **Modellbewertung**: Bestimmtheitsmaß (R²) zur Bewertung der Güte des Modells.

- **Anwendungen**: Vorhersage kontinuierlicher Werte, Analyse von Variablenbeziehungen, Basis für komplexere Modelle.

# MAE und R²

**Mean Absolute Error (MAE)**
Mean Absolute Error (MAE) ist ein Maß für den durchschnittlichen absoluten Fehler zwischen den vorhergesagten und den tatsächlichen Werten. 
Es wird berechnet als der Mittelwert der absoluten Differenzen zwischen den tatsächlichen und den vorhergesagten Werten.

Formel:
MAE = (1/n) * Σ|yi - ŷi|

wobei:
- n die Anzahl der Beobachtungen ist
- yi der tatsächliche Wert ist
- ŷi der vorhergesagte Wert ist

MAE ist einfach zu interpretieren und gibt die durchschnittliche Größe der Fehler in den gleichen Einheiten wie die Daten an.

**R²-Koeffizient (R-Squared)**
Der R²-Koeffizient, auch Bestimmtheitsmaß genannt, misst den Anteil der Varianz der abhängigen Variable, der durch das Modell erklärt wird. 
Ein R²-Wert von 1 bedeutet, dass das Modell die Daten perfekt erklärt, während ein Wert von 0 bedeutet, dass das Modell überhaupt nichts erklärt.

Formel:
R² = 1 - (SS_res / SS_tot)
- SS_res die Residuenquadratsumme ist (Σ(yi - ŷi)²)
- SS_tot die Gesamtsumme der Quadrate ist (Σ(yi - ȳ)²)
also:
R² = 1 - ((Σ(yi - ŷi)²) / (Σ(yi - ȳ)²))

wobei:

- yi der tatsächliche Wert ist
- ŷi der vorhergesagte Wert ist
- ȳ der Mittelwert der tatsächlichen Werte ist

R² gibt an, wie gut die Daten durch das Modell erklärt werden, und liegt immer zwischen 0 und 1 (bzw. kann auch negativ sein, wenn das Modell schlechter als der Mittelwert ist).

# Matrizen und Transponierte Matrizen

## Einführung

In der linearen Algebra sind Matrizen rechteckige Anordnungen von Zahlen, Symbolen oder Ausdrücken, die in Zeilen und Spalten organisiert sind. Eine Matrix wird oft verwendet, um lineare Gleichungssysteme darzustellen und zu lösen, Transformationen durchzuführen und viele andere Anwendungen in der Mathematik und Ingenieurwissenschaften.

## Definition einer Matrix

Eine Matrix wird allgemein als `A` bezeichnet und hat die Form:

\[
A = \begin{pmatrix}
a_{11} & a_{12} & \cdots & a_{1n} \\
a_{21} & a_{22} & \cdots & a_{2n} \\
\vdots & \vdots & \ddots & \vdots \\
a_{m1} & a_{m2} & \cdots & a_{mn}
\end{pmatrix}
\]

Hierbei ist \( A \) eine \( m \times n \) Matrix mit `m` Zeilen und `n` Spalten.

## Beispiel einer Matrix

```python
import numpy as np

# Erstellen einer 3x3 Matrix
A = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

print("Matrix A:")
print(A)
])
```
Transponierte Matrix:
Die transponierte Matrix $( A^T )$ einer Matrix $A$ wird durch das Vertauschen der Zeilen und Spalten von $A$ gebildet.
Formal: $A^T_{ij} = A_{ji} $
Beispiel der Transponierung einer Matrix
Transponieren der Matrix A
```python
A_T = np.transpose(A)

print("Transponierte Matrix A^T:")
print(A_
Ausgabe : A = ([[1, 4, 7],
              [2, 5, 8],
              [3, 6, 9]])T)
```

# Bibliotheken und ihre Funktionen

## NumPy

NumPy ist eine Bibliothek für wissenschaftliches Rechnen mit Python, die Unterstützung für große, mehrdimensionale Arrays und Matrizen bietet.

- **array**: Eine Funktion, um ein Array zu erstellen.
  ```python
  import numpy as np
  array = np.array([1, 2, 3, 4])
  ```

- **astype**: Eine Methode, um den Datentyp eines Arrays zu ändern.
  ```python
  array = np.array([1, 2, 3, 4], dtype=float)
  ```

- **add**: Eine Operation, die zwei Werte addiert.
  ```python
  a = np.array([1, 2])
  b = np.array([3, 4])
  ergebnis = np.add(a, b)
  ```

- **resize**: Eine Methode, um die Größe eines Arrays zu ändern.
  ```python
  array = np.array([1, 2, 3, 4, 5, 6])
  neues_array = np.resize(array, (2, 3))
  ```

- **zeros**: Erstellt ein Array gefüllt mit Nullen.
  ```python
  nullen = np.zeros((3, 3))
  ```

- **ones**: Erstellt ein Array gefüllt mit Einsen.
  ```python
  einsen = np.ones((2, 2))
  ```

- **arange**: Erstellt ein Array mit regelmäßig angeordneten Werten.
  ```python
  zahlen = np.arange(0, 10, 2)  # [0, 2, 4, 6, 8]
  ```

- **dot**: Berechnet das Matrixprodukt zweier Arrays.
  ```python
  a = np.array([[1, 2], [3, 4]])
  b = np.array([[5, 6], [7, 8]])
  produkt = np.dot(a, b)
  ```

## Pandas

Pandas ist eine Bibliothek für Datenmanipulation und -analyse.

- **read_csv**: Liest eine CSV-Datei in einen DataFrame.
  ```python
  import pandas as pd
  df = pd.read_csv('daten.csv')
  ```

- **head**: Zeigt die ersten n Zeilen eines DataFrame.
  ```python
  print(df.head())
  ```

- **groupby**: Gruppiert Daten nach bestimmten Kriterien.
  ```python
  grouped = df.groupby('kategorie')
  ```

- **merge**: Führt zwei DataFrames zusammen.
  ```python
  merged_df = pd.merge(df1, df2, on='id')
  ```

- **describe**: Erzeugt beschreibende Statistiken.
  ```python
  stats = df.describe()
  ```

## Matplotlib

Matplotlib ist eine Plotting-Bibliothek für Python.

- **imshow**: Eine Funktion, um ein Bild anzuzeigen.
  ```python
  import matplotlib.pyplot as plt
  import numpy as np
  
  bild = np.random.rand(100, 100)
  plt.imshow(bild, cmap='gray')
  plt.show()
  ```

- **subplots**: Eine Funktion, um mehrere Plots in einer Figur zu erstellen.
  [Detaillierte Erklärung fehlt im ursprünglichen Notebook]

- **plot**: Erstellt einen einfachen 2D-Plot.
  ```python
  plt.plot([1, 2, 3, 4], [1, 4, 2, 3])
  plt.show()
  ```

- **scatter**: Erstellt einen Streudiagramm-Plot.
  ```python
  plt.scatter([1, 2, 3, 4], [1, 4, 2, 3])
  plt.show()
  ```

- **hist**: Erstellt ein Histogramm.
  ```python
  plt.hist([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])
  plt.show()
  ```

- **savefig**: Speichert die aktuelle Figur als Bilddatei.
  ```python
  plt.savefig('plot.png')
  ```

## SciPy

SciPy ist eine Bibliothek für wissenschaftliche Berechnungen in Python.

- **stats.ttest_ind**: Führt einen unabhängigen t-Test durch.
  ```python
  from scipy import stats
  t_statistic, p_value = stats.ttest_ind(gruppe1, gruppe2)
  ```

- **optimize.minimize**: Findet das Minimum einer Funktion.
  ```python
  from scipy import optimize
  result = optimize.minimize(funktion, x0=[0, 0])
  ```

- **integrate.quad**: Berechnet ein bestimmtes Integral.
  ```python
  from scipy import integrate
  result, error = integrate.quad(lambda x: x**2, 0, 1)
  ```

- **linalg.solve**: Löst ein lineares Gleichungssystem.
  ```python
  from scipy import linalg
  x = linalg.solve(A, b)
  ```

## TensorFlow / Keras

TensorFlow ist eine Open-Source-Bibliothek für maschinelles Lernen, und Keras ist eine hochrangige API, die auf TensorFlow aufbaut.

- **Conv2D**: Eine Schicht für ein Convolutional Neural Network (CNN) in Keras.
  ```python
  from tensorflow.keras.layers import Conv2D
  conv = Conv2D(filters=32, kernel_size=(3, 3), activation='relu')
  ```

- **MaxPooling2D**: Eine Schicht für die Max-Pooling-Operation in einem CNN.
  ```python
  from tensorflow.keras.layers import MaxPooling2D
  pooling = MaxPooling2D(pool_size=(2, 2))
  ```

- **Flatten**: Eine Schicht, um mehrdimensionale Eingaben zu einer eindimensionalen Ausgabe abzuflachen.
  ```python
  from tensorflow.keras.layers import Flatten
  flatten = Flatten()
  ```

- **Dense**: Eine vollständig verbundene Schicht in einem neuronalen Netzwerk.
  ```python
  from tensorflow.keras.layers import Dense
  dense = Dense(units=128, activation='relu')
  ```

- **Dropout**: Eine Schicht, die Dropout-Regularisierung in einem neuronalen Netzwerk durchführt.
  ```python
  from tensorflow.keras.layers import Dropout
  dropout = Dropout(rate=0.5)
  ```

- **Sequential**: Ein sequentielles Modell in Keras, bei dem die Schichten linear aufeinander folgen.
  ```python
  from tensorflow.keras.models import Sequential
  modell = Sequential()
  ```

- **compile**: Eine Methode, um das Keras-Modell zu kompilieren.
  ```python
  modell.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
  ```

- **fit**: Eine Methode, um das Keras-Modell zu trainieren.
  ```python
  modell.fit(x_train, y_train, epochs=10)
  ```

- **predict**: Eine Methode, um Vorhersagen mit dem trainierten Keras-Modell zu machen.
  ```python
  vorhersagen = modell.predict(x_test)
  ```

- **save_model**: Eine Methode, um das trainierte Modell zu speichern.
  ```python
  from tensorflow.keras.models import save_model
  save_model(modell, 'modell.h5')
  ```

- **load_model**: Eine Methode, um ein gespeichertes Modell zu laden.
  ```python
  from tensorflow.keras.models import load_model
  modell = load_model('modell.h5')
  ```

- **BinaryCrossentropy**: Ein Verlustfunktion für binäre Klassifizierungsprobleme.
  ```python
  from tensorflow.keras.losses import BinaryCrossentropy
  verlust = BinaryCrossentropy()
  ```

- **BinaryAccuracy**: Eine Metrik, um die Genauigkeit bei binären Klassifizierungsproblemen zu messen.
  ```python
  from tensorflow.keras.metrics import BinaryAccuracy
  genauigkeit = BinaryAccuracy()
  ```

- **Precision**: Eine Metrik, um die Präzision bei Klassifizierungsproblemen zu messen.
  ```python
  from tensorflow.keras.metrics import Precision
  präzision = Precision()
  ```

- **Recall**: Eine Metrik, um den Rückruf bei Klassifizierungsproblemen zu messen.
  ```python
  from tensorflow.keras.metrics import Recall
  rückruf = Recall()
  ```

- **ImageDataGenerator**: Eine Klasse, um Bilder für das Training von Keras-Modellen zu generieren.
  ```python
  from tensorflow.keras.preprocessing.image import ImageDataGenerator
  datengenerator = ImageDataGenerator(rescale=1./255)
  ```

- **flow_from_directory**: Eine Methode, um Bilder aus einem Verzeichnis zu laden und für das Training vorzubereiten.
  ```python
  train_data = datengenerator.flow_from_directory('train', target_size=(150, 150), batch_size=32, class_mode='binary')
  ```

- **image_dataset_from_directory**: Eine Methode, um ein Bilddatensatz aus einem Verzeichnis zu erstellen.
  ```python
  import tensorflow as tf
  dataset = tf.keras.preprocessing.image_dataset_from_directory('verzeichnis')
  ```

- **TensorBoard**: Ein Werkzeug zur Visualisierung von TensorFlow-Grafiken und anderen Metriken.

- **Adam**: Ein Optimierungsalgorithmus für Gradientenabstieg.
  ```python
  from tensorflow.keras.optimizers import Adam
  optimizer = Adam(learning_rate=0.001)
  ```

- **EarlyStopping**: Ein Callback zur frühzeitigen Beendigung des Trainings.
  ```python
  from tensorflow.keras.callbacks import EarlyStopping
  early_stop = EarlyStopping(monitor='val_loss', patience=3)
  ```

- **ModelCheckpoint**: Speichert das Modell während des Trainings.
  ```python
  from tensorflow.keras.callbacks import ModelCheckpoint
  checkpoint = ModelCheckpoint('best_model.h5', save_best_only=True)
  ```

- **to_categorical**: Konvertiert Klassen-Vektoren in binäre Klassenmatrizen.
  ```python
  from tensorflow.keras.utils import to_categorical
  y_binary = to_categorical(y)
  ```

## Andere Python-Funktionen

- **print**: Ausgabetext auf der Konsole anzeigen.
  ```python
  print("Hallo, Welt!")
  ```

- **map**: Eine Funktion auf jedes Element einer Liste anwenden.
  ```python
  def quadrat(x):
      return x * x
  zahlen = [1, 2, 3, 4]
  ergebnis = list(map(quadrat, zahlen))
  ```

- **len**: Die Länge eines Objekts (z.B. Liste) zurückgeben.
  ```python
  liste = [1, 2, 3, 4]
  print(len(liste))
  ```

- **int**: Eine Zahl in einen Ganzzahlwert umwandeln.
  ```python
  zahl = 3.14
  ganzzahl = int(zahl)
  ```

- **min**: Den kleinsten Wert in einer Liste oder einem Array finden.
  ```python
  zahlen = [1, 2, 3, 4]
  print(min(zahlen))
  ```

- **max**: Den größten Wert in einer Liste oder einem Array finden.
  ```python
  zahlen = [1, 2, 3, 4]
  print(max(zahlen))
  ```

- **join**: Eine Methode, um eine Liste von Strings zu einem einzelnen String zu verbinden.
  ```python
  liste = ['Hallo', 'Welt']
  verbunden = ' '.join(liste)
  ```

- **format**: Eine Methode, um einen String zu formatieren.
  ```python
  name = "Welt"
  ausgabe = "Hallo, {}!".format(name)
  ```

- **enumerate**: Eine Funktion, die eine aufzählbare Liste von Tuple (Index, Wert) zurückgibt.
  ```python
  liste = ['a', 'b', 'c']
  for index, wert in enumerate(liste):
      print(index, wert)
  ```

- **next**: Eine Funktion, um das nächste Element eines Iterators zurückzugeben.
  ```python
  iterator = iter([1, 2, 3])
  print(next(iterator))
  ```

- **listdir**: Listet die Dateien in einem Verzeichnis auf.
  ```python
  import os
  dateien = os.listdir('.')
  ```

- **remove**: Eine Funktion, um eine Datei zu löschen.
  ```python
  import os
  os.remove('datei.txt')
  ```

- **sorted**: Sortiert eine Sequenz.
  ```python
  sortierte_liste = sorted([3, 1, 4, 1, 5, 9, 2, 6])
  ```

- **zip**: Kombiniert mehrere Iterables.
  ```python
  namen = ['Alice', 'Bob', 'Charlie']
  alter = [25, 30, 35]
  for name, age in zip(namen, alter):
      print(f"{name} ist {age} Jahre alt")
  ```

- **filter**: Filtert Elemente basierend auf einer Funktion.
  ```python
  zahlen = [1, 2, 3, 4, 5, 6]
  gerade = list(filter(lambda x: x % 2 == 0, zahlen))
  ```

- **any**: Prüft, ob mindestens ein Element in einer Sequenz wahr ist.
  ```python
  if any(zahl > 5 for zahl in [1, 2, 3, 4, 5, 6]):
      print("Mindestens eine Zahl ist größer als 5")
  ```

- **all**: Prüft, ob alle Elemente in einer Sequenz wahr sind.
  ```python
  if all(zahl > 0 for zahl in [1, 2, 3, 4, 5]):
      print("Alle Zahlen