# Architektur von KI

## Einleitung

Die Architektur von Künstlicher Intelligenz (KI) beschreibt, wie verschiedene Komponenten und Schichten eines KI-Systems strukturiert sind, um Aufgaben wie Datenverarbeitung, Mustererkennung oder Entscheidungsfindung durchzuführen. Es gibt verschiedene Arten von KI-Architekturen, abhängig von der spezifischen Anwendung und dem verwendeten Ansatz. Im Allgemeinen kann man KI-Architekturen in die folgenden Hauptkategorien einteilen:

    -Basisarchitektur von KI-Systemen

    -Arten von KI-Architekturen

## Basisarchitektur von KI-Systemen

### Datenverarbeitung

Datenakquise: Rohdaten werden gesammelt und in ein Format gebracht, das für die KI-Verarbeitung geeignet ist. Dies kann Sensordaten, Text, Bilder oder andere Arten von Daten umfassen.
Datenvorverarbeitung: Die Daten werden bereinigt, normalisiert und transformiert, um Rauschen zu reduzieren und relevante Merkmale hervorzuheben.

### Modellierung

Feature Engineering: Auswahl und Erstellung von relevanten Merkmalen (Features), die dem KI-Modell helfen, Muster und Zusammenhänge in den Daten zu erkennen.
Modelltraining: Verschiedene Algorithmen (z.B. neuronale Netze, Entscheidungsbäume) werden verwendet, um ein Modell zu trainieren. Das Modell lernt aus den Daten und passt seine Parameter an, um bestimmte Aufgaben zu erfüllen.
Modellbewertung: Das trainierte Modell wird getestet und bewertet, um sicherzustellen, dass es die Aufgabe wie erwartet erfüllt. Dabei werden Metriken wie Genauigkeit, Präzision, Recall und F1-Score verwendet.

### Entscheidungsfindung und Ausgabe

Inference (Schlussfolgerung): Das trainierte Modell wird verwendet, um Vorhersagen oder Entscheidungen basierend auf neuen Daten zu treffen.
Post-Processing: Ergebnisse werden möglicherweise weiter verarbeitet, um sie für den Endnutzer verständlich zu machen oder zusätzliche Analysen durchzuführen.

## Arten von KI-Architekturen

### Traditionelle Machine Learning-Architekturen

#### Lineare Modelle

Einfache Modelle, die auf linearen Beziehungen zwischen Eingabefunktionen und Ausgaben basieren (z.B. lineare Regression, logistische Regression).

#### Entscheidungsbäume

Hierarchische Modelle, die Entscheidungen basierend auf den Merkmalen der Daten treffen.

#### Ensemble-Methoden

Kombinieren mehrere Modelle, um die Leistung zu verbessern (z.B. Random Forests, Gradient Boosting Machines).

### Neuronale Netzwerke und Deep Learning

#### Feedforward Neural Networks (FNN) 

Die einfachste Form von neuronalen Netzwerken, bei denen Daten von der Eingabeschicht durch verborgene Schichten zur Ausgabeschicht fließen.

#### Convolutional Neural Networks (CNN)

Speziell für die Verarbeitung von Bilddaten entwickelt, nutzen CNNs Faltungsschichten, um lokale Merkmale zu extrahieren.

#### Recurrent Neural Networks (RNN)

Für die Verarbeitung von sequenziellen Daten geeignet, z.B. Text oder Zeitreihen, indem sie frühere Informationen über eine zeitliche Reihenfolge hinweg behalten (z.B. LSTM, GRU).

### Spezialarchitekturen

#### Transformers

Ein modernes Modell, das vor allem in der Verarbeitung natürlicher Sprache verwendet wird. Transformers nutzen Selbstaufmerksamkeit, um Kontexte zu erfassen (z.B. BERT, GPT).

#### Autoencoders

Netzwerke, die lernen, Daten zu komprimieren und zu rekonstruieren, oft verwendet für Anomalieerkennung oder Datenkompression.

[1] Natural Language Processing mit PyTorch (Buch) <br>
[2] https://research.google/blog/transformer-a-novel-neural-network-architecture-for-language-understanding/ <br>
[3] https://keras.io