# Einführung in Markov-Quellen

## Was ist eine Markov-Quelle?

Im Bereich der Informationstheorie ist eine **Markov-Quelle** ein statistisches Modell, das eine Sequenz von Symbolen ausgibt, basierend auf Wahrscheinlichkeiten, die vom vorherigen Symbol in der Sequenz abhängen. Diese Abhängigkeit führt das Konzept des 'Gedächtnisses' in die Quelle ein, da das nächste Symbol nicht unabhängig von den vorherigen Symbolen ist.

## Bedeutung in der Informationstheorie

Markov-Quellen sind grundlegend für das Verständnis vieler Aspekte der Datenkompression, Kanalkodierung und Vorhersage von Ereignissequenzen. Sie bieten ein Rahmenwerk für die Modellierung der Wahrscheinlichkeiten von Sequenzen in einem Prozess über die Zeit, was für die Gestaltung effizienter Kodierungsschemata entscheidend ist.

## Ziel dieses Notebooks

In diesem Notebook untersuchen wir eine Markov-Quelle der Ordnung 1, was bedeutet, dass die Wahrscheinlichkeit eines aktuellen Symbols nur vom unmittelbar vorhergehenden Symbol abhängt. Angesichts eines Alphabets \( X = \{x_1, x_2, x_3\} \) und einer Übergangswahrscheinlichkeitsmatrix ist unser Ziel, die stationären Wahrscheinlichkeiten jedes Symbols im Alphabet zu bestimmen. Dies wird es uns ermöglichen, das Langzeitverhalten der Markov-Quelle zu verstehen.

Am Ende dieser Übung werden wir ein klareres Verständnis dafür haben, wie Quellen mit Gedächtnis funktionieren und wie man wichtige Wahrscheinlichkeiten berechnet, die ihr Verhalten definieren.


# Theoretische Grundlagen

## Markov-Quellen mit Gedächtnis

Markov-Quellen mit Gedächtnis, speziell Markov-Quellen der Ordnung 1, haben die Besonderheit, dass die Wahrscheinlichkeit eines aktuellen Symbols $ Z_i $ von seinem Vorgänger $ Z_{i-1}$ abhängt. Dieses Konzept wird mathematisch durch eine Übergangswahrscheinlichkeitsmatrix dargestellt.

### Übergangswahrscheinlichkeitsmatrix (P)

Für ein Alphabet $ X = \{x_1, x_2, x_3\} $ beschreibt die Matrix $ P$ die Wahrscheinlichkeiten eines Übergangs von einem Symbol zu einem anderen. Die Matrix ist wie folgt aufgebaut:

$$
P = \begin{bmatrix}
P(Z_1|Z_1) & P(Z_1|Z_2) & P(Z_1|Z_3) \\
P(Z_2|Z_1) & P(Z_2|Z_2) & P(Z_2|Z_3) \\
P(Z_3|Z_1) & P(Z_3|Z_2) & P(Z_3|Z_3) \\
\end{bmatrix} 
$$

### Stationäre Wahrscheinlichkeiten (π)

Die stationären Wahrscheinlichkeiten $ \pi = \{P(Z_1), P(Z_2), P(Z_3)\} $ repräsentieren den langfristigen Anteil der Zeit, den die Quelle in jedem Zustand verbringt. Sie können als Lösungen des folgenden linearen Gleichungssystems gefunden werden:

1. $ P(Z_1) = P(Z_1|Z_1) \cdot P(Z_1) + P(Z_1|Z_2) \cdot P(Z_2) + P(Z_1|Z_3) \cdot P(Z_3) $
2. $ P(Z_2) = P(Z_2|Z_1) \cdot P(Z_1) + P(Z_2|Z_2) \cdot P(Z_2) + P(Z_2|Z_3) \cdot P(Z_3) $
3. $ P(Z_3) = P(Z_3|Z_1) \cdot P(Z_1) + P(Z_3|Z_2) \cdot P(Z_2) + P(Z_3|Z_3) \cdot P(Z_3) $
4. $ P(Z_1) + P(Z_2) + P(Z_3) = 1 $

### Berechnung

Um die stationären Wahrscheinlichkeiten zu bestimmen, müssen wir das obige Gleichungssystem lösen, wobei die letzte Gleichung die Normalisierungsbedingung darstellt, dass die Gesamtwahrscheinlichkeit 1 sein muss. Die Lösung dieses Systems gibt uns die langfristigen Wahrscheinlichkeiten für das Auftreten jedes Symbols in der Markov-Quelle.



In [4]:
from sympy import Matrix

# Create a matrix from the transition probabilities and subtract it from an identity matrix
# This will create the system of equations (I - P') * π = 0 where π is the steady state distribution vector
# We need to replace one of the equations with the normalization condition π1 + π2 + π3 = 1

# Define the transition probability matrix
P = Matrix([[0.8, 0.1, 0.1], [0.4, 0.2, 0.4], [0.1, 0.3, 0.6]])

# Aufstellung der Gleichungen

Um die stationären Wahrscheinlichkeiten für eine Markov-Quelle zu finden, nutzen wir die Eigenschaften der Übergangswahrscheinlichkeitsmatrix und die Tatsache, dass im Gleichgewicht die Wahrscheinlichkeiten konstant bleiben.

## System der Gleichungen

Für eine Markov-Quelle der Ordnung 1 mit drei möglichen Zuständen $ Z_1, Z_2, Z_3 $ und der Übergangswahrscheinlichkeitsmatrix $ P $ erstellen wir ein System linearer Gleichungen. Jede Gleichung entspricht einem Zustand der Markov-Quelle und beschreibt, dass die Wahrscheinlichkeit, in diesen Zustand zu gelangen, gleich der Wahrscheinlichkeit ist, diesen Zustand zu verlassen.

## Subtraktion der Matrix von der Einheitsmatrix

Um das Gleichungssystem aufzustellen, subtrahieren wir die transponierte Übergangswahrscheinlichkeitsmatrix $ P^T $ von der Einheitsmatrix $ I $. Dies ergibt eine neue Matrix $ A $, die wir zur Lösung des Gleichungssystems verwenden können.

$$ A = I - P^T $$

## Normalisierungsbedingung

Da die Summe aller Wahrscheinlichkeiten 1 ergeben muss, ersetzen wir eine der Zeilen in $ A $ durch die Normalisierungsbedingung. Das ergibt das finale Gleichungssystem, welches wir lösen werden, um die stationären Wahrscheinlichkeiten $ pi $ zu bestimmen.


In [5]:
from sympy import symbols, Eq, solve, Matrix

# Define the transition probability matrix for a source of order 1
P = Matrix([[0.8, 0.1, 0.1], [0.4, 0.2, 0.4], [0.1, 0.3, 0.6]])

# Set up the system of equations for the steady state probabilities
# We create a system (I - P') * π = 0 and replace one row with the normalization condition
I = Matrix([[1, 0, 0], [0, 1, 0], [0, 0, 1]])
A = I - P.transpose()
A[2, :] = Matrix([[1, 1, 1]])  # Replace the last row with the normalization condition
b = Matrix([0, 0, 1])  # Result matrix for the equations

# Solve the system for the steady state distribution π
steady_state_distribution = A.solve_least_squares(b)
steady_state_distribution


Matrix([
[0.512820512820512],
[ 0.17948717948718],
[0.307692307692308]])