# Bedarfsermittlung mithilfe von Bedarfsprognosen

In dieser Übung werden die gängigen Verfahren zum Prognostizieren von Bedarfen im Kontext der Produktion und Logistik zu beleuchtet, gegenübergestellt und in Python implementiert.

# Problemstellung und Ziel
 
Ungenauigkeiten in der Ermittlung von Bedarfen können in einem niedrigen Servicegrad oder in hohen Sicherheitsbeständen resultieren. Ersteres führt zu entgangenem Umsatz und letzteres zu hohen Lagerbeständen, Lagerkosten und somit zu einer erhöhten Kapitalbindung. Hieraus leitet sich das Ziel ab, die Bedarfe so zu ermitteln, dass diese für die Produktion oder den Vertrieb termin- und mengengerecht zur Verfügung stehen, der Produktionsplan oder eine mögliche Zielsetzung nicht gefährdet und gleichzeitig die Kapitalbindungskosten gering gehalten werden.

# Einordnung der Begriffe

**Definition "Bedarfsermittlung"**

> "*Verfahren zur Ermittlung der zukünftig auftretenden Materialbedarfe nach Zeit und Menge.*" (Krieger 2018a)

**Definition "Bedarfsprognose"**
> "*Verfahren, mit dem im Rahmen der verbrauchsorientierten Bedarfsermittlung aus den Bedarfswerten der Vergangenheit auf die künftigen Bedarfe geschlossen wird.*" (Krieger 2018b)

Beide Begriffe werden häufig synoym verwendet. Es wird aber ersichtlich, dass die Bedarfsprognose eine Konkretisierung der Bedarfsermittlung darstellt. Die Bedarfsermittlung lässt sich hierbei in drei Arten unterteilen (Wannenwetsch 2009, S.38):

**1. Programmorientierte Bedarfsermittlung**
- konkrete Kundenaufträge bilden Grundlage
- Bedarfstermine und Bedarfsmengen werden aus Aufträgen abgeleitet
- Verfahren liefert exakte Werte

**2. Heuristische Bedarfsermittlung (subjektive Bedarfsschätzung)**
- Grundlage bilden Erfahrung und Intuition des Planers: Bedarfsmenge wird *geschätzt*
- Hilfsmittel wie z. B. Umfragen werden genutzt
- Eine Abschätzung kann bei wenigen Produkten/Informationen rechnergestützten Verfahren überlegen sein
- heuristische Verfahren erforderlich, wenn keine verlässliche Datengrundlage gegeben ist

**3. Verbrauchsorientierte Bedarfsermittlung**
- Bedarf wird mit verschiedenen Verfahren (deterministisch, mathematisch-stochastisch) *prognostiziert*
- Vergangenheitswerte werden in die Zukunft *extrapoliert*
- Nutzung, wenn programmorientierte Verfahren nicht anwendbar oder unwirtschaftlich sind (wie z. B. bei C-Teilen)
- belastbare Prognoseergebnisse erfordern ausreichende Versorgung mit Zahlenwerten (Zeitreihen) und Kontinuität des Bedarfsverlaufs

Die Arten und darin eingeordnete Methoden haben alle ihre Anwendung und sind als ein Werkzeug zu verstehen, welches aufgabenbezogen ausgewählt werden muss. Die Praxis erfordert es häufig, die drei Arten nebeneinander einzusetzen (Wannenwetsch 2009, S.37).

<div class="alert alert-block alert-info">
In der Literatur und gängigen Definitionen werden die Begriffe "verbrauchsorientierte Bedarfsermittlung" sowie "stochastische Bedarfsermittlung" und "programmorientierte Bedarfsermittlung" sowie "deterministische Bedarfsermittlung" synonym verwendet. In der Theorie zwar keine Neuheit, jedoch sehr wohl in der Verbreitung der praxisbezogenen Anwendung, sind Verfahren des maschinellen Lernens (ML). Verfahren des ML sind nach dem Trainieren deterministische Verfahren. Im Sinne der Präzision sollten die o. g. Begriffe daher nicht ohne Weiteres synonymisiert werden. </div>

Den Kern der weiteren Betrachtungen sollen hier die verbrauchsorientierten Verfahren bilden.

# Bedarfsverläufe

Neben der Erfordernis ausreichend vorhandener historischer Daten des Bedarfs, ist auch der Bedarfsverlauf selbst entscheidend über die Qualität der Prognose. Hierbei lassen sich die Bedarfsverläufe kategorisieren in geeignete und, zumindest ohne weitere Analysen und Vorverarbeitung, eher ungeeignete Verläufe, welche als Sonderfälle betrachtet werden:

### unproblematische Bedarfsverläufe für Prognosen

| ![konstanter Bedarf](0_konstanter_Bedarf.png) | ![trendförmiger Bedarf](1_trendfoermiger_Bedarf.png) | ![saisonaler Bedarf](2_saisonaler_Bedarf.png) |
|-|-|-|


### problematische Bedarfsverläufe für Prognosen

| ![schwankender Bedarf](3_schwankender_Bedarf.png) | ![sporadischer Bedarf](4_sporadischer_Bedarf.png) | ![Strukturbruch im Bedarf](5_Strukturbruch_Bedarf.png) |
|-|-|-|


Weiterhin kann es kategorieübergreifende Mischformen geben.

# Überblick gängiger Prognoseverfahren

Prognoseverfahren müssen in Abhängigkeit von den unterschiedlichen Bedarfsverläufen gewählt werden. In der nachfolgenden Tabelle werden die relevanten Prognoseverfahren in Abhängigkeit zu den unterschiedlichen Bedarfsverläufe bewertet (Schuh und Schmidt 2014, S.88):

|Legende||
|:-:|:-|
|⚫︎|geeignet|
|◑|bedingt geeignet|
|⚪︎|nicht geeignet|

<br>
<br>
  
| | konstant/stationär | sporadisch| trendförmig | saisonal | saisonal trendförmig |
|-:|:-:|:-:|:-:|:-:|:-:|
|lineare Regression|◑|⚪︎|⚫︎|⚪︎|⚪︎|
|gleitender Mittelwert|⚫︎|◑|◑|⚪︎|⚪︎|
|exponentielle Glättung 1. Ordnung|⚫︎|◑|⚪︎|⚪︎|⚪︎|
|exponentielle Glättung 2. Ordnung nach Holt|◑|⚪︎|⚫︎|⚪︎|⚪︎|
|exponentielle Glättung 2. Ordnung nach Winters|◑|⚪︎|◑|⚫︎|⚫︎|
|Crostons Methode|⚪︎|⚫︎|⚪︎|⚪︎|⚪︎|
|multiple Regression|◑|◑|⚫︎|⚫︎|⚫︎|
|ARIMA-Klasse|⚫︎|◑|⚫︎|⚫︎|⚫︎|

## Bestimmung der Qualität der Prognose

Die Bestimmung der Qulität oder auch Güte, Genauigkeit einer Prognose fußt auf der Berechnung des Prognosefehlers e, welcher aus der Differenz des realen Wertes und des Prognosewertes berechnet wird.

$$
e_t = (Y_t - P_t)
$$
<br>
<br>

Eines der am häufigsten verwendeten Fehlermaße ist der mittlere quadrierte Fehler *MSE* (Mean Squared Error). Dieser wird wie folgt berechnet:

$$
\text{MSE} = \frac{1}{N} \sum_{t=1}^{N} (Y_t - P_t)^2
$$
<br>
<br>
$$
N = \text{Anzahl der Datenpunkte} \quad Y_t = \text{tatsächlicher Bedarfswert zum Zeitpunkt t} \quad P_t = \text{Prognosewert zum Zeitpunkt t}
$$

Die Prognosefehler werden quadriert, dann summiert und mit der Anzahl der erechneten Prognosefehler dividiert. Die Quadrierung hat den Effekt, dass große Prognosefehler besonders berücksichtigt werden. Der MSE zeigt somit an, ob das gewählte Prognoseverfahren große Fehler erzeugt etwa durch unpassende Parametrierung oder u. U. die falsche Wahl des Progonoseverfahrens selbst.

Es kann auch nützlich sein, den Prognosefehler in Prozent anzugeben. Hierfür wird die Methode *MAPE* (Mean Absolute Percentage Error) genutzt.

$$
\text{MAPE} = \frac{1}{N} \sum_{t=1}^{N} \left| \frac{Y_t - P_t}{Y_t} \right|
$$

$$
N = \text{Anzahl der Datenpunkte} \quad Y_t = \text{tatsächlicher Bedarfswert zum Zeitpunkt t} \quad P_t = \text{Prognosewert zum Zeitpunkt t}
$$

Dieses Verfahren gibt also das mittlere *Verhältnis* zwischen realem Wert und Prognosewert an.

# Definitionen ausgewählter Prognoseverfahren

## Einfacher und gleitender Mittelwert

Die Berechnung von Mittelwerten stellt die wohl einfachste Methode zur Prognose dar.

#### Arithmetischer Mittelwert

$$
P_{t+1} = \frac{1}{N} \sum_{i=1}^{N} Y_i
$$
<br>
<br>
$$
P_{t+1} = \text{Prognosewert Periode (t+1)} \quad Y_i = \text{Bedarfswert Periode i} \quad N = \text{Anzahl betrachteter Perioden (alle)}
$$

Dieses Verfahren kann nur sinnvoll eingesetzt werden bei sehr konstanten Bedaerfsverläufen ohne große Ausreißer. Robuster gegenüber Ausreißern ist der gleitende Mittelwert.

### Gleitender Mittelwert

$$
P_{t+1} = \frac{1}{N} \sum_{i=t-N+1}^{t} Y_i
$$
<br>
<br>
$$
P_{t+1} = \text{Prognosewert Periode (t+1)} \quad Y_i = \text{Bedarfswert Periode i} \quad N = \text{Anzahl betrachteter Perioden}
$$

### Lineare Regression

Wie der Name schon erahnen lässt, eignet sich dieses Verfahren für lineare Bedarfsverläufe - stationär als auch steigend und fallend.

$$
Y_t = \beta_0 + \beta_1 \cdot X_t
$$
<br>
<br>
$$
Y_t = \text{Bedarfswert Periode t} \quad \beta_0 = \text{y-Achsenabschnitt (Intercept), der den erwarteten Wert von Y angibt, wenn } X=0 \quad \beta_1 = \text{Steigungsparameter, der die Änderung von Y für eine Einheit Änderung von X angibt} \quad X_t = \text{ist die unabhängige Variable (der erklärende Faktor)}
$$

Die Methode der kleinsten Quadrate (OLS - Ordinary Least Squares) wird verwendet, um die Koeffizienten β0 und β1 in einer linearen Regression so zu schätzen, dass die Summe der quadrierten Differenzen zwischen den beobachteten und vorhergesagten Werten (Residuen) minimiert wird. Die allgemeine Formel für die Methode der kleinsten Quadrate lautet:

$$
\text{Minimize } \sum_{i=t}^{n} (Y_t - (\beta_0 + \beta_1 \cdot X_t))^2
$$

### Exponentielle Glättung 1. Ordnung

Die exponentielle Glättung 1. Ordnung kann als Spezialfall einer Mittelwerts betrachtet werden. Die exponentielle Glättung ist einfach zu implementieren und erfordert nur wenige Parameter. Sie eignet sich besonders für Situationen, in denen es eine gewisse Unsicherheit bezüglich der genauen Natur der Daten gibt und eine adaptive Methode gewünscht ist.

$$
P_{t+1} = \alpha \cdot Y_t + (1 - \alpha) \cdot P_t
$$
<br>
<br>
$$
P_{t+1} = \text{Prognosewert Periode (t+1)} \quad Y_i = \text{Bedarfswert Periode i} \quad \alpha = \text{Glättungsparameter wobei } 0 < \alpha<1 \quad P_t = \text{Prognose aktuelle Periode}
$$

Im ersten Schritt wird für die Prognose der aktuellen Periode hilfsweise der IST-Wert der aktuellen Periode herangezogen.
Je höher der Glättungsfaktor α ist, desto weniger werden alte Werte berücksichtigt. Aktuellere Werte werden stärker gewichtet. Hierbei haben sich folgende Entscheidungsregeln bewährt (Schuh und Schmidt 2014, S.74):

- 0,05 ≤ α ≤ 0,3 bei realen Periodenbedarfsmengen, welche annähernd normalverteilt sind (Normalfall 0,1 ≤ α ≤ 0,2)
- 0,3 < α ≤ 0,5 wenn signifikante Veränderungen in den Bedarfsverläufen erwartet werden (saisonale Einflüsse, Konjunkturschwankungen)
- α > 0,5 ist abzuraten, da wegen geringer Anzahl einbezogener Werte keine gesicherte statistische Aussage getroffen werden kann

<div class="alert alert-block alert-info">
Wenn α=1 ist, wird das Modell im Grunde keine Gewichtung auf vorherige Vorhersagen legen, und die Vorhersage wird ausschließlich durch den letzten Beobachtungswert bestimmt. In diesem Fall wird die Vorhersage mit den tatsächlichen Werten übereinstimmen, und der RMSE wird null sein. In der Praxis ist es jedoch unwahrscheinlich, dass α=1 verwendet wird, da dies zu einem zu aggressiven Ansprechen auf kurzfristige Schwankungen führen würde und das Modell nicht gut verallgemeinern könnte. </div>

### Exponentielle Glättung 2. Ordnung nach Holt

Die exponentiellen Glättung 2. Ordnung nach Holt (auch als Holts Methode bekannt) ist eine Erweiterung der exponentiellen Glättung 1. Ordnung. Dieses Verfahren bezieht lineare Trendverläufen innerhalb der betrachteten Zeitreihe mit ein.

$$
L_t = \alpha \cdot Y_t + (1 - \alpha) \cdot (L_{t-1} + T_{t-1})
$$

$$
T_t = \beta \cdot (L_t - L_{t-1}) + (1 - \beta) \cdot T_{t-1}
$$


$$
P_{t+p} = L_t + p \cdot T_t
$$
<br>
<br>
$$
L_t = \text{Achsenabschnitt Trendfunktion in t} \quad \alpha = \text{Glättungsparameter} \quad ß = \text{Trend-Glättungsparameter} \quad  P_t+p = \text{Prognose Periode (t + p)} \quad Y_t = \text{Bedarfswert Periode t} \quad p = \text{prognostizierte Periode ab t} \quad T_t = \text{Steigung Trendfunktion in t}
$$

Wie schon in der exponentiellen Glättung 1. Ordnung kann bei diesem Verfahren durch Anpassung der Glättungsparameter α und β die Reaktionsfreudigkeit beeinflusst werden. Der Glättungsfaktor α analog zur exponentiellen Glättung 1. Ordnung. Neu ist  β, welches ein Trend-Glättungsparameter ist und die Steigung des Trends bestimmt. Die Parameter α und β sind unabhängig voneinander. Wenn β = 0 gewählt wird, funktioniert dieses Verfahren wie die exponentielle Glättung 1. Ordnung.


### Exponentielle Glättung 2. Ordnung nach Winters

Die exponentiellen Glättung 2. Ordnung nach Winters (auch als Winters' Methode und Holt-Winters Methode bekannt) ist eine Erweiterung der exponentiellen Glättung 2. Ordnung nach Holt. Dieses Verfahren bezieht saisonale Verläufe innerhalb der betrachteten Zeitreihe mit ein. In der Winters Methode wird wie bereits in der Methode nach Holt eine Glättung des Achsenabschnitts sowie Steigung durchgeführt. Zusätzlich wird hier nun ein Saisonfaktor eingeführt, welcher ebenfalls Einfluss auf die Glättung übt.

Die Steigung in Winters Methode ist identisch zur Methode von Holt und wird mit dem Gewichtungsfaktor β durchgeführt. In Winters' Methode unterscheidet sich allerdings die Berechnung des Achsenabschnitts. Der Bedarfswert Y der Periode t wird durch den Saisonfaktor S der um eine Saisonlänge zurückliegenden Periode t-s dividiert. Saisonlänge beschreibt hier, wie oft sich die Daten wiederholen. Bei monatlich gesammelten Daten könnte die Saisonlänge z. B. mit 12 angenommen werden. Der Achsenabschnitt wird so um den Saisoneinfluss bereinigt. S wird aus der Glättung des Quotienten des tatsächlichen Werts Y und aktuellem Achsenabschnitts L mit dem eine Saisonlänge zurückliegenden Wert dieses Quotienten berechnet. Die Glättung erfolgt mittels des Saison Glättungsparameters γ wobei 0 ≤ γ ≤ 1.

Um die initialen Prognosewerte berechnen zu können, müssen Startwerte angenommen/berechnert werden. Es ist zu beachten, dass die Initialisierung von den Daten abhängt und entscheidend dafür ist, dass die Methode effektiv funktioniert. Die ersten Prognosewerte können zunächst u. U. stark von den tatsächlichen Bedarfswerten abweichen. Die Anpassung des Saisonfaktors erfolgt allerdings recht schnell (Schuh und Schmidt 2014, S.78).

Das Vorgehen bei diesem Verfahren, hier wird exemplarisch das additive und multiplikative Verfahren für die Saisonalität herangezogen, ist wie folgt (Hyndman, R. J.; Athanasopoulos, G. 2018): 


Additiv:

$$
L_t = \alpha \cdot (Y_t - S_{t-s}) + (1 - \alpha) \cdot (L_{t-1} + T_{t-1})
$$

$$
T_t = \beta \cdot (L_t - L_{t-1}) + (1 - \beta) \cdot T_{t-1}
$$

$$
S_t = \gamma \cdot (Y_t - L_{t-1} - T_{t-1} ) + (1 - \gamma) \cdot S_{t-s}
$$

$$
P_{t+p} = L_t + p \cdot T_t + S_{t+p-s}
$$
<br>
<br>
$$
L_t = \text{Achsenabschnitt Trendfunktion in t} \quad α = \text{Glättungsparameter} \quad ß = \text{Trend-Glättungsparameter} \quad γ = \text{Saison-Glättungsparameter} \quad Yt = \text{Bedarfswert Periode t} \quad s = \text{Länge einer Saison} \quad S = \text{Saisonfaktor} \quad Pt+p = \text{Prognose Periode (t + p)} \quad Tt = \text{Steigung Trendfunktion in t} \quad p = \text{prognostizierte Periode ab t}
$$


Multiplikativ:

$$
L_t = \alpha \cdot \left( \frac{Y_t}{S_{t-s}} \right) + (1 - \alpha) \cdot (L_{t-1} + T_{t-1})
$$

$$
T_t = \beta \cdot (L_t - L_{t-1}) + (1 - \beta) \cdot T_{t-1}
$$

$$
S_t = \gamma \cdot \left( \frac{Y_t}{L_{t-1} + T_{t-1}} \right) + (1 - \gamma) \cdot S_{t-s}
$$

$$
P_{t+p} = (L_t + p \cdot T_t) \cdot S_{t+p-s}
$$
<br>
<br>
$$
L_t = \text{Achsenabschnitt Trendfunktion in t} \quad α = \text{Glättungsparameter} \quad ß = \text{Trend-Glättungsparameter} \quad γ = \text{Saison-Glättungsparameter} \quad Yt = \text{Bedarfswert Periode t} \quad s = \text{Länge einer Saison} \quad S = \text{Saisonfaktor} \quad Pt+p = \text{Prognose Periode (t + p)} \quad Tt = \text{Steigung Trendfunktion in t} \quad p = \text{prognostizierte Periode ab t}
$$


Bei dem additiven Verfahren wird davon ausgegangen, dass der saisonale Effekt konstant ist, während das multiplikative Verfahren davon ausgeht, dass der saisonale Effekt mit dem Niveau der Zeitreihe variiert. Die additive Saisonalität eignet sich für Zeitreihen mit relativ konstanten saisonalen Mustern, während die multiplikative Saisonalität geeigneter ist, wenn der saisonale Effekt proportional zum Gesamtniveau der Daten zu- oder abnimmt (Hyndman, R. J.; Athanasopoulos, G. 2018).

Zustätzlich existiert noch das gedämpfte Verfahren. Dieses wird genutzt, wenn zu erwarten ist, dass der Trend in der Zeitreihe im Laufe der Zeit abnimmt oder letztlich abflacht. Dies ist besonders nützlich für langfristige Prognosen, um unrealistische Vorhersagen auf der Grundlage eines unbegrenzt wachsenden oder abnehmenden Trends zu vermeiden (Hyndman, R. J.; Athanasopoulos, G. 2018).

#### Zusammenfassung

**Alpha (α), Beta (β) und Gamma (γ)**

Die Parameter Alpha (α), Beta (β) und Gamma (γ) steuern die Gewichtung der jüngsten Beobachtungen bei der Aktualisierung der Niveau-/Level, Trend- und saisonalen Komponenten.

**Alpha (α)- Glättungsparameter für das Level**
- Steuert, wie stark die aktuelle Beobachtung im Vergleich zum vorherigen geglätteten Wert gewichtet wird
- Typische Werte liegen bei den meisten Datensätzen im Bereich 0,1 ≤ α ≤ 0,3
- Ein höherer Wert reagiert schneller auf Änderungen im Level der Reihe, während ein niedrigerer Wert kurzfristige Schwankungen glättet

**Beta (β)- Glättungsparameter für den Trend**
- Legt fest, wie viel Gewicht Änderungen des Niveaus bei der Aktualisierung des Trends beigemessen wird
- Typische Werte liegen im Bereich 0,1 ≤ β ≤ 0,3
- Ein höherer Wert erfasst Trendänderungen schneller, kann allerdings auf Rauschen überreagieren

**Gamma (γ) - Glättungsparameter für die saisonale Komponente**
- Bestimmt, wie schnell die saisonalen Muster aktualisiert werden
- Typische Werte liegen im Bereich von 0,1 ≤ γ ≤ 0,3
- Ein höherer Wert aktualisiert die saisonalen Veränderungen schneller, was nützlich sein kann, wenn sich die Saisonalität schnell ändert, während ein niedrigerer Wert eine stabilere Saisonalität voraussetzt


Auswahl der optimalen α, β und γ:
- Die Parameter α, β und γ können durch Schätzung zu ausreichend guter Vorhersagequalität führen, werden üblicherweise aber durch Optimierungsverfahren (wie z. B. grid search) unter Nutzung von Optimierungsbibliotheken optimal ausgewählt.


**Initialisierung von $L_0$, $T_0$, $S_0$**

Die Initialisierung ist entscheidend dafür, dass die Methode effektiv funktioniert.

**Level-Komponente $L_0$**

$L_0$ wird als Durchschnitt des ersten saisonalen Zyklus der Zeitreihe gesetzt:

$$
L_0 = \frac{\sum_{t=1}^s Y_t}{s}
$$

$s$ - Länge der Saisonalität (z. B. 12 für monatliche Daten, 4 für vierteljährliche Daten, usw.).


**Trend-Komponente $T_0$**

$T_0$ wird aus der Differenz zwischen den Durchschnitten der ersten beiden saisonalen Zyklen berechnet:

$$
T_0 = \frac{\sum_{t=s+1}^{2s} Y_t}{s} - \frac{\sum_{t=1}^s Y_t}{s}
$$

Diese Differenz wird durch die Länge der Saisonalität $s$ geteilt, um den durchschnittlichen Trend pro Zeitschritt zu erhalten:

$$
T_0 = \frac{\left( \frac{\sum_{t=s+1}^{2s} Y_t}{s} - \frac{\sum_{t=1}^s Y_t}{s} \right)}{s}
$$

**Saisonale-Komponente $S_0$**

Die saisonalen Komponenten $S_j$ erfassen den saisonalen Effekt für jede Position $j$ innerhalb des saisonalen Zyklus: $j=1$, $S_1$ steht für den saisonalen Effekt der ersten Periode, z. B. Januar, $j=2$, $S_2$ für Februar, usw.

Additiver Trend:

Für jede Periode $j$ im ersten Zyklus wird die initiale saisonale Komponente wie folgt berechnet:

$$
S_j = Y_j - L_0, \quad \text{für } j = 1, 2, \dots, s
$$

Multiplikativer Trend:

$S_j$ normalisieren, indem durch das initiale Level $L_0$ geteilt wird:
 
$$
S_j = \frac{Y_j}{L_0}
$$

Dies stellt sicher, dass die saisonalen Indizes zu $s$ aufsummiert werden oder im Durchschnitt gleich 1 sind.


Für die Anwendung und Implementierung ist eine Reihe geeigneter Bibliotheken und Funktionen vorhanden, deren Nutzung ratsam ist. Eine beispielhafte Implementierung wird im Notebook "Beispiele" vorgestellt werden.

## ARMA-Klasse

Auto-Regressive-Moving-Average Modelle (ARMA) und die Erweiterungen (z. B. ARIMA, ARIMAX, ARMAX, ...)  bilden eine große Klasse linearer, zeitdiskreter Modelle für stochastische Prozesse. Sie erzielen sehr gute Ergebnisse selbst mit eingeschränkter Datengrundlage und werden in vielen Bereichen der Wirtschafts-, Sozial- und Ingenieurwissenschaften zur statistischen Analyse von Zeitreihen und kurzfristigen Prognose eingesetzt.

Die Zeitreihe wird hierbei als rein stochastisch determinierte Reihe von Zufallswerten interpretiert und analysiert. Auto-Regressive-Moving-Average-Modelle (ARMA) sind für stationäre Datenreihen geeignet. Für nichtstationäre Daten können  Auto-Regressive-Integrated-Moving-Average-Modelle (ARIMA) eingesetzt werden, die die Daten in einen stationären Zustand überführen. Saisonalitäten in den Zeitreihen werden mit SARIMA-Modellen beschrieben (Seasonal-ARIMA). Auch können externe Variablen, die u. U. einen Einfluss auf die Zeitreihe üben, beschrieben werden (ARIMAX - x für exogenous). Alle diese Modelle werden auf Grundlage der Vergangenheitswerte geschätzt und sind allgemein, wodurch sie hohe Komplexitäten erreichen können. Ohne Zuhilfenahme geeigneter Software oder Software Bibliotheken sind diese Prognosemodelle nicht sinvoll einsetzbar (Schuh und Schmidt 2014, S.84; vgl. auch Huang & Petukhina 2022, Kapitel 4, Kapitel 5, Kapitel 7.2, Kapitel 8.3).

Erklärung der einzelnen Komponenten (univariater) ARIMA-Modelle:

|||
|-|-|
|AR|Auto-Regressive|
|MA|Moving Average|
|I|Integrated|
|S|Seasonal|
|X|Exogenous|

<br>
<br>

Resultierende mögliche Modelle aus der Kombination einzelner Komponenten:

|AR|MA| I| S| X|Modell|
|:-:|:-:|:-:|:-:|:-:|:-:|
|x|||||AR|
||x||||MA|
|x|x||||ARMA|
|x|x|||x|ARMAX|
|x|x|x|||ARIMA|
|x|x|x|x||SARIMA|
|x|x|x||x|ARIMAX|
|x|x|x|x|x|SARIMAX|

Das AR-Modell kann wie folgt beschrieben werden:
<br>

$$
Y_t = c + \phi_1 Y_{t-1} + \phi_2 Y_{t-2} + \ldots + \phi_p Y_{t-p} + \varepsilon_t\\
Y_t = c + \varepsilon_t + \sum_{i=1}^{p} \phi_i Y_{t-i}
$$

<br>
<br>

$$
Y_t = \text{zu modellierendes Signal/Wert Zeitpunkt t} \quad
c = \text{Konstante} \quad
\phi_1,\phi_2,…,\phi_p \text{ sind die autoregressiven Koeffizienten} \quad
εt= \text{Fehlerterm (weißes Rauschen) zum Zeitpunkt t} \quad
p = \text{Ordnung des autoregressiven Terms}
$$

Die autoregressiven Parameter ϕ beschreiben den Einfluss der entsprechenden Vorperiode und müssen durch mathematische Verfahren geschätzt werden.

Das MA-Modell kann wie folgt beschrieben werden:

$$
Y_t = c + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \theta_2 \varepsilon_{t-2} + \ldots + \theta_q \varepsilon_{t-q}\\
Y_t = c + \varepsilon_t + \sum_{j=1}^{q} \theta_j \varepsilon_{t-j}
$$

<br>
<br>

$$
Y_t = \text{zu modellierendes Signal/Wert Zeitpunkt t} \quad
c = \text{Konstante} \quad
\theta_1,\theta_2,…,\theta_p \text{ sind die MA-Koeffizienten (gleitender Mittelwert)} \quad
εt= \text{Fehlerterm (weißes Rauschen) zum Zeitpunkt t} \quad
q = \text{Ordnung des MA-Terms}
$$

Ein ARMA-Modell setzt sich demnach zusammen zu:

$$
Y_t = c + \varepsilon_t + \sum_{i=1}^{p} \phi_i Y_{t-i} + \sum_{j=1}^{q} \theta_j \varepsilon_{t-j}
$$

Die Notation für solche Modelle lautet ARMA(p, q). Hierbei geben p und q jeweils die AR und MA-Ordnung des Modells und somit des Prozesses an. Hieraus ergibt sich, dass reine AR(p)-Modelle bzw. MA(q)-Modelle spezielle ARMA-Modelle mit jeweils q=0 bzw. p=0 sind.


### Schritte und Analyse zur Modellerstellung
- 1. Überprüfung der Zeitreihe auf Stationarität. Sehr gängig ist hier der *Augmented Dickey-Fuller Test*. Ist die Zeitreihe nicht-stationär kann durch Differenzenbildung eine Stationarität induziert werden. Das Modell wird somit zu einem ARIMA-Modell der Ordnungen p,d,q oder auch ARIMA(p,d,q).
- 2. Anwendung der Autokorrelationsfunktion (engl.: Auto Correlation Function - ACF) und partiellen Autokorrelationsfunktion (engl.: Partial Auto Correlation Function - PACF) auf die Zeitreihe.
- 3. Betrachtung des Verlaufs der Funktionen (Korrelation der Zeitreihe mit sich selbst zu verschobenen Zeitpunkten - meist *lags* genannt) und Auswahl des Modells auf Basis des Verlaufs der beiden Autokorrelationsgraphen (s. Tabelle unterhalb)
- 4. Identifikation der Ordnung der Modell-Terme (hier zur besseren Verständnis auf AR und MA reduziert) mithilfe der ACF und PACF (geringe Ordnungen bedeuten eine geringere Anzahl der zu schätzenden Parameter)
- 5. Schätzung der autoregressiven Parameter ϕ mithilfe der Methode der kleinsten Quadrate oder der Maximum-Likelihood-Schätzung (engl.: Maximum Likelihood Estimation - MLE) mit dem ausgwähltem Modell und identifizierter Ordnung
- 6. Modell zusammensetzen und Prognosewerte berechnen

(vgl. Huang & Petukhina 2022, S.107-108)

### Verlaufs ACF und PACF: Bestimmtung des grundlegenden Modells

||ACF $\rho(k)$|PACF $\phi(kk)$|
|:-|:-|:-|
|**AR(p)**|exponentiell zu 0 abfallend und/oder alternierend um/zu 0 <br> |$\phi(kk) = 0$ für $k > p$ <br> (eine/mehrere signifikante Spitzen, sonst ~0)|
|**MA(q)**|$\rho(k) = 0$ für $k > q$ <br> (eine/mehrere signifikante Spitzen, sonst ~0) |Vorherrschend: exponentiell zu 0 abfallend und/oder alternierend um/zu 0|
|**ARMA(p,q)**|exponentiell zu 0 abfallend und/oder alternierend um/zu 0 nach lag max(0, q-p) <br> (Verlauf zu 0 abfallend nach einigen signifikanten Spitzen)| Vorherrschend: exponentiell zu 0 abfallend und/oder alternierend um/zu 0 nach lag max(0, q-p) <br> (Verlauf zu 0 abfallend nach einigen signifikanten Spitzen)|

Einige Sonderfälle:

|Verlauf der ACF|Bedeutung|
|-|-|
|Alle Werte nahe 0|weißese Rauschen/Zufallswerte|
|Spitzen in regelmäßigen Intervallen|AR(p) Term mit Saisonalität|


### Beispielverläufe von ACF und PACF
Die Plots zeigen den Verlauf der ACF und PACF für jeweils eine Zeitreihe. Die Spitzen zum Zeitpunkt t=0 in den beiden Plots werden ignoriert, da sie die Korrelation des Wertes mit sich selbt angeben. Signifikante Spitzen sind hierbei Werte > 0,5 und/oder <-0,5.

**Beispiel 1:**
![ACF-PACF](plot-ACF-PACF-AR1.png)

In diesem Beispiel ist die ACF exponentiell zu 0 abfallend, während die PACF eine signifikante Spitze vorweist und sonst ~0 ist oder um 0 schwankt. Für diese Zeitreihe ist ein **AR(1)**-Modell geeignet.

**Beispiel 2:**
![ACF-PACF](plot-ACF-PACF-MA1.png)

In diesem Beispiel hat die ACF eine signifikante Spitze und ist sonst ~0 oder schwankt um 0, während die PACF exponentiell zu 0 abfallend ist oder um 0 schwankt. Für diese Zeitreihe ist ein **MA(1)**-Modell geeignet.

**Beispiel 3:**
![ACF-PACF](plot-ACF-PACF-ARMA22.png)

In diesem Beispiel ist erkennbar, dass sowohl im ACF und PACF Plot 2 siginifikante Spitzen bei $t_1$ und $t_2$ vorzufinden sind. Die restlichen Werte sind alternierend um 0. In diesem Fall eignet sich also ein **ARMA(2,2)** Modell, um den Prozess zu erklären und eine Prognose machen zu können.

Die ACF und PACF sind oftmals nicht so eindeutig, wie es in den obigen Beispielen aufgezeigt wird, können aber als Grundlage für die Wahl eines Modells genutzt werden. In uneindeutign Fällen sollte zunächst ein einfaches Modell niedriger Ordnung gewählt und dann bei Bedarf angepasst werden.

Im nächsten Schritt können die Koeffizienten $\phi$ und $\theta$ bestimmt werden.

Im Notebook "Beispiele" wird die Implementierung unter Zuhilfenahme geeigneter Bibliotheken und Funktionen die Modell- als auch Koeffizientenbestimmung gezeigt werden.

# Literaturverzeichnis

Winfried Krieger (2018): Gabler Wirtschaftslexikon. Bedarfsermittlung. Online verfügbar unter https://wirtschaftslexikon.gabler.de/definition/bedarfsermittlung-30973/version-254544, zuletzt geprüft am 02.01.2024.

Winfried Krieger (2018): Gabler Wirtschaftslexikon. Bedarfsprognose. Online verfügbar unter https://wirtschaftslexikon.gabler.de/definition/bedarfsprognose-28262/version-251896, zuletzt geprüft am 02.01.2024.

Burggräf, Peter; Nowacki, Christoph; Kamp, Sebastian; Bachmann, Fabian (2021): Dimensionierung und Strukturierung der Produktion. In: Peter Burggräf und Günther Schuh (Hg.): Fabrikplanung. Berlin, Heidelberg: Springer Berlin Heidelberg, S. 123–163.

Wannenwetsch, Helmut (2009): Integrierte Materialwirtschaft und Logistik. Beschaffung, Logistik, Materialwirtschaft und Produktion. 4. Aufl. 2010. Berlin, Heidelberg: Springer Berlin Heidelberg (Springer-Lehrbuch).

Schuh, Günther; Schmidt, Carsten (2014): Produktionsmanagement. Berlin, Heidelberg: Springer Berlin Heidelberg.

Hyndman, R. J.; Athanasopoulos, G. (2018): Forecasting: principles and practice. OTexts. Melbourne, Australia. Online verfügbar unter https://otexts.com/fpp2/holt-winters.html, zuletzt geprüft am 02.01.2024.

Huang, Changquan; Petukhina, Alla (2022): Applied Time Series Analysis and Forecasting with Python. Cham: Springer International Publishing.

Joseph, Manu (2022): Modern Time Series Forecasting with Python. Explore industry-ready time series forecasting using modern machine learning and deep learning. Birmingham: Packt Publishing Limited.