# Untersuchung der Entwicklung von Verbraucherpreisen und Energiekosten


## Übersicht


Die Verbraucherpreise sind während der Pandemie und insbesondere nach dem Krieg in der Ukraine stark gestiegen. Die Preisentwicklung ist ein sehr wichtiger Indikator für die Analyse einer Volkswirtschaft und dient als grundlegendes Instrument für die politische Entscheidungsfindung. 
Zur Messung der Preisentwicklung werden der **Verbraucherpreisindex (VPI)** und der **Erzeugerpreisindex (EPI)** des Statistischen Bundesamtes verwendet. 

> "In der **Preisstatistik** werden Ergebnisse von **zeitlichen Preisvergleichen** in Form von **Indizes** monatlich beziehungsweise vierteljährlich veröffentlicht. Das deutsche preisstatistische System folgt dabei in seinem Aufbau den Stufen, die Güter auf ihrem Weg vom Import oder von der Produktion bis zum Endverbrauch durchlaufen können." 

[Quelle](https://www.destatis.de/DE/Themen/Wirtschaft/Preise/Ueberblick/einfuehrung.html?nn=467346)

**Verbraucherpreisindex (VPI)**: 
> "Der Verbraucherpreisindex misst monatlich die durchschnittliche Preisentwicklung aller Waren und Dienstleistungen, die private Haushalte in Deutschland für Konsumzwecke kaufen. Die Veränderung des Verbraucherpreisindex zum Vorjahresmonat bzw. zum Vorjahr wird als Teuerungsrate oder als Inflationsrate bezeichnet.
Beim Berechnen des Verbraucherpreisindex bzw. der Inflationsrate verwenden wir einen "Warenkorb", der rund 700 Güterarten umfasst und sämtliche von privaten Haushalten in Deutschland gekauften Waren und Dienstleistungen repräsentiert. Mit welchen Gewichten diese Güterarten in den Gesamtindex einfließen, ist im Wägungsschema festgehalten."

[Quelle](https://www.destatis.de/DE/Themen/Wirtschaft/Preise/Verbraucherpreisindex/_inhalt.html)

**Erzeugerpreisindex gewerblicher Produkte (EPI)**

>"Der vom Statistischen Bundesamt monatlich ermittelte Erzeugerpreisindex gewerblicher Produkte misst die durchschnittliche Preisentwicklung von Rohstoffen und Industrieerzeugnissen, die von inländischen Unternehmen abgebaut bzw. hergestellt und im Inland verkauft werden. Die Produzenten dieser Güter gehören zu den Wirtschaftszweigen des Bergbaus und der Gewinnung von Steinen und Erden, des Verarbeitenden Gewerbes und der Energie- und Wasserversorgung."

[Quelle](https://www.bundesbank.de/de/statistiken/konjunktur-und-preise/erzeuger-und-verbraucherpreise/erzeuger-und-verbraucherpreise-775284)

**Inflationsrate:**

Die Inflationsrate ist ein Maß für die prozentuale Veränderung der Preisindizes gegenüber dem Vorjahr. Ist sie rückläufig, spricht man von **Deflation**.

**Weitere Informationen:** 
* https://www.destatis.de/DE/Themen/Wirtschaft/Preise/Ueberblick/_inhalt.html
* https://www.bundesbank.de/de/statistiken/konjunktur-und-preise/erzeuger-und-verbraucherpreise/erzeuger-und-verbraucherpreise-775284

Wir wollen genauer untersuchen, wie sich der Verbraucher- und der Erzeugerpreisindex in den letzten Jahren entwickelt haben. 

**Mögliche Fragen:**
1. Wie stark sind die Preise gestiegen?
2. Wann sind die Preise gestiegen?
3. Welche Produkte sind besonders betroffen?
4. Ist der Anstieg an Verbraucherpreisen und Erzeugerpreisen proportional?

## Daten

Alle Daten, die wir verwenden werden, sind auf der Website des Statistischen Bundesamtes zu finden. Es werden jeweils die Daten der Jahre 2018 bis 2023 berücksichtigt.

## Data Cleaning

### VPI

Die Daten des Verbraucherpreisindex (Basisjahr=2020) können auf folgender Seite des Statistischen Bundesamtes abgerufen werden: https://www.destatis.de/DE/Themen/Wirtschaft/Preise/Verbraucherpreisindex/Tabellen/Verbraucherpreise-12Kategorien.html 

Wir laden die monatlichen Indizes in **Power BI**.

<img src='Bilder/2-1-VPI_load.png' width="600"/>

Um sie zu transformieren, öffnen wir sie in **PowerQuery**. Wir stellen fest, dass für die zweite Tabelle aufgrund der zusätzlichen Anmerkung falsche Spaltenüberschriften verwendet wurden. Wir übernehmen die erste Zeile als Überschrift und entfernen die zweite Zeile.

<img src='Bilder/2-2-VPI_Table1.png' width="1000"/>

Mit der Funktion *fill* füllen wir die Nullwerte mit den richtigen Jahreszahlen. Wir erstellen eine neue Spalte im Format "Jahr Monat" mit *Add Column From Examples* und verbinden die Tabellen mit einem *INNER JOIN* auf der neuen Spalte.

<img src='Bilder/2-3-VPI_merge_date_columns.png' width="1000"/>

Wir korrigieren die Spaltennamen und die Datentypen der Spalten und bringen die Tabelle mit der Funktion *Unpivot* von der Wide Form in die Long Form.

<img src='Bilder/2-4-VPI_unpivot.png' width="1000"/>

<img src='Bilder/2-5-EPI_transform.png' width="1000"/>

### EPI gewerblicher Produkte

Die Daten des **Erzeugerpreisindex gewerblicher Produkte** (Basisjahr=2015) können auf folgender Seite des Statistischen Bundesamtes abgerufen werden: https://www.destatis.de/DE/Themen/Wirtschaft/Preise/Erzeugerpreisindex-gewerbliche-Produkte/_inhalt.html#238942

Diesmal verwenden wir **Python** für das Data Cleaning. Dazu laden wir die entsprechende Tabelle als Excel-Datei herunter.

Wir laden die Daten in ein Pandas Dataframe.

In [1]:
import pandas as pd

file_path = '1-EPI-Gewerbliche-Produkte.xlsx'
df = pd.read_excel(file_path)
df.head(8)

Unnamed: 0,"Producer price index for industrial products: Germany,\nmonths, product classification (GP2009 2-/3-/4-/5-/6-/\n9-digit codes/special items)",Unnamed: 1,Unnamed: 2,Unnamed: 3,Unnamed: 4,Unnamed: 5,Unnamed: 6,Unnamed: 7,Unnamed: 8,Unnamed: 9,...,Unnamed: 64,Unnamed: 65,Unnamed: 66,Unnamed: 67,Unnamed: 68,Unnamed: 69,Unnamed: 70,Unnamed: 71,Unnamed: 72,Unnamed: 73
0,Index of producer prices of industrial products,,,,,,,,,,...,,,,,,,,,,
1,Germany,,,,,,,,,,...,,,,,,,,,,
2,Producer price index for industrial products (...,,,,,,,,,,...,,,,,,,,,,
3,GP2009 (2-digit codes): Industrial products,,2018,,,,,,,,...,,,,,,,,,,
4,,,January,February,March,April,May,June,July,August,...,March,April,May,June,July,August,September,October,November,December
5,GP09-05,Kohle,97.3,97.3,98.9,98.4,98.4,98.4,98.3,98.3,...,141,141,143,148.6,...,...,...,...,...,...
6,GP09-06,Erdöl und Erdgas,97.6,97,96,99.1,101,105.2,109.5,108.8,...,252.8,217.5,198.6,171.6,...,...,...,...,...,...
7,GP09-08,"Steine und Erden, sonstige Bergbauerzeugnisse",103.9,104,104,104.3,105,104.9,105.2,105,...,152.1,152.5,153.1,153.6,...,...,...,...,...,...


Wir erstellen eine Funktion zur Ermittlung der Spaltennamen.

In [2]:
def column_names():
    # Name der ersten Spalte 
    columns = ['Kategorie']
    # Zeitraum in der Form: 'JJJJ-MM' 
    for year in range(2018, 2024):
        for month in range(1, 13):
            columns.append(f'{year}-{month:02d}')
    return columns

Wir löschen die Zeilen mit falschen und unnötigen Daten, wandeln die Daten in das Long-Format um und ändern die Datentypen.

In [3]:
def clean_data(df):
    # Drop rows with missing data in column: 'Unnamed: 1'
    df = df.dropna(subset=['Unnamed: 1'])
    # Drop column: 'Producer price index for industrial products: Germany, months, product classification (GP2009 2-/3-/4-/5-/6-/ 9-digit codes/special items)'
    df = df.drop(columns=['Producer price index for industrial products: Germany,\nmonths, product classification (GP2009 2-/3-/4-/5-/6-/\n9-digit codes/special items)'])
    # Rename columns
    df.columns = column_names()
    # Drop Month with no data
    columns_to_drop = df.columns[df.eq('...').any()]
    df.drop(columns=columns_to_drop, inplace=True)
    
    # Pivot into long format
    df = pd.melt(df, id_vars='Kategorie', var_name='Datum', value_name='EPI')
    
    # Change column type to float16 for column: 'EPI'
    df = df.astype({'EPI': 'float16'})
    # Change column type to datetime64[ns] for column: 'Datum'
    df = df.astype({'Datum': 'datetime64[ns]'})
    # Change column type to string for column: 'Kategorie'
    df = df.astype({'Kategorie': 'category'})
    
    # Reset Index
    df = df.reset_index(drop=True)
    return df

df_clean = clean_data(df.copy())
df_clean.head()

Unnamed: 0,Kategorie,Datum,EPI
0,Kohle,2018-01-01,97.3125
1,Erdöl und Erdgas,2018-01-01,97.625
2,"Steine und Erden, sonstige Bergbauerzeugnisse",2018-01-01,103.875
3,Nahrungsmittel und Futtermittel,2018-01-01,104.5
4,Getränke,2018-01-01,103.5


Abschließend speichern wir die bereinigten Daten in einer Excel-Datei.

In [4]:
df_clean.to_excel('1-EPI-Gewerbliche-Produkte-clean.xlsx', sheet_name='EPI', index=False)

### EPI Dienstleistungen

Die Daten des **Erzeugerpreisindex Dienstleistungen** (Basisjahr=2015) können auf folgender Seite des Statistischen Bundesamtes abgerufen werden: https://www.destatis.de/DE/Themen/Wirtschaft/Preise/Erzeugerpreisindex-Dienstleistungen/_inhalt.html#

Die Daten für den EPI Dienstleistungen sind nur auf Quartalsbasis verfügbar. Wie beim VPI verwenden wir Power Query. Um die Spalten in die richtige Form zu bringen, verwenden wir ein Python-Skript. Die weiteren Schritte sind mit denen der vorhergehenden Queries vergleichbar.

In [None]:
# Das verwendete Python script

# 'dataset' holds the input data for this script
import pandas as pd
df = dataset
column_names = ['Code','Kategorie']
# Zeitraum in der Form: 'JJJJ-QTR' 
for year in range(2018, 2024):
    for qtr in range(1, 5):
        column_names.append(f'{year}-{qtr:02d}')
df.columns = column_names

<img src='Bilder/2-6-EPI_Dienstleistungen.png' width="1000"/>

## Data Exploration

**Mögliche Fragen:**
1. Wie stark sind die Preise gestiegen?
2. Wann sind die Preise gestiegen?
3. Welche Produkte sind besonders betroffen?
4. Ist der Anstieg an Verbraucherpreisen und Erzeugerpreisen proportional?

Basis Jahr für VPI ist 2020. Also beträgt der Index im Jahr 2020 100.

Basis Jahr für EPI ist 2015. Also beträgt der Index im Jahr 2015 100.

Vor der Pandemie lag die Inflationsrate für das Jahr 2019 bei 1,42 %. Im März 2020 erklärt die Weltgesundheitsorganisation (WHO) die aktuelle Situation zur weltweiten Pandemie. Die Inflationsrate sinkt und von Juli bis Oktober kommt es sogar zu einer deflationären Phase. Besonders betroffen sind die Preise für "Verkehr", "Freizeit, Unterhaltung und Kultur" sowie "Bekleidung und Schuhe". Der Minimalwert liegt im Juli 2020 für "Freizeit, Unterhaltung und Kultur" bei -5,87%. Die Inflationsrate für das gesamte Jahr 2020 beträgt 0,54%.

<img src='Bilder/3-1-VPI_Inflation.png' width="1000"/>

<!-- <img src='Bilder/3-2-VPI_Deflation_Pandemie.png' width="1000"/> -->

Ab 2021 steigt die Inflationsrate an. Besonders betroffen ist die Produktgruppe "Verkehr". So liegt die Inflationsrate für "Verkehr" im Juli 2021 bei 9,04% und der Index bei 108,6. Nach dem Angriff auf die Ukraine steigt die Inflationsrate rasant an. Im Februar beträgt die Inflation 4,33%, im März nach Beginn der Invasion bereits 5,88%. Der Höhepunkt für die Inflationsrate liegt im Oktober 2022 bei 8,82%. Der Höhepunkt für den VPI liegt im Juni 2023 bei 116,8.

<img src='Bilder/3-3-VPI_index.png' width="1000"/>

Nach dem Angriff auf die Ukraine sind "Nahrungsmittel und alkoholfreie Getränke" am stärksten betroffen. Im März 2023 beträgt die Inflationsrate für diese Produktgruppe 21,20% und der VPI 131,5, d.h. "Nahrungsmittel und alkoholfreie Getränke" sind um 31,5% teurer als im Basisjahr 2020.

<img src='Bilder/3-4-VPI_Vergleich.png' width="1000"/>

Die Entwicklung des EPI verläuft ähnlich wie die des VPI, jedoch sind die Werte für die Inflationsrate deutlich höher. So liegt die Inflationsrate für August 2022 bei 45,85% und spezifisch für "Energie" bei 138,98%.

<img src='Bilder/3-5-EPI_max.png' width="1000"/>

Die am frühesten von der Inflation betroffenen Produktgruppen sind "Erdöl und Erdgas", "Kokerzeugnisse und Mineralölerzeugnisse" und "Metalle".

<img src='Bilder/3-6-EPI_Güter1.png' width="1000"/>

Im Vergleich zu anderen Produkten sind die Nahrungsmittel auffällig, da der Anstieg des VPI im Vergleich zum EPI größer war als vielleicht zu erwarten wäre. 

<img src='Bilder/3-7-EPI_Güter2.png' width="1000"/>

Der EPI für Dienstleistungen ist dagegen im Vergleich weit weniger von der Inflation betroffen. Eine Ausnahme bildet hier die Güter- und Personenbeförderung in der Schifffahrt.

<img src='Bilder/3-8-EPI_Dienstleistungen.png' width="1000"/>

### Fazit

* Sehr stark abhängig von Energiepreisen 
    * Industriegüter besonders betroffen
* Nahrungsmittel im Vergleich zu anderen Produktgruppen größere Inflation im Vergleich zum EPI
    * Weiterführende Fragen: Welche Gründe könnte es haben?
* Inflation der Energiepreise schon vor dem Angriff auf die Ukraine
    * Anstieg der globalen Ölpreise
    * Diversifikation nötig
* Energiepreise wieder stark gesunken
* VPI und EPI sind jedoch noch nicht gesunken