# Fallstudie "Tablet GmbH"

## 1. Einleitung

Dieses Notebook umfasst die Analyse zur Fallstudie "Tablet GmbH", auf der die in der Präsentation erarbeiteten Erkenntnisse basieren. Darüber hinaus beinhaltet das Notebook weitere Analysen, welche nach der Präsentation durchgeführt wurden. Bei der Durchführung der Analyse hat sich die Projektgruppe an dem in der Vorlesung erlernten Business Analytics Prozess orientiert. 

Im Folgenden wird zunächst die Vorgehensweise vorgestellt und die Fragestellungen und Ziele der Analyse aufgestellt. Anschließend werden die Datensätze eingelesen, aufbereitet und transformiert, um danach die Analysen durchzuführen. Hierbei werden für jede Analyse passende Handlungsempfehlungen abgeleitet. Abschließend wird ein Fazit mit den wichtigsten Erkenntnissen und Handlungsempfehlungen gezogen.

Zu der Projektgruppe gehören die folgenden Mitglieder:
- Daniel Novakovic (1282962)
- Silas Elbers (1282272)
- Ali Cicek (1290028)
- Vincenzo Barberi (1290817)

## 2. Vorgehensweise

Die folgende Analyse beinhaltet die folgenden Schritte:

1. Aufstellung der Fragestellungen und Ziele
2. Import der wichtigsten Bibliotheken und Konfiguration allgemeiner Einstellungen
3. Einlesen der genutzten Datensätze
4. Aufbereiten und Transformieren der Datensätze
5. Analyse: Transformieren, Visualisieren und Modellieren, um Erkenntnisse zu gewinnen und Handlungsempfehlungen aufzustellen

Bei dem fünften Schritt ist zu beachten, dass es sich hierbei um einen iterativen Prozess handelt.


## 3. Problemstellung und Ziele

Vor der Durchführung der Analyse wurden folgende Fragestellungen formuliert:

- Warum war die wirtschaftlich Entwicklung der Tablet GmbH in den letzten beiden Jahren negativ? 
- Welche Faktoren beeinflussten die Situation?
- Wie kann die wirtschaftliche Situation der Tablet GmbH verbessert werden?

Als Ergebnisse der Analyse wurden folgenden Ziele definiert:

- Gründe für die wirtschaftliche Entwicklung analysieren
- Handlungsempfehlungen aufstellen, um die wirtschaftliche Entwicklung zu verbessern

## 4. Import der genutzten Bibliotheken und Konfiguration

Um die Analyse möglichst effizient durchzuführen, wurden die Python-Bibliotheken Pandas, Seaborn, Matplotlib, Numpy, Statsmodels verwendet. Um Betriebssystemfunktionalitäten nutzen zu können, wurde außerdem das OS-Modul importiert.

In [None]:
# Importieren der benötigten Bibliotheken
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib.patches as mpatches
import numpy as np
import statsmodels.formula.api as smf
import os

In [None]:
# Zahlen in Dataframes ohne wissenschaftliche Notation und mit zwei Nachkommastellen ausgeben
pd.options.display.float_format = '{:,.2f}'.format

## 5. Einlesen der Datensätze

Da die Datensätze ursprünglich als Excel-Dateien vorlagen, wurden die Datensätze als csv-Dateien umformatiert. Hierdurch haben sich die Ladezeiten beim Einlesen der Datensätze und der Benutzung ebendieser deutlich verringert. Der Code wurde auskommentiert, da die Umformatierung bereits durchgeführt wurden. Die csv-Dateien befinden sich im `data_csv` Ordner innerhalb des Projektordners.

In [None]:
# input_folder = './data'
# output_folder = './data_csv'

# Output-Verzeichnis erstellen
# if not os.path.exists(output_folder):
#     os.makedirs(output_folder)

# Alle Dateien im Input-Verzeichnis durchgehen, die auf .xlsx oder .xls enden, und in CSV umwandeln
# for file in os.listdir(input_folder):

#     if file.endswith('.xlsx') or file.endswith('.xls'):

#         file_path = os.path.join(input_folder, file)
#         output_file_path = os.path.join(output_folder, os.path.splitext(file)[0] + '.csv')

#         df = pd.read_excel(file_path)
#         df.to_csv(output_file_path, index=False)

In [None]:
# Einlesen der CSV-Dateien
df_crm = pd.read_csv("./data_csv/CRM_data.csv")
df_downtime = pd.read_csv("./data_csv/Downtime.csv")
df_preise = pd.read_csv("./data_csv/Preise.csv")

df_a_online = pd.read_csv("./data_csv/RegionA_online.csv")
df_a_phone = pd.read_csv("./data_csv/RegionA_phone.csv")
df_a_store = pd.read_csv("./data_csv/RegionA_store.csv")

df_b_online = pd.read_csv("./data_csv/RegionB_online.csv")
df_b_phone = pd.read_csv("./data_csv/RegionB_phone.csv")
df_b_store = pd.read_csv("./data_csv/RegionB_store.csv")

df_c_online = pd.read_csv("./data_csv/RegionC_online.csv")
df_c_phone = pd.read_csv("./data_csv/RegionC_phone.csv")
df_c_store = pd.read_csv("./data_csv/RegionC_store.csv")

df_d_online = pd.read_csv("./data_csv/RegionD_online.csv")
df_d_phone = pd.read_csv("./data_csv/RegionD_phone.csv")
df_d_store = pd.read_csv("./data_csv/RegionD_store.csv")

## 6. Aufbereiten der Datensätze

### CRM-Daten:

Der CRM-Datensatz beinhaltet Informationen zu den einzelnen Transaktionen, u. a. die Transaktions-ID, Kundendaten wie z. B. der Name oder die E-Mail und die Kundenbewertung der jeweilgen Transaktion. Im Beobachtungszeitraum (01.11.2021 bis 31.10.20222) gab es insgesamt 340.000 Transaktionen. Da keine Auffälligkeiten im Datensatz gefunden werden konnten, wurde lediglich die Spalte `id` in `transaction_id` umbenannt, da dieser Name auch in den Transaktionsdatensätzen verwendet wurde. Da die Spalten `vorname`, `nachname`, `iban` und `email` wurden entfernt, da sie für die Analysen nicht verwendet wurden.

In [None]:
df_crm

In [None]:
df_crm.info()

In [None]:
# Spalte id auf Englisch umbenennen
df_crm = df_crm.rename(columns={
    'id': 'transaction_id'
})

# Spalten vorname, nachname, iban und email entfernen
df_crm = df_crm.drop(columns=['vorname', 'nachname', 'iban', 'email'], axis=1)

df_crm

### Preisdaten:

Die Preisdaten beinhalten die Preise für die Produkte Tablet Basic, Tablet Mini und Tablet Pro für die Jahre 2021 und 2022.

In [None]:
df_preise

In [None]:
df_preise.info()

Zur Aufbereitung dieses Datensatzes wurden u. a. die Werte in der Jahresspalte in das Datumsformat umformatiert und die Produktbezeichnungen vereinheitlicht.

In [None]:
# Umbenennen der Spalte Jahr in year und preis in price
df_preise = df_preise.rename(columns={"Jahr": "year",
                                      "preis": "price"})

# Entfernen von Anfuehrungszeichen
df_preise['year'] = df_preise['year'].apply(lambda x: x.strip('"'))

# Korrigieren der falschen Jahreszahlen
df_preise['year'] = df_preise['year'].replace({'20022': '2022'})

# Umwandeln der Spalte "jahr" in Datumsformat
df_preise['year'] = pd.to_datetime(df_preise['year'], format='%Y')

# Spalte "jahr" als Jahreszahl extrahieren
df_preise['year'] = df_preise['year'].dt.year

# Werte "Tablet Basics" in "Tablet Basic" ändern
df_preise['product'] = df_preise['product'].replace({'Tablet Basics': 'Tablet Basic'})

df_preise

### Downtime-Daten:

In [None]:
df_downtime

In [None]:
df_downtime.info()

In [None]:
# Erste Spalte in year umbenennen
df_downtime = df_downtime.rename(columns={"Unnamed: 0": "year"})

# Spalte year in Datumsformat umwandeln
df_downtime['year'] = pd.to_datetime(df_downtime['year'], format='%Y')

# Spalte year als Jahreszahl extrahieren
df_downtime['year'] = df_downtime['year'].dt.year

df_downtime

Damit der Downtime-Datensatz im weiteren Verlauf einfacher verwendet werden kann, wurde er so umfortmatiert, dass für jede Jahr-Region-Kombination eine eigene Zeile vorhanden ist.

In [None]:
# df_downtime umformen
df_downtime = df_downtime.melt(id_vars=['year'], var_name='region', value_name='downtime')

# Werte in der Spalte region in A bis D umbenennen
df_downtime['region'] = df_downtime['region'].replace({'Region A': 'A', 
                                                       'Region B': 'B', 
                                                       'Region C': 'C', 
                                                       'Region D': 'D'})

df_downtime

### Transaktionsdaten:

Die Transaktionsdaten beinhalten genauere Daten zu den 340.000 Transaktionen. Es gibt insgesamt 12 Datensätze für die einzelnen Regionen und die jeweils vorhandenen Verkaufskanäle.

In [None]:
# Hinzufuegen der Spalten region und channel mit den entsprechenden Werten
df_a_online = df_a_online.assign(region='A', channel='online')
df_a_phone = df_a_phone.assign(region='A', channel='phone')
df_a_store = df_a_store.assign(region='A', channel='store')

df_b_online = df_b_online.assign(region='B', channel='online')
df_b_phone = df_b_phone.assign(region='B', channel='phone')
df_b_store = df_b_store.assign(region='B', channel='store')

df_c_online = df_c_online.assign(region='C', channel='online')
df_c_phone = df_c_phone.assign(region='C', channel='phone')
df_c_store = df_c_store.assign(region='C', channel='store')

df_d_online = df_d_online.assign(region='D', channel='online')
df_d_phone = df_d_phone.assign(region='D', channel='phone')
df_d_store = df_d_store.assign(region='D', channel='store')

In [None]:
# Umbenennen der Spalte PRODUKT in product in df_b_phone
df_b_phone = df_b_phone.rename(columns={"PRODUKT": "product"})

Da alle 12 Datensätze den gleichen Aufbau haben, wurden sie in einem Datensatz zusammengefasst, damit alle Transaktionsdaten gleichzeitig verwendet werden können.

In [None]:
# Alle Regionen und Kanaele in einem Dataframe zusammenfassen
df_sales = pd.concat([df_a_online, df_a_phone, df_a_store,
                      df_b_online, df_b_phone, df_b_store, 
                      df_c_online, df_c_phone, df_c_store, 
                      df_d_online, df_d_phone, df_d_store])

In [None]:
df_sales.info()

In [None]:
# Umbenennen der Spalten Tablet Basic, Tablet Mini und Tablet Pro, kosten_basic, kosten_mini und kosten_pro
df_sales = df_sales.rename(columns={
    "Tablet Basic": "tablet_basic",
    "Tablet Mini": "tablet_mini",
    "Tablet Pro": "tablet_pro",
    "kosten_basic": "cost_basic",
    "kosten_mini": "cost_mini",
    "kosten_pro": "cost_pro"
})

In [None]:
# Umwandeln der Spalte date in Datumsformat
df_sales["date"] = pd.to_datetime(df_sales["date"])

In den Spalten `cost_basic`, `cost_mini` und `cost_pro` fehlen viele Werte, jedoch sind insgesamt 340.000 Werte vorhanden. Da die Werte in diesen Spalten die Kosten für das in der Transaktion verkaufte Produkt darstellen, wurden die NaN-Werte durch 0 ersetzt.

In [None]:
# NaN in den Spalten cost_basic, cost_mini und cost_pro durch 0 ersetzen
df_sales['cost_basic'] = df_sales['cost_basic'].fillna(0)
df_sales['cost_mini'] = df_sales['cost_mini'].fillna(0)
df_sales['cost_pro'] = df_sales['cost_pro'].fillna(0)

In der Spalte `discount` sind nur 304.911 Werte vorhanden. In dieser Analyse wurde die Annahme getroffen, dass in den Transaktionen, in denen kein Wert in der Rabatt-Spalte vorhanden ist, auch kein Rabatt gewährt wurde. Dementsprechend wurden die fehlenden Werte durch 1 ersetzt. Anschließend wurde der tatsächliche Rabatt berechnet, der in der Transaktion gewährt wurde. 

In [None]:
# NaN in discount durch 1 ersetzen
df_sales['discount'] = df_sales['discount'].fillna(1)

# Tatsaechlichen Wert des Rabatts berechnen
df_sales['discount'] = 1 - df_sales['discount']

Während der Analyse der Transaktionen ist aufgefallen, dass es 4747 Transaktionen gibt, in denen das Produkt "Tablet Basic..." angegeben wurde. In diesen Fällen wurden die Werte durch "Tablet Basic" ersetzt.

In [None]:
# Alle Werte der Spalte product und die Anzahl der Werte anzeigen
df_sales['product'].value_counts()

In [None]:
# Werte "Tablet Basic..." in "Tablet Basic" aendern
df_sales['product'] = df_sales['product'].replace({'Tablet Basic...': 'Tablet Basic'})

In [None]:
df_sales.info()

In [None]:
df_sales

## 7. Transformieren

Während der Transformation der Datensätze wurden die Datensätze `df_sales`, `df_crm` und `df_preise` zusammengefügt. Der `df_sales` Datensatz wird als Basis aller Analysen verwendet.

Im ersten Schritt wurden die Datensätze `df_sales` und `df_crm` basierend auf der `transaction_id` zusammengefügt, um die Kundenbewertung in die Analysen einbeziehen zu können.

In [None]:
# df_sales und df_crm zusammenfuegen
df_sales = pd.merge(df_sales, df_crm, left_on='transaction_id', right_on='transaction_id', how='inner')

df_sales

Aus der Spalte `date` wurden die Spalten `year`, `month` und `week` erstellt. 

In [None]:
# Neue Spalten year, month und week erstellen
df_sales = df_sales.assign(year=df_sales['date'].dt.year,
                           month=df_sales['date'].dt.month,
                           week=df_sales['date'].dt.isocalendar().week)

Nun werden die Datensätze `df_sales` und `df_preise` zusammengefügt.

In [None]:
# Neue Spalte "price" erstellen, basierend auf den Werten in der Spalte "price" in df_preise
df_sales = df_sales.merge(df_preise, on=["year", "product"], how="left")

df_sales

Im Folgenden werden die Kosten aus den Spalten `cost_basic`, `cost_mini` und `cost_pro` in der Spalte `cost` zusammengefasst und die Transaktionsdaten mit den Gesamtkosten, dem Umsatz, dem Stückgewinn und dem Gesamtgewinn angereichert.

In [None]:
# Neue Spalte "cost" erstellen
df_sales['cost'] = df_sales["cost_basic"] + df_sales["cost_mini"] + df_sales["cost_pro"]

# Neue Spalte "cost_total" erstellen
df_sales['cost_total'] = df_sales["cost"] * df_sales["amount"]

# Neue Spalte "revenue" erstellen
df_sales['revenue'] = df_sales['price'] * df_sales['amount'] * (1 - df_sales['discount'])

# Neue Spalte "profit_per_piece" erstellen
df_sales["profit_per_piece"] = (df_sales["price"] * (1 - df_sales["discount"])) - df_sales["cost"]

# Neue Spalte "profit_total" erstellen
df_sales["profit_total"] = df_sales["profit_per_piece"] * df_sales["amount"]

Abschließend werden die Transaktionen nach der Transaktionsnummer sortiert und der Index zurückgesetzt.

In [None]:
# Sortieren nach Datum
df_sales.sort_values(by=['transaction_id'], inplace=True)

# Reset der Index-Spalte
df_sales.reset_index(drop=True, inplace=True)

# Alle Spalten anzeigen lassen
pd.set_option('display.max_columns', None)

df_sales

In [None]:
df_sales.info()

## 8. Analyse der allgemeinen wirtschaftlichen Entwicklung

Bevor die Gründe für die negative wirtschaftliche Entwicklung analysiert werden, muss ermittelt werden, ob die wirtschaftliche Entwicklung wirklich so negativ war wie angenommen und ob die Befürchtung, das Unternehmen könnte in eine Krise geraten, begründet ist.

In diesem Teil der Analyse wird daher die allgemeine wirtschaftliche Entwicklung der Tablet GmbH in den letzten 12 Monaten (Anfang November 2021 bis Ende Oktober 2022) analysiert. Hierfür werden zunächst die Verkaufsmenge, der Umsatz, die Kosten und der Gewinn je Monat summiert und anschließend visualisiert, um einen möglichen Trend ableiten zu können. Zusätzlich zur gesamten Verkaufsmenge wird auch die durchschnittliche Verkaufsmenge je Transaktion analysiert. Außerdem wird die Entwicklung der Umsatzrendite analysiert, um das Verhältnis des Gewinns zum Umsatz genauer zu untersuchen.

### Entwicklung der Kennzahlen Verkaufsmenge, Umsatz, Kosten, Gewinn und Umsatzrendite

Im ersten Schritt werden die Kennzahlen monatlich aggregiert.

In [None]:
# df_sales nach Jahr und Monat gruppieren und die Summe der Spalten der Verkaufsmenge, des Umsatzes, der Kosten und des Profits berechnen
df_development = df_sales.groupby(['year', 'month']).agg({"amount" : "sum",
                                                          "revenue" : "sum",
                                                          "cost_total" : "sum",
                                                          "profit_total" : "sum"})

# Berechnung der Umsatzrendite
df_development['profit_margin'] = df_development['profit_total'] / df_development['revenue'] * 100

# Reset der Index-Spalte, um die Spalten "year" und "month" zu erhalten
df_development.reset_index(inplace=True)

df_development

Anschließend werden die Entwicklungen als Liniendiagramme visualisiert, um mögliche Trends erkennen zu können.

In [None]:
# Visualisierung der Entwicklung des Umsatzes, der Kosten und des Profits
fig, ax = plt.subplots(figsize=(10, 6))

# Daten plotten
ax.plot(df_development['year'].astype(str) + '-' + df_development['month'].astype(str), df_development['revenue'])
ax.plot(df_development['year'].astype(str) + '-' + df_development['month'].astype(str), df_development['cost_total'])
ax.plot(df_development['year'].astype(str) + '-' + df_development['month'].astype(str), df_development['profit_total'])

# Grid hinzufuegen
ax.grid(color='lightgrey', linestyle='-', linewidth=0.5)

# Achsenbeschriftung und Titel hinzufuegen
ax.set_xlabel('Jahr-Monat', fontsize=12)
ax.set_ylabel('in €', fontsize=12)
ax.set_title('Entwicklung des Umsatzes, der Kosten und des Profits')

# Tausendertrennzeichen hinzufuegen
ax.get_yaxis().set_major_formatter(plt.FuncFormatter(lambda x, loc: "{:,}".format(int(x))))

# X-Achsenbeschriftung drehen
plt.xticks(rotation=45)

# Legende hinzufuegen
ax.legend(['Umsatz', 'Kosten', 'Profit'])

# Diagramm anzeigen
plt.tight_layout()
plt.show()

In [None]:
# Visualisierung der Entwicklung der Umsatzrentabilitaet
fig, ax = plt.subplots(figsize=(10, 6))

# Daten plotten
ax.plot(df_development['year'].astype(str) + '-' + df_development['month'].astype(str), df_development['profit_margin'])

# Grid hinzufuegen
ax.grid(color='lightgrey', linestyle='-', linewidth=0.5)

# Achsenbeschriftung und Titel hinzufuegen
ax.set_xlabel('Jahr-Monat', fontsize=12)
ax.set_ylabel('in %', fontsize=12)
ax.set_title('Entwicklung der Umsatzrentabilität', fontsize=14)

# X-Achsenbeschriftung drehen
plt.xticks(rotation=45)

# Diagramm anzeigen
plt.tight_layout()
plt.show()

In [None]:
# Visualisierung der Entwicklung der Verkaufsmenge
fig, ax = plt.subplots(figsize=(10, 6))

# Daten plotten
ax.plot(df_development['year'].astype(str) + '-' + df_development['month'].astype(str), df_development['amount'])

# Grid hinzufuegen
ax.grid(color='lightgrey', linestyle='-', linewidth=0.5)

# Achsenbeschriftung und Titel hinzufuegen
ax.set_xlabel('Jahr-Monat', fontsize=12)
ax.set_ylabel('in Stück', fontsize=12)
ax.set_title('Entwicklung der Verkaufsmenge')

# Tausendertrennzeichen hinzufuegen
ax.get_yaxis().set_major_formatter(plt.FuncFormatter(lambda x, loc: "{:,}".format(int(x))))

# X-Achsenbeschriftung drehen
plt.xticks(rotation=45)

# Diagramm anzeigen
plt.tight_layout()
plt.show()

### Entwicklung der durchschnittlichen Verkaufsmenge je Transaktion

In [None]:
# Durchschnittliche Anzahl der verkauften Produkte pro Transaktion
avg_menge_pro_monat = df_sales.groupby(['year', 'month']).agg({"amount" : "mean"})
avg_menge_pro_monat.reset_index(inplace=True)
avg_menge_pro_monat

In [None]:
# Visualisierung der Entwicklung der durchschnittlichen Anzahl der verkauften Produkte pro Transaktion
fig, ax = plt.subplots(figsize=(10, 6))

# Daten plotten
ax.bar(avg_menge_pro_monat['year'].astype(str) + '-' + avg_menge_pro_monat['month'].astype(str), avg_menge_pro_monat['amount'])

# Grid hinzufuegen
ax.grid(color='lightgrey', linestyle='-', linewidth=0.5)

# Achsenbeschriftung und Titel hinzufuegen
ax.set_xlabel('Jahr-Monat', fontsize=12)
ax.set_ylabel('in Stück', fontsize=12)
ax.set_title('Entwicklung der durchschnittlichen Anzahl der verkauften Produkte pro Transaktion')

# X-Achsenbeschriftung drehen
plt.xticks(rotation=45)

# Diagramm anzeigen
plt.tight_layout()
plt.show()

### Prozentuelle Veränderung vom Anfang bis zum Ende des Beobachtungszeitraums (Anfang November 2021 - Ende Oktober 2022)

Bei der Berechnung der prozentuellen Veränderung wurden zwei Zeitpunkte miteinander verglichen: der erste Zeitpunkt (01.11.2021) und der letzte Zeitpunkt im Beobachtungszeitraum (31.10.2022).

In [None]:
# Neues Dataframe mit KPIs erstellen
df_kpi = pd.DataFrame(columns=['kpi', 'change_in_percent'])

# Liste mit den KPIs erstellen
kpi = ['amount', 'revenue', 'cost_total', 'profit_total', 'profit_margin']

# Berechnung der Veraenderung in Prozent
for i in kpi:
    change = (df_development[i].iloc[-1] / df_development[i].iloc[0] - 1) * 100
    df_kpi.loc[len(df_kpi)] = [i, change]

df_kpi

In [None]:
# Visualisierung der Veraenderung der KPIs als Saeulendiagramm
fig, ax = plt.subplots(figsize=(10, 6))

# Daten plotten
bars = ax.bar(df_kpi['kpi'], df_kpi['change_in_percent'])

# Achsenbeschriftung und Titel hinzufuegen
ax.set_title('Veränderung der KPIs von Oktober 2021 bis September 2022')
ax.set_xlabel('KPI', fontsize=12)
ax.set_ylabel('in %', fontsize=12)

# Horizontales Grid hinzufuegen
ax.yaxis.grid(color='lightgrey', linestyle='-', linewidth=0.5)

# Linie bei 0 hinzufuegen
ax.axhline(0, color='black', linewidth=0.5)

# Farbe der Saeulen anpassen
ax.patches[0].set_color('green')
ax.patches[1].set_color('green')
ax.patches[2].set_color('red')
ax.patches[3].set_color('red')
ax.patches[4].set_color('red')

# Beschriftung der Saeulen hinzufuegen
ax.bar_label(bars, fmt='%.2f%%', padding=5, fontsize=16)

# y-Achsenskala anpassen
ax.set_ylim(ymax=250)
ax.set_ylim(ymin=-100)

# X-Achsenbeschriftung
ax.xaxis.set_ticks(np.arange(5))
ax.set_xticklabels(['Verkaufsmenge', 'Umsatz', 'Kosten', 'Profit', 'Umsatzrendite'])

# Diagramm anzeigen
plt.tight_layout()
plt.show()

**Erkenntnisse der Analyse:**

Die Betrachtung der allgemeinen wirtschaftlichen Entwicklung der Tablet GmbH in den letzten 12 Monaten zeigt sowohl positive als auch negative Trends auf.

Auf der einen Seite wurde die monatliche Verkaufsmenge von rund 61.000 Stück im Oktober 2021 um 20 % auf fast 74.000 Stück im November 2022 gesteigert. Einen ähnlichen positiven Trend kann man in der Umsatzentwicklung erkennen. Hier ist der Umsatz im Beobachtungszeitraum um rund 60 % gestiegen. Im Hinblick auf die durchschnittliche Verkaufsmenge je Transaktion ist jedoch ein leichter Abwärtstrend zu beobachten.

Auf der anderen Seite ist ein drastischer Negativtrend in der Kosten-, Profit- und Umsatzrenditenentwicklung erkennbar. Die Kosten sind im Verlauf der letzten 12 Monate mit einem Zuwachs von 186 % geradezu explodiert, wodurch der Gewinn um rund 42 % gesunken ist. Dementsprechend ist auch die Umsatzrendite von ca. 55 % im Oktober 2021 auf ca. 19 % im November 2022 abgestürzt, was einer Senkung von ca. 64 % entspricht.

Zusammmengefasst lässt sich also sagen, dass die wirtschaftliche Entwicklung der Tablet GmbH definitiv negativ war und dass es trotz Wachstum ein Gewinnrückgang zu verzeichnen ist. Die folgenden Analysen untersuchen nun die Gründe für diese Entwicklung, um daraufhin geeignete Handlungsempfehlungen zu formulieren.


# <span style="color:red">Ende Analyse Vince. Die folgenden Grafiken habe ich aus dem Notebook Vince_Analysen_neu eingefügt, da wir sie in der Präsi verwendet haben.</span>

# 9. Analyse der Produktperformance

In [None]:
pd.options.display.float_format = '{:,.2f}'.format
df_unit_cost = df_sales.groupby('product').agg({'amount': np.sum, 'cost_total' : np.sum})
df_unit_cost['cost_per_unit'] = df_unit_cost['cost_total'] / df_unit_cost['amount']
df_unit_cost.reset_index()

In [None]:
df_sales_basic_channel = df_sales[df_sales['product'] == 'Tablet Basic'].groupby('channel').agg({'amount': 'sum', 'revenue': 'sum', 'cost_total': 'sum', 'profit_total': 'sum'})
df_sales_basic_region = df_sales[df_sales['product'] == 'Tablet Basic'].groupby('region').agg({'amount': 'sum', 'revenue': 'sum', 'cost_total': 'sum', 'profit_total': 'sum'})

df_sales_basic_channel.reset_index(inplace=True)
df_sales_basic_region.reset_index(inplace=True)

df_sales_mini_channel = df_sales[df_sales['product'] == 'Tablet Mini'].groupby('channel').agg({'amount': 'sum', 'revenue': 'sum', 'cost_total': 'sum', 'profit_total': 'sum'})
df_sales_mini_region = df_sales[df_sales['product'] == 'Tablet Mini'].groupby('region').agg({'amount': 'sum', 'revenue': 'sum', 'cost_total': 'sum', 'profit_total': 'sum'})

df_sales_mini_channel.reset_index(inplace=True)
df_sales_mini_region.reset_index(inplace=True)

df_sales_pro_channel = df_sales[df_sales['product'] == 'Tablet Pro'].groupby('channel').agg({'amount': 'sum', 'revenue': 'sum', 'cost_total': 'sum', 'profit_total': 'sum'})
df_sales_pro_region = df_sales[df_sales['product'] == 'Tablet Pro'].groupby('region').agg({'amount': 'sum', 'revenue': 'sum', 'cost_total': 'sum', 'profit_total': 'sum'})

df_sales_pro_channel.reset_index(inplace=True)
df_sales_pro_region.reset_index(inplace=True)

In [None]:
plt.figure(figsize=(10, 6))
sns.barplot(data=df_sales_basic_channel, x='channel', y='cost_total')
plt.title('Total cost per channel tablet basic')
plt.xlabel('Channel')
plt.ylabel('Cost')
plt.show()

plt.figure(figsize=(10, 6))
sns.barplot(data=df_sales_mini_channel, x='channel', y='cost_total')
plt.title('Total cost per channel tablet mini')
plt.xlabel('Channel')
plt.ylabel('Cost')
plt.show()

plt.figure(figsize=(10, 6))
sns.barplot(data=df_sales_pro_channel, x='channel', y='cost_total')
plt.title('Total cost per channel tablet pro')
plt.xlabel('Channel')
plt.ylabel('Cost')
plt.show()

plt.figure(figsize=(10, 6))
sns.barplot(data=df_sales_basic_region, x='region', y='cost_total')
plt.title('Total cost per region tablet basic')
plt.xlabel('Region')
plt.ylabel('Cost')
plt.show()

plt.figure(figsize=(10, 6))
sns.barplot(data=df_sales_mini_region, x='region', y='cost_total')
plt.title('Total cost per region tablet mini')
plt.xlabel('Region')
plt.ylabel('Cost')
plt.show()

plt.figure(figsize=(10, 6))
sns.barplot(data=df_sales_pro_region, x='region', y='cost_total')
plt.title('Total cost per region tablet pro')
plt.xlabel('Region')
plt.ylabel('Cost')
plt.show()

In [None]:
cost_per_region_product_channel = df_sales.groupby(['region', 'product', 'channel'])['cost_total'].sum()/1_000_000
cost_per_region_product_channel = cost_per_region_product_channel.reset_index()
cost_per_region_product_channel

In [None]:
profit_per_region_product_channel = df_sales.groupby(['region', 'product', 'channel'])['profit_total'].sum()/1_000_000
profit_per_region_product_channel = profit_per_region_product_channel.reset_index()
profit_per_region_product_channel = profit_per_region_product_channel.replace({'product': {'Tablet Basic': 'Basic', 'Tablet Mini': 'Mini', 'Tablet Pro': 'Pro'}})
profit_per_region_product_channel

In [None]:
region_costs = cost_per_region_product_channel['region'].unique()

# Iteration über die einzelnen Regionen
for region_cost in region_costs:
    # Filtern der Daten für die aktuelle Region
    region_data = cost_per_region_product_channel[cost_per_region_product_channel['region'] == region_cost]
    
    # Diagramm erstellen
    fig, ax = plt.subplots()
    
    # Erstellen der x-Achsenbeschriftungen für das Säulendiagramm
    products = region_data['product']
    channels = region_data['channel']
    labels = [f'{product} - {channel}' for product, channel in zip(products, channels)]
    
    # Extrahieren der Gewinne
    costs = region_data['cost_total']
    
    # Festlegen der Farben für Basic, Mini und Pro
    colors = ['r' if product == 'Tablet Basic' else 'b' if product == 'Tablet Mini' else 'g' for product in products]
    
    # Erstellen des Säulendiagramms mit den entsprechenden Farben
    plt.bar(labels, costs, color=colors)
    
    # Achsentitel und Diagrammtitel
    
    plt.xlabel('Produkt und Kanal', size = 15)
    plt.ylabel('Kosten in Mio', size = 15)
    plt.title(f'Kosten der Region {region_cost}', size = 20)
    
  
    # Anpassung des Layouts und Anzeigen des Diagramms
    plt.tight_layout()
    
    # Gitterlinien aktivieren
    plt.grid(True)

    # Gitter in den Hintergrund legen
    ax.set_axisbelow(True)
     
    # Anpassung x-Achse und y-Achse
    import math
    max = math.ceil(costs.max() / 10.0) * 10 + 10
    ticks = max / 10
    plt.xticks(rotation = 65)
    plt.yticks(np.arange(0, max, ticks))
    plt.show()

In [None]:
from matplotlib.patches import Patch

region_costs = profit_per_region_product_channel['region'].unique()

# Iteration über die einzelnen Regionen
for region_cost in region_costs:
    # Filtern der Daten für die aktuelle Region
    region_data = profit_per_region_product_channel[profit_per_region_product_channel['region'] == region_cost]
    
    # Diagramm erstellen
    fig, ax = plt.subplots(figsize=(12, 6))
    
    # Erstellen der x-Achsenbeschriftungen für das Säulendiagramm
    products = region_data['product']
    channels = region_data['channel']
    labels = [f'{product} - {channel}' for product, channel in zip(products, channels)]
    
    # Extrahieren der Gewinne
    profits = region_data['profit_total']
    
    # Festlegen der Farben für Basic, Mini und Pro
    colors = ['tab:orange' if product == 'Basic' else 'b' if product == 'Mini' else 'g' for product in products]
    
    # Erstellen des Säulendiagramms mit den entsprechenden Farben
    plt.bar(labels, profits, color=colors)
    
    # Achsentitel und Diagrammtitel
    plt.xlabel('Produkt und Kanal', size = 15)
    plt.ylabel('Profit in Mio. €', size = 15)
    plt.title(f'Profit pro Produkt & Kanal - Region {region_cost}', size = 20)
    
    # Anpassung des Layouts und Anzeigen des Diagramms
    plt.tight_layout()
    
    # Gitterlinien aktivieren
    plt.grid(True)

    # Legende anzeigen mit den entsprechenden Farben
    legend_elements = [Patch(facecolor='tab:orange', label='Basic'),
                          Patch(facecolor='b', label='Mini'),
                          Patch(facecolor='g', label='Pro')]
    plt.legend(handles=legend_elements, loc='upper right', fontsize='large')

    # Gitter in den Hintergrund legen
    ax.set_axisbelow(True)
     
    # Anpassung x-Achse und y-Achse
    import math
    #max = math.ceil(profits.max() / 10.0) * 10 + 5
    max = 22.5
    ticks = 2.5
    plt.xticks(rotation = 45)
    plt.yticks(np.arange(0, max, ticks))
    plt.show()

In [None]:
# Transaktionen mit Verlust
df_sales_negative_profit = df_sales[df_sales['profit_total'] < 0]
df_sales_negative_profit.head

In [None]:
# Welche Produkte wurden mit einem Verlust verkauft?
df_sales_negative_profit['product'].unique()

In [None]:
# Summe des Verlusts
df_sales_negative_profit['profit_total'].sum()

In [None]:
# In welchen Verkaufskanälen und Regionen wurden die Produkte mit negativem Gewinn verkauft und wie oft?
df_sales_negative_profit.groupby(['region', 'channel']).agg({'transaction_id': 'count', 'profit_total': 'sum'})

In [None]:
# Group by channel, product and sum up amount
sales_per_product_by_channel = df_sales.groupby(['channel', 'product']).agg({'amount': 'sum'})
sales_per_product_by_channel = sales_per_product_by_channel.reset_index()
sales_per_product_by_channel

In [None]:
plt.figure(figsize=(10, 6))

sns.barplot(data=sales_per_product_by_channel, x='channel', y='amount', hue='product')

plt.title('Amount sold per product, grouped by channel')
plt.xlabel('Channel')
plt.ylabel('Amount sold')
plt.show()

In [None]:
# Group by region, product and sum up amount
sales_per_product_by_region = df_sales.groupby(['region', 'product']).agg({'amount': 'sum'})
sales_per_product_by_region = sales_per_product_by_region.reset_index()
sales_per_product_by_region

In [None]:
plt.figure(figsize=(10, 6))

sns.barplot(data=sales_per_product_by_region, x='region', y='amount', hue='product')

plt.title('Amount sold per product, grouped by region')
plt.xlabel('Region')
plt.ylabel('Amount sold')
plt.show()

# Umsatzanteile nach Regionen

In [None]:
# Anteil am Umsatz nach Region als Kreisdiagramm
df_sales_per_region = df_sales.groupby(['region'])['revenue'].sum()

# Kreisdiagramm
plt.pie(df_sales_per_region, labels=df_sales_per_region.index, autopct='%1.1f%%', counterclock=False, startangle=90)
plt.title('Umsatzanteile nach Regionen')

plt.tight_layout()
plt.show()

# Umsatzanteile nach Verkaufskanälen

In [None]:
# Anteil am Umsatz nach Kanal als Kreisdiagramm
df_sales_per_channel = df_sales.groupby(['channel'])['revenue'].sum()

# Kreisdiagramm
plt.pie(df_sales_per_channel, labels=df_sales_per_channel.index, autopct='%1.1f%%', counterclock=False, startangle=90)
plt.title('Umsatzanteile nach Kanälen')

plt.tight_layout()
plt.show()

# Umsatzanteile nach Produkten

In [None]:
# Anteil am Umsatz nach Produkt als Kreisdiagramm
df_sales_per_product = df_sales.groupby(['product'])['revenue'].sum()

# Kreisdiagramm
plt.pie(df_sales_per_product, labels=df_sales_per_product.index, autopct='%1.1f%%', counterclock=False, startangle=90)
plt.title('Umsatzanteile nach Produkten')

plt.tight_layout()
plt.show()

# Downtime-Daten als Säulendiagramm

# <span style="color:red">Alles hiernach gehört zu Silas Analyse, daher habe ich es stehen lassen.</span>

### Analyse der Kunden Bewertungen und der Verkauften Geräte nach Produkt und Zeit aufgeschlüsselt

In [None]:
df_sales.groupby(["product","year", "month"]).agg({"customer_rating" : {"mean", "median", "min", "max"}, "amount" : "count"}).round(2)

**Anlyse der Kundenbewertungen:**

Was man aus der Tabelle schon ablesen kann ist das die Bewertungen der Kunden für das Tablet Mini und das Tablet Basic schlechter werden und für das Pro besser werden. Gleichzeitig bewegen sich die Verkaufszahlen in dieselbe Richtung wie die Bewertungen scheinen aber nicht direkt im Zusammenhang zu stehen.

## Vetriebskanäle

In [None]:
df_sales_online = df_sales[df_sales['channel'] == 'online']
df_sales_phone = df_sales[df_sales['channel'] == 'phone']
df_sales_store = df_sales[df_sales['channel'] == 'store']

### Verkaufte Geräte pro Verkaufskanal

In [None]:
# Group by month and count sales
df_sales_online_monthly = df_sales_online.groupby(df_sales_online['date'].dt.to_period('M'))['amount'].sum().reset_index()
df_sales_phone_monthly = df_sales_phone.groupby(df_sales_phone['date'].dt.to_period('M'))['amount'].sum().reset_index()
df_sales_store_monthly = df_sales_store.groupby(df_sales_store['date'].dt.to_period('M'))['amount'].sum().reset_index()

df_sales_online_monthly['date'] = df_sales_online_monthly['date'].dt.to_timestamp()
df_sales_phone_monthly['date'] = df_sales_phone_monthly['date'].dt.to_timestamp()
df_sales_store_monthly['date'] = df_sales_store_monthly['date'].dt.to_timestamp()

In [None]:
# Set the size of the plot
plt.figure(figsize=(12, 6))

# Extract year and month from the 'date' column
df_sales_online_monthly['year_month'] = df_sales_online_monthly['date'].dt.strftime('%Y-%m')

# Create a list of unique year_month values for x-axis
x_labels = df_sales_online_monthly['year_month'].unique()
x = np.arange(len(df_sales_online_monthly['date']))

# Define the width for each bar
bar_width = 0.2

# Create the bar plots for each sales channel
plt.bar(x - bar_width, df_sales_online_monthly['amount'], width=bar_width, label='online', color='tab:orange', alpha=0.7)
plt.bar(x, df_sales_phone_monthly['amount'], width=bar_width, label='phone', color='b', alpha=0.7)
plt.bar(x + bar_width, df_sales_store_monthly['amount'], width=bar_width, label='store', color='g', alpha=0.7)

# Enhance the plot with titles and labels
plt.title('Verkaufsmenge pro Monat nach Verkaufskanälen')
plt.xlabel('Jahr-Monat')
plt.ylabel('Menge in Stück')

# Set x-axis ticks and labels to be the dates
plt.xticks(x, x_labels, rotation=45)

# Add legend
plt.legend(loc='upper left')

# Show the plot
plt.tight_layout()
plt.show()

**Analyse der Absatzmengen pro Vertriebskanäle:**

Wir sehen stark fallende Absatzzahlen für den Vertriebskanal online, einen leichten anstieg im phone Vertriebskanal und einen starken anstieg im store Vertriebskanal im Beobachtungszeitraum. Das starke Wachstum des store Geschäfts sorgt also dafür das wir trotzdem einen Anstieg bei den Absatzzahlen verzeichnen können. Es gilt jetzt zu analysieren warum die Vertriebskanäle sich so verhalten. 

### Verkaufte Produkte pro Verkaufskanal

Ein Grund für die unterschiedlichen Trends der in den einzelnen Vertriebskanälen könnte daran liegen das sie unterschiedlich stark von den einzelnen Produkttrends beeinflusst werden. Wir Analysieren also im folgenden welche Produkte im welchen Vertriebskanal abgesetzt werden und ob die Trends der Absatzmenge der einzelnen Produkte konstant ist über alle Vertriebskanäle.

#### Online

In [None]:
df_sales_online_basic = df_sales_online[df_sales_online['product'] == 'Tablet Basic']
df_sales_online_mini = df_sales_online[df_sales_online['product'] == 'Tablet Mini']
df_sales_online_pro = df_sales_online[df_sales_online['product'] == 'Tablet Pro']

# Group by month and count sales
df_sales_online_basic_monthly = df_sales_online_basic.groupby(df_sales_online_basic['date'].dt.to_period('M'))['amount'].sum().reset_index()
df_sales_online_mini_monthly = df_sales_online_mini.groupby(df_sales_online_mini['date'].dt.to_period('M'))['amount'].sum().reset_index()
df_sales_online_pro_monthly = df_sales_online_pro.groupby(df_sales_online_pro['date'].dt.to_period('M'))['amount'].sum().reset_index()

df_sales_online_basic_monthly['date'] = df_sales_online_basic_monthly['date'].dt.to_timestamp()
df_sales_online_mini_monthly['date'] = df_sales_online_mini_monthly['date'].dt.to_timestamp()
df_sales_online_pro_monthly['date'] = df_sales_online_pro_monthly['date'].dt.to_timestamp()

#### Phone

In [None]:
df_sales_phone_basic = df_sales_phone[df_sales_phone['product'] == 'Tablet Basic']
df_sales_phone_mini = df_sales_phone[df_sales_phone['product'] == 'Tablet Mini']
df_sales_phone_pro = df_sales_phone[df_sales_phone['product'] == 'Tablet Pro']

# Group by month and count sales
df_sales_phone_basic_monthly = df_sales_phone_basic.groupby(df_sales_phone_basic['date'].dt.to_period('M'))['amount'].sum().reset_index()
df_sales_phone_mini_monthly = df_sales_phone_mini.groupby(df_sales_phone_mini['date'].dt.to_period('M'))['amount'].sum().reset_index()
df_sales_phone_pro_monthly = df_sales_phone_pro.groupby(df_sales_phone_pro['date'].dt.to_period('M'))['amount'].sum().reset_index()

df_sales_phone_basic_monthly['date'] = df_sales_phone_basic_monthly['date'].dt.to_timestamp()
df_sales_phone_mini_monthly['date'] = df_sales_phone_mini_monthly['date'].dt.to_timestamp()
df_sales_phone_pro_monthly['date'] = df_sales_phone_pro_monthly['date'].dt.to_timestamp()

#### Store

In [None]:
df_sales_store_basic = df_sales_store[df_sales_store['product'] == 'Tablet Basic']
df_sales_store_mini = df_sales_store[df_sales_store['product'] == 'Tablet Mini']
df_sales_store_pro = df_sales_store[df_sales_store['product'] == 'Tablet Pro']

# Group by month and count sales
df_sales_store_basic_monthly = df_sales_store_basic.groupby(df_sales_store_basic['date'].dt.to_period('M'))['amount'].sum().reset_index()
df_sales_store_mini_monthly = df_sales_store_mini.groupby(df_sales_store_mini['date'].dt.to_period('M'))['amount'].sum().reset_index()
df_sales_store_pro_monthly = df_sales_store_pro.groupby(df_sales_store_pro['date'].dt.to_period('M'))['amount'].sum().reset_index()

df_sales_store_basic_monthly['date'] = df_sales_store_basic_monthly['date'].dt.to_timestamp()
df_sales_store_mini_monthly['date'] = df_sales_store_mini_monthly['date'].dt.to_timestamp()
df_sales_store_pro_monthly['date'] = df_sales_store_pro_monthly['date'].dt.to_timestamp()

#### Create Graphs

In [None]:
# Set the size of the plot
plt.figure(figsize=(5, 5))

# Extract year and month from the 'date' column
df_sales_online_monthly['year_month'] = df_sales_online_monthly['date'].dt.strftime('%Y-%m')

# Create a list of unique year_month values for x-axis
x_labels = df_sales_online_monthly['year_month'].unique()
x = np.arange(len(df_sales_online_monthly['date']))

# Define the width for each bar
bar_width = 0.2

# Create the bar plots for each sales channel
plt.bar(x - bar_width, df_sales_online_basic_monthly['amount'], width=bar_width, label='Basic', color='b', alpha=0.7)
plt.bar(x, df_sales_online_mini_monthly['amount'], width=bar_width, label='Mini', color='g', alpha=0.7)
plt.bar(x + bar_width, df_sales_online_pro_monthly['amount'], width=bar_width, label='Pro', color='tab:orange', alpha=0.7)

# Enhance the plot with titles and labels
plt.title('Verkaufsmenge pro Produkt - Online')
plt.xlabel('Jahr-Monat')
plt.ylabel('Menge in Stück')

# Set x-axis ticks and labels to be the dates
plt.xticks(x, x_labels, rotation=45)

# Add legend
plt.legend(loc='upper right')

# Show the plot
plt.tight_layout()
plt.show()

# Set the size of the plot
plt.figure(figsize=(5, 5))

# Extract year and month from the 'date' column
df_sales_online_monthly['year_month'] = df_sales_online_monthly['date'].dt.strftime('%Y-%m')

# Create a list of unique year_month values for x-axis
x_labels = df_sales_online_monthly['year_month'].unique()
x = np.arange(len(df_sales_online_monthly['date']))

# Define the width for each bar
bar_width = 0.2

# Create the bar plots for each sales channel
plt.bar(x - bar_width, df_sales_phone_basic_monthly['amount'], width=bar_width, label='Basic', color='b', alpha=0.7)
plt.bar(x, df_sales_phone_mini_monthly['amount'], width=bar_width, label='Mini', color='g', alpha=0.7)
plt.bar(x + bar_width, df_sales_phone_pro_monthly['amount'], width=bar_width, label='Pro', color='tab:orange', alpha=0.7)

# Enhance the plot with titles and labels
plt.title('Verkaufsmenge pro Produkt - Phone')
plt.xlabel('Jahr-Monat')
plt.ylabel('Menge in Stück')

# Set x-axis ticks and labels to be the dates
plt.xticks(x, x_labels, rotation=45)

# Add legend
plt.legend(loc='upper right')

# Show the plot
plt.tight_layout()
plt.show()

# Set the size of the plot
plt.figure(figsize=(5, 5))

# Extract year and month from the 'date' column
df_sales_online_monthly['year_month'] = df_sales_online_monthly['date'].dt.strftime('%Y-%m')

# Create a list of unique year_month values for x-axis
x_labels = df_sales_online_monthly['year_month'].unique()
x = np.arange(len(df_sales_online_monthly['date']))

# Define the width for each bar
bar_width = 0.2

# Create the bar plots for each sales channel
plt.bar(x - bar_width, df_sales_store_basic_monthly['amount'], width=bar_width, label='Basic', color='b', alpha=0.7)
plt.bar(x, df_sales_store_mini_monthly['amount'], width=bar_width, label='Mini', color='g', alpha=0.7)
plt.bar(x + bar_width, df_sales_store_pro_monthly['amount'], width=bar_width, label='Pro', color='tab:orange', alpha=0.7)

# Enhance the plot with titles and labels
plt.title('Verkaufsmenge pro Produkt - Store')
plt.xlabel('Jahr-Monat')
plt.ylabel('Menge in Stück')

# Set x-axis ticks and labels to be the dates
plt.xticks(x, x_labels, rotation=45)

# Add legend
plt.legend(loc='upper right')

# Show the plot
plt.tight_layout()
plt.show()

Was wir sehen können ist das die einzelnen Produkte in alle Vertriebskanälen denselben Trend aufweisen. Doch ist ihre Absatzmengen komplett unterschiedlich weswegen z.B. der online Vertriebskanal eine sinkende Absatzmenge hat da es deutlich vom Tablet Basic dominiert wird und dieses eine starken Absatz Rückgang verzeichnet. 

#### Aufteilung der Verkaufkänäle in Regionen

Um sicherzustellen, das die Analyse oben nicht durch die Regionen beeinflusst wurde nehmen wir nun noch die Regionen mit in die Analyse auf. Vielleicht sind die Vertriebskanäle ja sehr unterschiedlich stark in jeder Region.

In [None]:
# Annahme: Ihre DataFrame 'df_sales' enthält Spalten 'date', 'region', 'amount'

# Extrahieren Sie den Monat und das Jahr aus der 'date'-Spalte
df_sales['month_year'] = df_sales['date'].dt.strftime('%Y-%m')

# Gruppieren Sie Ihre Daten nach 'month_year' und 'region' und summieren Sie die Werte
grouped_data = df_sales.groupby(['month_year', 'channel', 'region'])['amount'].sum().unstack(fill_value=0)

# Set the size of the plot
plt.figure(figsize=(12, 6))

# Create the x-axis values for each date
x_labels = grouped_data.index
x = np.arange(len(x_labels))

# Define the width for each bar
bar_width = 0.35

# Create the stacked bar plots for each region
bottom = np.zeros(len(x_labels))
regions = grouped_data.columns

for region in regions:
    plt.bar(x, grouped_data[region], width=bar_width, label=region, alpha=0.7, bottom=bottom)
    bottom += grouped_data[region]

# Enhance the plot with titles and labels
plt.title('Verkaufte Geräte pro Vertriebskanal und Region')
plt.xlabel('Date')
plt.ylabel('Amount')

# Set x-axis ticks and labels
plt.xticks(x, x_labels, rotation=90)

# Add legend
plt.legend(loc='upper left', title='Region')

# Show the plot
plt.tight_layout()
plt.show()

**Analyse der Verkaufte Geräte pro Vertriebskanal und Region**

Auch wenn die Statistiken aufgrund der vielen Parameter etwas schwer zu lesen ist lässt sich kein besonderer Zusammenhang zwischen dem vorher Analysieren Ergebnis und den Regionen feststellen.

## Rabatte

Wir schauen uns die Rabatte an und schauen ob wir unseren Umsatz vielleicht durch größere Rabatte senken und Analysieren welche Faktoren bestimmen welcher Kunde einen Rabatt bekommt und wie es sich im Beobachtungszeitraum entwickelt hat.

#### Durchschnittliche Rabatte pro Vertriebskanal in %

In [None]:
# Group by month and count sales
df_discounts_monthly = df_sales.groupby(df_sales['date'].dt.to_period('M'))['discount'].mean().reset_index()
df_discounts_online_monthly = df_sales_online.groupby(df_sales_online['date'].dt.to_period('M'))['discount'].mean().reset_index()
df_discounts_phone_monthly = df_sales_phone.groupby(df_sales_phone['date'].dt.to_period('M'))['discount'].mean().reset_index()
df_discounts_store_monthly = df_sales_store.groupby(df_sales_store['date'].dt.to_period('M'))['discount'].mean().reset_index()

df_discounts_monthly['date'] = df_discounts_monthly['date'].dt.to_timestamp()
df_discounts_online_monthly['date'] = df_discounts_online_monthly['date'].dt.to_timestamp()
df_discounts_phone_monthly['date'] = df_discounts_phone_monthly['date'].dt.to_timestamp()
df_discounts_store_monthly['date'] = df_discounts_store_monthly['date'].dt.to_timestamp()

In [None]:
# Set the size of the plot
plt.figure(figsize=(12, 6))

# Extract year and month from the 'date' column
df_discounts_online_monthly['year_month'] = df_discounts_online_monthly['date'].dt.strftime('%Y-%m')

# Create a list of unique year_month values for x-axis
x_labels = df_discounts_online_monthly['year_month'].unique()
x = np.arange(len(df_discounts_online_monthly['date']))

# Define the width for each bar
bar_width = 0.2

# Create the bar plots for each sales channel
plt.bar(x - bar_width, (df_discounts_online_monthly['discount']), width=bar_width, label='Online', color='b', alpha=0.7)
plt.bar(x, (df_discounts_phone_monthly['discount']), width=bar_width, label='Phone', color='g', alpha=0.7)
plt.bar(x + bar_width, (df_discounts_store_monthly['discount']), width=bar_width, label='Store', color='tab:orange', alpha=0.7)

# Plot the line plot using data from df_discounts_monthly
plt.plot(x, (df_discounts_monthly['discount']), label='ø Rabatt', color='purple', linewidth=2, marker='o')

# Enhance the plot with titles and labels
plt.title('Rabatte pro Vertriebskanal')
plt.xlabel('Monat')
plt.ylabel('Rabatt in %')

# Set x-axis ticks and labels to be the dates
plt.xticks(x, x_labels, rotation=45)

# Add legend
plt.legend(loc='upper right')

# Show the plot
plt.tight_layout()
plt.show()

**Analyseergebnis der Rabatte pro Vertriebskanal**

Wir sehen das am meisten Rabatt im online Vertriebskanal gegeben wird und das durch die sinkende Absatzmenge online der durchschnitt sich immer mehr den anderen Vertriebskanälen annähert. Außerdem sehen wir das in allen Vertriebskanälen immer weniger Rabatte gegeben werden, was darauf schließen lässt das sich durch die Rabatte nicht unser Umsatz sinkt.

#### Durchschnittliche Rabatte pro Region in %

In [None]:
df_sales_A = df_sales[df_sales['region'] == 'A']
df_sales_B = df_sales[df_sales['region'] == 'B']
df_sales_C = df_sales[df_sales['region'] == 'C']
df_sales_D = df_sales[df_sales['region'] == 'D']

In [None]:
# Group by month and count sales
df_discounts_A_monthly = df_sales_A.groupby(df_sales_A['date'].dt.to_period('M'))['discount'].mean().reset_index()
df_discounts_B_monthly = df_sales_B.groupby(df_sales_B['date'].dt.to_period('M'))['discount'].mean().reset_index()
df_discounts_C_monthly = df_sales_C.groupby(df_sales_C['date'].dt.to_period('M'))['discount'].mean().reset_index()
df_discounts_D_monthly = df_sales_D.groupby(df_sales_D['date'].dt.to_period('M'))['discount'].mean().reset_index()

df_discounts_A_monthly['date'] = df_discounts_A_monthly['date'].dt.to_timestamp()
df_discounts_B_monthly['date'] = df_discounts_B_monthly['date'].dt.to_timestamp()
df_discounts_C_monthly['date'] = df_discounts_C_monthly['date'].dt.to_timestamp()
df_discounts_D_monthly['date'] = df_discounts_D_monthly['date'].dt.to_timestamp()

In [None]:
# Set the size of the plot
plt.figure(figsize=(12, 6))

# Extract year and month from the 'date' column
df_discounts_online_monthly['year_month'] = df_discounts_online_monthly['date'].dt.strftime('%Y-%m')

# Create a list of unique year_month values for x-axis
x_labels = df_discounts_online_monthly['year_month'].unique()
x = np.arange(len(df_discounts_online_monthly['date']))

# Define the width for each bar
bar_width = 0.2

# Create the bar plots for each sales channel
plt.bar(x - bar_width, (df_discounts_A_monthly['discount']), width=bar_width, label='A', color='b', alpha=0.7)
plt.bar(x, (df_discounts_B_monthly['discount']), width=bar_width, label='B', color='g', alpha=0.7)
plt.bar(x + bar_width, (df_discounts_C_monthly['discount']), width=bar_width, label='C', color='r', alpha=0.7)
plt.bar(x + (2 * bar_width), (df_discounts_D_monthly['discount']), width=bar_width, label='D', color='y', alpha=0.7)

# Plot the line plot using data from df_discounts_monthly
plt.plot(x, (df_discounts_monthly['discount']), label='avg_discount', color='purple', linewidth=2, marker='o')

# Enhance the plot with titles and labels
plt.title('Rabatte pro Region')
plt.xlabel('Month')
plt.ylabel('Rabatt')

# Set x-axis ticks and labels to be the dates
plt.xticks(x, x_labels, rotation=45)

# Add legend
plt.legend(loc='upper right')

# Show the plot
plt.tight_layout()
plt.show()

**Analyseergebnis der Rabatte pro Region**

Wir sehen das mehr Rabatte in der Region C gegeben werden, aber wenn wir uns die Y Achse anschauen sehen das zwischen den Regionen wirklich nicht viel Unterschied ist. Maximal ein halber Prozentpunkt liegt zwischen ihnen. Wir sehen das der Trend zu weniger Rabatten sich hier auch abzeichnet.

#### Durchschnittliche Rabatte pro Produkt in %

In [None]:
df_sales_basic = df_sales[df_sales['product'] == 'Tablet Basic']
df_sales_mini = df_sales[df_sales['product'] == 'Tablet Mini']
df_sales_pro = df_sales[df_sales['product'] == 'Tablet Pro']

In [None]:
# Group by month and count sales
df_discounts_basic_monthly = df_sales_basic.groupby(df_sales_basic['date'].dt.to_period('M'))['discount'].mean().reset_index()
df_discounts_mini_monthly = df_sales_mini.groupby(df_sales_mini['date'].dt.to_period('M'))['discount'].mean().reset_index()
df_discounts_pro_monthly = df_sales_pro.groupby(df_sales_pro['date'].dt.to_period('M'))['discount'].mean().reset_index()

df_discounts_basic_monthly['date'] = df_discounts_basic_monthly['date'].dt.to_timestamp()
df_discounts_mini_monthly['date'] = df_discounts_mini_monthly['date'].dt.to_timestamp()
df_discounts_pro_monthly['date'] = df_discounts_pro_monthly['date'].dt.to_timestamp()

In [None]:
# Set the size of the plot
plt.figure(figsize=(12, 6))

# Extract year and month from the 'date' column
df_discounts_online_monthly['year_month'] = df_discounts_online_monthly['date'].dt.strftime('%Y-%m')

# Create a list of unique year_month values for x-axis
x_labels = df_discounts_online_monthly['year_month'].unique()
x = np.arange(len(df_discounts_online_monthly['date']))

# Define the width for each bar
bar_width = 0.2

# Create the bar plots for each sales channel
plt.bar(x - bar_width, (df_discounts_basic_monthly['discount']), width=bar_width, label='Basic', color='b', alpha=0.7)
plt.bar(x, (df_discounts_mini_monthly['discount']), width=bar_width, label='Mini', color='g', alpha=0.7)
plt.bar(x + bar_width, (df_discounts_pro_monthly['discount']), width=bar_width, label='Pro', color='tab:orange', alpha=0.7)

# Plot the line plot using data from df_discounts_monthly
plt.plot(x, (df_discounts_monthly['discount']), label='ø Rabatt', color='purple', linewidth=2, marker='o')

# Enhance the plot with titles and labels
plt.title('Rabatte pro Produkt')
plt.xlabel('Monat')
plt.ylabel('Rabatt in %')

# Set x-axis ticks and labels to be the dates
plt.xticks(x, x_labels, rotation=45)

# Add legend
plt.legend(loc='upper right')

# Show the plot
plt.tight_layout()
plt.show()

**Analyseergebnis der Rabatte pro Produkt**

Wir sehen hier das keine Rabatte auf das Tablet Pro gegeben werden, im Durchschnitt 1% auf das Tablett Mini und ca. 3% auf das Tablet Basic. Wir sehen außerdem das die Rabatte über die Zeit konstant sind und sich nicht verändern und somit nicht dem Trend der vorangegangenen Analysen folgen und somit auch nicht dem durchschnittlichen Rabatt folgen. Das bedeutet das der Trend der sinkenden Rabatte nur durch die Veränderungen in den abgesetzten Produkten entsteht und deswegen nicht der Grund für den sinkenden Umsatz ist.

## Downtime

In [None]:
# df_downtime als Saeulendiagramm darstellen
sns.set_style("whitegrid")

# Farbpalette definieren (Blau für 2021, Orange für 2022)
colors = ["blue", "orange"]

# Saeulendiagramm erstellen
ax = sns.barplot(x="region", y="downtime", hue="year", data=df_downtime, palette=colors)

# Achsenbeschriftung
ax.set_xlabel("Region")
ax.set_ylabel("Downtime")

# Legende
ax.legend(title="Jahr", loc="upper right")

# Titel
ax.set_title("Downtime je Region")

# Diagramm anzeigen
plt.show()

In [None]:
df_sales_A = df_sales_online[df_sales_online['region'] == 'A']
df_sales_B = df_sales_online[df_sales_online['region'] == 'B']
df_sales_C = df_sales_online[df_sales_online['region'] == 'C']
df_sales_D = df_sales_online[df_sales_online['region'] == 'D']

# Group by month and count sales
df_discounts_A_monthly = df_sales_A.groupby(df_sales_A['date'].dt.to_period('M'))['amount'].count().reset_index()
df_discounts_B_monthly = df_sales_B.groupby(df_sales_B['date'].dt.to_period('M'))['amount'].count().reset_index()
df_discounts_C_monthly = df_sales_C.groupby(df_sales_C['date'].dt.to_period('M'))['amount'].count().reset_index()
df_discounts_D_monthly = df_sales_D.groupby(df_sales_D['date'].dt.to_period('M'))['amount'].count().reset_index()

df_discounts_A_monthly['date'] = df_discounts_A_monthly['date'].dt.to_timestamp()
df_discounts_B_monthly['date'] = df_discounts_B_monthly['date'].dt.to_timestamp()
df_discounts_C_monthly['date'] = df_discounts_C_monthly['date'].dt.to_timestamp()
df_discounts_D_monthly['date'] = df_discounts_D_monthly['date'].dt.to_timestamp()

In [None]:
# Set the size of the plot
plt.figure(figsize=(12, 6))

# Extract year and month from the 'date' column
df_discounts_online_monthly['year_month'] = df_discounts_online_monthly['date'].dt.strftime('%Y-%m')

# Create a list of unique year_month values for x-axis
x_labels = df_discounts_online_monthly['year_month'].unique()
x = np.arange(len(df_discounts_online_monthly['date']))

# Define the width for each bar
bar_width = 0.2

# Create the bar plots for each sales channel
plt.bar(x - bar_width, (df_discounts_A_monthly['amount']), width=bar_width, label='A', color='b', alpha=0.7)
plt.bar(x, (df_discounts_B_monthly['amount']), width=bar_width, label='B', color='g', alpha=0.7)
plt.bar(x + bar_width, (df_discounts_C_monthly['amount']), width=bar_width, label='C', color='r', alpha=0.7)
plt.bar(x + (2 * bar_width), (df_discounts_D_monthly['amount']), width=bar_width, label='D', color='y', alpha=0.7)


# Enhance the plot with titles and labels
plt.title('Verkaufte Geräte im Online Kanal pro Region')
plt.xlabel('Month')
plt.ylabel('Rabatt')

# Set x-axis ticks and labels to be the dates
plt.xticks(x, x_labels, rotation=45)

# Add legend
plt.legend(loc='upper right')

# Show the plot
plt.tight_layout()
plt.show()

**Analyse der Downtime**

Leider haben wir mit nur zwei Datenpunkten nicht genug Information um den Einfluss der Downtime auf denn Absatz im Onlinestore bewerten zu können. Wenn man sich den Online Absatz über den Jahreswechsel anschaut sieht man keine ungewöhnlich große Veränderung in den einzelnen Regionen die sich mit der Downtime erklären lassen würde.

# Anaylse der Performance der Regionen

In diesem Abschnitt werden die Regionen auf ihre Performance untersucht. Hierfür werden die Umsätze, die Kosten und die Gewinne der Regionen analysiert. Außerdem gucken wir uns genau an wie sich die Channel in den Regionen entwickeln und ob es einen Zusammenhang zwischen den Channeln und der Performance der Regionen gibt.

### Datenaufbereitung: 


In [None]:
profit_per_region_product_channel = df_sales.groupby(['region', 'product', 'channel'])['profit_total'].sum()/1_000_000
profit_per_region_product_channel = profit_per_region_product_channel.reset_index()
profit_per_region_product_channel = profit_per_region_product_channel.replace({'product': {'Tablet Basic': 'Basic', 'Tablet Mini': 'Mini', 'Tablet Pro': 'Pro'}})

sales_per_product_by_region = df_sales.groupby(['region', 'product']).agg({'amount': 'sum'})
sales_per_product_by_region = sales_per_product_by_region.reset_index()

df_sales_region_channel = df_sales.groupby(["year", "month", 'region', 'channel']).agg({"amount" : "sum"})
df_sales_region_channel.reset_index(inplace=True)

#Region A
df_sales_region_channel_a = df_sales_region_channel[df_sales_region_channel['region'] == 'A']
df_sales_region_channel_a_online = df_sales_region_channel_a[df_sales_region_channel_a['channel'] == 'online']
df_sales_region_channel_a_phone = df_sales_region_channel_a[df_sales_region_channel_a['channel'] == 'phone']
df_sales_region_channel_a_store = df_sales_region_channel_a[df_sales_region_channel_a['channel'] == 'store']

#Region B
df_sales_region_channel_b = df_sales_region_channel[df_sales_region_channel['region'] == 'B']
df_sales_region_channel_b_online = df_sales_region_channel_b[df_sales_region_channel_b['channel'] == 'online']
df_sales_region_channel_b_phone = df_sales_region_channel_b[df_sales_region_channel_b['channel'] == 'phone']
df_sales_region_channel_b_store = df_sales_region_channel_b[df_sales_region_channel_b['channel'] == 'store']

#Region C
df_sales_region_channel_c = df_sales_region_channel[df_sales_region_channel['region'] == 'C']
df_sales_region_channel_c_online = df_sales_region_channel_c[df_sales_region_channel_c['channel'] == 'online']
df_sales_region_channel_c_phone = df_sales_region_channel_c[df_sales_region_channel_c['channel'] == 'phone']
df_sales_region_channel_c_store = df_sales_region_channel_c[df_sales_region_channel_c['channel'] == 'store']

#Region D
df_sales_region_channel_d = df_sales_region_channel[df_sales_region_channel['region'] == 'D']
df_sales_region_channel_d_online = df_sales_region_channel_d[df_sales_region_channel_d['channel'] == 'online']
df_sales_region_channel_d_phone = df_sales_region_channel_d[df_sales_region_channel_d['channel'] == 'phone']
df_sales_region_channel_d_store = df_sales_region_channel_d[df_sales_region_channel_d['channel'] == 'store']

## Alle Regionen

In [None]:
plt.pie(df_sales_per_region, labels=df_sales_per_region.index, autopct='%1.1f%%', counterclock=False, startangle=90)
plt.title('Umsatzanteile nach Regionen')

plt.tight_layout()
plt.show()

In [None]:
plt.figure(figsize=(10, 6))

sns.barplot(data=sales_per_product_by_region, x='region', y='amount', hue='product')

plt.title('Menge der verkauften Produkte, gruppiert nach Region')
plt.xlabel('Region')
plt.ylabel('Verkaufsmenge')
plt.show()

### Fragestellung: Warum ist die Performance der Regionen so unterschiedlich?
<br>
Es fällt hier besonders auf, dass die Region A einen fast dreifach kleineren Umsatzanteil hat als die Region D. <br>
Der Unterschied in den Anteilen der anderen Regionen ist dabei im Vergleich weitaus weniger stark, hier liegt der Bereich zws. 3 bis 5% Umsatzanteil. <br>
Von A zu C, die drittschlechteste Region, ist der Unterschied schon 12.6% <br>
Die folgenden Analysen setzen einen besonderen Fokus auf Region A als Underperformer und die Region D als Überperformer <br>

### Funktionen:

In [None]:
def plot_profit_per_product_channel_region(region_costs, profit_per_region_product_channel):
    # Iteration über die einzelnen Regionen
    for region_cost in region_costs:
        # Filtern der Daten für die aktuelle Region
        region_data = profit_per_region_product_channel[profit_per_region_product_channel['region'] == region_cost]
        
        # Diagramm erstellen
        fig, ax = plt.subplots(figsize=(12, 6))
        
        # Erstellen der x-Achsenbeschriftungen für das Säulendiagramm
        products = region_data['product']
        channels = region_data['channel']
        labels = [f'{product} - {channel}' for product, channel in zip(products, channels)]
        
        # Extrahieren der Gewinne
        profits = region_data['profit_total']
        
        # Festlegen der Farben für Basic, Mini und Pro
        colors = ['tab:orange' if product == 'Basic' else 'b' if product == 'Mini' else 'g' for product in products]
        
        # Erstellen des Säulendiagramms mit den entsprechenden Farben
        plt.bar(labels, profits, color=colors)
        
        # Achsentitel und Diagrammtitel
        plt.xlabel('Produkt und Kanal', size = 15)
        plt.ylabel('Profit in Mio. €', size = 15)
        plt.title(f'Profit pro Produkt & Kanal - Region {region_cost}', size = 20)
        
        # Anpassung des Layouts und Anzeigen des Diagramms
        plt.tight_layout()
        
        # Gitterlinien aktivieren
        plt.grid(True)

        # Legende anzeigen mit den entsprechenden Farben
        legend_elements = [mpatches.Patch(facecolor='tab:orange', label='Basic'),
                              mpatches.Patch(facecolor='b', label='Mini'),
                              mpatches.Patch(facecolor='g', label='Pro')]
        plt.legend(handles=legend_elements, loc='upper right', fontsize='large')

        # Gitter in den Hintergrund legen
        ax.set_axisbelow(True)
         
        # Anpassung x-Achse und y-Achse
        max = 22.5
        ticks = 2.5
        plt.xticks(rotation = 45)
        plt.yticks(np.arange(0, max, ticks))
        plt.show()
        
def plot_sales(region):
    # Construct the dataframe names
    df_sales_region_channel_online = globals()[f'df_sales_region_channel_{region.lower()}_online']
    df_sales_region_channel_phone = globals()[f'df_sales_region_channel_{region.lower()}_phone']
    df_sales_region_channel_store = globals()[f'df_sales_region_channel_{region.lower()}_store']

    # Plot
    fig, ax = plt.subplots(figsize=(12, 6))

    # Daten plotten
    ax.plot(df_sales_region_channel_online['year'].astype(str) + '-' + df_sales_region_channel_online['month'].astype(str), df_sales_region_channel_online['amount'])
    ax.plot(df_sales_region_channel_phone['year'].astype(str) + '-' + df_sales_region_channel_phone['month'].astype(str), df_sales_region_channel_phone['amount'])
    ax.plot(df_sales_region_channel_store['year'].astype(str) + '-' + df_sales_region_channel_store['month'].astype(str), df_sales_region_channel_store['amount'])

    # Achsenbeschriftung und Titel hinzufuegen
    ax.set_xlabel('Jahr-Monat', fontsize=12)

    # y-Achse in Millionen formatieren
    ax.yaxis.set_major_formatter(
        plt.FuncFormatter(lambda x, loc: "{:,}".format(int(x))))

    ax.set_ylabel('Menge in Stück', fontsize=12)
    ax.set_title(f'Verkaufsmenge nach Kanälen - Region {region}', fontsize=20)

    # Legende hinzufuegen
    ax.legend(['Online', 'Phone', 'Store'], fontsize=14)

    # X-Achsenbeschriftung drehen
    plt.xticks(rotation=45)

    # Diagramm anzeigen
    plt.tight_layout()
    plt.show()


## Region A

In [None]:
plot_sales('A')


Hohe Abhängigkeit vom Online-Channel <br>

In [None]:
region_costs = ["A"]  # replace with your actual regions
plot_profit_per_product_channel_region(region_costs, profit_per_region_product_channel)

Region A verkauft am meisten über den Online Kanal, vorallem in der Kombination mit dem Basic Tablet. <br>
Generell sind die Profitströme, Kanal und Produkt unabhängig, niedrig. <br>
Der Kanal Store performt hier sogar am schlechtesten. <br>

## Region B

In [None]:
plot_sales('B')

Schlechte Performance vom Online-Channel wird besser abgefedert. <br>

In [None]:
region_costs = ["B"]  # replace with your actual regions
plot_profit_per_product_channel_region(region_costs, profit_per_region_product_channel)

Insgesamt höher als A. <br>
Die Kombination Mini und Phone zeigt hier gut was der Region fehlt. <br>

## Region C

In [None]:
plot_sales('C')

Ähnlich wie B, wobei der Wendepunkt, das starke Steigen von Phone und Store, sowie das Sinken von Online zur X-Achse, zeitlich später stattfindet <br>

In [None]:
region_costs = ["C"] 
plot_profit_per_product_channel_region(region_costs, profit_per_region_product_channel)

Sehr ähnlich zu B. <br>
Gut zu erkennen das jedes Produkt in jeder Kombination mit einem bestimmten Kanal am besten performt. <br>
Basic + Online, Mini + Phone und Pro + Store. <br>

## Region D

In [None]:
plot_sales('D')

Ähnlich zu B und C, jedoch trettet der Wendepunkt hier von allen Regionen am frühsten ein. <br>

In [None]:
region_costs = ["D"] 
plot_profit_per_product_channel_region(region_costs, profit_per_region_product_channel)

Balken verhalten sich wieder ähnlich zu B und C. <br>
Das zeigt wieder das A ein Ausreißer ist. <br>
Da der Wendepunkt am frühsten in D eintritt, ist die Profitgewinnung von Basic + Online geringer als bei B und C. <br>
Dafür ist die Kombi Pro + Store am gewinnbringendsten. <br>

## Ergebnisse der Performance-Analyse der Regionen

Der Abwärtstrend vom Online Kanal und Basic Produkt schlägt sich in den Regionen unterschiedlich aus. <br>
Region A leidet am meisten darunter, da sie am meisten über den Online Kanal verkauft. <br>
Und die anderen Absätzkanäle noch nicht stark genug sind um den Verlust auszugleichen. <br>
Die anderen Regionen sind bei Profitgewinnung sehr ähnlich zueinander und können das Defizit aus dem Online Kanal besser ausgleichen.<br>
Besonders aufgrund der Mini + Phone Kombination, die hier am profitabelsten ist. <br>
Die Überperformance von D ist darauf zurückzuführen, dass sie am frühesten den Wendepunkt, also die Verkaufszahlsteigerung im Phone und Store Kanal erreicht haben. <br>

Wenn man die Regionen danach aufreiht, wann sie den Wendepunkt erreicht haben, als an erster Stelle D, B, C und A, sieht man hier wieder Reihenfolger wie bei den Umsatzanteilen, D:32.8%, B: 29.1%, C: 25.3%, A: 12.7%. <br>