# Superstore-Datenanalyse nach IBCS-Standards
Dieses Notebook analysiert den *Superstore*-Datensatz und visualisiert eine klare Kernaussage basierend auf Produktgewinnen. Die Darstellung folgt dem IBCS-Prinzip und hebt eine bestimmte Produktgruppe hervor.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
# Hochladen der Datei in Colab
from google.colab import files
uploaded = files.upload()

# Daten laden
file_name = list(uploaded.keys())[0]  # Erster hochgeladener Dateiname
df = pd.read_csv(file_name, encoding='ISO-8859-1')

In [None]:
# Relevante Spalten auswählen und bereinigen
df = df[['Product Name', 'Category', 'Sub-Category', 'Sales', 'Profit']].dropna()

# Beispiel: Produktlinie mit hohem Gewinn identifizieren
selected_category = 'Technology'  # Beispiel-Kategorie
df_selected = df[df['Category'] == selected_category]

# Gewinnsegment definieren (oberste 10%)
high_profit_threshold = df_selected['Profit'].quantile(0.9)
df_high_profit = df_selected[df_selected['Profit'] >= high_profit_threshold]

In [None]:
# Scatter-Plot mit Kernaussage erstellen
plt.figure(figsize=(10, 6))
sns.scatterplot(x=df_selected['Sales'], y=df_selected['Profit'], alpha=0.6, label='Alle Produkte')

# Produkte mit hohem Gewinn markieren
sns.scatterplot(x=df_high_profit['Sales'], y=df_high_profit['Profit'], color='red', label='Hoher Gewinn')

# Nachricht hinzufügen (analog zum IBCS-Bild)
message_text = f"{len(df_high_profit)} Produkte von {selected_category} sind\nim Gewinnsegment von {round(high_profit_threshold, 2)} USD"
plt.text(x=df_selected['Sales'].max() * 0.6, 
         y=df_selected['Profit'].max() * 0.9,
         s=message_text,
         fontsize=12, bbox=dict(facecolor='white', alpha=0.7))

# Achsentitel setzen
plt.xlabel('Umsatz (Sales)')
plt.ylabel('Gewinn (Profit)')
plt.title(f'Analyse der Produktgewinne für {selected_category} (Superstore-Datensatz)')
plt.legend()
plt.grid(True)

# Visualisierung anzeigen
plt.show()