# Säljrapport

*Förslag på rapportstruktur*

## Introduktion

Här skriver vi en kort introduktion. 

**Importeringar för hela Notebooken** (rör ej)

In [None]:
import matplotlib.pyplot as plt 
from src.io_utils import * 
from src.metrics import * 
from src.viz import * 

**Förbereder data**

In [None]:
# Read 
df = read_data("data/ecommerce_sales.csv") 

# Clean
df_clean = clean_data(df) 

df_clean['month'] = df_clean.date.dt.month_name()

#Visualize
display(df_clean.sample(3))

## Nyckeltal

Här visualiserar vi våra nyckeltal.

### 1. Vad säljer? – vilka kategorier driver mest intäkt?

**Nyckeltal:** Total intäkt och totalt antal enheter & Intäkt per kategori

In [None]:
plot_revenue_per_category(df_clean)
boxplot_revenue_per_category(df_clean)

print(looking_for_them_outliers_in_category_revenue(df_clean))

### 2. Var säljer vi? – vilka städer står för störst intäkt?

**Sammanfattning:** 

Analysen visar städer per intäkter.
- Stockholm toppar listan med en total intäkt på cirka 1,23 miljoner kronor.
- Göteborg kommer på andra plats med ungefär 860 000 kronor i intäkter.
- Malmö är tredje störst med cirka 568 000 kronor i intäkter.

Denna information hjälper till att identifiera viktiga regioner som bidrar mest till försäljningen och kan användas för att rikta marknadsföring samt resurser mer effektivt.

In [None]:
df_rev_city = revenue_per_city(df_clean)
print(f"The top 3 cities per revenue are:\n"
      f"{df_rev_city.head(3)}.")

fig, ax = plt.subplots(figsize=(7,5))
bar(ax, df_rev_city["city"], df_rev_city["tot_rev_city"], "Revenue per City", "City", "Revenue", color="#4682B4")
plt.show()

### 3. När säljer vi? – finns tidsmönster/säsong i försäljningen?

 **Nyckeltal:** TBD

In [None]:

revenue_monthly_boxplot(df_clean)
revenue_monthly_bar(df_clean)



### 4. Hur ser en typisk order ut? – AOV (Average Order Value) och spridning.

**Sammanfattning:**
- Den genomsnittliga orderstorleken (AOV) hålls stabilt över tid första halvan av 2025, med undantag för en dipp i mars.
- Kategorierna *Electronics* och *Sports* driver upp orderstorlekarna, medan övriga kategorier ligger under genomsnittet med *Toys* och *Beauty* som lägst.
- Det stora antalet kunder köper mellan 2-4 produkter per order och kan stäcka sig så högt som upp mot 8 till 9 produkter (*Clothing, Sports, Toys*) men det är mer ovanligt.
- *Electronics* visar störst orderstorlekar, följt av *Sports* som ligger något lägre. Inom *Electronics* finns det även en kraftig spridning med höga värdestorlekar på ordrar i jämförelse med genomsnittet.
- *Toys* och *Beauty* presterar sämst och har även minst spridning i storleksvärdet på ordrar. 

In [None]:
# Calculating Order Value data
monthly_aov, total_aov, category_aov, city_aov, ave_units_per_order = calculate_aov(df_clean)

# Plotting the Order Value data
plot_ov_figure(monthly_aov, total_aov, category_aov, city_aov, ave_units_per_order, df)

### 5. Topp-listor – topp-3 kategorier efter intäkt.

**Nyckeltal:** Top-3 kategorier efter intäkt

Ansvarig: Abdullahi Sheek Elmi


In [None]:
import pandas as pd
import matplotlib.pyplot as plt

df = pd.read_csv("data/ecommerce_sales.csv")

# Funktion som räknar ut totalt antal sålda enheter
def compute_total_units(df):
    return df["units"].sum()

# Funktion som visar stapeldiagram över sålda enheter per kategori
def plot_units_by_category(df):
    units_by_category = df.groupby("category")["units"].sum().sort_values(ascending=False)
    units_by_category.plot(kind="bar", title="Sålda enheter per kategori", figsize=(8,4))
    plt.xlabel("Kategori")
    plt.ylabel("Antal enheter")
    plt.xticks(rotation=45, ha="right")
    plt.tight_layout()
    plt.show()

# Kör funktionerna
total_units = compute_total_units(df)
print("Totalt antal sålda enheter:", total_units)

plot_units_by_category(df)


# Kommentar
Jag räknade ihop det totala antalet sålda enheter och gjorde ett stapeldiagram
som visar hur många produkter som sålts inom varje kategori.


### 6. Eventuella avvikelser – något oväntat mönster som sticker ut?

*Insikter om avvikelser som går att utläsa från sammanställning av datan ovan*

## Rekommendationer

Avsluta rapporten med 2–3 korta rekommendationer (punktlista) baserat på era resultat, t.ex. “Satsa på kategori X i stad Y under månad Z”.