# Analyse Webmarketing ‚Äì E‚Äëcommerce Mode
Ce notebook reprend l'analyse webmarketing r√©alis√©e pour un site e‚Äëcommerce du secteur de la mode.


**Objectifs :**

- Identifier les canaux marketing les plus rentables

- Construire un analyse Pareto (20/80)

- √âtudier la performance : nouveaux vs clients fid√®les

- Prioriser les budgets marketing via les donn√©es


> üìù Remarque : adapte les noms de colonnes √† ton dataset r√©el.


## 1. Import des biblioth√®ques

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

%matplotlib inline

## 2. Chargement des donn√©es
On suppose un fichier CSV contenant les colonnes suivantes :

- `Channel` : canal d‚Äôacquisition (SEO, SEA, Social, Email‚Ä¶)
- `CustomerType` : New / Returning
- `ProductCategory` : cat√©gorie de produit
- `Revenue` : chiffre d‚Äôaffaires g√©n√©r√©
- `Conversions` : nombre de conversions
- `Clicks` : nombre de clics
- `Cost` : co√ªt d√©pens√©

üìå *Adapte ces colonnes √† ta propre base.*

In [None]:
file_path = "data/marketing_campaign.csv"

df = pd.read_csv(file_path)
df.head()

## 3. Nettoyage et pr√©paration des donn√©es

In [None]:
df.info()

# Supprimer lignes sans canal ou revenu
df = df.dropna(subset=["Channel", "Revenue"])

# Forcer Revenue et Cost en num√©riques
df["Revenue"] = pd.to_numeric(df["Revenue"], errors="coerce")
df["Cost"] = pd.to_numeric(df["Cost"], errors="coerce")

df = df.dropna(subset=["Revenue", "Cost"])

df.describe()

## 4. Analyse des canaux marketing

In [None]:
channel_perf = df.groupby("Channel").agg({
    "Revenue": "sum",
    "Cost": "sum",
    "Conversions": "sum"
})

channel_perf["ROI"] = (channel_perf["Revenue"] - channel_perf["Cost"]) / channel_perf["Cost"]
channel_perf

### Visualisation des revenus par canal

In [None]:
plt.figure(figsize=(8,4))
plt.bar(channel_perf.index, channel_perf["Revenue"])
plt.title("Revenus par Canal")
plt.ylabel("Revenue")
plt.xticks(rotation=45)
plt.show()

## 5. Analyse Pareto (20/80)

In [None]:
pareto = channel_perf.sort_values("Revenue", ascending=False)
pareto

In [None]:
plt.figure(figsize=(6,4))
plt.plot(pareto["Revenue"].cumsum() / pareto["Revenue"].sum(), marker='o')
plt.title("Courbe de Pareto")
plt.ylabel("% cumul√©s du revenu")
plt.xticks(rotation=45)
plt.grid(True)
plt.show()

## 6. Nouveaux vs clients fid√®les

In [None]:
cust_seg = df.groupby(["Channel", "CustomerType"]).agg({
    "Revenue": "sum",
    "Conversions": "sum"
}).reset_index()

cust_seg

In [None]:
plt.figure(figsize=(8,4))
for ctype in cust_seg["CustomerType"].unique():
    subset = cust_seg[cust_seg["CustomerType"] == ctype]
    plt.bar(subset["Channel"], subset["Revenue"], alpha=0.6, label=ctype)

plt.title("Revenu par Canal : Nouveaux vs Fid√®les")
plt.legend()
plt.xticks(rotation=45)
plt.show()

## 7. Analyse produits

In [None]:
product_perf = df.groupby("ProductCategory").agg({
    "Revenue": "sum",
    "Conversions": "sum"
}).sort_values("Revenue", ascending=False)

product_perf

## 8. Synth√®se & Recommandations
- Google Ads performant pour les clients fid√®les
- SEO tr√®s efficace pour acqu√©rir de nouveaux clients
- Les cat√©gories Pantalons, T-shirts et Chaussures g√©n√®rent >80% du CA
- Les affili√©s peu rentables ‚Üí r√©√©valuer le budget
- Tests A/B recommand√©s sur Social Ads

‚û°Ô∏è Ajuste ces conclusions selon tes r√©sultats r√©els.