<a href="https://colab.research.google.com/github/FabrizioSeverino/Portfolio/blob/main/Customer_Behaviour_Analysis_using_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# __**Customer Behaviour Analysis using Python**__  
L'Analisi del Comportamento del Cliente è un processo che consiste nell'esaminare e comprendere come i clienti interagiscono con un'azienda, un prodotto o un servizio. Questa analisi aiuta le organizzazioni a prendere decisioni informate, adattare le proprie strategie e migliorare l’esperienza del cliente.

L'Analisi del Comportamento del Cliente è un processo prezioso che consente alle aziende di prendere decisioni basate sui dati, migliorare l’esperienza del cliente e rimanere competitive in un mercato dinamico. Di seguito è illustrato il processo che possiamo seguire per svolgere l’analisi del comportamento dei clienti:

- Raccolta dei dati relativi alle interazioni dei clienti. Questi possono includere la cronologia degli acquisti, le visite al sito web, l’interazione sui social media, i feedback dei clienti e altro ancora.

- Identificazione e correzione di eventuali incoerenze nei dati, valori mancanti e valori anomali, per garantire la qualità e l’accuratezza delle informazioni.

- Calcolo delle statistiche di base come media, mediana e deviazione standard per riassumere i dati.

- Creazione di visualizzazioni come istogrammi, diagrammi a dispersione e grafici a barre per esplorare tendenze, modelli e anomalie nei dati.

- Utilizzo di tecniche come il clustering per raggruppare i clienti in base a comportamenti o caratteristiche comuni.

ho trovato il dataset qui: https://statso.io/customer-behaviour-case-study/

Ora, iniziamo con il compito di Analisi del Comportamento del Cliente importando le librerie Python necessarie e il dataset.

In [None]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

data = pd.read_csv("ecommerce_customer_data.csv")
print(data.head())

   User_ID  Gender  Age   Location Device_Type  Product_Browsing_Time  \
0        1  Female   23  Ahmedabad      Mobile                     60   
1        2    Male   25    Kolkata      Tablet                     30   
2        3    Male   32  Bangalore     Desktop                     37   
3        4    Male   35      Delhi      Mobile                      7   
4        5    Male   27  Bangalore      Tablet                     35   

   Total_Pages_Viewed  Items_Added_to_Cart  Total_Purchases  
0                  30                    1                0  
1                  38                    9                4  
2                  13                    5                0  
3                  20                   10                3  
4                  20                    8                2  


Prima di procedere, diamo un'occhiata alle statistiche riassuntive sia per le colonne numeriche che per quelle categoriche nel dataset.

In [None]:
# Statistiche riassuntive per le colonne numeriche
sintesi_numerica = data.describe()
print(sintesi_numerica)

          User_ID         Age  Product_Browsing_Time  Total_Pages_Viewed  \
count  500.000000  500.000000             500.000000          500.000000   
mean   250.500000   26.276000              30.740000           27.182000   
std    144.481833    5.114699              15.934246           13.071596   
min      1.000000   18.000000               5.000000            5.000000   
25%    125.750000   22.000000              16.000000           16.000000   
50%    250.500000   26.000000              31.000000           27.000000   
75%    375.250000   31.000000              44.000000           38.000000   
max    500.000000   35.000000              60.000000           50.000000   

       Items_Added_to_Cart  Total_Purchases  
count           500.000000       500.000000  
mean              5.150000         2.464000  
std               3.203127         1.740909  
min               0.000000         0.000000  
25%               2.000000         1.000000  
50%               5.000000         2.00

In [None]:
# Statistiche riassuntive per le colonne non numeriche (categoriche)
sintesi_categorica = data.describe(include='object')
print(sintesi_categorica)

       Gender Location Device_Type
count     500      500         500
unique      2        8           3
top      Male  Kolkata      Mobile
freq      261       71         178


Ora, diamo un'occhiata alla distribuzione dell'età nel dataset.

In [None]:
# Istogramma per 'Età'
fig = px.histogram(data, x='Age', title='Distribuzione dell' 'Età')
fig.show()

Ora, diamo un'occhiata alla distribuzione del genere.


In [None]:
# Grafico a barre per Genere
gender_counts = data['Gender'].value_counts().reset_index()
gender_counts.columns = ['Gender', 'Count']
fig = px.bar(gender_counts, x='Gender',
             y='Count',
             title='Distribuzione di Genere')
fig.show()

Ora, diamo un'occhiata alla relazione tra il tempo di navigazione dei prodotti e il numero totale di pagine visualizzate.

In [None]:
# 'Tempo_Navigazione_Prodotti' vs 'Pagine_Totali_Visualizzate'
fig = px.scatter(data, x='Product_Browsing_Time', y='Total_Pages_Viewed',
                 title='Tempo di Navigazione Prodotti vs. Pagine Totali Visualizzate',
                 trendline='ols')
fig.show()

Il grafico a dispersione sopra non mostra un pattern coerente né una forte associazione tra il tempo trascorso a navigare i prodotti e il numero totale di pagine visualizzate. Questo indica che i clienti non necessariamente esplorano più pagine se trascorrono più tempo sul sito, il che potrebbe dipendere da vari fattori come il design del sito, la rilevanza dei contenuti o le preferenze individuali degli utenti.

Ora, diamo un'occhiata al numero medio di pagine totali visualizzate suddiviso per genere:

In [None]:
# Analisi raggruppata
gender_grouped = data.groupby('Gender')['Total_Pages_Viewed'].mean().reset_index()
gender_grouped.columns = ['Gender', 'Average_Total_Pages_Viewed']
fig = px.bar(gender_grouped, x='Gender', y='Average_Total_Pages_Viewed',
             title='Numero Medio di Pagine Totali Visualizzate per Genere')
fig.show()

Ora, diamo un'occhiata al numero medio di pagine totali visualizzate per dispositivo.

In [None]:
devices_grouped = data.groupby('Device_Type')['Total_Pages_Viewed'].mean().reset_index()
devices_grouped.columns = ['Device_Type', 'Average_Total_Pages_Viewed']
fig = px.bar(devices_grouped, x='Device_Type', y='Average_Total_Pages_Viewed',
             title='Numero Medio di Pagine Totali Visualizzate per Dispositivo')
fig.show()

Ora, calcoliamo il valore a vita del cliente (Customer Lifetime Value) e visualizziamo i segmenti basati su questo valore.

In [None]:
data['CLV'] = (data['Total_Purchases'] * data['Total_Pages_Viewed']) / data['Age']

data['Segment'] = pd.cut(data['CLV'], bins=[1, 2.5, 5, float('inf')],
                         labels=['Valore Basso', 'Valore Medio', 'Valore Alto'])

segment_counts = data['Segment'].value_counts().reset_index()
segment_counts.columns = ['Segment', 'Count']

# Create a bar chart to visualize the customer segments
fig = px.bar(segment_counts, x='Segment', y='Count',
             title='Segmentazione dei clienti per CLV')
fig.update_xaxes(title='Segmento')
fig.update_yaxes(title='Numero di Clienti')
fig.show()

Ora, diamo un'occhiata al funnel di conversione dei clienti.

In [None]:
# Funnel analysis
funnel_data = data[['Product_Browsing_Time', 'Items_Added_to_Cart', 'Total_Purchases']]
funnel_data = funnel_data.groupby(['Product_Browsing_Time', 'Items_Added_to_Cart']).sum().reset_index()

fig = px.funnel(funnel_data, x='Product_Browsing_Time', y='Items_Added_to_Cart', title='Funnel di Conversione')
fig.show()

Nel grafico sopra, l’asse x rappresenta il tempo che i clienti trascorrono a navigare i prodotti sulla piattaforma e-commerce. L’asse y rappresenta il numero di articoli aggiunti al carrello dai clienti durante le loro sessioni di navigazione.

Ora, diamo un’occhiata al tasso di abbandono (churn rate) dei clienti:

In [None]:
# Calculate churn rate
data['Churned'] = data['Total_Purchases'] == 0

churn_rate = data['Churned'].mean()
print(churn_rate)

0.198


Un tasso di abbandono (churn rate) pari a 0,198 indica che una parte significativa dei clienti ha cessato di utilizzare il servizio, e affrontare questo fenomeno è importante per mantenere la crescita e la redditività dell’azienda.

#__**Riepilogo**__  
L’Analisi del Comportamento del Cliente è un processo che consiste nell’esaminare e comprendere come i clienti interagiscono con un’azienda, un prodotto o un servizio. Questa analisi aiuta le organizzazioni a prendere decisioni informate, personalizzare le proprie strategie e migliorare l’esperienza del cliente.     
Spero che vi sia piaciuta la mia dimostrazione, grrazie mille per avermi dedicato il vostro tempo, a presto!