# Ανάλυση Πελατών E-commerce

Αυτό το notebook περιέχει τον κώδικα για την ανάλυση τμηματοποίησης πελατών (customer segmentation). Η ανάλυση περιλαμβάνει:
1.  Εύρεση των top 10 πελατών βάσει συνολικών εσόδων.
2.  Υπολογισμό του αριθμού μοναδικών κατηγοριών προϊόντων από τις οποίες αγοράζει κάθε πελάτης.

In [None]:
import os
import pandas as pd

# Δες πού βρίσκεσαι
print("Current directory:", os.getcwd())
print("Files here:", os.listdir('.'))

# Φόρτωση δεδομένων από το φάκελο data/
customers = pd.read_csv('data/customers.csv')
orders = pd.read_csv('data/orders.csv')
order_details = pd.read_csv('data/order_details.csv')
products = pd.read_csv('data/products.csv')

In [5]:
import pandas as pd
import numpy as np
from datetime import datetime

In [4]:
# Σε ένα νέο κελί στο Jupyter, γράψε και τρέξε:
import sys
!{sys.executable} -m pip install pandas

# Μετά δοκίμασε πάλι το import
import pandas as pd
print("Pandas installed successfully!")

Pandas installed successfully!



[notice] A new release of pip is available: 25.3 -> 26.0.1
[notice] To update, run: C:\Users\ΚΩΣΤΑΣ\python\python.exe -m pip install --upgrade pip


In [None]:
# Φόρτωση των αρχείων CSV
# ΣΗΜΕΙΩΣΗ: Αντικατέστησε τα paths με τα σωστά για τοπικό υπολογιστή
customers = pd.read_csv('customers.csv')
orders = pd.read_csv('orders.csv')
order_details = pd.read_csv('order_details.csv')
products = pd.read_csv('products.csv')

print("Δεδομένα φορτώθηκαν επιτυχώς!")
print(f"Πελάτες: {customers.shape}")
print(f"Παραγγελίες: {orders.shape}")
print(f"Λεπτομέρειες: {order_details.shape}")
print(f"Προϊόντα: {products.shape}")

In [None]:
# Συγχώνευση όλων των πινάκων για πλήρη εικόνα
full_data = (
    order_details
    .merge(orders, on='OrderID')
    .merge(customers, on='CustomerID')
    .merge(products, on='ProductID')
)

print(f"Σύνολο εγγραφών: {len(full_data)}")
full_data.head(3)

In [None]:
# Υπολογισμός τελικής αξίας ανά γραμμή παραγγελίας
data_with_value = full_data.assign(
    Συνολική_Αξία = lambda df: df['Ποσότητα'] * df['Τιμή_Μονάδας'],
    Έκπτωση_Ποσό = lambda df: df['Συνολική_Αξία'] * (df['Έκπτωση_%'] / 100),
    Τελική_Αξία = lambda df: df['Συνολική_Αξία'] - df['Έκπτωση_Ποσό']
)

print("Υπολογισμοί ολοκληρώθηκαν")
data_with_value[['OrderID', 'ProductID', 'Ποσότητα', 'Τιμή_Μονάδας', 'Έκπτωση_%', 'Τελική_Αξία']].head(3)

In [None]:
# Υπολογισμός συνολικών εσόδων ανά πελάτη
customer_revenue = (
    data_with_value
    .groupby(['CustomerID', 'Όνομα'])
    ['Τελική_Αξία']
    .sum()
    .sort_values(ascending=False)
    .reset_index()
)

# Top 10
top_10_customers = customer_revenue.head(10)
print("ΟΙ TOP 10 ΠΕΛΑΤΕΣ ΒΑΣΕΙ ΕΣΟΔΩΝ")
print(top_10_customers.to_string(index=False))

# Υπολογισμός ποσοστού εσόδων
total_revenue = customer_revenue['Τελική_Αξία'].sum()
top_10_revenue = top_10_customers['Τελική_Αξία'].sum()
print(f"\nΣυνολικά έσοδα από top 10: {top_10_revenue:.2f}")
print(f"Ποσοστό επί συνόλου: {top_10_revenue/total_revenue*100:.1f}%")

In [None]:
# Υπολογισμός μοναδικών κατηγοριών ανά πελάτη
customer_categories = (
    data_with_value
    .groupby(['CustomerID', 'Όνομα'])
    ['Κατηγορία']
    .nunique()
    .reset_index()
    .rename(columns={'Κατηγορία': 'Αριθμός_Κατηγοριών'})
)

print("ΚΑΤΑΝΟΜΗ ΠΕΛΑΤΩΝ ΑΝΑ ΑΡΙΘΜΟ ΚΑΤΗΓΟΡΙΩΝ")
print(customer_categories['Αριθμός_Κατηγοριών'].value_counts().sort_index())

# Πελάτες με >=3 κατηγορίες
customers_3plus = customer_categories[customer_categories['Αριθμός_Κατηγοριών'] >= 3]
print(f"\nΠελάτες με ≥3 κατηγορίες: {len(customers_3plus)} από {len(customer_categories)}")
print(f"Ποσοστό: {len(customers_3plus)/len(customer_categories)*100:.1f}%")

In [None]:
# Συνδυασμός revenue και categories για τους top 10
top_10_detailed = (
    top_10_customers
    .merge(customer_categories, on=['CustomerID', 'Όνομα'])
    .sort_values('Τελική_Αξία', ascending=False)
)

print("ΛΕΠΤΟΜΕΡΕΙΕΣ ΓΙΑ ΤΟΥΣ TOP 10 ΠΕΛΑΤΕΣ")
print(top_10_detailed.to_string(index=False))