# Lab 3: Exploratory Data Analysis (EDA) - Chocolate Sales

## Tasks
1. Load the Chocolate Sales dataset.
2. Perform data cleaning (handling currency symbols).
3. Conduct basic statistical exploration.
4. Visualize key patterns using Matplotlib and Seaborn.

In [None]:
# Import required libraries
# استيراد المكتبات اللازمة للتحليل والرسم البياني
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Set the visual style for seaborn
sns.set(style="whitegrid")
%matplotlib inline

In [None]:
# Load the dataset
# تحميل البيانات من ملف CSV
df = pd.read_csv('Chocolate_Sales.csv')

# Display the first 5 rows
# عرض أول 5 صفوف لرؤية شكل البيانات
df.head()

In [None]:
# Clean the 'Amount' column by removing '$' and ',' then converting to float
# تنظيف عمود المبلغ بحذف علامة الدولار والفاصلة وتحويله لرقم
df['Amount'] = df['Amount'].replace('[\$,]', '', regex=True).astype(float)

# Convert 'Date' column to datetime objects
# تحويل عمود التاريخ إلى صيغة تاريخ صحيحة
df['Date'] = pd.to_datetime(df['Date'])

# Display data types to confirm changes
# عرض أنواع البيانات للتأكد من التعديلات
df.info()

In [None]:
# Get statistical summary of numerical data
# الحصول على ملخص إحصائي للأرقام (المتوسط، الانحراف، إلخ)
df.describe()

In [None]:
# Visualize the total sales amount per country using a Bar Plot
# رسم بياني يوضح إجمالي المبيعات لكل دولة
plt.figure(figsize=(10, 6))
sns.barplot(data=df, x='Country', y='Amount', estimator=sum, palette='viridis')
plt.title('Total Sales Amount by Country')
plt.ylabel('Total Amount')
plt.show()

In [None]:
# Visualize the distribution of Boxes Shipped using a Histogram
# رسم بياني يوضح توزيع عدد الصناديق المشحونة
plt.figure(figsize=(10, 5))
sns.histplot(df['Boxes Shipped'], kde=True, color='brown')
plt.title('Distribution of Boxes Shipped')
plt.show()

In [None]:
# Analyze product performance: Total boxes shipped per product
# تحليل أداء المنتجات: إجمالي الصناديق المشحونة لكل منتج
product_sales = df.groupby('Product')['Boxes Shipped'].sum().sort_values(ascending=False)
print(product_sales)