
# ðŸ“Š Business Intelligence Dashboard Project  
## Financial Sample Workbook â€“ Microsoft  

**Tools:** Python, Pandas, NumPy, Seaborn, Matplotlib, Scikit-learn, Statsmodels, Plotly, Dash  

**Tujuan Proyek:**  
Membangun pipeline Business Intelligence end-to-end mulai dari ETL, Data Cleaning, EDA, Regresi, Klastering, Time Series, hingga dasar Dashboard menggunakan dataset *Financial Sample Workbook from Microsoft*.



## 1. Extract, Transform, Load (ETL)
Tahap ini bertujuan untuk memuat data dari sumber, melakukan transformasi awal, dan menyiapkan data untuk analisis.


In [None]:

import pandas as pd

# Load dataset
df = pd.read_excel("Financial Sample.xlsx")
df.head()



## 2. Data Cleaning
Melakukan pemeriksaan struktur data, menangani tipe data, serta standarisasi variabel kategorik.


In [None]:

# Cek informasi data
df.info()

# Konversi tipe data
df['Date'] = pd.to_datetime(df['Date'])

num_cols = [
    'Units Sold', 'Manufacturing Price', 'Sale Price',
    'Gross Sales', 'Discounts', 'Sales', 'COGS', 'Profit'
]
df[num_cols] = df[num_cols].astype(float)

# Standarisasi string
df['Country'] = df['Country'].str.title()
df['Segment'] = df['Segment'].str.upper()
df['Product'] = df['Product'].str.strip()
df['Discount Band'] = df['Discount Band'].str.capitalize()

df.head()



## 3. Exploratory Data Analysis (EDA)
Eksplorasi pola dan hubungan antar variabel utama seperti Sales dan Profit.


In [None]:

import seaborn as sns
import matplotlib.pyplot as plt

sns.scatterplot(data=df, x='Sales', y='Profit', hue='Segment')
plt.title("Hubungan Sales dan Profit")
plt.show()



## 4. Regresi Linear
Model regresi linear digunakan untuk memprediksi Profit berdasarkan variabel finansial.


In [None]:

from sklearn.linear_model import LinearRegression

X = df[['Sales', 'Discounts', 'COGS']]
y = df['Profit']

model = LinearRegression()
model.fit(X, y)

print("Intercept:", model.intercept_)
print("Koefisien:", model.coef_)



## 5. Analisis Klaster (K-Means)
Pengelompokan data berdasarkan kinerja finansial.


In [None]:

from sklearn.cluster import KMeans
from sklearn.preprocessing import StandardScaler

features = df[['Sales', 'Profit']]
scaled = StandardScaler().fit_transform(features)

kmeans = KMeans(n_clusters=3, random_state=42)
df['Cluster'] = kmeans.fit_predict(scaled)

df[['Sales', 'Profit', 'Cluster']].head()



## 6. Analisis Deret Waktu (Time Series)
Menganalisis tren penjualan dan melakukan peramalan menggunakan ARIMA.


In [None]:

from statsmodels.tsa.arima.model import ARIMA

ts_sales = df.groupby('Date')['Sales'].sum()
ts_sales.plot(title='Total Sales Over Time')

model_arima = ARIMA(ts_sales, order=(1,1,1))
result = model_arima.fit()
result.summary()



## 7. Visualisasi Interaktif
Visualisasi interaktif untuk mendukung storytelling data.


In [None]:

import plotly.express as px

fig = px.bar(
    df,
    x='Country',
    y='Sales',
    color='Segment',
    title='Sales by Country and Segment'
)
fig.show()



## 8. Kesimpulan
Notebook ini menunjukkan implementasi lengkap Business Intelligence menggunakan Python 
dengan dataset Financial Sample Workbook, dan dapat dikembangkan lebih lanjut 
menjadi dashboard web interaktif menggunakan Dash.
