In [None]:
# SOAL 1: Membuat Dataset Penjualan (Digitalise & Collect)
import pandas as pd

# Buat data penjualan toko
data = {
    "Tanggal": ["2025-02-15", "2025-02-15", "2025-02-16", "2025-02-16", "2025-02-17", "2025-02-17", "2025-02-18", "2025-02-18", "2025-02-19", "2025-02-19"],
    "Produk": ["Laptop", "Mouse", "Keyboard", "Monitor", "Printer", "Flashdisk", "Hard Disk", "Solid State Disk", "Speaker", "Headphone"],
    "Jumlah Terjual": [5, 10, 7, 3, 2, 20, 4, 6, 8, 9],
    "Stok": [10, 50, 30, 15, 8, 100, 12, 20, 25, 18],
    "Harga Satuan": [12000000, 150000, 300000, 2500000, 1800000, 100000, 1200000, 1500000, 750000, 950000],
}

# Simpan dalam DataFrame
df = pd.DataFrame(data)

# Format harga satuan dengan titik sebagai pemisah ribuan
df["Harga Satuan"] = df["Harga Satuan"].apply(lambda x: "{:,.0f}".format(x).replace(",", "."))

# Simpan sebagai file CSV
df.to_csv("data_penjualan_latihan.csv", index=False)

# Tampilkan DataFrame
print(df)

In [None]:
# SOAL 2: Membersihkan dan Mengolah Data (Transform)
import pandas as pd

# 1. Baca file CSV
df = pd.read_csv("data_penjualan_latihan.csv")

# 2. Cek data yang hilang dan isi dengan nilai default
df.fillna({
    "Tanggal": "2025-01-01",  # Default tanggal jika kosong
    "Produk": "Tidak Diketahui",
    "Jumlah Terjual": 0,
    "Stok": 0,
    "Harga Satuan": "0"
}, inplace=True)

# Konversi kolom Harga Satuan ke integer (hilangkan titik pemisah ribuan dulu)
df["Harga Satuan"] = df["Harga Satuan"].astype(str).str.replace(".", "").astype(int)

# 3. Konversi kolom Tanggal ke format datetime
df["Tanggal"] = pd.to_datetime(df["Tanggal"], format="%Y-%m-%d")

# 4. Tambahkan kolom baru
df["Total Penjualan"] = df["Jumlah Terjual"] * df["Harga Satuan"]
df["Keuntungan"] = (df["Jumlah Terjual"] * df["Harga Satuan"]) - (df["Jumlah Terjual"] * 10_000)

# Format angka agar menggunakan titik sebagai pemisah ribuan
df["Harga Satuan"] = df["Harga Satuan"].apply(lambda x: "{:,.0f}".format(x).replace(",", "."))
df["Total Penjualan"] = df["Total Penjualan"].apply(lambda x: "{:,.0f}".format(x).replace(",", "."))
df["Keuntungan"] = df["Keuntungan"].apply(lambda x: "{:,.0f}".format(x).replace(",", "."))

# 5. Tampilkan 5 data pertama setelah transformasi
print(df.head())


In [None]:
#SOAL 3: Melatih Model AI (Train & Execute)
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import accuracy_score

# 1. Baca file CSV yang sudah dibersihkan
df = pd.read_csv("data_penjualan_latihan.csv")

# Konversi kolom Harga Satuan ke integer (hilangkan titik pemisah ribuan dulu jika ada)
df["Harga Satuan"] = df["Harga Satuan"].astype(str).str.replace(".", "").astype(int)

# 2. Tambahkan kolom "Perlu Restock" (1 jika stok < 5, 0 jika tidak)
df["Perlu Restock"] = df["Stok"].apply(lambda x: 1 if x < 5 else 0)

# 3. Pisahkan data menjadi fitur (X) dan target (y)
X = df[["Jumlah Terjual", "Stok"]]
y = df["Perlu Restock"]

# 4. Split data menjadi Training (80%) dan Testing (20%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 5. Latih model Decision Tree
model = DecisionTreeClassifier(random_state=42)
model.fit(X_train, y_train)

# 6. Prediksi pada data testing
y_pred = model.predict(X_test)

# 7. Evaluasi akurasi model
accuracy = accuracy_score(y_test, y_pred)
print(f"Akurasi model: {accuracy:.2%}")

In [None]:
# SOAL 4: Prediksi Restock Produk (Execute & Insights)
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier

# 1. Baca dataset yang sudah dibersihkan
df = pd.read_csv("data_penjualan_latihan.csv")

# Konversi Harga Satuan ke integer jika masih dalam format string dengan pemisah titik
df["Harga Satuan"] = df["Harga Satuan"].astype(str).str.replace(".", "").astype(int)

# Tambahkan kolom "Perlu Restock"
df["Perlu Restock"] = df["Stok"].apply(lambda x: 1 if x < 5 else 0)

# Definisikan fitur (X) dan target (y)
X = df[["Jumlah Terjual", "Stok"]]
y = df["Perlu Restock"]

# Pisahkan data Training (80%) dan Testing (20%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Latih model Decision Tree
model = DecisionTreeClassifier(random_state=42)
model.fit(X_train, y_train)

# 2. Prediksi apakah produk baru perlu di-restock
produk_baru = [[8, 3]]  # Jumlah Terjual = 8, Stok = 3
prediksi = model.predict(produk_baru)

# 3. Cetak hasil prediksi
if prediksi[0] == 1:
    print("Prediksi untuk produk baru (Jumlah Terjual = 8, Stok = 3):\n  Produk perlu di-restock!")
else:
    print("Prediksi untuk produk baru (Jumlah Terjual = 8, Stok = 3):\n  Produk tidak perlu di-restock!")

# 4. Buat visualisasi hubungan Jumlah Terjual dan Stok terhadap Keuntungan
df["Keuntungan"] = (df["Jumlah Terjual"] * df["Harga Satuan"]) - (df["Jumlah Terjual"] * 10_000)

plt.figure(figsize=(8, 6))
plt.scatter(df["Jumlah Terjual"], df["Keuntungan"], c=df["Stok"], cmap="coolwarm", edgecolors="k", alpha=0.7)
plt.colorbar(label="Stok (Unit)")
plt.xlabel("Jumlah Terjual")
plt.ylabel("Keuntungan (Rp)")
plt.title("Hubungan Jumlah Terjual, Stok, dan Keuntungan")
plt.grid(True)
plt.show()
