In [3]:
import numpy as np
from sklearn.cluster import KMeans
from sklearn.naive_bayes import MultinomialNB
from sklearn.tree import DecisionTreeClassifier
from sklearn.feature_extraction import DictVectorizer
from sklearn.tree import export_text


# Data pelanggan dengan atribut usia, jenis kelamin, pendapatan, dan kategori pembelian
customer_data = {},
    # Tambahkan data pelanggan lainnya jika diperlukan

# Melakukan k-means clustering
def kmeans():
    # Mengubah data menjadi format yang sesuai untuk k-means clustering
    X = []
    for customer, attributes in customer_data.items():
        X.append([attributes["usia"], attributes["pendapatan"]])
    
    # Membangun model k-means clustering
    kmeans = KMeans(n_clusters=3)
    kmeans.fit(X)
    
    # Mendapatkan hasil kelompok untuk setiap pelanggan
    customer_clusters = {}
    for i, customer in enumerate(customer_data.keys()):
        customer_clusters[customer] = kmeans.labels_[i]
    
    return customer_clusters

# Melakukan analisis pembelian dengan kolaborasi Naive Bayes
def analyze_pur(customer_clusters):
    # Mengubah data menjadi format yang sesuai untuk kolaborasi Naive Bayes
    X = []
    y = []
    for customer, attributes in customer_data.items():
        X.append(attributes)
        cluster = customer_clusters[customer]
        y.append(attributes["kategori_pembelian"])
    
    # Membangun model kolaborasi Naive Bayes
    vectorizer = DictVectorizer()
    X_transformed = vectorizer.fit_transform(X)
    naive_bayes = MultinomialNB()
    naive_bayes.fit(X_transformed, y)
    
    # Mendapatkan hasil analisis pembelian untuk setiap kelompok
    cluster_purchases = {}
    for customer, attributes in customer_data.items():
        cluster = customer_clusters[customer]
        purchase_category = attributes["kategori_pembelian"]
        if cluster not in cluster_purchases:
            cluster_purchases[cluster] = []
        cluster_purchases[cluster].append(purchase_category)
    
    return cluster_purchases

# Membangun pohon keputusan berdasarkan hasil analisis
def build(cluster_purchases):
    # Mengubah data menjadi format yang sesuai untuk pohon keputusan
    X = []
    y = []
    for cluster, purchases in cluster_purchases.items():
        for purchase in purchases:
            X.append(cluster)
            y.append(purchase)
    
    # Membangun pohon keputusan
    decision_tree = DecisionTreeClassifier()
    decision_tree.fit(np.array(X).reshape(-1, 1), y)
    
    return decision_tree

# Melakukan prediksi pengiriman paket berdasarkan pohon keputusan
def predict_del(customer, purchase_category, decision_tree):
    # Melakukan prediksi pengiriman paket
    prediction = decision_tree.predict([[customer_clusters[customer]]])
    
    # Menampilkan hasil prediksi
    print(f"Prediksi pengiriman paket untuk {customer} dengan pembelian kategori {purchase_category}: {prediction[0]}")

# Menampilkan struktur pohon keputusan
def display_dec(decision_tree):
    tree_text = export_text(decision_tree, feature_names=["Cluster"])
    print("Struktur Pohon Keputusan:")
    print(tree_text)

# Menjalankan alur pemrosesan
customer_clusters = kmeans_clustering()
cluster_purchases = analyze_purchases(customer_clusters)
decision_tree = build_decision_tree(cluster_purchases)

predict_delivery("Pelanggan 1", "Elektronik", decision_tree)
predict_delivery("Pelanggan 2", "Makanan", decision_tree)
predict_delivery("Pelanggan 3", "Perawatan Kesehatan", decision_tree)

display_decision_tree(decision_tree)

Prediksi pengiriman paket untuk Pelanggan 1 dengan pembelian kategori Elektronik: Elektronik
Prediksi pengiriman paket untuk Pelanggan 2 dengan pembelian kategori Makanan: Makanan
Prediksi pengiriman paket untuk Pelanggan 3 dengan pembelian kategori Perawatan Kesehatan: Perawatan Kesehatan
Struktur Pohon Keputusan:
|--- Cluster <= 0.50
|   |--- class: Makanan
|--- Cluster >  0.50
|   |--- Cluster <= 1.50
|   |   |--- class: Perawatan Kesehatan
|   |--- Cluster >  1.50
|   |   |--- class: Elektronik



