In [1]:
import pandas as pd
import random

# List untuk menampung data
data_list = []

# Prefiks untuk setiap kelas
kelas_info = {
    'DC': 100,
    'DL': 100,
    'B': 100,
    'Lainnya': 100
}

# Prefiks untuk kelas 'Lainnya'
plat_lainnya = ['KT', 'DA', 'DE', 'DG', 'DL', 'DM', 'DT']

# Fungsi untuk membuat nomor plat acak
def buat_nomor_acak():
    nomor = random.randint(1000, 9999)
    huruf_akhir = "".join(random.choices('ABCDEFGHIJKLMNOPQRSTUVWXYZ', k=2))
    return f"{nomor} {huruf_akhir}"

# Membuat data untuk setiap kelas
for kelas, jumlah in kelas_info.items():
    for _ in range(jumlah):
        if kelas == 'Lainnya':
            prefiks = random.choice(plat_lainnya)
        else:
            prefiks = kelas

        plat_teks = f"{prefiks} {buat_nomor_acak()}"
        data_list.append({'plat_teks': plat_teks, 'kelas': kelas})

# Mengacak urutan data agar lebih realistis
random.shuffle(data_list)

# Membuat DataFrame dan menyimpannya ke CSV
df = pd.DataFrame(data_list)
df.to_csv('plat_nomor.csv', index=False)

print("File 'plat_nomor.csv' dengan 400 data dummy berhasil dibuat!")
print("Contoh 5 baris pertama dari data:")
print(df.head())

File 'plat_nomor.csv' dengan 400 data dummy berhasil dibuat!
Contoh 5 baris pertama dari data:
    plat_teks    kelas
0  DL 5924 UT       DL
1  DC 2398 QN       DC
2  DG 9481 DP  Lainnya
3  DT 7087 SR  Lainnya
4  DM 4286 SA  Lainnya


In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score



def ekstrak_kode_depan(plat_teks):
    """
    Fungsi sederhana untuk mengambil 2 karakter pertama sebagai fitur utama.
    Ini adalah bagian dari implementasi manual Anda.
    """
    # Mengambil 2 karakter pertama dan membersihkan spasi
    kode = plat_teks[:2].strip()
    return kode

def tentukan_kelas_dari_kode(kode_depan):
    """
    Mengubah kode depan menjadi kelas yang sesuai.
    """
    if kode_depan == 'DC':
        return 'DC'
    elif kode_depan == 'DL':
        return 'DL'
    elif kode_depan == 'B':
        return 'B'
    else:
        return 'Lainnya'

def hitung_akurasi_manual(label_asli, hasil_prediksi):
    """
    Fungsi manual untuk menghitung akurasi.
    """
    cocok = 0
    # Menggunakan .values untuk membandingkan array numpy secara langsung
    label_asli_array = label_asli.values

    for i in range(len(label_asli_array)):
        if label_asli_array[i] == hasil_prediksi[i]:
            cocok += 1
    return cocok / len(label_asli_array)


try:
    data = pd.read_csv('plat_nomor.csv')
    print("\nData berhasil dimuat.")
except FileNotFoundError:
    print("File 'plat_nomor.csv' tidak ditemukan. Pastikan Anda sudah menjalankan sel pertama.")


# 2. Proses Fitur dan Label
fitur = data['plat_teks'].apply(ekstrak_kode_depan)
label = data['kelas']

fitur_numerik = pd.get_dummies(fitur)

# 3. Bagi Data (80% latih, 20% uji)
X_train, X_test, y_train, y_test = train_test_split(fitur_numerik, label, test_size=0.2, random_state=42, stratify=label)

# 4. Latih Model (menggunakan library scikit-learn)
model = KNeighborsClassifier(n_neighbors=5)
model.fit(X_train, y_train)
print("Model berhasil dilatih.")

# 5. Uji Model
prediksi = model.predict(X_test)

# 6. Evaluasi Kinerja
print("-" * 30)
print("Hasil Evaluasi Model:")
# Menggunakan fungsi evaluasi dari library untuk perbandingan
akurasi_library = accuracy_score(y_test, prediksi)
print(f"Akurasi (dari scikit-learn): {akurasi_library * 100:.2f}%")

# Menggunakan fungsi evaluasi manual yang sudah kita buat
akurasi_manual = hitung_akurasi_manual(y_test, prediksi)
print(f"Akurasi (dari fungsi manual): {akurasi_manual * 100:.2f}%")
print("-" * 30)


# 7. Contoh Prediksi Aplikasi Sederhana
def prediksi_plat_baru(plat):
    kode_depan = ekstrak_kode_depan(plat)
    kelas_prediksi = tentukan_kelas_dari_kode(kode_depan)
    print(f"Plat '{plat}' diprediksi sebagai kelas: {kelas_prediksi}")

print("\nContoh Penggunaan Aplikasi:")
prediksi_plat_baru("DC 4321 XY")
prediksi_plat_baru("B 1 JKL")
prediksi_plat_baru("KT 8888 ABC")