Import terlebih dahulu library yang akan kita gunakan

In [None]:
import pandas as pd
from sklearn.feature_extraction.text import CountVectorizer
from sklearn.model_selection import train_test_split
from sklearn.naive_bayes import MultinomialNB
import pickle
from google.colab import data_table
data_table.disable_dataframe_formatter()

Setelah kode di atas dieksekusi, kita dapat menggunakan fungsi dan kelas yang diimpor untuk melakukan analisis teks menggunakan metode klasifikasi Naive Bayes.

In [None]:
# Membaca dataset
data = pd.read_csv('https://gitlab.com/kempess/dataset-article/-/raw/main/dataset_produk.csv')

Dengan menggunakan baris kode tersebut, dataset makanan dari file CSV akan dibaca dan disimpan dalam variabel data. kita dapat menggunakan variabel ini untuk melakukan analisis data lebih lanjut menggunakan pustaka pandas.

In [None]:
data.head(len(data))

kode tersebut bertujuan untuk melihat beberapa baris pertama dari dataset makanan yang telah dibaca dari file CSV

In [None]:
# Provides some information regarding the columns in the data
data.info()

In [None]:
# Melakukan tokenisasi pada kolom yang menunjukkan "kategori halal"
vectorizer = CountVectorizer()
X_text = data['Nama Produk']
X_name = data['Keterangan Halal']
X = vectorizer.fit_transform(X_text + ' ' + X_name)

# Memisahkan fitur (X) dan target (y)
y = data['Status']

# Memecah kumpulan data menjadi data latihan dan data uji
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Membuat objek Naive Bayes
model = MultinomialNB()

# Melatih model menggunakan data latih
model.fit(X_train, y_train)

# Menyimpan model ke dalam file pickle
filename = 'naive_bayes_model.pkl'
with open(filename, 'wb') as file:
    pickle.dump(model, file)

In [None]:
from sklearn.metrics import accuracy_score
import pickle

# Membuka file model
with open('naive_bayes_model.pkl', 'rb') as file:
    model = pickle.load(file)

# Lakukan prediksi menggunakan model
predicted = model.predict(X_test)  # X_test adalah data uji yang digunakan

# Hitung dan cetak akurasi
accuracy = accuracy_score(y_test, predicted)  # y_test adalah label yang sesuai dengan X_test
print("MultinomialNB Accuracy:", accuracy)


Dengan menggunakan baris-baris kode di atas, dilakukan pelatihan model klasifikasi Naive Bayes menggunakan dataset makanan yang telah diolah menjadi matriks fitur. Model tersebut kemudian disimpan dalam file pickle untuk digunakan di masa mendatang tanpa perlu melatih ulang model.

In [None]:
# Membaca model dari file pickle
with open(filename, 'rb') as file:
    loaded_model = pickle.load(file)

# Menerima input dari pengguna
new_data = input("Masukkan makanan atau minuman (pisahkan dengan koma jika lebih dari satu): ")
new_data = new_data.split(',')

# Mengubah data input menjadi bentuk yang dapat diproses oleh model
new_data_transformed = vectorizer.transform(new_data)

# Melakukan prediksi menggunakan model yang telah disimpan
predictions = loaded_model.predict(new_data_transformed)

# Menampilkan hasil prediksi
for data, prediction in zip(new_data, predictions):
    print(f'Makanan: {data.strip()}, Prediksi: {prediction}')


Dengan menggunakan baris-baris kode di atas, model klasifikasi Naive Bayes yang telah disimpan sebelumnya diambil dari file pickle. Kemudian, pengguna diminta untuk memasukkan data makanan yang akan diprediksi. Setelah itu, model melakukan prediksi terhadap data input tersebut, dan hasil prediksi ditampilkan kepada pengguna.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
# Membaca dataset
data = pd.read_csv('https://gitlab.com/kempess/dataset-article/-/raw/main/dataset_produk.csv')
# Grafik Bar untuk Jumlah Data pada Setiap Status
status_counts = data['Status'].value_counts()
plt.figure(figsize=(8, 6))
plt.bar(status_counts.index, status_counts.values)
plt.xlabel('Status')
plt.ylabel('Jumlah Data')
plt.title('Jumlah Data pada Setiap Status')
plt.show()




In [None]:
# Grafik Pie untuk Proporsi Status
plt.figure(figsize=(6, 6))
plt.pie(status_counts.values, labels=status_counts.index, autopct='%1.1f%%')
plt.title('Proporsi Status')
plt.show()



In [None]:
# Grafik Bar untuk Jumlah Data pada Setiap keterangan Halal
keterangan_counts = data['Keterangan Halal'].value_counts().head(10)
plt.figure(figsize=(10, 6))
plt.bar(keterangan_counts.index, keterangan_counts.values)
plt.xlabel('Keterangan Halal')
plt.ylabel('Jumlah Data')
plt.title('Jumlah Data pada Setiap Keterangan Halal (Top 10)')
plt.xticks(rotation=45)
plt.show()

## Kesimpulan

Dalam kode yang diberikan, dilakukan klasifikasi makanan untuk menentukan status halal dan haram menggunakan metode Naive Bayes. Langkah-langkah yang dijalankan mencakup membaca dataset, tokenisasi teks menggunakan CountVectorizer, membagi dataset menjadi data latih dan data uji, membuat objek model Naive Bayes, melatih model menggunakan data latih, dan menyimpan model yang telah dilatih ke dalam file pickle.Setelah model dilatih, pengguna dapat memasukkan data makanan sebagai input. Data input tersebut kemudian diubah menjadi bentuk yang dapat diproses oleh model, dan prediksi status halal dan haram dilakukan menggunakan model yang telah disimpan sebelumnya. Hasil prediksi ditampilkan kepada pengguna. Dengan menggunakan metode Naive Bayes, kode ini memberikan cara untuk melakukan klasifikasi makanan dengan mengidentifikasi status halal dan haram berdasarkan teks yang terkait dengan kriteria halal.