#Data Preparation

Install dan import package

In [None]:
import pandas as pd
import numpy as np
import tensorflow as tf
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

Read Dataset

In [None]:
data_restaurant="https://docs.google.com/spreadsheets/d/e/2PACX-1vTyCBQxA1HyRnQWj-RXf-_5DXKn3L90Td0aO5r8DsTtE7pO3IQbPVvcuhfaCmJvTwiD_Hhvw34Xzbya/pub?gid=2129966204&single=true&output=csv"
data_makanminum="https://docs.google.com/spreadsheets/d/e/2PACX-1vTyCBQxA1HyRnQWj-RXf-_5DXKn3L90Td0aO5r8DsTtE7pO3IQbPVvcuhfaCmJvTwiD_Hhvw34Xzbya/pub?gid=477290477&single=true&output=csv"

# membaca kedua sheet ke dalam DataFrame
data_resto = pd.read_csv(data_restaurant)
data_makmin = pd.read_csv(data_makanminum)

print(data_resto.head())
print(data_makmin.head())

  resto_id                                      nama_restoran  \
0   RT01J1                Mie Bandung Chinese Food, Ngampilan   
1   RT02J1  Soto Tauco Pekalongan Bu Iswi, Jalan Bimokurdo...   
2   RT03J1                  Bakso Urat dan Mie Ayam "Pak Mir"   
3   RT04J1  Soto Ayam Kampung Dan Soto Daging Sapi Pak Gendut   
4   RT05J1                                          Toba Tabo   

  preferensi_makanan lokasi_restoran  Harga_Rata-Rata_Makanan_di_Toko (Rp)  \
0            Chinese         3.23 km                                 39000   
1          Indonesia         3.01 km                                 19000   
2          Indonesia         1.44 km                                 18000   
3          Indonesia         0.83 km                                 22000   
4            Chinese         2.13 km                                 40000   

   rating_toko jenis_suasana toko_sering_diskon_(Ya/Tidak)  \
0          4.7        Santai                         Tidak   
1          3.7  

Memilih kolom yang digunakan

In [None]:
data_makmin.columns = data_makmin.columns.str.strip()

columns_to_select = ['makanan/minuman', 'kategori', 'deskripsi_rasa']
makanan_data = data_makmin[columns_to_select]

print("\nDataset dengan kolom terpilih:")
print(makanan_data.head())


Dataset dengan kolom terpilih:
  makanan/minuman       kategori                               deskripsi_rasa
0    Sate Klathak  Makanan Berat                   Gurih, pedas, juicy, smoky
1    Soto Kambing  Makanan Berat  Gurih, pedas, rempah, segar, lezat, berkuah
2    Sate Kambing  Makanan Berat      Gurih, pedas, juicy, smoky, asin, manis
3     Wedang Uwuh        Minuman                 Manis, hangat, rempah, segar
4          Bakpia        Jajanan                 Manis, lembut, gurih, kacang


In [None]:
#memilih kolom sheet data restoran
data_resto.columns = data_resto.columns.str.strip()

columns_select = ['nama_restoran', 'rating_toko', 'variasi_makanan']
restoran_data = data_resto[columns_select]

print("\nDataset dengan kolom terpilih:")
print(restoran_data.head())


Dataset dengan kolom terpilih:
                                       nama_restoran  rating_toko  \
0                Mie Bandung Chinese Food, Ngampilan          4.7   
1  Soto Tauco Pekalongan Bu Iswi, Jalan Bimokurdo...          3.7   
2                  Bakso Urat dan Mie Ayam "Pak Mir"          3.6   
3  Soto Ayam Kampung Dan Soto Daging Sapi Pak Gendut          3.8   
4                                          Toba Tabo          4.7   

                                     variasi_makanan  
0  Bakmi, Nasi Goreng, Mie Ayam, Kwetiaw, Bakso P...  
1  Bakso, Soto Tauco, Lontong, Es Teh, Es Jeruk, ...  
2         Bakso, Sop Ayam, Jajanan, Es Jeruk, Es Teh  
3  Soto Daging, Soto Ayam, Perkedel, Es Teh, Es J...  
4  Sate Babi, Babi Kecap, Bakmi Babi, Kopi, Es Ko...  


Pre processing

In [None]:
# Menangani nilai NaN dalam kolom 'deskripsi_rasa'
makanan_data['deskripsi_rasa'].fillna('', inplace=True)

# Encoding kategori makanan
label_encoder = LabelEncoder()
makanan_data['kategori_Encoded'] = label_encoder.fit_transform(makanan_data['kategori'])

# Membagi dataset menjadi data latih dan data uji
X_train, X_test, y_train, y_test = train_test_split(makanan_data['deskripsi_rasa'],
                                                    makanan_data['kategori_Encoded'],
                                                    test_size=0.2, random_state=42)

# Membuat vektor fitur dari deskripsi rasa menggunakan TfidfVectorizer
vectorizer = TfidfVectorizer()
X_train_vec = vectorizer.fit_transform(X_train).toarray()  # Konversi ke bentuk array
X_test_vec = vectorizer.transform(X_test).toarray() # Konversi ke bentuk array

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  makanan_data['deskripsi_rasa'].fillna('', inplace=True)
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  makanan_data['kategori_Encoded'] = label_encoder.fit_transform(makanan_data['kategori'])


# Membangun model rekomendasi makanan bedasarkan deskripsi rasa

In [None]:
# Membangun model
model = tf.keras.Sequential([
    tf.keras.layers.Dense(256, activation='relu', input_shape=(X_train_vec.shape[1],)),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(128, activation='relu'),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(64, activation='relu'),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(len(label_encoder.classes_), activation='softmax')
])

In [None]:
# Create and compile the model
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

In [None]:
# Train the model
model.fit(X_train_vec,
          y_train, epochs=100, validation_split=0.2)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

<keras.src.callbacks.History at 0x77fdf34765f0>

In [None]:
#Evaluasi akurasi
test_loss, test_acc = model.evaluate(X_test_vec, y_test)
print('Test accuracy:', test_acc)

Test accuracy: 0.7903226017951965


In [None]:
#Fungsi untuk merekomendasikan makanan/minuman bedasarkan inputan
def recommend_makanan(category, taste):
    # Vektorisasi input menggunakan TfidfVectorizer
    input_vec = vectorizer.transform([taste]).toarray()

    # Prediksi kategori
    category_pred = model.predict(input_vec)

    # Mendapatkan kategori yang diprediksi
    predicted_category = label_encoder.inverse_transform([category_pred.argmax()])[0]

    # Filter data berdasarkan kategori yang diprediksi
    category_data = makanan_data[makanan_data['kategori'] == category]

    # Vektorisasi deskripsi rasa dalam data latih
    X_train_category = vectorizer.transform(category_data['deskripsi_rasa']).toarray()

    # Hitung similarity scores antara input dan deskripsi makanan dalam data latih
    similarity_scores = cosine_similarity(input_vec, X_train_category)

    # Dapatkan indeks top 5 makanan yang paling mirip
    top_indices = similarity_scores.argsort()[0][-5:][::-1]

    # Dapatkan rekomendasi makanan berdasarkan kategori yang diprediksi
    recommended_food = category_data.iloc[top_indices]['makanan/minuman'].values

    return recommended_food

Inputan Dropdown button & free text (for testing)

- Dropdown button untuk inputan kategori
- Free text untuk inputan deskripsi rasa


In [None]:
# Contoh penggunaan
category = 'Jajanan'
taste = 'asin, gurih, renyah'
recommended_food = recommend_makanan(category, taste)

print("Rekomendasi makanan bedasarkan kategori '{}' dengan rasa '{}':".format(category, taste))
for idx, food in enumerate(recommended_food, 1):
    print("{}. {}".format(idx, food))

Rekomendasi makanan bedasarkan kategori 'Jajanan' dengan rasa 'asin, gurih, renyah':
1. Lumpia
2. Tempura
3. Emping
4. kentang Goreng
5. Roti Bakar Keju


In [None]:
import ipywidgets as widgets
from IPython.display import display, clear_output

# Fungsi untuk menangani aksi tombol submit
def submit_action(b):
    category = category_dropdown.value
    taste = taste_input.value
    recommended_makanan = recommend_makanan(category, taste)

    # Membersihkan output sebelumnya
    with output:
        clear_output(wait=True)

        # Menampilkan hasil rekomendasi makanan
        print(f"Rekomendasi makanan bedasarkan kategori '{category}' dengan rasa '{taste}':")
        for makanan in recommended_makanan:
            print(f"- {makanan}")


# Membuat dropdown untuk kategori
category_options = ['Makanan Berat', 'Makanan Ringan', 'Jajanan', 'Minuman']
category_dropdown = widgets.Dropdown(
    options=category_options,
    value=category_options[0],
    description='Category:',
    disabled=False,
)

# Membuat kolom input untuk rasa
taste_input = widgets.Text(
    value='',
    placeholder='Enter taste',
    description='Taste:',
    disabled=False
)

# Membuat tombol submit
submit_button = widgets.Button(
    description='Submit',
    disabled=False,
    button_style='', # 'success', 'info', 'warning', 'danger' or ''
    tooltip='Click me',
    icon='check' # (FontAwesome names without the `fa-` prefix)
)

# Membuat widget output untuk menampilkan hasil
output = widgets.Output()

# Menambahkan event handler untuk tombol submit
submit_button.on_click(submit_action)

# Menampilkan dropdown kategori, kolom input rasa, dan tombol submit
display(category_dropdown, taste_input, submit_button, output)

Dropdown(description='Category:', options=('Makanan Berat', 'Makanan Ringan', 'Jajanan', 'Minuman'), value='Ma…

Text(value='', description='Taste:', placeholder='Enter taste')

Button(description='Submit', icon='check', style=ButtonStyle(), tooltip='Click me')

Output()

#Rekomendasi restoran bedasarkan makanan yang dipilih

In [None]:
makanan_data['Features'] = makanan_data['makanan/minuman']

# Encode data teks menggunakan TF-IDF
tfidf = TfidfVectorizer()
tfidf_matrix_mamin= tfidf.fit_transform(makanan_data['Features'])

Cosine Similarity

In [None]:
# Menangani nilai NaN dalam kolom 'variasi_makanan'
restoran_data['variasi_makanan'].fillna('', inplace=True)

# matrix TF-IDF untuk data restoran
tfidf_matrix_restaurant = tfidf.transform(restoran_data['variasi_makanan'])

# Menghitung cosine similarity antara matriks TF-IDF makanan dan restoran
cosine_sim = cosine_similarity(tfidf_matrix_mamin, tfidf_matrix_restaurant)

# Fungsi untuk merekomendasikan restoran bedasarkan makanan yang dipilih
def recommend_restaurants_for_food_containing_keyword(keyword, cosine_sim, makanan_data, restoran_data):
    # Menemukan indeks makanan yang mengandung kata kunci
    food_indices = makanan_data[makanan_data['makanan/minuman'].str.contains(keyword, case=False, na=False)].index.tolist()

    # Daftar restoran yang direkomendasikan dengan skor cosine similarity
    recommended_restaurants_with_scores = []

    for food_index in food_indices:
        # Hitung dan urutkan skor cosine similarity untuk setiap makanan
        sim_scores = list(enumerate(cosine_sim[food_index]))
        sim_scores = sorted(sim_scores, key=lambda x: x[1], reverse=True)

        # Mendapatkan 5 restoran teratas yang paling mirip dengan skor cosine similarity untuk setiap makanan
        top_similar_restaurants = sim_scores[:5]

        for idx, score in top_similar_restaurants:
            recommended_restaurants_with_scores.append((restoran_data.iloc[idx]['nama_restoran'],
                                                        score, makanan_data.iloc[food_index]['makanan/minuman']))

    # Mengurutkan daftar akhir bedasarkan skor cosine similarity
    recommended_restaurants_with_scores.sort(key=lambda x: x[1], reverse=True)

    # Mendapatkan rekomendasi unik untuk menghindari adanya duplikasi
    unique_recommendations = []
    seen_restaurants = set()
    for rec in recommended_restaurants_with_scores:
        if rec[0] not in seen_restaurants:
            seen_restaurants.add(rec[0])
            unique_recommendations.append(rec)

    return unique_recommendations[:5]

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  restoran_data['variasi_makanan'].fillna('', inplace=True)


Inputan makanan yang dipilih

In [None]:
# Memilih makanan
selected_food = 'kue adrem'

# Merekomendasikan restoran
recommended_restaurants_with_scores = recommend_restaurants_for_food_containing_keyword(selected_food, cosine_sim, makanan_data, restoran_data)

print(f"Rekomendasi restoran yang menyediakan makanan/minuman yang memiliki menu '{selected_food}' :")
for nama_restoran, score, variasi_makanan in recommended_restaurants_with_scores:
    print(f"- {nama_restoran} menyediakan {variasi_makanan}")

Rekomendasi restoran yang menyediakan makanan/minuman yang memiliki menu 'kue adrem' :
- Lupis Mbah Satinem  menyediakan Kue Adrem 
- Kipo Bu Djito ꦏꦶꦥꦺꦴꦧꦸꦣ꧀ꦗꦶꦠꦺꦴ menyediakan Kue Adrem 
- Panada & Puding RoBin menyediakan Kue Adrem 
- Kue Bandung & Pukis Ko Ayung Kotabaru menyediakan Kue Adrem 
- Lapis Legit Langgeng Sari menyediakan Kue Adrem 


In [None]:
model.save('modelrecom.h5')

  saving_api.save_model(


In [None]:
# Simpan file .pkl

import pickle
with open('modelrecom.pkl','wb') as file:
  pickle.dump(model, file)