# Install library
!: Digunakan untuk menginstall library python secara massal

Split-folders: Library untuk membagi dataset menjadi train set dan validation set dengan mudah

Pathlib: Library untuk memanipulasi path dan file system pada Python

Matplotlib: Library untuk membuat plot visualisasi data

Tensorflow: Library open-source untuk mengembangkan model machine learning

Pillow: Library untuk manipulasi gambar, seperti mengubah ukuran, memotong, dan memutar gambar

Numpy: Library Python yang digunakan untuk mengelola array dan matriks

In [None]:
!pip install split-folders pathlib matplotlib tensorflow pillow numpy

# Pembagian dataset
Ratio yang digunakan adalah 80:20, 80% dataset dan 20% validation set

Seed digunakan untuk merandomize dataset

In [None]:
import splitfolders as sf

sf.ratio(r"C:\Users\arfan\train\Model\dataset", output=r"C:\Users\arfan\train\Model\dataset_splitfolder",
    seed=42, ratio=(.8, .2), group_prefix=None, move=False) # default values

# Menentukan direktori train set dan validation set

In [None]:
train_dir = r"C:\Users\arfan\train\Model\dataset_splitfolder\train"
validation_dir = r"C:\Users\arfan\train\Model\dataset_splitfolder\val"

# Memuat foto
Menampilkan foto landmark dari dataset

In [None]:
import os
import random
import matplotlib.pyplot as plt
from tensorflow.keras.preprocessing.image import load_img

# Menentukan direktori dataset dan kelasnya
train_dir = r"C:\Users\arfan\train\Model\dataset_splitfolder\train"
class_names = sorted(os.listdir(train_dir))

# Menampilkan beberapa gambar secara acak dari setiap kelas
fig, ax = plt.subplots(nrows=len(class_names), ncols=4, figsize=(10, 20))
for i, class_name in enumerate(class_names):
    class_dir = os.path.join(train_dir, class_name)
    image_names = os.listdir(class_dir)
    for j in range(4):
        image_name = random.choice(image_names)
        image_path = os.path.join(class_dir, image_name)
        image = load_img(image_path, target_size=(224, 224))
        ax[i][j].imshow(image)
        ax[i][j].set_title(class_name)
        ax[i][j].axis('off')
plt.show()

# Memuat data dan memproses data
ImageDataGenerator untuk melakukan augmentasi data pada dataset training.

Flow_from_directory untuk membaca dataset train dan validation dari direktori yang telah ditentukan sebelumnya

Sparse pada class_mode, output dari generator akan berupa array 1 dimensi yang berisi nilai integer yang merepresentasikan kelas dari setiap sampel pada dataset.

In [None]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

train_datagen = ImageDataGenerator(rescale = 1./255.)

# Melakukan image augmentation pada dataset untuk menambah variasi data
train_datagen = ImageDataGenerator(rescale = 1./255.,
                                   rotation_range = 40,
                                   width_shift_range = 0.2,
                                   height_shift_range = 0.2,
                                   shear_range = 0.2,
                                   zoom_range = 0.2,
                                    horizontal_flip = True)

test_datagen = ImageDataGenerator(rescale = 1.0/255)

# Melakukan data generator untuk membaca dataset training di setiap label
train_generator = train_datagen.flow_from_directory(train_dir,
                                                    batch_size = 32,
                                                    class_mode = 'sparse', 
                                                    target_size = (224, 224))     

# Melakukan data generator untuk membaca dataset testing di setiap label
validation_generator =  test_datagen.flow_from_directory( validation_dir,
                                                          batch_size  = 32,
                                                          class_mode  = 'sparse', 
                                                          target_size = (224, 224))

# Menampilkan beberapa gambar yang telah di-augmentasi
fig, ax = plt.subplots(nrows=3, ncols=4, figsize=(10, 10))
for i in range(0, 3):
    for j in range(0, 4):
        image, label = next(train_generator)
        ax[i][j].imshow(image[0])
        ax[i][j].set_title(f"Label: {int(label[0])}")
        ax[i][j].axis('off')
plt.show()

# Labelling
Digunakan untuk melakukan mapping dari label integer ke nama kelas

In [None]:
labels = (train_generator.class_indices)

Merepresentasikan label integer

In [None]:
labels

# Arsitektur model
Mengimport library yang dibutuhkan untuk modelling

In [None]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout

# Penjelasan 
Model Sequential adalah model neural network yang terdiri dari sekumpulan layer yang saling tersambung secara berurutan.

Conv2D(): fungsi ini digunakan untuk menambahkan layer konvolusi pada model. Layer konvolusi digunakan untuk memproses citra dengan melakukan operasi konvolusi pada citra input.

MaxPooling2D(): fungsi ini digunakan untuk menambahkan layer pooling pada model. Layer pooling digunakan untuk mengekstraksi fitur-fitur penting dari citra input dengan melakukan operasi pooling pada citra.

Flatten(): fungsi ini digunakan untuk menambahkan layer flatten pada model. Layer flatten digunakan untuk meratakan output dari layer sebelumnya menjadi sebuah vektor satu dimensi.

Dense(): fungsi ini digunakan untuk menambahkan layer fully connected pada model. Layer fully connected digunakan untuk menghubungkan setiap neuron dari layer sebelumnya dengan setiap neuron pada layer selanjutnya.

Dropout(): fungsi ini digunakan untuk menambahkan layer dropout pada model. Layer dropout digunakan untuk mengurangi overfitting pada model dengan secara acak menonaktifkan beberapa neuron pada layer sebelumnya.

Activation: parameter ini digunakan untuk menentukan fungsi aktivasi pada setiap layer. Fungsi aktivasi digunakan untuk menambahkan sifat non-linear pada model sehingga model dapat mempelajari fitur-fitur yang kompleks.

Input_shape: parameter ini digunakan untuk menentukan ukuran input pada layer pertama. Ukuran input pada layer pertama harus sama dengan ukuran citra input.

Pool_size: parameter ini digunakan untuk menentukan ukuran window pada layer pooling. Ukuran window pada layer pooling digunakan untuk menentukan berapa banyak fitur yang akan dikeluarkan dari citra input pada setiap operasi pooling.

Model.add(Dense(5, activation='softmax')): Menambahkan layer Dense (fully connected) dengan 5 neuron yang merepresentasikan 5 kelas output yang diinginkan, dan menggunakan fungsi aktivasi softmax untuk mendapatkan nilai probabilitas untuk setiap kelas.

In [None]:
# Inisialisasi model
model = Sequential()

# Tambahkan layer pertama Conv2D dengan 32 filter dan ukuran kernel 3x3
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(224, 224, 3)))

# Tambahkan layer MaxPooling2D dengan ukuran pool 2x2
model.add(MaxPooling2D(pool_size=(2, 2)))

# Tambahkan layer kedua Conv2D dengan 64 filter dan ukuran kernel 3x3
model.add(Conv2D(64, (3, 3), activation='relu'))

# Tambahkan layer MaxPooling2D dengan ukuran pool 2x2
model.add(MaxPooling2D(pool_size=(2, 2)))

# Tambahkan layer ketiga Conv2D dengan 128 filter dan ukuran kernel 3x3
model.add(Conv2D(128, (3, 3), activation='relu'))

# Tambahkan layer MaxPooling2D dengan ukuran pool 2x2
model.add(MaxPooling2D(pool_size=(2, 2)))

# Tambahkan layer keempat Conv2D dengan 256 filter dan ukuran kernel 3x3
model.add(Conv2D(256, (3, 3), activation='relu'))

# Tambahkan layer MaxPooling2D dengan ukuran pool 2x2
model.add(MaxPooling2D(pool_size=(2, 2)))

# Tambahkan layer Flatten untuk mengubah input menjadi 1 dimensi
model.add(Flatten())

# Tambahkan layer Dense dengan 256 unit dan aktivasi relu
model.add(Dense(256, activation='relu'))

# Tambahkan layer Dropout untuk mencegah overfitting
model.add(Dropout(0.5))

# Tambahkan layer Dense terakhir dengan 5 unit dan aktivasi softmax untuk mendapatkan nilai probabilitas dari 5 kelas
model.add(Dense(5, activation='softmax'))

# Hasil model pembelajaran

In [None]:
model.summary()

# Compile model

Optimizer adam digunakan untuk optimasi yang akan menyesuaikan bobot dalam jaringan saraf tiruan

Fungsi loss yang digunakan untuk mengevaluasi seberapa baik model bekerja pada setiap iterasi. Karena output dari model merupakan label kelas yang berupa integer

Metrics accuracy digunakan untuk mengevaluasi kinerja model selama pelatihan dan pengujian

In [None]:
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.losses import sparse_categorical_crossentropy

model.compile(optimizer=Adam(), loss=sparse_categorical_crossentropy, metrics=['accuracy'])

Melatih model sebanyak 100 epoch

In [None]:
history = model.fit(train_generator, validation_data=validation_generator, epochs = 100)

# Evaluasi

Grafik pertama menampilkan akurasi pelatihan dan validasi terhadap jumlah epoch yang dilakukan

Grafik kedua menampilkan loss pelatihan dan validasi terhadap jumlah epoch yang dilakukan

In [None]:
import matplotlib.pyplot as plt

#history akurasi
acc = history.history['accuracy']
val_acc = history.history['val_accuracy']

#history loss
loss = history.history['loss']
val_loss = history.history['val_loss']

#subplot akurasi
plt.figure(figsize=(8, 8))
plt.subplot(2, 1, 1)
plt.plot(acc, label='Training Accuracy')
plt.plot(val_acc, label='Validation Accuracy')
plt.legend(loc='lower right')
plt.ylabel('Accuracy')
plt.ylim([min(plt.ylim()),1])
plt.title('Training and Validation Accuracy')

#subplot loss
plt.subplot(2, 1, 2)
plt.plot(loss, label='Training Loss')
plt.plot(val_loss, label='Validation Loss')
plt.legend(loc='upper right')
plt.ylabel('Cross Entropy')
plt.ylim([0,1.0])
plt.title('Training and Validation Loss')
plt.xlabel('epoch')
plt.show()

# Simpan model
Hasil model pembelajaran disimpan dengan extension h5, model.h5 akan digunakan untuk pembuatan web aplikasi menggunakan streamlit

In [None]:
model.save('model.h5')

# Pengujian

In [None]:
import tensorflow as tf
import numpy as np
import pathlib as pl
import matplotlib.pyplot as plt

gambar_folder = pl.Path("19_e.jpg")
nama_class = ['Candi Borobudur', 'Gedung Sate', 'Istana Maimun', 'Jembatan Ampera', 'Monumen Nasional']

# Load model
model = tf.keras.models.load_model('model.h5')

# Load gambar dan konversi ke array
gambar = tf.keras.utils.load_img(gambar_folder, target_size=(224, 224))
gambar_toarray = tf.keras.utils.img_to_array(gambar)
gambar_toarray = tf.expand_dims(gambar_toarray, 0) 

# Lakukan prediksi menggunakan model
prediksi = model.predict(gambar_toarray)
kelas_prediksi = nama_class[np.argmax(prediksi)]

# Tampilkan gambar dan hasil prediksi
fig, ax = plt.subplots()
ax.imshow(gambar)
ax.set_title("Diklasifikasikan Sebagai Landmark: {}".format(kelas_prediksi))
ax.axis('off')
plt.show()

# Pengujian tanpa jumlah total tanpa nama file

In [None]:
import tensorflow as tf
import numpy as np
import pathlib as pl
import matplotlib.pyplot as plt

# Definisikan path ke folder dataset
path = pl.Path(r"C:\Users\arfan\train\Model\dataset_splitfolder\val")

# Definisikan nama class
nama_class = ['Candi Borobudur', 'Gedung Sate', 'Istana Maimun', 'Jembatan Ampera', 'Monumen Nasional']

# Load model
model = tf.keras.models.load_model('model.h5')

# Definisikan ImageDataGenerator untuk melakukan augmentasi gambar pada data testing
test_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255)

# Load data testing dari folder menggunakan ImageDataGenerator
test_data = test_datagen.flow_from_directory(directory=path,
                                             target_size=(224, 224),
                                             classes=nama_class,
                                             class_mode='sparse',
                                             shuffle=False)

# Lakukan prediksi menggunakan model pada data testing
predictions = model.predict(test_data)

# Ambil indeks kelas dengan nilai probabilitas tertinggi dari setiap prediksi
predicted_classes = np.argmax(predictions, axis=1)

# Tampilkan hasil prediksi
for i, img, in enumerate(test_data.filenames):
    # Load gambar
    img_path = path / img
    img = tf.keras.utils.load_img(img_path, target_size=(224, 224))
    
    # Tampilkan gambar dan hasil prediksi
    fig, ax = plt.subplots()
    ax.imshow(img)
    ax.set_title("Diklasifikasikan Sebagai Landmark: {}".format(nama_class[predicted_classes[i]]))
    ax.axis('off')
    plt.show()

# Pengujian tanpa gambar ( old code )

In [None]:
import tensorflow as tf
import numpy as np
import pathlib as pl

gambar_folder = pl.Path(r"C:\Users\arfan\train\Model\dataset_splitfolder\val")
nama_class = ['Candi Borobudur', 'Gedung Sate', 'Jembatan Ampera', 'Istana Maimun', 'Monumen Nasional']
model = tf.keras.models.load_model('model.h5')

for class_name in nama_class:
    class_folder = gambar_folder / class_name
    for image_path in class_folder.glob('*.jpg'):
        gambar = tf.keras.utils.load_img(image_path, target_size=(224, 224))
        gambar_toarray = tf.keras.utils.img_to_array(gambar)
        gambar_toarray = tf.expand_dims(gambar_toarray, 0) 
        prediksi = model.predict(gambar_toarray)
        presentase = tf.nn.softmax(prediksi[0])
        print("Gambar {} diklasifikasikan sebagai Landmark: {}"
              .format(image_path.name, nama_class[np.argmax(presentase)]))

# Pengujian menampilkan persentase dengan nama landmark bukan nama file

In [None]:
import tensorflow as tf
import numpy as np
import pathlib as pl
import matplotlib.pyplot as plt

# Definisikan path ke folder dataset
path = pl.Path(r"C:\Users\arfan\train\Model\dataset_splitfolder\val")

# Definisikan nama class
nama_class = ['Candi Borobudur', 'Gedung Sate', 'Istana Maimun', 'Jembatan Ampera', 'Monumen Nasional']

# Load model
model = tf.keras.models.load_model('model.h5')

# Definisikan ImageDataGenerator untuk melakukan augmentasi gambar pada data testing
test_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255)

# Load data testing dari folder menggunakan ImageDataGenerator
test_data = test_datagen.flow_from_directory(directory=path,
                                             target_size=(224, 224),
                                             classes=nama_class,
                                             class_mode='sparse',
                                             shuffle=False)

# Lakukan prediksi menggunakan model pada data testing
predictions = model.predict(test_data)

# Ambil indeks kelas dengan nilai probabilitas tertinggi dari setiap prediksi
predicted_classes = np.argmax(predictions, axis=1)

# Tampilkan hasil prediksi
for i, img, in enumerate(test_data.filenames):
    # Load gambar
    img_path = path / img
    img = tf.keras.utils.load_img(img_path, target_size=(224, 224))
    
    # Ambil probabilitas untuk setiap kelas
    probabilities = predictions[i]
    
    # Tampilkan gambar dan hasil prediksi
    fig, ax = plt.subplots()
    ax.imshow(img)
    ax.set_title("Diklasifikasikan Sebagai Landmark: {}".format(nama_class[predicted_classes[i]]))
    ax.axis('off')
    
    # Tambahkan probabilitas persen dan nama file gambar pada hasil output
    for j, prob in enumerate(probabilities):
        class_name = nama_class[j]
        percentage = prob * 100
        text = "{}: {:.2f}%".format(class_name, percentage)
        plt.text(10, 20 + j * 20, text, color='white', backgroundcolor='black')
    
    plt.show()


# Pengujian dengan total jumlah dan probabilitas tetapi tidak ada nama file

In [None]:
import tensorflow as tf
import numpy as np
import pathlib as pl
import matplotlib.pyplot as plt

# Definisikan path ke folder dataset
path = pl.Path(r"C:\Users\arfan\train\Model\dataset_splitfolder\val")

# Definisikan nama class
nama_class = ['Candi Borobudur', 'Gedung Sate', 'Istana Maimun', 'Jembatan Ampera', 'Monumen Nasional']

# Load model
model = tf.keras.models.load_model('model.h5')

# Definisikan ImageDataGenerator untuk melakukan augmentasi gambar pada data testing
test_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255)

# Load data testing dari folder menggunakan ImageDataGenerator
test_data = test_datagen.flow_from_directory(directory=path,
                                             target_size=(224, 224),
                                             classes=nama_class,
                                             class_mode='sparse',
                                             shuffle=False)

# Lakukan prediksi menggunakan model pada data testing
predictions = model.predict(test_data)

# Ambil indeks kelas dengan nilai probabilitas tertinggi dari setiap prediksi
predicted_classes = np.argmax(predictions, axis=1)

# Inisialisasi variabel untuk menghitung prediksi yang benar dan salah
correct_predictions = 0
incorrect_predictions = 0

# Tampilkan hasil prediksi
for i, img, in enumerate(test_data.filenames):
    # Load gambar
    img_path = path / img
    img = tf.keras.utils.load_img(img_path, target_size=(224, 224))
    
    # Ambil probabilitas untuk setiap kelas
    probabilities = predictions[i]
    
    # Tampilkan gambar dan hasil prediksi
    fig, ax = plt.subplots()
    ax.imshow(img)
    
    # Periksa apakah prediksi benar atau salah
    if predicted_classes[i] == test_data.labels[i]:
        ax.set_title("Prediksi Benar: {}".format(nama_class[predicted_classes[i]]))
        correct_predictions += 1
    else:
        ax.set_title("Prediksi Salah: {}".format(nama_class[predicted_classes[i]]))
        incorrect_predictions += 1
    
    ax.axis('off')
    
    # Tambahkan probabilitas persen dan nama file gambar pada hasil output
    for j, prob in enumerate(probabilities):
        class_name = nama_class[j]
        percentage = prob * 100
        text = "{}: {:.2f}%".format(class_name, percentage)
        plt.text(10, 20 + j * 20, text, color='white', backgroundcolor='black')
    
    plt.show()

# Tampilkan jumlah prediksi yang benar dan salah
print("Jumlah Prediksi Benar: ", correct_predictions)
print("Jumlah Prediksi Salah: ", incorrect_predictions)


# Pengujian dengan nama file dan nama landmark dan total jumlah

In [None]:
import tensorflow as tf
import numpy as np
import pathlib as pl
import matplotlib.pyplot as plt

# Definisikan path ke folder dataset
path = pl.Path(r"C:\Users\arfan\train\Model\dataset_splitfolder\val")

# Definisikan nama class
nama_class = ['Candi Borobudur', 'Gedung Sate', 'Istana Maimun', 'Jembatan Ampera', 'Monumen Nasional']

# Load model
model = tf.keras.models.load_model('model.h5')

# Definisikan ImageDataGenerator untuk melakukan augmentasi gambar pada data testing
test_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255)

# Load data testing dari folder menggunakan ImageDataGenerator
test_data = test_datagen.flow_from_directory(directory=path,
                                             target_size=(224, 224),
                                             classes=nama_class,
                                             class_mode='sparse',
                                             shuffle=False)

# Lakukan prediksi menggunakan model pada data testing
predictions = model.predict(test_data)

# Ambil indeks kelas dengan nilai probabilitas tertinggi dari setiap prediksi
predicted_classes = np.argmax(predictions, axis=1)

# Inisialisasi variabel untuk menghitung prediksi yang benar dan salah
correct_predictions = 0
incorrect_predictions = 0

# Tampilkan hasil prediksi
for i, img, in enumerate(test_data.filenames):
    # Load gambar
    img_path = path / img
    img = tf.keras.utils.load_img(img_path, target_size=(224, 224))
    
    # Ambil probabilitas untuk setiap kelas
    probabilities = predictions[i]
    
    # Tampilkan gambar dan hasil prediksi
    fig, ax = plt.subplots()
    ax.imshow(img)
    
    # Periksa apakah prediksi benar atau salah
    if predicted_classes[i] == test_data.labels[i]:
        ax.set_title("Prediksi Benar: {} - {}".format(nama_class[predicted_classes[i]], img_path.name))
        correct_predictions += 1
    else:
        ax.set_title("Prediksi Salah: {} - {}".format(nama_class[predicted_classes[i]], img_path.name))
        incorrect_predictions += 1
    
    ax.axis('off')
    
    # Tambahkan probabilitas persen dan nama file gambar pada hasil output
    for j, prob in enumerate(probabilities):
        class_name = nama_class[j]
        percentage = prob * 100
        text = "{}: {:.2f}%".format(class_name, percentage)
        plt.text(10, 20 + j * 20, text, color='white', backgroundcolor='black')
    
    plt.show()

# Tampilkan jumlah prediksi yang benar dan salah
print("Jumlah Prediksi Benar: ", correct_predictions)
print("Jumlah Prediksi Salah: ", incorrect_predictions)


# Pengujian dengan nama file total file benar salah dan nama file yang salah ada nama landmark juga

In [None]:
import tensorflow as tf
import numpy as np
import pathlib as pl
import matplotlib.pyplot as plt

# Definisikan path ke folder dataset
path = pl.Path(r"C:\Users\arfan\train\Model\dataset_splitfolder\val")

# Definisikan nama class
nama_class = ['Candi Borobudur', 'Gedung Sate', 'Istana Maimun', 'Jembatan Ampera', 'Monumen Nasional']

# Load model
model = tf.keras.models.load_model('model.h5')

# Definisikan ImageDataGenerator untuk melakukan augmentasi gambar pada data testing
test_datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=1./255)

# Load data testing dari folder menggunakan ImageDataGenerator
test_data = test_datagen.flow_from_directory(directory=path,
                                             target_size=(224, 224),
                                             classes=nama_class,
                                             class_mode='sparse',
                                             shuffle=False)

# Lakukan prediksi menggunakan model pada data testing
predictions = model.predict(test_data)

# Ambil indeks kelas dengan nilai probabilitas tertinggi dari setiap prediksi
predicted_classes = np.argmax(predictions, axis=1)

# Inisialisasi variabel untuk menghitung prediksi yang benar dan salah
correct_predictions = 0
incorrect_predictions = 0
incorrect_files = []

# Tampilkan hasil prediksi
for i, img, in enumerate(test_data.filenames):
    # Load gambar
    img_path = path / img
    img = tf.keras.utils.load_img(img_path, target_size=(224, 224))
    
    # Ambil probabilitas untuk setiap kelas
    probabilities = predictions[i]
    
    # Tampilkan gambar dan hasil prediksi
    fig, ax = plt.subplots()
    ax.imshow(img)
    
    # Periksa apakah prediksi benar atau salah
    if predicted_classes[i] == test_data.labels[i]:
        ax.set_title("Prediksi Benar: {} - {}".format(nama_class[predicted_classes[i]], img_path.name))
        correct_predictions += 1
    else:
        ax.set_title("Prediksi Salah: {} - {}".format(nama_class[predicted_classes[i]], img_path.name))
        incorrect_predictions += 1
        incorrect_files.append(img_path.name)
    
    ax.axis('off')
    
    # Tambahkan probabilitas persen dan nama file gambar pada hasil output
    for j, prob in enumerate(probabilities):
        class_name = nama_class[j]
        percentage = prob * 100
        text = "{}: {:.2f}%".format(class_name, percentage)
        plt.text(10, 20 + j * 20, text, color='white', backgroundcolor='black')
    
    plt.show()

# Tampilkan jumlah prediksi yang benar dan salah
print("Jumlah Prediksi Benar: ", correct_predictions)
print("Jumlah Prediksi Salah: ", incorrect_predictions)
print("Nama File yang Salah:", incorrect_files)
