### TUGAS BESAR PRAKTIKUM PENGOLAHAN CITRA DIGITAL
#### Penerapan Metode Ekstraksi Ciri GLCM untuk Identifikasi Pola dalam Pengklasifikasian Jenis Batik

In [36]:
import cv2 as cv
import matplotlib.pyplot as plt
import numpy as np
import os
import pandas as pd
import math
from tqdm import tqdm

Blok kode di atas digunakan untuk mengimport library-library yang akan digunakan di dalam program.
Terdapat library cv2 yang digunakan untuk proses input, simpan dan menampilkan citra diberi nama cv sebagai alias.
Lalu library matplotlib dengan class pyplot untuk melakukan visualisasi data yang dialiaskan sebagai plt.
Kemudian terdapat numpy yang berfungsi untuk melakukan operasi numerik terhadap citra yang diberi nama alias np.
Terdapat juga library os yang digunakan untuk berinteraksi dengan sistem operasi pada tingkat yang lebih rendah seperti mengakses dan memanipulasi jalur (path) file dan direktori.
Library pandas digunakan untuk melakukan manipulasi dan analisis data dalam Python. Library ini menyediakan struktur data dan fungsi yang kuat untuk memanipulasi, menganalisis, dan mengolah data tabular.
Library math digunakan untuk melakukan operasi aritmatika seperti logaritma dan pengakaran.
Library tqdm digunakan untuk membuat bar progres (progress bar) yang interaktif saat melakukan iterasi atau perulangan dalam kode Python. Progress bar memberikan tampilan visual yang membantu mengindikasikan kemajuan suatu proses yang sedang berlangsung.

#### Melakukan preprocessing terhadap dataset yang telah disediakan.

In [37]:
def threshold(image):
   for i in range(image.shape[0]):
      for j in range(image.shape[1]):
         if image[i][j] < 128:
            image[i][j] = 0
         if image[i][j] >= 128:
            image[i][j] = 255
   return image

Blok kode di atas merupakan fungsi threshold yang melakukan proses thresholding pada citra image dengan memberi kondisi jika intensitas piksel bernilai di bawah 128, maka intensitas piksel tersebut dihitung sebagai 0. Jika intensitas piksel bernilai di atas atau sama dengan 128, maka intensitas piksel tersebut dihitung sebagai 255.

In [38]:
def sobel(image):
   sobel_x = cv.Sobel(image, cv.CV_64F, 1, 0, ksize=3)
   sobel_y = cv.Sobel(image, cv.CV_64F, 0, 1, ksize=3)
   result = cv.magnitude(sobel_x, sobel_y)
   return result

Blok kode di atas merupakan proses pendeteksian tepi menggunakan Operator Sobel yang ada pada library cv2. Fungsi ini memiliki sebuah parameter bernama image. Selanjutnya, kode tersebut melakukan operasi Sobel pada gambar dengan menggunakan fungsi cv.Sobel(). Terdapat dua pemanggilan cv.Sobel() yang masing-masing menghitung gradien dalam sumbu x dan sumbu y. Dalam hal ini, image digunakan sebagai input, cv.CV_64F menentukan tipe data output, 1 dan 0 menentukan gradien dalam sumbu x dan sumbu y (contoh yang ini adalah x=1, y=0), dan ksize=3 menentukan ukuran kernel Sobel sebagai 3x3.
Setelah itu, cv.magnitude() digunakan untuk menghitung magnitudo gradien dengan mengambil akar kuadrat dari penjumlahan kuadrat gradien dalam sumbu x dan sumbu y. Hasil magnitudo gradien disimpan dalam variabel result yang kemudian dikembalikan oleh fungsi sebagai output.

In [39]:
labels = [] #menyimpan labels
filenames = [] #menyimpan nama image
data = [] #menyimpan data image

def read_data(folder):
   for label in os.listdir(folder):
      label_path = os.path.join(folder, label)
      
      if os.path.isdir(label_path):            
         for filename in os.listdir(label_path):
            file_path = os.path.join(label_path, filename)
            img = cv.imread(file_path)
            img = cv.cvtColor(img, cv.COLOR_BGR2GRAY)
               
            #preprocessing data               
            img = cv.resize(img, (256, 256))
            img = cv.normalize(img, None, 0, 255, cv.NORM_MINMAX, cv.CV_8U)
            img = cv.equalizeHist(img)
            img = sobel(img)
            img = threshold(img)
            plt.imsave("data_sebelum_uji/"+filename, img)
            data.append(img)
            labels.append(label)
            filenames.append(filename)
               
            if img is None:
               print("Tidak ada gambar: {file_path}")

Blok kode di atas digunakan untuk membaca dan memproses dataset yang ada. Terdapat tiga variabel yang dideklarasikan sebelum fungsi, yaitu labels, filenames, dan data. Variabel labels digunakan untuk menyimpan label-label yang terkait dengan gambar-gambar. Variabel filenames digunakan untuk menyimpan nama file gambar. Variabel data digunakan untuk menyimpan data gambar yang telah diproses. Fungsi read_data() menerima parameter folder, yang merupakan path ke folder yang berisi data gambar. Pada baris pertama dalam fungsi, perulangan for digunakan untuk mengiterasi melalui setiap label di dalam folder. os.listdir(folder) digunakan untuk mendapatkan daftar file dan direktori di dalam folder yang diberikan. Di dalam perulangan pertama, variabel label_path digunakan untuk menyimpan path ke folder label yang sedang diproses. Kemudian, perulangan for kedua digunakan untuk mengiterasi melalui setiap file dalam folder label yang sedang diproses. os.listdir(label_path) digunakan untuk mendapatkan daftar file di dalam folder label. Di dalam perulangan kedua, variabel file_path digunakan untuk menyimpan path ke file gambar yang sedang diproses. Gambar dibaca menggunakan cv.imread(file_path), kemudian diubah menjadi citra grayscale menggunakan cv.cvtColor(img, cv.COLOR_BGR2GRAY).

Setelah itu, dilakukan tahap preprocessing pada gambar. Gambar diubah menjadi ukuran 256x256 piksel menggunakan cv.resize(img, (256, 256)). Kemudian, gambar dinormalisasi menggunakan cv.normalize() untuk mengatur rentang intensitas piksel menjadi 0-255. Dilakukan juga ekualisasi histogram menggunakan cv.equalizeHist() untuk meningkatkan kontras gambar. Selanjutnya, gambar diteruskan ke fungsi sobel() yang diduga melakukan deteksi tepi menggunakan operator Sobel. Setelah itu, gambar diteruskan ke fungsi threshold() yang diduga melakukan proses thresholding untuk menghasilkan gambar biner. Gambar yang telah diproses disimpan dengan plt.imsave() dengan nama file yang sesuai dalam folder "data_sebelum_uji/". Data gambar, label, dan nama file ditambahkan ke masing-masing variabel data, labels, dan filenames. Terdapat juga penanganan ketika gambar tidak dapat dibaca dengan mencetak pesan kesalahan.

In [40]:
read_data("batik/")

Blok kode di atas merupakan pemanggilan fungsi read_data() dengan folder batik sebagai argument yang dipassing ke dalam variabel folder dalam fungsi tersebut.

In [41]:
data = np.array(data).astype(int)

Blok kode di atas digunakan untuk mengubah data yang disimpan dalam list data menjadi sebuah array dan mengubah tipe datanya menjadi integer. Hasil dari proses ini akan disimpan kembali ke dalam variabel data.

#### Melakukan ekstraksi ciri pada dataset yang telah dipreprocessing sebelumnya.

In [42]:
def derajat0(img):
   max = np.max(img)
   temp = np.zeros([max + 1, max + 1])
    
   for i in range(len(img)):
      for j in range(len(img[i]) - 1):
         temp[img[i, j], img[i, j + 1]] += 1
    
   result = temp + temp.T
   result /= np.sum(result)
   
   return result

Blok kode di atas merupakan fungsi derajat0 dengan parameter img. Yang pertama dilakukan adalah mencari nilai maksimum dalam gambar menggunakan np.max(img). Nilai ini akan digunakan untuk membuat matriks kosong dengan ukuran (max + 1) x (max + 1).Membuat matriks kosong temp dengan ukuran yang sesuai menggunakan np.zeros. Melakukan loop pada setiap baris (i) dan kolom (j) dalam gambar. Pada setiap iterasi, menambahkan jumlah kemunculan pasangan piksel sebelah kanan menggunakan temp[img[i, j], img[i, j + 1]] += 1. Ini dilakukan untuk menghitung distribusi probabilitas dari piksel-piksel yang muncul berdampingan. Menggabungkan matriks temp dengan tranposenya menggunakan temp + temp.T. Ini dilakukan untuk memperoleh matriks simetri yang mencerminkan ketergantungan piksel secara bilateral. Membagi matriks data dengan jumlah semua elemennya menggunakan data /= np.sum(data). Ini dilakukan untuk menghitung probabilitas dari setiap pasangan piksel. Mengembalikan matriks distribusi probabilitas data.

In [43]:
def derajat45(img):
   max = np.max(img)
   temp = np.zeros([max + 1, max + 1])
    
   for i in range(len(img) - 1):
      for j in range(len(img[i]) - 1):
         temp[img[i + 1, j], img[i, j + 1]] += 1
    
   result = temp + temp.T
   result /= np.sum(result)
    
   return result

Blok kode di atas merupakan fungsi derajat45 dengan parameter img. Yang pertama dilakukan adalah mencari nilai maksimum dalam gambar menggunakan np.max(img), nilai tersebut akan digunakan untuk membuat matriks kosong dengan ukuran (max + 1) x (max + 1). Kemudian, matriks kosong temp dengan ukuran yang sesuai akan dibuat menggunakan np.zeros. Selanjutnya, kita akan melakukan loop pada setiap baris (i) dan kolom (j) dalam gambar, kecuali baris terakhir dan kolom terakhir. Pada setiap iterasi, kita akan menambahkan jumlah kemunculan pasangan piksel pada posisi yang ditentukan oleh (img[i + 1, j], img[i, j + 1]) menggunakan temp[img[i + 1, j], img[i, j + 1]] += 1. Langkah ini dilakukan untuk menghitung distribusi probabilitas dari piksel-piksel yang muncul pada sudut 45 derajat.
Setelah itu, kita akan menggabungkan matriks temp dengan transposenya menggunakan temp + temp.T. Hal ini dilakukan untuk memperoleh matriks simetri yang mencerminkan ketergantungan piksel secara bilateral. Selanjutnya, kita akan membagi matriks data dengan jumlah semua elemennya menggunakan data /= np.sum(data). Langkah ini dilakukan untuk menghitung probabilitas dari setiap pasangan piksel.Terakhir, matriks distribusi probabilitas data akan dikembalikan.

In [44]:
def derajat90(img):
   max = np.max(img)
   temp = np.zeros([max + 1, max + 1])
    
   for i in range(len(img) - 1):
      for j in range(len(img[i]) - 1):
         temp[img[i + 1, j], img[i, j]] += 1

   result = temp + temp.T
   result /= np.sum(result)
    
   return result

Blok kode di atas merupakan fungsi derajat90 dengan parameter img. Yang pertama dilakukan adalah mencari nilai maksimum dalam gambar menggunakan np.max(img). Nilai ini akan digunakan untuk membuat matriks kosong dengan ukuran (max + 1) x (max + 1). Membuat matriks kosong temp dengan ukuran yang sesuai menggunakan np.zeros. Melakukan loop pada setiap baris (i) dan kolom (j) dalam gambar, kecuali baris terakhir dan kolom terakhir. Pada setiap iterasi, menambahkan jumlah kemunculan pasangan piksel pada posisi yang ditentukan oleh (img[i + 1, j], img[i, j]) menggunakan temp[img[i + 1, j], img[i, j]] += 1. Ini dilakukan untuk menghitung distribusi probabilitas dari piksel-piksel yang muncul pada sudut 90 derajat. Menggabungkan matriks temp dengan tranposenya menggunakan temp + temp.T. Ini dilakukan untuk memperoleh matriks simetri yang mencerminkan ketergantungan piksel secara bilateral. Membagi matriks data dengan jumlah semua elemennya menggunakan data /= np.sum(data). Ini dilakukan untuk menghitung probabilitas dari setiap pasangan piksel.Mengembalikan matriks distribusi probabilitas data.

In [45]:
def derajat135(img):
   max = np.max(img)
   temp = np.zeros([max + 1, max + 1])
    
   for i in range(len(img) - 1):
      for j in range(len(img[i]) - 1):
         temp[img[i, j], img[i + 1, j + 1]] += 1
    
   result = temp + temp.T
   result /= np.sum(result)
   
   return result

Blok kode di atas merupakan fungsi derajat135 dengan parameter img. Yang pertama dilakukan adalah mencari nilai maksimum dalam gambar menggunakan np.max(img), nilai tersebut akan digunakan untuk membuat matriks kosong dengan ukuran (max + 1) x (max + 1). Matriks kosong temp dengan ukuran yang sesuai akan dibuat menggunakan np.zeros.Selanjutnya, akan dilakukan loop pada setiap baris (i) dan kolom (j) dalam gambar, kecuali baris terakhir dan kolom terakhir. Pada setiap iterasi, kita akan menambahkan jumlah kemunculan pasangan piksel pada posisi yang ditentukan oleh (img[i, j], img[i + 1, j + 1]) menggunakan temp[img[i, j], img[i + 1, j + 1]] += 1. Langkah ini dilakukan untuk menghitung distribusi probabilitas dari piksel-piksel yang muncul pada sudut 135 derajat. Setelah itu, menggabungkan matriks temp dengan transposenya menggunakan temp + temp.T. Hal ini dilakukan untuk memperoleh matriks simetri yang mencerminkan ketergantungan piksel secara bilateral.Selanjutnya, membagi matriks data dengan jumlah semua elemennya menggunakan data /= np.sum(data). Langkah ini dilakukan untuk menghitung probabilitas dari setiap pasangan piksel.Terakhir, matriks distribusi probabilitas data akan dikembalikan.

In [46]:
def extract(image):
   feature = []
   for img in tqdm(image, desc='Ekstraksi'):
      result = []
      result.append(derajat0(img))
      result.append(derajat45(img))
      result.append(derajat90(img))
      result.append(derajat135(img))
      feature.append(result)
   return feature

Blok kode di atas merupakan fungsi extract dengan parameter image. Untuk menyimpan fitur-fitur yang diekstraksi dari setiap gambar, akan dibuat sebuah list kosong yang disebut feature. Selanjutnya, kita akan melakukan loop pada setiap gambar dalam list image menggunakan tqdm untuk menampilkan progress bar. Pada setiap iterasi, akan dibuat sebuah list kosong yang disebut data untuk menyimpan fitur-fitur dari gambar saat ini. Kemudian, dipanggil fungsi derajat0, derajat45, derajat90, dan derajat135 untuk menghasilkan matriks distribusi probabilitas dari gambar pada empat sudut yang berbeda. Setelah itu, akan ditambahkan matriks distribusi probabilitas ke dalam list data. Langkah terakhir adalah menambahkan list data ke dalam list feature. terakhir akan dikembalikan list feature yang berisi fitur-fitur yang diekstraksi dari setiap gambar.

In [47]:
features = extract(data)

Ekstraksi: 100%|██████████| 600/600 [01:55<00:00,  5.19it/s]


Blok kode di atas memanggil fungsi extract() dengan argumen data dan menyimpan hasilnya ke dalam variabel features. Fungsi extract() dipanggil dengan argumen data. Fungsi tersebut akan memproses data yang ada dan menghasilkan fitur-fitur yang dianggap penting atau relevan dari data tersebut. Hasil yang dikembalikan oleh fungsi extract() kemudian disimpan dalam variabel features. Variabel features akan berisi hasil ekstraksi fitur dari data yang telah diproses oleh fungsi tersebut.

In [48]:
def dissimilarity(data_res): 
   result = 0
   for i in range (len(data_res)): 
      for j in range(len(data_res)):
         #rumus : p(x,y)+|i-j|
         result += data_res[i,j] + abs(i-j)
   return result

Blok kode di atas merupakan fungsi dissimilarity(), yang bertujuan untuk menghitung nilai ketidakserupaan antara elemen-elemen dalam suatu matriks data_res. Pada baris pertama, variabel result diinisialisasi dengan nilai 0. Variabel ini akan digunakan untuk menyimpan hasil perhitungan dissimilarity. Perulangan pertama dengan variabel i digunakan untuk mengiterasi melalui indeks baris matriks data_res. Perulangan kedua dengan variabel j digunakan untuk mengiterasi melalui indeks kolom matriks data_res. Di dalam kedua perulangan, dilakukan perhitungan dissimilarity menggunakan rumus p(x,y) + |i-j|. p(x,y) adalah elemen matriks data_res pada posisi (i, j). abs(i-j) adalah selisih absolut antara nilai indeks i dan j. Hasil perhitungan dissimilarity ditambahkan dengan nilai data_res[i, j] + abs(i-j) dan disimpan dalam variabel result. Setelah selesai melakukan perulangan, nilai result yang telah mengakumulasi hasil perhitungan dissimilarity dikembalikan dari fungsi sebagai output.

In [49]:
def ASM(data_res): 
   result = 0
   for i in range (len(data_res)): 
      for j in range(len(data_res)):
         #rumus : p(x,y)^2
         result += pow(data_res[i,j],2)
   return result

Blok kode di atas merupakan fungsi ASM() yang bertujuan untuk menghitung nilai Angular Second Moment (ASM) dari suatu matriks data_res. Pada baris pertama, variabel result diinisialisasi dengan nilai 0. Variabel ini akan digunakan untuk menyimpan hasil perhitungan ASM. Terdapat dua perulangan for berturut-turut. Perulangan pertama dengan variabel i digunakan untuk mengiterasi melalui indeks baris matriks data_res. Perulangan kedua dengan variabel j digunakan untuk mengiterasi melalui indeks kolom matriks data_res. Di dalam kedua perulangan, dilakukan perhitungan ASM menggunakan rumus p(x,y)^2. p(x,y) adalah elemen matriks data_res pada posisi (i, j). Hasil perhitungan data_res[i, j]^2 ditambahkan ke variabel result dengan menggunakan operator += untuk mengakumulasi hasil perhitungan. Setelah selesai melakukan perulangan, nilai result yang telah mengakumulasi hasil perhitungan ASM dikembalikan dari fungsi sebagai output.

In [50]:
def contrast(data_res): 
   result = 0
   for i in range (len(data_res)): 
      for j in range(len(data_res)):
         #rumus : p(x,y)+(i-j)^2
         result += data_res[i,j] + pow(i-j,2)
   return result

Blok kode di atas merupakan fungsi contrast() yang bertujuan untuk menghitung nilai kontras dari suatu matriks data_res. Pada baris pertama, variabel result diinisialisasi dengan nilai 0. Variabel ini akan digunakan untuk menyimpan hasil perhitungan kontras. Terdapat dua perulangan for berturut-turut. Perulangan pertama dengan variabel i digunakan untuk mengiterasi melalui indeks baris matriks data_res. Perulangan kedua dengan variabel j digunakan untuk mengiterasi melalui indeks kolom matriks data_res. Di dalam kedua perulangan, dilakukan perhitungan kontras menggunakan rumus p(x,y) + (i-j)^2. p(x,y) adalah elemen matriks data_res pada posisi (i, j). (i-j)^2 adalah selisih antara nilai indeks i dan j yang dipangkatkan dua. Hasil perhitungan data_res[i, j] + (i-j)^2 ditambahkan ke variabel result dengan menggunakan operator += untuk mengakumulasi hasil perhitungan. Setelah selesai melakukan perulangan, nilai result yang telah mengakumulasi hasil perhitungan kontras dikembalikan dari fungsi sebagai output.

In [51]:
def entrophy(data_res): 
   result = 0
   for i in range (len(data_res)): 
      for j in range(len(data_res)):
         if data_res[i,j] > 0:
            #rumus : -(p(x,y)*log^2(i-j)
            result += -(data_res[i,j] * math.log2(data_res[i,j]))
   return result

Blok kode di atas merupakan fungsi entropy() yang bertujuan untuk menghitung nilai entropi dari suatu matriks data_res. Pada baris pertama, variabel result diinisialisasi dengan nilai 0. Variabel ini akan digunakan untuk menyimpan hasil perhitungan entropi. Terdapat dua perulangan for berturut-turut. Perulangan pertama dengan variabel i digunakan untuk mengiterasi melalui indeks baris matriks data_res. Perulangan kedua dengan variabel j digunakan untuk mengiterasi melalui indeks kolom matriks data_res. Di dalam kedua perulangan, dilakukan perhitungan entropi menggunakan rumus -(p(x,y) * log2(p(x,y))). p(x,y) adalah elemen matriks data_res pada posisi (i, j). Rumus ini menghitung entropi untuk setiap elemen yang lebih besar dari 0. Nilai entropi dihitung sebagai hasil perkalian antara p(x,y) dan logaritma basis 2 dari p(x,y). Jika nilai data_res[i, j] lebih besar dari 0, maka perhitungan entropi dilakukan dengan mengurangi hasil perkalian dari -(data_res[i, j] * math.log2(data_res[i, j])) dari variabel result. Setelah selesai melakukan perulangan, nilai result yang telah mengakumulasi hasil perhitungan entropi dikembalikan dari fungsi sebagai output.

In [52]:
def energy(data_res): 
   result = 0
   for i in range (len(data_res)): 
      for j in range(len(data_res)):
         #rumus : sqrt(p(x,y)^2) atau sqrt(ASM)
         result += pow(data_res[i,j],2)
   return result

Blok kode di atas merupakan fungsi energy() yang bertujuan untuk menghitung nilai energi dari suatu matriks data_res. Pada baris pertama, variabel result diinisialisasi dengan nilai 0. Variabel ini akan digunakan untuk menyimpan hasil perhitungan energi. Terdapat dua perulangan for berturut-turut. Perulangan pertama dengan variabel i digunakan untuk mengiterasi melalui indeks baris matriks data_res. Perulangan kedua dengan variabel j digunakan untuk mengiterasi melalui indeks kolom matriks data_res. Di dalam kedua perulangan, dilakukan perhitungan energi menggunakan rumus sqrt(p(x,y)^2) atau sqrt(ASM). p(x,y) adalah elemen matriks data_res pada posisi (i, j). ASM merujuk pada Angular Second Moment, yang juga dikenal sebagai nilai energi dari matriks. Perhitungan energi dilakukan dengan memangkatkan nilai elemen matriks ke kuadrat dan menjumlahkannya ke variabel result menggunakan operator += untuk mengakumulasi hasil perhitungan. Setelah selesai melakukan perulangan, nilai result yang telah mengakumulasi hasil perhitungan energi dikembalikan dari fungsi sebagai output.

In [53]:
def homogenity(data_res): 
   result = 0
   for i in range (len(data_res)): 
      for j in range(len(data_res)):
         #rumus : p(x,y)/1+(i-j)^2
         result += data_res[i,j]/(1+pow((i-j),2))
   return result

Blok kode di atas merupakan fungsi homogeneity() yang bertujuan untuk menghitung nilai homogenitas dari suatu matriks data_res. Pada baris pertama, variabel result diinisialisasi dengan nilai 0. Variabel ini akan digunakan untuk menyimpan hasil perhitungan homogenitas. Terdapat dua perulangan for berturut-turut. Perulangan pertama dengan variabel i digunakan untuk mengiterasi melalui indeks baris matriks data_res. Perulangan kedua dengan variabel j digunakan untuk mengiterasi melalui indeks kolom matriks data_res. Di dalam kedua perulangan, dilakukan perhitungan homogenitas menggunakan rumus p(x,y)/(1+(i-j)^2). p(x,y) adalah elemen matriks data_res pada posisi (i, j). Rumus ini menghitung homogenitas untuk setiap elemen dalam matriks dengan membagi nilai elemen dengan 1 ditambah kuadrat selisih antara indeks baris dan indeks kolom. Hasil perhitungan data_res[i, j]/(1+pow((i-j),2)) ditambahkan ke variabel result dengan menggunakan operator += untuk mengakumulasi hasil perhitungan. Setelah selesai melakukan perulangan, nilai result yang telah mengakumulasi hasil perhitungan homogenitas dikembalikan dari fungsi sebagai output.

In [54]:
def correlation(data_res):
   row = len(data_res)
   column = len(data_res[0])
   sumIJ = sum(i * j * data_res[i][j] for i in range(row) for j in range(column))
   sumI = sum(i * data_res[i][j] for i in range(row) for j in range(column))
   sumJ = sum(j * data_res[i][j] for i in range(row) for j in range(column))
   sumI_squared = sum((i - sumI) ** 2 * data_res[i][j] for i in range(row) for j in range(column))
   sumJ_squared = sum((j - sumJ) ** 2 * data_res[i][j] for i in range(row) for j in range(column))

   std_i = math.sqrt(sumI_squared)
   std_j = math.sqrt(sumJ_squared)

   if std_i != 0 and std_j != 0:
      result = (sumIJ - sumI * sumJ) / (std_i * std_j)
   else:
      result = 0

   return result

Blok kode di atas merupakan fungsi correlation() yang bertujuan untuk menghitung nilai korelasi antara dua variabel dalam suatu matriks data_res. Pada baris pertama, variabel row diinisialisasi dengan nilai jumlah baris dalam matriks data_res, sedangkan variabel column diinisialisasi dengan nilai jumlah kolom dalam matriks. Selanjutnya, terdapat beberapa perhitungan yang dilakukan menggunakan beberapa perulangan for berturut-turut. Pada baris ketiga, dilakukan perhitungan sumIJ yang mengakumulasi hasil perkalian antara i, j, dan data_res[i][j] untuk setiap kombinasi indeks baris dan kolom. Ini digunakan dalam perhitungan korelasi. Pada baris keempat, dilakukan perhitungan sumI yang mengakumulasi hasil perkalian antara i dan data_res[i][j] untuk setiap kombinasi indeks baris dan kolom. Ini digunakan dalam perhitungan korelasi. Pada baris kelima, dilakukan perhitungan sumJ yang mengakumulasi hasil perkalian antara j dan data_res[i][j] untuk setiap kombinasi indeks baris dan kolom. Ini juga digunakan dalam perhitungan korelasi. Pada baris keenam, dilakukan perhitungan sumI_squared yang mengakumulasi hasil perkalian kuadrat dari selisih antara i dan sumI dengan data_res[i][j] untuk setiap kombinasi indeks baris dan kolom. Ini digunakan dalam perhitungan standar deviasi std_i. Pada baris ketujuh, dilakukan perhitungan sumJ_squared yang mengakumulasi hasil perkalian kuadrat dari selisih antara j dan sumJ dengan data_res[i][j] untuk setiap kombinasi indeks baris dan kolom. Ini digunakan dalam perhitungan standar deviasi std_j. Pada baris kesembilan, dilakukan perhitungan standar deviasi std_i dengan menghitung akar kuadrat dari sumI_squared. Pada baris kesepuluh, dilakukan perhitungan standar deviasi std_j dengan menghitung akar kuadrat dari sumJ_squared. Selanjutnya, dilakukan penghitungan nilai korelasi dengan rumus (sumIJ - sumI * sumJ) / (std_i * std_j). Jika nilai standar deviasi std_i dan std_j bukan nol (untuk menghindari pembagian dengan nol), maka perhitungan korelasi dilakukan dan hasilnya disimpan di variabel result. Jika salah satu dari standar deviasi tersebut nol, maka result diatur menjadi 0. Terakhir, nilai result yang merupakan hasil perhitungan korelasi dikembalikan dari fungsi sebagai output.

In [55]:
frame = []
indeks = 0 #menentukan indeks dari nama filenya
n = 200
for i in features:
   save = []
   #untuk menginputkan nama dari file
   save.append(filenames[indeks])
   indeks += 1
   for j in i:
      #memanggil fungsi energy
      en = energy(j)
      save.append(en)
        
      #memanggil fungsi homogenitas
      hm = homogenity(j)
      save.append(hm)
        
      #memanggil fungsi entropi
      ent = entrophy(j)
      save.append(ent)
        
      #memanggil fungsi contrast
      con = contrast(j)
      save.append(con)

      #memanggil fungsi dissimilarity
      dis = dissimilarity(j)
      save.append(dis)

      #memanggil fungsi ASM
      asm = ASM(j)
      save.append(asm)
       
      #memanggil fungsi correlation
      cor = correlation(j)
      save.append(cor)
        
   #menginputkan isi var save ke var frame
   frame.append(save)

Blok kode di atas merupakan proses ekstraksi fitur dari setiap elemen dalam features dan menyimpan hasilnya dalam frame. Pada baris pertama, variabel frame diinisialisasi sebagai sebuah list kosong. Variabel ini akan digunakan untuk menyimpan hasil ekstraksi fitur dari setiap elemen dalam features. Variabel indeks diinisialisasi dengan nilai 0. Variabel ini digunakan untuk menentukan indeks dari nama file yang akan disimpan dalam frame. Terdapat sebuah perulangan for yang mengiterasi melalui setiap elemen dalam features. Setiap elemen ini direpresentasikan oleh variabel i. Di dalam perulangan tersebut, sebuah list save kosong dibuat. List ini akan digunakan untuk menyimpan hasil ekstraksi fitur dari elemen i. Pada baris keenam, nama file (berdasarkan indeks yang ditentukan oleh indeks) ditambahkan ke dalam save menggunakan save.append(filenames[indeks]). Setelah itu, terdapat perulangan for yang mengiterasi melalui setiap elemen j dalam elemen i. Elemen j ini mewakili matriks yang akan diekstraksi fiturnya. Di dalam perulangan tersebut, fungsi-fungsi yang telah didefinisikan sebelumnya (seperti energy(), homogeneity(), entropy(), contrast(), dissimilarity(), ASM(), dan correlation()) dipanggil untuk melakukan ekstraksi fitur dari matriks j. Hasil ekstraksi fitur tersebut disimpan dalam variabel en, hm, ent, con, dis, asm, dan cor secara berturut-turut. Setelah mendapatkan hasil ekstraksi fitur, nilai-nilai tersebut ditambahkan ke dalam save menggunakan save.append(). Setelah selesai melakukan perulangan dalam elemen i, save yang berisi hasil ekstraksi fitur untuk satu elemen diinputkan ke dalam frame menggunakan frame.append(save). Proses ini diulangi untuk setiap elemen dalam features hingga semua elemen telah diekstraksi fiturnya dan hasilnya disimpan dalam frame. Setelah selesai melakukan perulangan, frame akan berisi hasil ekstraksi fitur dari setiap elemen dalam features, termasuk nama file dan nilai-nilai fitur yang terkait.

In [56]:
#membuat var yang nantinya digunakan sebagai header
headerPass = ['path','energi0','homogenitas0','entropy0','contras0','dissimilarity0','ASM0','correlation0',
              'energi45','homogenitas45','entropy45','contras45','dissimilarity45','ASM45','correlation45',
              'energi90','homogenitas90','entropy90','contras90','dissimilarity90','ASM90','correlation90',
              'energi135','homogenitas135','entropy135','contras135','dissimilarity135','ASM135','correlation135']
#menginputkan var frame sebagai isi dari tabel
df = pd.DataFrame(frame, columns = headerPass)
#digunakan untuk mensave data menjadi file csv dengan nama Jurnalmodul8
df['labels'] = labels
df.to_csv(r'akurasi_ekstraksi_ciri.csv', index=False)

Blok kode di atas digunakan untuk membuat DataFrame menggunakan pandas dari variabel frame yang berisi hasil ekstraksi fitur. DataFrame tersebut kemudian disimpan sebagai file CSV dengan nama "akurasi_ekstraksi_ciri.csv". Variabel headerPass merupakan sebuah list yang berisi nama-nama kolom yang akan menjadi header atau nama kolom pada DataFrame. Nama-nama kolom ini mencakup jenis fitur dan sudut orientasi (0, 45, 90, dan 135 derajat) yang akan digunakan. Selanjutnya, DataFrame baru dibuat menggunakan pd.DataFrame(frame, columns=headerPass). Variabel frame digunakan sebagai data yang akan diisi ke dalam DataFrame, sedangkan columns=headerPass digunakan untuk menetapkan nama kolom sesuai dengan nilai dalam headerPass. Setelah DataFrame dibuat, kolom "labels" ditambahkan ke DataFrame dengan df['labels'] = labels. Kolom "labels" akan berisi nilai-nilai label yang telah ditentukan sebelumnya. Terakhir, DataFrame disimpan sebagai file CSV menggunakan df.to_csv(r'akurasi_ekstraksi_ciri.csv', index=False). r'akurasi_ekstraksi_ciri.csv' menentukan nama file dan path tempat file CSV akan disimpan. index=False digunakan untuk mengabaikan kolom indeks dalam DataFrame saat menyimpan ke file CSV.

In [57]:
df

Unnamed: 0,path,energi0,homogenitas0,entropy0,contras0,dissimilarity0,ASM0,correlation0,energi45,homogenitas45,...,ASM90,correlation90,energi135,homogenitas135,entropy135,contras135,dissimilarity135,ASM135,correlation135,labels
0,Kawung1.jpg,0.345918,0.735099,1.752151,715816961.0,5592321.0,0.345918,0.423307,0.335948,0.710731,...,0.346409,0.420493,0.335199,0.708947,1.783047,715816961.0,5592321.0,0.335199,0.365139,Kawung
1,Kawung11.jpg,0.469772,0.734348,1.465789,715816961.0,5592321.0,0.469772,0.207342,0.447978,0.678605,...,0.471957,0.211468,0.446619,0.674761,1.489468,715816961.0,5592321.0,0.446619,0.025984,Kawung
2,Kawung12.jpg,0.371557,0.752011,1.692554,715816961.0,5592321.0,0.371557,0.438867,0.363461,0.733460,...,0.384651,0.489927,0.361652,0.729554,1.720779,715816961.0,5592321.0,0.361652,0.386793,Kawung
3,Kawung13.jpg,0.344550,0.688347,1.765518,715816961.0,5592321.0,0.344550,0.293171,0.340061,0.673454,...,0.360312,0.373603,0.339679,0.672346,1.777420,715816961.0,5592321.0,0.339679,0.255360,Kawung
4,Kawung14.jpg,0.364211,0.674714,1.718105,715816961.0,5592321.0,0.364211,0.218638,0.362164,0.666549,...,0.386194,0.344901,0.362761,0.668333,1.720693,715816961.0,5592321.0,0.362761,0.201891,Kawung
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
595,Truntum5.jpg,0.334197,0.783796,1.746434,715816961.0,5592321.0,0.334197,0.564399,0.314288,0.745932,...,0.348096,0.611269,0.314485,0.746332,1.809670,715816961.0,5592321.0,0.314485,0.488764,Truntum
596,Truntum6.jpg,0.363416,0.691380,1.721416,715816961.0,5592321.0,0.363416,0.270751,0.353099,0.660274,...,0.387357,0.397885,0.351099,0.653908,1.747562,715816961.0,5592321.0,0.351099,0.181003,Truntum
597,Truntum7.jpg,0.342214,0.766333,1.743790,715816961.0,5592321.0,0.342214,0.511883,0.303760,0.679144,...,0.324943,0.436828,0.304950,0.682435,1.855170,715816961.0,5592321.0,0.304950,0.336086,Truntum
598,Truntum8.jpg,0.321548,0.758552,1.788481,715816961.0,5592321.0,0.321548,0.512512,0.292464,0.694814,...,0.339017,0.577463,0.293344,0.697060,1.875491,715816961.0,5592321.0,0.293344,0.388591,Truntum


Blok kode di atas digunakan untuk memanggil variabel df dan menampilkan isi dari variabel tersebut.