# Sistem Klasifikasi Anjing dan Kucing menggunakan Metode Color Histogram

Coded By : Fauzan Firdaus (1301164317) & Nur Azizah Agustina (1301164076)

Pertama-tama, lakukan import terlebih dahulu untuk beberapa library yang akan digunakan.

In [1]:
import cv2
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score
import glob

Definisikan fungsi 'extractColorHist' untuk melakukan proses ekstraksi fitur dengan metode Color Histogram.

In [2]:
def extractColorHist(img):
    chans = cv2.split(img)
    colors = ("h", "s", "v")
    features = []

    for (chan, color) in zip(chans, colors):
        hist = cv2.calcHist([chan], [0], None, [256], [0, 256])
        features.extend(hist)
    return np.array(features).flatten()

Setelah itu, fungsi 'featureExtraction' dibawah ini berfungsi untuk melakukan proses ekstraksi fitur bentuk secara iteratif untuk semua gambar dalam array.

In [4]:
def featureExtraction(arr):
    arr_feature=[]
    for i in range(np.shape(arr)[0]):
        arr_feature.append(extractColorHist(arr[i]))
    return arr_feature

Fungsi selanjutnya adalah 'preprocessing' yang berfungsi untuk melakukan tahap preprocessing (membuat gambar dalam channel HSV).

In [3]:
def preprocessing(arr):
    arr_prep=[]
    for i in range(np.shape(arr)[0]):
        img=matplotlib.colors.rgb_to_hsv(arr[i])
        arr_prep.append(img)
    return arr_prep

Fungsi yang terakhir adalah 'loadData' yang berfungsi untuk memuat semua gambar/dataset dan labelnya menjadi bentuk array yang berada dalam folder Datasets.

In [5]:
def loadData(arr,labelobject):
    label=[]
    strr = "Datasets/"+str(labelobject)+"/*.jpg"
    for file in glob.glob(strr):
        img=np.asarray(plt.imread(file))
        arr.append(img)
        label.append(labelobject)
    return arr,label

Lakukan proses load gambar dan labelnya

In [6]:
cat=[]
dog=[]

cat,label_cat = loadData(cat,1)
dog,label_dog = loadData(dog,2)

Gabungkan semua dataset menjadi 1 array

In [7]:
combineImage = np.concatenate((cat,dog))
combineLabel = np.concatenate((label_cat,label_dog))

Pecah dataset menjadi 2 bagian, yaitu data train dan data test. Hal ini dilakukan bertujuan dalam proses memvalidasi dataset.

In [8]:
X_train, X_test, y_train, y_test = train_test_split(combineImage, combineLabel, test_size=0.2, random_state=42)

Lakukan preprocessing terlebih dahulu

In [9]:
X_trainp=preprocessing(X_train)
X_testp=preprocessing(X_test)

Lalu, lakukan proses ekstraksi.

In [10]:
X_trainext=featureExtraction(X_trainp)
X_testext=featureExtraction(X_testp)

Tahap akhir adalah melakukan learning (fit) model / data train. Setelah melakukan learning, proses yang dilakukan adalah melakukan prediksi label, lalu muncullah akurasi sebagai ketepatan dari prediksi label tersebut dengan label yang sebenarnya.

In [11]:
clf = RandomForestClassifier(n_estimators=100, random_state=42)
clf.fit(X_trainext, y_train)
result = clf.predict(X_testext)
print("Akurasi :", accuracy_score(y_test, result) * 100)

Akurasi : 58.5
