# Features Extraction (Color)

### Import all package
- **pandas** digunakan untuk mempermudah visualisasi data dan export otomatis ke excel
- **copy** digunakan untuk melakukan copy pada list, dictionary, ataupun array agar value awal tidak berubah

In [46]:
import cv2
import numpy as np
import pandas as pd
from copy import deepcopy
import os

### Pembuatan Fungsi Feature Extraction
tujuan kode dimasukkan ke dalam fungsi adalah mempermudah pemanggilan kode tanpa perlu menulis kode ulang

In [47]:
def featuresExtract(imgpath):
    img = cv2.imread(imgpath)
    b, r, g = cv2.split(img)
        
    sum_r = np.mean(r)
    sum_g = np.mean(g)
    sum_b = np.mean(b)
    
    return [sum_r, sum_g, sum_b]

- penghitungan rata-rata pixel tiap channel terdapat pada baris 5-7
- penghitungan dilakukan dengan menggunakan **numpy** agar waktu run lebih cepat daripada manual menggunakan loop
- berikut contoh kode perhitungan manual menggantikan baris 5-7 dengan loop:

In [None]:
'''
sum_r, sum_g, sum_b = 0
for i in range(len(img)):  # perulangan untuk row
    for j in range(len(img[0])):  # perulangan untuk column
        # blue
        px_b = b[i, j]  # membaca tiap pixel pada channel
        sum_b += px_b / (len(img) * len(img[0]))  # menghitung rata-rata
        
        # red
        px_r = r[i, j]
        sum_r += px_r / (len(img) * len(img[0]))
        
        # green
        px_g = g[i, j]
        sum_g += px_g / (len(img) * len(img[0]))
'''

### Pembuatan Fungsi Testing

In [58]:
def testing(x_train, y_train, testpath):
    dt_test = [featuresExtract(testpath)]
    jarak = abs(dt_test - x_train)
    tot_jarak = np.sum(jarak, axis=1)
    val_dekat = min(tot_jarak)
    index = np.where(tot_jarak == val_dekat)[0][0]
    prediksi = y_train[index]
    
    return prediksi

### Pembuatan Data Store Dictionary
**Dictionary** dipakai untuk menyimpan data hanya untuk mempermudah pembuatan dataframe pandas. Jika tidak ingin menggunakan package pandas, data cukup disimpan ke dalam array 2D

In [38]:
datastore = {
    'gambar' : [],
    'red' : [],
    'green' : [],
    'blue' : [],
    'label' : []}

### Implementasi Penggunaan Feature Extraction (Color)

In [None]:
directory = "D:/Citra Digital Praktik/5210411135/image/DatasetDaging"
files = os.listdir(directory)
training = deepcopy(datastore)
    
for f in files:
    imgpath = os.path.join(directory, f)
    sum_channel = featuresExtract(imgpath)
    training['gambar'].append(f)
    training['red'].append(sum_channel[0])
    training['green'].append(sum_channel[1])
    training['blue'].append(sum_channel[2])
    training['label'].append(f[0:4])
    
training_df = pd.DataFrame(training)
training_df.set_index('gambar', inplace=True)   
display(training_df)

### Implementasi Prediksi Label pada Data Testing

In [None]:
testdir = "D:/Citra Digital Praktik/5210411135/imgtest/DatasetTestDaging"
fltest = os.listdir(testdir)
datatest = deepcopy(datastore)

for f in fltest:
    testpath = os.path.join(testdir, f)
    test_extract = featuresExtract(testpath)
    
    x_train = np.array(training_df[['red', 'green', 'blue']])
    y_train = np.array(training_df['label'])
    prediksi = testing(x_train, y_train, testpath)
    
    datatest['gambar'].append(f)
    datatest['red'].append(test_extract[0])
    datatest['green'].append(test_extract[1])
    datatest['blue'].append(test_extract[2])
    datatest['label'].append(prediksi)
  
    
datatest_df = pd.DataFrame(datatest)
datatest_df.rename(columns = {'label':'prediksi'}, inplace=True)
datatest_df.set_index('gambar', inplace=True)   
display(datatest_df)