In [1]:
import os
import csv
import cv2
from skimage.feature import hog
from sklearn.externals import joblib

In [2]:
# ucitavanje skupova

def load_images_from_folder(folder):
    images = []
    for filename in os.listdir(folder):
        img_path = os.path.join(folder, filename)
        img = cv2.imread(img_path)
        if img is not None:
            img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
            images.append(img)
    return images 

def load_sets():
    sa_knjigom = load_images_from_folder("skup_podataka/saKnjigom")
    bez_knjige = load_images_from_folder("skup_podataka/bezKnjiga")
    test_skup = load_images_from_folder("skup_podataka/test")
    return sa_knjigom, bez_knjige, test_skup

In [3]:
# odredjivanje da li naslici ima knjiga ili nema

def hog_processing(sa_knjigama, bez_knjiga):
    lista_svih = []
    labele = []
    for slika in sa_knjigama:
        features = hog(slika, orientations=9, pixels_per_cell=(8, 8), cells_per_block=(2, 2), block_norm="L2")
        lista_svih.append(features)
        labele.append(1)

    for slika in bez_knjiga:
        features = hog(slika, orientations=9, pixels_per_cell=(8, 8), cells_per_block=(2, 2), block_norm="L2")
        lista_svih.append(features)
        labele.append(0)

    clf = joblib.load("pedestrian.pkl")
    clf.fit(lista_svih, labele)
    return clf

def read_resault(ime_fajla):
    resenje = []
    with open(ime_fajla, encoding="utf8", newline='\n') as f:
        lines = csv.reader(f, delimiter=',')
        for row in lines:
            if (row[0] == "br_knjiga"):
                continue
            niz = []
            if len(row) == 2:
                niz = row[1]
                niz = niz[1:-1]
                niz = niz.split(';')
            resenje.append([int(row[0]), niz])
    return resenje

def predict_books(clf, test_skup, informacije):
    resenje = [i[0] != 0 for i in informacije]

    dobijeni_rezultat = []
    ind = 0
    br_tacnih = 0
    for slika in test_skup:
        features = hog(slika, orientations=9, pixels_per_cell=(8, 8), cells_per_block=(2, 2), block_norm="L2")
        listica = [features, features]
        rez = clf.predict(listica)
        dobijeni_rezultat.append(rez[0])
        if (dobijeni_rezultat[ind] == resenje[ind]):
            br_tacnih += 1
        ind += 1
    tacnost = (br_tacnih / len(resenje)) * 100
    tacnost = round(tacnost, 2)
    return tacnost, dobijeni_rezultat

In [4]:
# GLAVNA FUNKCIJA

with_books, without_books, test_set = load_sets()
print("Slike sa knjigama:", len(with_books))
print("Slike bez knjiga:", len(without_books))
print("Slike za test:", len(test_set))

print("\nDetekcija da li na slikama ima knjiga ili ne je u toku...")
print("Detekcija moze potrajati oko 10 minuta")
linear_svc = hog_processing(with_books, without_books)
file_info = read_resault('skup_podataka/test_podaci.csv')
accuracy, resault = predict_books(linear_svc, test_set, file_info)
print("\nDetekcija je zavrsena")
print("Tacnost resenja: " + str(accuracy) +"%")

"""
    file_info                                                -> [[0, []], [2, ['rec', 'rec', 'rec']], ...]
    
    knjiga_info_7 = file_info[6]                             -> [2, ['rec', 'rec', 'rec']]                -> ima knjiga
    sve_reci_za_ocr = file_info[6][1] = knjiga_info_7[1]     -> ['rec', 'rec', 'rec']
    knjiga_info_5 = file_info[4]                             -> [0, []]                                   -> nema knjiga
    
    --------------------------------------------------------------------------------------------------------------------
    result                                                   -> [0, 1, 0, 1, 1, ...]
    --------------------------------------------------------------------------------------------------------------------
    uslov za ocr:
        => result[ind] == 1 and file_info[ind][0] != 0
    
"""

Slike sa knjigama: 210
Slike bez knjiga: 210
Slike za test: 150

Detekcija da li na slikama ima knjiga ili ne je u toku...
Detekcija moze potrajati oko 10 minuta


https://scikit-learn.org/stable/modules/model_persistence.html#security-maintainability-limitations


[LibLinear]
Detekcija je zavrsena
Tacnost resenja: 88.67%
