# Lab 3

## Основні функції та змінні

### Імпортуємо необхідні бібліотеки

In [239]:
import cv2
import numpy as np
import pandas as pd
import time
import os
import matplotlib.pyplot as plt

### Код попередньої лабки

In [5]:
class ObjectRecignition:
    """
    Arguments:
        path_main: string -- path for main (train) image
        directory_test: string -- directory with all images for testing
        directory_save: string -- directory where you want to save all possible savings
        n_features: int -- number of features that will be used as a parameter for ORB descriptor (default: 1500)
    """
    
    def __init__(self, path_main, directory_test, directory_save, n_features=1500):
        self.path_main = path_main
        self.directory_test = directory_test
        self.directory_save = directory_save
        self.n_features = n_features
        self.__orb = cv2.ORB_create(nfeatures=n_features)
        self.img_main = cv2.imread(path_main, cv2.IMREAD_GRAYSCALE)
        self.keypoints_main, self.descriptors_main = self.__orb.detectAndCompute(self.img_main, None)
        self.__bf = cv2.BFMatcher(cv2.NORM_HAMMING, crossCheck=True)
    
    
    def get_metrics(self, path):
        """
        Return metrics for main and another image
        Arguments:
            path: string -- path for another image
        Returns:
            features: int -- number of features
            all_matches: int -- number of all matches
            true_matches: int -- number of true matches (find by findHomography)
            error_all_matches: float -- mean of distances of DMatch objects for all matches
            error_true_matches: float -- mean of distances of DMatch objects for true matches
            size: tuple -- size of image
            time: float -- time of running the function
        """        
        # Initialize an image
        img = cv2.imread(path, cv2.IMREAD_GRAYSCALE)
        kp, des = self.__orb.detectAndCompute(img, None)
        
        # Find features
        features = self.n_features
        
        # Find time
        start_time = time.time()
        
        # Find all_matches
        try:
            matches = self.__bf.match(self.descriptors_main, des)
        except:
            print("Something wrong with image", path)
            return np.nan, np.nan, np.nan, np.nan, np.nan, np.nan, np.nan
        matches = sorted(matches, key = lambda x: x.distance)
        all_matches = len(matches)
        
        # Find true_matches
        query_pts = np.float32([self.keypoints_main[m.queryIdx].pt for m in matches]).reshape(-1, 1, 2)
        train_pts = np.float32([kp[m.trainIdx].pt for m in matches]).reshape(-1, 1, 2)
        _, mask = cv2.findHomography(query_pts, train_pts, cv2.RANSAC, 5.0)
        matches_mask = mask.ravel().tolist()
        true_matches_list = []
        for index, el in enumerate(matches_mask):
            if el == 1:
                true_matches_list.append(matches[index])
        true_matches = len(true_matches_list)
        
        # Find time
        end_time = time.time()
        time_ = round(end_time - start_time, 4)
        
        # Find error_all_matches
        if all_matches == 0:
            error_all_matches = np.nan
        else:
            error_all_matches_list = []
            for m in matches:
                error_all_matches_list.append(m.distance)
            error_all_matches = round(np.array(error_all_matches_list).mean(), 4)
        
        # Find error_true_matches
        if true_matches == 0:
            error_true_matches = np.nan
        else:
            error_true_matches_list = []
            for m in true_matches_list:
                error_true_matches_list.append(m.distance)
            error_true_matches = round(np.array(error_true_matches_list).mean(), 4)
        
        # Find size
        size = img.shape
        
        # Здається, що алгоримт завжди знаходить у районі 10 true_matches, тому будемо вважати 10 еквівалентно 0
#         if true_matches < 10:
#             true_matches = 0
#             error_true_matches = np.nan
        
        # Return values as tuple
        return features, all_matches, true_matches, error_all_matches, error_true_matches, size, time_
    
        
    def get_all_metrics_as_df(self, print_results=False):
        """
        Return all metrics for all images from directory_test as pandas DataFrame
        Returns:
            df: pandas DataFrame -- a dataframe with all metrics for all images
        """
        all_metrics = []
        
        for filename in os.listdir(self.directory_test):
            path = self.directory_test + '\\\\' + filename
            temp_list = list(self.get_metrics(path))
            temp_list.insert(0, filename)
            all_metrics.append(temp_list)
            
        df = pd.DataFrame(all_metrics, columns=['name', 'features', 'all_matches', 'true_matches', 
                                                'error_all_matches', 'error_true_matches', 'size', 'time'])
        return df
        
    
    def save_all_metrics(self, file_name):
        """
        Save all metrics for all images as csv file
        Arguments:
            file_name: string -- name of the file (without the format)
        """
        df = self.get_all_metrics_as_df()
        df.to_csv(self.directory_save + '\\\\' + file_name + '.csv') 
    
    
    def show_features(self, save=False):
        """
        Show features on the main image
        Arguments:
            save: bool -- save received image or not (default: False)
        """
        img_keys = cv2.drawKeypoints(self.img_main, self.keypoints_main, None)
        cv2.namedWindow("Image", cv2.WINDOW_NORMAL)
        cv2.resizeWindow("Image", 600, 600)
        cv2.imshow("Image", img_keys)
        
        if save:
            file_name = self.directory_save + '\\\\' + 'features_for_' + self.path_main.split('\\')[-1]
            cv2.imwrite(file_name, img_keys)
        
        cv2.waitKey(0)
        cv2.destroyAllWindows()

    
    def show_all_matches(self, random=True, path='', save=False):
        """
        Show all matches between main and another image
        Arguments:
            random: bool -- show all matches for random image if random set to True (default: True)
            path: string -- path for another image if random set to False (default: empty string)
            save: bool -- save received image or not (default: False)
        """
        if random:
            path = self.directory_test + '\\\\' + np.random.choice(os.listdir(self.directory_test))
        else:
            if path == '':
                return "Please enter the path or set random to True"
            
        img = cv2.imread(path, cv2.IMREAD_GRAYSCALE)
        kp, des = self.__orb.detectAndCompute(img, None)
        
        matches = self.__bf.match(self.descriptors_main, des)
        matches = sorted(matches, key = lambda x: x.distance)
        
        matching_result = cv2.drawMatches(self.img_main, self.keypoints_main, img, kp, matches, None)
        
        cv2.namedWindow("Matches", cv2.WINDOW_NORMAL)
        cv2.resizeWindow("Matches", 1200, 600)
        cv2.imshow("Matches", matching_result)
        
        if save:
            file_name = self.directory_save + '\\\\' +  'all_matches_for_' + path.split('\\')[-1]
            cv2.imwrite(file_name, matching_result)
        
        cv2.waitKey(0)
        cv2.destroyAllWindows()
        
    
    def show_true_matches(self, random=True, path='', save=False):
        """
        Show true matches between main and another image (finding by findHomography)
        Arguments:
            random: bool -- show all matches for random image if random set to True (default: True)
            path: string -- path for another image if random set to False (default: empty string)
            save: bool -- save received image or not (default: False)
        """
        if random:
            path = self.directory_test + '\\\\' + np.random.choice(os.listdir(self.directory_test))
        else:
            if path == '':
                return "Please enter the path or set random to True"
            
        img = cv2.imread(path, cv2.IMREAD_GRAYSCALE)
        kp, des = self.__orb.detectAndCompute(img, None)
        
        matches = self.__bf.match(self.descriptors_main, des)
        matches = sorted(matches, key = lambda x: x.distance)
        
        matching_result = cv2.drawMatches(self.img_main, self.keypoints_main, img, kp, matches, None)
        
        query_pts = np.float32([self.keypoints_main[m.queryIdx].pt for m in matches]).reshape(-1, 1, 2)
        train_pts = np.float32([kp[m.trainIdx].pt for m in matches]).reshape(-1, 1, 2)
        _, mask = cv2.findHomography(query_pts, train_pts, cv2.RANSAC, 5.0)
        matches_mask = mask.ravel().tolist()
        
        true_matches = []
        for index, el in enumerate(matches_mask):
            if el == 1:
                true_matches.append(matches[index])
                
        matching_true_relults = cv2.drawMatches(self.img_main, self.keypoints_main, img, kp, true_matches, None)
        
        cv2.namedWindow("True Matches", cv2.WINDOW_NORMAL)
        cv2.resizeWindow("True Matches", 1200, 600)
        cv2.imshow("True Matches", matching_true_relults)
        
        if save:
            file_name = self.directory_save + '\\\\' + 'true_matches_for_' + path.split('\\')[-1]
            cv2.imwrite(file_name, matching_true_relults)
        
        cv2.waitKey(0)
        cv2.destroyAllWindows()

### Оголошуємо необхідні змінні

In [198]:
n_features = 500
directory_test = "Library"
include_other_photos = True

### Ініціалізуємо X та y для майбутнього класифікатора

In [282]:
def create_X_and_y(n_features, directory_test, include_other_photos):
    """
    Create X and y for future classifier
    Arguments:
        n_features: int -- number of features (will be used for defining ORB descriptor)
        directory_test: str -- directory with all images for testing
        include_other_photos: bool -- spicifies which classifier will be later (binary classifier with only two possible objects
                              on photo or ternary classifier with two possible objects on photo and some another type of photos)
    Returns:
    X: np.array -- matrix X for future classifier
    y: np.array -- vector y for future classifier
    """
    X_dict = {}
    X = []
    y = []
    orb = cv2.ORB_create(nfeatures=n_features)
    
    for filename in os.listdir(directory_test):
        path = directory_test + '\\\\' + filename
        img = cv2.imread(path, cv2.IMREAD_GRAYSCALE)
        kp, des = orb.detectAndCompute(img, None)
        try:
            size = des.shape[0]
        except:
            continue
        if size == 500:
            id = int(filename.split('.')[0])
            if include_other_photos:
                X.append(des)
                X_dict[id] = des
                if id < 120:
                    y.append(2)
                elif id > 225:
                    y.append(0)
                else:
                    y.append(1)
            else:
                if id < 120:
                    X.append(des)
                    X_dict[id] = des
                    y.append(2)
                elif id > 225:
                    pass
                else:
                    X.append(des)
                    X_dict[id] = des
                    y.append(1)
                    
    X = np.asarray(X)
    X = X.reshape(X.shape[0], -1)
    y = np.asarray(y)
    
    return X, y, X_dict

### Допоміжна функція для наочної перевірки правильності роботи класифікатора

In [295]:
def print_photo(y_test, y_pred, X_test, X_dict):
    if y_test == 0:
        print("This is neither car nor ship!")
    elif y_test == 1:
        print("This is car!")
    else:
        print("This is ship!")
    if y_pred == 0:
        print("My classifier thinks this is neither car nor ship!")
    elif y_pred == 1:
        print("My classifier thinks this is car!")
    else:
        print("My classifier thinks this is ship!")
    X_test = X_test.reshape(500, 32)
    id = [id for id, el in X_dict.items() if (el == X_test).all()][0]
    path = directory_test + '\\\\' + str(id) + '.jpg'
    img = cv2.imread(path, 0)
    cv2.namedWindow("Image", cv2.WINDOW_NORMAL)
    cv2.resizeWindow("Image", 600, 600)
    cv2.imshow("Image", img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
    print(path)

## Будуємо тернарний класифікатор

In [296]:
X, y, X_dict = create_X_and_y(n_features, directory_test, include_other_photos)

print("X shape:", X.shape)
print("y shape:", y.shape)

X shape: (221, 16000)
y shape: (221,)


### Розділяємо вибірку на train та test

In [393]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=100)

print("X_train shape:", X_train.shape)
print("y_train shape:", y_train.shape)
print("X_test shape:", X_test.shape)
print("y_test shape:", y_test.shape)

X_train shape: (165, 16000)
y_train shape: (165,)
X_test shape: (56, 16000)
y_test shape: (56,)


### Використовуємо Logistic Regression як наш класифікатор

In [394]:
from sklearn.linear_model import LogisticRegression

logreg = LogisticRegression(solver='liblinear', multi_class='auto')
logreg.fit(X_train, y_train)

y_pred = logreg.predict(X_test)

### Виводимо точність для одного із train_test_split

In [395]:
from sklearn import metrics
print(metrics.accuracy_score(y_test, y_pred))

0.7857142857142857


### Демонструємо наглядну роботу класифікатора

In [300]:
y_pred

array([2, 2, 2, 2, 1, 2, 2, 1, 1, 1, 2, 1, 2, 1, 1, 2, 2, 1, 1, 1, 2, 1,
       2, 1, 2, 2, 2, 1, 1, 1, 1, 2, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 1, 2, 2, 2, 2, 1, 1, 2, 2, 1, 1])

In [301]:
y_test

array([2, 0, 1, 2, 0, 1, 1, 1, 1, 1, 2, 1, 2, 1, 1, 0, 2, 1, 1, 1, 2, 1,
       2, 1, 0, 1, 1, 1, 1, 1, 1, 2, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2,
       2, 1, 2, 2, 0, 2, 1, 2, 2, 2, 1, 2])

In [314]:
# pd.Series(y_train).value_counts()

Як ми бачимо, точність класифіктора для даного train_test_split майже 80%, що впринципі досить непогано для такої трейнової вибірки. Вище я вивів очікувані значення y та передбачені. За допомогою функції print_photo можемо повиводити зображення, які наш класифікатор передбачає не вірно.

<img src="Library\146.jpg" alt="Drawing" style="width: 400px;"/>

In [306]:
print_photo(y_test[2], y_pred[2], X_test[2], X_dict)

This is car!
My classifier thinks this is ship!
Library\\146.jpg


<img src="Library\179.jpg" alt="Drawing" style="width: 400px;"/>

In [310]:
print_photo(y_test[5], y_pred[5], X_test[5], X_dict)

This is car!
My classifier thinks this is ship!
Library\\179.jpg


<img src="Library\238.jpg" alt="Drawing" style="width: 400px;"/>

In [312]:
print_photo(y_test[1], y_pred[1], X_test[1], X_dict)

This is neither car nor ship!
My classifier thinks this is ship!
Library\\238.jpg


<img src="Library\101.jpg" alt="Drawing" style="width: 400px;"/>

In [317]:
print_photo(y_test[-1], y_pred[-1], X_test[-1], X_dict)

This is ship!
My classifier thinks this is car!
Library\\101.jpg


Так, за цими прикладами здається дуже дивним, що класифікатор не вірно розпізнає об'єкти на цих зображеннях, проте самі зображення дійсно дуже різні (на одному із них лише трішки видніється машинка, головний ракурс на замку, а останнє фото кораблика взагалі трішки розмите, а, як ми уже знаємо із попередньої лабки, ORB є дуже чутливим до освітлення й розмитості фото), а тому однозначного висновку щодо того чому так відбувається зробити не можна. На мою думку, це відбувається через замалу трейн вибірку (лише 165 об'єктів). Та навіть попри таку невеличку вибірку класифікатор працює із точністю близько 70% (для різних train_test_split різна точність), що досить круто. Одне можна сказати напевне: наша вибірка містить замалу кількість фото без машинки й корабля, саме через це вона взагалі не виводить жодного спрогнозованого 0 (що відповідає зображенню без машинки й корабля). Тому наступним кроком спробуємо розглянути бінарну класифікацію на вибірці, яка міститиме лише фото або машинки, або корабля.

### Виводимо confusion matrix

In [321]:
print(metrics.confusion_matrix(y_test, y_pred))

[[ 0  1  4]
 [ 0 19  5]
 [ 0  2 25]]


Це я вивів confusion matrix, із якої досить добре видно кількість правильно спрогнозованих фото та помилки першого й другого роду. Наприклад, класифікатор правильно знаходить 19 машин на фото та 25 кораблів, проте замість того, щоб не знайти нічого, він 4 рази знаходить кораблі й 1 раз машинку, а замість того, щоб знайти машинку, він 5 разів знаходить корабель і тд.

### Виводимо точність по cross validation

In [481]:
from sklearn.model_selection import cross_val_score

print(cross_val_score(logreg, X, y, cv=10, scoring='accuracy').mean())

0.49551101072840203


#### P.S. У майбутньому користуватимемось цією метрикою, як основною при порівнянні класифікаторів

## Будуємо бінарний класифіктор

In [323]:
X, y, X_dict = create_X_and_y(n_features, directory_test, include_other_photos=False)

print("X shape:", X.shape)
print("y shape:", y.shape)

X shape: (191, 16000)
y shape: (191,)


### Розділяємо вибірку на train та test

In [341]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=8)

print("X_train shape:", X_train.shape)
print("y_train shape:", y_train.shape)
print("X_test shape:", X_test.shape)
print("y_test shape:", y_test.shape)

X_train shape: (143, 16000)
y_train shape: (143,)
X_test shape: (48, 16000)
y_test shape: (48,)


### Використовуємо Logistic Regression як наш класифікатор

In [342]:
logreg = LogisticRegression(solver='liblinear', multi_class='auto')
logreg.fit(X_train, y_train)

y_pred = logreg.predict(X_test)

### Виводимо точність для одного із train_test_split

In [343]:
print(metrics.accuracy_score(y_test, y_pred))

0.8958333333333334


### Виводимо confusion matrix

In [344]:
print(metrics.confusion_matrix(y_test, y_pred))

[[22  2]
 [ 3 21]]


### Виводимо точність по cross validation

In [346]:
print(cross_val_score(logreg, X, y, cv=10, scoring='accuracy').mean())

0.807280701754386


Останню точність ми й вважаємо нашою основною метрикою при порівнянні класифікаторів, тому ми бачимо, що вона зросла на 10% у порівнянні із попереднім тернарним класифікатором, тобто в 4 із 5 випадків класифікатор правильно знаходить чи машинка на зображенні, чи корабель, що я вважаю мега-круто, як для такої невеличкої трейн вибірки (лише 143 об'єкти).

## Розглядаємо інші класифікатори

Розглянемо ще кілька класифікаторів і подивимося, яку точінсть видають вони для тернарного класифікатору (випадок, коли в трейн вибірці є зображення або із машинкою, або із кораблем, або без нічого). Як і раніше, вважатимемо за основну метрику середній результат точності cross validation (уже знаємо, що для логістичної цей показник становить близько 70%).

In [378]:
X, y, X_dict = create_X_and_y(n_features, directory_test, include_other_photos=True)

print("X shape:", X.shape)
print("y shape:", y.shape)

X shape: (221, 16000)
y shape: (221,)


### Використовуємо SVM with linear kernel як наш класифікатор

In [443]:
from sklearn.svm import SVC

svm = SVC(kernel='linear')
print(cross_val_score(svm, X, y, cv=10, scoring='accuracy').mean())

0.7021174477696217


### Використовуємо SVM with polynomial kernel як наш класифікатор

In [442]:
svm = SVC(kernel='poly', gamma='scale')
print(cross_val_score(svm, X, y, cv=10, scoring='accuracy').mean())

0.7108319217014868


### Використовуємо PCA

До цього моменту ми розглядали класифікатори, які ідеально підходять для випадку, коли кількість фіч набагато більша за кількість трейн екзамплів (у нас 16000 проти 165). Зараз же зменшимо розмірність нашої матриці X із [221x16000] до [221x100] за допомогою Principal Component Analysis (PCA).

In [493]:
from sklearn.decomposition import PCA

pca = PCA(n_components=100)
X_pca = pca.fit_transform(X)

### Використовуємо SVM with Gaussian kernel with PCA як наш класифікатор

In [484]:
svm = SVC(kernel='rbf', gamma='scale')
print(cross_val_score(svm, X_pca, y, cv=10, scoring='accuracy').mean())

0.6940523244871071


### Використовуємо NN with PCA як наш класифікатор

In [471]:
from sklearn.neural_network import MLPClassifier

nn = MLPClassifier(hidden_layer_sizes=(200,))
print(cross_val_score(nn, X_pca, y, cv=10, scoring='accuracy').mean())

0.4625917560700169


### Використовуємо Random Forest with PCA як наш класифікатор

In [500]:
from sklearn.ensemble import RandomForestClassifier

rfc = RandomForestClassifier(n_estimators=200)
print(cross_val_score(rfc, X_pca, y, cv=10, scoring='accuracy').mean())

# from sklearn.model_selection import GridSearchCV
# param_grid = dict(n_estimators=[100, 200, 300, 400, 500, 600, 700, 800, 900, 1000])
# grid = GridSearchCV(rfc, param_grid, cv=10, scoring='accuracy', return_train_score=False)
# grid.fit(X_pca, y)
# print(grid.best_score_)
# print(grid.best_params_)

0.6953039713909279


### Використовуємо Decision Trees with PCA як наш класифікатор

In [516]:
from sklearn.tree import DecisionTreeClassifier

dtc = DecisionTreeClassifier()
print(cross_val_score(dtc, X_pca, y, cv=10, scoring='accuracy').mean())

0.655561829474873
