In [None]:
from os import listdir

import numpy as np
from cv2 import *
from sklearn.cluster import KMeans
from sklearn.metrics import confusion_matrix
from sklearn.neighbors import KNeighborsClassifier

folders_name = ['Inside_City', 'Store', 'Mountain', 'Tall_Building', 'Open_Country', 'Highway', 'Kitchen', 'Coast',
                'Office', 'Bedroom', 'Suburb', 'Livingroom', 'Street', 'Industrial', 'Forest']

sift = SIFT_create()
descriptors = list()



در این قسمت سیفت و ایمپورت‌ها هستند.

In [None]:

def find_feature(path, type_of_data):
    im_list = listdir(path)
    D = list()
    for file in im_list:
        if file.endswith(".jpg"):
            im = imread(path + file)
            _, des = sift.detectAndCompute(im, None)
            if type_of_data == 'Train':
                for d in des:
                    descriptors.append(d)

            D.append(des)
    return D


def init_desc(type_of_data):
    folder = 'Data/' + type_of_data + '/'
    desc = list()
    for f in folders_name:
        desc.append(find_feature(folder + f + '/', type_of_data))
    return desc


desc_train = init_desc('Train')
desc_test = init_desc('Test')


در این قسمت از کد ابتدا دیسکریپتورهای هر عکس را حساب کردم و دیسکریپتورهای داده‌های آموزش را در یک لیست دیسکریپتور ریختم. هم‌چنین دیسکریپتورهای آموزش و تست را به صورت جداگانه در لیست‌هایی قرار دادم که در قسمت بعد از آن استفاده کنم


In [None]:

n_cluster = [50, 75, 85, 100]

Train_X, Train_Y = list(), list()
Test_X, Test_Y, True_Y = list(), list(), list()

for n in n_cluster:
    k_means = KMeans(n_clusters=n, random_state=0).fit(descriptors)

    train_X, train_Y = list(), list()
    test_X, test_Y, true_Y = list(), list(), list()


    def training(index):
        for des in desc_train[index]:
            h = np.zeros(n)
            for d in des:
                p = k_means.predict([d])
                h[p] += 1
            train_X.append(h.reshape(-1))
            train_Y.append(index)


    for i in range(len(folders_name)):
        training(i)


    def test(index):
        for des in desc_test[index]:
            h = np.zeros(n)
            for d in des:
                p = k_means.predict([d])
                h[p] += 1
            test_X.append(h.reshape(-1))
            true_Y.append(index)


    for i in range(len(folders_name)):
        test(i)

    for k in range(8):
        for l in range(2):
            metric = 'l' + str(l + 1)
            neigh = KNeighborsClassifier(n_neighbors=2 * k + 1, metric=metric)
            neigh.fit(train_X, train_Y)
            test_Y = neigh.predict(test_X)

            C = confusion_matrix(true_Y, test_Y)

            correct = 0
            for i in range(len(folders_name)):
                correct += C[i, i]

            print('n_cluster: ' + str(n), ' kNN: ' + str(2 * k + 1), ' metric: ' + metric)
            print(correct / len(folders_name))


کلاسترهای متفاوت را امتحان کردم. ابتدا 3 عدد 50 و 80 و 100 را گرفتم و تعداد کلاسترها را روی این اعداد ست کردم و یک فور کلی زدم. سپس در تابع ترینینگ اندیس که نشان‌دهنده‌ی نوع داده(عکس) است را گرفتم و با استفاده از پردیکت $kmeans$ 
هموگرافی هر عکس را می‌سازم. این تابع به این صورت عمل می‌کند که برای هر عکس دیسکریپتورها را می‌گیرد و با توجه به کلاسترها می‌گوید در کدام کلاستر می‌افتد. سپس بردار $h$
را در آن نقطه یک واحد افزایش می‌دهیم.
حال این بردارها را به عنوان فیچر وکتور هر عکس به ماتریس آموزش می‌دهیم و برای $Y$ آن نیز
اندیس نوع داده را به آن نسبت می‌دهیم، روی همه‌ی نوع داده‌ها فور می‌زنیم و فیچروکتور همه عکس‌های آموزش را محاسبه می‌کنیم. 
در قسمت بعد تابع تست اینگونه است که مانند تابع آموزش عمل می‌کند و فیچر وکتور هر عکس تست را محاسبه می‌کند و به ماتریس $test\_X$ اضافه می‌کند و هم‌چنین مقدار واقعی را به ماتریس 
$true\_Y$ 
اضافه می‌کند.
این ماتریس را بعدا با ماتریسی که پردیکت می‌شود مقایسه می‌کنیم و درصد درستی جواب حدس زده شده را محاسبه می‌کنیم.
در ادامه برای حدس از روش $kNN$
استفاده کردم. در این قسمت نیز برای $k$های
متفاوت و دو نرم $l1,l2$ درصد درستی را محاسبه کردم. 
این قسمت از کد را مانند قسمت الف و با استفاده از 
$sklearn$
انجام دادم.

نتایج به‌دست آمده برای تعداد کلاسترها و مقدار $k$ و نرم‌های متفاوت:


```
n_cluster: 50  kNN: 1  metric: l1
37.6

n_cluster: 50  kNN: 1  metric: l2
39.733333333333334

n_cluster: 50  kNN: 3  metric: l1
41.2

n_cluster: 50  kNN: 3  metric: l2
41.733333333333334

n_cluster: 50  kNN: 5  metric: l1
44.2

n_cluster: 50  kNN: 5  metric: l2
44.53333333333333

n_cluster: 50  kNN: 7  metric: l1
45.266666666666666

n_cluster: 50  kNN: 7  metric: l2
44.0

n_cluster: 50  kNN: 9  metric: l1
44.86666666666667

n_cluster: 50  kNN: 9  metric: l2
45.6

n_cluster: 50  kNN: 11  metric: l1
45.6

n_cluster: 50  kNN: 11  metric: l2
46.0

n_cluster: 50  kNN: 13  metric: l1
46.266666666666666

n_cluster: 50  kNN: 13  metric: l2
46.666666666666664

n_cluster: 50  kNN: 15  metric: l1
46.733333333333334

n_cluster: 50  kNN: 15  metric: l2
47.13333333333333

n_cluster: 75  kNN: 1  metric: l1
39.2

n_cluster: 75  kNN: 1  metric: l2
38.53333333333333

n_cluster: 75  kNN: 3  metric: l1
41.53333333333333

n_cluster: 75  kNN: 3  metric: l2
41.8

n_cluster: 75  kNN: 5  metric: l1
43.86666666666667

n_cluster: 75  kNN: 5  metric: l2
43.733333333333334

n_cluster: 75  kNN: 7  metric: l1
45.06666666666667

n_cluster: 75  kNN: 7  metric: l2
45.666666666666664

n_cluster: 75  kNN: 9  metric: l1
45.8

n_cluster: 75  kNN: 9  metric: l2
46.4

n_cluster: 75  kNN: 11  metric: l1
46.46666666666667

n_cluster: 75  kNN: 11  metric: l2
46.6

n_cluster: 75  kNN: 13  metric: l1
47.13333333333333

n_cluster: 75  kNN: 13  metric: l2
47.333333333333336

n_cluster: 75  kNN: 15  metric: l1
47.86666666666667

n_cluster: 75  kNN: 15  metric: l2
46.93333333333333

n_cluster: 85  kNN: 1  metric: l1
38.333333333333336

n_cluster: 85  kNN: 1  metric: l2
41.266666666666666

n_cluster: 85  kNN: 3  metric: l1
38.4

n_cluster: 85  kNN: 3  metric: l2
41.266666666666666

n_cluster: 85  kNN: 5  metric: l1
42.333333333333336

n_cluster: 85  kNN: 5  metric: l2
45.53333333333333

n_cluster: 85  kNN: 7  metric: l1
43.666666666666664

n_cluster: 85  kNN: 7  metric: l2
45.666666666666664

n_cluster: 85  kNN: 9  metric: l1
43.733333333333334

n_cluster: 85  kNN: 9  metric: l2
45.93333333333333

n_cluster: 85  kNN: 11  metric: l1
45.4

n_cluster: 85  kNN: 11  metric: l2
45.93333333333333

n_cluster: 85  kNN: 13  metric: l1
45.46666666666667

n_cluster: 85  kNN: 13  metric: l2
45.666666666666664

n_cluster: 85  kNN: 15  metric: l1
46.666666666666664

n_cluster: 85  kNN: 15  metric: l2
46.666666666666664

n_cluster: 100  kNN: 1  metric: l1
40.46666666666667

n_cluster: 100  kNN: 1  metric: l2
41.46666666666667

n_cluster: 100  kNN: 3  metric: l1
40.2

n_cluster: 100  kNN: 3  metric: l2
41.86666666666667

n_cluster: 100  kNN: 5  metric: l1
43.8

n_cluster: 100  kNN: 5  metric: l2
44.13333333333333

n_cluster: 100  kNN: 7  metric: l1
44.266666666666666

n_cluster: 100  kNN: 7  metric: l2
45.13333333333333

n_cluster: 100  kNN: 9  metric: l1
45.0

n_cluster: 100  kNN: 9  metric: l2
47.2

n_cluster: 100  kNN: 11  metric: l1
45.2

n_cluster: 100  kNN: 11  metric: l2
47.13333333333333

n_cluster: 100  kNN: 13  metric: l1
45.8

n_cluster: 100  kNN: 13  metric: l2
47.93333333333333

n_cluster: 100  kNN: 15  metric: l1
46.06666666666667

n_cluster: 100  kNN: 15  metric: l2
48.266666666666666

```

و همانطور که مشاهده می‌کنید بیشترین مقدار درستی برای مقادیر زیر است:


```
n_cluster: 100  kNN: 15  metric: l2
48.266666666666666

```

