In [10]:
%%html
<style>@font-face{font-family:Vazir;src:url(Vazir.eot);src:url(Vazir.eot?#iefix) format("embedded-opentype"),url(Vazir.woff2) format("woff2"),url(Vazir.woff) format("woff"),url(Vazir.ttf) format("truetype");font-weight:400;font-style:normal}.farsi{font-family:Vazir;direction:rtl}.center{text-align:center}.justify{text-align:justify}.blue{color:blue}</style>

<div class="farsi justify">
    ۱- Grayscale : با تبدیل هر عکس به سیاه سفید باعث می‌شود تاثیر فاکتور رنگ برای یک عکس از بین برود یعنی ماشین قرمز و آبی دیگر برایش فرق ندارد
    <br/>
    PCA : با کاهش ابعاد بردار ويژگی باعث می‌شود که سرعت ترین و تا حدی بازدهی آن افزایش پیدا کند
    <br/>
    Random Projection: روشی‌است که با آن ابعاد بردار ويژگی کاهش پیدا می‌کند که تاثیر آن مانند PCA است
    <br/>
    Augmentation: با تغییر هر عکس روی داده train تعداد اعضای داده train را بیشتر می‌کند از روش‌های تغییر عکس مانند چرخش یا قرینه کردن استفاده می‌شود.
</div>

## <div class = "farsi center blue">خواندن از فایل ها</div>

In [2]:
import pandas as pd
import numpy as np

CIFAR_LENGTH  = 32
train_data    = pd.read_csv('CIFAR10/CIFAR10_train_data.csv' ,header=None)
train_label   = pd.read_csv('CIFAR10/CIFAR10_train_label.csv',header=None)
test_data     = pd.read_csv('CIFAR10/CIFAR10_val_data.csv'   ,header=None)
test_label    = pd.read_csv('CIFAR10/CIFAR10_val_label.csv'  ,header=None)
real_test     = pd.read_csv('CIFAR10/CIFAR10_test_data.csv'  ,header=None)
np_test_label = np.array(test_label[0].values)
print('loading........done')

loading........done


## <div class = "farsi center blue">توابع اولیه</div>

In [3]:
from PIL import Image
from matplotlib.pyplot import imshow
import skimage.transform as imgtrans

def vec_to_img(img_vec):
    img_vec = img_vec.astype(np.uint8)
    img_arr = np.asarray(img_vec).reshape((CIFAR_LENGTH,CIFAR_LENGTH,3))
    return Image.fromarray(img_arr, 'RGB')
def img_to_vec(img):
    arr = np.array(img)
    return arr.ravel()
def rotate_img(img,degree):
    img_arr = imgtrans.rotate(np.array(img),degree,mode='reflect')
    return img_arr.ravel()
def print_img(img):
    imshow(np.asarray(img))
def calc_grade(perdicts,source = np_test_label):
    np_source = np.array(source)
    np_perdicts = np.array(perdicts)
    return np.count_nonzero(np_perdicts==np_source)/len(np_source)

## <div class = "farsi center blue">تبدیل همه عکس‌ها به سیاه سفید</div>

In [4]:
gr_train_data = train_data.apply(lambda x:vec_to_img(x).convert('L'),axis = 1)
gr_test_data  = test_data.apply(lambda x:img_to_vec(vec_to_img(x).convert('L')),axis = 1,result_type = 'expand')
gr_real_test  = real_test.apply(lambda x:img_to_vec(vec_to_img(x).convert('L')),axis = 1,result_type = 'expand')
print('done')

done


## <div class = "farsi center blue">پیاده سازی Augmentation بر روی داده Train و دو برابر کردن حجم آن</div>

In [5]:
fliped_train_data = gr_train_data.apply(lambda x:x.transpose(Image.FLIP_LEFT_RIGHT))
new_train_data    = pd.concat([gr_train_data, fliped_train_data],ignore_index=True).to_frame()

new_train_data = new_train_data.apply(lambda x:img_to_vec(x[0]),axis = 1,result_type = 'expand')

expanded_train_label = pd.concat([train_label]*2,ignore_index=True)
print('done')

done


## <div class = "farsi center blue">کاهش ابعاد بردار ویژگی به ۲۰</div>

In [6]:
from sklearn.random_projection import GaussianRandomProjection
grp = GaussianRandomProjection(n_components=150)
grp.fit(new_train_data.values)
grp_train     = grp.transform(new_train_data.values)
grp_test      = grp.transform(gr_test_data.values)
grp_real_test = grp.transform(gr_real_test.values)

In [7]:
from sklearn.decomposition import PCA
pca = PCA(n_components=20)
pca.fit(grp_train)
pca_train     = pca.transform(grp_train)
pca_test      = pca.transform(grp_test)
pca_real_test = pca.transform(grp_real_test)
print('done')

done


## <div class = "farsi center blue">محاسبه خطا برای داده‌های Test</div>

In [8]:
from sklearn.ensemble import RandomForestClassifier
rfc = RandomForestClassifier(n_estimators=100,random_state = 0)
rfc.fit(pca_train,expanded_train_label[0].values)
rfc_predicted = rfc.predict(pca_test)
print(calc_grade(rfc_predicted))

0.405


## <div class = "farsi center blue">ذخیره‌سازی خروجی Real test</div>

In [9]:
output = pd.DataFrame()
output['id']      = [i for i in range(1,len(pca_real_test)+1)]
output['predict'] = rfc.predict(pca_real_test)
output.to_csv('810195420.csv',index=False)

## <div class = "farsi center blue">جمع بندی</div>

<div class="farsi justify">
    به طور کلی GRayscale تاثیر زیادی بر عملکرد الگوریتم گذاشت و همچنین pca و randomprojection باعث شدند بدون از دست رفتن ملموس عملکرد سرعت اجرا افزایش پیدا کند.
    ولی برخلاف تصور Augmentation تاثیر زیادی بر عملکرد نداشت و فقط باعث کاهش سرعت و حتی کاهش عملکرد شد برای همین فقط از flip استفاده شد و از چرخش استفاده نشد.
</div>