In [None]:
#sciagniecie wszystkich potrzebnych bibliotek
from scipy.io import loadmat
import pandas as pd
from PIL import Image
import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf
import os
import cv2
from sklearn.model_selection import train_test_split
import random
from keras.callbacks import EarlyStopping
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
import pickle

# 1. Poprawna ekstrakcja danych z plikow oraz ich wstepna analiza

In [None]:
#sciagniecie danych z google drive
from google.colab import drive
drive.mount('/content/gdrive')

!unzip "/content/gdrive/MyDrive/Colab Notebooks/car_ims.zip" -d "/content"

In [None]:
#budowa funkcji, ktorej celem jest prawidlowe sciagniecie pliku zawierajacego 
#etykiety zbioru wykorzystanego do analizy 
def read_mat_to_df(file_path):
    np_array= loadmat(file_path, matlab_compatible=False, simplify_cells=True, chars_as_strings=True)
    df= pd.DataFrame(np_array['annotations'])
    if 'class_names' in np_array:
        class_names= list(np_array['class_names'])
        df['class_name']= df['class'].map(dict(enumerate(class_names, start=1)))
    # squeeze int-types
    for c, t in df.dtypes.items():
        if t.kind == 'i':
            df[c]= df[c].astype('int16')
    if 'fname' in df.columns:
        df['relative_im_path']= 'car_ims/0' + df['fname']
        df.drop(columns=['fname'], inplace=True)
    return df

cars_full= read_mat_to_df('gdrive/MyDrive/cars_annos.mat')
class_class_name_count=cars_full[['class','class_name']].value_counts().reset_index()
class_to_name_dict=dict(zip(class_class_name_count['class'], class_class_name_count.class_name))

In [None]:
#utworzenie kolumny w tabeli z etykietami, ktora bedzie wykorzystana do analizy jako zmienna objasniana
cars_full['brand']=[class_name.split()[0] for class_name in cars_full['class_name'].tolist()]
map_brand=cars_full['brand'].value_counts().reset_index()
map_brand['class']=[x for x in range(1,len(map_brand)+1)]
class_to_brand_dict=dict(zip(map_brand['brand'], map_brand['class']))
brand_to_class_dict=dict(zip(map_brand['class'], map_brand['brand']))
cars_full['class']=cars_full['brand'].map(class_to_brand_dict)

In [None]:
# zbudowanie funkcji, ktorej celem bedzie ekstrakcja danych. Funkcja ta posiada wiele argumentow, ktore
# umozliwiaja uzytkownikowi modyfikacje obserwacji
# cropped - przycinanie zdjecia aby wynikiem byl wylacznie samochod
# white_black - wybranie wymiarow zdjecia, czarne==True, biale==False
# sub_sample - wybranie ilosci zdjec poddanych ekstracji i pre-processingu
# image_dim_change - bool parametr, ktory uzytkownik moze uzyc w sytuacji checi zmienienia wymiarow zdjecia
# image_dim_change_val - parametr, ktory oznajmia jakie wymiary zdjecie powinno posiadac
# final_data - zastosowanie wyrownania histogramy oraz podzielenia wektoru ze zdjeciem przez 255 w sytuacji, gdy 
# parametr bedzie rownal sie z True
# wynikiem funkcji sa zdjecia oraz ich wymiary
def loop_for_car_images(df,white_black=True,sub_sample=None,
                        cropped=True, image_dim_change=False,
                        image_dim_change_val=[100,100],final_data=False):
    if sub_sample==None:
        sub_sample=len(df)
    df1=df.copy()[0:sub_sample]
    images=[]
    i=0
    images_dim=[]
    for index,row in df1.iterrows():
        i+=1
        path=os.path.join(df['relative_im_path'][index])
        image = Image.open(path)
        if len(np.array(image).shape)==3 and white_black==True:
            image=image.convert('L')
        image_array=np.array(image)
        if len(image_array.shape)<3 and white_black==False:
            image_array=cv2.merge((image_array,image_array,image_array))
        if cropped:
            image_array=image_array[row['bbox_y1']:row['bbox_y2'],row['bbox_x1']:row['bbox_x2']]
        if image_dim_change:
            image_array=cv2.resize(image_array,(image_dim_change_val[0],image_dim_change_val[1]))
        if final_data:
            image_array = cv2.equalizeHist(image_array[:,:])
            image_array=image_array.reshape(image_dim_change_val[0],image_dim_change_val[1], 1)
            image_array=image_array/255

        images.append(image_array)
        images_dim.append(image_array.shape)
        if i%1000==0:
            print(f'{i} photos have been uploaded')
    return images, images_dim

In [None]:
#sciaganie danych oraz ich wymiarow
images,images_dim=loop_for_car_images(cars_full,white_black=True)

In [None]:
# wstępna analiza wyników warstwy splotowej
image = Image.open("car_ims/000354.jpg")
plt.imshow(image)
plt.show()

image_array=np.array(image)/255
image_array2=image_array.copy()
images_con=np.array([image_array,image_array2])


filters=np.full((15,15,3,2),-20)
filters[:,6:9,:,0]=500 # LINIA PIONOWA
filters[6:9,:,:,1]=500 #LINIA POZIOMA

output= tf.nn.conv2d(images_con, filters, strides=1, padding='SAME')

plt.imshow(output[0,:,:,0],cmap='gray')
plt.show()

plt.imshow(output[0,:,:,1],cmap='gray')
plt.show()

# wstępna analiza wyników warstwy laczacej
image = Image.open("car_ims/000001.jpg")
plt.figure(figsize=(15,10))
plt.imshow(image)
plt.show()
image=np.array(image)/255

# tworzenie wyników warstwy łączącej max pooling oraz average pooling 
output_max=tf.nn.max_pool(image,ksize=10, strides=2,padding='VALID')
output_avg=tf.nn.avg_pool(image,ksize=10, strides=2,padding='VALID')

# max pooling
plt.figure(figsize=(15,10))
plt.imshow(output_max[:,:,0],cmap='gray')
plt.show()
#average pooling
plt.figure(figsize=(15,10))
plt.imshow(output_avg[:,:,0],cmap='gray')
plt.show()

del output_max
del output_avg
del image
del output
del filters

In [None]:
#utworzenie rysunku przedstawiajacego losowo wybrane samochody ze zbioru
images_20=[]
which_images=[]
for i in range(0,20):
    which_image=['0','0']+[str(random.randint(0, 9)) for x in range(0,4)]
    which_image=''.join(which_image)
    image=Image.open(f"{os.getcwd()}/data_and_labels/car_ims/{which_image}.jpg")
    images_20.append(image)
    which_images.append(which_image)

fig,axs=plt.subplots(4,4,figsize=(15,12))
i=0
for x1 in range(0,4):
    for x2 in range(0,4):
        axs[x1,x2].imshow(images_20[i])
        i+=1
        
plt.show()
del x1, x2, images_20, which_images, image, i

In [None]:
# utworzenie wykresu, ktore celem bedzie ukazanie liczebnosci poszczegolnych klas
class_count=cars_full[['class','brand']].value_counts().reset_index().sort_values("class", ascending=False)
class_car=cars_full[['class','brand']].value_counts().reset_index()

plt.figure(figsize=(25,12))
plt.bar(class_count['brand'],class_count[0])
plt.xticks(rotation=90,ha='center',fontsize=20)
plt.show()

del class_count

max_class=class_car[class_car[0]==max(class_car[0])].reset_index()
min_class=class_car[class_car[0]==min(class_car[0])].reset_index()
print(f'maksymalna ilość zdjęć przypisana dla poszczególnej klasy samochodu {max_class.brand[0]} to: {int(max_class[0])}')
print(f'minimalna ilość zdjęć przypisana dla poszczególnej klasy samochodu {min_class.brand[0]} to: {int(min_class[0])}')
del max_class, min_class, class_car

# 3. Preprocessing

In [None]:
# utworzenie wykresow, ktore ukazywac beda wyniki zastosowania przyciecia oraz
# zmienienia kolorow na czarno biale
images_black,_=loop_for_car_images(cars_full[0:151],white_black=True)
images_color,_=loop_for_car_images(cars_full[0:151],white_black=False,cropped=False)


images_pre1=[images_black[0],images_color[0],images_black[149],images_color[149]]

fig,axs=plt.subplots(2,2,figsize=(12,10))
axs[0,1].imshow(images_pre1[0],cmap='gray')
axs[0,1].title.set_text('czarno-białe zdjęcie po przycięciu')
axs[0,0].imshow(images_pre1[1])
axs[0,0].title.set_text('zdjęcie przed zmianami')
axs[1,1].imshow(images_pre1[2],cmap='gray')
axs[1,1].title.set_text('czarno-białe zdjęcie po przycięciu')
axs[1,0].imshow(images_pre1[3])
axs[1,0].title.set_text('zdjęcie przed zmianami')

plt.show()

del images_black, images_color, _, images_pre1, fig, axs

In [None]:
# ukazanie wynikow zastosowania metody wyrownania histogramu zdjecia
images1=cv2.equalizeHist(images[12341][:,:])

fig,axs=plt.subplots(2,2,figsize=(15,10))
axs[0,0].imshow(images[12341],cmap='gray')
axs[0,0].title.set_text('Orginalne zdjęcie')
hist,_=np.histogram(images[12341].flatten(), 256, [0, 256])
axs[0,1].plot(hist, color='r')
axs[0,1].set_xlim([0, 256])
axs[0,1].set_ylim([0, 5000])
axs[0,1].title.set_text('histogram orginalnego zdjęcia')
axs[1,0].imshow(images1,cmap='gray')
axs[1,0].title.set_text('Zdjęcie po wyrównaniu histogramu')
hist,_=np.histogram(images1.flatten(), 256, [0, 256])
axs[1,1].plot(hist, color='r')
axs[1,1].set_xlim([0, 256])
axs[1,1].set_ylim([0, 5000])
axs[1,1].title.set_text('Wyrównany histogram')

In [None]:
#przedstawienie wykresow ukazujacych wymiary wszystkich zdjec
df_dim=pd.DataFrame(images_dim,columns=['height','width'])
fig,axs=plt.subplots(1,2,figsize=(20,8))
axs[0].hist(df_dim['height'],bins=200,edgecolor='k',alpha=0.5)
axs[0].axvline(df_dim['height'].mean(), color='r', linestyle='dashed', linewidth=2)
axs[0].axvline(statistics.mode(df_dim['height']), color='b', linestyle='dashed', linewidth=2)
axs[0].set_title('Wysokość',fontsize=15)
axs[1].hist(df_dim['width'],bins=200,edgecolor='k',alpha=0.5)
axs[1].axvline(df_dim['width'].mean(), color='r', linestyle='dashed', linewidth=2)
axs[1].axvline(statistics.mode(df_dim['width']), color='b', linestyle='dashed', linewidth=2)
axs[1].set_title('Szerokość',fontsize=15)

#del images_dim, images, _, image_array, image_array2, images1

In [None]:
# sciagniecie danych na ktorych zastosowano  wyrownanie histogramu, zmiany kolorow na czarno-biale, przyciecia
# oraz zmiany ich wymiarow
# mean_width=round(df_dim['width'].mean())
# mean_height=round(df_dim['height'].mean())
# print(df_dim['width'].mean(),df_dim['height'].mean())
# del df_dim
images,_=loop_for_car_images(cars_full,white_black=True,image_dim_change=True,
                              image_dim_change_val=[200,200],final_data=True)


In [None]:
# podzial danych na zbior treningowy, walidacyjny oraz testowy
X=images
y=cars_full['class']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 0.2,random_state=5,stratify=y)
X_val, X_test, y_val, y_test =train_test_split(X_test, y_test, test_size = 0.5,random_state=20,stratify=y_test)
del images, _, X, y

In [None]:
# utworzenie wykresu ukazujacego liczebnosc poszczegolnych klas dla zbioru treningowego, walidacyjnego
# oraz testowego
y_train_list=[]
for y_train_ob in y_train:
    brand_car=brand_to_class_dict[y_train_ob]
    y_train_list.append(brand_car)
y_val_list=[]
for y_val_ob in y_val:
    brand_car=brand_to_class_dict[y_val_ob]
    y_val_list.append(brand_car)
y_test_list=[]
for y_test_ob in y_test:
    brand_car=brand_to_class_dict[y_test_ob]
    y_test_list.append(brand_car)

plt.figure(figsize=(20,10))
plt.hist([y_test_list,y_val_list,y_train_list], 49,edgecolor='k', histtype='bar')
plt.xticks(rotation=90,ha='center')
plt.legend(['testowy','walidacyjny','treningowy'])
plt.show()
#del y_test_list, y_val_list, y_train_list

In [None]:
# utworzenie funkcji, ktora stosowac bedzie na danych metode data augmentation
augmentation = tf.keras.Sequential([
  tf.keras.layers.RandomFlip("horizontal_and_vertical"),
  tf.keras.layers.RandomRotation(0.2,fill_mode='constant',seed=1),
])
def data_aug(X,y,how_much_total,show=False):
    data_val_count=y.value_counts().reset_index()
    low_cat=data_val_count[data_val_count['class']<how_much_total]
    low_cat.columns=['class','count']
    images_aug=list(X.copy())
    labels_aug=list(y.copy())
    df_y=pd.DataFrame(y).reset_index()
    df_y.columns=['previous index','y']
    for _,low_cat_row in low_cat.iterrows():
        how_much_aug=how_much_total-low_cat_row['count']
        df_temp=df_y[df_y['y']==low_cat_row['class']]
        i=0
        show1=False
        if show==True:
            show1=True
        while i<how_much_aug:
            for index,row in df_temp.iterrows():
                image_to_aug=X[index].copy()
                aug_image=augmentation(image_to_aug)
                if show1:
                    print(class_to_name_dict.get(low_cat_row['class']))
                    plt.figure(figsize=(15,10))
                    plt.imshow(image_to_aug)
                    plt.show()
                    plt.figure(figsize=(15,10))
                    plt.imshow(aug_image)
                    plt.show()
                    show1=False
                images_aug.append(aug_image)
                labels_aug.append(low_cat_row['class'])
                i+=1
                if i>=how_much_aug:
                    break
    print('Done!')
    return images_aug, labels_aug

In [None]:
# zastosowanie data augmentation na danych treningowych
X_train, y_train=data_aug(X_train,y_train,how_much_total=250,show=False)

In [None]:
# zmienienie klasy danych aby mogly byc uzyte do budowy modeli splotowych sieci neuronowych
X_train=np.array(X_train)
X_val=np.array(X_val)
X_test=np.array(X_test)
y_train=np.array(y_train)
y_val=np.array(y_val)
y_test=np.array(y_test)

y_train=tf.keras.utils.to_categorical(y_train)
y_val=tf.keras.utils.to_categorical(y_val)
y_test=tf.keras.utils.to_categorical(y_test)

In [None]:
# zapisanie danych w formie pickle
import pickle
pick_insert = open('gdrive/My Drive/X_train.pkl','wb')
pickle.dump(X_train, pick_insert)
pick_insert.close()
pick_insert = open('gdrive/My Drive/X_val.pkl','wb')
pickle.dump(X_val, pick_insert)
pick_insert.close()
pick_insert = open('gdrive/My Drive/X_test.pkl','wb')
pickle.dump(X_test, pick_insert)
pick_insert.close()
pick_insert = open('gdrive/My Drive/y_train.pkl','wb')
pickle.dump(y_train, pick_insert)
pick_insert.close()
pick_insert = open('gdrive/My Drive/y_val.pkl','wb')
pickle.dump(y_val, pick_insert)
pick_insert.close()
pick_insert = open('gdrive/My Drive/y_test.pkl','wb')
pickle.dump(y_test, pick_insert)
pick_insert.close()