In [1]:
import os
import pickle

import keras.utils
import numpy as np
import pandas as pd
from PIL import Image
from keras.applications import Xception
from keras.callbacks import ModelCheckpoint
from keras.layers import Input, Activation, Flatten, Dense
from keras.layers import (concatenate)
from keras.models import Model
from keras.models import load_model
from keras.optimizers import Adam
from skimage.transform import resize
from sklearn.metrics import accuracy_score, cohen_kappa_score
from sklearn.model_selection import train_test_split
from tqdm import tqdm


data_dir = "C:\\Users\\Priit\\Dropbox\\Informaatika\\Magister\\Tehisnärvivõrgud\\data"

train_image = os.path.join(data_dir, "train_images")
test_image = os.path.join(data_dir, "test_images")

label_column = "AdoptionSpeed"

BATCH_SIZE, test_size = 512, 0.2

height, width = 100, 100

Using TensorFlow backend.


In [2]:
def read_csv_kaggle(path, is_train):
    train = pd.read_csv(path, sep=',')
    pet_ids = train["PetID"]

    selected_columns = ["Type",
                        "Gender",
                        "Color1",
                        "Color2",
                        "Color3",
                        "MaturitySize",
                        "FurLength",
                        "Vaccinated",
                        "Dewormed",
                        "Sterilized",
                        "Health",
                        #"State",
                        "MaturitySize"]
    
    y = train[label_column] if is_train else None
    
    # One-Hot-encode
    X = pd.get_dummies(train[selected_columns], columns=selected_columns)

    # Normalize:
    to_normalize = ["Age", "Fee", "Quantity"]
    for to_norm in to_normalize:
         X[to_norm] = (train[to_norm] - train[to_norm].mean()) / train[to_norm].std()
    
    return X, y, pet_ids

def read_images(image_paths):
    def random_image():
        return np.random.rand(height, width, 3) * 255
    
    def read_image(path):
        img = np.asarray(Image.open(path).convert("RGB"), dtype="int32" )
        return resize(img, (height, width), anti_aliasing=True, mode='constant')    

    return np.array([read_image(path) if os.path.isfile(path) else random_image() for path in tqdm(image_paths)])

In [3]:
X, y, pet_ids = read_csv_kaggle(os.path.join(data_dir, "train.csv"), True)

In [4]:
f_im_name = "images.binary"

if not os.path.isfile(f_im_name):
    images = read_images([os.path.join(train_image, pet_id + "-1.jpg") for pet_id in pet_ids])
    
    # Standardize:
    mean, std = np.mean(images), np.std(images)
    images_meanstd = (images - mean)/std
    
    with open(f_im_name, 'wb') as handle_1, open("mnstd", 'wb') as handle_2:
        pickle.dump(images_meanstd, handle_1, protocol=pickle.HIGHEST_PROTOCOL)        
        pickle.dump((mean, std), handle_2, protocol=pickle.HIGHEST_PROTOCOL)

else:
    with open(f_im_name, 'rb') as handle_1, open("mnstd", 'rb') as handle_2:
        images_meanstd = pickle.load(handle_1)
        temp = pickle.load(handle_2)
        mean, std = temp[0], temp[1]
                
print(images_meanstd.shape)

(14993, 100, 100, 3)


In [5]:
X_train_img, X_test_img, X_train_else, X_test_else, y_train, y_test = train_test_split(images_meanstd, 
                                                                                       X, 
                                                                                       y, 
                                                                                       test_size=test_size,
                                                                                       random_state=1)

In [20]:
# https://stackoverflow.com/questions/49618986/neural-network-in-keras-with-two-different-input-types-images-and-values
# https://www.learnopencv.com/keras-tutorial-transfer-learning-using-pre-trained-models/

transfer = Xception(weights='imagenet', include_top=False, input_shape=(height, width, 3))

# Freeze Xception
#for layer in transfer.layers[:-9]:
#    layer.trainable = False

# Inputs
image_input = Input(shape=(height, width, 3))
aux_input = Input(shape=(len(list(X_train_else)),))

# Images:
transfer = transfer(image_input)
transfer = Dense(150, activation='relu')(transfer)
flatten = Flatten()(transfer)

# Aux input:
x = Dense(150, activation='relu')(aux_input)

# Merged:
merge = concatenate([flatten, x])
x = Dense(500)(merge)
h = Dense(5)(x)

# Predictions:
predictions = Activation('softmax')(h)

model = Model(inputs=[image_input, aux_input], outputs=predictions)
model.compile(optimizer=Adam(lr=0.001), loss='categorical_crossentropy', metrics=['accuracy'])


history = model.fit([X_train_img, X_train_else], 
                    keras.utils.to_categorical(y_train),
                    batch_size=BATCH_SIZE, 
                    epochs=4, 
                    validation_split=0.1,
                    callbacks=[ModelCheckpoint('test_model.h5', save_best_only=True)])

Train on 10794 samples, validate on 1200 samples
Epoch 1/4
Epoch 2/4
Epoch 3/4
Epoch 4/4


In [26]:
train_pred = [np.argmax(pred) for pred in model.predict([X_train_img, X_train_else])]
test_predictions = [np.argmax(pred) for pred in model.predict([X_test_img, X_test_else])]

In [27]:
print("Kappa on train: {}".format(round(cohen_kappa_score(y_train, train_pred, weights="quadratic"), 4)))
print("Accuracy on train: {}".format(round(accuracy_score(y_train, train_pred), 4)))
print("________________")
print("Kappa on test: {}".format(round(cohen_kappa_score(y_test, test_predictions, weights="quadratic"), 4)))
print("Accuracy on test: {}".format(round(accuracy_score(y_test, test_predictions), 4)))

Kappa on train: 0.27
Accuracy on train: 0.3805
________________
Kappa on test: 0.2415
Accuracy on test: 0.3531


In [22]:
test, _, test_pet_ids = read_csv_kaggle(os.path.join(data_dir, "test.csv"), False)
test_images = read_images([os.path.join(test_image, pet_id + "-1.jpg") for pet_id in test_pet_ids])
test_images_std = (test_images - mean)/std


  0%|                                                                                         | 0/3972 [00:00<?, ?it/s]
  0%|                                                                                 | 4/3972 [00:00<02:00, 32.92it/s]
  0%|                                                                                 | 6/3972 [00:00<02:41, 24.53it/s]
  0%|▏                                                                                | 8/3972 [00:00<02:53, 22.84it/s]
  0%|▎                                                                               | 14/3972 [00:00<02:24, 27.34it/s]
  0%|▎                                                                               | 18/3972 [00:00<02:18, 28.62it/s]
  1%|▍                                                                               | 22/3972 [00:00<02:14, 29.43it/s]
  1%|▌                                                                               | 25/3972 [00:00<02:48, 23.48it/s]
  1%|▌                                 

  7%|█████▍                                                                         | 271/3972 [00:08<01:21, 45.39it/s]
  7%|█████▌                                                                         | 277/3972 [00:08<01:19, 46.68it/s]
  7%|█████▌                                                                         | 282/3972 [00:08<01:23, 44.45it/s]
  7%|█████▋                                                                         | 288/3972 [00:09<01:18, 47.00it/s]
  7%|█████▉                                                                         | 296/3972 [00:09<01:10, 52.11it/s]
  8%|██████                                                                         | 303/3972 [00:09<01:05, 56.14it/s]
  8%|██████▏                                                                        | 309/3972 [00:09<01:20, 45.47it/s]
  8%|██████▎                                                                        | 315/3972 [00:09<01:17, 47.23it/s]
  8%|██████▍                            

 15%|███████████▍                                                                   | 578/3972 [00:17<02:21, 24.02it/s]
 15%|███████████▌                                                                   | 581/3972 [00:17<02:39, 21.30it/s]
 15%|███████████▌                                                                   | 584/3972 [00:17<02:47, 20.19it/s]
 15%|███████████▋                                                                   | 587/3972 [00:17<02:46, 20.28it/s]
 15%|███████████▋                                                                   | 590/3972 [00:17<02:35, 21.80it/s]
 15%|███████████▊                                                                   | 594/3972 [00:17<02:21, 23.89it/s]
 15%|███████████▊                                                                   | 597/3972 [00:18<02:14, 25.05it/s]
 15%|███████████▉                                                                   | 600/3972 [00:18<02:23, 23.52it/s]
 15%|███████████▉                       

 21%|████████████████▌                                                              | 832/3972 [00:26<01:26, 36.12it/s]
 21%|████████████████▋                                                              | 836/3972 [00:26<01:27, 35.70it/s]
 21%|████████████████▋                                                              | 840/3972 [00:26<01:26, 36.27it/s]
 21%|████████████████▊                                                              | 844/3972 [00:26<01:25, 36.73it/s]
 21%|████████████████▊                                                              | 848/3972 [00:26<01:40, 30.96it/s]
 21%|████████████████▉                                                              | 853/3972 [00:26<01:32, 33.68it/s]
 22%|█████████████████                                                              | 858/3972 [00:26<01:25, 36.39it/s]
 22%|█████████████████▏                                                             | 862/3972 [00:26<01:23, 37.33it/s]
 22%|█████████████████▏                 

 29%|██████████████████████▍                                                       | 1141/3972 [00:34<01:18, 36.02it/s]
 29%|██████████████████████▍                                                       | 1145/3972 [00:34<01:18, 35.92it/s]
 29%|██████████████████████▌                                                       | 1149/3972 [00:34<01:28, 31.78it/s]
 29%|██████████████████████▋                                                       | 1153/3972 [00:34<01:32, 30.54it/s]
 29%|██████████████████████▋                                                       | 1157/3972 [00:34<01:32, 30.34it/s]
 29%|██████████████████████▊                                                       | 1161/3972 [00:35<01:53, 24.72it/s]
 29%|██████████████████████▊                                                       | 1164/3972 [00:35<01:59, 23.48it/s]
 29%|██████████████████████▉                                                       | 1167/3972 [00:35<01:55, 24.26it/s]
 29%|██████████████████████▉            

 36%|███████████████████████████▋                                                  | 1412/3972 [00:43<01:51, 23.03it/s]
 36%|███████████████████████████▊                                                  | 1415/3972 [00:43<01:51, 22.89it/s]
 36%|███████████████████████████▊                                                  | 1418/3972 [00:43<01:54, 22.24it/s]
 36%|███████████████████████████▉                                                  | 1422/3972 [00:43<01:44, 24.30it/s]
 36%|████████████████████████████                                                  | 1428/3972 [00:43<01:28, 28.67it/s]
 36%|████████████████████████████                                                  | 1432/3972 [00:44<01:21, 31.14it/s]
 36%|████████████████████████████▏                                                 | 1436/3972 [00:44<01:36, 26.22it/s]
 36%|████████████████████████████▎                                                 | 1439/3972 [00:44<01:44, 24.34it/s]
 36%|████████████████████████████▎      

 43%|█████████████████████████████████▏                                            | 1689/3972 [00:52<01:01, 37.37it/s]
 43%|█████████████████████████████████▎                                            | 1694/3972 [00:52<00:59, 38.61it/s]
 43%|█████████████████████████████████▎                                            | 1698/3972 [00:52<00:59, 38.05it/s]
 43%|█████████████████████████████████▍                                            | 1702/3972 [00:53<01:23, 27.19it/s]
 43%|█████████████████████████████████▌                                            | 1706/3972 [00:53<01:34, 24.09it/s]
 43%|█████████████████████████████████▌                                            | 1710/3972 [00:53<01:24, 26.77it/s]
 43%|█████████████████████████████████▋                                            | 1714/3972 [00:53<01:16, 29.41it/s]
 43%|█████████████████████████████████▋                                            | 1718/3972 [00:53<01:10, 31.82it/s]
 43%|█████████████████████████████████▊ 

 49%|██████████████████████████████████████▌                                       | 1966/3972 [01:01<01:13, 27.24it/s]
 50%|██████████████████████████████████████▋                                       | 1969/3972 [01:01<01:12, 27.54it/s]
 50%|██████████████████████████████████████▋                                       | 1973/3972 [01:01<01:05, 30.30it/s]
 50%|██████████████████████████████████████▊                                       | 1977/3972 [01:01<01:07, 29.67it/s]
 50%|██████████████████████████████████████▉                                       | 1981/3972 [01:02<01:03, 31.18it/s]
 50%|██████████████████████████████████████▉                                       | 1985/3972 [01:02<01:00, 32.92it/s]
 50%|███████████████████████████████████████                                       | 1990/3972 [01:02<00:56, 35.02it/s]
 50%|███████████████████████████████████████▏                                      | 1994/3972 [01:02<01:00, 32.49it/s]
 50%|███████████████████████████████████

 56%|████████████████████████████████████████████                                  | 2241/3972 [01:10<00:56, 30.47it/s]
 57%|████████████████████████████████████████████                                  | 2245/3972 [01:10<00:55, 31.06it/s]
 57%|████████████████████████████████████████████▏                                 | 2249/3972 [01:10<00:54, 31.48it/s]
 57%|████████████████████████████████████████████▏                                 | 2253/3972 [01:10<01:00, 28.39it/s]
 57%|████████████████████████████████████████████▎                                 | 2258/3972 [01:10<00:52, 32.55it/s]
 57%|████████████████████████████████████████████▍                                 | 2262/3972 [01:11<00:57, 29.83it/s]
 57%|████████████████████████████████████████████▍                                 | 2266/3972 [01:11<01:03, 26.86it/s]
 57%|████████████████████████████████████████████▌                                 | 2270/3972 [01:11<00:59, 28.83it/s]
 57%|███████████████████████████████████

 64%|█████████████████████████████████████████████████▋                            | 2529/3972 [01:19<00:42, 33.83it/s]
 64%|█████████████████████████████████████████████████▊                            | 2534/3972 [01:19<00:39, 36.05it/s]
 64%|█████████████████████████████████████████████████▊                            | 2538/3972 [01:19<00:43, 32.94it/s]
 64%|█████████████████████████████████████████████████▉                            | 2542/3972 [01:19<00:42, 33.68it/s]
 64%|██████████████████████████████████████████████████                            | 2547/3972 [01:19<00:39, 36.31it/s]
 64%|██████████████████████████████████████████████████                            | 2551/3972 [01:19<00:45, 31.18it/s]
 64%|██████████████████████████████████████████████████▏                           | 2555/3972 [01:19<00:45, 30.95it/s]
 64%|██████████████████████████████████████████████████▎                           | 2560/3972 [01:20<00:41, 33.74it/s]
 65%|███████████████████████████████████

 70%|██████████████████████████████████████████████████████▉                       | 2797/3972 [01:28<00:32, 35.61it/s]
 71%|███████████████████████████████████████████████████████                       | 2801/3972 [01:28<00:32, 36.16it/s]
 71%|███████████████████████████████████████████████████████                       | 2806/3972 [01:28<00:30, 38.29it/s]
 71%|███████████████████████████████████████████████████████▏                      | 2810/3972 [01:28<00:33, 35.03it/s]
 71%|███████████████████████████████████████████████████████▎                      | 2814/3972 [01:28<00:35, 32.30it/s]
 71%|███████████████████████████████████████████████████████▎                      | 2818/3972 [01:28<00:34, 33.71it/s]
 71%|███████████████████████████████████████████████████████▍                      | 2822/3972 [01:28<00:32, 35.36it/s]
 71%|███████████████████████████████████████████████████████▍                      | 2826/3972 [01:28<00:32, 35.27it/s]
 71%|███████████████████████████████████

 78%|████████████████████████████████████████████████████████████▌                 | 3087/3972 [01:37<00:27, 31.94it/s]
 78%|████████████████████████████████████████████████████████████▋                 | 3091/3972 [01:37<00:26, 32.86it/s]
 78%|████████████████████████████████████████████████████████████▊                 | 3095/3972 [01:37<00:25, 34.04it/s]
 78%|████████████████████████████████████████████████████████████▊                 | 3099/3972 [01:37<00:26, 33.44it/s]
 78%|████████████████████████████████████████████████████████████▉                 | 3104/3972 [01:37<00:23, 36.91it/s]
 78%|█████████████████████████████████████████████████████████████                 | 3110/3972 [01:37<00:20, 41.12it/s]
 78%|█████████████████████████████████████████████████████████████▏                | 3115/3972 [01:37<00:22, 37.42it/s]
 79%|█████████████████████████████████████████████████████████████▏                | 3119/3972 [01:38<00:24, 35.19it/s]
 79%|███████████████████████████████████

 85%|██████████████████████████████████████████████████████████████████▎           | 3376/3972 [01:46<00:23, 25.20it/s]
 85%|██████████████████████████████████████████████████████████████████▍           | 3381/3972 [01:46<00:20, 29.26it/s]
 85%|██████████████████████████████████████████████████████████████████▍           | 3385/3972 [01:46<00:20, 28.03it/s]
 85%|██████████████████████████████████████████████████████████████████▌           | 3389/3972 [01:46<00:20, 27.82it/s]
 85%|██████████████████████████████████████████████████████████████████▋           | 3393/3972 [01:46<00:19, 29.92it/s]
 86%|██████████████████████████████████████████████████████████████████▋           | 3397/3972 [01:47<00:18, 31.85it/s]
 86%|██████████████████████████████████████████████████████████████████▊           | 3401/3972 [01:47<00:16, 33.66it/s]
 86%|██████████████████████████████████████████████████████████████████▊           | 3405/3972 [01:47<00:16, 34.91it/s]
 86%|███████████████████████████████████

 92%|███████████████████████████████████████████████████████████████████████▊      | 3657/3972 [01:55<00:10, 29.92it/s]
 92%|███████████████████████████████████████████████████████████████████████▉      | 3661/3972 [01:55<00:11, 26.75it/s]
 92%|███████████████████████████████████████████████████████████████████████▉      | 3664/3972 [01:55<00:11, 26.03it/s]
 92%|████████████████████████████████████████████████████████████████████████      | 3669/3972 [01:55<00:10, 29.69it/s]
 92%|████████████████████████████████████████████████████████████████████████▏     | 3673/3972 [01:55<00:09, 31.71it/s]
 93%|████████████████████████████████████████████████████████████████████████▏     | 3677/3972 [01:56<00:09, 31.28it/s]
 93%|████████████████████████████████████████████████████████████████████████▎     | 3681/3972 [01:56<00:09, 32.13it/s]
 93%|████████████████████████████████████████████████████████████████████████▎     | 3685/3972 [01:56<00:08, 34.09it/s]
 93%|███████████████████████████████████

 99%|█████████████████████████████████████████████████████████████████████████████▍| 3941/3972 [02:04<00:00, 41.45it/s]
 99%|█████████████████████████████████████████████████████████████████████████████▍| 3946/3972 [02:04<00:00, 40.22it/s]
 99%|█████████████████████████████████████████████████████████████████████████████▌| 3951/3972 [02:04<00:00, 40.69it/s]
100%|█████████████████████████████████████████████████████████████████████████████▋| 3956/3972 [02:04<00:00, 37.58it/s]
100%|█████████████████████████████████████████████████████████████████████████████▊| 3960/3972 [02:04<00:00, 33.62it/s]
100%|█████████████████████████████████████████████████████████████████████████████▊| 3964/3972 [02:04<00:00, 33.40it/s]
100%|█████████████████████████████████████████████████████████████████████████████▉| 3968/3972 [02:05<00:00, 30.19it/s]
100%|██████████████████████████████████████████████████████████████████████████████| 3972/3972 [02:05<00:00, 31.00it/s]

In [23]:
loaded = load_model('test_model.h5')
test_pred = loaded.predict([test_images_std, test])

In [24]:
test_pred_label = [np.argmax(pred) for pred in test_pred]

In [25]:
pd.DataFrame({'PetID': test_pet_ids, 'AdoptionSpeed': test_pred_label}).to_csv('submission4.csv', index=False)