In [1]:
import os
import PIL
import h5py
import math
import numpy as np
import matplotlib.pyplot as plt
from keras.applications.vgg16 import preprocess_input, VGG16
from keras.utils.np_utils import to_categorical
%matplotlib inline

Using TensorFlow backend.


In [2]:
OUT_FILE = 'data/aug_train_data.h5'
METADATA = 'metadata.npy'
DATA_FOLDER = 'data/augmentated'
SHAPE = (150, 250, 3)
BATCH_SIZE = 16

In [3]:
labels = os.listdir(DATA_FOLDER)
labels = [l for l in labels if ".DS_Store" not in l]
labels_path = [os.path.join(DATA_FOLDER, l) for l in labels]
print(labels_path)
n_labels = len(labels)
n_images = np.sum([len(os.listdir(l)) for l in labels_path])

label2idx = {j:to_categorical(i, n_labels)[0] for i,j in enumerate(labels)}
np.save(METADATA, label2idx)

model = VGG16(include_top=False, input_shape=SHAPE)
model.layers.pop()
    
print('model output shape: {}', model.output_shape)

f = h5py.File(OUT_FILE)
output_shape = (n_images, *model.output_shape[1:])
chunk_shape = (BATCH_SIZE, *model.output_shape[1:])
try:
    f.pop('x')
    f.pop('y')
except:
    None

img_data = f.create_dataset('x', shape=output_shape,
                            dtype=np.float32, chunks=chunk_shape)
labels_data = f.create_dataset('y', shape=(n_images, n_labels),
                               dtype=np.float32, chunks=(BATCH_SIZE, n_labels))

['data/augmentated/ALB', 'data/augmentated/BET', 'data/augmentated/DOL', 'data/augmentated/LAG', 'data/augmentated/NoF', 'data/augmentated/OTHER', 'data/augmentated/SHARK', 'data/augmentated/YFT']


model output shape: {} (None, 4, 7, 512)


In [4]:
from collections import deque
from time import time

t0 = time()
ts = deque(maxlen=5)
idxx = 0

for path, label in zip(labels_path, labels):
    files = os.listdir(path)
    files = [f for f in files if ".DS_Store" not in f]
    n_files = len(files)
    next_idxx = idxx + n_files
    labels_data[idxx:next_idxx] = label2idx[label]
    idx = 0
    for i in range(math.ceil(n_files / BATCH_SIZE)):
        tt0 = time()
        eta = np.mean(ts) * (n_images - idxx - idx) if len(ts) != 0 else 999
        print('%s: %04d/%04d (ETA: %.2fs)...' %
              (label, idx, n_files, eta), end='\r')
        next_idx = min(n_files, idx + BATCH_SIZE)
        batch_n = next_idx - idx
        batch_x = np.ndarray((batch_n, *SHAPE), dtype=np.float32)
        for j in range(batch_n):
            img = PIL.Image.open(os.path.join(path, files[idx + j]))
            img = img.resize(SHAPE[:2][::-1])
            img = np.asarray(img, dtype=np.float32)
            batch_x[j] = img
    
        batch_x = preprocess_input(batch_x)
        img_data[idxx + idx:idxx + idx + batch_n] = model.predict(batch_x)
        idx = next_idx
        ts.append((time() - tt0) / batch_n)
    
    idxx = next_idxx
    print(' '*50, end='\r')
    print('{}: Done'.format(label))
    
print('Done ({})'.format((time() - t0)))

ALB: 0000/4227 (ETA: 999.00s)...

ALB: 0016/4227 (ETA: 8317.28s)...

ALB: 0032/4227 (ETA: 8330.76s)...

ALB: 0048/4227 (ETA: 7912.24s)...

ALB: 0064/4227 (ETA: 9079.02s)...

ALB: 0080/4227 (ETA: 9176.53s)...

ALB: 0096/4227 (ETA: 9164.20s)...

ALB: 0112/4227 (ETA: 9017.50s)...

ALB: 0128/4227 (ETA: 9024.61s)...

ALB: 0144/4227 (ETA: 8060.57s)...

ALB: 0160/4227 (ETA: 7807.09s)...

ALB: 0176/4227 (ETA: 7730.06s)...

ALB: 0192/4227 (ETA: 8123.94s)...

ALB: 0208/4227 (ETA: 8420.74s)...

ALB: 0224/4227 (ETA: 9287.24s)...

ALB: 0240/4227 (ETA: 9969.50s)...

ALB: 0256/4227 (ETA: 10807.65s)...

ALB: 0272/4227 (ETA: 11590.89s)...

ALB: 0288/4227 (ETA: 12151.13s)...

ALB: 0304/4227 (ETA: 12134.78s)...

ALB: 0320/4227 (ETA: 12264.41s)...

ALB: 0336/4227 (ETA: 12598.30s)...

ALB: 0352/4227 (ETA: 13119.94s)...

ALB: 0368/4227 (ETA: 13617.56s)...

ALB: 0384/4227 (ETA: 14202.18s)...

ALB: 0400/4227 (ETA: 14848.17s)...

ALB: 0416/4227 (ETA: 14743.54s)...

ALB: 0432/4227 (ETA: 13924.92s)...

ALB: 0448/4227 (ETA: 14216.19s)...

ALB: 0464/4227 (ETA: 14002.27s)...

ALB: 0480/4227 (ETA: 13794.61s)...

ALB: 0496/4227 (ETA: 13726.58s)...

ALB: 0512/4227 (ETA: 13573.47s)...

ALB: 0528/4227 (ETA: 12749.66s)...

ALB: 0544/4227 (ETA: 12144.72s)...

ALB: 0560/4227 (ETA: 11490.14s)...

ALB: 0576/4227 (ETA: 11184.29s)...

ALB: 0592/4227 (ETA: 11189.56s)...

ALB: 0608/4227 (ETA: 11132.93s)...

ALB: 0624/4227 (ETA: 11146.20s)...

ALB: 0640/4227 (ETA: 11082.65s)...

ALB: 0656/4227 (ETA: 10982.04s)...

ALB: 0672/4227 (ETA: 11262.04s)...

ALB: 0688/4227 (ETA: 11557.45s)...

ALB: 0704/4227 (ETA: 12080.41s)...

ALB: 0720/4227 (ETA: 12517.17s)...

ALB: 0736/4227 (ETA: 12772.15s)...

ALB: 0752/4227 (ETA: 12476.69s)...

ALB: 0768/4227 (ETA: 12338.43s)...

ALB: 0784/4227 (ETA: 11817.61s)...

ALB: 0800/4227 (ETA: 11361.68s)...

ALB: 0816/4227 (ETA: 11575.89s)...

ALB: 0832/4227 (ETA: 12409.84s)...

ALB: 0848/4227 (ETA: 12745.45s)...

ALB: 0864/4227 (ETA: 13021.83s)...

ALB: 0880/4227 (ETA: 13323.23s)...

ALB: 0896/4227 (ETA: 13155.08s)...

ALB: 0912/4227 (ETA: 12371.21s)...

ALB: 0928/4227 (ETA: 12188.99s)...

ALB: 0944/4227 (ETA: 12042.15s)...

ALB: 0960/4227 (ETA: 11773.16s)...

ALB: 0976/4227 (ETA: 11645.58s)...

ALB: 0992/4227 (ETA: 11699.07s)...

ALB: 1008/4227 (ETA: 11839.17s)...

ALB: 1024/4227 (ETA: 11737.80s)...

ALB: 1040/4227 (ETA: 12222.34s)...

ALB: 1056/4227 (ETA: 12210.76s)...

ALB: 1072/4227 (ETA: 12025.25s)...

ALB: 1088/4227 (ETA: 11503.30s)...

ALB: 1104/4227 (ETA: 11346.71s)...

ALB: 1120/4227 (ETA: 10544.43s)...

ALB: 1136/4227 (ETA: 9237.01s)...

ALB: 1152/4227 (ETA: 8101.19s)...

ALB: 1168/4227 (ETA: 7189.04s)...

ALB: 1184/4227 (ETA: 6272.85s)...

ALB: 1200/4227 (ETA: 5659.16s)...

ALB: 1216/4227 (ETA: 6045.41s)...

ALB: 1232/4227 (ETA: 6496.39s)...

ALB: 1248/4227 (ETA: 6504.68s)...

ALB: 1264/4227 (ETA: 6518.55s)...

ALB: 1280/4227 (ETA: 6254.93s)...

ALB: 1296/4227 (ETA: 5811.32s)...

ALB: 1312/4227 (ETA: 5308.89s)...

ALB: 1328/4227 (ETA: 5080.87s)...

ALB: 1344/4227 (ETA: 4895.93s)...

ALB: 1360/4227 (ETA: 4839.35s)...

ALB: 1376/4227 (ETA: 4846.67s)...

ALB: 1392/4227 (ETA: 4840.38s)...

ALB: 1408/4227 (ETA: 4819.19s)...

ALB: 1424/4227 (ETA: 4797.18s)...

ALB: 1440/4227 (ETA: 4790.52s)...

ALB: 1456/4227 (ETA: 4800.57s)...

ALB: 1472/4227 (ETA: 4992.77s)...

ALB: 1488/4227 (ETA: 4972.12s)...

ALB: 1504/4227 (ETA: 4999.03s)...

ALB: 1520/4227 (ETA: 5023.57s)...

ALB: 1536/4227 (ETA: 4992.90s)...

ALB: 1552/4227 (ETA: 4798.33s)...

ALB: 1568/4227 (ETA: 4848.09s)...

ALB: 1584/4227 (ETA: 4836.40s)...

ALB: 1600/4227 (ETA: 4791.09s)...

ALB: 1616/4227 (ETA: 4790.87s)...

ALB: 1632/4227 (ETA: 4801.11s)...

ALB: 1648/4227 (ETA: 4787.52s)...

ALB: 1664/4227 (ETA: 4761.71s)...

ALB: 1680/4227 (ETA: 4777.47s)...

ALB: 1696/4227 (ETA: 4743.77s)...

ALB: 1712/4227 (ETA: 4717.89s)...

ALB: 1728/4227 (ETA: 4701.22s)...

ALB: 1744/4227 (ETA: 4733.83s)...

ALB: 1760/4227 (ETA: 4779.08s)...

ALB: 1776/4227 (ETA: 4869.53s)...

ALB: 1792/4227 (ETA: 4890.70s)...

ALB: 1808/4227 (ETA: 4903.41s)...

ALB: 1824/4227 (ETA: 4883.34s)...

ALB: 1840/4227 (ETA: 4896.34s)...

ALB: 1856/4227 (ETA: 4841.53s)...

ALB: 1872/4227 (ETA: 5199.94s)...

ALB: 1888/4227 (ETA: 5262.43s)...

ALB: 1904/4227 (ETA: 5360.75s)...

ALB: 1920/4227 (ETA: 5327.45s)...

ALB: 1936/4227 (ETA: 5356.10s)...

ALB: 1952/4227 (ETA: 4938.29s)...

ALB: 1968/4227 (ETA: 4780.57s)...

ALB: 1984/4227 (ETA: 4645.26s)...

ALB: 2000/4227 (ETA: 4579.88s)...

ALB: 2016/4227 (ETA: 4484.19s)...

ALB: 2032/4227 (ETA: 4704.94s)...

ALB: 2048/4227 (ETA: 4755.12s)...

ALB: 2064/4227 (ETA: 5156.57s)...

ALB: 2080/4227 (ETA: 5292.63s)...

ALB: 2096/4227 (ETA: 5321.42s)...

ALB: 2112/4227 (ETA: 5089.77s)...

ALB: 2128/4227 (ETA: 5072.64s)...

ALB: 2144/4227 (ETA: 5002.24s)...

ALB: 2160/4227 (ETA: 5188.15s)...

ALB: 2176/4227 (ETA: 5298.95s)...

ALB: 2192/4227 (ETA: 5318.08s)...

ALB: 2208/4227 (ETA: 5645.78s)...

ALB: 2224/4227 (ETA: 5712.34s)...

ALB: 2240/4227 (ETA: 5595.83s)...

ALB: 2256/4227 (ETA: 5468.18s)...

ALB: 2272/4227 (ETA: 5602.59s)...

ALB: 2288/4227 (ETA: 5275.44s)...

ALB: 2304/4227 (ETA: 4851.83s)...

ALB: 2320/4227 (ETA: 4611.11s)...

ALB: 2336/4227 (ETA: 4578.33s)...

ALB: 2352/4227 (ETA: 4382.95s)...

ALB: 2368/4227 (ETA: 4324.84s)...

ALB: 2384/4227 (ETA: 4382.99s)...

ALB: 2400/4227 (ETA: 4434.42s)...

ALB: 2416/4227 (ETA: 4445.14s)...

ALB: 2432/4227 (ETA: 4459.33s)...

ALB: 2448/4227 (ETA: 4456.63s)...

ALB: 2464/4227 (ETA: 4387.87s)...

ALB: 2480/4227 (ETA: 4326.56s)...

ALB: 2496/4227 (ETA: 4309.40s)...

ALB: 2512/4227 (ETA: 4373.64s)...

ALB: 2528/4227 (ETA: 4504.51s)...

ALB: 2544/4227 (ETA: 4636.07s)...

ALB: 2560/4227 (ETA: 4797.10s)...

ALB: 2576/4227 (ETA: 4998.26s)...

ALB: 2592/4227 (ETA: 5067.88s)...

ALB: 2608/4227 (ETA: 5032.70s)...

ALB: 2624/4227 (ETA: 4900.00s)...

ALB: 2640/4227 (ETA: 4767.34s)...

ALB: 2656/4227 (ETA: 4518.29s)...

ALB: 2672/4227 (ETA: 4361.00s)...

ALB: 2688/4227 (ETA: 4230.91s)...

ALB: 2704/4227 (ETA: 4363.22s)...

ALB: 2720/4227 (ETA: 4395.51s)...

ALB: 2736/4227 (ETA: 4475.84s)...

ALB: 2752/4227 (ETA: 4748.55s)...

ALB: 2768/4227 (ETA: 5293.71s)...

ALB: 2784/4227 (ETA: 5347.61s)...

ALB: 2800/4227 (ETA: 5328.06s)...

ALB: 2816/4227 (ETA: 5273.62s)...

ALB: 2832/4227 (ETA: 5110.52s)...

ALB: 2848/4227 (ETA: 4623.42s)...

ALB: 2864/4227 (ETA: 4431.89s)...

ALB: 2880/4227 (ETA: 4384.71s)...

ALB: 2896/4227 (ETA: 4431.87s)...

ALB: 2912/4227 (ETA: 4331.24s)...

ALB: 2928/4227 (ETA: 4337.93s)...

ALB: 2944/4227 (ETA: 4320.40s)...

ALB: 2960/4227 (ETA: 4363.97s)...

ALB: 2976/4227 (ETA: 4305.84s)...

ALB: 2992/4227 (ETA: 4293.38s)...

ALB: 3008/4227 (ETA: 4220.94s)...

ALB: 3024/4227 (ETA: 4258.32s)...

ALB: 3040/4227 (ETA: 4193.52s)...

ALB: 3056/4227 (ETA: 4213.71s)...

ALB: 3072/4227 (ETA: 4263.82s)...

ALB: 3088/4227 (ETA: 4308.66s)...

ALB: 3104/4227 (ETA: 4319.12s)...

ALB: 3120/4227 (ETA: 4283.88s)...

ALB: 3136/4227 (ETA: 4232.04s)...

ALB: 3152/4227 (ETA: 4154.25s)...

ALB: 3168/4227 (ETA: 4126.55s)...

ALB: 3184/4227 (ETA: 4072.97s)...

ALB: 3200/4227 (ETA: 4191.84s)...

ALB: 3216/4227 (ETA: 4288.37s)...

ALB: 3232/4227 (ETA: 4302.68s)...

ALB: 3248/4227 (ETA: 4285.49s)...

ALB: 3264/4227 (ETA: 4285.62s)...

ALB: 3280/4227 (ETA: 4154.76s)...

ALB: 3296/4227 (ETA: 4065.49s)...

ALB: 3312/4227 (ETA: 4014.05s)...

ALB: 3328/4227 (ETA: 3970.89s)...

ALB: 3344/4227 (ETA: 3968.21s)...

ALB: 3360/4227 (ETA: 3997.45s)...

ALB: 3376/4227 (ETA: 3995.95s)...

ALB: 3392/4227 (ETA: 3977.46s)...

ALB: 3408/4227 (ETA: 3961.70s)...

ALB: 3424/4227 (ETA: 3904.22s)...

ALB: 3440/4227 (ETA: 3859.52s)...

ALB: 3456/4227 (ETA: 3824.30s)...

ALB: 3472/4227 (ETA: 3825.74s)...

ALB: 3488/4227 (ETA: 3867.35s)...

ALB: 3504/4227 (ETA: 3806.96s)...

ALB: 3520/4227 (ETA: 3843.33s)...

ALB: 3536/4227 (ETA: 4078.95s)...

ALB: 3552/4227 (ETA: 4209.44s)...

ALB: 3568/4227 (ETA: 4202.81s)...

ALB: 3584/4227 (ETA: 4423.22s)...

ALB: 3600/4227 (ETA: 4532.33s)...

ALB: 3616/4227 (ETA: 4362.35s)...

ALB: 3632/4227 (ETA: 4308.77s)...

ALB: 3648/4227 (ETA: 4557.54s)...

ALB: 3664/4227 (ETA: 4518.82s)...

ALB: 3680/4227 (ETA: 4458.91s)...

ALB: 3696/4227 (ETA: 4448.24s)...

ALB: 3712/4227 (ETA: 4481.77s)...

ALB: 3728/4227 (ETA: 4239.30s)...

ALB: 3744/4227 (ETA: 4203.67s)...

ALB: 3760/4227 (ETA: 4251.32s)...

ALB: 3776/4227 (ETA: 4163.00s)...

ALB: 3792/4227 (ETA: 3978.37s)...

ALB: 3808/4227 (ETA: 3866.52s)...

ALB: 3824/4227 (ETA: 3699.14s)...

ALB: 3840/4227 (ETA: 3468.73s)...

ALB: 3856/4227 (ETA: 3407.57s)...

ALB: 3872/4227 (ETA: 3382.15s)...

ALB: 3888/4227 (ETA: 3363.32s)...

ALB: 3904/4227 (ETA: 3344.57s)...

ALB: 3920/4227 (ETA: 3330.96s)...

ALB: 3936/4227 (ETA: 3293.39s)...

ALB: 3952/4227 (ETA: 3318.96s)...

ALB: 3968/4227 (ETA: 3284.46s)...

ALB: 3984/4227 (ETA: 3301.56s)...

ALB: 4000/4227 (ETA: 3340.59s)...

ALB: 4016/4227 (ETA: 3359.01s)...

ALB: 4032/4227 (ETA: 3353.34s)...

ALB: 4048/4227 (ETA: 3368.79s)...

ALB: 4064/4227 (ETA: 3328.78s)...

ALB: 4080/4227 (ETA: 3274.73s)...

ALB: 4096/4227 (ETA: 3314.09s)...

ALB: 4112/4227 (ETA: 3463.72s)...

ALB: 4128/4227 (ETA: 3526.68s)...

ALB: 4144/4227 (ETA: 3532.50s)...

ALB: 4160/4227 (ETA: 3513.55s)...

ALB: 4176/4227 (ETA: 3429.17s)...

ALB: 4192/4227 (ETA: 3257.90s)...

ALB: 4208/4227 (ETA: 3183.00s)...

ALB: 4224/4227 (ETA: 3140.61s)...

                                                  ALB: Done
BET: 0000/0351 (ETA: 3157.87s)...

BET: 0016/0351 (ETA: 3158.61s)...

BET: 0032/0351 (ETA: 3155.32s)...

BET: 0048/0351 (ETA: 3172.47s)...

BET: 0064/0351 (ETA: 3237.62s)...

BET: 0080/0351 (ETA: 3249.96s)...

BET: 0096/0351 (ETA: 3305.81s)...

BET: 0112/0351 (ETA: 3318.38s)...

BET: 0128/0351 (ETA: 3299.98s)...

BET: 0144/0351 (ETA: 3249.94s)...

BET: 0160/0351 (ETA: 3223.22s)...

BET: 0176/0351 (ETA: 3196.37s)...

BET: 0192/0351 (ETA: 3114.91s)...

BET: 0208/0351 (ETA: 3075.37s)...

BET: 0224/0351 (ETA: 3027.00s)...

BET: 0240/0351 (ETA: 3034.41s)...

BET: 0256/0351 (ETA: 2963.26s)...

BET: 0272/0351 (ETA: 3033.71s)...

BET: 0288/0351 (ETA: 3020.13s)...

BET: 0304/0351 (ETA: 3064.23s)...

BET: 0320/0351 (ETA: 3041.10s)...

BET: 0336/0351 (ETA: 3092.29s)...

                                                  BET: Done
DOL: 0000/0276 (ETA: 2998.46s)...

DOL: 0016/0276 (ETA: 2988.09s)...

DOL: 0032/0276 (ETA: 2952.87s)...

DOL: 0048/0276 (ETA: 2955.81s)...

DOL: 0064/0276 (ETA: 2914.39s)...

DOL: 0080/0276 (ETA: 2915.84s)...

DOL: 0096/0276 (ETA: 2940.05s)...

DOL: 0112/0276 (ETA: 2932.65s)...

DOL: 0128/0276 (ETA: 2894.95s)...

DOL: 0144/0276 (ETA: 2903.75s)...

DOL: 0160/0276 (ETA: 2906.35s)...

DOL: 0176/0276 (ETA: 2891.42s)...

DOL: 0192/0276 (ETA: 2857.33s)...

DOL: 0208/0276 (ETA: 2875.51s)...

DOL: 0224/0276 (ETA: 2853.55s)...

DOL: 0240/0276 (ETA: 3013.48s)...

DOL: 0256/0276 (ETA: 3104.94s)...

DOL: 0272/0276 (ETA: 3184.10s)...

                                                  DOL: Done
LAG: 0000/0150 (ETA: 3160.76s)...

LAG: 0016/0150 (ETA: 3137.59s)...

LAG: 0032/0150 (ETA: 2961.36s)...

LAG: 0048/0150 (ETA: 2814.89s)...

LAG: 0064/0150 (ETA: 2743.55s)...

LAG: 0080/0150 (ETA: 2728.61s)...

LAG: 0096/0150 (ETA: 2702.93s)...

LAG: 0112/0150 (ETA: 2687.79s)...

LAG: 0128/0150 (ETA: 2708.54s)...

LAG: 0144/0150 (ETA: 2696.00s)...

                                                  LAG: Done
NoF: 0000/1167 (ETA: 2695.95s)...

NoF: 0016/1167 (ETA: 2702.40s)...

NoF: 0032/1167 (ETA: 2688.49s)...

NoF: 0048/1167 (ETA: 2668.15s)...

NoF: 0064/1167 (ETA: 2644.81s)...

NoF: 0080/1167 (ETA: 2649.22s)...

NoF: 0096/1167 (ETA: 2673.51s)...

NoF: 0112/1167 (ETA: 2667.14s)...

NoF: 0128/1167 (ETA: 2647.46s)...

NoF: 0144/1167 (ETA: 2621.99s)...

NoF: 0160/1167 (ETA: 2614.51s)...

NoF: 0176/1167 (ETA: 2640.30s)...

NoF: 0192/1167 (ETA: 2740.34s)...

NoF: 0208/1167 (ETA: 2906.05s)...

NoF: 0224/1167 (ETA: 3019.90s)...

NoF: 0240/1167 (ETA: 3053.05s)...

NoF: 0256/1167 (ETA: 2998.58s)...

NoF: 0272/1167 (ETA: 2931.75s)...

NoF: 0288/1167 (ETA: 2757.48s)...

NoF: 0304/1167 (ETA: 2641.92s)...

NoF: 0320/1167 (ETA: 2576.14s)...

NoF: 0336/1167 (ETA: 2541.93s)...

NoF: 0352/1167 (ETA: 2458.66s)...

NoF: 0368/1167 (ETA: 2469.62s)...

NoF: 0384/1167 (ETA: 2446.53s)...

NoF: 0400/1167 (ETA: 2419.61s)...

NoF: 0416/1167 (ETA: 2398.24s)...

NoF: 0432/1167 (ETA: 2473.77s)...

NoF: 0448/1167 (ETA: 2436.39s)...

NoF: 0464/1167 (ETA: 2426.90s)...

NoF: 0480/1167 (ETA: 2433.04s)...

NoF: 0496/1167 (ETA: 2464.78s)...

NoF: 0512/1167 (ETA: 2430.16s)...

NoF: 0528/1167 (ETA: 2615.02s)...

NoF: 0544/1167 (ETA: 2694.00s)...

NoF: 0560/1167 (ETA: 2713.65s)...

NoF: 0576/1167 (ETA: 2710.66s)...

NoF: 0592/1167 (ETA: 2635.05s)...

NoF: 0608/1167 (ETA: 2446.40s)...

NoF: 0624/1167 (ETA: 2353.14s)...

NoF: 0640/1167 (ETA: 2297.49s)...

NoF: 0656/1167 (ETA: 2228.79s)...

NoF: 0672/1167 (ETA: 2226.07s)...

NoF: 0688/1167 (ETA: 2223.10s)...

NoF: 0704/1167 (ETA: 2228.73s)...

NoF: 0720/1167 (ETA: 2214.82s)...

NoF: 0736/1167 (ETA: 2243.32s)...

NoF: 0752/1167 (ETA: 2236.46s)...

NoF: 0768/1167 (ETA: 2227.57s)...

NoF: 0784/1167 (ETA: 2205.46s)...

NoF: 0800/1167 (ETA: 2196.73s)...

NoF: 0816/1167 (ETA: 2156.34s)...

NoF: 0832/1167 (ETA: 2171.62s)...

NoF: 0848/1167 (ETA: 2152.81s)...

NoF: 0864/1167 (ETA: 2148.18s)...

NoF: 0880/1167 (ETA: 2143.46s)...

NoF: 0896/1167 (ETA: 2138.28s)...

NoF: 0912/1167 (ETA: 2120.42s)...

NoF: 0928/1167 (ETA: 2099.35s)...

NoF: 0944/1167 (ETA: 2075.10s)...

NoF: 0960/1167 (ETA: 2067.98s)...

NoF: 0976/1167 (ETA: 2041.48s)...

NoF: 0992/1167 (ETA: 2048.28s)...

NoF: 1008/1167 (ETA: 2033.86s)...

NoF: 1024/1167 (ETA: 2035.02s)...

NoF: 1040/1167 (ETA: 2012.45s)...

NoF: 1056/1167 (ETA: 2035.06s)...

NoF: 1072/1167 (ETA: 1997.23s)...

NoF: 1088/1167 (ETA: 2000.53s)...

NoF: 1104/1167 (ETA: 1988.38s)...

NoF: 1120/1167 (ETA: 2010.12s)...

NoF: 1136/1167 (ETA: 1979.03s)...

NoF: 1152/1167 (ETA: 1970.37s)...

                                                  NoF: Done
OTHER: 0000/0714 (ETA: 1942.13s)...

OTHER: 0016/0714 (ETA: 1905.90s)...

OTHER: 0032/0714 (ETA: 1878.47s)...

OTHER: 0048/0714 (ETA: 1879.51s)...

OTHER: 0064/0714 (ETA: 1858.85s)...

OTHER: 0080/0714 (ETA: 1847.93s)...

OTHER: 0096/0714 (ETA: 1847.54s)...

OTHER: 0112/0714 (ETA: 1828.53s)...

OTHER: 0128/0714 (ETA: 1798.86s)...

OTHER: 0144/0714 (ETA: 1790.93s)...

OTHER: 0160/0714 (ETA: 1780.27s)...

OTHER: 0176/0714 (ETA: 1781.45s)...

OTHER: 0192/0714 (ETA: 1783.12s)...

OTHER: 0208/0714 (ETA: 1763.79s)...

OTHER: 0224/0714 (ETA: 1779.34s)...

OTHER: 0240/0714 (ETA: 1922.76s)...

OTHER: 0256/0714 (ETA: 2026.67s)...

OTHER: 0272/0714 (ETA: 2070.96s)...

OTHER: 0288/0714 (ETA: 2151.59s)...

OTHER: 0304/0714 (ETA: 2256.10s)...

OTHER: 0320/0714 (ETA: 2140.68s)...

OTHER: 0336/0714 (ETA: 2050.14s)...

OTHER: 0352/0714 (ETA: 2069.52s)...

OTHER: 0368/0714 (ETA: 2032.35s)...

OTHER: 0384/0714 (ETA: 2093.88s)...

OTHER: 0400/0714 (ETA: 2184.52s)...

OTHER: 0416/0714 (ETA: 2230.79s)...

OTHER: 0432/0714 (ETA: 2200.31s)...

OTHER: 0448/0714 (ETA: 2230.54s)...

OTHER: 0464/0714 (ETA: 2128.43s)...

OTHER: 0480/0714 (ETA: 2154.51s)...

OTHER: 0496/0714 (ETA: 2055.57s)...

OTHER: 0512/0714 (ETA: 1977.46s)...

OTHER: 0528/0714 (ETA: 1870.02s)...

OTHER: 0544/0714 (ETA: 1747.97s)...

OTHER: 0560/0714 (ETA: 1563.89s)...

OTHER: 0576/0714 (ETA: 1549.05s)...

OTHER: 0592/0714 (ETA: 1537.48s)...

OTHER: 0608/0714 (ETA: 1545.76s)...

OTHER: 0624/0714 (ETA: 1546.67s)...

OTHER: 0640/0714 (ETA: 1551.78s)...

OTHER: 0656/0714 (ETA: 1593.38s)...

OTHER: 0672/0714 (ETA: 1662.62s)...

OTHER: 0688/0714 (ETA: 1669.78s)...

OTHER: 0704/0714 (ETA: 1663.74s)...

                                                  OTHER: Done
SHARK: 0000/0366 (ETA: 1644.35s)...

SHARK: 0016/0366 (ETA: 1587.95s)...

SHARK: 0032/0366 (ETA: 1499.52s)...

SHARK: 0048/0366 (ETA: 1478.60s)...

SHARK: 0064/0366 (ETA: 1469.21s)...

SHARK: 0080/0366 (ETA: 1464.30s)...

SHARK: 0096/0366 (ETA: 1461.91s)...

SHARK: 0112/0366 (ETA: 1458.80s)...

SHARK: 0128/0366 (ETA: 1455.55s)...

SHARK: 0144/0366 (ETA: 1442.32s)...

SHARK: 0160/0366 (ETA: 1436.78s)...

SHARK: 0176/0366 (ETA: 1421.15s)...

SHARK: 0192/0366 (ETA: 1420.01s)...

SHARK: 0208/0366 (ETA: 1394.95s)...

SHARK: 0224/0366 (ETA: 1396.49s)...

SHARK: 0240/0366 (ETA: 1376.18s)...

SHARK: 0256/0366 (ETA: 1368.04s)...

SHARK: 0272/0366 (ETA: 1350.16s)...

SHARK: 0288/0366 (ETA: 1336.96s)...

SHARK: 0304/0366 (ETA: 1324.44s)...

SHARK: 0320/0366 (ETA: 1321.82s)...

SHARK: 0336/0366 (ETA: 1318.95s)...

SHARK: 0352/0366 (ETA: 1303.98s)...

                                                  SHARK: Done
YFT: 0000/1875 (ETA: 1301.89s)...

YFT: 0016/1875 (ETA: 1291.93s)...

YFT: 0032/1875 (ETA: 1287.41s)...

YFT: 0048/1875 (ETA: 1273.07s)...

YFT: 0064/1875 (ETA: 1273.61s)...

YFT: 0080/1875 (ETA: 1259.25s)...

YFT: 0096/1875 (ETA: 1314.22s)...

YFT: 0112/1875 (ETA: 1312.39s)...

YFT: 0128/1875 (ETA: 1302.61s)...

YFT: 0144/1875 (ETA: 1293.67s)...

YFT: 0160/1875 (ETA: 1281.67s)...

YFT: 0176/1875 (ETA: 1214.14s)...

YFT: 0192/1875 (ETA: 1306.63s)...

YFT: 0208/1875 (ETA: 1314.34s)...

YFT: 0224/1875 (ETA: 1341.53s)...

YFT: 0240/1875 (ETA: 1376.01s)...

YFT: 0256/1875 (ETA: 1395.46s)...

YFT: 0272/1875 (ETA: 1275.86s)...

YFT: 0288/1875 (ETA: 1251.41s)...

YFT: 0304/1875 (ETA: 1208.80s)...

YFT: 0320/1875 (ETA: 1188.90s)...

YFT: 0336/1875 (ETA: 1165.28s)...

YFT: 0352/1875 (ETA: 1175.61s)...

YFT: 0368/1875 (ETA: 1191.62s)...

YFT: 0384/1875 (ETA: 1217.01s)...

YFT: 0400/1875 (ETA: 1168.31s)...

YFT: 0416/1875 (ETA: 1130.71s)...

YFT: 0432/1875 (ETA: 1135.89s)...

YFT: 0448/1875 (ETA: 1132.85s)...

YFT: 0464/1875 (ETA: 1105.19s)...

YFT: 0480/1875 (ETA: 1098.42s)...

YFT: 0496/1875 (ETA: 1083.19s)...

YFT: 0512/1875 (ETA: 1022.85s)...

YFT: 0528/1875 (ETA: 968.14s)...

YFT: 0544/1875 (ETA: 918.39s)...

YFT: 0560/1875 (ETA: 903.66s)...

YFT: 0576/1875 (ETA: 884.74s)...

YFT: 0592/1875 (ETA: 881.64s)...

YFT: 0608/1875 (ETA: 866.18s)...

YFT: 0624/1875 (ETA: 858.82s)...

YFT: 0640/1875 (ETA: 842.77s)...

YFT: 0656/1875 (ETA: 851.36s)...

YFT: 0672/1875 (ETA: 833.71s)...

YFT: 0688/1875 (ETA: 828.20s)...

YFT: 0704/1875 (ETA: 838.38s)...

YFT: 0720/1875 (ETA: 834.56s)...

YFT: 0736/1875 (ETA: 805.73s)...

YFT: 0752/1875 (ETA: 797.28s)...

YFT: 0768/1875 (ETA: 781.26s)...

YFT: 0784/1875 (ETA: 748.19s)...

YFT: 0800/1875 (ETA: 730.82s)...

YFT: 0816/1875 (ETA: 727.56s)...

YFT: 0832/1875 (ETA: 717.04s)...

YFT: 0848/1875 (ETA: 724.33s)...

YFT: 0864/1875 (ETA: 711.95s)...

YFT: 0880/1875 (ETA: 705.61s)...

YFT: 0896/1875 (ETA: 687.51s)...

YFT: 0912/1875 (ETA: 677.96s)...

YFT: 0928/1875 (ETA: 649.40s)...

YFT: 0944/1875 (ETA: 636.46s)...

YFT: 0960/1875 (ETA: 625.34s)...

YFT: 0976/1875 (ETA: 615.81s)...

YFT: 0992/1875 (ETA: 631.41s)...

YFT: 1008/1875 (ETA: 623.89s)...

YFT: 1024/1875 (ETA: 611.00s)...

YFT: 1040/1875 (ETA: 595.64s)...

YFT: 1056/1875 (ETA: 594.67s)...

YFT: 1072/1875 (ETA: 570.23s)...

YFT: 1088/1875 (ETA: 555.19s)...

YFT: 1104/1875 (ETA: 550.46s)...

YFT: 1120/1875 (ETA: 552.18s)...

YFT: 1136/1875 (ETA: 553.84s)...

YFT: 1152/1875 (ETA: 540.57s)...

YFT: 1168/1875 (ETA: 531.15s)...

YFT: 1184/1875 (ETA: 537.04s)...

YFT: 1200/1875 (ETA: 524.21s)...

YFT: 1216/1875 (ETA: 522.90s)...

YFT: 1232/1875 (ETA: 511.94s)...

YFT: 1248/1875 (ETA: 499.17s)...

YFT: 1264/1875 (ETA: 468.12s)...

YFT: 1280/1875 (ETA: 448.11s)...

YFT: 1296/1875 (ETA: 405.89s)...

YFT: 1312/1875 (ETA: 385.21s)...

YFT: 1328/1875 (ETA: 371.79s)...

YFT: 1344/1875 (ETA: 360.19s)...

YFT: 1360/1875 (ETA: 351.21s)...

YFT: 1376/1875 (ETA: 348.46s)...

YFT: 1392/1875 (ETA: 358.21s)...

YFT: 1408/1875 (ETA: 362.38s)...

YFT: 1424/1875 (ETA: 354.20s)...

YFT: 1440/1875 (ETA: 343.53s)...

YFT: 1456/1875 (ETA: 327.02s)...

YFT: 1472/1875 (ETA: 295.11s)...

YFT: 1488/1875 (ETA: 269.95s)...

YFT: 1504/1875 (ETA: 255.80s)...

YFT: 1520/1875 (ETA: 243.44s)...

YFT: 1536/1875 (ETA: 235.20s)...

YFT: 1552/1875 (ETA: 230.26s)...

YFT: 1568/1875 (ETA: 219.46s)...

YFT: 1584/1875 (ETA: 212.85s)...

YFT: 1600/1875 (ETA: 201.10s)...

YFT: 1616/1875 (ETA: 188.02s)...

YFT: 1632/1875 (ETA: 174.47s)...

YFT: 1648/1875 (ETA: 166.16s)...

YFT: 1664/1875 (ETA: 155.35s)...

YFT: 1680/1875 (ETA: 144.33s)...

YFT: 1696/1875 (ETA: 132.92s)...

YFT: 1712/1875 (ETA: 119.28s)...

YFT: 1728/1875 (ETA: 105.73s)...

YFT: 1744/1875 (ETA: 91.86s)...

YFT: 1760/1875 (ETA: 79.62s)...

YFT: 1776/1875 (ETA: 67.52s)...

YFT: 1792/1875 (ETA: 57.44s)...

YFT: 1808/1875 (ETA: 46.97s)...

YFT: 1824/1875 (ETA: 36.45s)...

YFT: 1840/1875 (ETA: 26.19s)...

YFT: 1856/1875 (ETA: 16.37s)...

YFT: 1872/1875 (ETA: 6.29s)...

                                                  YFT: Done
Done (7125.220876932144)


In [5]:
f.close()

In [10]:
OUT_FILE = 'data/test_data.h5'
METADATA = 'metadata.npy'
DATA_FOLDER = 'data/test'
SHAPE = (150, 250, 3)
BATCH_SIZE = 16

In [11]:
labels = os.listdir(DATA_FOLDER)
labels = [l for l in labels if ".DS_Store" not in l]
labels_path = [os.path.join(DATA_FOLDER, l) for l in labels]
print(labels_path)
n_labels = len(labels)
n_images = np.sum([len(os.listdir(l)) for l in labels_path])

label2idx = {j:to_categorical(i, n_labels)[0] for i,j in enumerate(labels)}
np.save(METADATA, label2idx)

model = VGG16(include_top=False, input_shape=SHAPE)
model.layers.pop()
    
print('model output shape: {}', model.output_shape)

f = h5py.File(OUT_FILE)
output_shape = (n_images, *model.output_shape[1:])
chunk_shape = (BATCH_SIZE, *model.output_shape[1:])
try:
    f.pop('x')
    f.pop('y')
except:
    None

img_data = f.create_dataset('x', shape=output_shape,
                            dtype=np.float32, chunks=chunk_shape)
labels_data = f.create_dataset('y', shape=(n_images, n_labels),
                               dtype=np.float32, chunks=(BATCH_SIZE, n_labels))

['data/test/ALB', 'data/test/BET', 'data/test/DOL', 'data/test/LAG', 'data/test/NoF', 'data/test/OTHER', 'data/test/SHARK', 'data/test/YFT']


model output shape: {} (None, 4, 7, 512)


In [12]:
from collections import deque
from time import time

t0 = time()
ts = deque(maxlen=5)
idxx = 0

for path, label in zip(labels_path, labels):
    files = os.listdir(path)
    files = [f for f in files if ".DS_Store" not in f]
    n_files = len(files)
    next_idxx = idxx + n_files
    labels_data[idxx:next_idxx] = label2idx[label]
    idx = 0
    for i in range(math.ceil(n_files / BATCH_SIZE)):
        tt0 = time()
        eta = np.mean(ts) * (n_images - idxx - idx) if len(ts) != 0 else 999
        print('%s: %04d/%04d (ETA: %.2fs)...' %
              (label, idx, n_files, eta), end='\r')
        next_idx = min(n_files, idx + BATCH_SIZE)
        batch_n = next_idx - idx
        batch_x = np.ndarray((batch_n, *SHAPE), dtype=np.float32)
        for j in range(batch_n):
            img = PIL.Image.open(os.path.join(path, files[idx + j]))
            img = img.resize(SHAPE[:2][::-1])
            img = np.asarray(img, dtype=np.float32)
            batch_x[j] = img
    
        batch_x = preprocess_input(batch_x)
        img_data[idxx + idx:idxx + idx + batch_n] = model.predict(batch_x)
        idx = next_idx
        ts.append((time() - tt0) / batch_n)
    
    idxx = next_idxx
    print(' '*50, end='\r')
    print('{}: Done', label)
    
print('Done ({})', (time() - t0))

ALB: 0000/0111 (ETA: 999.00s)...

ALB: 0016/0111 (ETA: 228.93s)...

ALB: 0032/0111 (ETA: 244.44s)...

ALB: 0048/0111 (ETA: 250.57s)...

ALB: 0064/0111 (ETA: 254.09s)...

ALB: 0080/0111 (ETA: 239.75s)...

ALB: 0096/0111 (ETA: 228.71s)...

                                                  {}: Done ALB
BET: 0000/0066 (ETA: 206.90s)...

BET: 0016/0066 (ETA: 185.17s)...

BET: 0032/0066 (ETA: 160.46s)...

BET: 0048/0066 (ETA: 143.83s)...

BET: 0064/0066 (ETA: 133.53s)...

                                                  {}: Done BET
DOL: 0000/0013 (ETA: 135.74s)...

                                                  {}: Done DOL
LAG: 0000/0011 (ETA: 125.20s)...

                                                  {}: Done LAG
NoF: 0000/0032 (ETA: 114.83s)...

NoF: 0016/0032 (ETA: 104.66s)...

                                                  {}: Done NoF
OTHER: 0000/0036 (ETA: 92.48s)...

OTHER: 0016/0036 (ETA: 83.85s)...

OTHER: 0032/0036 (ETA: 77.36s)...

                                                  {}: Done OTHER
SHARK: 0000/0041 (ETA: 75.48s)...

SHARK: 0016/0041 (ETA: 63.27s)...

SHARK: 0032/0041 (ETA: 51.77s)...

                                                  {}: Done SHARK
YFT: 0000/0059 (ETA: 44.17s)...

YFT: 0016/0059 (ETA: 30.22s)...

YFT: 0032/0059 (ETA: 19.05s)...

YFT: 0048/0059 (ETA: 7.82s)...

                                                  {}: Done YFT
Done ({}) 271.7203960418701


In [13]:
f.close()