In [3]:
from os import listdir
from pickle import dump
from keras.applications.vgg16 import VGG16
from keras_preprocessing.image import load_img
from keras_preprocessing.image import img_to_array
from keras.applications.vgg16 import preprocess_input
from keras.models import Model

In [4]:
# извлечем признаки для каждого изображения в директории
def extract_features(directory):
	# загружаем модель
	model = VGG16()
	model = Model(inputs=model.inputs, outputs=model.layers[-2].output)
	# sвыведем информацию о модели
	print(model.summary())
	# извлекаем признаки в ловарь для каждого изображения
	features = dict()
	for name in listdir(directory):
		# загружаем изображение из файла
		filename = directory + '/' + name
		image = load_img(filename, target_size=(224, 224))
		# переводим изображение в numpy массив
		image = img_to_array(image)
		# перерисовываем изображение для модели
		image = image.reshape((1, image.shape[0], image.shape[1], image.shape[2]))
		# подготавливаем изображение для модели
		image = preprocess_input(image)
		# получаем признаки
		feature = model.predict(image, verbose=0)
		# получаем имя изображения из имени файла
		image_id = name.split('.')[0]
		# сохраняем признак в словарь
		features[image_id] = feature
		print('>%s' % name)
	return features

In [6]:
# Извелечем признаки для каждого изображения
directory = 'D:/Temp/Dataset/kaggle/flickr_30k/copy_flickr30k_images'
features = extract_features(directory)
print('Извлечено признаков: %d' % len(features))
# Сохраним признаки в файл для дальнейшей обработки
dump(features, open('features.pkl', 'wb'))

Model: "model_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 input_2 (InputLayer)        [(None, 224, 224, 3)]     0         
                                                                 
 block1_conv1 (Conv2D)       (None, 224, 224, 64)      1792      
                                                                 
 block1_conv2 (Conv2D)       (None, 224, 224, 64)      36928     
                                                                 
 block1_pool (MaxPooling2D)  (None, 112, 112, 64)      0         
                                                                 
 block2_conv1 (Conv2D)       (None, 112, 112, 128)     73856     
                                                                 
 block2_conv2 (Conv2D)       (None, 112, 112, 128)     147584    
                                                                 
 block2_pool (MaxPooling2D)  (None, 56, 56, 128)       0   

In [8]:
# Извелечем признаки для каждого изображения из обуччающей выборки
directory = 'D:/Temp/Dataset/kaggle/flickr_30k/copy_train_flickr30k_images'
features = extract_features(directory)
print('Извлечено признаков: %d' % len(features))
# Сохраним признаки в файл для дальнейшей обработки
dump(features, open('D:/Temp/Dataset/kaggle/flickr_30k/ru-tokenizer-train.pkl', 'wb'))

Model: "model_3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 input_4 (InputLayer)        [(None, 224, 224, 3)]     0         
                                                                 
 block1_conv1 (Conv2D)       (None, 224, 224, 64)      1792      
                                                                 
 block1_conv2 (Conv2D)       (None, 224, 224, 64)      36928     
                                                                 
 block1_pool (MaxPooling2D)  (None, 112, 112, 64)      0         
                                                                 
 block2_conv1 (Conv2D)       (None, 112, 112, 128)     73856     
                                                                 
 block2_conv2 (Conv2D)       (None, 112, 112, 128)     147584    
                                                                 
 block2_pool (MaxPooling2D)  (None, 56, 56, 128)       0   