In [1]:
import tensorflow as tf
from tensorflow.keras.applications import InceptionV3
from tensorflow.keras.models import Model
from tensorflow.keras.preprocessing.image import load_img, img_to_array
from tensorflow.keras.applications.inception_v3 import preprocess_input
import numpy as np

# 1. Charger InceptionV3
# weights='imagenet' : On utilise le savoir pré-acquis
# include_top=False  : On jette la dernière couche de classification (celle qui dit "chat", "chien")
# pooling='avg'      : Important ! On transforme la sortie (8x8x2048) en un vecteur plat (2048)
base_model = InceptionV3(weights='imagenet')

# On crée un nouveau modèle qui s'arrête juste avant la fin
# La couche finale d'InceptionV3 s'appelle souvent 'avg_pool' ou on prend l'avant dernière
model_inception = Model(inputs=base_model.input, outputs=base_model.layers[-2].output)

print("InceptionV3 chargé avec succès.")
print("Format de sortie des features :", model_inception.output_shape)
# Doit afficher (None, 2048) -> Un vecteur de 2048 nombres par image

# 2. Fonction de prétraitement d'une image
def load_and_process_image(image_path):
    # InceptionV3 attend obligatoirement du 299x299
    img = load_img(image_path, target_size=(299, 299))
    
    # Conversion en tableau numpy
    x = img_to_array(img)
    
    # Ajout d'une dimension (pour faire un batch de 1 image) : (299, 299, 3) -> (1, 299, 299, 3)
    x = np.expand_dims(x, axis=0)
    
    # Prétraitement spécifique à Inception (Mise à l'échelle entre -1 et 1)
    x = preprocess_input(x)
    return x

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/inception_v3/inception_v3_weights_tf_dim_ordering_tf_kernels.h5
InceptionV3 chargé avec succès.
Format de sortie des features : (None, 2048)


In [3]:
import tensorflow as tf
import os
import json
import numpy as np
from tensorflow.keras.applications import InceptionV3
from tensorflow.keras.models import Model
from tensorflow.keras.preprocessing.image import load_img, img_to_array
from tensorflow.keras.applications.inception_v3 import preprocess_input

# --- CONFIGURATION ---
ANNOTATION_FILE = '/content/annotations/captions_train2014.json'
IMAGE_FOLDER = '/content/train2014/'
NUM_EXAMPLES = 10000  # On garde 10 000 images pour le prototype

# --- 1. CHARGEMENT DES LÉGENDES (JSON) ---
print("Chargement du fichier JSON...")
with open(ANNOTATION_FILE, 'r') as f:
    annotations = json.load(f)

# Mapping Image -> Caption
image_path_to_caption = {}
for annot in annotations['annotations']:
    caption = f"<start> {annot['caption']} <end>"
    image_id = annot['image_id']
    full_coco_image_path = os.path.join(IMAGE_FOLDER, 'COCO_train2014_' + '%012d.jpg' % (image_id))

    if full_coco_image_path in image_path_to_caption:
        image_path_to_caption[full_coco_image_path].append(caption)
    else:
        image_path_to_caption[full_coco_image_path] = [caption]

# Sélection aléatoire des images
image_paths = list(image_path_to_caption.keys())
import random
random.shuffle(image_paths)
train_image_paths = image_paths[:NUM_EXAMPLES]

print(f"Nombre d'images sélectionnées : {len(train_image_paths)}")

# --- 2. PRÉPARATION DU MODÈLE ---
print("Chargement d'InceptionV3...")
base_model = InceptionV3(weights='imagenet')
# On prend la sortie avant la classification finale
feature_extractor = Model(inputs=base_model.input, outputs=base_model.layers[-2].output)

# --- 3. EXTRACTION DES FEATURES ---
def load_image(image_path):
    img = tf.io.read_file(image_path)
    img = tf.io.decode_jpeg(img, channels=3)
    img = tf.image.resize(img, (299, 299))
    img = tf.keras.applications.inception_v3.preprocess_input(img)
    return img, image_path

# Création du dataset
image_dataset = tf.data.Dataset.from_tensor_slices(train_image_paths)
image_dataset = image_dataset.map(load_image, num_parallel_calls=tf.data.AUTOTUNE).batch(16)

print("Démarrage de l'extraction... (Patientez)")

batch_count = 0
for img, path in image_dataset:
    # Extraction
    batch_features = feature_extractor(img)
    
    # Reshape (batch, 8, 8, 2048) ou (batch, 2048) -> On veut (batch, 2048)
    # Souvent Inception sort (batch, 2048) directement avec layers[-2]
    # Mais par sécurité on s'assure que c'est compatible
    batch_features = tf.reshape(batch_features, (batch_features.shape[0], -1, 2048))

    # Sauvegarde .npy
    for bf, p in zip(batch_features, path):
        path_of_feature = p.numpy().decode("utf-8")

Chargement du fichier JSON...


FileNotFoundError: [Errno 2] No such file or directory: '/content/annotations/captions_train2014.json'

In [4]:
import tensorflow as tf
import numpy as np

# Fonction de chargement et preprocessing d'une image
def load_image(image_path):
    img = tf.io.read_file(image_path)
    img = tf.io.decode_jpeg(img, channels=3)
    img = tf.image.resize(img, (299, 299))
    img = tf.keras.applications.inception_v3.preprocess_input(img)
    return img, image_path

# Création d'un dataset TensorFlow pour charger les images efficacement
# Note : on suppose que 'train_image_paths' et 'feature_extractor' sont déjà définis par l'étape précédente
image_dataset = tf.data.Dataset.from_tensor_slices(train_image_paths)
image_dataset = image_dataset.map(load_image, num_parallel_calls=tf.data.AUTOTUNE).batch(16)

print("Démarrage de l'extraction des features... (Cela peut prendre du temps)")

# Compteur pour suivre la progression manuellement
batch_count = 0

# Boucle d'extraction (Sans tqdm)
for img, path in image_dataset:
    # 1. Extraction des features via InceptionV3
    batch_features = feature_extractor(img)
    
    # 2. Reshape : On s'assure que c'est bien (batch_size, 2048)
    batch_features = tf.reshape(batch_features, (batch_features.shape[0], -1, 2048))

    # 3. Sauvegarde sur le disque (.npy) pour chaque image
    for bf, p in zip(batch_features, path):
        path_of_feature = p.numpy().decode("utf-8")
        # On enregistre le fichier au même endroit que l'image mais avec extension .npy
        np.save(path_of_feature + '.npy', bf.numpy())

    # Affichage de progression tous les 100 batches
    batch_count += 1
    if batch_count % 100 == 0:
        print(f"Batch n°{batch_count} traité...")

print("Extraction terminée ! Toutes les images sont converties en vecteurs .npy")

NameError: name 'train_image_paths' is not defined