In [1]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

from tensorflow import keras
import cv2

%matplotlib inline
plt.rcParams['figure.figsize'] = 12, 8
%config InlineBackend.figure_format = 'retina'

In [2]:
from keras.applications import VGG16
from keras.models import Sequential, load_model
from keras.layers import Input, Flatten, Dense, Dropout

vgg = VGG16(include_top=False, weights="imagenet")
vgg.trainable = False

dense = load_model("modele-VGG16") # ou 'modele-VGG16.h5'
modele = Sequential([
    Input((227, 227, 3)),
    vgg,
    dense
], name="complet")



In [3]:
from os.path import join
NOM = "BowlPlace1Subject1"
VIDEO = join("VIDEOS", NOM + ".mp4")
BOITE = join("GT", NOM + "_2_bboxes.txt")

## Lecture des boites fournies
Lit le fichier contenant les informations de reconnaissance d'objets pour avoir un point de départ.

In [4]:
from os.path import join
from typing import List, Tuple
import csv

def lecture_information_boite_englobante(nom: str) -> List[List[Tuple[int, int, int, int]]]:
    """ Lit les boites englobante fournies pour l'exemple. """
    resultats = list()
    
    with open(join("GT", nom + "_2_bboxes.txt"), "r") as fichier:
        lecteur = csv.reader(fichier, delimiter=" ")

        for ligne in lecteur:
            frame_nb = int(ligne[0])
            boite_nb = int(ligne[1])
            boites = list()
            for i in range(boite_nb):
                boite = (int(ligne[i * 4 + 2]), int(ligne[i * 4 + 3]), int(ligne[i * 4 + 4]), int(ligne[i * 4 + 5]))
                boites.append(boite)
            resultats.append(boites)
    
    return resultats

boites_englobantes = lecture_information_boite_englobante(NOM)

## Recherche de l'objet sur la prochaine image
À partir de la zone désignée dans l'image précédante, tente de retrouver l'objet dans la nouvelle image.

In [5]:
from PIL import Image

def evaluation_boite(image: Image, boites: list) -> np.array:
    assert isinstance(boites, (list, tuple))
    extraits = list(np.asarray(image\
        .resize((227, 227), box=((boite[0], boite[1], boite[0] + boite[2], boite[1] + boite[3]))))
        for boite in boites)
    return modele.predict(np.array(extraits))

In [None]:
from utils.evaluateBBox import *

frame = 0
video = cv2.VideoCapture(VIDEO)

while video.isOpened():
    ret, f = video.read()
    image = Image.fromarray(f)
    
    if ret == False:
        break
        
    # découper une boite
    if frame - 1 > 0 and len(boites_englobantes[frame - 1]) > 0:
        boite_pre = boites_englobantes[frame - 1][0]
        boite_cible = boites_englobantes[frame][0]
        
        valeurs = evaluation_boite(image, (boite_pre, boite_cible))
        categorie = np.argmax(valeurs[0])
        evaluations = {boite_pre: valeurs[0][categorie]}  # categorie
        meilleur_pos = boite_pre
        #print(meilleur_pos, valeur[categorie])
        #print(boite_cible, valeurs[1][categorie])
        
        # Modifications légères de la boite en maximisant la correspondance à la catégorie.
        # la déplacer un peu et réessayer -> méthode diamand ?
        # Méthode diamand sur 4D (x, y, w, h) ou (x, y, ratio, zoom)
        pas = 32
        while pas >= 4:
            # propositions de nouvelles boites englobantes
            propositions = list(boite_v
                for boite_v in boites_voisines(meilleur_pos, image.size, pas=pas)
                    if boite_v not in evaluations.keys())

            # évalue toutes les boites proposées
            valeurs = evaluation_boite(image, propositions)
            for i, boite_v in enumerate(propositions):
                valeur = valeurs[i]
                evaluations[boite_v] = valeur[categorie]
                if valeur[categorie] > evaluations[meilleur_pos]:
                    meilleur_pos = boite_v
            pas /= 2
        print(f"ajustement de {boite_pre} à {meilleur_pos}")
        print(f"score: {IoU(boite_cible, meilleur_pos)}")
        
    
    frame += 1
    
video.release()