# Imports

In [1]:
from statistics import mode
import shutil
import os

# I - Création des tfrecord train et test

## 1 - paramètres :

In [8]:
path_images = '/tf/ship_data/train_v2'
path_to_csv = '/tf/ship_data/train_ship_segmentations_OD.csv'
image_rate = 0.01 # taux d'images de la base initiale, sachant qu'au maximum on peut prendre 42556 images avec bateau pour image_rate=1.
boat_rate = 0.8 # taux d'images contenant au moins un bateau
cut_rate = 0.7 # taux d'images (par rapport à nb_images) utilisées pour train. Le reste sera utilisé pour test.
tfrecord_dir = '/tf/ship_data/annotations' # répertoire où train et test seront créés

## 2 - exécution du script :

Génère deux fichiers au format tfrecord dans le répertoire tfrecord_dir : deux fichiers train et test nommés selon train_25_80_70.tfrecord pour 25% des 42556 images de bateau, 80% d'images avec bateau réparties 70% dans train.

In [3]:
from generate_tfrecord import generate_tf_record
generate_tf_record(path_images, path_to_csv, image_rate, cut_rate, boat_rate, tfrecord_dir)

Création des dataframes train et test...
False


100%|██████████| 296/296 [00:04<00:00, 72.73it/s]
100%|██████████| 129/129 [00:01<00:00, 73.39it/s]


Création du tfrecord train...


100%|██████████| 296/296 [00:00<00:00, 799.20it/s]


Création du tfrecord test...


100%|██████████| 129/129 [00:00<00:00, 810.09it/s]

Tfrecords créés avec succès !
Enregistrés dans le répertoire :/tf/annotations





# II - Chargement du modèle

## 1 - paramètres :

Les modèles sont importés du "model zoo" de tensorflow : https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/tf2_detection_zoo.md

In [26]:
models_dir = '/tf/pretrained_models' # répertoire où les models seront téléchargés
model_url = 'http://download.tensorflow.org/models/object_detection/tf2/20200711/faster_rcnn_resnet101_v1_640x640_coco17_tpu-8.tar.gz'

## 2 - exécution du script :

In [27]:
from download_model import download_model
download_model(model_url, models_dir)

Le modèle a déjà été téléchargé auparavant.


# III - Paramétrage des hyperparamètres du modèle

Le paramétrage suivant n'est pas exhaustif. Seuls les paramètres génériques, assurant à l'apprentissage puisse être lancé. D'autres hyperparamètres spécifiques au modèle choisi (generations des "anchor boxes" par exemple) doivent également être paramétrés.

##  1 - Lister des bases train et test disponibles, choix des paramètres

In [14]:
import os
for path in [os.path.join(tfrecord_dir, p) for p in os.listdir(tfrecord_dir)]:
    print(path)

/tf/ship_data/annotations/test_50_80_70.tfrecord
/tf/ship_data/annotations/train_25_80_70.tfrecord
/tf/ship_data/annotations/train_100_80_70.tfrecord
/tf/ship_data/annotations/test_100_80_70.tfrecord
/tf/ship_data/annotations/train_1_80_70.tfrecord
/tf/ship_data/annotations/test_1_80_70.tfrecord
/tf/ship_data/annotations/train_50_80_70.tfrecord
/tf/ship_data/annotations/test_25_80_70.tfrecord


In [18]:
config_dict = {
    'num_classes' : 1,
    'batch_size' : 56,
    'train_tfrecord_path' : '/tf/ship_data/annotations/train_100_80_70.tfrecord',
    'test_tfrecord_path' : '/tf/ship_data/annotations/test_100_80_70.tfrecord',
    'label_map_path' : '/tf/ship_detect_tl/data/label_map.txt',
    'fine_tune_checkpoint' : '/tf/pretrained_models/checkpoints/faster_rcnn_resnet101_v1_640x640_coco17_tpu-8/checkpoint/ckpt-0',
    'fine_tune_checkpoint_type' : "detection"
}

## 2 -  Ecrire ces paramètres dans le fichier config

In [25]:
pipeline_config_path = '/tf/custom_models/faster_rcnn_resnet101_v1_640x640_coco17_tpu-8/pipeline.config'

In [20]:
from modify_pipeline import modify_pipeline
modify_pipeline(pipeline_config_path, config_dict)

INFO:tensorflow:Writing pipeline config file to /tf/custom_models/faster_rcnn_resnet101_v1_640x640_coco17_tpu-8/pipeline.config


[06/01 08:17:48] tensorflow INFO: Writing pipeline config file to /tf/custom_models/faster_rcnn_resnet101_v1_640x640_coco17_tpu-8/pipeline.config


# IV - Génération des commandes pour lancer l'entrainement et l'évaluation

Il s'agira de copier ses commandes et de les coller dans le terminal de la machine où l'on souhaite lancer l'entrainement. 
Autrement dit, ces commandes doivent être exécutées dans le container paramétré selon la procédure décrite *EXPLIQUER OÙ*.
Ensuite, pour pouvoir avoir deux courbes (entrainement et validation), il faut exécuter les commande d'entrainement et de test en parallèle dans deux terminaux (dans le container). De plus, il est nécéssaire de veiller à allouer les ressources GPU de sorte que le calcul de la validation soit terminé avant l'arrivée du prochain checkpoint (on peut aussi jouer sur d'autres paramètres tels que la taille du dataset test, le nombre de steps avant d'écrire un checkpoint ou encore le nombre d'images testées dans le dataset test)/

## 1 -  Entrainement

### Allocation des ressources GPU (voir paragraphe précédent)

Dans le terminal du container dans lequel sera exécuté l'entrainement, coller (ex. si l'on choisit les GPU 0,1 et 2) : export CUDA_VISIBLE_DEVICES=0,1,2,3,4,5,6

### Commande pour l'entrainement

In [28]:
model_dir = '/tf/custom_models/faster_rcnn_01-06-22-3/checkpoint'
pipeline_config_path = '/tf/custom_models/faster_rcnn_01-06-22-3/pipeline.config'
num_train_steps = '100000'

Copier coller la commande affichée après exécution de la cellule suivante dans le terminal du container dans lequel sera exécuté l'entrainement.

In [29]:
command = 'python /tf/models/research/object_detection/model_main_tf2.py --model_dir={} --pipeline_config_path={} --num_train_steps={} --alsologtostderr'.format(model_dir, pipeline_config_path, num_train_steps)
print(command)

python /tf/models/research/object_detection/model_main_tf2.py --model_dir=/tf/custom_models/faster_rcnn_01-06-22-3/checkpoint --pipeline_config_path=/tf/custom_models/faster_rcnn_01-06-22-3/pipeline.config --num_train_steps=100000 --alsologtostderr


## 2 -  Validation

### Allocation des ressources GPU

Dans le terminal du container dans lequel sera exécuté l'entrainement, coller (ex. si l'on choisit les GPU 3) : export CUDA_VISIBLE_DEVICES=7

### Commande pour la validation

In [23]:
checkpoint_dir = model_dir + '/checkpoint'
sample_1_of_n_eval_examples = '2'

Copier coller la commande affichée après exécution de la cellule suivante dans le terminal du container dans lequel sera exécuté l'entrainement.

In [24]:
command = 'python /tf/models/research/object_detection/model_main_tf2.py --model_dir={} --pipeline_config_path={} --checkpoint_dir={} --sample_1_of_n_eval_examples={}'.format(model_dir, pipeline_config_path, checkpoint_dir, sample_1_of_n_eval_examples)
print(command)

python /tf/models/research/object_detection/model_main_tf2.py --model_dir=/tf/custom_models/faster_rcnn_resnet101_v1_640x640_coco17_tpu-8/checkpoint --pipeline_config_path=/tf/custom_models/faster_rcnn_resnet101_v1_640x640_coco17_tpu-8/pipeline.config --checkpoint_dir=/tf/custom_models/faster_rcnn_resnet101_v1_640x640_coco17_tpu-8/checkpoint --sample_1_of_n_eval_examples=2


# V - observation des résultats 

Les courbes sont observables sous Tensorboard. Pour le lancer, il faudra exécuter la commande suivante dans le terminal du container. Puisque Tensorboard va tourner sur l'adresse locale du container, il ne sera pas accessible depuis l'ordinateur hôte. Il faut mettre en place du port forwarding voir établir un tunnel ssh si le container tourne sur un server. Cependant, pas d'inquiétude ! Si le container est ouvert sur VSCode, ce dernier va s'en occuper pour nous.

In [15]:
print('tensorboard --logdir {} --host 0.0.0.0'.format(model_dir))

tensorboard --logdir /tf/custom_models/faster_rcnn_inception_resnet_v2_640x640_coco17_tpu-8/checkpoint --host 0.0.0.0
