O presente script é aplicado para realizar o treinamento dos modelos.

# 0 - Importando Bibliotecas

In [None]:
%matplotlib inline

In [None]:
from project_utils.training_pipeline import *
from project_utils.fo_dataset_pipeline import *
from project_utils.eval_pipeline import *
from project_utils.visualization_utils import *
import fiftyone as fo

In [None]:
base_path = '../faster_rcnn/new_train/'

# cria o diretório onde o modelo treinado será salvo com a numeração atual do experimento
model_path = get_path_to_save_model(base_path)

In [None]:
model_path

# 1. - Pipeline de Treinamento

## 1.0 - Especificação de hiperparâmetros

Nome dos backbones disponíveis: 
- resnet50_fpn_1x
- resnet50_fpn_2x
- resnet101_fpn_1x
- resnet101_fpn_2x
- resnext101_32x4d_fpn_1x
- resnext101_32x4d_fpn_2x
- resnext101_64x4d_fpn_1x
- resnext101_64x4d_fpn_2x





In [None]:
hyperparam = Hyperparameters(
    model_name = 'mmdet.faster_rcnn',
    backbone_name = 'resnet50_fpn_1x',
    learning_rate = 1e-4,
    num_epochs = 20,
    train_shuffle = False,
    batch_size = 1,
    img_size = 512,
    presize = None
)

## 1.1 - Parseamento dos dados

In [None]:
train_records, valid_records, class_map = parse_data(dataset_type = 'partial')

In [None]:
# defini o número de classes + brackground
num_classes=len(class_map)
print(f'Número de classes + background: {num_classes}')

In [None]:
len_train = len(train_records)
len_valid = len(valid_records)

print(f'Tamanho do conjunto de treinamento: {len_train}')
print(f'Tamanho do conjunto de validação: {len_valid}')

## 1.2 - Especificação de transformações

In [None]:
train_tfms = get_tfms(img_size = hyperparam.img_size, 
                      presize = hyperparam.presize,
                      tfms_type ='train')

In [None]:
valid_tfms = get_tfms(img_size = hyperparam.img_size,
                      tfms_type = 'valid')

## 1.3 - Instanciação dos Datasets

In [None]:
train_ds = get_dataset(records = train_records, 
                       tfms = train_tfms)

In [None]:
valid_ds = get_dataset(records = valid_records, 
                       tfms = valid_tfms)

## 1.4 - Especificação do modelo

In [None]:
model_type, backbone_type, extra_args = get_model_type(model_name = hyperparam.model_name, 
                                                       backbone_name = hyperparam.backbone_name, 
                                                       img_size = hyperparam.img_size)

## 1.5 - Instanciação do modelo

In [None]:
model = get_model(model_type = model_type, 
                  backbone_type = backbone_type, 
                  num_classes = num_classes, 
                  extra_args = extra_args)

## 1.6 - Instanciação dos Dataloaders

In [None]:
train_dl = get_dataloader(model_type = model_type, 
                          dataset = train_ds, 
                          batch_size = hyperparam.batch_size, 
                          train_shuffle = hyperparam.train_shuffle, 
                          dataloader_type = 'train')

In [None]:
valid_dl = get_dataloader(model_type = model_type, 
                         dataset = valid_ds, 
                         batch_size = hyperparam.batch_size, 
                         dataloader_type = 'valid')

## 1.7 - Especificação da métrica de performance

In [None]:
metrics =  get_bbox_metrics()
dls = [train_dl, valid_dl]

## 1.8 - Instanciação do Learner

In [None]:
learner = get_learner(model_type = model_type, 
                      model = model, 
                      dls = dls, 
                      metrics = metrics)

## 1.9  - Treinamento do modelo

In [None]:
train(learner = learner, 
      num_epochs = hyperparam.num_epochs, 
      learning_rate = hyperparam.learning_rate)

## 1.10 - Armazenmento do modelo treinado (e de metadados)

In [None]:
save_epoch_history(learner = learner, path_to_save = model_path)

In [None]:
save_hyperparameters(hyperparameters = hyperparam, path_to_save = model_path)

In [None]:
save_model(model = model, hyperparameters = hyperparam, 
           class_map = class_map, path_to_save = model_path)

# 2 - Pipeline de Criação do Dataset FiftyOne

In [None]:
dataset_name = get_fo_dataset_name(model_path)
apply_fo_dataset_pipeline(model_path, dataset_name, dataset_type='partial')

# 3 - Pipeline de Avaliação 

In [None]:
fo_dataset = fo.load_dataset(dataset_name)
apply_eval_pipeline(fo_dataset, model_path)