#Ajuste fino do conjunto de dados CSTNews usando BERT Transformers by HuggingFace e Lotes Inteligentes e Validação Cruzada para todos os Folds

Com base no modelo BERT pré-treinado realiza o ajuste fino para os dados CSTNews para classificar documentos coerentes e incoerentes.

- Realiza o ajuste fino nos dados de CSTNEWS de Márcio Dias.
- Realiza a avaliação do conjunto de teste para um determinado fold(10%).
- A seção 2 - parametrização define os argumentos da execução.

Notebook base: https://colab.research.google.com/drive/1KDeFAHvRFq3bY5onzj8Wgul3rRcrQNaC?usp=sharing

----------------------------

**Link biblioteca Transformers:**
https://github.com/huggingface/transformers


**Artigo original BERT:**
https://arxiv.org/pdf/1506.06724.pdf

**Artigo padding dinâmico:**
https://towardsdatascience.com/divide-hugging-face-transformers-training-time-by-2-or-more-21bf7129db9q-21bf7129db9e

# 1 Preparação do ambiente
Preparação do ambiente para execução do notebook.

## 1.1 Tempo inicial de processamento

In [1]:
# Import das bibliotecas
import time
import datetime

# Marca o tempo de início do processamento
inicioProcessamento = time.time()

In [2]:
print("  Tempo de início de processamento:  {:} (h:mm:ss)".format(inicioProcessamento))

  Tempo de início de processamento:  1631107287.818004 (h:mm:ss)


## 1.2 Tratamento de logs

In [3]:
# Biblioteca de logging
import logging

# Formatando a mensagem de logging
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)

## 1.3 Identificando o ambiente Colab

In [4]:
# Se estiver executando no Google Colaboratory
import sys

# Retorna true ou false se estiver no Google Colaboratory
IN_COLAB = 'google.colab' in sys.modules

## 1.4 Biblioteca de limpeza de tela

In [5]:
from IPython.display import clear_output

## 1.5 Conecta ao Google Drive

É necessário existir a pasta '/content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/Resultados/' para receber os resutlados do notebook.

In [6]:
# Monta o Google Drive para esta instância de notebook.
from google.colab import drive

drive.mount('/content/drive')

Mounted at /content/drive


## 1.6 Instalação do wandb

Instalação

In [7]:
!pip install --upgrade wandb

Collecting wandb
  Downloading wandb-0.12.1-py2.py3-none-any.whl (1.7 MB)
[K     |████████████████████████████████| 1.7 MB 5.2 MB/s 
[?25hCollecting GitPython>=1.0.0
  Downloading GitPython-3.1.18-py3-none-any.whl (170 kB)
[K     |████████████████████████████████| 170 kB 53.2 MB/s 
[?25hCollecting subprocess32>=3.5.3
  Downloading subprocess32-3.5.4.tar.gz (97 kB)
[K     |████████████████████████████████| 97 kB 6.5 MB/s 
Collecting pathtools
  Downloading pathtools-0.1.2.tar.gz (11 kB)
Collecting sentry-sdk>=1.0.0
  Downloading sentry_sdk-1.3.1-py2.py3-none-any.whl (133 kB)
[K     |████████████████████████████████| 133 kB 41.3 MB/s 
[?25hCollecting docker-pycreds>=0.4.0
  Downloading docker_pycreds-0.4.0-py2.py3-none-any.whl (9.0 kB)
Collecting configparser>=3.8.1
  Downloading configparser-5.0.2-py3-none-any.whl (19 kB)
Collecting shortuuid>=0.5.0
  Downloading shortuuid-1.0.1-py3-none-any.whl (7.5 kB)
Collecting gitdb<5,>=4.0.1
  Downloading gitdb-4.0.7-py3-none-any.whl (63 kB

## 1.7 Instalação BERT da Hugging Face

Instala a interface pytorch para o BERT by Hugging Face. 

In [8]:
!pip install -U transformers==4.5.1

Collecting transformers==4.5.1
  Downloading transformers-4.5.1-py3-none-any.whl (2.1 MB)
[K     |████████████████████████████████| 2.1 MB 5.3 MB/s 
Collecting sacremoses
  Downloading sacremoses-0.0.45-py3-none-any.whl (895 kB)
[K     |████████████████████████████████| 895 kB 35.0 MB/s 
[?25hCollecting tokenizers<0.11,>=0.10.1
  Downloading tokenizers-0.10.3-cp37-cp37m-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_12_x86_64.manylinux2010_x86_64.whl (3.3 MB)
[K     |████████████████████████████████| 3.3 MB 38.2 MB/s 
Installing collected packages: tokenizers, sacremoses, transformers
Successfully installed sacremoses-0.0.45 tokenizers-0.10.3 transformers-4.5.1


## 1.8 Recupera o coerenciaBERT do Github

In [9]:
tokengit = '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'
nomeusuario = 'osmarbraz'
repositorio = 'coerenciabert.git'
!git clone https://{tokengit}@github.com/{nomeusuario}/{repositorio}

Cloning into 'coerenciabert'...
remote: Enumerating objects: 2110, done.[K
remote: Counting objects: 100% (2110/2110), done.[K
remote: Compressing objects: 100% (1213/1213), done.[K
remote: Total 2110 (delta 943), reused 2060 (delta 893), pack-reused 0[K
Receiving objects: 100% (2110/2110), 23.24 MiB | 17.23 MiB/s, done.
Resolving deltas: 100% (943/943), done.


In [10]:
#Muda o diretório corrente para a pasta clonada
import sys
sys.path.append('./coerenciabert/coerencia')

In [11]:
# Import de bibliotecas
from util.utilmodulo import *
from util.utiltempo import *
from util.utilarquivo import *

## 1.9 Colaboratory

Usando Colab GPU para Treinamento


Uma GPU pode ser adicionada acessando o menu e selecionando:

`Edit -> Notebook Settings -> Hardware accelerator -> (GPU)`

Em seguida, execute a célula a seguir para confirmar que a GPU foi detectada.

In [12]:
# Importando a biblioteca
import tensorflow as tf

# Recupera o nome do dispositido da GPU.
device_name = tf.test.gpu_device_name()

# O nome do dispositivo deve ser parecido com o seguinte:
if device_name == '/device:GPU:0':
    print('Encontrei GPU em: {}'.format(device_name))
else:
    print('Dispositivo GPU não encontrado')
    #raise SystemError('Dispositivo GPU não encontrado')

Encontrei GPU em: /device:GPU:0


Nome da GPU

Para que a torch use a GPU, precisamos identificar e especificar a GPU como o dispositivo. Posteriormente, em nosso ciclo de treinamento, carregaremos dados no dispositivo.

Vale a pena observar qual GPU você recebeu. A GPU Tesla V100 é muito mais rápido que as outras GPUs, abaixo uma lista ordenada:
- 1o Tesla V100-SXM2-16GB(Pro)
- 2o Tesla P100-PCIE-16GB
- 3o Tesla T4
- 4o Tesla P4 (Não tem memória para execução 4 lotes de treino x 8 lotes de avaliação, somente 2 x 4)
- 5o Tesla K80 (Não tem memória para execução 4 lotes de treino x 8 lotes de avaliação, somente 2 x 4)

In [13]:
# Biblioteca coerenciaBERT
from bert.bertmodulo import *

device = getDeviceGPU()

2021-09-08 13:23:14,286 : INFO : Existem 1 GPU(s) disponíveis.
2021-09-08 13:23:14,298 : INFO : Iremos usar a GPU: Tesla K80.


# 2 Parametrização

In [14]:
# Biblioteca coerenciaBERT
from transformers import TrainingArguments

# Definição dos parâmetros de Treinamento.
training_args = TrainingArguments(
    # AjusteFinoCSTNews_v1_C_SB_KF = nome do notebook
    # E = número de épocas
    # lr = taxa de aprendizagem
    # b = lotes de treino e avaliação
    # f = número do fold
    output_dir = 'XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f',    
    save_steps = 0,    
    seed = 42,
    num_train_epochs = 1, # Intervalo de valores: 2, 3, 4
    learning_rate = 1e-5, # Intervalo de valores: 1e-5, 2e-5, 3e-5, 4e-5, 5e-5 
    gradient_accumulation_steps = 1,
    per_device_train_batch_size = 4, 
    per_device_eval_batch_size = 8,        
    evaluation_strategy = 'epoch'
)

# Import de bibliotecas
from bert.bertarguments import ModeloArgumentosClassificacao

# Definição dos parâmetros do Modelo
model_args = ModeloArgumentosClassificacao(     
    max_seq_len = 512,
    #pretrained_model_name_or_path = "https://neuralmind-ai.s3.us-east-2.amazonaws.com/nlp/bert-large-portuguese-cased/bert-large-portuguese-cased_pytorch_checkpoint.zip",
    pretrained_model_name_or_path = "https://neuralmind-ai.s3.us-east-2.amazonaws.com/nlp/bert-base-portuguese-cased/bert-base-portuguese-cased_pytorch_checkpoint.zip",    
    #pretrained_model_name_or_path = 'bert-base-multilingual-cased',
    do_lower_case = False,   # default True
    num_labels = 2,
    output_attentions = False,    # default False
    output_hidden_states = False, # default False 
    optimizer = 'AdamW',
    use_wandb = False,
    salvar_modelo_wandb = False,
    salvar_modelo = False,
    salvar_avaliacao = True, # Salva o resultado classificações
    salvar_classificacao = True, # Salva o resultado da avaliação das classificações
    fold = 1 # Intervalo de valores: 1 a 10, É utilizado somente para logs. Use as variáveis das últimas linhas de bloco para definir o intervalo de folds a serem gerados.
)

# Determina o intervalo de folds a ser avaliado
inicioFold = 1
fimFold = 10

# 3 BERT

## Carrega o modelo e tokenizador BERT

Lista de modelos da comunidade:
* https://huggingface.co/models

Português(https://github.com/neuralmind-ai/portuguese-bert):  
* **'neuralmind/bert-base-portuguese-cased'**
* **'neuralmind/bert-large-portuguese-cased'**

In [15]:
# Import de bibliotecas
from bert.bertmodulo import *

# Carrega o modelo e tokenizador do BERT
# Carregado a cada fold
# model, tokenizer = carregaBERT(model_args)

# 4.Wandb

https://wandb.ai/osmar-braz/ajustefinocstnews_v1_c_sb_kfold/table?workspace=user-osmar-braz


## Função de inicialização wandb

In [16]:
def inicializacaoWandb():

  if model_args.use_wandb:

    # Importando a biblioteca.
    import wandb

    #Login via linha de comando
    !wandb login aded3bc0ea651fff536cc08ba69caf8ac4141cfd

    # Inicializando o registro do experimento.
    # Na execução só pode existir de um init  para que não gere dois registros no wandb.
    wandb.init(project="ajustefinocstnews_v1_c_sb_kfold", name=training_args.output_dir + str(model_args.fold))

    # Atualiza os parâmetros do modelo no wandb.
    wandb.config.update(model_args)
    # Atualiza os parâmetros de treinamento no wandb.
    wandb.config.update(training_args)

    # Registra os parämetros não literais do model_args.
    wandb.log({"max_seq_len": model_args.max_seq_len})
    wandb.log({"do_lower_case": model_args.do_lower_case})
    wandb.log({"output_hidden_states": model_args.output_hidden_states})    
    wandb.log({"fold": model_args.fold})

    return wandb

# 5 Treinamento e avaliação

Treinando e avaliando o conjunto de dados.

## 5.1 Execução do treinamento e avaliação de todos os Folds

In [None]:
# Import das bibliotecas
import time
import datetime

# Biblioteca coerenciaBERT
from bert.bertmodulo import *
from conjuntodedados.dadoscstnewsclassificacaokfold import *
from experimento.classificacaobinaria  import *
from experimento.classificacaobinariakfold import *

# Percorre todos os folds do intervalo de inicioFold até fimFold
for ifold in range(inicioFold, fimFold+1):

  # Seta o parâmetro do fold
  model_args.fold = ifold
  print("\nProcessamendo do fold: {}".format(model_args.fold))
  
  # Marca o tempo de início do processamento
  inicioProcessamentof = time.time()

  print("  Tempo de início de processamento fold:  {:} (h:mm:ss)".format(formataTempo(inicioProcessamentof)))

  # Carrega o modelo e tokenizador do BERT
  model, tokenizer = carregaBERT(model_args)

  # Inicializa o wandb para registro
  wandb = inicializacaoWandb()

  # Função de carregamento dos dados de um fold
  dfdados_train, dfdados_test = getConjuntoDeDadosClassificacaoFold(model_args, tokenizer, ORIGEM=None)

  # Pega as listas de documentos de treino e seus rótulos.
  documentos_treino = dfdados_train.documento.values
  classes_treino = dfdados_train.classe.values
  documentoids_treino = dfdados_train.id.values

  # Pega as listas de documentos teste e seus rótulos.
  documentos_teste = dfdados_test.documento.values
  classes_teste = dfdados_test.classe.values
  documentoids_teste = dfdados_test.id.values

  # Mostra o resultado dos dados carregados.
  print("Total do conjunto de dados          : {}.".format(len(documentos_treino) + len(documentos_teste)))
  print("Total do conjunto de dados de treino: {}.".format(len(documentos_treino)))
  print("Total do conjunto de dados de teste : {}.".format(len(documentos_teste)))

  #################  Treinamento

  # Registra o tempo inicial.
  treinamento_t0 = time.time()

  # Realiza o treinamento.
  model = realizaTreinamento(model_args, training_args, model, tokenizer, documentos_treino, classes_treino, documentoids_treino, wandb)
  
  # Medida de quanto tempo levou a execução do treinamento.
  treinamento_total = formataTempo(time.time() - treinamento_t0)

  print("  Tempo total treinamento       : {:}".format(treinamento_total))
  
  #################  Treinamento

  ################# Avaliação

  # Registra o tempo inicial.
  avaliacao_t0 = time.time()

  # Realiza a avaliação do modelo.
  media_test_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, lista_resultado_avaliacao = realizaAvaliacao(model_args, training_args, model, tokenizer, documentos_teste, classes_teste, documentoids_teste, wandb)

  print('Avaliação loss: {:.8f}; Acc: {:.8f}; Rec: {:.8f}; Pre: {:.8f}, F1:{:.8f}, vp: {:3d}; vn: {:3d}; fp: {:3d}; fn: {:3d}'.format( 
        media_test_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s))      
    
  print("Acurácia do fold {}        : {:.8f}".format(model_args.fold, acc))  

  # Medida de quanto tempo levou a execução do treinamento e avaliação
  avaliacao_total = formataTempo(time.time() - avaliacao_t0)

  print("Tempo gasto na avaliação  : {:}".format(avaliacao_total))

  ################# Avaliação

  # Salva o resultado da classificação  
  # Diretório para salvar o arquivo de classificação.
  DIRETORIO_CLASSIFICACAO = "/content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/"
  salvaResultadoClassificacao(model_args, training_args, DIRETORIO_CLASSIFICACAO, lista_resultado_avaliacao)
  
  # Salva o resultado da avaliação
  # Diretório para salvar o arquivo.
  DIRETORIO_AVALIACAO = "/content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/"  
  salvaResultadoAvaliacao(model_args, training_args, DIRETORIO_AVALIACAO, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, treinamento_total)
  
  # Apaga os dados
  del dfdados_train
  del dfdados_test
  del documentos_treino
  del classes_treino
  del documentoids_treino
  del documentos_teste
  del classes_teste
  del documentoids_teste
  del lista_resultado_avaliacao  
  del model

  # Pega o tempo atual menos o tempo do início do processamento.
  finalProcessamentof = time.time()
  tempoTotalProcessamentof = formataTempo(finalProcessamentof - inicioProcessamentof)

  print("")
  print("Tempo processamento fold: {:} (h:mm:ss)".format(tempoTotalProcessamentof))


Processamendo do fold: 1
  Tempo de início de processamento fold:  18878 days, 13:23:15 (h:mm:ss)


2021-09-08 13:23:15,418 : INFO : Download do arquivo: bert-base-portuguese-cased_pytorch_checkpoint.zip.


  0%|          | 0.00/406M [00:00<?, ?B/s]

2021-09-08 13:23:31,711 : INFO : Download do arquivo: coerenciabert/modeloBERT/vocab.txt.


  0%|          | 0.00/210k [00:00<?, ?B/s]

2021-09-08 13:23:31,834 : INFO : Diretório coerenciabert/modeloBERT do modelo BERT pronta!
2021-09-08 13:23:31,891 : INFO : Usando modelo BERT pré-treinado.
2021-09-08 13:23:31,892 : INFO : Carregando o modelo BERT do diretório coerenciabert/modeloBERT para classificação.
Some weights of the model checkpoint at coerenciabert/modeloBERT were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForSequen

Total do conjunto de dados          : 9960.
Total do conjunto de dados de treino: 8964.
Total do conjunto de dados de teste : 996.


Épocas:   0%|          | 0/1 [00:00<?, ?épocas/s]

2021-09-08 13:24:17,517 : INFO : Tokenizando 8,964 amostra.
2021-09-08 13:24:45,759 : INFO : Tokenização concluída.
2021-09-08 13:24:45,761 : INFO :      8,964 amostras.
2021-09-08 13:24:45,774 : INFO :      8,964 amostras após classificação.
2021-09-08 13:24:45,778 : INFO : Criando lotes de tamanho 4.
2021-09-08 13:24:45,791 : INFO : Lote criado - Selecionado 2,241 lotes.


Epoca 1:   0%|          | 0/2241 [00:00<?, ?lotes/s]

2021-09-08 13:39:13,034 : INFO :   Média perda(loss) do treinamento da época : 0.34904172.
2021-09-08 13:39:13,038 : INFO :   Tempo de treinamento da época             : 0:14:27.
2021-09-08 13:39:13,047 : INFO :   Tempo parcial do treinamento              : 0:14:56 (h:mm:ss).
2021-09-08 13:39:13,060 : INFO :   Média perda(loss) treinamento : 0.34904172.
2021-09-08 13:39:13,064 : INFO : Treinamento completo!
2021-09-08 13:39:13,072 : INFO : Existem 1 GPU(s) disponíveis.
2021-09-08 13:39:13,074 : INFO : Iremos usar a GPU: Tesla K80.
2021-09-08 13:39:13,076 : INFO : Realizando Avaliação fold: 1.
2021-09-08 13:39:13,078 : INFO : Predizendo rótulos para 996 documentos de teste.
2021-09-08 13:39:13,081 : INFO : Tokenizando 996 amostra.


  Tempo total treinamento       : 0:14:56


2021-09-08 13:39:16,247 : INFO : Tokenização concluída.
2021-09-08 13:39:16,250 : INFO :        996 amostras.
2021-09-08 13:39:16,257 : INFO :        996 amostras após classificação.
2021-09-08 13:39:16,258 : INFO : Criando lotes de tamanho 8.
2021-09-08 13:39:16,265 : INFO : Lote criado - Selecionado 125 lotes.


Lotes :   0%|          | 0/125 [00:00<?, ?lotes/s]

Avaliação loss: 0.13732307; Acc: 0.96686747; Rec: 0.99598394; Pre: 0.94117647, F1:0.96780488, vp: 496; vn: 467; fp:  31; fn:   2
Acurácia do fold 1        : 0.96686747
Tempo gasto na avaliação  : 0:00:33


2021-09-08 13:39:46,602 : INFO : Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/.
2021-09-08 13:39:50,598 : INFO : Atualizando arquivo classificação: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f1_BERTimbau_base.csv.
2021-09-08 13:39:50,961 : INFO : Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/.
2021-09-08 13:39:50,971 : INFO : Criando arquivo resultado: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f1_BERTimbau_base.csv.
2021-09-08 13:39:50,983 : INFO : Apagando diretório existente do modelo!



Tempo processamento fold: 0:16:36 (h:mm:ss)

Processamendo do fold: 2
  Tempo de início de processamento fold:  18878 days, 13:39:51 (h:mm:ss)


2021-09-08 13:39:51,285 : INFO : Download do arquivo: bert-base-portuguese-cased_pytorch_checkpoint.zip.


  0%|          | 0.00/406M [00:00<?, ?B/s]

2021-09-08 13:40:08,374 : INFO : Download do arquivo: coerenciabert/modeloBERT/vocab.txt.


  0%|          | 0.00/210k [00:00<?, ?B/s]

2021-09-08 13:40:08,512 : INFO : Diretório coerenciabert/modeloBERT do modelo BERT pronta!
2021-09-08 13:40:08,566 : INFO : Usando modelo BERT pré-treinado.
2021-09-08 13:40:08,568 : INFO : Carregando o modelo BERT do diretório coerenciabert/modeloBERT para classificação.
Some weights of the model checkpoint at coerenciabert/modeloBERT were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForSequen

Total do conjunto de dados          : 9960.
Total do conjunto de dados de treino: 8964.
Total do conjunto de dados de teste : 996.


Épocas:   0%|          | 0/1 [00:00<?, ?épocas/s]

2021-09-08 13:40:42,882 : INFO : Tokenizando 8,964 amostra.
2021-09-08 13:41:10,539 : INFO : Tokenização concluída.
2021-09-08 13:41:10,541 : INFO :      8,964 amostras.
2021-09-08 13:41:10,565 : INFO :      8,964 amostras após classificação.
2021-09-08 13:41:10,567 : INFO : Criando lotes de tamanho 4.
2021-09-08 13:41:10,584 : INFO : Lote criado - Selecionado 2,241 lotes.


Epoca 1:   0%|          | 0/2241 [00:00<?, ?lotes/s]

2021-09-08 13:55:37,600 : INFO :   Média perda(loss) do treinamento da época : 0.33614447.
2021-09-08 13:55:37,612 : INFO :   Tempo de treinamento da época             : 0:14:27.
2021-09-08 13:55:37,613 : INFO :   Tempo parcial do treinamento              : 0:14:55 (h:mm:ss).
2021-09-08 13:55:37,626 : INFO :   Média perda(loss) treinamento : 0.33614447.
2021-09-08 13:55:37,628 : INFO : Treinamento completo!
2021-09-08 13:55:37,633 : INFO : Existem 1 GPU(s) disponíveis.
2021-09-08 13:55:37,636 : INFO : Iremos usar a GPU: Tesla K80.
2021-09-08 13:55:37,638 : INFO : Realizando Avaliação fold: 2.
2021-09-08 13:55:37,641 : INFO : Predizendo rótulos para 996 documentos de teste.
2021-09-08 13:55:37,643 : INFO : Tokenizando 996 amostra.


  Tempo total treinamento       : 0:14:55


2021-09-08 13:55:40,707 : INFO : Tokenização concluída.
2021-09-08 13:55:40,709 : INFO :        996 amostras.
2021-09-08 13:55:40,711 : INFO :        996 amostras após classificação.
2021-09-08 13:55:40,716 : INFO : Criando lotes de tamanho 8.
2021-09-08 13:55:40,722 : INFO : Lote criado - Selecionado 125 lotes.


Lotes :   0%|          | 0/125 [00:00<?, ?lotes/s]

2021-09-08 13:56:10,021 : INFO : Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/.
2021-09-08 13:56:10,035 : INFO : Criando arquivo classificação: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f2_BERTimbau_base.csv.
2021-09-08 13:56:10,055 : INFO : Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/.
2021-09-08 13:56:10,057 : INFO : Criando arquivo resultado: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f2_BERTimbau_base.csv.
2021-09-08 13:56:10,073 : INFO : Apagando diretório existente do modelo!


Avaliação loss: 0.18653340; Acc: 0.95281124; Rec: 0.99397590; Pre: 0.91836735, F1:0.95467695, vp: 495; vn: 454; fp:  44; fn:   3
Acurácia do fold 2        : 0.95281124
Tempo gasto na avaliação  : 0:00:32

Tempo processamento fold: 0:16:19 (h:mm:ss)

Processamendo do fold: 3
  Tempo de início de processamento fold:  18878 days, 13:56:10 (h:mm:ss)


2021-09-08 13:56:10,337 : INFO : Download do arquivo: bert-base-portuguese-cased_pytorch_checkpoint.zip.


  0%|          | 0.00/406M [00:00<?, ?B/s]

2021-09-08 13:56:26,286 : INFO : Download do arquivo: coerenciabert/modeloBERT/vocab.txt.


  0%|          | 0.00/210k [00:00<?, ?B/s]

2021-09-08 13:56:26,424 : INFO : Diretório coerenciabert/modeloBERT do modelo BERT pronta!
2021-09-08 13:56:26,483 : INFO : Usando modelo BERT pré-treinado.
2021-09-08 13:56:26,490 : INFO : Carregando o modelo BERT do diretório coerenciabert/modeloBERT para classificação.
Some weights of the model checkpoint at coerenciabert/modeloBERT were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForSequen

Total do conjunto de dados          : 9960.
Total do conjunto de dados de treino: 8964.
Total do conjunto de dados de teste : 996.


Épocas:   0%|          | 0/1 [00:00<?, ?épocas/s]

2021-09-08 13:57:00,494 : INFO : Tokenizando 8,964 amostra.
2021-09-08 13:57:27,853 : INFO : Tokenização concluída.
2021-09-08 13:57:27,858 : INFO :      8,964 amostras.
2021-09-08 13:57:28,089 : INFO :      8,964 amostras após classificação.
2021-09-08 13:57:28,090 : INFO : Criando lotes de tamanho 4.
2021-09-08 13:57:28,109 : INFO : Lote criado - Selecionado 2,241 lotes.


Epoca 1:   0%|          | 0/2241 [00:00<?, ?lotes/s]

2021-09-08 14:11:54,598 : INFO :   Média perda(loss) do treinamento da época : 0.34643619.
2021-09-08 14:11:54,606 : INFO :   Tempo de treinamento da época             : 0:14:26.
2021-09-08 14:11:54,611 : INFO :   Tempo parcial do treinamento              : 0:14:55 (h:mm:ss).
2021-09-08 14:11:54,625 : INFO :   Média perda(loss) treinamento : 0.34643619.
2021-09-08 14:11:54,627 : INFO : Treinamento completo!
2021-09-08 14:11:54,635 : INFO : Existem 1 GPU(s) disponíveis.
2021-09-08 14:11:54,637 : INFO : Iremos usar a GPU: Tesla K80.
2021-09-08 14:11:54,640 : INFO : Realizando Avaliação fold: 3.
2021-09-08 14:11:54,641 : INFO : Predizendo rótulos para 996 documentos de teste.
2021-09-08 14:11:54,644 : INFO : Tokenizando 996 amostra.


  Tempo total treinamento       : 0:14:55


2021-09-08 14:11:57,873 : INFO : Tokenização concluída.
2021-09-08 14:11:57,875 : INFO :        996 amostras.
2021-09-08 14:11:57,877 : INFO :        996 amostras após classificação.
2021-09-08 14:11:57,882 : INFO : Criando lotes de tamanho 8.
2021-09-08 14:11:57,886 : INFO : Lote criado - Selecionado 125 lotes.


Lotes :   0%|          | 0/125 [00:00<?, ?lotes/s]

2021-09-08 14:12:27,654 : INFO : Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/.
2021-09-08 14:12:27,660 : INFO : Criando arquivo classificação: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f3_BERTimbau_base.csv.
2021-09-08 14:12:27,679 : INFO : Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/.
2021-09-08 14:12:27,681 : INFO : Criando arquivo resultado: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f3_BERTimbau_base.csv.
2021-09-08 14:12:27,696 : INFO : Apagando diretório existente do modelo!


Avaliação loss: 0.23726544; Acc: 0.93975904; Rec: 1.00000000; Pre: 0.89247312, F1:0.94318182, vp: 498; vn: 438; fp:  60; fn:   0
Acurácia do fold 3        : 0.93975904
Tempo gasto na avaliação  : 0:00:33

Tempo processamento fold: 0:16:18 (h:mm:ss)

Processamendo do fold: 4
  Tempo de início de processamento fold:  18878 days, 14:12:28 (h:mm:ss)


2021-09-08 14:12:28,036 : INFO : Download do arquivo: bert-base-portuguese-cased_pytorch_checkpoint.zip.


  0%|          | 0.00/406M [00:00<?, ?B/s]

2021-09-08 14:12:43,820 : INFO : Download do arquivo: coerenciabert/modeloBERT/vocab.txt.


  0%|          | 0.00/210k [00:00<?, ?B/s]

2021-09-08 14:12:43,949 : INFO : Diretório coerenciabert/modeloBERT do modelo BERT pronta!
2021-09-08 14:12:44,010 : INFO : Usando modelo BERT pré-treinado.
2021-09-08 14:12:44,011 : INFO : Carregando o modelo BERT do diretório coerenciabert/modeloBERT para classificação.
Some weights of the model checkpoint at coerenciabert/modeloBERT were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForSequen

Total do conjunto de dados          : 9960.
Total do conjunto de dados de treino: 8964.
Total do conjunto de dados de teste : 996.


Épocas:   0%|          | 0/1 [00:00<?, ?épocas/s]

2021-09-08 14:13:17,882 : INFO : Tokenizando 8,964 amostra.
2021-09-08 14:13:45,100 : INFO : Tokenização concluída.
2021-09-08 14:13:45,102 : INFO :      8,964 amostras.
2021-09-08 14:13:45,124 : INFO :      8,964 amostras após classificação.
2021-09-08 14:13:45,126 : INFO : Criando lotes de tamanho 4.
2021-09-08 14:13:45,145 : INFO : Lote criado - Selecionado 2,241 lotes.


Epoca 1:   0%|          | 0/2241 [00:00<?, ?lotes/s]

2021-09-08 14:28:13,101 : INFO :   Média perda(loss) do treinamento da época : 0.36939397.
2021-09-08 14:28:13,110 : INFO :   Tempo de treinamento da época             : 0:14:28.
2021-09-08 14:28:13,116 : INFO :   Tempo parcial do treinamento              : 0:14:56 (h:mm:ss).
2021-09-08 14:28:13,132 : INFO :   Média perda(loss) treinamento : 0.36939397.
2021-09-08 14:28:13,139 : INFO : Treinamento completo!
2021-09-08 14:28:13,142 : INFO : Existem 1 GPU(s) disponíveis.
2021-09-08 14:28:13,144 : INFO : Iremos usar a GPU: Tesla K80.
2021-09-08 14:28:13,145 : INFO : Realizando Avaliação fold: 4.
2021-09-08 14:28:13,147 : INFO : Predizendo rótulos para 996 documentos de teste.
2021-09-08 14:28:13,149 : INFO : Tokenizando 996 amostra.


  Tempo total treinamento       : 0:14:56


2021-09-08 14:28:16,494 : INFO : Tokenização concluída.
2021-09-08 14:28:16,496 : INFO :        996 amostras.
2021-09-08 14:28:16,503 : INFO :        996 amostras após classificação.
2021-09-08 14:28:16,506 : INFO : Criando lotes de tamanho 8.
2021-09-08 14:28:16,513 : INFO : Lote criado - Selecionado 125 lotes.


Lotes :   0%|          | 0/125 [00:00<?, ?lotes/s]

2021-09-08 14:28:46,022 : INFO : Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/.
2021-09-08 14:28:46,032 : INFO : Criando arquivo classificação: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f4_BERTimbau_base.csv.
2021-09-08 14:28:46,061 : INFO : Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/.
2021-09-08 14:28:46,063 : INFO : Criando arquivo resultado: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f4_BERTimbau_base.csv.
2021-09-08 14:28:46,077 : INFO : Apagando diretório existente do modelo!


Avaliação loss: 0.24159112; Acc: 0.94979920; Rec: 0.98795181; Pre: 0.91791045, F1:0.95164410, vp: 492; vn: 454; fp:  44; fn:   6
Acurácia do fold 4        : 0.94979920
Tempo gasto na avaliação  : 0:00:33

Tempo processamento fold: 0:16:18 (h:mm:ss)

Processamendo do fold: 5
  Tempo de início de processamento fold:  18878 days, 14:28:46 (h:mm:ss)


2021-09-08 14:28:46,436 : INFO : Download do arquivo: bert-base-portuguese-cased_pytorch_checkpoint.zip.


  0%|          | 0.00/406M [00:00<?, ?B/s]

2021-09-08 14:29:02,788 : INFO : Download do arquivo: coerenciabert/modeloBERT/vocab.txt.


  0%|          | 0.00/210k [00:00<?, ?B/s]

2021-09-08 14:29:02,924 : INFO : Diretório coerenciabert/modeloBERT do modelo BERT pronta!
2021-09-08 14:29:02,984 : INFO : Usando modelo BERT pré-treinado.
2021-09-08 14:29:02,985 : INFO : Carregando o modelo BERT do diretório coerenciabert/modeloBERT para classificação.
Some weights of the model checkpoint at coerenciabert/modeloBERT were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForSequen

Total do conjunto de dados          : 9960.
Total do conjunto de dados de treino: 8964.
Total do conjunto de dados de teste : 996.


Épocas:   0%|          | 0/1 [00:00<?, ?épocas/s]

2021-09-08 14:29:37,504 : INFO : Tokenizando 8,964 amostra.
2021-09-08 14:30:05,708 : INFO : Tokenização concluída.
2021-09-08 14:30:05,710 : INFO :      8,964 amostras.
2021-09-08 14:30:05,730 : INFO :      8,964 amostras após classificação.
2021-09-08 14:30:05,733 : INFO : Criando lotes de tamanho 4.
2021-09-08 14:30:05,747 : INFO : Lote criado - Selecionado 2,241 lotes.


Epoca 1:   0%|          | 0/2241 [00:00<?, ?lotes/s]

2021-09-08 14:44:35,162 : INFO :   Média perda(loss) do treinamento da época : 0.38962368.
2021-09-08 14:44:35,164 : INFO :   Tempo de treinamento da época             : 0:14:29.
2021-09-08 14:44:35,168 : INFO :   Tempo parcial do treinamento              : 0:14:58 (h:mm:ss).
2021-09-08 14:44:35,194 : INFO :   Média perda(loss) treinamento : 0.38962368.
2021-09-08 14:44:35,196 : INFO : Treinamento completo!
2021-09-08 14:44:35,207 : INFO : Existem 1 GPU(s) disponíveis.
2021-09-08 14:44:35,209 : INFO : Iremos usar a GPU: Tesla K80.
2021-09-08 14:44:35,212 : INFO : Realizando Avaliação fold: 5.
2021-09-08 14:44:35,215 : INFO : Predizendo rótulos para 996 documentos de teste.
2021-09-08 14:44:35,216 : INFO : Tokenizando 996 amostra.


  Tempo total treinamento       : 0:14:58


2021-09-08 14:44:38,349 : INFO : Tokenização concluída.
2021-09-08 14:44:38,352 : INFO :        996 amostras.
2021-09-08 14:44:38,361 : INFO :        996 amostras após classificação.
2021-09-08 14:44:38,364 : INFO : Criando lotes de tamanho 8.
2021-09-08 14:44:38,370 : INFO : Lote criado - Selecionado 125 lotes.


Lotes :   0%|          | 0/125 [00:00<?, ?lotes/s]

2021-09-08 14:45:08,073 : INFO : Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/.
2021-09-08 14:45:08,091 : INFO : Criando arquivo classificação: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f5_BERTimbau_base.csv.
2021-09-08 14:45:08,110 : INFO : Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/.
2021-09-08 14:45:08,115 : INFO : Criando arquivo resultado: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f5_BERTimbau_base.csv.
2021-09-08 14:45:08,128 : INFO : Apagando diretório existente do modelo!


Avaliação loss: 0.32983325; Acc: 0.92269076; Rec: 0.99598394; Pre: 0.86865149, F1:0.92797007, vp: 496; vn: 423; fp:  75; fn:   2
Acurácia do fold 5        : 0.92269076
Tempo gasto na avaliação  : 0:00:33

Tempo processamento fold: 0:16:22 (h:mm:ss)

Processamendo do fold: 6
  Tempo de início de processamento fold:  18878 days, 14:45:08 (h:mm:ss)


2021-09-08 14:45:08,454 : INFO : Download do arquivo: bert-base-portuguese-cased_pytorch_checkpoint.zip.


  0%|          | 0.00/406M [00:00<?, ?B/s]

2021-09-08 14:45:25,697 : INFO : Download do arquivo: coerenciabert/modeloBERT/vocab.txt.


  0%|          | 0.00/210k [00:00<?, ?B/s]

2021-09-08 14:45:25,839 : INFO : Diretório coerenciabert/modeloBERT do modelo BERT pronta!
2021-09-08 14:45:25,911 : INFO : Usando modelo BERT pré-treinado.
2021-09-08 14:45:25,912 : INFO : Carregando o modelo BERT do diretório coerenciabert/modeloBERT para classificação.
Some weights of the model checkpoint at coerenciabert/modeloBERT were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForSequen

Total do conjunto de dados          : 9960.
Total do conjunto de dados de treino: 8964.
Total do conjunto de dados de teste : 996.


Épocas:   0%|          | 0/1 [00:00<?, ?épocas/s]

2021-09-08 14:46:00,620 : INFO : Tokenizando 8,964 amostra.
2021-09-08 14:46:28,048 : INFO : Tokenização concluída.
2021-09-08 14:46:28,049 : INFO :      8,964 amostras.
2021-09-08 14:46:28,071 : INFO :      8,964 amostras após classificação.
2021-09-08 14:46:28,072 : INFO : Criando lotes de tamanho 4.
2021-09-08 14:46:28,085 : INFO : Lote criado - Selecionado 2,241 lotes.


Epoca 1:   0%|          | 0/2241 [00:00<?, ?lotes/s]

2021-09-08 15:00:56,258 : INFO :   Média perda(loss) do treinamento da época : 0.34897480.
2021-09-08 15:00:56,269 : INFO :   Tempo de treinamento da época             : 0:14:28.
2021-09-08 15:00:56,270 : INFO :   Tempo parcial do treinamento              : 0:14:56 (h:mm:ss).
2021-09-08 15:00:56,292 : INFO :   Média perda(loss) treinamento : 0.34897480.
2021-09-08 15:00:56,297 : INFO : Treinamento completo!
2021-09-08 15:00:56,302 : INFO : Existem 1 GPU(s) disponíveis.
2021-09-08 15:00:56,306 : INFO : Iremos usar a GPU: Tesla K80.
2021-09-08 15:00:56,308 : INFO : Realizando Avaliação fold: 6.
2021-09-08 15:00:56,312 : INFO : Predizendo rótulos para 996 documentos de teste.
2021-09-08 15:00:56,314 : INFO : Tokenizando 996 amostra.


  Tempo total treinamento       : 0:14:56


2021-09-08 15:00:59,455 : INFO : Tokenização concluída.
2021-09-08 15:00:59,457 : INFO :        996 amostras.
2021-09-08 15:00:59,462 : INFO :        996 amostras após classificação.
2021-09-08 15:00:59,469 : INFO : Criando lotes de tamanho 8.
2021-09-08 15:00:59,474 : INFO : Lote criado - Selecionado 125 lotes.


Lotes :   0%|          | 0/125 [00:00<?, ?lotes/s]

2021-09-08 15:01:29,172 : INFO : Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/.
2021-09-08 15:01:29,178 : INFO : Criando arquivo classificação: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Classificacao/XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f6_BERTimbau_base.csv.
2021-09-08 15:01:29,197 : INFO : Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/.
2021-09-08 15:01:29,199 : INFO : Criando arquivo resultado: /content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/XX_AjusteFinoCSTNews_v1_C_SB_KF_E_4_lr_5_b_4_8_f6_BERTimbau_base.csv.
2021-09-08 15:01:29,223 : INFO : Apagando diretório existente do modelo!


Avaliação loss: 0.25777133; Acc: 0.94879518; Rec: 1.00000000; Pre: 0.90710383, F1:0.95128940, vp: 498; vn: 447; fp:  51; fn:   0
Acurácia do fold 6        : 0.94879518
Tempo gasto na avaliação  : 0:00:33

Tempo processamento fold: 0:16:21 (h:mm:ss)

Processamendo do fold: 7
  Tempo de início de processamento fold:  18878 days, 15:01:29 (h:mm:ss)


2021-09-08 15:01:29,530 : INFO : Download do arquivo: bert-base-portuguese-cased_pytorch_checkpoint.zip.


  0%|          | 0.00/406M [00:00<?, ?B/s]

### Carrega e calcula a acurácia médias das execuções


In [None]:
# Biblioteca coerenciaBERT
from experimento.classificacaobinariakfold import *

# Diretório para salvar o arquivo.
DIRETORIO_AVALIACAO = "/content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/Avaliacao/"

carregaResultadoAvaliacao(model_args, training_args, DIRETORIO_AVALIACAO)

# 6 Finalização

## 6.1 Salvando o Modelo para o wandb

In [None]:
if model_args.use_wandb and model_args.salvar_modelo_wandb:
  
    # Salva o modelo para o wandb    
    torch.save(model.state_dict(), os.path.join(wandb.run.dir, 'model_dict.pt'))

## 6.2 Salvando o Modelo Ajustado

Grava o modelo e o tokenizador no disco.

In [None]:
def salvaModelo(model_args):
  
    if model_args.salvar_modelo:
  
        # Import de bibliotecas.
        import os

        # Salvando as melhores práticas: se você usar nomes padrão para o modelo, você pode recarregá-lo usando from_pretrained ()

        # Diretório de salvamento do modelo.
        DIRETORIO_LOCAL_MODELO_AJUSTADO = '/content/modelo_ajustado/'

        # Cria o diretório de saída se necessário.
        if not os.path.exists(DIRETORIO_LOCAL_MODELO_AJUSTADO):
            os.makedirs(DIRETORIO_LOCAL_MODELO_AJUSTADO)

        print('Salvando o modelo para {}'.format(DIRETORIO_LOCAL_MODELO_AJUSTADO))

        # Salve um modelo treinado, configuração e tokenizer usando `save_pretrained ()`.
        # Eles podem então ser recarregados usando `from_pretrained ()`.
        model_to_save = model.module if hasattr(model, 'module') else model  # Cuide do treinamento distribuído/paralelo
        model_to_save.save_pretrained(DIRETORIO_LOCAL_MODELO_AJUSTADO)
        tokenizer.save_pretrained(DIRETORIO_LOCAL_MODELO_AJUSTADO)

        # Boa prática: salve seus argumentos de treinamento junto com o modelo treinado.
        torch.save (model_args, os.path.join (DIRETORIO_LOCAL_MODELO_AJUSTADO, 'model_args.bin'))
        torch.save (training_args, os.path.join (DIRETORIO_LOCAL_MODELO_AJUSTADO, 'training_args.bin'))

In [None]:
salvaModelo(model_args)

Vamos verificar os tamanhos dos arquivos, por curiosidade.

In [None]:
if model_args.salvar_modelo:
  !ls -l --block-size=K /content/modelo_ajustado/

O maior arquivo é o peso do modelo, em torno de 416MB o base e 1.25G o large.

In [None]:
if model_args.salvar_modelo:
  !ls -l --block-size=M /content/modelo_ajustado/pytorch_model.bin

Para salvar seu modelo nas sessões do Colab Notebook, faça o download no seu computador local ou, idealmente, copie-o no seu Google Drive.

In [None]:
if model_args.salvar_modelo:

  # Importando as bibliotecas.
  import os

  # Import de bibliotecas
  from bert.bertmodulo import *

  # Verifica o nome do modelo BERT a ser utilizado
  MODELO_BERT = getNomeModeloBERT(model_args)

  # Verifica o tamanho do modelo(default large)
  TAMANHO_BERT =  getTamanhoBERT(model_args)
  
  # Diretório local de salvamento do modelo.
  DIRETORIO_LOCAL_MODELO_AJUSTADO = '/content/modelo_ajustado/'

  # Diretório remoto de salvamento do modelo.  
  DIRETORIO_REMOTO_MODELO_AJUSTADO = "/content/drive/MyDrive/Colab Notebooks/Data/CSTNEWS/validacao_classificacao/kfold/modelo/modelo" + MODELO_BERT + TAMANHO_BERT

  # Verifica se o diretório existe
  if not os.path.exists(DIRETORIO_REMOTO_MODELO_AJUSTADO):  
    # Cria o diretório
    os.makedirs(DIRETORIO_REMOTO_MODELO_AJUSTADO)
    print('Diretório criado: {}'.format(DIRETORIO_REMOTO_MODELO_AJUSTADO))
  else:
    print('Diretório já existe: {}'.format(DIRETORIO_REMOTO_MODELO_AJUSTADO))

  ## Copia o arquivo do modelo para o diretório no Google Drive.
  !cp -r '$DIRETORIO_LOCAL_MODELO_AJUSTADO'* '$DIRETORIO_REMOTO_MODELO_AJUSTADO'

  print("Modelo copiado!")

## 6.3 Tempo final de processamento



In [None]:
 # Pega o tempo atual menos o tempo do início do processamento.
finalProcessamento = time.time()
tempoTotalProcessamento = formataTempo(finalProcessamento - inicioProcessamento)

print("")
print("  Tempo processamento: {:} (h:mm:ss)".format(tempoTotalProcessamento))

Executa o wandb para finalizar a execução anterior

In [None]:
if model_args.use_wandb:
    # Importando a biblioteca.
    import wandb
    
    # Inicializando o registro do experimento.
    # Na execução só pode existir de um init  para que não gere dois registros no wandb.
    wandb.init(project="ajustefinocstnews_v1_c_sb_kfold", name=training_args.output_dir + str(model_args.fold))