#Ajuste fino do conjunto de dados do CohQuAD CoIn en usando BERT Transformers by HuggingFace e Lotes Inteligentes e Validação Cruzada para todos os Folds

Realiza o ajuste fino do modelo BERT pré-treinado com o conjunto de dados para discriminar documentos originais e modificados e avalia utilizando validação cruzada 10 fold.

Classes:
- 1 - Documento original
- 0 - Documento modificado

Características:
- Realiza o ajuste fino utilizando documentos originais e modificados em pares.
- O Treinamento do modelo utiliza o conjunto de dados com um treinamento para um fold com 90% dos dados.
- A avaliação do modelo utiliza o conjunto de dados de teste para um fold com 10% dos dados.
- Realiza o ajuste fino em 10 pares de folds de treino e teste.
- Utiliza Lotes Inteligentes para otimizar o tempo de execução de treinamento.

- A seção 2 - parametrização define os argumentos da execução.

Utiliza o arquivo `COHEBERT_KFOLD_10_PX_KY.zip`, X é o número de documentos modificados e Y o valor de top K predições.
.

----------------------------

**Link biblioteca Transformers:**
https://github.com/huggingface/transformers


**Artigo original BERT:**
https://arxiv.org/pdf/1506.06724.pdf

**Artigo padding dinâmico:**
https://towardsdatascience.com/divide-hugging-face-transformers-training-time-by-2-or-more-21bf7129db9q-21bf7129db9e

# 1 Preparação do ambiente
Preparação do ambiente para execução do notebook.

## 1.1 Tempo inicial de processamento

In [None]:
import time
import datetime

# Marca o tempo de início do processamento
inicio_processamento = time.time()

In [None]:
print("  Tempo de início de processamento:  {:} (h:mm:ss)".format(inicio_processamento))

  Tempo de início de processamento:  1664584173.1705067 (h:mm:ss)


## 1.2 Funções e classes auxiliares

Verifica se existe o diretório cohebert no diretório corrente.   


In [None]:
# Import das bibliotecas.
import os # Biblioteca para manipular arquivos

# ============================  
def verificaDiretorioCoheBERT():
    """
      Verifica se existe o diretório cohebert no diretório corrente.    
    """
    
    # Verifica se o diretório existe
    if not os.path.exists(DIRETORIO_COHEBERT):  
        # Cria o diretório
        os.makedirs(DIRETORIO_COHEBERT)
        logging.info("Diretório Cohebert criado: {}".format(DIRETORIO_COHEBERT))
    
    return DIRETORIO_COHEBERT

Realiza o download e um arquivo

In [None]:
# Import das bibliotecas.
import requests # Biblioteca de download
from tqdm.notebook import tqdm as tqdm_notebook # Biblioteca para barra de progresso
import os # Biblioteca para manipular arquivos

def downloadArquivo(url_arquivo, nome_arquivo_destino):
    """    
      Realiza o download de um arquivo de uma url em salva em nome_arquivo_destino.
    
      Parâmetros:
        `url_arquivo` - URL do arquivo a ser feito download.      
        `nome_arquivo_destino` - Nome do arquivo a ser salvo.      
    """
    
    # Verifica se existe o diretório base
    DIRETORIO_COHEBERT = verificaDiretorioCoheBERT()
    
    # Realiza o download de um arquivo em uma url
    data = requests.get(url_arquivo, stream=True)
    
    # Verifica se o arquivo existe
    if data.status_code != 200:
        logging.info("Exceção ao tentar realizar download {}. Response {}.".format(url_arquivo, data.status_code))
        data.raise_for_status()
        return

    # Recupera o nome do arquivo a ser realizado o download    
    nome_arquivo = nome_arquivo_destino.split("/")[-1]  

    # Define o nome e caminho do arquivo temporário    
    nome_arquivo_temporario = DIRETORIO_COHEBERT + "/" + nome_arquivo + "_part"
    
    logging.info("Download do arquivo: {}.".format(nome_arquivo_destino))
    
    # Baixa o arquivo
    with open(nome_arquivo_temporario, "wb") as arquivo_binario:        
        tamanho_conteudo = data.headers.get("Content-Length")        
        total = int(tamanho_conteudo) if tamanho_conteudo is not None else None
        # Barra de progresso de download
        progresso_bar = tqdm_notebook(unit="B", total=total, unit_scale=True)                
        # Atualiza a barra de progresso
        for chunk in data.iter_content(chunk_size=1024):        
            if chunk:                
                progresso_bar.update(len(chunk))
                arquivo_binario.write(chunk)
    
    # Renomeia o arquivo temporário para o arquivo definitivo
    os.rename(nome_arquivo_temporario, nome_arquivo_destino)
    
    # Fecha a barra de progresso.
    progresso_bar.close()

Remove tags de um documento

In [None]:
def remove_tags(documento):
    """
      Remove tags de um documento
    """
    
    import re

    documento_limpo = re.compile("<.*?>")
    return re.sub(documento_limpo, "", documento)

Funções auxiliares de arquivos

In [None]:
def carregar(nome_arquivo, encoding="Windows-1252"):
    """
      Carrega um arquivo texto e retorna as linhas como um único parágrafo(texto).
    
      Parâmetros:
        `nome_arquivo` - Nome do arquivo a ser carregado.  
    """

    # Abre o arquivo
    arquivo = open(nome_arquivo, "r", encoding= encoding)
    
    paragrafo = ""
    for linha in arquivo:
        linha = linha.splitlines()
        linha = " ".join(linha)
        # Remove as tags existentes no final das linhas
        linha = remove_tags(linha)
        if linha != "":
          paragrafo = paragrafo + linha.strip() + " "
    
    # Fecha o arquivo
    arquivo.close()

    # Remove os espaços em branco antes e depois do parágrafo
    return paragrafo.strip()

In [None]:
def carregarLista(nome_arquivo, encoding="Windows-1252"):
    """
      Carrega um arquivo texto e retorna as linhas como uma lista de sentenças(texto).
    
      Parâmetros:
        `nome_arquivo` - Nome do arquivo a ser carregado.   
        `encoding` - Codificação dos caracteres do arquivo.
    """

    # Abre o arquivo
    arquivo = open(nome_arquivo, "r", encoding= encoding)
    
    sentencas = []
    for linha in arquivo:        
        linha = linha.splitlines()
        linha = " ".join(linha)
        linha = remove_tags(linha)
        if linha != "":
          sentencas.append(linha.strip())
    
    # Fecha o arquivo
    arquivo.close()

    return sentencas 

In [None]:
def salvar(nome_arquivo,texto):                       
    """
      Salva um texto em arquivo.
     
      Parâmetros:
        `nome_arquivo` - Nome do arquivo a ser salvo.
        `texto` - Texto a ser salvo.     
    """

    arquivo = open(nome_arquivo, "w")
    arquivo.write(str(texto))
    arquivo.close()

Função auxiliar para formatar o tempo como `hh: mm: ss`

In [None]:
# Import das bibliotecas.
import time
import datetime

def formataTempo(tempo):
    """
      Pega a tempo em segundos e retorna uma string hh:mm:ss
    """
    # Arredonda para o segundo mais próximo.
    tempo_arredondado = int(round((tempo)))
    
    # Formata como hh:mm:ss
    return str(datetime.timedelta(seconds=tempo_arredondado))    

Calcula a média de uma lista tempo string no formato hh:mm:ss.

In [None]:
# Import das bibliotecas.
from cmath import rect, phase
from math import radians, degrees
  
def mediaAngulo(deg):
    return degrees(phase(sum(rect(1, radians(d)) for d in deg)/len(deg)))
 
def mediaTempo(tempos):
    '''
    Calcula a média de uma lista de tempo string no formato hh:mm:ss
    '''
    t = (tempo.split(':') for tempo in tempos)
    # Converte para segundos
    segundos = ((float(s) + int(m) * 60 + int(h) * 3600) for h, m, s in t)
    # Verifica se deu algum dia
    dia = 24 * 60 * 60
    # Converte para angulos
    para_angulos = [s * 360. / dia for s in segundos]
    # Calcula a média dos angulos
    media_como_angulo = mediaAngulo(para_angulos)
    media_segundos = media_como_angulo * dia / 360.
    if media_segundos < 0:
        media_segundos += dia
    # Recupera as horas e os minutos  
    h, m = divmod(media_segundos, 3600)
    # Recupera os minutos e os segundos
    m, s = divmod(m, 60)    
    return '{:02d}:{:02d}:{:02d}'.format(int(h), int(m), int(s))

Calcula a soma de uma lista de tempo string no formato hh:mm:ss

In [None]:
def somaTempo(tempos):
    '''
    Calcula a soma de uma lista de tempo string no formato hh:mm:ss
    '''
    t = (tempo.split(':') for tempo in tempos)
    # Converte para segundos
    segundos = ((float(s) + int(m) * 60 + int(h) * 3600) for h, m, s in t)
    # Soma os segundos
    soma_segundos = sum([s * 1. for s in segundos])
    # Recupera as horas e os minutos   
    h, m = divmod(soma_segundos, 3600)
    # Recupera os minutos e os segundos
    m, s = divmod(m, 60)    
    return '{:02d}:{:02d}:{:02d}'.format(int(h), int(m), int(s))

Em muitos dos meus loops for (de longa duração), imprimirei atualizações periódicas de progresso. Normalmente, eu escolho o intervalo de atualização manualmente, mas para este Notebook, defini uma função auxiliar para fazer essa escolha para mim :)

In [None]:
def obterIntervaloAtualizacao(total_iteracoes, numero_atualizacoes):
    '''
     Esta função tentará escolher um intervalo de atualização de progresso inteligente
     com base na magnitude das iterações totais.

     Parâmetros:
       `total_iteracoes` - O número de iterações no loop for.
       `numero_atualizacoes` - Quantas vezes queremos ver uma atualização sobre o
                               curso do loop for.
     '''
    
    # Divida o total de iterações pelo número desejado de atualizações. Provavelmente
    # este será um número feio.
    intervalo_exato = total_iteracoes / numero_atualizacoes

    # A função `arredondar` tem a capacidade de arredondar um número para, por exemplo, o
    # milésimo mais próximo: round (intervalo_exato, -3)
    #
    # Para determinar a magnitude para arredondar, encontre a magnitude do total,
    # e então vá uma magnitude abaixo disso.
    
    # Obtenha a ordem de magnitude do total.
    ordem_magnitude = len(str(total_iteracoes)) - 1
    
    # Nosso intervalo de atualização deve ser arredondado para uma ordem de magnitude menor.
    magnitude_arrendonda = ordem_magnitude - 1

    # Arredonde para baixo e lance para um int.
    intervalo_atualizacao = int(round(intervalo_exato, -magnitude_arrendonda))

    # Não permita que o intervalo seja zero!
    if intervalo_atualizacao == 0:
        intervalo_atualizacao = 1

    return intervalo_atualizacao

Classe(ModeloArgumentosMedida) de definição dos parâmetros do modelo para medida

In [None]:
# Import das bibliotecas.
from dataclasses import dataclass, field
from typing import Dict, Optional
from typing import List

@dataclass
class ModeloArgumentosMedida:
    max_seq_len: Optional[int] = field(
        default=None,
        metadata={"help": "max seq len"},
    )    
    pretrained_model_name_or_path: str = field(
        default="neuralmind/bert-base-portuguese-cased",
        metadata={"help": "nome do modelo pré-treinado do BERT."},
    )
    modelo_spacy: str = field(
        default="pt_core_news_lg",
        metadata={"help": "nome do modelo do spaCy."},
    )
    versao_modelo_spacy: str = field(
        default="-3.2.0",
        metadata={"help": "versão do nome do modelo no spaCy."},
    )
    sentenciar_documento: bool = field(
        default=True,
        metadata={"help": "Dividir o documento em sentenças(frases)."},
    )
    do_lower_case: bool = field(
        default=False,
        metadata={"help": "define se o texto do modelo deve ser todo em minúsculo."},
    )    
    output_attentions: bool = field(
        default=False,
        metadata={"help": "habilita se o modelo retorna os pesos de atenção."},
    )
    output_hidden_states: bool = field(
        default=False,
        metadata={"help": "habilita gerar as camadas ocultas do modelo."},
    )
    usar_mcl_ajustado : bool = field(
        default=False,
        metadata={"help": "habilita o carragamento de mcl ajustado."},
    )

Classe(ModeloArgumentosClassificacao) de definição dos parâmetros do modelo para classificação

In [None]:
# Import das bibliotecas.
from dataclasses import dataclass, field
from typing import Dict, Optional
from typing import List

@dataclass
class ModeloArgumentosClassificacao:
    '''
    Classe(ModeloArgumentosClassificacao) de definição dos parâmetros do modelo BERT para a classificação de coerência.
    '''
    max_seq_len: Optional[int] = field(
        default=None,
        metadata={"help": "max seq len"},
    )    
    pretrained_model_name_or_path: str = field(
        default="neuralmind/bert-base-portuguese-cased",
        metadata={"help": "nome do modelo pré-treinado do BERT."},
    )
    do_lower_case: bool = field(
        default=False,
        metadata={"help": "define se o texto do modelo deve ser todo em minúsculo."},
    )
    num_labels: int = field(
        default=2,
        metadata={"help": "número de rótulos a serem classificados."},
    )
    output_attentions: bool = field(
        default=False,
        metadata={"help": "habilita se o modelo retorna os pesos de atenção."},
    )
    output_hidden_states: bool = field(
        default=False,
        metadata={"help": "habilita gerar as camadas ocultas do modelo."},
    )
    optimizer: str = field(
        default="AdamW",
        metadata={"help": "otimizador do modelo."},
    )
    use_wandb : bool = field(
        default=True,
        metadata={"help": "habilita o uso do wandb."},
    )
    salvar_modelo_wandb : bool = field(
        default=True,
        metadata={"help": "habilita o salvamento do modelo no wandb."},
    )
    salvar_modelo : bool = field(
        default=False,
        metadata={"help": "habilita o salvamento do modelo."},
    )
    salvar_avaliacao : bool = field(
        default=True,
        metadata={"help": "habilita o salvamento do resultado da avaliação."},
    )     
    salvar_classificacao : bool = field(
        default=False,
        metadata={"help": "habilita o salvamento da classificação."},
    )
    usar_mcl_ajustado: bool = field(
        default=False,
        metadata={'help': 'habilita o carragamento de mcl ajustado.'},
    )
    top_k_predicao: int = field(
        default="100",
        metadata={"help": "Quantidade de previsões de palavras recuperadas mais próximas da máscara."},
    )
    documentos_perturbados: int = field(
        default="1",
        metadata={"help": "Quantidade de documentos perturbados comparados com o seu original."},
    ) 
    epoca: int = field(
        default="1",
        metadata={"help": "Época a ser avaliada."},
    )    
    fold: int = field(
        default="1",
        metadata={"help": "Fold a ser avaliado."},
    )    

Biblioteca de limpeza de tela

In [None]:
from IPython.display import clear_output

## 1.3 Tratamento de logs

In [None]:
# Import das bibliotecas.
import logging # Biblioteca de logging

# Formatando a mensagem de logging
logging.basicConfig(format="%(asctime)s : %(levelname)s : %(message)s")

logger = logging.getLogger()
logger.setLevel(logging.INFO)

## 1.4 Identificando o ambiente Colab

In [None]:
# Se estiver executando no Google Colaboratory
import sys

# Retorna true ou false se estiver no Google Colaboratory
IN_COLAB = 'google.colab' in sys.modules

## 1.5 Colaboratory

Usando Colab GPU para Treinamento


Uma GPU pode ser adicionada acessando o menu e selecionando:

`Edit -> Notebook Settings -> Hardware accelerator -> (GPU)`

Em seguida, execute a célula a seguir para confirmar que a GPU foi detectada.

In [None]:
# Import das bibliotecas.
import tensorflow as tf

# Recupera o nome do dispositido da GPU.
device_name = tf.test.gpu_device_name()

# O nome do dispositivo deve ser parecido com o seguinte:
if device_name == "/device:GPU:0":
    logging.info("Encontrei GPU em: {}".format(device_name))
else:
    logging.info("Dispositivo GPU não encontrado")
    #raise SystemError("Dispositivo GPU não encontrado")

INFO:numexpr.utils:NumExpr defaulting to 2 threads.
INFO:root:Encontrei GPU em: /device:GPU:0


Nome da GPU

Para que a torch use a GPU, precisamos identificar e especificar a GPU como o dispositivo. Posteriormente, em nosso ciclo de treinamento, carregaremos dados no dispositivo.

Vale a pena observar qual GPU você recebeu. A GPU Tesla P100 é muito mais rápido que as outras GPUs, abaixo uma lista ordenada:
- 1o Tesla P100
- 2o Tesla T4
- 3o Tesla P4 (Não tem memória para execução 4 x 8, somente 2 x 4)
- 4o Tesla K80 (Não tem memória para execução 4 x 8, somente 2 x 4)

In [None]:
# Import das bibliotecas.
import torch # Biblioteca para manipular os tensores

def getDeviceGPU():
    """
    Retorna um dispositivo de GPU se disponível ou CPU.
    
    Retorno:
    `device` - Um device de GPU ou CPU.       
    """
        
    # Se existe GPU disponível.
    if torch.cuda.is_available():
        
        # Diz ao PyTorch para usar GPU.    
        device = torch.device("cuda")
        
        logging.info("Existem {} GPU(s) disponíveis.".format(torch.cuda.device_count()))
        logging.info("Iremos usar a GPU: {}.".format(torch.cuda.get_device_name(0)))

    # Se não.
    else:        
        logging.info("Sem GPU disponível, usando CPU.")
        device = torch.device("cpu")
        
    return device

In [None]:
device = getDeviceGPU()

INFO:root:Existem 1 GPU(s) disponíveis.
INFO:root:Iremos usar a GPU: Tesla V100-SXM2-16GB.


Conecta o modelo ao device

In [None]:
# Import das bibliotecas.
import torch # Biblioteca para manipular os tensores

def conectaGPU(model, device):
    """
      Conecta um modelo BERT a GPU.

      Parâmetros:
        `model` - Um modelo BERT carregado.       
        `device` - Um device de GPU.     
    
      Retorno:
        `model` - Um objeto model BERT conectado a GPU.     
    """
    # Associa a GPU ao modelo.
    model.to(device)

    # Se existe GPU disponível.
    if torch.cuda.is_available():    
        # Diga ao pytorch para rodar este modelo na GPU.
        logging.info("Pytorch rodando o modelo na GPU.")
        model.cuda()
        
    else:
        logging.info("Pytorch rodando sem GPU.")

    return model

Memória

Memória disponível no ambiente

In [None]:
# Import das bibliotecas.
from psutil import virtual_memory

ram_gb = virtual_memory().total / 1e9
logging.info("Seu ambiente de execução tem {: .1f} gigabytes de RAM disponível\n".format(ram_gb))

if ram_gb < 20:
  logging.info("Para habilitar um tempo de execução de RAM alta, selecione menu o ambiente de execução> \"Alterar tipo de tempo de execução\"")
  logging.info("e selecione High-RAM. Então, execute novamente está célula")
else:
  logging.info("Você está usando um ambiente de execução de memória RAM alta!")

INFO:root:Seu ambiente de execução tem  13.6 gigabytes de RAM disponível

INFO:root:Para habilitar um tempo de execução de RAM alta, selecione menu o ambiente de execução> "Alterar tipo de tempo de execução"
INFO:root:e selecione High-RAM. Então, execute novamente está célula


## 1.6 Monta uma pasta no google drive para carregar os arquivos de dados.



In [None]:
# Monta o Google Drive para esta instância de notebook.
from google.colab import drive

drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


## 1.7 Instalação do wandb

Instalação

In [None]:
!pip install --upgrade wandb

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


Login via linha de comando

In [None]:
!wandb login aded3bc0ea651fff536cc08ba69caf8ac4141cfd

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


## 1.8 Instalação BERT da Hugging Face

Instala a interface pytorch para o BERT by Hugging Face. 

In [None]:
!pip install -U transformers==4.5.1

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


# 2 Parametrização

## Gerais

In [None]:
# Prefixo do nome do arquivo usado nas saídas projeto C = Cris, SB = SmartBatch, KF = KFold
NOME_BASE_SAIDA = "AjusteFinoCohQuADCoInen_C_SB_KF_v1"

# Definição dos parâmetros a serem avaliados

######## Parâmetros Individuais ########

# Quantidade de documentos a serem perturbados a partir do original. Usar 1, 20 ou 100.   
DOCUMENTOS_PERTURBADOS = 100 # Conjunto de valores: 1, 20 ou 100.

# Quantidade de palavras a serem recuperadas mais próximas da máscara. 
TOP_K_PREDICAO = 100 # Conjunto de valores: 1, 20 ou 100.

# Tamanho dos lotes de treino e avaliação. Usar 16 ou 32
TAMANHO_LOTE = 23

######## Parâmetros de conjunto ########
# Taxas de aprendizagem a serem avaliadas
TAXAS_DE_APRENDIZAGEM = [1e-5, 2e-5, 3e-5, 4e-5, 5e-5]

# MCLs a serem avaliados
#NOMES_MODELO = ['https://neuralmind-ai.s3.us-east-2.amazonaws.com/nlp/bert-base-portuguese-cased/bert-base-portuguese-cased_pytorch_checkpoint.zip',
#                'https://neuralmind-ai.s3.us-east-2.amazonaws.com/nlp/bert-large-portuguese-cased/bert-large-portuguese-cased_pytorch_checkpoint.zip',
#                'bert-base-multilingual-cased']

NOMES_MODELO = ["bert-large-cased"]

######## Parâmetros de intervalo ########
# Número de épocas a serem avaliadas
# Todas as épocas são avaliadas e os resultados da classificação são salvos de 0 até 4.
# A época 0 avalia o modelo sem realizar ajuste fino.
EPOCAS = 4

# Determina o intervalo de folds(Kfold=10m inicio_fold=1 e fim_fold=0) a serem avaliados. 
inicio_fold = 1
fim_fold = 10

## Específicos

Parâmetros do treinamento

In [None]:
# Importando as bibliotecas.
from transformers import TrainingArguments

# Definição dos parâmetros de Treinamento
training_args = TrainingArguments(    
    # NOME_BASE_SAIDA = Nome base do arquivo de saída
    # P = documentos perturbados
    # K = previsões palavras 
    # E = número total de épocas de treinamento
    # e = número da época executada
    # lr = taxa de aprendizagem
    # b = lotes de treino e avaliação    
    # f = número do fold
    output_dir = NOME_BASE_SAIDA + "K_1_P_1_E_4_e_1_lr_5_b_8_4_f", # É utilizado somente para logs de arquivo e wandb   
    save_steps = 0,    
    seed = 42,
    num_train_epochs = EPOCAS, # Intervalo de valores: 2, 3, 4. É utilizado somente para logs.
    learning_rate = 5e-5, # Intervalo de valores: 1e-5, 2e-5, 3e-5, 4e-5, 5e-5. É utilizado somente para logs.
    gradient_accumulation_steps = 1,
    per_device_train_batch_size = TAMANHO_LOTE, 
    per_device_eval_batch_size = TAMANHO_LOTE,        
    evaluation_strategy = 'epoch',    
)

Parâmetros do modelo

In [None]:
# Definição dos parâmetros do Modelo.
model_args = ModeloArgumentosClassificacao(     
    max_seq_len = 512,
    
    pretrained_model_name_or_path = "bert-large-cased",
    #pretrained_model_name_or_path = "bert-base-cased"
    #pretrained_model_name_or_path = "neuralmind/bert-large-portuguese-cased",
    #pretrained_model_name_or_path = "neuralmind/bert-base-portuguese-cased",    
    #pretrained_model_name_or_path = "bert-base-multilingual-cased",
    #pretrained_model_name_or_path = "bert-base-multilingual-uncased",

    do_lower_case = False, # default True
    num_labels = 2,
    output_attentions = False, # default False
    output_hidden_states = False, # default False 
    optimizer = 'AdamW',
    use_wandb = True, # Ativa a gravação de logs no wandb
    salvar_modelo_wandb = False, # Ativa o salvamento do MCL no wandb
    salvar_modelo = False, # Ativa o salvamento do MCL no googledrive
    salvar_avaliacao = True, # Salva o resultado classificações
    salvar_classificacao = True, # Salva o resultado da avaliação das classificações
    usar_mcl_ajustado = False, # Especifica se deve ser carregado um MCL ajustado ou pré-treinado. Necessário especificar o tipo do modelo em pretrained_model_name_or_path. 
    documentos_perturbados = DOCUMENTOS_PERTURBADOS, # Quantidade de documentos a serem perturbados a partir do original.    
    top_k_predicao = TOP_K_PREDICAO, # Conjunto de valores: 1, 10, 100, 500 e 1000. Quantidade de palavras a serem recuperadas mais próximas da máscara. 
    fold = 10 # Intervalo de valores: 1 a 10, É utilizado somente para logs. Use as variáveis do bloco a seguir para definir um intervalo dos folds
)

## Define o caminho para os arquivos de dados

In [None]:
# Diretório do cohebert
DIRETORIO_COHEBERT = "COHQUAD_COIN_EN"

## Define o caminho para os arquivos de dados

In [None]:
# Diretório local para os arquivos pré-processados
DIRETORIO_LOCAL = "/content/" + DIRETORIO_COHEBERT + "/"

# Diretório no google drive com os arquivos pré-processados
DIRETORIO_DRIVE = "/content/drive/MyDrive/Colab Notebooks/Data/" + DIRETORIO_COHEBERT + "/"

## Inicialização diretórios

Diretório base local

In [None]:
# Importando as bibliotecas.
import os

def criaDiretorioLocal():

  # Cria o diretório para receber os arquivos Originais e Permutados
  # Diretório a ser criado
  dirbase = DIRETORIO_LOCAL[:-1]

  if not os.path.exists(dirbase):  
      # Cria o diretório
      os.makedirs(dirbase)    
      logging.info("Diretório criado: {}.".format(dirbase))
  else:    
      logging.info("Diretório já existe: {}.".format(dirbase))

In [None]:
criaDiretorioLocal()

INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN.


Diretório para conter as os resultados das classificações

In [None]:
# Import de bibliotecas.
import os

def criaDiretorioClassificacao():
  DIRETORIO_BASE = DIRETORIO_DRIVE + "/validacao_classificacao_palavra"

  # Verifica se o diretório existe
  if not os.path.exists(DIRETORIO_BASE):  
    # Cria o diretório
    os.makedirs(DIRETORIO_BASE)
    logging.info("Diretório criado: {}.".format(DIRETORIO_BASE))
  else:
    logging.info("Diretório já existe: {}.".format(DIRETORIO_BASE))

In [None]:
criaDiretorioClassificacao()

INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN//validacao_classificacao_palavra.


Diretório para conter os arquivos da avaliação kfold

In [None]:
# Import de bibliotecas.
import os

def criaDiretorioClassificacaoKfold():
  DIRETORIO_BASE = DIRETORIO_DRIVE + "validacao_classificacao_palavra/kfold"

  # Verifica se o diretório existe
  if not os.path.exists(DIRETORIO_BASE):  
    # Cria o diretório
    os.makedirs(DIRETORIO_BASE)
    logging.info("Diretório criado: {}.".format(DIRETORIO_BASE))
  else:
    logging.info("Diretório já existe: {}.".format(DIRETORIO_BASE))

In [None]:
criaDiretorioClassificacaoKfold()

INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold.


Diretório para conter os arquivos de classificação da avaliação kfold

In [None]:
# Import de bibliotecas.
import os

def criaDiretorioClassificacaoKfoldClassificacao():

  DIRETORIO_BASE = DIRETORIO_DRIVE + "validacao_classificacao_palavra/kfold/Classificacao"

  # Verifica se o diretório existe
  if not os.path.exists(DIRETORIO_BASE):  
    # Cria o diretório
    os.makedirs(DIRETORIO_BASE)
    logging.info("Diretório criado: {}.".format(DIRETORIO_BASE))
  else:
    logging.info("Diretório já existe: {}.".format(DIRETORIO_BASE))

In [None]:
criaDiretorioClassificacaoKfoldClassificacao()

INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao.


Diretório para conter os arquivos de resultado da avaliação kfold

In [None]:
# Import de bibliotecas.
import os

def criaDiretorioClassificacaoKfoldAvaliacao():

  DIRETORIO_BASE = DIRETORIO_DRIVE + "validacao_classificacao_palavra/kfold/Avaliacao"

  # Verifica se o diretório existe
  if not os.path.exists(DIRETORIO_BASE):  
    # Cria o diretório
    os.makedirs(DIRETORIO_BASE)
    logging.info("Diretório criado: {}.".format(DIRETORIO_BASE))
  else:
    logging.info("Diretório já existe: {}.".format(DIRETORIO_BASE))

In [None]:
criaDiretorioClassificacaoKfoldAvaliacao()

INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao.


# 3 BERT

## 3.1 Modelo Pré-treinado BERT

### Funções Auxiliares

In [None]:
def getNomeModeloBERT(model_args):
    '''    
    Recupera uma string com uma descrição do modelo BERT para nomes de arquivos e diretórios.
    
    Parâmetros:
    `model_args` - Objeto com os argumentos do modelo.       
    
    Retorno:
    `MODELO_BERT` - Nome do modelo BERT.
    '''

    # Verifica o nome do modelo(default SEM_MODELO_BERT)
    MODELO_BERT = "SEM_MODELO_BERT"
    
    if 'neuralmind' in model_args.pretrained_model_name_or_path:
        MODELO_BERT = "_BERTimbau"        
    else:
        if 'multilingual' in model_args.pretrained_model_name_or_path:
            MODELO_BERT = "_BERTmultilingual"
        else:
            if 'bert' in model_args.pretrained_model_name_or_path:
                MODELO_BERT = "_BERT"  
            
    return MODELO_BERT

In [None]:
def getTamanhoBERT(model_args):
    '''    
    Recupera uma string com o tamanho(dimensão) do modelo BERT para nomes de arquivos e diretórios.
    
    Parâmetros:
    `model_args` - Objeto com os argumentos do modelo.       
    
    Retorno:
    `TAMANHO_BERT` - Nome do tamanho do modelo BERT.
    '''
    
    # Verifica o tamanho do modelo(default large)
    TAMANHO_BERT = "_large"
    
    if 'base' in model_args.pretrained_model_name_or_path:
        TAMANHO_BERT = "_base"
        
    return TAMANHO_BERT  

### Função download Modelo Pre-treinado BERT

In [None]:
# Import das bibliotecas.
import zipfile # Biblioteca para descompactar
import shutil # iblioteca de manipulação arquivos de alto nível

def downloadModeloPretreinado(model_args):
    """
      Realiza o download do modelo BERT(MODELO) e retorna o diretório onde o modelo BERT(MODELO) foi descompactado.
    
      Parâmetros:
        `model_args` - Objeto com os argumentos do modelo.
    
      Retorno:
        `DIRETORIO_MODELO` - Diretório de download do modelo.
    """ 
    
    # Nome diretório base modelo BERT
    NOME_DIRETORIO_BASE_MODELO = "modeloBERT"
    
    # Verifica se existe o diretório base do cohebert e retorna o nome do diretório
    DIRETORIO_COHEBERT = verificaDiretorioCoheBERT()
    
    # Recupera o nome ou caminho do modelo
    MODELO = model_args.pretrained_model_name_or_path

    # Variável para setar o arquivo.
    URL_MODELO = None

    if "http" in MODELO:
        URL_MODELO = MODELO

    # Se a variável foi setada.
    if URL_MODELO:

        # Diretório do modelo.
        DIRETORIO_MODELO = DIRETORIO_COHEBERT + "/" + NOME_DIRETORIO_BASE_MODELO
        
        # Recupera o nome do arquivo do modelo da url.
        NOME_ARQUIVO = URL_MODELO.split("/")[-1]

        # Nome do arquivo do vocabulário.
        ARQUIVO_VOCAB = "vocab.txt"
        
        # Caminho do arquivo na url.
        CAMINHO_ARQUIVO = URL_MODELO[0:len(URL_MODELO)-len(NOME_ARQUIVO)]

        # Verifica se o diretório de descompactação existe no diretório corrente
        if os.path.exists(DIRETORIO_MODELO):
            logging.info("Apagando diretório existente do modelo.")
            # Apaga o diretório e os arquivos existentes                     
            shutil.rmtree(DIRETORIO_MODELO)
        
        # Realiza o download do arquivo do modelo        
        downloadArquivo(URL_MODELO, NOME_ARQUIVO)

        # Descompacta o arquivo no diretório de descompactação.                
        arquivo_zip = zipfile.ZipFile(NOME_ARQUIVO, "r")
        arquivo_zip.extractall(DIRETORIO_MODELO)

        # Baixa o arquivo do vocabulário.
        # O vocabulário não está no arquivo compactado acima, mesma url mas arquivo diferente.
        URL_MODELO_VOCAB = CAMINHO_ARQUIVO + ARQUIVO_VOCAB
        # Coloca o arquivo do vocabulário no diretório do modelo.        
        downloadArquivo(URL_MODELO_VOCAB, DIRETORIO_MODELO + "/" + ARQUIVO_VOCAB)
        
        # Apaga o arquivo compactado
        os.remove(NOME_ARQUIVO)

        del arquivo_zip

        logging.info("Diretório {} do modelo BERT pronta.".format(DIRETORIO_MODELO))

    else:
        DIRETORIO_MODELO = MODELO
        logging.info("Variável URL_MODELO não setada.")

    return DIRETORIO_MODELO

### Copia o modelo do BERT ajustado

In [None]:
# Import das bibliotecas.
import shutil # iblioteca de manipulação arquivos de alto nível

def copiaModeloAjustado(model_args):
    """ 
      Copia o modelo ajustado BERT do GoogleDrive para o projeto.
    
      Parâmetros:
        `model_args` - Objeto com os argumentos do modelo.
    
      Retorno:
        `DIRETORIO_LOCAL_MODELO_AJUSTADO` - Diretório de download ajustado do modelo.
    """

    # Verifica o nome do modelo BERT a ser utilizado
    MODELO_BERT = getNomeModeloBERT(model_args)

    # Verifica o tamanho do modelo(default large)
    TAMANHO_BERT = getTamanhoBERT(model_args)

    # Verifica se existe o diretório base do cohebert e retorna o nome do diretório
    DIRETORIO_COHEBERT = verificaDiretorioCoheBERT()

    # Diretório local de salvamento do modelo.
    DIRETORIO_LOCAL_MODELO_AJUSTADO = DIRETORIO_COHEBERT + "/modelo_ajustado/"

    # Diretório remoto de salvamento do modelo no google drive.
    DIRETORIO_REMOTO_MODELO_AJUSTADO = "/content/drive/MyDrive/Colab Notebooks/Data/" + DIRETORIO_COHEBERT + "/validacao_classificacao_palavra/holdout/modelo/" + MODELO_BERT + TAMANHO_BERT

    # Copia o arquivo do modelo para o diretório no Google Drive.
    shutil.copytree(DIRETORIO_REMOTO_MODELO_AJUSTADO, DIRETORIO_LOCAL_MODELO_AJUSTADO) 
   
    logging.info("Modelo BERT ajustado copiado!")

    return DIRETORIO_LOCAL_MODELO_AJUSTADO

### Verifica de onde utilizar o modelo do BERT

In [None]:
def verificaModelo(model_args):
    """ 
    Verifica de onde utilizar o modelo.
    
    Parâmetros:
    `model_args` - Objeto com os argumentos do modelo.
    
    Retorno:
    `DIRETORIO_MODELO` - Diretório de download do modelo.
    """ 

    DIRETORIO_MODELO = None
    
    if model_args.usar_mcl_ajustado == True:        
        # Diretório do modelo
        DIRETORIO_MODELO = copiaModeloAjustado()
        
        logging.info("Usando modelo BERT ajustado.")
        
    else:
        DIRETORIO_MODELO = downloadModeloPretreinado(model_args)
        logging.info("Usando modelo BERT pré-treinado.")        
        
    return DIRETORIO_MODELO

## 3.2 Tokenizador BERT

### Função carrega Tokenizador BERT

O tokenizador utiliza WordPiece, veja em [artigo original](https://arxiv.org/pdf/1609.08144.pdf).



In [None]:
# Import das bibliotecas.
from transformers import BertTokenizer # Importando as bibliotecas do tokenizador BERT.

def carregaTokenizadorModeloPretreinado(DIRETORIO_MODELO, model_args):
    """
      Carrega o tokenizador do DIRETORIO_MODELO.
      O tokenizador utiliza WordPiece.
      Carregando o tokenizador do diretório "./modelo/" do diretório padrão se variável `DIRETORIO_MODELO` setada.
      Caso contrário carrega da comunidade
      Por default(`do_lower_case=True`) todas as letras são colocadas para minúsculas. Para ignorar a conversão para minúsculo use o parâmetro `do_lower_case=False`. Esta opção também considera as letras acentuadas(ãçéí...), que são necessárias a língua portuguesa.
      O parâmetro `do_lower_case` interfere na quantidade tokens a ser gerado a partir de um texto. Quando igual a `False` reduz a quantidade de tokens gerados.
    
      Parâmetros:
        `DIRETORIO_MODELO` - Diretório a ser utilizado pelo modelo BERT.           
        `model_args` - Objeto com os argumentos do modelo.       
    
      Retorno:
        `tokenizer` - Tokenizador BERT.
    """

    tokenizer = None
    
    # Se a variável DIRETORIO_MODELO foi setada.
    if DIRETORIO_MODELO:
        # Carregando o Tokenizador.
        logging.info("Carregando o tokenizador BERT do diretório {}.".format(DIRETORIO_MODELO))

        tokenizer = BertTokenizer.from_pretrained(DIRETORIO_MODELO, do_lower_case=model_args.do_lower_case)

    else:
        # Carregando o Tokenizador da comunidade.
        logging.info("Carregando o tokenizador BERT da comunidade.")

        tokenizer = BertTokenizer.from_pretrained(model_args.pretrained_model_name_or_path, do_lower_case=model_args.do_lower_case)

    return tokenizer

## 3.3 Carrega o modelo e tokenizador BERT

Lista de modelos da comunidade:
* https://huggingface.co/models

Português(https://github.com/neuralmind-ai/portuguese-bert):  
* **"neuralmind/bert-base-portuguese-cased"**
* **"neuralmind/bert-large-portuguese-cased"**

A implementação do huggingface pytorch inclui um conjunto de interfaces projetadas para uma variedade de tarefas de PNL. Embora essas interfaces sejam todas construídas sobre um modelo treinado de BERT, cada uma possui diferentes camadas superiores e tipos de saída projetados para acomodar suas tarefas específicas de PNL.

### Função carrega modelo BERT medida




In [None]:
# Import das bibliotecas.
from transformers import BertModel # Importando as bibliotecas do Modelo BERT.

def carregaModeloMedida(DIRETORIO_MODELO, model_args):
    """
      Carrega o modelo e retorna o modelo.
    
      Parâmetros:
        `DIRETORIO_MODELO` - Diretório a ser utilizado pelo modelo BERT.           
        `model_args` - Objeto com os argumentos do modelo.   
    
      Retorno:
        `model` - Um objeto do modelo BERT carregado.
    """

    # Variável para setar o arquivo.
    URL_MODELO = None

    if "http" in model_args.pretrained_model_name_or_path:
        URL_MODELO = model_args.pretrained_model_name_or_path

    # Se a variável URL_MODELO foi setada
    if URL_MODELO:        
        # Carregando o Modelo BERT
        logging.info("Carregando o modelo BERT do diretório {} para cálculo de medidas.".format(DIRETORIO_MODELO))

        model = BertModel.from_pretrained(DIRETORIO_MODELO,
                                          output_attentions=model_args.output_attentions,
                                          output_hidden_states=model_args.output_hidden_states)
        
    else:
        # Carregando o Modelo BERT da comunidade
        logging.info("Carregando o modelo BERT da comunidade {} para cálculo de medidas.".format(model_args.pretrained_model_name_or_path))

        model = BertModel.from_pretrained(model_args.pretrained_model_name_or_path,
                                          output_attentions=model_args.output_attentions,
                                          output_hidden_states=model_args.output_hidden_states)

    return model

### Função carrega modelo BERT classificação



In [None]:
# Import das bibliotecas.
from transformers import BertForSequenceClassification # Importando as bibliotecas do Modelo BERT.

def carregaModeloClassifica(DIRETORIO_MODELO, model_args):
    ''' 
    Carrega o modelo e retorna o modelo.
    
    Parâmetros:
    `DIRETORIO_MODELO` - Diretório a ser utilizado pelo modelo BERT.           
    `model_args` - Objeto com os argumentos do modelo.
    
    Retorno:
    `model` - Um objeto do modelo BERT carregado.
    ''' 

    # Variável para setar o arquivo.
    URL_MODELO = None

    if 'http' in model_args.pretrained_model_name_or_path:
        URL_MODELO = model_args.pretrained_model_name_or_path

    # Se a variável URL_MODELO foi setada
    if URL_MODELO:
        # Carregando o Modelo BERT
        logging.info("Carregando o modelo BERT do diretório {} para classificação.".format(DIRETORIO_MODELO))

        model = BertForSequenceClassification.from_pretrained(DIRETORIO_MODELO, 
                                                              num_labels=model_args.num_labels,
                                                              output_attentions=model_args.output_attentions,
                                                              output_hidden_states=model_args.output_hidden_states)
            
    else:
        # Carregando o Modelo BERT da comunidade
        logging.info("Carregando o modelo BERT da comunidade {} para classificação.".format(model_args.pretrained_model_name_or_path))

        model = BertForSequenceClassification.from_pretrained(model_args.pretrained_model_name_or_path,
                                                              num_labels=model_args.num_labels,
                                                              output_attentions=model_args.output_attentions,
                                                              output_hidden_states=model_args.output_hidden_states)
    return model

### Função carrega o BERT

In [None]:
def carregaBERT(model_args):
    """ 
      Carrega o BERT para cálculo de medida ou classificação e retorna o modelo e o tokenizador.
      O tipo do model retornado pode ser BertModel ou BertForSequenceClassification, depende do tipo de model_args.
    
      Parâmetros:
        `model_args` - Objeto com os argumentos do modelo.       
          - Se model_args = ModeloArgumentosClassificacao deve ser carregado o BERT para classificação(BertForSequenceClassification).
          - Se model_args = ModeloArgumentosMedida deve ser carregado o BERT para cálculo de medida(BertModel).

      Retorno:    
        `model` - Um objeto do modelo BERT carregado.       
        `tokenizer` - Um objeto tokenizador BERT carregado.       
    """
            
    # Verifica a origem do modelo
    DIRETORIO_MODELO = verificaModelo(model_args)
    
    # Variável para conter o modelo
    model = None
    
    # Verifica o tipo do modelo em model_args    
    if type(model_args) == ModeloArgumentosMedida:
        # Carrega o modelo para cálculo da medida
        model = carregaModeloMedida(DIRETORIO_MODELO, model_args)
        
    else:
        # Carrega o modelo para classificação
        model = carregaModeloClassifica(DIRETORIO_MODELO, model_args)
        
        # Recupera o dispositivo da GPU 
        device = getDeviceGPU()
    
        # Conecta o modelo a GPU
        model = conectaGPU(model, device)
                       
    # Carrega o tokenizador. 
    # O tokenizador é o mesmo para o classificador e medidor.
    tokenizer = carregaTokenizadorModeloPretreinado(DIRETORIO_MODELO, model_args)
    
    return model, tokenizer

### Recupera detalhes do BERT

In [None]:
# Verifica o nome do modelo BERT a ser utilizado
MODELO_BERT = getNomeModeloBERT(model_args)

# Verifica o tamanho do modelo(default large)
TAMANHO_BERT = getTamanhoBERT(model_args)

# 4 Treino

## 4.1 Wandb

https://wandb.ai/osmar-braz/AjusteFinoCohebert_C_SB_KF_v1/table?workspace=user-osmar-braz



### Função de inicialização wandb

In [None]:
# Importando a biblioteca.
import wandb

def inicializacaoWandb():

  if model_args.use_wandb:

    #Login via linha de comando
    !wandb login aded3bc0ea651fff536cc08ba69caf8ac4141cfd

    # Inicializando o registro do experimento.
    # Na execução só pode existir de um init  para que não gere dois registros no wandb.
    # O projeto no wandb recebe o nome base mais o número de um fold especifico.
    wandb.init(project=NOME_BASE_SAIDA, name=training_args.output_dir + str(model_args.fold))
    
    # Atualiza os parâmetros do modelo no wandb.
    wandb.config.update(model_args)
    # Atualiza os parâmetros de treinamento no wandb.
    wandb.config.update(training_args)
    wandb.config.dataset = DIRETORIO_COHEBERT
    wandb.config.batch_size = training_args.per_device_train_batch_size
    
    # Registra os parämetros não literais do model_args.    
    wandb.log({"max_seq_len": model_args.max_seq_len})
    wandb.log({"do_lower_case": model_args.do_lower_case})
    wandb.log({"output_hidden_states": model_args.output_hidden_states})
  
    return wandb

## 4.2 Carregamento dos arquivos de dados kfold

### Especifica os nomes dos arquivos de dados



In [None]:
# Nome do arquivo
NOME_ARQUIVO_FOLD_COMPACTADO = DIRETORIO_COHEBERT + "_KFOLD_10" + "_P" +  str(model_args.documentos_perturbados) + "_K" + str(model_args.top_k_predicao) + ".zip"

### Copia os arquivos do Google Drive para o Colaboratory

In [None]:
def copiaArquivoFold():
  
  # Se estiver executando no Google Colaboratory
  if IN_COLAB:

    criaDiretorioLocal()
    
    !cp "$DIRETORIO_DRIVE""/validacao_classificacao_palavra/kfold/""$NOME_ARQUIVO_FOLD_COMPACTADO" "$DIRETORIO_LOCAL"
      
    logging.info("Terminei a cópia.")

In [None]:
copiaArquivoFold()

INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN.
INFO:root:Terminei a cópia.


Descompacta os arquivos

Usa o unzip para descompactar:
*   `-o` sobrescreve o arquivo se existir
*   `-j` Não cria nenhum diretório
*   `-q` Desliga as mensagens 
*   `-d` Diretório de destino


In [None]:
def descompactaArquivoFold():
  
  # Se estiver executando no Google Colaboratory
  if IN_COLAB:
    !unzip -o -j -q "$DIRETORIO_LOCAL$NOME_ARQUIVO_FOLD_COMPACTADO" -d "/content/validacao_kfold"

    logging.info("Terminei a descompactação.")

In [None]:
descompactaArquivoFold()

INFO:root:Terminei a descompactação.


### 4.2.4 Função de carregamento dos dados de um fold

In [None]:
# Import das bibliotecas.
import pandas as pd

def carregamentoDadosFold(fold):

  logging.info("Carregando os arquivos do fold de treino e avaliação.")
  
  # Diretório dos arquivos de dados.
  DIRETORIO = "/content/validacao_kfold"

  # Define o prefixo do nome dos arquivos dos folds
  PREFIXO_NOME_ARQUIVO_TREINO = DIRETORIO_COHEBERT + "_Train_f"
  PREFIXO_NOME_ARQUIVO_TESTE = DIRETORIO_COHEBERT + "_Test_f"

  # Nome dos arquivos.
  ARQUIVO_TREINO = DIRETORIO + "/" + PREFIXO_NOME_ARQUIVO_TREINO + str(fold) + ".csv"
  ARQUIVO_TESTE = DIRETORIO + "/" + PREFIXO_NOME_ARQUIVO_TESTE + str(fold) + ".csv" 

  logging.info("Carregando arquivo de treino: {}.".format(ARQUIVO_TREINO))
  logging.info("Carregando arquivo de teste: {}.".format(ARQUIVO_TESTE))

  # Verifica se o arquivo existe
  if not os.path.isfile(ARQUIVO_TREINO):
      # Caso contrário copia o arquivo do drive e descompacta
      copiaArquivoFold()
      descompactaArquivoFold()

  # Carrega o conjunto de dados de treino e teste.
  df_dados_train = pd.read_csv(ARQUIVO_TREINO, sep=';')  
  df_dados_test = pd.read_csv(ARQUIVO_TESTE, sep=';')  
  #logging.info("Qtde de dados de treino: {} e teste {}.".format(len(df_dados_train), len(df_dados_test)))

  return df_dados_train, df_dados_test

## 4.3 Análise

### Função descarte documentos muito grandes

In [None]:
def descarteDocumentosGrandes(tokenizer, 
                              tamanho_maximo_token, 
                              df_dados_train, 
                              df_dados_test):

  logging.info("Descartando documentos grandes dos conjuntos de dados.")

  # Define o tamanho máximo para os tokens.
  tamanho_maximo = tamanho_maximo_token

  # Tokenize a codifica as setenças para o BERT.     
  df_dados_train["input_ids"] = df_dados_train["documento"].apply(lambda tokens: tokenizer.encode(tokens, add_special_tokens=True))
        
  df_dados_train = df_dados_train[df_dados_train["input_ids"].apply(len)<tamanho_maximo]

  # Remove as colunas desnecessárias.
  df_dados_train = df_dados_train.drop(columns=["input_ids"])

  # Tokenize a codifica as setenças para o BERT.     
  df_dados_test["input_ids"] = df_dados_test["documento"].apply(lambda tokens: tokenizer.encode(tokens, add_special_tokens=True))

  # Corta os inputs para o tamanho máximo 512.
  df_dados_test = df_dados_test[df_dados_test["input_ids"].apply(len)<tamanho_maximo]

  #logging.info("Tamanho do conjunto de dados: {} / Treino: {} / Teste: {}.".format((len(df_dados_train)+len(df_dados_test)),len(df_dados_train), len(df_dados_test)))
    
  # Remove as colunas desnecessárias.
  df_dados_test = df_dados_test.drop(columns=["input_ids"])

  del tokenizer
  del tamanho_maximo

  return df_dados_train, df_dados_test

## 4.4 Treinando o modelo de classificação

### Otimizador e Agendador de Taxas de Aprendizado/Optimizer & Learning Rate Scheduler



Agora que temos nosso modelo carregado, precisamos pegar os hiperparâmetros de treinamento no modelo armazenado.

Para fins de ajuste fino, os autores recomendam escolher entre os seguintes valores (no Apêndice A.3 do [artigo BERT](https://arxiv.org/pdf/1810.04805.pdf)):

> - **Tamanho do lote(Batch size):** 16, 32
- **Taxa de aprendizado (Adam):** 5e-5, 3e-5, 2e-5
- **Número de épocas:** 2, 3, 4

O parâmetro epsilon `eps = 1e-6` é" um número muito pequeno para impedir qualquer divisão por zero na implementação "(a partir de [aqui](https://machinelearningmastery.com/adam-optimization-algorithm-for-deep-learning/)).

Você pode encontrar a criação do otimizador do AdamW em `run_glue.py` [aqui](https://github.com/huggingface/transformers/blob/5bfcd0485ece086ebcbed2d008813037968a9e58/examples/run_glue.py#L109).

### Função carrega otimizador


In [None]:
# Import das bibliotecas.
from transformers import AdamW

def carregaOtimizador(training_args, model):
  '''
    Esta função carrega o otimizador utilizado no agendador de aprendizado.
  '''

  # Nota: AdamW é uma classe da biblioteca huggingface (ao contrário de pytorch).
  # Eu acredito que o 'W' significa 'Correção de redução de peso "
  optimizer = AdamW(model.parameters(),
                  lr = training_args.learning_rate, # (ou alfa) A taxa de aprendizado a ser usada. - default é 3e-5
                  # betas = (0.9, 0.999), # (beta1, beta2) - default é (0.9, 0.999)
                    # beta1 é taxa de decaimento exponencial para as estimativas do primeiro momento. 
                    # beta2 é taxa de decaimento exponencial para as estimativas do segundo momento. Este valor deve ser definido próximo a 1,0 em problemas com gradiente esparso (por exemplo, PNL e problemas de visão de computacional)
                  # eps = 1e-6, #  É um número muito pequeno para evitar qualquer divisão por zero na implementação - default é 1e-6.
                  # weight_decay = 0.0, # Correção de redução de peso. - default é 0.0
                    # A redução da taxa de aprendizagem também pode ser usada com Adam. A taxa de decaimento é atualizada a cada época para a demonstração da regressão logística.
                  # correct_bias = True #  Se não deve corrigir o viés(bias) no Adam mudar para False.- default é True
                )
  
  return optimizer

### Função carrega agendador

A função **get_linear_schedule_with_warmup** cria um agendador com uma taxa de aprendizado que diminua linearmente da taxa de aprendizagem inicial definido no otimizador até 0, após um período de aquecimento durante o qual ele aumenta linearmente de 0 para a taxa de aprendizagem inicial definido no otimizador.

Se `num_warmup_steps=0` e `weight_decay=0`(otimizador) não ocorre a etapa de aquecimento.

In [None]:
# Import das bibliotecas.
from transformers import get_linear_schedule_with_warmup

def carregaAgendador(training_args, optimizer, numero_etapas):
  '''
    Esta função carrega o agendador com um taxa de aprendizado que diminua linearmente até 0.
  '''

  # O número total de etapas de ajuste fino é [número de lotes] x [número de épocas].
  # (Observe que este não é o mesmo que o número de amostras de ajuste fino).
  total_etapas = numero_etapas * training_args.num_train_epochs

  #Cria o agendador de taxa de aprendizagem.
  scheduler = get_linear_schedule_with_warmup(optimizer, # O otimizador para o qual agendar a taxa de aprendizado.
                                            num_warmup_steps = 0, # O número de etapas para a fase de aquecimento. Valor default value em run_glue.py
                                            num_training_steps = total_etapas) # O número total de etapas de treinamento.


  logging.info("Total de etapas: {}".format(total_etapas))

  return scheduler

### Função cria lotes inteligentes

In [None]:
# Import das bibliotecas.
from tqdm.notebook import tqdm as tqdm_notebook
import random

def criarLotesInteligentes(tokenizer,
                           documentos, 
                           classes, 
                           id_documentos, 
                           batch_size):
    '''
    Esta função combina todos os passos para preparar os lotes.
    '''
    logging.info("Criando Lotes Inteligentes de {:,} amostras com tamanho de lote {:,}...".format(len(documentos), batch_size))

    # ============================
    #   Tokenização & Truncamento
    # ============================

    input_ids_completos = []
    
    # Tokeniza todas as amostras de treinamento
    logging.info("Tokenizando {:,} amostra...".format(len(classes)))
    
    # Escolha o intervalo que o progresso será atualizado.
    intervalo_atualizacao = obterIntervaloAtualizacao(total_iteracoes=len(classes), numero_atualizacoes=10)
    
    # Barra de progresso dos documentos
    documentos_bar = tqdm_notebook(documentos, desc=f'Documentos ', unit=f'documento', total=len(documentos))

    # Para cada amostra de treinamento...
    for documento in documentos_bar:
    
        # Relatório de progresso
        #if ((len(input_ids_completos) % intervalo_atualizacao) == 0):
        #    logging.info("  Tokenizado {:,} amostras.".format(len(input_ids_completos)))

        # Tokeniza a amostra.
        input_ids = tokenizer.encode(text=documento,                    # Documento a ser codificado.
                                    add_special_tokens=True,            # Adiciona os ttokens especiais.
                                    max_length=model_args.max_seq_len,  # Tamanho do truncamento!
                                    truncation=True,                    # Faz o truncamento!
                                    padding=False)                      # Não preenche.
                
        # Adicione o resultado tokenizado à nossa lista.
        input_ids_completos.append(input_ids)

        del input_ids
    
    del documentos    
    
    logging.info("{:>10,} amostras tokenizadas.".format(len(input_ids_completos)))

    # =========================
    #      Seleciona os Lotes
    # =========================    
    
    # Classifique as duas listas pelo comprimento da sequência de entrada.
    amostras = sorted(zip(input_ids_completos, classes, id_documentos), key=lambda x: len(x[0]))

    del input_ids_completos
    del classes
    del id_documentos

    logging.info("{:>10,} amostras após classificação.".format(len(amostras)))

    # Lista de lotes que iremos construir.
    batch_ordered_documentos = []
    batch_ordered_classes = []
    batch_ordered_id_documentos = []

    logging.info("Criando lotes de tamanho {:}...".format(batch_size))

    # Escolha um intervalo no qual imprimir atualizações de progresso.
    intervalo_atualizacao = obterIntervaloAtualizacao(total_iteracoes=len(amostras), numero_atualizacoes=10)
        
    # Faça um loop em todas as amostras de entrada ... 
    while len(amostras) > 0:
        
        # Mostra o progresso.
        if ((len(batch_ordered_documentos) % intervalo_atualizacao) == 0 \
            and not len(batch_ordered_documentos) == 0):
            logging.info("  Selecionado {:,} lotes.".format(len(batch_ordered_documentos)))
        
        # `to_take` é o tamanho real do nosso lote. Será `batch_size` até
        # chegamos ao último lote, que pode ser menor.
        to_take = min(batch_size, len(amostras))
        
        # Escolha um índice aleatório na lista de amostras restantes para começar o nosso lote.
        select = random.randint(0, len(amostras) - to_take)

        # Selecione um lote contíguo de amostras começando em `select`.
        #print ("Selecionando lote de {:} a {:}".format(select, select+to_take))
        batch = amostras[select:(select + to_take)]

        #print("Tamanho do lote:", len(batch))
        
        # Cada amostra é uma tupla --divida para criar uma lista separada de
        # sequências e uma lista de rótulos para este lote.
        batch_ordered_documentos.append([s[0] for s in batch])
        batch_ordered_classes.append([s[1] for s in batch])
        batch_ordered_id_documentos.append([s[2] for s in batch])
        
        # Remova a amostra da lista
        del amostras[select:select + to_take]

    logging.info("  FEITO - Selecionado {:,} lotes.".format(len(batch_ordered_documentos)))

    # =========================
    #        Adicionando o preenchimento
    # =========================    

    logging.info("Preenchendo sequências dentro de cada lote...")

    py_input_ids = []
    py_attention_masks = []
    py_labels = []
    list_id_documentos = []

    # Para cada lote...
    for (batch_input_ids, batch_labels, batch_id_documentos) in zip(batch_ordered_documentos, batch_ordered_classes, batch_ordered_id_documentos):

        # Nova versão do lote, desta vez com sequências preenchidas e agora com
        # as máscaras de atenção definidas.
        batch_padded_input_ids = []
        batch_attention_masks = []
                
        # Primeiro, encontre a amostra mais longa do lote.
        # Observe que as sequências atualmente incluem os tokens especiais!
        max_size = max([len(input) for input in batch_input_ids])
        
        # Para cada entrada neste lote...
        for input in batch_input_ids:
                        
            # Quantos tokens pad precisam ser adicionados
            num_pads = max_size - len(input)

            # Adiciona `num_pads` do pad token(tokenizer.pad_token_id) até o final da sequência.
            padded_input = input + [tokenizer.pad_token_id] * num_pads

            # Define a máscara de atenção --é apenas um `1` para cada token real
            # e um `0` para cada token de preenchimento(pad).
            attention_mask = [1] * len(input) + [0] * num_pads
            
            # Adiciona o resultado preenchido ao lote.
            batch_padded_input_ids.append(padded_input)
            batch_attention_masks.append(attention_mask)

            del padded_input
            del attention_mask
        
        # Nosso lote foi preenchido, portanto, precisamos salvar este lote atualizado.
        # Também precisamos que as entradas sejam tensores PyTorch, então faremos isso aqui.
        py_input_ids.append(torch.tensor(batch_padded_input_ids))
        py_attention_masks.append(torch.tensor(batch_attention_masks))
        py_labels.append(torch.tensor(batch_labels))
        list_id_documentos.append(batch_id_documentos)
        
        del batch_padded_input_ids
        del batch_attention_masks

    del batch_ordered_documentos
    del batch_ordered_classes
    del batch_ordered_id_documentos
    
    del tokenizer    

    # Retorna o conjunto de dados em lotes inteligentes!
    return (py_input_ids, py_attention_masks, py_labels, list_id_documentos)

### Função de Treinamento

In [None]:
# Import das bibliotecas
import random
import numpy as np
from tqdm.notebook import tqdm as tqdm_notebook

def realizaTreinamento(model, 
                       tokenizer, 
                       optimizer, 
                       scheduler,  
                       documentos_treino, 
                       classes_treino, 
                       id_documentos_treino, 
                       documentos_teste, 
                       classes_teste, 
                       id_documentos_teste, 
                       EPOCAS = 4):
  
  #logging.info("Realizando treinamento e avaliação do fold: {}".format(model_args.fold))

  # Defina o valor da semente em todos os lugares para torná-lo reproduzível.
  seed_val = training_args.seed
  random.seed(seed_val)
  np.random.seed(seed_val)
  torch.manual_seed(seed_val)
  torch.cuda.manual_seed_all(seed_val)

  # Medida do tempo total de treinamento e avaliação.
  treinamento_avaliacao_t0 = time.time()

  # Limpa o cache da GPU.
  torch.cuda.empty_cache()

  # Coloque o modelo em modo de treinamento. 
  model.train()

  # Acumula as perdas do treinamento.
  train_losses = []
  test_losses = []
   
  # Barra de progresso da época.
  epoca_bar = tqdm_notebook(range(0,training_args.num_train_epochs+1), desc=f'Épocas', unit=f'épocas')
  
  # Para cada época.
  for epoca_i in epoca_bar:
  
    # ========================================
    #               Inicialização
    # ========================================

    # Atualiza a época corrente      
    model_args.epoca = epoca_i

    # Atualiza o nome da saída corrente
    training_args.output_dir = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args, model_args)

    # Inicializa o wandb para registro
    # Gera uma entrada para cada todas as epocas, com a taxa de aprendizagem, lote e fold    
    wandb = inicializacaoWandb()
    
    # Log das métidas com wandb.
    if model_args.use_wandb:    
      wandb.watch(model)  

    # Recupera o lote inteligente
    (py_input_ids, py_attention_masks, py_labels, documentoids) = criarLotesInteligentes(tokenizer, 
                                                                                         documentos_treino, 
                                                                                         classes_treino, 
                                                                                         id_documentos_treino, 
                                                                                         training_args.per_device_train_batch_size)
   
    # ========================================
    #               Avaliação época 0, sem treinamento
    # ========================================
    if epoca_i == 0:

      # Registra o tempo inicial.
      avaliacao_epoca_t0 = time.time()
      
      # Realiza a avaliação do modelo.    
      media_test_epoca_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, lista_resultado_avaliacao = realizaAvaliacao(epoca_i, 
                                                                                                                     model, 
                                                                                                                     tokenizer, 
                                                                                                                     optimizer, 
                                                                                                                     scheduler, 
                                                                                                                     wandb, 
                                                                                                                     documentos_teste, 
                                                                                                                     classes_teste, 
                                                                                                                     id_documentos_teste)

      logging.info("   Avaliação loss: {:.8f}; Acc: {:.8f}; Rec: {:.8f}; Pre: {:.8f}, F1:{:.8f}, vp: {:3d}; vn: {:3d}; fp: {:3d}; fn: {:3d}".format(media_test_epoca_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s))      
      logging.info("   Acurácia do fold {} na época {}: {:.8f}.".format(model_args.fold, epoca_i, acc))  

      # Não acura acumula a perda de treinamento da época pois não ocorreu treinamento.
      # test_losses.append(media_test_epoca_loss)

      # Medida de quanto tempo levou a execução da avaliação.
      avaliacao_epoca_total = formataTempo(time.time() - avaliacao_epoca_t0)

      logging.info("   Média perda(loss) do avaliação da época   : {0:.8f}.".format(media_test_epoca_loss))
      logging.info("   Tempo de avaliação da época               : {:}.".format(avaliacao_epoca_total))    
      logging.info("   Tempo parcial do processamento            : {:} (h:mm:ss)".format(formataTempo(time.time()-treinamento_avaliacao_t0)))

      ################# Salva a classificação e avaliação para a época

      # Salva o resultado da classificação da época
      salvaResultadoClassificacao(lista_resultado_avaliacao)

      # Salva o resultado da avaliação da épóca
      treinamento_avaliacao_total_t0 = format(formataTempo(time.time()-treinamento_avaliacao_t0))
      salvaResultadoAvaliacao(media_test_epoca_loss, 
                              acc, 
                              rec, 
                              pre, 
                              f1, 
                              vp_s, 
                              vn_s, 
                              fp_s, 
                              fn_s, 
                              treinamento_avaliacao_total_t0)

      # Log das métricas com wandb.
      if model_args.use_wandb:    
        NOME_EXECUCAO = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args,model_args)
        wandb.log({"nome_execucao": NOME_EXECUCAO[:-2], # -2 para retirar "_f" do fina do nome da execução
                  "acuracia": acc,
                  "vp": vp_s , 
                  "vn": vn_s,  
                  "fp": fp_s,
                  "fn": fn_s, 
                  "media_train_epoca_loss" : 0,
                  "tempo_train" : 0,
                  "media_test_epoca_loss" : media_test_epoca_loss,
                  "tempo_test" : avaliacao_epoca_total})
      
    else:
      # ========================================
      #               Treinamento e Avaliação para as épocas > 0
      # ========================================

      # Execute uma passada completa sobre o conjunto de treinamento.
      logging.info("Realizando treinamento do fold {} na época: {}.".format(model_args.fold, model_args.epoca))

      # Medida de quanto tempo leva o período de treinamento.
      treinamento_epoca_t0 = time.time()

      # Acumula as perdas do treinamento da época.
      train_batch_losses = []

      # Barras de progresso.    
      lote_treino_bar = tqdm_notebook(range(0, len(py_input_ids)), desc=f'Epoca {epoca_i}', unit=f'lotes', total=len(py_input_ids) )

      # Para cada lote dos dados de treinamento.
      for index in lote_treino_bar:      

          # Descompacte este lote de treinamento de nosso dataloader.
          #
          # À medida que descompactamos o lote, também copiaremos cada tensor para a GPU usando o
          # o método `to`
          #
          # `lote` é uma lista contém três tensores pytorch:
          #   [0]: input ids 
          #   [1]: attention masks
          #   [2]: labels 

          # Recupera os tensores do lote e copia para a GPU usando o método `to` 
          d_input_ids = py_input_ids[index].to(device)
          d_input_mask = py_attention_masks[index].to(device)
          d_labels = py_labels[index].to(device)     
          
          # Sempre limpe quaisquer gradientes calculados anteriormente antes de realizar um
          # passe para trás. PyTorch não faz isso automaticamente porque
          # acumular os gradientes é "conveniente durante o treinamento de RNNs".
          # (source: https://stackoverflow.com/questions/48001598/why-do-we-need-to-call-zero-grad-in-pytorch)
          model.zero_grad()

          # Execute um passe para frente (avalie o modelo neste lote de treinamento).
          # A documentação para esta função `model` está aqui:
          # https://huggingface.co/transformers/v2.2.0/model_doc/bert.html#transformers.BertForSequenceClassification
          # Ele retorna diferentes números de parâmetros dependendo de quais argumentos
          # são fornecidos e quais sinalizadores estão definidos. Para nosso uso aqui, ele retorna
          # a perda (porque fornecemos rótulos) e os "logits" - o modelo de saídas antes da ativação.     

          # last_hidden_state = outputs[0], pooler_output = outputs[1], hidden_states = outputs[2]
          outputs = model(d_input_ids, 
                          token_type_ids=None, 
                          attention_mask=d_input_mask, 
                          labels=d_labels)
          
          # A perda(loss) é retornado em outputs[0] porque fornecemos rótulos(labels))                  
          loss = outputs[0]

          # E outputs[1] os "logits" - o modelo de saídas antes da ativação.
          # logits possui duas dimensões, a primeira do lote e a segunda do rótulo da predição                        
          # A função `.detach().cpu()` retira da gpu.
          logits = outputs[1].detach().cpu()
    
          # Acumule a perda de treinamento em todos os lotes da época para que possamos
          # calcular a perda média no final da época. `loss` é um tensor contendo um único valor.   
          # A função `.item ()` retorna apenas o valor Python do tensor.
          train_batch_losses.append(loss.item())

          # Mostra a perda na barra de progresso.
          lote_treino_bar.set_postfix(loss=loss.item())

          # Log das métricas com wandb.
          if model_args.use_wandb:          
            wandb.log({"train_batch_loss": loss.item()})

          # Execute uma passagem para trás para calcular os gradientes.
          # Todos os parâmetros do modelo deve ter sido setado para param.requires_grad = False
          loss.backward()            

          # Corte a norma dos gradientes para 1.0.
          # Isso ajuda a evitar o problema de "gradientes explosivos".
          torch.nn.utils.clip_grad_norm_(model.parameters(), 1.0)
        
          # Atualize os parâmetros e dê um passo usando o gradiente calculado.
          # O otimizador dita a "regra de atualização" - como os parâmetros são
          # modificados com base em seus gradientes, taxa de aprendizagem, etc.
          optimizer.step()
                            
          # Atualize a taxa de aprendizagem.
          scheduler.step()

          # Apaga variáveis não utilizadas
          del outputs

      # Média da perda do treinamento de todos os lotes da época.
      media_train_epoca_loss = np.mean(train_batch_losses)

      # Acumule a perda de treinamento de todas as épocas para calcular a perda média do treinamento.    
      train_losses.append(media_train_epoca_loss)

      # Medida de quanto tempo levou o treinamento desta época.
      treinamento_epoca_total = formataTempo(time.time() - treinamento_epoca_t0)

      logging.info("   Média perda(loss) do treinamento da época : {0:.8f}.".format(media_train_epoca_loss))
      logging.info("   Tempo de treinamento da época             : {:}.".format(treinamento_epoca_total))    
      logging.info("   Tempo parcial processamento               : {:} (h:mm:ss)".format(formataTempo(time.time()-treinamento_avaliacao_t0)))

      ################# Avaliação da época
      
      # Registra o tempo inicial.
      avaliacao_epoca_t0 = time.time()

      # Realiza a avaliação do modelo.    
      media_test_epoca_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, lista_resultado_avaliacao = realizaAvaliacao(epoca_i, model, 
                                                                                                                     tokenizer, 
                                                                                                                     optimizer, 
                                                                                                                     scheduler, 
                                                                                                                     wandb, 
                                                                                                                     documentos_teste, 
                                                                                                                     classes_teste, 
                                                                                                                     id_documentos_teste)

      logging.info("   Avaliação loss: {:.8f}; Acc: {:.8f}; Rec: {:.8f}; Pre: {:.8f}, F1:{:.8f}, vp: {:3d}; vn: {:3d}; fp: {:3d}; fn: {:3d}".format(media_test_epoca_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s))      
      logging.info("   Acurácia do fold {} na época {}: {:.8f}.".format(model_args.fold, epoca_i, acc))  
      
      # Acumule a perda de treinamento da época para calcular a perda média do treinamento.    
      test_losses.append(media_test_epoca_loss)

      # Medida de quanto tempo levou a execução da avaliação
      avaliacao_epoca_total = formataTempo(time.time() - avaliacao_epoca_t0)

      logging.info("   Média perda(loss) do avaliação da época   : {0:.8f}.".format(media_test_epoca_loss))
      logging.info("   Tempo de avaliação da época               : {:}.".format(avaliacao_epoca_total))    
      logging.info("   Tempo parcial do processamento            : {:} (h:mm:ss)".format(formataTempo(time.time()-treinamento_avaliacao_t0)))

      ################# Salva a classificação e avaliação para a época

      # Salva o resultado da classificação da época
      salvaResultadoClassificacao(lista_resultado_avaliacao)

      # Salva o resultado da avaliação da épóca
      treinamento_avaliacao_total_t0 = format(formataTempo(time.time()-treinamento_avaliacao_t0))
      salvaResultadoAvaliacao(media_test_epoca_loss, 
                              acc, 
                              rec, 
                              pre, 
                              f1, 
                              vp_s, 
                              vn_s, 
                              fp_s, 
                              fn_s, 
                              treinamento_avaliacao_total_t0)

      ################# Salva o modelo ajustado no wandb
      salvaModeloWandb(model, model_args)

      ################# Salva o modelo ajustado
      salvaModelo(model, tokenizer, model_args)

      # Apaga variáveis não utilizadas
      del py_input_ids
      del py_attention_masks
      del py_labels
      del train_batch_losses
      del lote_treino_bar

      # Log das métricas com wandb.
      if model_args.use_wandb:    
        NOME_EXECUCAO = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args,model_args)
        wandb.log({"nome_execucao": NOME_EXECUCAO[:-2], # -2 para retirar "_f" do fina do nome da execução
                  "acuracia": acc,
                  "vp": vp_s , 
                  "vn": vn_s,  
                  "fp": fp_s,
                  "fn": fn_s, 
                  "media_train_epoca_loss" : media_train_epoca_loss,
                  "tempo_train" : treinamento_epoca_total,
                  "media_test_epoca_loss" : media_test_epoca_loss,
                  "tempo_test" : avaliacao_epoca_total})
        
    # Finaliza o wandb
    if model_args.use_wandb:
      wandb.finish()  
     
  # Média da perda do treinamento de todas as épocas.
  media_train_loss = np.mean(train_losses)
  media_test_loss = np.mean(test_losses)

  logging.info("  Média perda(loss) treinamento : {0:.8f}.".format(media_train_loss))
  logging.info("  Média perda(loss) avaliação   : {0:.8f}.".format(media_test_loss))

  # Apaga variáveis não utilizadas
  del train_losses
  del epoca_bar
  
  del model
  del tokenizer  
  del documentos_treino
  del classes_treino
  del id_documentos_treino
  del documentos_teste
  del classes_teste
  del id_documentos_teste

## 4.5 Avaliação

Avaliando o modelo treinado no conjunto de dados de teste.

### Função de avaliação

In [None]:
# Import das bibliotecas.
import torch
from tqdm.notebook import tqdm as tqdm_notebook

def realizaAvaliacao(epoca, 
                     model, 
                     tokenizer, 
                     optimizer, 
                     scheduler, 
                     wandb,
                     documentos_teste, 
                     classes_teste, 
                     id_documentos_teste):
   
  # Armazena o resultado da avaliação executada
  lista_resultado_avaliacao = []

  logging.info("Realizando avaliação do fold {} na época: {}.".format(model_args.fold, epoca))

  # Use nossa nova função para preparar completamente nosso conjunto de dados.
  (py_input_ids, py_attention_masks, py_labels, documentosids) = criarLotesInteligentes(tokenizer, documentos_teste, classes_teste, id_documentos_teste, training_args.per_device_eval_batch_size)

  # Coloque o modelo em modo de avaliação.
  model.eval()

  # Acumula as perdas dos testes dos lotes.
  test_batch_losses = []

  # Acumula os resultados dos testes.
  vp = [] # Verdadeiro positivo
  vn = [] # Verdadeiro negativo
  fp = [] # Falso positivo
  fn = [] # Falso negativo

  # Barra de progresso dos lotes de teste.
  lote_teste_bar = tqdm_notebook(range(0, len(py_input_ids)), desc=f'Lotes ', unit=f'lotes', total=len(py_input_ids))

  # Para cada lote dos dados de avaliação(teste).
  for index in lote_teste_bar:

    # Copia o lote para a GPU.
    d_input_ids = py_input_ids[index].to(device)
    d_input_mask = py_attention_masks[index].to(device)
    d_labels = py_labels[index].to(device)
    d_id_documentos = documentosids[index]

    # Diga a pytorch para não se preocupar em construir o gráfico de computação durante
    # o passe para frente, já que isso só é necessário para backprop (treinamento).
    with torch.no_grad():
        # Obtenha a saída de "logits" pelo modelo. Os "logits" são a saída
        # valores antes de aplicar uma função de ativação como o softmax.        
        # Retorno de model quando ´last_hidden_state=True´ é setado:    
        # last_hidden_state = outputs[0], pooler_output = outputs[1], hidden_states = outputs[2]
        outputs = model(d_input_ids,
                        token_type_ids=None, 
                        attention_mask=d_input_mask, 
                        labels=d_labels)
        
    # A perda(loss) é retornado em outputs[0] porque fornecemos rótulos(labels). 
    # É útil para comparar com a perda do treinamento, quando é realizado a avaliação entre as épocas de treinamento.
    loss = outputs[0]

    # E outputs[1] os "logits" - o modelo de saídas antes da ativação.
    # logits possui duas dimensões, a primeira do lote e a segunda do rótulo da predição                        
    logits = outputs[1]
        
    # Acumule a perda da avaliação em todos os lotes para que possamos
    # calcular a perda média no final. `loss` é um tensor contendo um único valor.
    # A função '.cpu()' move loss para a cpu.
    # A função `.item ()` retorna apenas o valor Python do tensor.         
    test_batch_losses.append(loss.cpu().item())

    # Log das métricas com wandb.
    if model_args.use_wandb:
        wandb.log({"test_batch_loss": loss.cpu().item()})

    # Recupera o índice do melhor resultado, maior valor dos tensores para coluna(1)
    _, classificacao = torch.max(logits, 1)

    # Verifica a classificação realizada e o rótulo previsto
    vp.append(((classificacao==1) & (d_labels==1)).sum().cpu().item())
    vn.append(((classificacao==0) & (d_labels==0)).sum().cpu().item())
    fp.append(((classificacao==1) & (d_labels==0)).sum().cpu().item())
    fn.append(((classificacao==0) & (d_labels==1)).sum().cpu().item())

    # Adiciona o documento de teste, o rótulo e a classificação realizada a lista de resultado
    for lote in range(len(d_labels)):
                
      lista_resultado_avaliacao.append([d_id_documentos[lote],
                                        d_labels[lote].cpu().item(), 
                                        classificacao[lote].cpu().item()])

    del outputs
    del d_input_ids
    del d_input_mask
    del d_labels
    del d_id_documentos

  # Soma as classificações realizadas
  vp_s, vn_s, fp_s, fn_s = sum(vp), sum(vn), sum(fp), sum(fn)
  
  # Acurácia indica uma performance geral do modelo. 
  # Dentre todas as classificações, quantas o modelo classificou corretamente(vp=1 e vn=0).
  if (vp_s+vn_s+fp_s+fn_s) != 0:
      acc = (vp_s+vn_s)/(vp_s+vn_s+fp_s+fn_s)
  else:
      acc = 0

  # Recall(Revocação) avalia todas as situações da classe Positivo(vp=1) com o valor esperado e quantas estão corretas.
  if (vp_s+fn_s) != 0:
      rec = (vp_s)/(vp_s+fn_s)
  else:
      rec = 0
  
  # Precisão avalia as classificações da classe positivo(vp=1 e fp=0) que o modelo fez e quantas estão corretas.
  if (vp_s+fp_s) != 0:
      pre = (vp_s)/(vp_s+fp_s)
  else:
      pre = 0  

  # F1 é a média harmônica entre precisão e recall.
  if (pre + rec) != 0:  
    f1 = 2 * ((pre * rec)/(pre + rec))
  else:
    f1 = 0

  # Média da perda da avaliação  
  media_test_epoca_loss = np.mean(test_batch_losses)

  del py_input_ids
  del py_attention_masks
  del py_labels
  del test_batch_losses
  del lote_teste_bar
  
  del model
  del tokenizer
  del documentos_teste
  del classes_teste
  del id_documentos_teste

  return media_test_epoca_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, lista_resultado_avaliacao

### Função que salva o resultado da classificação

In [None]:
def getNomeDiretorioResultados(training_args, model_args):
  
  # Monta o nome do arquivo com parâmetros
  nome_arquivo = ""
  nome_arquivo = nome_arquivo + "P_" + str(model_args.documentos_perturbados)
  nome_arquivo = nome_arquivo + "_K_" + str(model_args.top_k_predicao) 
     
  return nome_arquivo

In [None]:
# Import das bibliotecas.
import os
import datetime

def salvaResultadoClassificacao(lista_resultado_avaliacao):

  if model_args.salvar_classificacao:

    # Recupera a hora do sistema.
    data_e_hora = datetime.datetime.now()
    
    # Nome arquivo resultado
    NOME_ARQUIVO_CLASSIFICACAO = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args, model_args) + str(model_args.fold) + MODELO_BERT + TAMANHO_BERT 
  
    # Diretório para salvar o arquivo.
    DIRETORIO_CLASSIFICACAO_DRIVE = DIRETORIO_DRIVE + "validacao_classificacao_palavra/kfold/Classificacao/" + getNomeDiretorioResultados(training_args, model_args) + "/"

    # Diretório local para salvar o arquivo
    DIRETORIO_CLASSIFICACAO_LOCAL = DIRETORIO_LOCAL + "Classificacao/"

    # Verifica se o diretório existe
    if not os.path.exists(DIRETORIO_CLASSIFICACAO_DRIVE):  
      # Cria o diretório
      os.makedirs(DIRETORIO_CLASSIFICACAO_DRIVE)
      logging.info("Diretório criado: {}.".format(DIRETORIO_CLASSIFICACAO_DRIVE))
    else:
      logging.info("Diretório já existe: {}.".format(DIRETORIO_CLASSIFICACAO_DRIVE))

    # Verifica se o diretório existe
    if not os.path.exists(DIRETORIO_CLASSIFICACAO_LOCAL):  
      # Cria o diretório
      os.makedirs(DIRETORIO_CLASSIFICACAO_LOCAL)
      logging.info("Diretório criado: {}.".format(DIRETORIO_CLASSIFICACAO_LOCAL))
    else:
      logging.info("Diretório já existe: {}.".format(DIRETORIO_CLASSIFICACAO_LOCAL))      

    # Caminho completo do arquivo compactado no drive
    NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO = DIRETORIO_CLASSIFICACAO_DRIVE + NOME_ARQUIVO_CLASSIFICACAO + ".zip"
    # print("NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO:", NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO)

    # Caminho completo do arquivo compactado no local
    NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO = DIRETORIO_CLASSIFICACAO_LOCAL + NOME_ARQUIVO_CLASSIFICACAO + ".zip"
    # print("NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO:", NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO)

    # Caminho completo do arquivo no local
    NOME_ARQUIVO_CLASSIFICACAO_LOCAL = DIRETORIO_CLASSIFICACAO_LOCAL + NOME_ARQUIVO_CLASSIFICACAO + ".csv"
    # print("NOME_ARQUIVO_CLASSIFICACAO_LOCAL:", NOME_ARQUIVO_CLASSIFICACAO_LOCAL)

    # Gera todo o conteúdo a ser salvo no arquivo
    novo_conteudo = ""        
    for resultado in lista_resultado_avaliacao:      
      novo_conteudo = novo_conteudo + data_e_hora.strftime("%d/%m/%Y %H:%M") + ";" + str(resultado[0]) + ";" + str(resultado[1]) + ";" + str(resultado[2]) + "\n"

    # Verifica se o arquivo existe.
    if os.path.isfile(NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO):

      # Copia arquivo da classificação compactado do google drive para o drive local
      !cp "$NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO" "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO"  
      # Descompacta arquivo da classificação compactado no drive local
      !unzip -o -j -q "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO" -d "$DIRETORIO_CLASSIFICACAO_LOCAL"

      logging.info("Atualizando arquivo classificação: {}.".format(NOME_ARQUIVO_CLASSIFICACAO_LOCAL))
      # Abre o arquivo para leitura.
      arquivo = open(NOME_ARQUIVO_CLASSIFICACAO_LOCAL,'r')
      # Leitura de todas as linhas do arquivo.
      conteudo = arquivo.readlines()
      # Conteúdo a ser adicionado.
      conteudo.append(novo_conteudo)

      # Abre novamente o arquivo (escrita).
      arquivo = open(NOME_ARQUIVO_CLASSIFICACAO_LOCAL,'w')
      # escreva o conteúdo criado anteriormente nele.
      arquivo.writelines(conteudo)  
      # Fecha o arquivo.
      arquivo.close()

      # Compacta o arquivo da classificação
      !zip -o -q -j "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO" "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL"
      # Copia o arquivo da classificação compactado para o drive
      !cp "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO" "$NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO"

      del conteudo
      del arquivo
      del lista_resultado_avaliacao
      
    else:
      logging.info("Criando arquivo classificação: {}.".format(NOME_ARQUIVO_CLASSIFICACAO_LOCAL))
      # Abre novamente o arquivo (escrita).
      arquivo = open(NOME_ARQUIVO_CLASSIFICACAO_LOCAL,'w')
      arquivo.writelines('data;id;classe;predicao\n' + novo_conteudo)  # escreva o conteúdo criado anteriormente nele.
      # Fecha o arquivo.
      arquivo.close()

      # Compacta o arquivo da classificação
      !zip -o -q -j "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO" "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL"
      # Copia o arquivo da classificação compactado para o drive
      !cp "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO" "$NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO"

      del arquivo
      del lista_resultado_avaliacao    

### Função que salva o resultado da avaliação

Salva o resultado da avaliação do conjunto de dados de teste do fold especificado.

In [None]:
# Import das bibliotecas.
import os
import datetime

def salvaResultadoAvaliacao(media_test_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, treinamento_total):

  if model_args.salvar_avaliacao:
    
    # Recupera a hora do sistema.
    data_e_hora = datetime.datetime.now()

    # Nome arquivo resultado
    NOME_ARQUIVO_AVALIACAO = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args, model_args) + str(model_args.fold) + MODELO_BERT + TAMANHO_BERT 

    # Diretório para salvar o arquivo.
    DIRETORIO_AVALIACAO = DIRETORIO_DRIVE + "validacao_classificacao_palavra/kfold/Avaliacao/" + getNomeDiretorioResultados(training_args, model_args) + "/"

    # Verifica se o diretório existe
    if not os.path.exists(DIRETORIO_AVALIACAO):  
      # Cria o diretório
      os.makedirs(DIRETORIO_AVALIACAO)
      logging.info("Diretório criado: {}.".format(DIRETORIO_AVALIACAO))
    else:
      logging.info("Diretório já existe: {}.".format(DIRETORIO_AVALIACAO))

    # Nome do arquivo a ser aberto.
    NOME_ARQUIVO_AVALIACAO_COMPLETO = DIRETORIO_AVALIACAO + NOME_ARQUIVO_AVALIACAO + ".csv"

    # Conteúdo a ser adicionado.
    novo_conteudo = NOME_ARQUIVO_AVALIACAO + ";" +  data_e_hora.strftime("%d/%m/%Y %H:%M") + ";"  + treinamento_total + ";"  + str(acc) + ";"  +  str(vp_s) + ";"  +  str(vn_s) + ";" +  str(fp_s) + ";" +  str(fn_s) + "\n"

    # Verifica se o arquivo existe.
    if os.path.isfile(NOME_ARQUIVO_AVALIACAO_COMPLETO):
      logging.info("Atualizando arquivo resultado: {}.".format(NOME_ARQUIVO_AVALIACAO_COMPLETO))
      # Abre o arquivo para leitura.
      arquivo = open(NOME_ARQUIVO_AVALIACAO_COMPLETO,'r')
      # Leitura de todas as linhas do arquivo.
      conteudo = arquivo.readlines()
      # Conteúdo a ser adicionado.
      conteudo.append(novo_conteudo)

      # Abre novamente o arquivo (escrita).
      arquivo = open(NOME_ARQUIVO_AVALIACAO_COMPLETO,'w')
      # escreva o conteúdo criado anteriormente nele.
      arquivo.writelines(conteudo)  
      # Fecha o arquivo.
      arquivo.close()

      del conteudo
      del arquivo

    else:
      logging.info("Criando arquivo resultado: {}.".format(NOME_ARQUIVO_AVALIACAO_COMPLETO))
      # Abre novamente o arquivo (escrita).
      arquivo = open(NOME_ARQUIVO_AVALIACAO_COMPLETO,'w')
      arquivo.writelines('arquivo;data;tempo;acuracia;vp;vn;fp;fn\n' + novo_conteudo)  # escreva o conteúdo criado anteriormente nele.
      # Fecha o arquivo.
      arquivo.close()

      del arquivo

### Função que carrega e calcula a média da acurácia dos folds


In [None]:
# Import das bibliotecas.
import os
import pandas as pd

def carregaResultadoAvaliacao(NOME_ARQUIVO_AVALIACAO):

  NOME_ARQUIVO_EXECUCAO = NOME_ARQUIVO_AVALIACAO + "X" + MODELO_BERT + TAMANHO_BERT

  logging.info("Média dos arquivos: {}".format(NOME_ARQUIVO_EXECUCAO))

  # Diretório para salvar o arquivo.
  DIRETORIO_AVALIACAO = DIRETORIO_DRIVE + "validacao_classificacao_palavra/kfold/Avaliacao/" + getNomeDiretorioResultados(training_args, model_args) + "/"

  # Verifica se o diretório dos resultados existem.
  if os.path.exists(DIRETORIO_AVALIACAO):
    # Acumuladores.
    soma_acuracia = 0
    listaTempo = []
    conta_folds = 0

    # Percorre os arquivos de resultados.
    for f in range(10):  
      # Nome do arquivo a ser aberto.
      NOME_ARQUIVO_AVALIACAO_COMPLETO = DIRETORIO_AVALIACAO + NOME_ARQUIVO_AVALIACAO + str(f+1) + MODELO_BERT + TAMANHO_BERT + ".csv"    
      # Verifica se o arquivo existe.
      if os.path.isfile(NOME_ARQUIVO_AVALIACAO_COMPLETO):
        
        # Carrega os dados do arquivo  
        dados = pd.read_csv(NOME_ARQUIVO_AVALIACAO_COMPLETO, sep=';')
        # Mostra os dados do teste do fold.
        for index, linha in dados.iterrows():
        
          # Cálculo das estatísticas
          acc = (linha['vp']+linha['vn'])/(linha['vp']+linha['vn']+linha['fp']+linha['fn'])
          if (linha['vp']+linha['fn']) != 0:
              rec = (linha['vp'])/(linha['vp']+linha['fn'])
          else:
              rec = 0
          if (linha['vp']+linha['fp']) != 0:
              pre = (linha['vp'])/(linha['vp']+linha['fp'])
          else:  
              pre = 0
          if (pre + rec) != 0:  
              f1 = 2 * ((pre * rec)/(pre + rec))
          else:
              f1 = 0
          qtde_testes = linha['vp']+linha['vn']+linha['fp']+linha['fn']
          logging.info("Arquivo: {}, Data: {}, Tempo: {}, QtdeTeste: {:3d}, Acc: {:.8f}, Rec: {:.8f}, Pre: {:.8f}, F1:{:.8f}, vp: {:4d}; vn: {:4d}; fp: {:4d}; fn: {:4d}".format( 
               linha["arquivo"], linha["data"], linha["tempo"], qtde_testes, acc, rec, pre, f1, linha["vp"], linha["vn"], linha["fp"], linha["fn"]))    
           
          # Guarda o tempo.
          listaTempo.append(str(linha['tempo']))

        # Procura a maior acurácia.
        soma_acuracia = soma_acuracia + dados['acuracia'].max()
        # Conta o número de folds.
        conta_folds = conta_folds + 1

        del dados
    
    # Mostra a soma da acurácia . 
    logging.info("Total acurácia                                       : {:.8f}.".format(soma_acuracia))
    # Mostra a quantidade de folds.
    logging.info("Quantidade de folds                                  : {}.".format(conta_folds))  

    # Calcula a média.
    if conta_folds != 0:
      media = soma_acuracia/conta_folds
      logging.info("A média da acurácia de {:2d} folds é                    : {:.8f}.".format(conta_folds, media))
      logging.info("O tempo gasto na execução do treinamentoa {:2d} folds é : {}.".format(conta_folds, somaTempo(listaTempo)))
      logging.info("A média de tempo de execução de {:2d} folds é           : {}.".format(conta_folds, mediaTempo(listaTempo)))
      
      # Guarda o resultado da execução
      lista_resultado_execucoes.append(NOME_ARQUIVO_EXECUCAO + ";" + str(media) + ";" + str(somaTempo(listaTempo)))

  else:
    logging.info("Diretório com os resultados não encontrado.")
  
  del listaTempo

## 4.6 Salva e copia o modelo ajustado

### Função que salva o modelo ajustado no wandb


In [None]:
def salvaModeloWandb(model, model_args):
  
  # Salvando o Modelo para o wandb
  if model_args.use_wandb and model_args.salvar_modelo_wandb:
  
    # Salva o modelo para o wandb    
    torch.save(model.state_dict(), os.path.join(wandb.run.dir, 'model_dict.pt'))

    logging.info("Modelo salvo no wandb.")

### Função que salva e copia o modelo ajustado

Salva e  modelo e o tokenizador no disco e copia para o google drive.

In [None]:
# Import de bibliotecas.
import os

def salvaModelo(model, tokenizer, model_args):
  
  if model_args.salvar_modelo:

    # Salvando as melhores práticas: se você usar nomes padrão para o modelo, você pode recarregá-lo usando from_pretrained ()

    # Diretório de salvamento do modelo.
    DIRETORIO_LOCAL_MODELO_AJUSTADO = '/content/modelo_ajustado/' + model_args.fold

    # Cria o diretório de saída se necessário.
    if not os.path.exists(DIRETORIO_LOCAL_MODELO_AJUSTADO):
      os.makedirs(DIRETORIO_LOCAL_MODELO_AJUSTADO)

    logging.info("Salvando o modelo para {}.".format(DIRETORIO_LOCAL_MODELO_AJUSTADO))

    # Salve um modelo treinado, configuração e tokenizer usando `save_pretrained ()`.
    # Eles podem então ser recarregados usando `from_pretrained ()`.
    model_to_save = model.module if hasattr(model, 'module') else model  # Cuide do treinamento distribuído/paralelo
    model_to_save.save_pretrained(DIRETORIO_LOCAL_MODELO_AJUSTADO)
    tokenizer.save_pretrained(DIRETORIO_LOCAL_MODELO_AJUSTADO)

    # Boa prática: salve seus argumentos de treinamento junto com o modelo treinado.
    torch.save(model_args, os.path.join (DIRETORIO_LOCAL_MODELO_AJUSTADO, 'mode_args.bin'))
    torch.save(training_args, os.path.join (DIRETORIO_LOCAL_MODELO_AJUSTADO, 'training_args.bin'))

    logging.info("Modelo salvo.")

    # Para salvar seu modelo nas sessões do Colab Notebook, faça o download no seu computador local ou, idealmente, copie-o no seu Google Drive.
    # Copia o arquivo do modelo para o diretório no Google Drive.
    !cp -r '$DIRETORIO_LOCAL_MODELO_AJUSTADO'* '$DIRETORIO_REMOTO_MODELO_AJUSTADO'

    logging.info("Modelo copiado.")


# 5 Execução do treinamento e avaliação 

Gera o sufixo do nome do arquivo de saída com os parâmetros da execução

Exemplo de formado de sufixo.
`K_1_P_1_E_4_e_1_lr_5_b_8_4_f`
  - P = documentos perturbados
  - K = previsões palavras 
  - E = número total de épocas de treinamento
  - e = número da época executada
  - lr = taxa de aprendizagem
  - b = lotes de treino e avaliação  
  - f = número do fold

In [None]:
def getSufixoNomeArquivoSaida(training_args, model_args):

  # Recupera o número inteiro da taxa de aprendizagem
  taxa_inteiro = int(training_args.learning_rate*100000)

  # Monta o nome do arquivo com parâmetros
  nome_arquivo = ""
  nome_arquivo = nome_arquivo + "_P_" + str(model_args.documentos_perturbados) 
  nome_arquivo = nome_arquivo + "_K_" + str(model_args.top_k_predicao) 
  nome_arquivo = nome_arquivo + "_E_" + str(training_args.num_train_epochs)
  nome_arquivo = nome_arquivo + "_e_" + str(model_args.epoca)   
  nome_arquivo = nome_arquivo + "_lr_" + str(taxa_inteiro)  
  nome_arquivo = nome_arquivo + "_b_" + str(training_args.per_device_train_batch_size) 
  nome_arquivo = nome_arquivo + "_" + str( training_args.per_device_eval_batch_size) 
  nome_arquivo = nome_arquivo + "_f" 
   
  return nome_arquivo

## 5.1 Função de treinamento e avaliação de todos os folds

Carrega os folds para serem avaliados

In [None]:
# Import das bibliotecas
from tqdm.notebook import tqdm as tqdm_notebook
import time
import datetime
import gc

def procedimentoTreinamentoAvaliacaoFolds(modelo, taxa_de_aprendizagem):
  
  # Barra de progresso dos folds
  fold_bar = tqdm_notebook(range(inicio_fold, fim_fold+1), desc=f'Folds ', unit=f'fold', total=fim_fold)

  # Percorre todos os folds do intervalo de inicio_fold até fim_fold
  for ifold in fold_bar:

    # Seta o parâmetro do fold
    model_args.fold = ifold

    logging.info("Processamendo do fold: {}.".format(model_args.fold))
    logging.info("   com o modelo: {}".format(modelo))
    logging.info("   até época {} e taxa de aprendizagem {}.".format(training_args.num_train_epochs, taxa_de_aprendizagem))  
    
    # Marca o tempo de início do processamento
    processamento_fold_t0 = time.time()

    # Carregando o modelo   
    model, tokenizer = carregaBERT(model_args)
        
    # Conecta o modelo a GPU
    model = conectaGPU(model, device)

    # Função de carregamento dos dados de um fold
    df_dados_train, df_dados_test = carregamentoDadosFold(model_args.fold)

    # Descartando documentos muito grandes
    df_dados_train, df_dados_test = descarteDocumentosGrandes(tokenizer, model_args.max_seq_len, df_dados_train, df_dados_test)
    
    # Pega as listas de documentos de treino e seus rótulos.
    documentos_treino = df_dados_train.documento.values
    classes_treino = df_dados_train.classe.values
    id_documentos_treino = df_dados_train.id.values

    # Pega as listas de documentos teste e seus rótulos.
    documentos_teste = df_dados_test.documento.values
    classes_teste = df_dados_test.classe.values
    id_documentos_teste = df_dados_test.id.values

    del df_dados_train
    del df_dados_test

    # Mostra o resultado dos dados carregados.
    logging.info("Tamanho do conjunto de dados : {} / Treino: {} / Teste: {}.".format(len(documentos_treino) + len(documentos_teste), len(documentos_treino), len(documentos_teste)))
    
    #################  Treinamento

    # Carrega o otimizador
    optimizer = carregaOtimizador(training_args, model)

    # Carrega o agendador
    scheduler = carregaAgendador(training_args, optimizer, numero_etapas=len(documentos_treino))

    # Registra o tempo inicial.
    treinamento_t0 = time.time()
    
    # Realiza o treinamento.
    realizaTreinamento(model, tokenizer, optimizer, scheduler, 
                       documentos_treino, classes_treino, id_documentos_treino, 
                       documentos_teste, classes_teste, id_documentos_teste, training_args.num_train_epochs)
    
    # Medida de quanto tempo levou a execução do treinamento.
    treinamento_f = time.time()
    treinamento_total = formataTempo(treinamento_f - treinamento_t0)  
    logging.info("  Tempo total treinamento       : {:}.".format(treinamento_total))
    
    #################  Treinamento

    # Apaga os dados
    del documentos_treino
    del classes_treino
    del id_documentos_treino
    
    del documentos_teste
    del classes_teste
    del id_documentos_teste

    del optimizer
    del scheduler
    del model
    del tokenizer

    # Pega o tempo atual menos o tempo do início do processamento.
    processamento_fold_f = time.time()
    processamento_fold_total = formataTempo(processamento_fold_f - processamento_fold_t0)    
    logging.info("  Tempo processamento fold: {:} (h:mm:ss)\n".format(processamento_fold_total))    

    # Chama o coletor de lixo para esvaziar a memória
    gc.collect()    

## 5.2 Execução o procedimento de treinamento e avaliação para todos os parâmetros

In [None]:
# Import das bibliotecas
from tqdm.notebook import tqdm as tqdm_notebook

# Barra de progresso modelos
modelo_bar = tqdm_notebook(enumerate(NOMES_MODELO), desc=f'Modelos ', unit=f'modelo', total=len(NOMES_MODELO))

# Percorre todos os modelos a serem avaliados
for modelo_i, modelo in modelo_bar:

  # Seta o parâmetro do modelo
  model_args.pretrained_model_name_or_path = modelo

  # Barra de progresso das taxas de aprendizagem
  taxa_de_aprendizagem_bar = tqdm_notebook(enumerate(TAXAS_DE_APRENDIZAGEM), desc=f'Taxas de aprendizagem ', unit=f'taxa', total=len(TAXAS_DE_APRENDIZAGEM))

  # Executa o treinamento e avaliação para diversas taxas de aprendizagem
  for taxas_de_aprendizagem_i, taxa_de_aprendizagem in taxa_de_aprendizagem_bar:

    # Atualiza a taxa de aprendizagem da avaliação
    training_args.learning_rate = taxa_de_aprendizagem

    # Marca o tempo de início do processamento dos folds
    processamento_todos_fold_t0 = time.time()

    # Executa o treinamento e avaliacao de todos folds para o modelo e taxa de aprendizagem
    procedimentoTreinamentoAvaliacaoFolds(modelo, taxa_de_aprendizagem)

    # Pega o tempo atual menos o tempo do início do processamento.
    processamento_todos_fold_f = time.time()
    processamento_todos_fold_total = formataTempo(processamento_todos_fold_f - processamento_todos_fold_t0)    
    logging.info("  Tempo processamento de todos os folds: {:} (h:mm:ss)\n".format(processamento_todos_fold_total))    


Modelos :   0%|          | 0/1 [00:00<?, ?modelo/s]

Taxas de aprendizagem :   0%|          | 0/5 [00:00<?, ?taxa/s]

Folds :   0%|          | 0/10 [00:00<?, ?fold/s]

INFO:root:Processamendo do fold: 1.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 1e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are i

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


ERROR:wandb.jupyter:Failed to detect the name of this notebook, you can set it manually with the WANDB_NOTEBOOK_NAME environment variable to enable code saving.
[34m[1mwandb[0m: Currently logged in as: [33mosmar-braz[0m. Use [1m`wandb login --relogin`[0m to force relogin


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 1 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.70784297; Acc: 0.46000000; Rec: 0.76500000; Pre: 0.47515528, F1:0.58620690, vp: 306; vn:  62; fp: 338; fn:  94
INFO:root:   Acurácia do fold 1 na época 0: 0.46000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.70784297.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,█▅▅▅▄▄▅▇▅▄▃▅█▅▅▃▄▆▄▅▅▅▄▁▅▅▄▅▄▅▄▂▄▂▄

0,1
acuracia,0.46
do_lower_case,False
fn,94
fp,338
max_seq_len,512
media_test_epoca_loss,0.70784
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.26671330.
INFO:root:   Tempo de treinamento da época             : 0:00:44.
INFO:root:   Tempo parcial processamento               : 0:01:08 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02225523; Acc: 0.99625000; Rec: 1.00000000; Pre: 0.99255583, F1:0.99626401, vp: 400; vn: 397; fp:   3; fn:   0
INFO:root:   Acurácia do fold 1 na época 1: 0.99625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02225523.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:10 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_1_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▆▁▁▁▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁
train_batch_loss,███▇█▇▇▇▅▃▄▂▂▂▂▆▁▂▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99625
do_lower_case,False
fn,0
fp,3
max_seq_len,512
media_test_epoca_loss,0.02226
media_train_epoca_loss,0.26671
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.03100484.
INFO:root:   Tempo de treinamento da época             : 0:00:41.
INFO:root:   Tempo parcial processamento               : 0:02:03 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01094941; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 1 na época 2: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01094941.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:05 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_1_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.01095
media_train_epoca_loss,0.031
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.06616566.
INFO:root:   Tempo de treinamento da época             : 0:00:44.
INFO:root:   Tempo parcial processamento               : 0:02:59 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00836082; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 1 na época 3: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00836082.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:01 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_1_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▃▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00836
media_train_epoca_loss,0.06617
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.05099170.
INFO:root:   Tempo de treinamento da época             : 0:00:59.
INFO:root:   Tempo parcial processamento               : 0:04:12 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01039820; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 1 na época 4: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01039820.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:04:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_1_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▃▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.0104
media_train_epoca_loss,0.05099
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


INFO:root:  Média perda(loss) treinamento : 0.10371888.
INFO:root:  Média perda(loss) avaliação   : 0.01299091.
INFO:root:  Tempo total treinamento       : 0:04:42.
INFO:root:  Tempo processamento fold: 0:05:03 (h:mm:ss)

INFO:root:Processamendo do fold: 2.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 1e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 2 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69744084; Acc: 0.49375000; Rec: 0.03500000; Pre: 0.42424242, F1:0.06466513, vp:  14; vn: 381; fp:  19; fn: 386
INFO:root:   Acurácia do fold 2 na época 0: 0.49375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69744084.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:09 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▃█▄▆▅▅▄▄▄▄▃▃▄▂▃▆▄▄▅▄▃▅▄▄▅▄▅▄▄▁▂▅▆▄

0,1
acuracia,0.49375
do_lower_case,False
fn,386
fp,19
max_seq_len,512
media_test_epoca_loss,0.69744
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.39877464.
INFO:root:   Tempo de treinamento da época             : 0:00:43.
INFO:root:   Tempo parcial processamento               : 0:01:05 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02522015; Acc: 0.99500000; Rec: 1.00000000; Pre: 0.99009901, F1:0.99502488, vp: 400; vn: 396; fp:   4; fn:   0
INFO:root:   Acurácia do fold 2 na época 1: 0.99500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02522015.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:08 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_1_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▅▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▆▁
train_batch_loss,▃▃▃▃▄▃▂▃▂▆▂▃▁▁▁▆▁▁▁▂▁▄▁▁▂▁▆▁▁█▂▁▁▁▁▁▂▂▁▁

0,1
acuracia,0.995
do_lower_case,False
fn,0
fp,4
max_seq_len,512
media_test_epoca_loss,0.02522
media_train_epoca_loss,0.39877
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.05856358.
INFO:root:   Tempo de treinamento da época             : 0:00:43.
INFO:root:   Tempo parcial processamento               : 0:02:03 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01866428; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 2 na época 2: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01866428.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:05 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_1_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▆▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▂▁▁▁▁▁▆▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▄▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01866
media_train_epoca_loss,0.05856
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.05293263.
INFO:root:   Tempo de treinamento da época             : 0:00:45.
INFO:root:   Tempo parcial processamento               : 0:03:02 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01626781; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 2 na época 3: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01626781.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:04 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_1_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▃▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01627
media_train_epoca_loss,0.05293
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01054596.
INFO:root:   Tempo de treinamento da época             : 0:01:00.
INFO:root:   Tempo parcial processamento               : 0:04:17 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01698695; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 2 na época 4: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01698695.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:04:20 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_1_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▆▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁
train_batch_loss,▁▁▁▁▁▁▇▁▁▁▇▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01699
media_train_epoca_loss,0.01055
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


INFO:root:  Média perda(loss) treinamento : 0.13020420.
INFO:root:  Média perda(loss) avaliação   : 0.01928480.
INFO:root:  Tempo total treinamento       : 0:04:47.
INFO:root:  Tempo processamento fold: 0:05:01 (h:mm:ss)

INFO:root:Processamendo do fold: 3.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 1e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 3 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69699712; Acc: 0.49875000; Rec: 0.02750000; Pre: 0.47826087, F1:0.05200946, vp:  11; vn: 388; fp:  12; fn: 389
INFO:root:   Acurácia do fold 3 na época 0: 0.49875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69699712.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:11 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▂▃▄▄▃█▄▃▅▂▂▃▃▃▃▄▅▃▃▄▄▄▃▃▃▃▄▄▃▁▂▂▆▁

0,1
acuracia,0.49875
do_lower_case,False
fn,389
fp,12
max_seq_len,512
media_test_epoca_loss,0.697
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.32033444.
INFO:root:   Tempo de treinamento da época             : 0:00:45.
INFO:root:   Tempo parcial processamento               : 0:01:10 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.12563801; Acc: 0.98000000; Rec: 1.00000000; Pre: 0.96153846, F1:0.98039216, vp: 400; vn: 384; fp:  16; fn:   0
INFO:root:   Acurácia do fold 3 na época 1: 0.98000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.12563801.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:12 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_1_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▄▁▁▁▁▁▃▁█▁▁▇▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▆▅▆▅▅▅▃▆▃▆▃▄▂▂▁▃▁█▁▆▁▅█▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁

0,1
acuracia,0.98
do_lower_case,False
fn,0
fp,16
max_seq_len,512
media_test_epoca_loss,0.12564
media_train_epoca_loss,0.32033
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.06048017.
INFO:root:   Tempo de treinamento da época             : 0:00:44.
INFO:root:   Tempo parcial processamento               : 0:02:10 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.04038218; Acc: 0.97500000; Rec: 0.95250000; Pre: 0.99738220, F1:0.97442455, vp: 381; vn: 399; fp:   1; fn:  19
INFO:root:   Acurácia do fold 3 na época 2: 0.97500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.04038218.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:12 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_1_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▃▄▁▁▇█▁▁▁▁▁▁▁▇▃▁▁▁▁▁▁▂▁▁▁▁▁▃▂▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▂▁█▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.975
do_lower_case,False
fn,19
fp,1
max_seq_len,512
media_test_epoca_loss,0.04038
media_train_epoca_loss,0.06048
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.02388577.
INFO:root:   Tempo de treinamento da época             : 0:00:46.
INFO:root:   Tempo parcial processamento               : 0:03:13 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00860421; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 3 na época 3: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00860421.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_1_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.0086
media_train_epoca_loss,0.02389
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.03013542.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:04:33 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00955814; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 3 na época 4: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00955814.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:36 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_1_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▅▁▁▁▅▁▁▁▁▁▁▁▆▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▆

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00956
media_train_epoca_loss,0.03014
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


INFO:root:  Média perda(loss) treinamento : 0.10870895.
INFO:root:  Média perda(loss) avaliação   : 0.04604563.
INFO:root:  Tempo total treinamento       : 0:05:02.
INFO:root:  Tempo processamento fold: 0:05:16 (h:mm:ss)

INFO:root:Processamendo do fold: 4.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 1e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 4 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69861526; Acc: 0.49750000; Rec: 0.02250000; Pre: 0.45000000, F1:0.04285714, vp:   9; vn: 389; fp:  11; fn: 391
INFO:root:   Acurácia do fold 4 na época 0: 0.49750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69861526.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:11 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▁▃▅▄▇▁▅▃▃▄▂▃▆▄▄▃▄▆▄▃▄▂▄▅▅▄▅▄▅▄▃▁▄█▅

0,1
acuracia,0.4975
do_lower_case,False
fn,391
fp,11
max_seq_len,512
media_test_epoca_loss,0.69862
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.38919546.
INFO:root:   Tempo de treinamento da época             : 0:00:46.
INFO:root:   Tempo parcial processamento               : 0:01:12 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01039971; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 4 na época 1: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01039971.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_1_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▃▃▃▃▄▃▂▃▂▆▂▁▁▁▁▅▁█▅▂▁▂▁▁▃▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.0104
media_train_epoca_loss,0.3892
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.04652569.
INFO:root:   Tempo de treinamento da época             : 0:00:45.
INFO:root:   Tempo parcial processamento               : 0:02:13 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02905170; Acc: 0.99125000; Rec: 1.00000000; Pre: 0.98280098, F1:0.99132590, vp: 400; vn: 393; fp:   7; fn:   0
INFO:root:   Acurácia do fold 4 na época 2: 0.99125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02905170.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:15 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_1_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▁▁▁▁▁▁▁▁▁▅▁▁▁▁▁▁▁▁█▁▁▆▁▁▁▁▁▁▁▁▁▁▆▁
train_batch_loss,▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99125
do_lower_case,False
fn,0
fp,7
max_seq_len,512
media_test_epoca_loss,0.02905
media_train_epoca_loss,0.04653
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01625592.
INFO:root:   Tempo de treinamento da época             : 0:00:46.
INFO:root:   Tempo parcial processamento               : 0:03:16 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01950742; Acc: 0.99625000; Rec: 1.00000000; Pre: 0.99255583, F1:0.99626401, vp: 400; vn: 397; fp:   3; fn:   0
INFO:root:   Acurácia do fold 4 na época 3: 0.99625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01950742.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:18 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_1_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▁▁▁▁▁▁▁▁▁▁▅▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▇▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99625
do_lower_case,False
fn,0
fp,3
max_seq_len,512
media_test_epoca_loss,0.01951
media_train_epoca_loss,0.01626
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01032148.
INFO:root:   Tempo de treinamento da época             : 0:01:07.
INFO:root:   Tempo parcial processamento               : 0:04:40 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00867906; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 4 na época 4: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00867906.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:43 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_1_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁█▁▁▇▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00868
media_train_epoca_loss,0.01032
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


INFO:root:  Média perda(loss) treinamento : 0.11557464.
INFO:root:  Média perda(loss) avaliação   : 0.01690947.
INFO:root:  Tempo total treinamento       : 0:05:07.
INFO:root:  Tempo processamento fold: 0:05:21 (h:mm:ss)

INFO:root:Processamendo do fold: 5.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 1e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 5 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69835621; Acc: 0.49125000; Rec: 0.02500000; Pre: 0.37037037, F1:0.04683841, vp:  10; vn: 383; fp:  17; fn: 390
INFO:root:   Acurácia do fold 5 na época 0: 0.49125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69835621.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:12 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▂▄▅█▄▆▃▄▆▁▃▃▄▂▂▇▇▄▅▃▅▆▃▂▅▃▅▅▅▁▂▂█▄

0,1
acuracia,0.49125
do_lower_case,False
fn,390
fp,17
max_seq_len,512
media_test_epoca_loss,0.69836
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.40965336.
INFO:root:   Tempo de treinamento da época             : 0:00:45.
INFO:root:   Tempo parcial processamento               : 0:01:12 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.10203178; Acc: 0.96875000; Rec: 1.00000000; Pre: 0.94117647, F1:0.96969697, vp: 400; vn: 375; fp:  25; fn:   0
INFO:root:   Acurácia do fold 5 na época 1: 0.96875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.10203178.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_1_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁█▃▁▁▁▇▁▂▁▁▂▁▁▁▁▁▁▁▁▁▃▃▁▁▁▁▁▁▂▁▄
train_batch_loss,▃▃▃▃▃▃▂▃▁▅▁▃▁▁▁▆▁▁▂▃▁▅▁▁▁▁▁▁█▁▁▁▁▁▁▁▃▁▁▁

0,1
acuracia,0.96875
do_lower_case,False
fn,0
fp,25
max_seq_len,512
media_test_epoca_loss,0.10203
media_train_epoca_loss,0.40965
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.06587725.
INFO:root:   Tempo de treinamento da época             : 0:00:48.
INFO:root:   Tempo parcial processamento               : 0:02:17 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.04378838; Acc: 0.99125000; Rec: 1.00000000; Pre: 0.98280098, F1:0.99132590, vp: 400; vn: 393; fp:   7; fn:   0
INFO:root:   Acurácia do fold 5 na época 2: 0.99125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.04378838.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:19 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_1_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁█▁▁▇▁▁▁▁▁▁▁▁▅█▁▁▁▁▁▁▁▁▁▁▁▆▁▁▁▁▁▃
train_batch_loss,▁▁▁▁▁▁▂█▃▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99125
do_lower_case,False
fn,0
fp,7
max_seq_len,512
media_test_epoca_loss,0.04379
media_train_epoca_loss,0.06588
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.03544875.
INFO:root:   Tempo de treinamento da época             : 0:00:46.
INFO:root:   Tempo parcial processamento               : 0:03:19 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01569937; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 5 na época 3: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01569937.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:21 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_1_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▇▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▃▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.0157
media_train_epoca_loss,0.03545
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01992664.
INFO:root:   Tempo de treinamento da época             : 0:01:05.
INFO:root:   Tempo parcial processamento               : 0:04:42 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01539918; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 5 na época 4: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01539918.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:45 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_1_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁█▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.0154
media_train_epoca_loss,0.01993
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


INFO:root:  Média perda(loss) treinamento : 0.13272650.
INFO:root:  Média perda(loss) avaliação   : 0.04422968.
INFO:root:  Tempo total treinamento       : 0:05:11.
INFO:root:  Tempo processamento fold: 0:05:25 (h:mm:ss)

INFO:root:Processamendo do fold: 6.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 1e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 6 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69707560; Acc: 0.49250000; Rec: 0.02250000; Pre: 0.37500000, F1:0.04245283, vp:   9; vn: 385; fp:  15; fn: 391
INFO:root:   Acurácia do fold 6 na época 0: 0.49250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69707560.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:12 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▄█▅▇▅▅▅▅▆▂▄▅▅▆▄█▆▅▆▄▄▆▆▆▆▅▄▆▄▄▁▄▇▅

0,1
acuracia,0.4925
do_lower_case,False
fn,391
fp,15
max_seq_len,512
media_test_epoca_loss,0.69708
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.32556870.
INFO:root:   Tempo de treinamento da época             : 0:00:46.
INFO:root:   Tempo parcial processamento               : 0:01:12 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.04767839; Acc: 0.98375000; Rec: 1.00000000; Pre: 0.96852300, F1:0.98400984, vp: 400; vn: 387; fp:  13; fn:   0
INFO:root:   Acurácia do fold 6 na época 1: 0.98375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.04767839.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_1_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▄▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▃▃▃▃▃▃▂▃▁▄▁▂▁▁▁▄▁▂▁▂▁█▁▁▁▁▁▁▁▁▂▁▁▁▁▁▃▁▁▁

0,1
acuracia,0.98375
do_lower_case,False
fn,0
fp,13
max_seq_len,512
media_test_epoca_loss,0.04768
media_train_epoca_loss,0.32557
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.10768279.
INFO:root:   Tempo de treinamento da época             : 0:00:47.
INFO:root:   Tempo parcial processamento               : 0:02:15 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00147576; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 6 na época 2: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00147576.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:17 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_1_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▄▁▃▂▁▂▂▁▂▁▁▁▃▁▁▂▁▂▁▁▁▁▁▁▁▁▁▁█▁▁▂▁▁▃
train_batch_loss,▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00148
media_train_epoca_loss,0.10768
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.02407244.
INFO:root:   Tempo de treinamento da época             : 0:00:49.
INFO:root:   Tempo parcial processamento               : 0:03:20 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00101694; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 6 na época 3: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00101694.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:22 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_1_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▆▇▆▂▂▂▂▂▆▂▂▅█▂▁▂▃▂▃▁▂▂▂▂▄▂▂▁▂▆▆▅▄▃▃
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00102
media_train_epoca_loss,0.02407
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01018215.
INFO:root:   Tempo de treinamento da época             : 0:01:08.
INFO:root:   Tempo parcial processamento               : 0:04:47 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00084120; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 6 na época 4: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00084120.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:50 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_1_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▇▄▁▇█▂▃▂▄▁▁▃▁▄▃▂▃▁▂▆▁▁▆▄▃▂▂▁▁▁▂▂▄▃▃
train_batch_loss,▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00084
media_train_epoca_loss,0.01018
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


INFO:root:  Média perda(loss) treinamento : 0.11687652.
INFO:root:  Média perda(loss) avaliação   : 0.01275307.
INFO:root:  Tempo total treinamento       : 0:05:14.
INFO:root:  Tempo processamento fold: 0:05:28 (h:mm:ss)

INFO:root:Processamendo do fold: 7.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 1e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 7 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69773722; Acc: 0.49250000; Rec: 0.03000000; Pre: 0.40000000, F1:0.05581395, vp:  12; vn: 382; fp:  18; fn: 388
INFO:root:   Acurácia do fold 7 na época 0: 0.49250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69773722.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:12 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▁▄█▄▇▆▅▅▄▅▁▃▃▄▄▂██▅▅▄▃▄▆▅▄▄▅▂▂▂▂▇▇▅

0,1
acuracia,0.4925
do_lower_case,False
fn,388
fp,18
max_seq_len,512
media_test_epoca_loss,0.69774
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.30678413.
INFO:root:   Tempo de treinamento da época             : 0:00:49.
INFO:root:   Tempo parcial processamento               : 0:01:17 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.05708327; Acc: 0.98625000; Rec: 1.00000000; Pre: 0.97323601, F1:0.98643650, vp: 400; vn: 389; fp:  11; fn:   0
INFO:root:   Acurácia do fold 7 na época 1: 0.98625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.05708327.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:19 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_1_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▃▁▁▁▁▁▁▂▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▄█
train_batch_loss,▃▃▃▃▃▃▂▂▁▁▁▁▁▁▁▅▁█▁▄▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁

0,1
acuracia,0.98625
do_lower_case,False
fn,0
fp,11
max_seq_len,512
media_test_epoca_loss,0.05708
media_train_epoca_loss,0.30678
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01902886.
INFO:root:   Tempo de treinamento da época             : 0:00:48.
INFO:root:   Tempo parcial processamento               : 0:02:22 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00963129; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 7 na época 2: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00963129.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:25 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_1_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁
train_batch_loss,▄▃▁▁▁▁▂▂▁▁▁▁▁▁▂▂▁▁▁▁▂▂▁▂▂▁▆█▂▂▇▁▁▂▁▁▃▃▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00963
media_train_epoca_loss,0.01903
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.00913929.
INFO:root:   Tempo de treinamento da época             : 0:00:48.
INFO:root:   Tempo parcial processamento               : 0:03:29 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01002205; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 7 na época 3: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01002205.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:31 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_1_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▃▃▅▁▁█▁▁▁▁▁▂▁▃▄▂▂▁▂▂▁▂▁▁▁▃▁▁▁▁▁▁▃▃▂▃▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.01002
media_train_epoca_loss,0.00914
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.00888604.
INFO:root:   Tempo de treinamento da época             : 0:01:09.
INFO:root:   Tempo parcial processamento               : 0:04:54 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01193627; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 7 na época 4: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01193627.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:57 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_1_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.01194
media_train_epoca_loss,0.00889
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


INFO:root:  Média perda(loss) treinamento : 0.08595958.
INFO:root:  Média perda(loss) avaliação   : 0.02216822.
INFO:root:  Tempo total treinamento       : 0:05:24.
INFO:root:  Tempo processamento fold: 0:05:38 (h:mm:ss)

INFO:root:Processamendo do fold: 8.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 1e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 8 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69595567; Acc: 0.49750000; Rec: 0.02000000; Pre: 0.44444444, F1:0.03827751, vp:   8; vn: 390; fp:  10; fn: 392
INFO:root:   Acurácia do fold 8 na época 0: 0.49750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69595567.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:12 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▅█▅▇▄▅▃▅▄▅▄▄▄▅▅▇▄▅▅▅▅▄▄▅▅▆▅▅▃▁▂▃█▅

0,1
acuracia,0.4975
do_lower_case,False
fn,392
fp,10
max_seq_len,512
media_test_epoca_loss,0.69596
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.43443481.
INFO:root:   Tempo de treinamento da época             : 0:00:48.
INFO:root:   Tempo parcial processamento               : 0:01:14 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.28483931; Acc: 0.92750000; Rec: 0.86750000; Pre: 0.98579545, F1:0.92287234, vp: 347; vn: 395; fp:   5; fn:  53
INFO:root:   Acurácia do fold 8 na época 1: 0.92750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.28483931.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:16 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_1_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▂▄▁▂▁▁▁▁▁▁█▁▁▂▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▄▄▄▄▄▄▃▄▂█▂▄▂▂▂▅▂█▂▂▁▅▂▂▅▄▂▁▄▄▁▁▁▁▂▁▄▄▁▁

0,1
acuracia,0.9275
do_lower_case,False
fn,53
fp,5
max_seq_len,512
media_test_epoca_loss,0.28484
media_train_epoca_loss,0.43443
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.07017976.
INFO:root:   Tempo de treinamento da época             : 0:00:50.
INFO:root:   Tempo parcial processamento               : 0:02:20 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01674831; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 8 na época 2: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01674831.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:23 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_1_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁
train_batch_loss,▂▁▁▂▁▁▂▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01675
media_train_epoca_loss,0.07018
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.02096673.
INFO:root:   Tempo de treinamento da época             : 0:00:50.
INFO:root:   Tempo parcial processamento               : 0:03:29 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02041034; Acc: 0.99625000; Rec: 1.00000000; Pre: 0.99255583, F1:0.99626401, vp: 400; vn: 397; fp:   3; fn:   0
INFO:root:   Acurácia do fold 8 na época 3: 0.99625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02041034.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:31 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_1_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▇▁▁▁▁▆▁▁▁▁▁▁▁▁▁█▁
train_batch_loss,▁▁▁▁▁▄▁▁▁▁▁▁▁▁▅▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99625
do_lower_case,False
fn,0
fp,3
max_seq_len,512
media_test_epoca_loss,0.02041
media_train_epoca_loss,0.02097
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.04422891.
INFO:root:   Tempo de treinamento da época             : 0:01:11.
INFO:root:   Tempo parcial processamento               : 0:04:58 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01635286; Acc: 0.99625000; Rec: 1.00000000; Pre: 0.99255583, F1:0.99626401, vp: 400; vn: 397; fp:   3; fn:   0
INFO:root:   Acurácia do fold 8 na época 4: 0.99625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01635286.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:05:02 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_1_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▇█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▄▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▆▁▁▁▁▁▅

0,1
acuracia,0.99625
do_lower_case,False
fn,0
fp,3
max_seq_len,512
media_test_epoca_loss,0.01635
media_train_epoca_loss,0.04423
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


INFO:root:  Média perda(loss) treinamento : 0.14245255.
INFO:root:  Média perda(loss) avaliação   : 0.08458770.
INFO:root:  Tempo total treinamento       : 0:05:26.
INFO:root:  Tempo processamento fold: 0:05:41 (h:mm:ss)

INFO:root:Processamendo do fold: 9.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 1e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 9 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69937896; Acc: 0.48625000; Rec: 0.02750000; Pre: 0.33333333, F1:0.05080831, vp:  11; vn: 378; fp:  22; fn: 389
INFO:root:   Acurácia do fold 9 na época 0: 0.48625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69937896.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:12 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▅█▅▆▅▄▄▃▄▄▄▅▄▄▄▅▅▅▄▄▄▄▄▄▃▄▅▃▅▁▃▅▆▃

0,1
acuracia,0.48625
do_lower_case,False
fn,389
fp,22
max_seq_len,512
media_test_epoca_loss,0.69938
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.43010583.
INFO:root:   Tempo de treinamento da época             : 0:00:51.
INFO:root:   Tempo parcial processamento               : 0:01:19 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.53299223; Acc: 0.91500000; Rec: 0.83750000; Pre: 0.99112426, F1:0.90785908, vp: 335; vn: 397; fp:   3; fn:  65
INFO:root:   Acurácia do fold 9 na época 1: 0.91500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.53299223.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:21 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_1_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▁▅▁▁▁▁▁▃▁▁▇▂▄▂▁▁▁▂▁▁▅▃▂▄▃▁▁▁▁▁▂▃▂▁
train_batch_loss,▂▂▂▂▂▂▂▂▁▃▁▁▂▁▁▃▁█▁▂▂▃▁▁▄▆▁▃▁▂▁▁▁▁▁▁▄▁▁▁

0,1
acuracia,0.915
do_lower_case,False
fn,65
fp,3
max_seq_len,512
media_test_epoca_loss,0.53299
media_train_epoca_loss,0.43011
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.07553355.
INFO:root:   Tempo de treinamento da época             : 0:00:50.
INFO:root:   Tempo parcial processamento               : 0:02:27 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00054982; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 9 na época 2: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00054982.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:29 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_1_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▂▄▁▁▁▂█▂▆▁▁▁▂▁▇▂▁▅▁▃▁▁▁▁▄▇▂▇▂▂▁▁▁
train_batch_loss,▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00055
media_train_epoca_loss,0.07553
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01155372.
INFO:root:   Tempo de treinamento da época             : 0:00:49.
INFO:root:   Tempo parcial processamento               : 0:03:34 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00109357; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 9 na época 3: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00109357.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:37 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_1_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▆█▁▂█▂▂▃▂▂▂▃▂▄▂▂▃▆▁▁▃▂▆▃▂▂▁▅▁▇▃▄▁▅
train_batch_loss,▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00109
media_train_epoca_loss,0.01155
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01554319.
INFO:root:   Tempo de treinamento da época             : 0:01:12.
INFO:root:   Tempo parcial processamento               : 0:05:03 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00066538; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 9 na época 4: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00066538.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:05:06 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_1_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▆▁▁▄▅▁▃▇▇▁▁▂▁▂█▁▂▂▁█▁▁▅▁▂▄▆▆▃▆▂▇▇▃▃
train_batch_loss,▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00067
media_train_epoca_loss,0.01554
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


INFO:root:  Média perda(loss) treinamento : 0.13318407.
INFO:root:  Média perda(loss) avaliação   : 0.13382525.
INFO:root:  Tempo total treinamento       : 0:05:32.
INFO:root:  Tempo processamento fold: 0:05:46 (h:mm:ss)

INFO:root:Processamendo do fold: 10.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 1e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCl

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 10 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69857895; Acc: 0.49625000; Rec: 0.02750000; Pre: 0.44000000, F1:0.05176471, vp:  11; vn: 386; fp:  14; fn: 389
INFO:root:   Acurácia do fold 10 na época 0: 0.49625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69857895.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:13 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▃▅▄█▄▆▅▅▆▄▄▅▅▃▃▆▇▅▄▅▄▅▅▅▄▅▅▅▅▂▁▂█▃

0,1
acuracia,0.49625
do_lower_case,False
fn,389
fp,14
max_seq_len,512
media_test_epoca_loss,0.69858
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.38184362.
INFO:root:   Tempo de treinamento da época             : 0:00:49.
INFO:root:   Tempo parcial processamento               : 0:01:17 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.08286343; Acc: 0.98000000; Rec: 1.00000000; Pre: 0.96153846, F1:0.98039216, vp: 400; vn: 384; fp:  16; fn:   0
INFO:root:   Acurácia do fold 10 na época 1: 0.98000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.08286343.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:20 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_1_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁█▁▁▁▁▂▁▁▁▂▁▁▁▁▁▁▂▁▁▁▁▂▁█▁▁
train_batch_loss,▃▃▃▃▂▃▂▃▂▅▂▁▁▁▁▃▁█▁▃▁▂▁▁▁▁▁▁▁▅▁▁▁▁▃▄▁▁▁▁

0,1
acuracia,0.98
do_lower_case,False
fn,0
fp,16
max_seq_len,512
media_test_epoca_loss,0.08286
media_train_epoca_loss,0.38184
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.07556629.
INFO:root:   Tempo de treinamento da época             : 0:00:50.
INFO:root:   Tempo parcial processamento               : 0:02:25 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.06630413; Acc: 0.98750000; Rec: 1.00000000; Pre: 0.97560976, F1:0.98765432, vp: 400; vn: 390; fp:  10; fn:   0
INFO:root:   Acurácia do fold 10 na época 2: 0.98750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.06630413.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:27 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_1_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▂▂
train_batch_loss,▁▁▁▁▁▁▇▂▂▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▄▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9875
do_lower_case,False
fn,0
fp,10
max_seq_len,512
media_test_epoca_loss,0.0663
media_train_epoca_loss,0.07557
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.02357152.
INFO:root:   Tempo de treinamento da época             : 0:00:52.
INFO:root:   Tempo parcial processamento               : 0:03:33 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00820032; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 10 na época 3: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00820032.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:35 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_1_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▆▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.0082
media_train_epoca_loss,0.02357
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.04333109.
INFO:root:   Tempo de treinamento da época             : 0:01:12.
INFO:root:   Tempo parcial processamento               : 0:05:03 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.07629633; Acc: 0.98750000; Rec: 1.00000000; Pre: 0.97560976, F1:0.98765432, vp: 400; vn: 390; fp:  10; fn:   0
INFO:root:   Acurácia do fold 10 na época 4: 0.98750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.07629633.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:06 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_1_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▇▁▁█▁▁▁▁▁▁▄▁▇▁▁▁▁▁▁▁▇▁▁▁▁▁▁▄▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█

0,1
acuracia,0.9875
do_lower_case,False
fn,0
fp,10
max_seq_len,512
media_test_epoca_loss,0.0763
media_train_epoca_loss,0.04333
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.13107813.
INFO:root:  Média perda(loss) avaliação   : 0.05841606.
INFO:root:  Tempo total treinamento       : 0:05:32.
INFO:root:  Tempo processamento fold: 0:05:47 (h:mm:ss)

INFO:root:  Tempo processamento de todos os folds: 0:54:28 (h:mm:ss)



Folds :   0%|          | 0/10 [00:00<?, ?fold/s]

INFO:root:Processamendo do fold: 1.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 2e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are i

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 1 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69858045; Acc: 0.48500000; Rec: 0.01250000; Pre: 0.22727273, F1:0.02369668, vp:   5; vn: 383; fp:  17; fn: 395
INFO:root:   Acurácia do fold 1 na época 0: 0.48500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69858045.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:12 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▄▇▅▇▅▆▃▄▅▃▄▃▄▄▆▄▇▅▆▆▄▅▆▃▅▄▃▄▅▁▃▄█▄

0,1
acuracia,0.485
do_lower_case,False
fn,395
fp,17
max_seq_len,512
media_test_epoca_loss,0.69858
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.35853842.
INFO:root:   Tempo de treinamento da época             : 0:00:52.
INFO:root:   Tempo parcial processamento               : 0:01:18 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02987957; Acc: 0.99500000; Rec: 1.00000000; Pre: 0.99009901, F1:0.99502488, vp: 400; vn: 396; fp:   4; fn:   0
INFO:root:   Acurácia do fold 1 na época 1: 0.99500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02987957.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:20 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_2_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▅▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▅█▁▁
train_batch_loss,▂▂▂▂▂▂▂▄▁▄▁▁▁▁▁▇▁█▁▂▁▄▁▁▁▁▁▁▁▃▁▁▁▁▁▁▃▁▁▁

0,1
acuracia,0.995
do_lower_case,False
fn,0
fp,4
max_seq_len,512
media_test_epoca_loss,0.02988
media_train_epoca_loss,0.35854
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.07500036.
INFO:root:   Tempo de treinamento da época             : 0:00:52.
INFO:root:   Tempo parcial processamento               : 0:02:29 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.12078363; Acc: 0.98375000; Rec: 1.00000000; Pre: 0.96852300, F1:0.98400984, vp: 400; vn: 387; fp:  13; fn:   0
INFO:root:   Acurácia do fold 1 na época 2: 0.98375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.12078363.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:31 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_2_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▄▁▁▁▁▁▁▁▁▁▁▁▁▁▁▇▁▁▁▁▁▁█▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▆▁▂▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.98375
do_lower_case,False
fn,0
fp,13
max_seq_len,512
media_test_epoca_loss,0.12078
media_train_epoca_loss,0.075
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.08980483.
INFO:root:   Tempo de treinamento da época             : 0:00:51.
INFO:root:   Tempo parcial processamento               : 0:03:38 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.07926771; Acc: 0.98375000; Rec: 1.00000000; Pre: 0.96852300, F1:0.98400984, vp: 400; vn: 387; fp:  13; fn:   0
INFO:root:   Acurácia do fold 1 na época 3: 0.98375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.07926771.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:40 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_2_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▄▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁█▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁▂█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.98375
do_lower_case,False
fn,0
fp,13
max_seq_len,512
media_test_epoca_loss,0.07927
media_train_epoca_loss,0.0898
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.08380224.
INFO:root:   Tempo de treinamento da época             : 0:01:12.
INFO:root:   Tempo parcial processamento               : 0:05:09 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.08670542; Acc: 0.98375000; Rec: 1.00000000; Pre: 0.96852300, F1:0.98400984, vp: 400; vn: 387; fp:  13; fn:   0
INFO:root:   Acurácia do fold 1 na época 4: 0.98375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.08670542.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:13 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_2_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▂▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂█▁▁▁▁

0,1
acuracia,0.98375
do_lower_case,False
fn,0
fp,13
max_seq_len,512
media_test_epoca_loss,0.08671
media_train_epoca_loss,0.0838
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.15178646.
INFO:root:  Média perda(loss) avaliação   : 0.07915908.
INFO:root:  Tempo total treinamento       : 0:05:40.
INFO:root:  Tempo processamento fold: 0:05:53 (h:mm:ss)

INFO:root:Processamendo do fold: 2.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 2e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 2 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69744084; Acc: 0.49375000; Rec: 0.03500000; Pre: 0.42424242, F1:0.06466513, vp:  14; vn: 381; fp:  19; fn: 386
INFO:root:   Acurácia do fold 2 na época 0: 0.49375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69744084.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:12 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▃█▄▆▅▅▄▄▄▄▃▃▄▂▃▆▄▄▅▄▃▅▄▄▅▄▅▄▄▁▂▅▆▄

0,1
acuracia,0.49375
do_lower_case,False
fn,386
fp,19
max_seq_len,512
media_test_epoca_loss,0.69744
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.35492985.
INFO:root:   Tempo de treinamento da época             : 0:00:51.
INFO:root:   Tempo parcial processamento               : 0:01:20 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02593671; Acc: 0.99500000; Rec: 1.00000000; Pre: 0.99009901, F1:0.99502488, vp: 400; vn: 396; fp:   4; fn:   0
INFO:root:   Acurácia do fold 2 na época 1: 0.99500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02593671.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:22 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_2_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▆▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁
train_batch_loss,▆▅▅▅▆▄▂▆▂▃▁▁▁▁▁█▁▅▁▃▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁

0,1
acuracia,0.995
do_lower_case,False
fn,0
fp,4
max_seq_len,512
media_test_epoca_loss,0.02594
media_train_epoca_loss,0.35493
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.04525779.
INFO:root:   Tempo de treinamento da época             : 0:00:51.
INFO:root:   Tempo parcial processamento               : 0:02:30 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01737368; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 2 na época 2: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01737368.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:33 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_2_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁█▁█▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01737
media_train_epoca_loss,0.04526
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01269348.
INFO:root:   Tempo de treinamento da época             : 0:00:53.
INFO:root:   Tempo parcial processamento               : 0:03:40 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01629353; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 2 na época 3: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01629353.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:43 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_2_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01629
media_train_epoca_loss,0.01269
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.00803392.
INFO:root:   Tempo de treinamento da época             : 0:01:14.
INFO:root:   Tempo parcial processamento               : 0:05:12 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01529372; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 2 na época 4: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01529372.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:16 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_2_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁
train_batch_loss,▁▁▁▁▁▁█▁▁▁█▁▁▁▁▁▁▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01529
media_train_epoca_loss,0.00803
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.10522876.
INFO:root:  Média perda(loss) avaliação   : 0.01872441.
INFO:root:  Tempo total treinamento       : 0:05:41.
INFO:root:  Tempo processamento fold: 0:05:54 (h:mm:ss)

INFO:root:Processamendo do fold: 3.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 2e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 3 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69699712; Acc: 0.49875000; Rec: 0.02750000; Pre: 0.47826087, F1:0.05200946, vp:  11; vn: 388; fp:  12; fn: 389
INFO:root:   Acurácia do fold 3 na época 0: 0.49875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69699712.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:12 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▂▃▄▄▃█▄▃▅▂▂▃▃▃▃▄▅▃▃▄▄▄▃▃▃▃▄▄▃▁▂▂▆▁

0,1
acuracia,0.49875
do_lower_case,False
fn,389
fp,12
max_seq_len,512
media_test_epoca_loss,0.697
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.38256131.
INFO:root:   Tempo de treinamento da época             : 0:00:51.
INFO:root:   Tempo parcial processamento               : 0:01:20 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.09689393; Acc: 0.98000000; Rec: 1.00000000; Pre: 0.96153846, F1:0.98039216, vp: 400; vn: 384; fp:  16; fn:   0
INFO:root:   Acurácia do fold 3 na época 1: 0.98000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.09689393.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:22 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_2_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▄▁▁▁▃▁█▁▂▁▁▁▁▁▁▁▁▁▁▁▁▃▁▁▁▁▁▁▁▅▁▁
train_batch_loss,▂▂▂▂▂▂▂▂▁▁▁▂▁▁▁▃▁█▂▃▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.98
do_lower_case,False
fn,0
fp,16
max_seq_len,512
media_test_epoca_loss,0.09689
media_train_epoca_loss,0.38256
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.15090261.
INFO:root:   Tempo de treinamento da época             : 0:00:54.
INFO:root:   Tempo parcial processamento               : 0:02:32 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.03678388; Acc: 0.99125000; Rec: 1.00000000; Pre: 0.98280098, F1:0.99132590, vp: 400; vn: 393; fp:   7; fn:   0
INFO:root:   Acurácia do fold 3 na época 2: 0.99125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.03678388.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:35 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_2_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▇▁█▁▁▁▄▁▃▁▅▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁█▁▁▁▂█▂▁▁▁▁▁▁▁▃▁▆▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▂▁▁▁

0,1
acuracia,0.99125
do_lower_case,False
fn,0
fp,7
max_seq_len,512
media_test_epoca_loss,0.03678
media_train_epoca_loss,0.1509
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.02945039.
INFO:root:   Tempo de treinamento da época             : 0:00:54.
INFO:root:   Tempo parcial processamento               : 0:03:45 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00862866; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 3 na época 3: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00862866.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:48 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_2_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00863
media_train_epoca_loss,0.02945
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.02482189.
INFO:root:   Tempo de treinamento da época             : 0:01:13.
INFO:root:   Tempo parcial processamento               : 0:05:17 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01435674; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 3 na época 4: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01435674.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:21 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_2_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▅▁▁▁▄▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▄▁▁▁▁▁▁▁▄

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01436
media_train_epoca_loss,0.02482
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.14693405.
INFO:root:  Média perda(loss) avaliação   : 0.03916580.
INFO:root:  Tempo total treinamento       : 0:05:47.
INFO:root:  Tempo processamento fold: 0:06:01 (h:mm:ss)

INFO:root:Processamendo do fold: 4.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 2e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 4 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69861526; Acc: 0.49750000; Rec: 0.02250000; Pre: 0.45000000, F1:0.04285714, vp:   9; vn: 389; fp:  11; fn: 391
INFO:root:   Acurácia do fold 4 na época 0: 0.49750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69861526.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:13 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▁▃▅▄▇▁▅▃▃▄▂▃▆▄▄▃▄▆▄▃▄▂▄▅▅▄▅▄▅▄▃▁▄█▅

0,1
acuracia,0.4975
do_lower_case,False
fn,391
fp,11
max_seq_len,512
media_test_epoca_loss,0.69862
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.32471348.
INFO:root:   Tempo de treinamento da época             : 0:00:54.
INFO:root:   Tempo parcial processamento               : 0:01:23 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.30200604; Acc: 0.94250000; Rec: 0.88750000; Pre: 0.99719101, F1:0.93915344, vp: 355; vn: 399; fp:   1; fn:  45
INFO:root:   Acurácia do fold 4 na época 1: 0.94250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.30200604.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:26 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_2_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▃▄▁▁▅▁▁▁▁▁▂▁▁▁▇█▁▁▁▁▁▁▁▁▃▁▁▂▁▃▂▄
train_batch_loss,▂▂▂▂▃▂▂▂▁▂▁▁▁▁▁▂▁█▁▂▁▂▁▁▂▁▁▁▁▇▂▁▁▁▁▁▁▂▁▁

0,1
acuracia,0.9425
do_lower_case,False
fn,45
fp,1
max_seq_len,512
media_test_epoca_loss,0.30201
media_train_epoca_loss,0.32471
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.08490098.
INFO:root:   Tempo de treinamento da época             : 0:00:52.
INFO:root:   Tempo parcial processamento               : 0:02:34 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00786141; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 4 na época 2: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00786141.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:36 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_2_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁█▁▁▁▁▁▆▁▁▁▁▁▁▁▁▃▁▁▁▁▁▁▁▁▁▂▄▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00786
media_train_epoca_loss,0.0849
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.04525406.
INFO:root:   Tempo de treinamento da época             : 0:00:53.
INFO:root:   Tempo parcial processamento               : 0:03:45 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01052075; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 4 na época 3: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01052075.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:47 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_2_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▃▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01052
media_train_epoca_loss,0.04525
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.00993185.
INFO:root:   Tempo de treinamento da época             : 0:01:16.
INFO:root:   Tempo parcial processamento               : 0:05:20 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00812956; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 4 na época 4: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00812956.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:25 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_2_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁█▁▁▆▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00813
media_train_epoca_loss,0.00993
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.11620009.
INFO:root:  Média perda(loss) avaliação   : 0.08212944.
INFO:root:  Tempo total treinamento       : 0:05:48.
INFO:root:  Tempo processamento fold: 0:06:02 (h:mm:ss)

INFO:root:Processamendo do fold: 5.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 2e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 5 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69835621; Acc: 0.49125000; Rec: 0.02500000; Pre: 0.37037037, F1:0.04683841, vp:  10; vn: 383; fp:  17; fn: 390
INFO:root:   Acurácia do fold 5 na época 0: 0.49125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69835621.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:13 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▂▄▅█▄▆▃▄▆▁▃▃▄▂▂▇▇▄▅▃▅▆▃▂▅▃▅▅▅▁▂▂█▄

0,1
acuracia,0.49125
do_lower_case,False
fn,390
fp,17
max_seq_len,512
media_test_epoca_loss,0.69836
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.33369947.
INFO:root:   Tempo de treinamento da época             : 0:00:53.
INFO:root:   Tempo parcial processamento               : 0:01:21 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.04286936; Acc: 0.99250000; Rec: 1.00000000; Pre: 0.98522167, F1:0.99255583, vp: 400; vn: 394; fp:   6; fn:   0
INFO:root:   Acurácia do fold 5 na época 1: 0.99250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.04286936.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:24 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_2_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▅▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁██▁▁▁█▁▁▅▁▁
train_batch_loss,▅▄▄▅▄▄▃▂▂▁▁▁▁▁▁█▁▁▁█▁▄▁▁▄▁▁▁▁▄▂▁▁▁▁▁▂▁▁▁

0,1
acuracia,0.9925
do_lower_case,False
fn,0
fp,6
max_seq_len,512
media_test_epoca_loss,0.04287
media_train_epoca_loss,0.3337
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.08088424.
INFO:root:   Tempo de treinamento da época             : 0:00:53.
INFO:root:   Tempo parcial processamento               : 0:02:32 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.04026238; Acc: 0.99500000; Rec: 1.00000000; Pre: 0.99009901, F1:0.99502488, vp: 400; vn: 396; fp:   4; fn:   0
INFO:root:   Acurácia do fold 5 na época 2: 0.99500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.04026238.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:34 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_2_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▇▁▁▆▁▁▁▁▁▁▁▁▇█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.995
do_lower_case,False
fn,0
fp,4
max_seq_len,512
media_test_epoca_loss,0.04026
media_train_epoca_loss,0.08088
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.04727340.
INFO:root:   Tempo de treinamento da época             : 0:00:55.
INFO:root:   Tempo parcial processamento               : 0:03:45 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.03026821; Acc: 0.99500000; Rec: 1.00000000; Pre: 0.99009901, F1:0.99502488, vp: 400; vn: 396; fp:   4; fn:   0
INFO:root:   Acurácia do fold 5 na época 3: 0.99500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.03026821.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:47 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_2_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▇▁▁█▁▁▁▁▁██▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▃▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.995
do_lower_case,False
fn,0
fp,4
max_seq_len,512
media_test_epoca_loss,0.03027
media_train_epoca_loss,0.04727
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.05396523.
INFO:root:   Tempo de treinamento da época             : 0:01:16.
INFO:root:   Tempo parcial processamento               : 0:05:18 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02635196; Acc: 0.99500000; Rec: 1.00000000; Pre: 0.99009901, F1:0.99502488, vp: 400; vn: 396; fp:   4; fn:   0
INFO:root:   Acurácia do fold 5 na época 4: 0.99500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02635196.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:22 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_2_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▆▁▆▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁█▁▁▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▇▁▁▁▁▁▁▁▁█

0,1
acuracia,0.995
do_lower_case,False
fn,0
fp,4
max_seq_len,512
media_test_epoca_loss,0.02635
media_train_epoca_loss,0.05397
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.12895558.
INFO:root:  Média perda(loss) avaliação   : 0.03493798.
INFO:root:  Tempo total treinamento       : 0:05:48.
INFO:root:  Tempo processamento fold: 0:06:03 (h:mm:ss)

INFO:root:Processamendo do fold: 6.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 2e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 6 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69707560; Acc: 0.49250000; Rec: 0.02250000; Pre: 0.37500000, F1:0.04245283, vp:   9; vn: 385; fp:  15; fn: 391
INFO:root:   Acurácia do fold 6 na época 0: 0.49250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69707560.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:13 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▄█▅▇▅▅▅▅▆▂▄▅▅▆▄█▆▅▆▄▄▆▆▆▆▅▄▆▄▄▁▄▇▅

0,1
acuracia,0.4925
do_lower_case,False
fn,391
fp,15
max_seq_len,512
media_test_epoca_loss,0.69708
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.32272730.
INFO:root:   Tempo de treinamento da época             : 0:00:55.
INFO:root:   Tempo parcial processamento               : 0:01:24 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.04608906; Acc: 0.98375000; Rec: 0.96750000; Pre: 1.00000000, F1:0.98348158, vp: 387; vn: 400; fp:   0; fn:  13
INFO:root:   Acurácia do fold 6 na época 1: 0.98375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.04608906.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:26 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_2_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▃▁▁▁▁█▁▃▁▁▁▁▁▁▂▁▁▂▂▁▁▁▁▁▃▂▁▃▁▃▁▃▁▁▁
train_batch_loss,▃▃▃▃▃▃▂▂▂▃▁▁▁▁▁█▁▁▁▄▁▂▁▁▁▁▁▁▁▄▁▁▁▂▁▁▂▁▁▁

0,1
acuracia,0.98375
do_lower_case,False
fn,13
fp,0
max_seq_len,512
media_test_epoca_loss,0.04609
media_train_epoca_loss,0.32273
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.04383609.
INFO:root:   Tempo de treinamento da época             : 0:00:55.
INFO:root:   Tempo parcial processamento               : 0:02:37 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.39601108; Acc: 0.92875000; Rec: 0.85750000; Pre: 1.00000000, F1:0.92328398, vp: 343; vn: 400; fp:   0; fn:  57
INFO:root:   Acurácia do fold 6 na época 2: 0.92875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.39601108.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:39 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_2_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▃▄▃▁▁▁▃▁▁▁▁▅▁▁▃▁▆█▁▁▁▁▆▁▁▁▁▁▅▂▃▁▁▁
train_batch_loss,█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.92875
do_lower_case,False
fn,57
fp,0
max_seq_len,512
media_test_epoca_loss,0.39601
media_train_epoca_loss,0.04384
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.02569806.
INFO:root:   Tempo de treinamento da época             : 0:00:54.
INFO:root:   Tempo parcial processamento               : 0:03:50 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00090164; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 6 na época 3: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00090164.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:52 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_2_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▇█▇▁▁▂▄▁▅▂▂██▂▁▁▄▄▃▁▂▁▂▁▅▃▂▁▂▇▆▅▄▇▃
train_batch_loss,▁▂▂▃▂▂▁▁▄▁▆▁▁▁▄▁█▆▅▅▁▃▃▁▃▃▃▁▃▁▂▁▂▁▁▃▄▁▄▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.0009
media_train_epoca_loss,0.0257
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.11575596.
INFO:root:   Tempo de treinamento da época             : 0:01:14.
INFO:root:   Tempo parcial processamento               : 0:05:23 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00102350; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 6 na época 4: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00102350.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:27 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_2_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▇▂▅█▁▄▁▄▁▁▃▁▅▇▄▅▁▃█▁▁▅▄▃▃▃▁▁▂▄▂▃▅▅
train_batch_loss,▁▁▁▁▁▁▂▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00102
media_train_epoca_loss,0.11576
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.12700435.
INFO:root:  Média perda(loss) avaliação   : 0.11100632.
INFO:root:  Tempo total treinamento       : 0:05:54.
INFO:root:  Tempo processamento fold: 0:06:07 (h:mm:ss)

INFO:root:Processamendo do fold: 7.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 2e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 7 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69773722; Acc: 0.49250000; Rec: 0.03000000; Pre: 0.40000000, F1:0.05581395, vp:  12; vn: 382; fp:  18; fn: 388
INFO:root:   Acurácia do fold 7 na época 0: 0.49250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69773722.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:13 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▁▄█▄▇▆▅▅▄▅▁▃▃▄▄▂██▅▅▄▃▄▆▅▄▄▅▂▂▂▂▇▇▅

0,1
acuracia,0.4925
do_lower_case,False
fn,388
fp,18
max_seq_len,512
media_test_epoca_loss,0.69774
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.31604413.
INFO:root:   Tempo de treinamento da época             : 0:00:55.
INFO:root:   Tempo parcial processamento               : 0:01:24 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.06712392; Acc: 0.96250000; Rec: 0.92500000; Pre: 1.00000000, F1:0.96103896, vp: 370; vn: 400; fp:   0; fn:  30
INFO:root:   Acurácia do fold 7 na época 1: 0.96250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.06712392.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:27 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_2_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁█▁▁▁▁▁▁▄▁▁▁▁▁▄▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂
train_batch_loss,▂▂▂▂▂▂▂▁▁▁▁▁▁▁▁▂▁█▁▅▁▁▁▁▁▁▁▁▁▇▁▁▁▁▁▁▂▁▁▁

0,1
acuracia,0.9625
do_lower_case,False
fn,30
fp,0
max_seq_len,512
media_test_epoca_loss,0.06712
media_train_epoca_loss,0.31604
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.10329633.
INFO:root:   Tempo de treinamento da época             : 0:00:54.
INFO:root:   Tempo parcial processamento               : 0:02:37 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01008251; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 7 na época 2: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01008251.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:39 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_2_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁
train_batch_loss,▁▃▁▁▁▁█▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.01008
media_train_epoca_loss,0.1033
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01339653.
INFO:root:   Tempo de treinamento da época             : 0:00:54.
INFO:root:   Tempo parcial processamento               : 0:03:50 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01138044; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 7 na época 3: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01138044.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:52 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_2_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▄▅▅▁▁█▁▂▁▁▁▁▁▃▃▂▂▁▂▂▁▃▂▁▁▃▁▁▁▁▁▁▃▃▂▃▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.01138
media_train_epoca_loss,0.0134
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.00853334.
INFO:root:   Tempo de treinamento da época             : 0:01:18.
INFO:root:   Tempo parcial processamento               : 0:05:26 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01316586; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 7 na época 4: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01316586.
INFO:root:   Tempo de avaliação da época               : 0:00:05.
INFO:root:   Tempo parcial do processamento            : 0:05:30 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_2_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.01317
media_train_epoca_loss,0.00853
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:05


INFO:root:  Média perda(loss) treinamento : 0.11031758.
INFO:root:  Média perda(loss) avaliação   : 0.02543818.
INFO:root:  Tempo total treinamento       : 0:05:56.
INFO:root:  Tempo processamento fold: 0:06:10 (h:mm:ss)

INFO:root:Processamendo do fold: 8.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 2e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 8 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69595567; Acc: 0.49750000; Rec: 0.02000000; Pre: 0.44444444, F1:0.03827751, vp:   8; vn: 390; fp:  10; fn: 392
INFO:root:   Acurácia do fold 8 na época 0: 0.49750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69595567.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:13 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▅█▅▇▄▅▃▅▄▅▄▄▄▅▅▇▄▅▅▅▅▄▄▅▅▆▅▅▃▁▂▃█▅

0,1
acuracia,0.4975
do_lower_case,False
fn,392
fp,10
max_seq_len,512
media_test_epoca_loss,0.69596
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.37301803.
INFO:root:   Tempo de treinamento da época             : 0:00:55.
INFO:root:   Tempo parcial processamento               : 0:01:24 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.06430885; Acc: 0.98125000; Rec: 1.00000000; Pre: 0.96385542, F1:0.98159509, vp: 400; vn: 385; fp:  15; fn:   0
INFO:root:   Acurácia do fold 8 na época 1: 0.98125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.06430885.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:26 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_2_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▃▁▁▁▁▁▁▃▁▁█▁▁▁▁▁▇▁▁▁▁▁▁▁▇▁▁▁▁▁▂
train_batch_loss,▃▃▃▃▃▃▃▃▁▁▁▁▁▁▁▆▁▁▁█▁▃▁▁▂▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁

0,1
acuracia,0.98125
do_lower_case,False
fn,0
fp,15
max_seq_len,512
media_test_epoca_loss,0.06431
media_train_epoca_loss,0.37302
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.06861282.
INFO:root:   Tempo de treinamento da época             : 0:00:55.
INFO:root:   Tempo parcial processamento               : 0:02:37 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.03092418; Acc: 0.99375000; Rec: 1.00000000; Pre: 0.98765432, F1:0.99378882, vp: 400; vn: 395; fp:   5; fn:   0
INFO:root:   Acurácia do fold 8 na época 2: 0.99375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.03092418.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:39 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_2_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▃▁▁▁▁▁▁▁▁▅▁█▁▁▁▁▁
train_batch_loss,▅▁▁▁▁▁▇▄▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99375
do_lower_case,False
fn,0
fp,5
max_seq_len,512
media_test_epoca_loss,0.03092
media_train_epoca_loss,0.06861
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.07533768.
INFO:root:   Tempo de treinamento da época             : 0:00:57.
INFO:root:   Tempo parcial processamento               : 0:03:53 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.03481794; Acc: 0.99375000; Rec: 1.00000000; Pre: 0.98765432, F1:0.99378882, vp: 400; vn: 395; fp:   5; fn:   0
INFO:root:   Acurácia do fold 8 na época 3: 0.99375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.03481794.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:03:55 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_2_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▄▁▁▁▁▄▁▁▁▁▄▁▁▁▁█▁
train_batch_loss,▁▁▁▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▂▄▁▁▁▁▁▁▁▁▁▂▁▁▁▁

0,1
acuracia,0.99375
do_lower_case,False
fn,0
fp,5
max_seq_len,512
media_test_epoca_loss,0.03482
media_train_epoca_loss,0.07534
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.00847468.
INFO:root:   Tempo de treinamento da época             : 0:01:19.
INFO:root:   Tempo parcial processamento               : 0:05:29 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01420171; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 8 na época 4: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01420171.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:33 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_2_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,██▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▇▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.0142
media_train_epoca_loss,0.00847
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.13136080.
INFO:root:  Média perda(loss) avaliação   : 0.03606317.
INFO:root:  Tempo total treinamento       : 0:06:00.
INFO:root:  Tempo processamento fold: 0:06:16 (h:mm:ss)

INFO:root:Processamendo do fold: 9.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 2e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 9 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69937896; Acc: 0.48625000; Rec: 0.02750000; Pre: 0.33333333, F1:0.05080831, vp:  11; vn: 378; fp:  22; fn: 389
INFO:root:   Acurácia do fold 9 na época 0: 0.48625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69937896.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:13 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▅█▅▆▅▄▄▃▄▄▄▅▄▄▄▅▅▅▄▄▄▄▄▄▃▄▅▃▅▁▃▅▆▃

0,1
acuracia,0.48625
do_lower_case,False
fn,389
fp,22
max_seq_len,512
media_test_epoca_loss,0.69938
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.29052724.
INFO:root:   Tempo de treinamento da época             : 0:00:55.
INFO:root:   Tempo parcial processamento               : 0:01:25 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00489096; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 9 na época 1: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00489096.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:27 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_2_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁█▂▁▁▁▁▁▁▁▁▂▁▁▂▁▁▁▁
train_batch_loss,▃▃▃▂▃▃▂▃▁▃▁▁▁▁▁▆▁▁▁▂▂▃▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00489
media_train_epoca_loss,0.29053
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.03821252.
INFO:root:   Tempo de treinamento da época             : 0:00:59.
INFO:root:   Tempo parcial processamento               : 0:02:42 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00548904; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 9 na época 2: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00548904.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:45 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_2_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▂▄▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00549
media_train_epoca_loss,0.03821
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.03013319.
INFO:root:   Tempo de treinamento da época             : 0:00:58.
INFO:root:   Tempo parcial processamento               : 0:03:58 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00757466; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 9 na época 3: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00757466.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:04:01 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_2_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁
train_batch_loss,▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00757
media_train_epoca_loss,0.03013
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.00946919.
INFO:root:   Tempo de treinamento da época             : 0:01:20.
INFO:root:   Tempo parcial processamento               : 0:05:37 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00063500; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 9 na época 4: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00063500.
INFO:root:   Tempo de avaliação da época               : 0:00:05.
INFO:root:   Tempo parcial do processamento            : 0:05:42 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_2_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▃▁▁▄▇▁▄█▇▁▁▂▁▂▁▁▂▂▁▅▁▁▆▁▂▅▇▇▃▆▂▇█▅▄
train_batch_loss,▁▁▁▁▁▁▁▁▁█▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00063
media_train_epoca_loss,0.00947
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:05


INFO:root:  Média perda(loss) treinamento : 0.09208554.
INFO:root:  Média perda(loss) avaliação   : 0.00464741.
INFO:root:  Tempo total treinamento       : 0:06:08.
INFO:root:  Tempo processamento fold: 0:06:21 (h:mm:ss)

INFO:root:Processamendo do fold: 10.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 2e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCl

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 10 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69857895; Acc: 0.49625000; Rec: 0.02750000; Pre: 0.44000000, F1:0.05176471, vp:  11; vn: 386; fp:  14; fn: 389
INFO:root:   Acurácia do fold 10 na época 0: 0.49625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69857895.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:13 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▃▅▄█▄▆▅▅▆▄▄▅▅▃▃▆▇▅▄▅▄▅▅▅▄▅▅▅▅▂▁▂█▃

0,1
acuracia,0.49625
do_lower_case,False
fn,389
fp,14
max_seq_len,512
media_test_epoca_loss,0.69858
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.28371192.
INFO:root:   Tempo de treinamento da época             : 0:00:58.
INFO:root:   Tempo parcial processamento               : 0:01:27 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00974692; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 10 na época 1: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00974692.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:29 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_2_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁
train_batch_loss,▃▃▃▃▃▃▃▂▁▆▁▁▁▁▁▇▁▁▁▄▁▁▁▁█▁▁▁▁▆▁▁▁▁▁▁▄▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00975
media_train_epoca_loss,0.28371
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.04597164.
INFO:root:   Tempo de treinamento da época             : 0:00:59.
INFO:root:   Tempo parcial processamento               : 0:02:45 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01689124; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 10 na época 2: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01689124.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:47 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_2_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁█▁
train_batch_loss,▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01689
media_train_epoca_loss,0.04597
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01963889.
INFO:root:   Tempo de treinamento da época             : 0:00:59.
INFO:root:   Tempo parcial processamento               : 0:04:03 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02048568; Acc: 0.99625000; Rec: 1.00000000; Pre: 0.99255583, F1:0.99626401, vp: 400; vn: 397; fp:   3; fn:   0
INFO:root:   Acurácia do fold 10 na época 3: 0.99625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02048568.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:05 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_2_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▁▁▁▁▄█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▇▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99625
do_lower_case,False
fn,0
fp,3
max_seq_len,512
media_test_epoca_loss,0.02049
media_train_epoca_loss,0.01964
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.05482271.
INFO:root:   Tempo de treinamento da época             : 0:01:22.
INFO:root:   Tempo parcial processamento               : 0:05:42 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02352462; Acc: 0.99625000; Rec: 1.00000000; Pre: 0.99255583, F1:0.99626401, vp: 400; vn: 397; fp:   3; fn:   0
INFO:root:   Acurácia do fold 10 na época 4: 0.99625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02352462.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:46 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_2_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁█▁▁▁▁▁▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█

0,1
acuracia,0.99625
do_lower_case,False
fn,0
fp,3
max_seq_len,512
media_test_epoca_loss,0.02352
media_train_epoca_loss,0.05482
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.10103629.
INFO:root:  Média perda(loss) avaliação   : 0.01766211.
INFO:root:  Tempo total treinamento       : 0:06:13.
INFO:root:  Tempo processamento fold: 0:06:27 (h:mm:ss)

INFO:root:  Tempo processamento de todos os folds: 1:01:19 (h:mm:ss)



Folds :   0%|          | 0/10 [00:00<?, ?fold/s]

INFO:root:Processamendo do fold: 1.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 3e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are i

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 1 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69858045; Acc: 0.48500000; Rec: 0.01250000; Pre: 0.22727273, F1:0.02369668, vp:   5; vn: 383; fp:  17; fn: 395
INFO:root:   Acurácia do fold 1 na época 0: 0.48500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69858045.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:13 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▄▇▅▇▅▆▃▄▅▃▄▃▄▄▆▄▇▅▆▆▄▅▆▃▅▄▃▄▅▁▃▄█▄

0,1
acuracia,0.485
do_lower_case,False
fn,395
fp,17
max_seq_len,512
media_test_epoca_loss,0.69858
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.30515963.
INFO:root:   Tempo de treinamento da época             : 0:00:59.
INFO:root:   Tempo parcial processamento               : 0:01:28 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.17149001; Acc: 0.95875000; Rec: 0.92250000; Pre: 0.99460916, F1:0.95719844, vp: 369; vn: 398; fp:   2; fn:  31
INFO:root:   Acurácia do fold 1 na época 1: 0.95875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.17149001.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:30 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_3_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▂█▁▁▆▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▂▅
train_batch_loss,▂▂▂▃▃▂▂▂▁▁▁▁▁▁▁▅▁▁▁▂▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▃▁▁

0,1
acuracia,0.95875
do_lower_case,False
fn,31
fp,2
max_seq_len,512
media_test_epoca_loss,0.17149
media_train_epoca_loss,0.30516
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.04077513.
INFO:root:   Tempo de treinamento da época             : 0:00:59.
INFO:root:   Tempo parcial processamento               : 0:02:47 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01876391; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 1 na época 2: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01876391.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:49 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_3_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01876
media_train_epoca_loss,0.04078
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01102982.
INFO:root:   Tempo de treinamento da época             : 0:00:58.
INFO:root:   Tempo parcial processamento               : 0:04:04 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00877703; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 1 na época 3: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00877703.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:04:07 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_3_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁
train_batch_loss,▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00878
media_train_epoca_loss,0.01103
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.00998894.
INFO:root:   Tempo de treinamento da época             : 0:01:20.
INFO:root:   Tempo parcial processamento               : 0:05:43 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01623524; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 1 na época 4: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01623524.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:47 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_3_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▇▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01624
media_train_epoca_loss,0.00999
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.09173838.
INFO:root:  Média perda(loss) avaliação   : 0.05381655.
INFO:root:  Tempo total treinamento       : 0:06:15.
INFO:root:  Tempo processamento fold: 0:06:28 (h:mm:ss)

INFO:root:Processamendo do fold: 2.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 3e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 2 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69744084; Acc: 0.49375000; Rec: 0.03500000; Pre: 0.42424242, F1:0.06466513, vp:  14; vn: 381; fp:  19; fn: 386
INFO:root:   Acurácia do fold 2 na época 0: 0.49375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69744084.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:13 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▃█▄▆▅▅▄▄▄▄▃▃▄▂▃▆▄▄▅▄▃▅▄▄▅▄▅▄▄▁▂▅▆▄

0,1
acuracia,0.49375
do_lower_case,False
fn,386
fp,19
max_seq_len,512
media_test_epoca_loss,0.69744
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.36650558.
INFO:root:   Tempo de treinamento da época             : 0:01:00.
INFO:root:   Tempo parcial processamento               : 0:01:29 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.15889359; Acc: 0.97500000; Rec: 0.97000000; Pre: 0.97979798, F1:0.97487437, vp: 388; vn: 392; fp:   8; fn:  12
INFO:root:   Acurácia do fold 2 na época 1: 0.97500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.15889359.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:31 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_3_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▅▁█▁▁▁▁▁▁▁▁▁▁▂▁█▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁
train_batch_loss,▂▂▂▂▂▂▂▁▁▁▁▁▁▁▁█▁▂▁▃▁▂▆▁▁▁▁▁▂▅▁▁▁▁▂▁▁▁▁▁

0,1
acuracia,0.975
do_lower_case,False
fn,12
fp,8
max_seq_len,512
media_test_epoca_loss,0.15889
media_train_epoca_loss,0.36651
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


VBox(children=(Label(value='Waiting for wandb.init()...\r'), FloatProgress(value=0.0333373228708903, max=1.0))…

INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.06651338.
INFO:root:   Tempo de treinamento da época             : 0:01:00.
INFO:root:   Tempo parcial processamento               : 0:02:50 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01743691; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 2 na época 2: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01743691.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:02:52 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_3_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▄▁▃▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01744
media_train_epoca_loss,0.06651
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.04099975.
INFO:root:   Tempo de treinamento da época             : 0:00:59.
INFO:root:   Tempo parcial processamento               : 0:04:07 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.08342900; Acc: 0.97625000; Rec: 0.95750000; Pre: 0.99480519, F1:0.97579618, vp: 383; vn: 398; fp:   2; fn:  17
INFO:root:   Acurácia do fold 2 na época 3: 0.97625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.08342900.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:04:09 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_3_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▃▃▆▁▁▁▁▁▁▁▁▁▄▁▁▁▁▁█▁▁▁▁▁▁▃▁▁▁▂▁▂▁▁▁
train_batch_loss,▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▃▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.97625
do_lower_case,False
fn,17
fp,2
max_seq_len,512
media_test_epoca_loss,0.08343
media_train_epoca_loss,0.041
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.05438399.
INFO:root:   Tempo de treinamento da época             : 0:01:22.
INFO:root:   Tempo parcial processamento               : 0:05:48 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01728397; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 2 na época 4: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01728397.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:52 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_3_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁
train_batch_loss,▁▁▁▁▁▁▅▃▁▁▅▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01728
media_train_epoca_loss,0.05438
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.13210068.
INFO:root:  Média perda(loss) avaliação   : 0.06926087.
INFO:root:  Tempo total treinamento       : 0:06:20.
INFO:root:  Tempo processamento fold: 0:06:34 (h:mm:ss)

INFO:root:Processamendo do fold: 3.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 3e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 3 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69699712; Acc: 0.49875000; Rec: 0.02750000; Pre: 0.47826087, F1:0.05200946, vp:  11; vn: 388; fp:  12; fn: 389
INFO:root:   Acurácia do fold 3 na época 0: 0.49875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69699712.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▂▃▄▄▃█▄▃▅▂▂▃▃▃▃▄▅▃▃▄▄▄▃▃▃▃▄▄▃▁▂▂▆▁

0,1
acuracia,0.49875
do_lower_case,False
fn,389
fp,12
max_seq_len,512
media_test_epoca_loss,0.697
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.40863320.
INFO:root:   Tempo de treinamento da época             : 0:01:00.
INFO:root:   Tempo parcial processamento               : 0:01:29 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.11750874; Acc: 0.95500000; Rec: 0.97250000; Pre: 0.93961353, F1:0.95577396, vp: 389; vn: 375; fp:  25; fn:  11
INFO:root:   Acurácia do fold 3 na época 1: 0.95500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.11750874.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:32 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_3_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▆▁▁▅▁▃▁▃▁▂▁▁▁▁▁▁▂▇▂▁▃▁▁▁▃▁▁█▁▃▁▁▁▁▁
train_batch_loss,▃▃▃▃▂▃▂▃▂▃▁▁▁▁▁▆▁▁▁▅▁▂▁▁▂▁█▁▄▁▁▁▁▁▆▆▄▃▁▁

0,1
acuracia,0.955
do_lower_case,False
fn,11
fp,25
max_seq_len,512
media_test_epoca_loss,0.11751
media_train_epoca_loss,0.40863
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.06304784.
INFO:root:   Tempo de treinamento da época             : 0:00:59.
INFO:root:   Tempo parcial processamento               : 0:02:47 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01862225; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 3 na época 2: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01862225.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:49 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_3_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,█▂▁▁▁▁▃▁▁▁▁▁▁▁▁▁▅▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01862
media_train_epoca_loss,0.06305
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.16116213.
INFO:root:   Tempo de treinamento da época             : 0:00:59.
INFO:root:   Tempo parcial processamento               : 0:04:05 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01565756; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 3 na época 3: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01565756.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:08 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_3_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▄▁▁▁▄▁▁▁▁▁▂█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01566
media_train_epoca_loss,0.16116
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.07897424.
INFO:root:   Tempo de treinamento da época             : 0:01:24.
INFO:root:   Tempo parcial processamento               : 0:05:47 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02752494; Acc: 0.99500000; Rec: 1.00000000; Pre: 0.99009901, F1:0.99502488, vp: 400; vn: 396; fp:   4; fn:   0
INFO:root:   Acurácia do fold 3 na época 4: 0.99500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02752494.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:51 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_3_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▃▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▆▅▁▁▅▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▆▁▁▁▁▁▁▁▆

0,1
acuracia,0.995
do_lower_case,False
fn,0
fp,4
max_seq_len,512
media_test_epoca_loss,0.02752
media_train_epoca_loss,0.07897
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.17795435.
INFO:root:  Média perda(loss) avaliação   : 0.04482838.
INFO:root:  Tempo total treinamento       : 0:06:20.
INFO:root:  Tempo processamento fold: 0:06:34 (h:mm:ss)

INFO:root:Processamendo do fold: 4.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 3e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 4 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69861526; Acc: 0.49750000; Rec: 0.02250000; Pre: 0.45000000, F1:0.04285714, vp:   9; vn: 389; fp:  11; fn: 391
INFO:root:   Acurácia do fold 4 na época 0: 0.49750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69861526.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:13 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▁▃▅▄▇▁▅▃▃▄▂▃▆▄▄▃▄▆▄▃▄▂▄▅▅▄▅▄▅▄▃▁▄█▅

0,1
acuracia,0.4975
do_lower_case,False
fn,391
fp,11
max_seq_len,512
media_test_epoca_loss,0.69862
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.44086983.
INFO:root:   Tempo de treinamento da época             : 0:01:01.
INFO:root:   Tempo parcial processamento               : 0:01:30 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.08845700; Acc: 0.97000000; Rec: 1.00000000; Pre: 0.94339623, F1:0.97087379, vp: 400; vn: 376; fp:  24; fn:   0
INFO:root:   Acurácia do fold 4 na época 1: 0.97000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.08845700.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:01:32 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_3_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁█▁▁▄▁▁▁▁▁▁▁▁▁▅▅▁▁▁▁▁▁▁▁▃▁▁▂▁▄▄▇
train_batch_loss,▅▅▄▄▅▄▄▄▂▄▄▆▂▁▁█▁▁▁▄▁█▁▁▁▁▅▁▃▅▂▁▁▁▁▁▂▁▁▁

0,1
acuracia,0.97
do_lower_case,False
fn,0
fp,24
max_seq_len,512
media_test_epoca_loss,0.08846
media_train_epoca_loss,0.44087
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.13409231.
INFO:root:   Tempo de treinamento da época             : 0:01:00.
INFO:root:   Tempo parcial processamento               : 0:02:48 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.03176337; Acc: 0.99500000; Rec: 1.00000000; Pre: 0.99009901, F1:0.99502488, vp: 400; vn: 396; fp:   4; fn:   0
INFO:root:   Acurácia do fold 4 na época 2: 0.99500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.03176337.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:50 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_3_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▁▁▁▁▁▁▁▁▁▇▁▁▁▁▁▁▁▁▁▁▇▁▁▁▁▁▁▇▁▁▁▁▁▁
train_batch_loss,▁▇▁▁▁▁▁▆▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.995
do_lower_case,False
fn,0
fp,4
max_seq_len,512
media_test_epoca_loss,0.03176
media_train_epoca_loss,0.13409
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.04530332.
INFO:root:   Tempo de treinamento da época             : 0:01:00.
INFO:root:   Tempo parcial processamento               : 0:04:07 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.15959630; Acc: 0.97000000; Rec: 0.94250000; Pre: 0.99735450, F1:0.96915167, vp: 377; vn: 399; fp:   1; fn:  23
INFO:root:   Acurácia do fold 4 na época 3: 0.97000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.15959630.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:09 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_3_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▇▁▁▁▂▁▁▁▆▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.97
do_lower_case,False
fn,23
fp,1
max_seq_len,512
media_test_epoca_loss,0.1596
media_train_epoca_loss,0.0453
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.04250526.
INFO:root:   Tempo de treinamento da época             : 0:01:25.
INFO:root:   Tempo parcial processamento               : 0:05:50 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00825521; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 4 na época 4: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00825521.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:55 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_3_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▅▁▁▄▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▆▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00826
media_train_epoca_loss,0.04251
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.16569268.
INFO:root:  Média perda(loss) avaliação   : 0.07201797.
INFO:root:  Tempo total treinamento       : 0:06:25.
INFO:root:  Tempo processamento fold: 0:06:39 (h:mm:ss)

INFO:root:Processamendo do fold: 5.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 3e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 5 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69835621; Acc: 0.49125000; Rec: 0.02500000; Pre: 0.37037037, F1:0.04683841, vp:  10; vn: 383; fp:  17; fn: 390
INFO:root:   Acurácia do fold 5 na época 0: 0.49125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69835621.
INFO:root:   Tempo de avaliação da época               : 0:00:02.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▂▄▅█▄▆▃▄▆▁▃▃▄▂▂▇▇▄▅▃▅▆▃▂▅▃▅▅▅▁▂▂█▄

0,1
acuracia,0.49125
do_lower_case,False
fn,390
fp,17
max_seq_len,512
media_test_epoca_loss,0.69836
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:02


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.45527760.
INFO:root:   Tempo de treinamento da época             : 0:01:01.
INFO:root:   Tempo parcial processamento               : 0:01:30 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.55212279; Acc: 0.89000000; Rec: 1.00000000; Pre: 0.81967213, F1:0.90090090, vp: 400; vn: 312; fp:  88; fn:   0
INFO:root:   Acurácia do fold 5 na época 1: 0.89000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.55212279.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:33 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_3_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▆▂▁▂▁█▁▇▁▂▃▁▁▄▁▁▂▁▁▁▂▂▁▃▂▃▆▃▅▁▃
train_batch_loss,▄▆▄▄▄▄▂▄▄▃▂▁▁▄▄▄▃▄▂█▁▄▁▁▂▁▁▁▁▄▂▁▁▁▇▁▂▂▁▁

0,1
acuracia,0.89
do_lower_case,False
fn,0
fp,88
max_seq_len,512
media_test_epoca_loss,0.55212
media_train_epoca_loss,0.45528
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.22006887.
INFO:root:   Tempo de treinamento da época             : 0:01:00.
INFO:root:   Tempo parcial processamento               : 0:02:50 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.06733789; Acc: 0.98875000; Rec: 1.00000000; Pre: 0.97799511, F1:0.98887515, vp: 400; vn: 391; fp:   9; fn:   0
INFO:root:   Acurácia do fold 5 na época 2: 0.98875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.06733789.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:53 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_3_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▂█▁▁▆▃▃▁▄▁▁▁▁█▇▁▁▂▁▄▁▁▁▁▁▁▄▁▂▁▁▂▁
train_batch_loss,▁▄▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.98875
do_lower_case,False
fn,0
fp,9
max_seq_len,512
media_test_epoca_loss,0.06734
media_train_epoca_loss,0.22007
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.34002897.
INFO:root:   Tempo de treinamento da época             : 0:01:00.
INFO:root:   Tempo parcial processamento               : 0:04:09 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69351879; Acc: 0.50000000; Rec: 1.00000000; Pre: 0.50000000, F1:0.66666667, vp: 400; vn:   0; fp: 400; fn:   0
INFO:root:   Acurácia do fold 5 na época 3: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69351879.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:11 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_3_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▇▄▅▅█▄▆▄▃▆▁█▅▂▆▄▂▄▁█▇▄▄▅▇▄▄▅█▅▂▂▃▄▂
train_batch_loss,▁▁▁▁▁▁▁▂▁▁▃▁▁▁▁▁▁▁▁▁▁▁▂▅█▃▂▁▁▁▃▅▂▃▃▄▃▃▃▃

0,1
acuracia,0.5
do_lower_case,False
fn,0
fp,400
max_seq_len,512
media_test_epoca_loss,0.69352
media_train_epoca_loss,0.34003
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69181464.
INFO:root:   Tempo de treinamento da época             : 0:01:25.
INFO:root:   Tempo parcial processamento               : 0:05:52 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69510605; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 5 na época 4: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69510605.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:05:56 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_3_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▄▄▅▅█▄▇█▄▄▁▁▅▇▄▂▅▂▅▄▄▄▅▁▂▆▂▄▄▃▄▄▆▂
train_batch_loss,▄▅▄▄▄▅▄▅▄▄▄▂█▅▄▄▄▅▄▄▅▅▃▄▄▁▄▁▅▄▄▄▄▃▅▅▄▅▂▆

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.69511
media_train_epoca_loss,0.69181
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.42679752.
INFO:root:  Média perda(loss) avaliação   : 0.50202138.
INFO:root:  Tempo total treinamento       : 0:06:25.
INFO:root:  Tempo processamento fold: 0:06:39 (h:mm:ss)

INFO:root:Processamendo do fold: 6.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 3e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 6 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69707560; Acc: 0.49250000; Rec: 0.02250000; Pre: 0.37500000, F1:0.04245283, vp:   9; vn: 385; fp:  15; fn: 391
INFO:root:   Acurácia do fold 6 na época 0: 0.49250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69707560.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▄█▅▇▅▅▅▅▆▂▄▅▅▆▄█▆▅▆▄▄▆▆▆▆▅▄▆▄▄▁▄▇▅

0,1
acuracia,0.4925
do_lower_case,False
fn,391
fp,15
max_seq_len,512
media_test_epoca_loss,0.69708
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.55478037.
INFO:root:   Tempo de treinamento da época             : 0:01:02.
INFO:root:   Tempo parcial processamento               : 0:01:32 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.39489039; Acc: 0.87375000; Rec: 0.75250000; Pre: 0.99339934, F1:0.85633001, vp: 301; vn: 398; fp:   2; fn:  99
INFO:root:   Acurácia do fold 6 na época 1: 0.87375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.39489039.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:34 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_3_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁█▃▁▁▁▇▃▁▃▁▁▁▁▁▂▃▁▁▁▁▁▁▃▅▁▁▅▂▂▁▁▂
train_batch_loss,▄▅▃▃▃▄▃▃▃▄▃▃▂▂▁█▁▇▁▄▁▇▁▁▅▁▅▁▁▆▂▁▁▁▂▁▁▂▁▁

0,1
acuracia,0.87375
do_lower_case,False
fn,99
fp,2
max_seq_len,512
media_test_epoca_loss,0.39489
media_train_epoca_loss,0.55478
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.07051913.
INFO:root:   Tempo de treinamento da época             : 0:01:00.
INFO:root:   Tempo parcial processamento               : 0:02:50 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00440161; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 6 na época 2: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00440161.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:53 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_3_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▄▄▆▃▅▅█▅▆▂▆▃▃▂▄▄▂▅▄▆▁▅▃▄▂▅▄▃▄▄▅▄▄▅▆
train_batch_loss,▁▂▁▁█▁▁▁▁▁▁▁▁▁▁▁▄▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.0044
media_train_epoca_loss,0.07052
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.03564222.
INFO:root:   Tempo de treinamento da época             : 0:01:00.
INFO:root:   Tempo parcial processamento               : 0:04:09 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00090324; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 6 na época 3: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00090324.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:11 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_3_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▆▇▇▄▄▃▃▄▆▅▅▆█▅▃▄▄▄▅▂▅▅▃▄▄▄▄▁▄▆▇▆▆▅▅
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▂▁▁▁▁▁▁█▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.0009
media_train_epoca_loss,0.03564
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.03318349.
INFO:root:   Tempo de treinamento da época             : 0:01:28.
INFO:root:   Tempo parcial processamento               : 0:05:55 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00084851; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 6 na época 4: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00084851.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:00 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_3_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▃▁▅█▂▂▂▄▂▁▃▁▄▄▁▃▁▁▇▂▁▄▂▂▁▂▁▁▁▁▁▂▃▅
train_batch_loss,▁▁▁▁▁▁██▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▆▁▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00085
media_train_epoca_loss,0.03318
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.17353130.
INFO:root:  Média perda(loss) avaliação   : 0.10026094.
INFO:root:  Tempo total treinamento       : 0:06:29.
INFO:root:  Tempo processamento fold: 0:06:43 (h:mm:ss)

INFO:root:Processamendo do fold: 7.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 3e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 7 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69773722; Acc: 0.49250000; Rec: 0.03000000; Pre: 0.40000000, F1:0.05581395, vp:  12; vn: 382; fp:  18; fn: 388
INFO:root:   Acurácia do fold 7 na época 0: 0.49250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69773722.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▁▄█▄▇▆▅▅▄▅▁▃▃▄▄▂██▅▅▄▃▄▆▅▄▄▅▂▂▂▂▇▇▅

0,1
acuracia,0.4925
do_lower_case,False
fn,388
fp,18
max_seq_len,512
media_test_epoca_loss,0.69774
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.31762913.
INFO:root:   Tempo de treinamento da época             : 0:01:03.
INFO:root:   Tempo parcial processamento               : 0:01:32 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00955108; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 7 na época 1: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00955108.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:35 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_3_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▃▄▃▃▄▃▂▄▁▂▁▁▁▁▁█▁▁▁▆▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00955
media_train_epoca_loss,0.31763
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.05403962.
INFO:root:   Tempo de treinamento da época             : 0:01:02.
INFO:root:   Tempo parcial processamento               : 0:02:54 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00918358; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 7 na época 2: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00918358.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:57 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_3_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▆▁▁█▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00918
media_train_epoca_loss,0.05404
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.02372825.
INFO:root:   Tempo de treinamento da época             : 0:01:02.
INFO:root:   Tempo parcial processamento               : 0:04:14 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.56673474; Acc: 0.91625000; Rec: 0.83500000; Pre: 0.99701493, F1:0.90884354, vp: 334; vn: 399; fp:   1; fn:  66
INFO:root:   Acurácia do fold 7 na época 3: 0.91625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.56673474.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:16 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_3_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▇▅▄▄▁▄▁▁▁▃▁▁▁▁▁█▃▁▂▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂█▁▁▁

0,1
acuracia,0.91625
do_lower_case,False
fn,66
fp,1
max_seq_len,512
media_test_epoca_loss,0.56673
media_train_epoca_loss,0.02373
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.11659515.
INFO:root:   Tempo de treinamento da época             : 0:01:29.
INFO:root:   Tempo parcial processamento               : 0:06:02 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00934555; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 7 na época 4: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00934555.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:06 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_3_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▃▁▁▆▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00935
media_train_epoca_loss,0.1166
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.12799804.
INFO:root:  Média perda(loss) avaliação   : 0.14870374.
INFO:root:  Tempo total treinamento       : 0:06:35.
INFO:root:  Tempo processamento fold: 0:06:49 (h:mm:ss)

INFO:root:Processamendo do fold: 8.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 3e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 8 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69595567; Acc: 0.49750000; Rec: 0.02000000; Pre: 0.44444444, F1:0.03827751, vp:   8; vn: 390; fp:  10; fn: 392
INFO:root:   Acurácia do fold 8 na época 0: 0.49750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69595567.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▅█▅▇▄▅▃▅▄▅▄▄▄▅▅▇▄▅▅▅▅▄▄▅▅▆▅▅▃▁▂▃█▅

0,1
acuracia,0.4975
do_lower_case,False
fn,392
fp,10
max_seq_len,512
media_test_epoca_loss,0.69596
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.33103522.
INFO:root:   Tempo de treinamento da época             : 0:01:03.
INFO:root:   Tempo parcial processamento               : 0:01:33 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02453260; Acc: 0.99500000; Rec: 1.00000000; Pre: 0.99009901, F1:0.99502488, vp: 400; vn: 396; fp:   4; fn:   0
INFO:root:   Acurácia do fold 8 na época 1: 0.99500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02453260.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:36 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_3_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▅▁▁▁▁▆▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁
train_batch_loss,▆█▆▆▆▆▂█▁▂▁▄▁▁▁█▁▁▁▅▁▂▁▁▅▁▁▁▁▁▁▁▁▁▂▁▁▃▁▁

0,1
acuracia,0.995
do_lower_case,False
fn,0
fp,4
max_seq_len,512
media_test_epoca_loss,0.02453
media_train_epoca_loss,0.33104
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01476345.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:02:55 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.03628511; Acc: 0.99500000; Rec: 1.00000000; Pre: 0.99009901, F1:0.99502488, vp: 400; vn: 396; fp:   4; fn:   0
INFO:root:   Acurácia do fold 8 na época 2: 0.99500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.03628511.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:58 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_3_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▅▁▄▁█▁▁▁▁▁
train_batch_loss,█▁▁▁▁▁▅▁▁▁▁▁▁▁▁▅▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.995
do_lower_case,False
fn,0
fp,4
max_seq_len,512
media_test_epoca_loss,0.03629
media_train_epoca_loss,0.01476
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.02733105.
INFO:root:   Tempo de treinamento da época             : 0:01:03.
INFO:root:   Tempo parcial processamento               : 0:04:17 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02709140; Acc: 0.99500000; Rec: 1.00000000; Pre: 0.99009901, F1:0.99502488, vp: 400; vn: 396; fp:   4; fn:   0
INFO:root:   Acurácia do fold 8 na época 3: 0.99500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02709140.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:20 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_3_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▆▁▁▁▁▇▁▁▁▁▁▁▁▁▁█▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.995
do_lower_case,False
fn,0
fp,4
max_seq_len,512
media_test_epoca_loss,0.02709
media_train_epoca_loss,0.02733
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.01128014.
INFO:root:   Tempo de treinamento da época             : 0:01:28.
INFO:root:   Tempo parcial processamento               : 0:06:05 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.02195269; Acc: 0.99625000; Rec: 1.00000000; Pre: 0.99255583, F1:0.99626401, vp: 400; vn: 397; fp:   3; fn:   0
INFO:root:   Acurácia do fold 8 na época 4: 0.99625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.02195269.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:10 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_3_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▇█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁
train_batch_loss,▁▁▁▁▇▁▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▆▁█▁▁▁▁▁▁

0,1
acuracia,0.99625
do_lower_case,False
fn,0
fp,3
max_seq_len,512
media_test_epoca_loss,0.02195
media_train_epoca_loss,0.01128
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.09610247.
INFO:root:  Média perda(loss) avaliação   : 0.02746545.
INFO:root:  Tempo total treinamento       : 0:06:38.
INFO:root:  Tempo processamento fold: 0:06:52 (h:mm:ss)

INFO:root:Processamendo do fold: 9.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 3e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 9 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69937896; Acc: 0.48625000; Rec: 0.02750000; Pre: 0.33333333, F1:0.05080831, vp:  11; vn: 378; fp:  22; fn: 389
INFO:root:   Acurácia do fold 9 na época 0: 0.48625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69937896.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▅█▅▆▅▄▄▃▄▄▄▅▄▄▄▅▅▅▄▄▄▄▄▄▃▄▅▃▅▁▃▅▆▃

0,1
acuracia,0.48625
do_lower_case,False
fn,389
fp,22
max_seq_len,512
media_test_epoca_loss,0.69938
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.57383469.
INFO:root:   Tempo de treinamento da época             : 0:01:05.
INFO:root:   Tempo parcial processamento               : 0:01:34 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.22296220; Acc: 0.93875000; Rec: 0.88500000; Pre: 0.99159664, F1:0.93527081, vp: 354; vn: 397; fp:   3; fn:  46
INFO:root:   Acurácia do fold 9 na época 1: 0.93875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.22296220.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:37 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_3_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▂▁▄▁█▂▁▁▁▁▁▂▁▁▁▁▁▅▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▃▄▃▂▃▃▂▃▂▃▃▂▃▃▂▃▁▆▁█▃▄▁▃▃▅▃▁▃▃▂▂▄▁▁▁▁▂▁▁

0,1
acuracia,0.93875
do_lower_case,False
fn,46
fp,3
max_seq_len,512
media_test_epoca_loss,0.22296
media_train_epoca_loss,0.57383
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.21518722.
INFO:root:   Tempo de treinamento da época             : 0:01:03.
INFO:root:   Tempo parcial processamento               : 0:02:57 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.09437104; Acc: 0.98500000; Rec: 1.00000000; Pre: 0.97087379, F1:0.98522167, vp: 400; vn: 388; fp:  12; fn:   0
INFO:root:   Acurácia do fold 9 na época 2: 0.98500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.09437104.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:00 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_3_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▃▁▁▁▁▁▁
train_batch_loss,▁▄▁▁▁▆▁▅▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.985
do_lower_case,False
fn,0
fp,12
max_seq_len,512
media_test_epoca_loss,0.09437
media_train_epoca_loss,0.21519
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.16324101.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:04:20 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00094408; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 9 na época 3: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00094408.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:23 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_3_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▇█▁▁▃▁▂▃▁▂▁▂▁▂▂▁▂▂▁▁▂▁▄▂▂▂▁▃▁▂▁▄▁▃
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▃▁▁▁▁▁▁▁▁▁▁▁▃▄▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00094
media_train_epoca_loss,0.16324
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.08204584.
INFO:root:   Tempo de treinamento da época             : 0:01:32.
INFO:root:   Tempo parcial processamento               : 0:06:12 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00038470; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 9 na época 4: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00038470.
INFO:root:   Tempo de avaliação da época               : 0:00:05.
INFO:root:   Tempo parcial do processamento            : 0:06:17 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_3_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▃▁▁▂▆▂▃▇▇▂▂▂▂▃▁▂▂▂▁▅▂▁▅▁▂▅▅█▃▅▃▆▆▄▄
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▄▁▁▁█▁▁▁▁▁▁▁▁▄▁▁▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00038
media_train_epoca_loss,0.08205
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:05


INFO:root:  Média perda(loss) treinamento : 0.25857719.
INFO:root:  Média perda(loss) avaliação   : 0.07966551.
INFO:root:  Tempo total treinamento       : 0:06:45.
INFO:root:  Tempo processamento fold: 0:06:59 (h:mm:ss)

INFO:root:Processamendo do fold: 10.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 3e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCl

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 10 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69857895; Acc: 0.49625000; Rec: 0.02750000; Pre: 0.44000000, F1:0.05176471, vp:  11; vn: 386; fp:  14; fn: 389
INFO:root:   Acurácia do fold 10 na época 0: 0.49625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69857895.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▃▅▄█▄▆▅▅▆▄▄▅▅▃▃▆▇▅▄▅▄▅▅▅▄▅▅▅▅▂▁▂█▃

0,1
acuracia,0.49625
do_lower_case,False
fn,389
fp,14
max_seq_len,512
media_test_epoca_loss,0.69858
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.33565529.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:01:33 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.04717742; Acc: 0.99125000; Rec: 1.00000000; Pre: 0.98280098, F1:0.99132590, vp: 400; vn: 393; fp:   7; fn:   0
INFO:root:   Acurácia do fold 10 na época 1: 0.99125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.04717742.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:36 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_3_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▇█▁▁▁▁▁▁▁▁▁▁▁▁▆█▁▁▁▁▁▁█▁▄▁▁█▁▁▁▁
train_batch_loss,▃▄▃▃▃▃▂▂▂▂▂▁▁▁▁█▁▁▁▂▁▃▁▁▁▁▁▁▁▁▃▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99125
do_lower_case,False
fn,0
fp,7
max_seq_len,512
media_test_epoca_loss,0.04718
media_train_epoca_loss,0.33566
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.07947462.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:02:56 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00875192; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 10 na época 2: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00875192.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:59 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_3_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁
train_batch_loss,▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁█▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.00875
media_train_epoca_loss,0.07947
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.31037463.
INFO:root:   Tempo de treinamento da época             : 0:01:05.
INFO:root:   Tempo parcial processamento               : 0:04:20 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.07102194; Acc: 0.98250000; Rec: 0.96750000; Pre: 0.99742268, F1:0.98223350, vp: 387; vn: 399; fp:   1; fn:  13
INFO:root:   Acurácia do fold 10 na época 3: 0.98250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.07102194.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:22 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_3_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▅▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▇▅▆▆▃▃▇█▂▂▁▂▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9825
do_lower_case,False
fn,13
fp,1
max_seq_len,512
media_test_epoca_loss,0.07102
media_train_epoca_loss,0.31037
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.21040473.
INFO:root:   Tempo de treinamento da época             : 0:01:32.
INFO:root:   Tempo parcial processamento               : 0:06:10 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.01840761; Acc: 0.99750000; Rec: 1.00000000; Pre: 0.99502488, F1:0.99750623, vp: 400; vn: 398; fp:   2; fn:   0
INFO:root:   Acurácia do fold 10 na época 4: 0.99750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.01840761.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_3_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁█▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁
train_batch_loss,▃▁▁▁▁▁▁▃▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▅▁▁▁▆▁▁▁▁▂

0,1
acuracia,0.9975
do_lower_case,False
fn,0
fp,2
max_seq_len,512
media_test_epoca_loss,0.01841
media_train_epoca_loss,0.2104
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.23397732.
INFO:root:  Média perda(loss) avaliação   : 0.03633972.
INFO:root:  Tempo total treinamento       : 0:06:43.
INFO:root:  Tempo processamento fold: 0:06:57 (h:mm:ss)

INFO:root:  Tempo processamento de todos os folds: 1:07:21 (h:mm:ss)



Folds :   0%|          | 0/10 [00:00<?, ?fold/s]

INFO:root:Processamendo do fold: 1.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 4e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are i

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 1 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69858045; Acc: 0.48500000; Rec: 0.01250000; Pre: 0.22727273, F1:0.02369668, vp:   5; vn: 383; fp:  17; fn: 395
INFO:root:   Acurácia do fold 1 na época 0: 0.48500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69858045.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▄▇▅▇▅▆▃▄▅▃▄▃▄▄▆▄▇▅▆▆▄▅▆▃▅▄▃▄▅▁▃▄█▄

0,1
acuracia,0.485
do_lower_case,False
fn,395
fp,17
max_seq_len,512
media_test_epoca_loss,0.69858
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.34368262.
INFO:root:   Tempo de treinamento da época             : 0:01:03.
INFO:root:   Tempo parcial processamento               : 0:01:33 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.17996529; Acc: 0.94500000; Rec: 1.00000000; Pre: 0.90090090, F1:0.94786730, vp: 400; vn: 356; fp:  44; fn:   0
INFO:root:   Acurácia do fold 1 na época 1: 0.94500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.17996529.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:36 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_4_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▂▁▁▁▇▂▁█▁▁▁▁▂▁▁▁▁▆▁▁▃▁▁▁▁▁▁▄▂▁▁▂█▄▂
train_batch_loss,▃▄▃▃▃▃▂▂▂▄▁▁▁▂▁▃▁█▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▃▃▁▁

0,1
acuracia,0.945
do_lower_case,False
fn,0
fp,44
max_seq_len,512
media_test_epoca_loss,0.17997
media_train_epoca_loss,0.34368
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.07274248.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:02:57 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.04386334; Acc: 0.99250000; Rec: 1.00000000; Pre: 0.98522167, F1:0.99255583, vp: 400; vn: 394; fp:   6; fn:   0
INFO:root:   Acurácia do fold 1 na época 2: 0.99250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.04386334.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:59 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_4_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁█▁▁▁▁▁▁
train_batch_loss,▁█▁▁▁▁▂█▁▁▁▁▁▁▁▁▄▁▁▁▁▁▁▁▁▁▃▄▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9925
do_lower_case,False
fn,0
fp,6
max_seq_len,512
media_test_epoca_loss,0.04386
media_train_epoca_loss,0.07274
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.07233055.
INFO:root:   Tempo de treinamento da época             : 0:01:05.
INFO:root:   Tempo parcial processamento               : 0:04:21 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.05831950; Acc: 0.95750000; Rec: 0.92500000; Pre: 0.98930481, F1:0.95607235, vp: 370; vn: 396; fp:   4; fn:  30
INFO:root:   Acurácia do fold 1 na época 3: 0.95750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.05831950.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:23 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_4_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▃▂▁▁▁▃▁▁▁▁▁▁▅▁▁▁▄▁▃▁▁▁▁▁▁▁▅▁▂▅▄▂▁▁█
train_batch_loss,▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▃▁▁▁▁▁▁▁▁▁▁▁▁▄▂█▁▁

0,1
acuracia,0.9575
do_lower_case,False
fn,30
fp,4
max_seq_len,512
media_test_epoca_loss,0.05832
media_train_epoca_loss,0.07233
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.54551853.
INFO:root:   Tempo de treinamento da época             : 0:01:34.
INFO:root:   Tempo parcial processamento               : 0:06:14 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.16974695; Acc: 0.93125000; Rec: 0.88500000; Pre: 0.97520661, F1:0.92791612, vp: 354; vn: 391; fp:   9; fn:  46
INFO:root:   Acurácia do fold 1 na época 4: 0.93125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.16974695.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:19 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_4_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▇▁▃█▂▁▆▄▄▁▁▁▁▇▂▁▃▁▁▂▁▁▁▂▁▁▆▁▁▁▁▁▅▁▁
train_batch_loss,▁▁▁▃▁▁▁▁▁▄▂▁▁▅▁▁▁▇▂█▂▃▂▃▂▂▃▂▃▃▂▃▃▁▂▁▁▁▁▁

0,1
acuracia,0.93125
do_lower_case,False
fn,46
fp,9
max_seq_len,512
media_test_epoca_loss,0.16975
media_train_epoca_loss,0.54552
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.25856855.
INFO:root:  Média perda(loss) avaliação   : 0.11297377.
INFO:root:  Tempo total treinamento       : 0:06:49.
INFO:root:  Tempo processamento fold: 0:07:03 (h:mm:ss)

INFO:root:Processamendo do fold: 2.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 4e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 2 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69744084; Acc: 0.49375000; Rec: 0.03500000; Pre: 0.42424242, F1:0.06466513, vp:  14; vn: 381; fp:  19; fn: 386
INFO:root:   Acurácia do fold 2 na época 0: 0.49375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69744084.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:15 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▃█▄▆▅▅▄▄▄▄▃▃▄▂▃▆▄▄▅▄▃▅▄▄▅▄▅▄▄▁▂▅▆▄

0,1
acuracia,0.49375
do_lower_case,False
fn,386
fp,19
max_seq_len,512
media_test_epoca_loss,0.69744
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.77923169.
INFO:root:   Tempo de treinamento da época             : 0:01:02.
INFO:root:   Tempo parcial processamento               : 0:01:34 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69374690; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 2 na época 1: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69374690.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:37 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_4_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▄▅▄▅▄▇▅▄▆▁▄▃▄▅▃█▄▄▆▆▅▅▄▄▅▄▅▂▄▃▇▅▄▅
train_batch_loss,▃▃▃▃▄▃▂▃▃▃▂▆▁▁▁▄▁▁▁▆▁▄▃▄▃▃▃▂▂▄▃▂█▁▆▁▃▃▃▃

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.69375
media_train_epoca_loss,0.77923
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.70431991.
INFO:root:   Tempo de treinamento da época             : 0:01:03.
INFO:root:   Tempo parcial processamento               : 0:02:57 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69314694; Acc: 0.50000000; Rec: 1.00000000; Pre: 0.50000000, F1:0.66666667, vp: 400; vn:   0; fp: 400; fn:   0
INFO:root:   Acurácia do fold 2 na época 2: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69314694.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:00 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_4_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▆▄▄▁▁▄▄▄▃▃▆▆▅▄▄▅▃▆▂█▄▃▄▅▄▄▅▂▄▄▄▃▅▂
train_batch_loss,▅▅▅▄▅▅▄▅▄▅█▇▅▄▅▅▅▁▅▅▅▅▅▄▅▆▅▆▅▅▅▆▆▅▅▄▇▅█▅

0,1
acuracia,0.5
do_lower_case,False
fn,0
fp,400
max_seq_len,512
media_test_epoca_loss,0.69315
media_train_epoca_loss,0.70432
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69473233.
INFO:root:   Tempo de treinamento da época             : 0:01:06.
INFO:root:   Tempo parcial processamento               : 0:04:22 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69349947; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 2 na época 3: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69349947.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:25 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_4_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▃▄▄▄▅▅▃▇▅▅█▃▅▅█▅▄▅▇▁▃▅▄▃▆▅▄▁▃▄▄▄▆▅▆
train_batch_loss,▆▅▅▅▅▅▂▁▅▆▅▅▅▂▅▅▅▅▅▅▅▅▅▃▅▅▅▅▅▅▅▆█▅▅▅▅▅▅▅

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.6935
media_train_epoca_loss,0.69473
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69340014.
INFO:root:   Tempo de treinamento da época             : 0:01:35.
INFO:root:   Tempo parcial processamento               : 0:06:16 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69916239; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 2 na época 4: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69916239.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:20 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_4_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▄▄▁▄▅▄▄▇▆█▄█▅▂▆▃▁▆▂▆▅▄▄▃▄▂▅▂▄▄▄▆▅▂▂
train_batch_loss,▅▅▅▅▅▇▅▅▄▅▅▅█▅▄▅▅▅▄▅▄▅▄▅▄▁▅▂▅▅▅▅▅▅▅▇▅▅▅▇

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.69916
media_train_epoca_loss,0.6934
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.71792101.
INFO:root:  Média perda(loss) avaliação   : 0.69488892.
INFO:root:  Tempo total treinamento       : 0:06:48.
INFO:root:  Tempo processamento fold: 0:07:02 (h:mm:ss)

INFO:root:Processamendo do fold: 3.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 4e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 3 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69699712; Acc: 0.49875000; Rec: 0.02750000; Pre: 0.47826087, F1:0.05200946, vp:  11; vn: 388; fp:  12; fn: 389
INFO:root:   Acurácia do fold 3 na época 0: 0.49875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69699712.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▂▃▄▄▃█▄▃▅▂▂▃▃▃▃▄▅▃▃▄▄▄▃▃▃▃▄▄▃▁▂▂▆▁

0,1
acuracia,0.49875
do_lower_case,False
fn,389
fp,12
max_seq_len,512
media_test_epoca_loss,0.697
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.53439593.
INFO:root:   Tempo de treinamento da época             : 0:01:03.
INFO:root:   Tempo parcial processamento               : 0:01:33 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.43043521; Acc: 0.89875000; Rec: 0.96250000; Pre: 0.85365854, F1:0.90481786, vp: 385; vn: 334; fp:  66; fn:  15
INFO:root:   Acurácia do fold 3 na época 1: 0.89875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.43043521.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:36 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_4_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▃▁▁▄▅▂▁▆▁▅▁▃▁▁▂▁▁█▂▁▅▁▁▁▂▁▁▆▁▁▁▁▃▁▃
train_batch_loss,▂▂▂▂▂▂▂▂▂▂▁▃▁▁▁▃▁█▁▃▁▂▁▁▁▁▁▁▅▁▁▁▁▁▁▁▃▁▁▁

0,1
acuracia,0.89875
do_lower_case,False
fn,15
fp,66
max_seq_len,512
media_test_epoca_loss,0.43044
media_train_epoca_loss,0.5344
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.39315319.
INFO:root:   Tempo de treinamento da época             : 0:01:03.
INFO:root:   Tempo parcial processamento               : 0:02:56 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.28486399; Acc: 0.89875000; Rec: 0.80250000; Pre: 0.99380805, F1:0.88796680, vp: 321; vn: 398; fp:   2; fn:  79
INFO:root:   Acurácia do fold 3 na época 2: 0.89875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.28486399.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:02:58 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_4_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▃█▁▇▂▄▁▁▄▁▄▁█▁▅▁▁▁▂▁▁▂▁▅▂▁▁▂▂▁█▃▁
train_batch_loss,▇▄▁▁▁▁▂▂▂▁▁▁▁▁▁▁▃▁▄▁▂▅▂▁▁▁█▃▅▂▄▁█▄▁▁▃▄▁▃

0,1
acuracia,0.89875
do_lower_case,False
fn,79
fp,2
max_seq_len,512
media_test_epoca_loss,0.28486
media_train_epoca_loss,0.39315
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.73394324.
INFO:root:   Tempo de treinamento da época             : 0:01:03.
INFO:root:   Tempo parcial processamento               : 0:04:19 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.67491060; Acc: 0.54750000; Rec: 0.09500000; Pre: 1.00000000, F1:0.17351598, vp:  38; vn: 400; fp:   0; fn: 362
INFO:root:   Acurácia do fold 3 na época 3: 0.54750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.67491060.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:22 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_4_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▆▂▃▅▃▆▄▆▆▆▆▁▂█▆▆▄▇▁▃▄▆▅▄▅▆▅▅▄▅▄▆▆▆▅
train_batch_loss,▁▁▁▄▁▁▁▁▁▁▁▁▅▁▄▄▁▁▂▃▂▂▂▂▃▃▃▂▁▁▁▅█▅▁▂▃▃▂▃

0,1
acuracia,0.5475
do_lower_case,False
fn,362
fp,0
max_seq_len,512
media_test_epoca_loss,0.67491
media_train_epoca_loss,0.73394
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.66146634.
INFO:root:   Tempo de treinamento da época             : 0:01:36.
INFO:root:   Tempo parcial processamento               : 0:06:14 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.66052624; Acc: 0.54750000; Rec: 0.09500000; Pre: 1.00000000, F1:0.17351598, vp:  38; vn: 400; fp:   0; fn: 362
INFO:root:   Acurácia do fold 3 na época 4: 0.54750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.66052624.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:18 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_4_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▇▇▇▄▃█▆▁▅▇▇▇▆█▇▇▇▇▇▇█▇▇▇▆▅▇▇▇▇▇▇█▇▆
train_batch_loss,▅▆▆▆▆▆▆▆▆▆▅█▆▁▅▆▆▆▆▆▆▆▆▆▆▅▆▅▆▆▆▆▂▆▆▆▆▆▅▇

0,1
acuracia,0.5475
do_lower_case,False
fn,362
fp,0
max_seq_len,512
media_test_epoca_loss,0.66053
media_train_epoca_loss,0.66147
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.58073968.
INFO:root:  Média perda(loss) avaliação   : 0.51268401.
INFO:root:  Tempo total treinamento       : 0:06:47.
INFO:root:  Tempo processamento fold: 0:07:02 (h:mm:ss)

INFO:root:Processamendo do fold: 4.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 4e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 4 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69861526; Acc: 0.49750000; Rec: 0.02250000; Pre: 0.45000000, F1:0.04285714, vp:   9; vn: 389; fp:  11; fn: 391
INFO:root:   Acurácia do fold 4 na época 0: 0.49750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69861526.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▁▃▅▄▇▁▅▃▃▄▂▃▆▄▄▃▄▆▄▃▄▂▄▅▅▄▅▄▅▄▃▁▄█▅

0,1
acuracia,0.4975
do_lower_case,False
fn,391
fp,11
max_seq_len,512
media_test_epoca_loss,0.69862
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.51205355.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:01:34 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.46943696; Acc: 0.79250000; Rec: 0.61250000; Pre: 0.95703125, F1:0.74695122, vp: 245; vn: 389; fp:  11; fn: 155
INFO:root:   Acurácia do fold 4 na época 1: 0.79250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.46943696.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:37 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_4_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▆▂▂██▅▁▆▂▆▂▃▃▆▂▂▃▆▄▂▅▂▂▂▃▃▂▇▅▄▇▆▄▃▅
train_batch_loss,▃▄▂▂▃▃▂▂▂▂▄▂▁▂▁▄▁▇▂▂▁▄▁▁▁▁▁▁▁█▁▁▁▂▁▁▁▄▁▂

0,1
acuracia,0.7925
do_lower_case,False
fn,155
fp,11
max_seq_len,512
media_test_epoca_loss,0.46944
media_train_epoca_loss,0.51205
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.56404669.
INFO:root:   Tempo de treinamento da época             : 0:01:05.
INFO:root:   Tempo parcial processamento               : 0:02:58 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.49274171; Acc: 0.74125000; Rec: 0.48250000; Pre: 1.00000000, F1:0.65092749, vp: 193; vn: 400; fp:   0; fn: 207
INFO:root:   Acurácia do fold 4 na época 2: 0.74125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.49274171.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:01 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_4_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▅▆▆▄▁▆▃▆▄█▇▇▅█▅▆▄▇▅▅█▄▄▄▇▃▃▇▆▇▆▆▆▆
train_batch_loss,▄▄▄▁▁▁▁▁▂▁█▁▁▁▆▆▃▂▅▂▃▂▂▁▄▃▃▃▂▄▃▃▁▃▂▃▃▄▁▃

0,1
acuracia,0.74125
do_lower_case,False
fn,207
fp,0
max_seq_len,512
media_test_epoca_loss,0.49274
media_train_epoca_loss,0.56405
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.49543099.
INFO:root:   Tempo de treinamento da época             : 0:01:03.
INFO:root:   Tempo parcial processamento               : 0:04:21 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.48846784; Acc: 0.74125000; Rec: 0.48250000; Pre: 1.00000000, F1:0.65092749, vp: 193; vn: 400; fp:   0; fn: 207
INFO:root:   Acurácia do fold 4 na época 3: 0.74125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.48846784.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:24 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_4_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▇▇█▂▃▆▆▅█▃▂▆▇▄▁▅▄▇▆▄▅▇▃▂▅▄▃▆▇▃▃▂▇▅▇
train_batch_loss,▃▂▄▃▄▄▄▃▄▃▄▄▄▃▄▄▄▄▄▄▄▄▄▃▄▄▄▃▄▂▄▄█▂▁▄▃▁▃▁

0,1
acuracia,0.74125
do_lower_case,False
fn,207
fp,0
max_seq_len,512
media_test_epoca_loss,0.48847
media_train_epoca_loss,0.49543
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.58934385.
INFO:root:   Tempo de treinamento da época             : 0:01:42.
INFO:root:   Tempo parcial processamento               : 0:06:23 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69572639; Acc: 0.50000000; Rec: 1.00000000; Pre: 0.50000000, F1:0.66666667, vp: 400; vn:   0; fp: 400; fn:   0
INFO:root:   Acurácia do fold 4 na época 4: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69572639.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:27 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_4_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▇▆▅▅▅▅▄▁▂▅▄▆▄▃█▄▄▅▅▂▅▇▅▅▃▄▂▄▅▄▅▄▅▇
train_batch_loss,▄▅▂▅▄▂▅▅▁▄▄▁▃▅▃▂▃▄▄▅▃▅▃▅▂▂█▁▇▅▅▆▄▅▄▅▅▄▄▄

0,1
acuracia,0.5
do_lower_case,False
fn,0
fp,400
max_seq_len,512
media_test_epoca_loss,0.69573
media_train_epoca_loss,0.58934
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.54021877.
INFO:root:  Média perda(loss) avaliação   : 0.53659322.
INFO:root:  Tempo total treinamento       : 0:06:55.
INFO:root:  Tempo processamento fold: 0:07:09 (h:mm:ss)

INFO:root:Processamendo do fold: 5.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 4e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 5 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69835621; Acc: 0.49125000; Rec: 0.02500000; Pre: 0.37037037, F1:0.04683841, vp:  10; vn: 383; fp:  17; fn: 390
INFO:root:   Acurácia do fold 5 na época 0: 0.49125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69835621.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▂▄▅█▄▆▃▄▆▁▃▃▄▂▂▇▇▄▅▃▅▆▃▂▅▃▅▅▅▁▂▂█▄

0,1
acuracia,0.49125
do_lower_case,False
fn,390
fp,17
max_seq_len,512
media_test_epoca_loss,0.69836
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.42859673.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:01:34 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.07688111; Acc: 0.96625000; Rec: 1.00000000; Pre: 0.93676815, F1:0.96735187, vp: 400; vn: 373; fp:  27; fn:   0
INFO:root:   Acurácia do fold 5 na época 1: 0.96625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.07688111.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:37 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_4_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁█▅▁▁▁▂▁▇▁▁▃▁▁▅▁▁▁▁▁▁▄▆▁▄▁▆▁▁▁▁▅
train_batch_loss,▂▂▂▂▂▂▂▂▁▂▂▂▁▁▁▂▁█▁▂▁▃█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.96625
do_lower_case,False
fn,0
fp,27
max_seq_len,512
media_test_epoca_loss,0.07688
media_train_epoca_loss,0.4286
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.37944810.
INFO:root:   Tempo de treinamento da época             : 0:01:05.
INFO:root:   Tempo parcial processamento               : 0:02:59 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.52486274; Acc: 0.71375000; Rec: 0.43000000; Pre: 0.99421965, F1:0.60034904, vp: 172; vn: 399; fp:   1; fn: 228
INFO:root:   Acurácia do fold 5 na época 2: 0.71375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.52486274.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:02 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_4_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▆▆▄▅▆▅▆▃▂▅▅▅▅▆▄█▁▅▄▄▄▄▅▆▄▁▆▄▄▄▂▄▄▄
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▄▁▃▂▁▂▂▂▁▂▂▂▂▂▁▂

0,1
acuracia,0.71375
do_lower_case,False
fn,228
fp,1
max_seq_len,512
media_test_epoca_loss,0.52486
media_train_epoca_loss,0.37945
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.67396678.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:04:23 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69321133; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 5 na época 3: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69321133.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:26 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_4_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▂▅▄▄▁▅▃▅▆▃█▁▄▇▃▅▇▅█▁▂▅▅▄▂▅▅▄▁▄▇▇▆▅▇
train_batch_loss,▃▆▄▂▁▅▄▄▅▅▆▆▅▅▅▅▅▅▅▅▅▅▅▄▆▅▅▅▅▅▅▆█▅▆▅▅▅▅▅

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.69321
media_train_epoca_loss,0.67397
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 5 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69334989.
INFO:root:   Tempo de treinamento da época             : 0:01:46.
INFO:root:   Tempo parcial processamento               : 0:06:28 (h:mm:ss)
INFO:root:Realizando avaliação do fold 5 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69482079; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 5 na época 4: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69482079.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:32 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_4_b_23_23_f5_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▄▄▄▄▄█▄▇█▄▄▁▁▄▇▄▂▅▂▄▄▄▄▄▁▂▆▂▄▄▃▄▄▆▂
train_batch_loss,▄▄▄▄▄▄▄▄▃▄▄▅█▄▁▄▅▄▄▄▄▄▃▄▄▁▄▁▄▄▄▄▄▃▄▄▄▄▂▅

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.69482
media_train_epoca_loss,0.69335
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.54384038.
INFO:root:  Média perda(loss) avaliação   : 0.49744399.
INFO:root:  Tempo total treinamento       : 0:07:01.
INFO:root:  Tempo processamento fold: 0:07:14 (h:mm:ss)

INFO:root:Processamendo do fold: 6.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 4e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 6 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69707560; Acc: 0.49250000; Rec: 0.02250000; Pre: 0.37500000, F1:0.04245283, vp:   9; vn: 385; fp:  15; fn: 391
INFO:root:   Acurácia do fold 6 na época 0: 0.49250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69707560.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:15 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▄█▅▇▅▅▅▅▆▂▄▅▅▆▄█▆▅▆▄▄▆▆▆▆▅▄▆▄▄▁▄▇▅

0,1
acuracia,0.4925
do_lower_case,False
fn,391
fp,15
max_seq_len,512
media_test_epoca_loss,0.69708
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.37012506.
INFO:root:   Tempo de treinamento da época             : 0:01:03.
INFO:root:   Tempo parcial processamento               : 0:01:36 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.03033383; Acc: 0.99875000; Rec: 1.00000000; Pre: 0.99750623, F1:0.99875156, vp: 400; vn: 399; fp:   1; fn:   0
INFO:root:   Acurácia do fold 6 na época 1: 0.99875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.03033383.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:39 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_4_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▂▂▁▁▂▂▂▄▁▂▁▆▁▁▂▁▂▅▂▂▂▂▂▁▂▂▁█▁▂▃▂▂▁▂
train_batch_loss,▂▃▂▂▂▃▁▂▁▁▁▁▁▁▁█▁▁▁▃▁▄▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.99875
do_lower_case,False
fn,0
fp,1
max_seq_len,512
media_test_epoca_loss,0.03033
media_train_epoca_loss,0.37013
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.17330061.
INFO:root:   Tempo de treinamento da época             : 0:01:03.
INFO:root:   Tempo parcial processamento               : 0:02:59 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.05381029; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 6 na época 2: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.05381029.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:02 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_4_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▂▁▅▁▁▁█▁▆▁▄▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁▂▁▁▂▁
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.05381
media_train_epoca_loss,0.1733
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.11212194.
INFO:root:   Tempo de treinamento da época             : 0:01:06.
INFO:root:   Tempo parcial processamento               : 0:04:24 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00053123; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 6 na época 3: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00053123.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:27 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_4_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▃▆▇▂▂▂▂▂▃▂▃▅█▃▂▂▂▂▃▁▂▂▂▂▄▂▂▁▂▅▅▃▃▂▃
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00053
media_train_epoca_loss,0.11212
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 6 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.09738028.
INFO:root:   Tempo de treinamento da época             : 0:01:53.
INFO:root:   Tempo parcial processamento               : 0:06:36 (h:mm:ss)
INFO:root:Realizando avaliação do fold 6 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.00098007; Acc: 1.00000000; Rec: 1.00000000; Pre: 1.00000000, F1:1.00000000, vp: 400; vn: 400; fp:   0; fn:   0
INFO:root:   Acurácia do fold 6 na época 4: 1.00000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.00098007.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:41 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_4_b_23_23_f6_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▃▁▅█▁▁▁▃▂▂▃▁▄▄▁▃▁▁▇▁▂▄▂▂▁▂▁▁▂▁▁▂▃▅
train_batch_loss,▁▁▁▁▁▁█▇▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▆▇▁▁▁▁▁▁▁

0,1
acuracia,1.0
do_lower_case,False
fn,0
fp,0
max_seq_len,512
media_test_epoca_loss,0.00098
media_train_epoca_loss,0.09738
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.18823197.
INFO:root:  Média perda(loss) avaliação   : 0.02141386.
INFO:root:  Tempo total treinamento       : 0:07:03.
INFO:root:  Tempo processamento fold: 0:07:17 (h:mm:ss)

INFO:root:Processamendo do fold: 7.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 4e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 7 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69773722; Acc: 0.49250000; Rec: 0.03000000; Pre: 0.40000000, F1:0.05581395, vp:  12; vn: 382; fp:  18; fn: 388
INFO:root:   Acurácia do fold 7 na época 0: 0.49250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69773722.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▁▄█▄▇▆▅▅▄▅▁▃▃▄▄▂██▅▅▄▃▄▆▅▄▄▅▂▂▂▂▇▇▅

0,1
acuracia,0.4925
do_lower_case,False
fn,388
fp,18
max_seq_len,512
media_test_epoca_loss,0.69774
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.45227612.
INFO:root:   Tempo de treinamento da época             : 0:01:05.
INFO:root:   Tempo parcial processamento               : 0:01:35 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.33216888; Acc: 0.95000000; Rec: 0.90500000; Pre: 0.99450549, F1:0.94764398, vp: 362; vn: 398; fp:   2; fn:  38
INFO:root:   Acurácia do fold 7 na época 1: 0.95000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.33216888.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:38 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_4_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▂▁▁▁▇▁▁▁▁▁▁▁▁▁▁▂▅▁▁▂▁▁▅▁█▃▂▃▁▁▁
train_batch_loss,▃▅▃▃▄▃▃▃▁▁▁▁▁▁▁█▁▄▃▄▁▄▁▁▁▁▁▁▁▅▃▁▁▁▁▁▁▁▂▁

0,1
acuracia,0.95
do_lower_case,False
fn,38
fp,2
max_seq_len,512
media_test_epoca_loss,0.33217
media_train_epoca_loss,0.45228
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.31371864.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:02:59 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.66489473; Acc: 0.58125000; Rec: 0.16250000; Pre: 1.00000000, F1:0.27956989, vp:  65; vn: 400; fp:   0; fn: 335
INFO:root:   Acurácia do fold 7 na época 2: 0.58125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.66489473.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:02 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_4_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▄▅▅▃▇▆▅▅▅▄▆▄▅▁▅▁▅▃▅▆▂▅▇▄▄▄█▃▇▅▅▂▃▃▃
train_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▅▁▄▂▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▃▂▁▂

0,1
acuracia,0.58125
do_lower_case,False
fn,335
fp,0
max_seq_len,512
media_test_epoca_loss,0.66489
media_train_epoca_loss,0.31372
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.70927828.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:04:22 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.47781749; Acc: 0.80125000; Rec: 0.67750000; Pre: 0.90033223, F1:0.77318117, vp: 271; vn: 370; fp:  30; fn: 129
INFO:root:   Acurácia do fold 7 na época 3: 0.80125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.47781749.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:25 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_4_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▄▃▂▃▂▃▁▃▂▁█▁▂█▁▂▃▁▂▂▁▃▁▁▁▃▄▂▃▂▃▆▃▇▆
train_batch_loss,▃▂▁▁▁▁▁█▂▁▂▅▃▃▃▃▃▂▁▄▄▂▃▁▃▃▅▂▁▂▃▄▃▂▁▂▅▁▂▄

0,1
acuracia,0.80125
do_lower_case,False
fn,129
fp,30
max_seq_len,512
media_test_epoca_loss,0.47782
media_train_epoca_loss,0.70928
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 7 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.70299901.
INFO:root:   Tempo de treinamento da época             : 0:01:54.
INFO:root:   Tempo parcial processamento               : 0:06:35 (h:mm:ss)
INFO:root:Realizando avaliação do fold 7 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.61480581; Acc: 0.72750000; Rec: 0.55750000; Pre: 0.84469697, F1:0.67168675, vp: 223; vn: 359; fp:  41; fn: 177
INFO:root:   Acurácia do fold 7 na época 4: 0.72750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.61480581.
INFO:root:   Tempo de avaliação da época               : 0:00:05.
INFO:root:   Tempo parcial do processamento            : 0:06:40 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_4_b_23_23_f7_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▇▇▃▂▆▁▄▇▄▃▃▁▃▆█▁▃▅▁▆▁▂▃▄▃▃▅▂▁▄▂▂▂▃▁
train_batch_loss,▃▃▁▂▃▃▂▂▁▁▁▁▃▂▂▁▁▄▁▄▁▁▃▃▁█▂▂▂▂▂▆▂▂▃▃▁▁▁▂

0,1
acuracia,0.7275
do_lower_case,False
fn,177
fp,41
max_seq_len,512
media_test_epoca_loss,0.61481
media_train_epoca_loss,0.703
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:05


INFO:root:  Média perda(loss) treinamento : 0.54456801.
INFO:root:  Média perda(loss) avaliação   : 0.52242173.
INFO:root:  Tempo total treinamento       : 0:07:05.
INFO:root:  Tempo processamento fold: 0:07:19 (h:mm:ss)

INFO:root:Processamendo do fold: 8.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 4e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 8 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69595567; Acc: 0.49750000; Rec: 0.02000000; Pre: 0.44444444, F1:0.03827751, vp:   8; vn: 390; fp:  10; fn: 392
INFO:root:   Acurácia do fold 8 na época 0: 0.49750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69595567.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▅█▅▇▄▅▃▅▄▅▄▄▄▅▅▇▄▅▅▅▅▄▄▅▅▆▅▅▃▁▂▃█▅

0,1
acuracia,0.4975
do_lower_case,False
fn,392
fp,10
max_seq_len,512
media_test_epoca_loss,0.69596
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.66478217.
INFO:root:   Tempo de treinamento da época             : 0:01:06.
INFO:root:   Tempo parcial processamento               : 0:01:36 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.36855290; Acc: 0.88250000; Rec: 0.78500000; Pre: 0.97515528, F1:0.86980609, vp: 314; vn: 392; fp:   8; fn:  86
INFO:root:   Acurácia do fold 8 na época 1: 0.88250000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.36855290.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:38 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_4_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▇▁▂▂▁▁▁▃▁▁▂▁█▂▁▄▂▁▃▁▁▁▁▃▂▂▂▃▂▂▃
train_batch_loss,▄█▄▅▆▄▄▅▆▄▇▆▃▃▂▇▄▅▄▄▄▅▄▄▄█▁▁▁▆▄▄▅▂▃▂▄▄█▁

0,1
acuracia,0.8825
do_lower_case,False
fn,86
fp,8
max_seq_len,512
media_test_epoca_loss,0.36855
media_train_epoca_loss,0.66478
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.46343806.
INFO:root:   Tempo de treinamento da época             : 0:01:07.
INFO:root:   Tempo parcial processamento               : 0:03:01 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.20243840; Acc: 0.95125000; Rec: 1.00000000; Pre: 0.91116173, F1:0.95351609, vp: 400; vn: 361; fp:  39; fn:   0
INFO:root:   Acurácia do fold 8 na época 2: 0.95125000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.20243840.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:04 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_4_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▃▃▁▄▁█▁▁▂▂▂▂▁▁▂▁▁▃▂▁▂▂▁▂▁▂▁▃▁▁▂▅▁
train_batch_loss,▁▅▂▄▃▂▂▃▆▁▁▁▄▂▃▃▂▂▂▁▂▂▁▁▂▁▁▁▁█▁▁▁▁▁▁▂▆▁▁

0,1
acuracia,0.95125
do_lower_case,False
fn,0
fp,39
max_seq_len,512
media_test_epoca_loss,0.20244
media_train_epoca_loss,0.46344
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.65088326.
INFO:root:   Tempo de treinamento da época             : 0:01:06.
INFO:root:   Tempo parcial processamento               : 0:04:28 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.41505317; Acc: 0.91375000; Rec: 0.91500000; Pre: 0.91271820, F1:0.91385768, vp: 366; vn: 365; fp:  35; fn:  34
INFO:root:   Acurácia do fold 8 na época 3: 0.91375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.41505317.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:31 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_4_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,█▅▇▁▂▂▁▁▇▄▁▁▁▂▁▁▁▁▄▂▄▂▁▂▁▁▂▂▁█▅█▃▃▁
train_batch_loss,▁▁▁▃▁█▁▂▃▂▂▂▂▂▄▃▃▃▂▃▃▃▂▁▃▃▅▂▃▂▃▂▃▂▁▄▁▁▁▁

0,1
acuracia,0.91375
do_lower_case,False
fn,34
fp,35
max_seq_len,512
media_test_epoca_loss,0.41505
media_train_epoca_loss,0.65088
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 8 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.43069414.
INFO:root:   Tempo de treinamento da época             : 0:01:52.
INFO:root:   Tempo parcial processamento               : 0:06:39 (h:mm:ss)
INFO:root:Realizando avaliação do fold 8 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.68797588; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 8 na época 4: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.68797588.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:44 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_4_b_23_23_f8_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▄▅▄▂▅▄▄▆▆█▅▂▅▂▆▃▅▆▄▄▅▄▅▄▅▁▄▃▅▁▃▄▄▆▃
train_batch_loss,▁▁▁▆▁▁▂▁▁▁▁▁▂▂▁▁▁▅▁▅▁▁▁▁▁▁▆▁▁▂▂▂▂▂▁█▃▂▂▂

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.68798
media_train_epoca_loss,0.43069
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.55244941.
INFO:root:  Média perda(loss) avaliação   : 0.41850509.
INFO:root:  Tempo total treinamento       : 0:07:18.
INFO:root:  Tempo processamento fold: 0:07:32 (h:mm:ss)

INFO:root:Processamendo do fold: 9.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 4e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 9 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69937896; Acc: 0.48625000; Rec: 0.02750000; Pre: 0.33333333, F1:0.05080831, vp:  11; vn: 378; fp:  22; fn: 389
INFO:root:   Acurácia do fold 9 na época 0: 0.48625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69937896.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▅█▅▆▅▄▄▃▄▄▄▅▄▄▄▅▅▅▄▄▄▄▄▄▃▄▅▃▅▁▃▅▆▃

0,1
acuracia,0.48625
do_lower_case,False
fn,389
fp,22
max_seq_len,512
media_test_epoca_loss,0.69938
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.58310479.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:01:34 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69382877; Acc: 0.50000000; Rec: 1.00000000; Pre: 0.50000000, F1:0.66666667, vp: 400; vn:   0; fp: 400; fn:   0
INFO:root:   Acurácia do fold 9 na época 1: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69382877.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:37 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_4_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▅▅▇▃▅▅▅▅▃█▅▅▆▇█▁▆▅▅▄▅▄▅▆▅▃▅▂▅▃▅▄▆▅
train_batch_loss,▂▃▂▂▂▂▂▁▂▁▁▁▁▁▁▄▁█▁▇▁▄▁▁▁▅▂▂▂▂▂▂▂▂▂▂▂▂▂▂

0,1
acuracia,0.5
do_lower_case,False
fn,0
fp,400
max_seq_len,512
media_test_epoca_loss,0.69383
media_train_epoca_loss,0.5831
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


VBox(children=(Label(value='Waiting for wandb.init()...\r'), FloatProgress(value=0.03333744208017985, max=1.0)…

INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69437664.
INFO:root:   Tempo de treinamento da época             : 0:01:05.
INFO:root:   Tempo parcial processamento               : 0:03:00 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.70508752; Acc: 0.50000000; Rec: 1.00000000; Pre: 0.50000000, F1:0.66666667, vp: 400; vn:   0; fp: 400; fn:   0
INFO:root:   Acurácia do fold 9 na época 2: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.70508752.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:02 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_4_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▅▆▆▁▅▆▅▅▅▄▅▅▆▅▂▄▄▅▅█▅▃▆▆▃▃▃▃▆▅▅▅▄▄
train_batch_loss,▅▅▅▅▅▅▅▅▅▅▅▅▅▁▆▅█▆▅▅▅▅▆▆▅▅▅▆▅▅▅▅▆▅▅▄▅▆▆▅

0,1
acuracia,0.5
do_lower_case,False
fn,0
fp,400
max_seq_len,512
media_test_epoca_loss,0.70509
media_train_epoca_loss,0.69438
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69131999.
INFO:root:   Tempo de treinamento da época             : 0:01:06.
INFO:root:   Tempo parcial processamento               : 0:04:26 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69627360; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 9 na época 3: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69627360.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:29 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_4_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▅▅▃▄▄▄▅▅▅█▄▄▅▇█▃▅▅▁▄▅▄▆▅▅▆▁▄▁▅▃▆▃▆
train_batch_loss,▅▅▅▅▆▅▃▃▅▅▆▅▅▃▅▅▅▅▅▅▅▅▅▁▅▅▅▅▅▅▅▆█▅▅▅▅▅▅▅

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.69627
media_train_epoca_loss,0.69132
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 9 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69367084.
INFO:root:   Tempo de treinamento da época             : 0:01:52.
INFO:root:   Tempo parcial processamento               : 0:06:37 (h:mm:ss)
INFO:root:Realizando avaliação do fold 9 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69351006; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 9 na época 4: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69351006.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:42 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_4_b_23_23_f9_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▄▁▂▄▃▆▁▄▃▄▅▇▆█▄▄▅▅▃▆▆▂▃▁▄▄▃▅▄▄▄▅▅▂▂
train_batch_loss,▅▅▅▅▅▅▅▅▅▅▅██▅▄▅▆▅▅▅▅▆▄▅▅▃▅▁▅▅▅▅▅▅▅▆▆▅▅▆

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.69351
media_train_epoca_loss,0.69367
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.66561806.
INFO:root:  Média perda(loss) avaliação   : 0.69717499.
INFO:root:  Tempo total treinamento       : 0:07:20.
INFO:root:  Tempo processamento fold: 0:07:34 (h:mm:ss)

INFO:root:Processamendo do fold: 10.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 4e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCl

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 10 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69857895; Acc: 0.49625000; Rec: 0.02750000; Pre: 0.44000000, F1:0.05176471, vp:  11; vn: 386; fp:  14; fn: 389
INFO:root:   Acurácia do fold 10 na época 0: 0.49625000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69857895.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▃▃▅▄█▄▆▅▅▆▄▄▅▅▃▃▆▇▅▄▅▄▅▅▅▄▅▅▅▅▂▁▂█▃

0,1
acuracia,0.49625
do_lower_case,False
fn,389
fp,14
max_seq_len,512
media_test_epoca_loss,0.69858
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.37492328.
INFO:root:   Tempo de treinamento da época             : 0:01:06.
INFO:root:   Tempo parcial processamento               : 0:01:36 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.09595237; Acc: 0.98750000; Rec: 1.00000000; Pre: 0.97560976, F1:0.98765432, vp: 400; vn: 390; fp:  10; fn:   0
INFO:root:   Acurácia do fold 10 na época 1: 0.98750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.09595237.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:39 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_4_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▃▁▁▁▁▁▁▁▁█▁▃█▁▁▁▁▁▂▁▁▁▁▁▁▁▁▁▃▁▁▁▁
train_batch_loss,▂▂▂▂▂▂▂▁▁▁▁▁▁▁▁▄▁█▁▄▁▃▁▁▃▁▃▁▁▁▁▁▁▁▁▁▂▁▁▁

0,1
acuracia,0.9875
do_lower_case,False
fn,0
fp,10
max_seq_len,512
media_test_epoca_loss,0.09595
media_train_epoca_loss,0.37492
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.68841971.
INFO:root:   Tempo de treinamento da época             : 0:01:07.
INFO:root:   Tempo parcial processamento               : 0:03:02 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.70744104; Acc: 0.50000000; Rec: 1.00000000; Pre: 0.50000000, F1:0.66666667, vp: 400; vn:   0; fp: 400; fn:   0
INFO:root:   Acurácia do fold 10 na época 2: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.70744104.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:05 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_4_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▇▇▄▃▄▅▅▄▅▄▄▅▆▄▄▃▁▄▂█▁▆▆▆▂▁▇▅▂▄▅▄▅▂
train_batch_loss,▁▁▁▁▁▁▆▇▇▇▇▇█▆▇▇█▆▇▇▇▇▇█▇▇▇▇▇▇▇▆█▇▇▇▇▇▇▇

0,1
acuracia,0.5
do_lower_case,False
fn,0
fp,400
max_seq_len,512
media_test_epoca_loss,0.70744
media_train_epoca_loss,0.68842
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69753778.
INFO:root:   Tempo de treinamento da época             : 0:01:06.
INFO:root:   Tempo parcial processamento               : 0:04:30 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69394024; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 10 na época 3: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69394024.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:32 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_4_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▃▅▅▄▄▆▃▄▇▄█▂▅█▅▅▃▄▇▁▂▅▄▂▄▆▅▁▇▄▆▅▅▅▅
train_batch_loss,▇▃▃▃▃▃▁▁▃▃▄▃▃▂▃▃▃▃▃▃▃▃▃▃▃▃▃▃▃▄▃▄█▃▃▃▃▃▃▃

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.69394
media_train_epoca_loss,0.69754
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 10 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69362080.
INFO:root:   Tempo de treinamento da época             : 0:01:52.
INFO:root:   Tempo parcial processamento               : 0:06:43 (h:mm:ss)
INFO:root:Realizando avaliação do fold 10 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69744852; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 10 na época 4: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69744852.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:47 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_4_b_23_23_f10_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /con

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▅▃▅▅█▅█▇▅▄▄▅▆▇▂▄▅▁▅▇▄▁▄▄▆█▄▅▅▃▅▆▇▁
train_batch_loss,▃▄▄▄▄▄▄▄▄▄▂█▃▄▅▄▂▄▄▄▄▄▄▄▄▃▄▁▄▄▄▄▄▄▄▅▅▄▃▅

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.69745
media_train_epoca_loss,0.69362
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.61362539.
INFO:root:  Média perda(loss) avaliação   : 0.54869554.
INFO:root:  Tempo total treinamento       : 0:07:25.
INFO:root:  Tempo processamento fold: 0:07:39 (h:mm:ss)

INFO:root:  Tempo processamento de todos os folds: 1:13:00 (h:mm:ss)



Folds :   0%|          | 0/10 [00:00<?, ?fold/s]

INFO:root:Processamendo do fold: 1.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 5e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are i

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 1 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69858045; Acc: 0.48500000; Rec: 0.01250000; Pre: 0.22727273, F1:0.02369668, vp:   5; vn: 383; fp:  17; fn: 395
INFO:root:   Acurácia do fold 1 na época 0: 0.48500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69858045.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:15 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_5_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▄▇▅▇▅▆▃▄▅▃▄▃▄▄▆▄▇▅▆▆▄▅▆▃▅▄▃▄▅▁▃▄█▄

0,1
acuracia,0.485
do_lower_case,False
fn,395
fp,17
max_seq_len,512
media_test_epoca_loss,0.69858
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.59620686.
INFO:root:   Tempo de treinamento da época             : 0:01:04.
INFO:root:   Tempo parcial processamento               : 0:01:34 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.49708007; Acc: 0.83750000; Rec: 0.68000000; Pre: 0.99270073, F1:0.80712166, vp: 272; vn: 398; fp:   2; fn: 128
INFO:root:   Acurácia do fold 1 na época 1: 0.83750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.49708007.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:37 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_5_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▂▁▁▂█▂▅▄▆▁▁▁▁▂▁▁▁▃▄▃▂▄▁▂▅▃▁▃▂▁▂▃▁▁▃
train_batch_loss,▃▄▃▃▂▃▂▂▂▂▁▁▁▁▁▄▁█▁▄▂▃▅▁▂▁▁▁▁▅▂▁▁▁▃▁▃▂▁▁

0,1
acuracia,0.8375
do_lower_case,False
fn,128
fp,2
max_seq_len,512
media_test_epoca_loss,0.49708
media_train_epoca_loss,0.59621
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.67231511.
INFO:root:   Tempo de treinamento da época             : 0:01:05.
INFO:root:   Tempo parcial processamento               : 0:02:59 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69698830; Acc: 0.50000000; Rec: 1.00000000; Pre: 0.50000000, F1:0.66666667, vp: 400; vn:   0; fp: 400; fn:   0
INFO:root:   Acurácia do fold 1 na época 2: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69698830.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:02 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_5_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▆▅▄▄▂▁▄▄▄▃▄▄▆▆▄▄▄▂▅▅█▃▂▄▅▂▄▇▃▂▄▄▄▂▁
train_batch_loss,▄▃▁▁▁▁▃▁▄▁█▄▄▄▄▄▃▁▇▃▃▃▃▃▃▃▃▄▃▃▃▃▄▃▃▃▄▃▃▃

0,1
acuracia,0.5
do_lower_case,False
fn,0
fp,400
max_seq_len,512
media_test_epoca_loss,0.69699
media_train_epoca_loss,0.67232
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69533588.
INFO:root:   Tempo de treinamento da época             : 0:01:06.
INFO:root:   Tempo parcial processamento               : 0:04:25 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69341038; Acc: 0.50000000; Rec: 1.00000000; Pre: 0.50000000, F1:0.66666667, vp: 400; vn:   0; fp: 400; fn:   0
INFO:root:   Acurácia do fold 1 na época 3: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69341038.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:28 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_5_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▂▆▄▅▆▅▇▄▄▅▁▆▅▂▂▅▃▅▅█▆▅▅▇▆▄▅▇▃▅▄▆▄▅▃
train_batch_loss,▅▄▄▄▅▄▂▁▅▅▃▄▄▄▄▄▄▄▄▄▄▄▄▂▄▄▄▄▄▄▄▅█▄▅▄▄▄▄▄

0,1
acuracia,0.5
do_lower_case,False
fn,0
fp,400
max_seq_len,512
media_test_epoca_loss,0.69341
media_train_epoca_loss,0.69534
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 1 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69474919.
INFO:root:   Tempo de treinamento da época             : 0:01:54.
INFO:root:   Tempo parcial processamento               : 0:06:38 (h:mm:ss)
INFO:root:Realizando avaliação do fold 1 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69447917; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 1 na época 4: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69447917.
INFO:root:   Tempo de avaliação da época               : 0:00:05.
INFO:root:   Tempo parcial do processamento            : 0:06:43 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_5_b_23_23_f1_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▃▂▂▃▁▄▃▄▅▅▄█▂▄▄▁▄▅▂▅▇▃▄▃▃▂▅▁▄▃▃▅▃▃▁
train_batch_loss,▅▅▅▅▅▅▅▅▅▅▅▆█▅▅▅▅▅▅▅█▅▅▅▆▁▅▁▅▅▅▅▅▅▅▆▆▅▃▆

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.69448
media_train_epoca_loss,0.69475
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:05


INFO:root:  Média perda(loss) treinamento : 0.66465176.
INFO:root:  Média perda(loss) avaliação   : 0.64548948.
INFO:root:  Tempo total treinamento       : 0:07:23.
INFO:root:  Tempo processamento fold: 0:07:37 (h:mm:ss)

INFO:root:Processamendo do fold: 2.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 5e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 2 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69744084; Acc: 0.49375000; Rec: 0.03500000; Pre: 0.42424242, F1:0.06466513, vp:  14; vn: 381; fp:  19; fn: 386
INFO:root:   Acurácia do fold 2 na época 0: 0.49375000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69744084.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_5_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▃█▄▆▅▅▄▄▄▄▃▃▄▂▃▆▄▄▅▄▃▅▄▄▅▄▅▄▄▁▂▅▆▄

0,1
acuracia,0.49375
do_lower_case,False
fn,386
fp,19
max_seq_len,512
media_test_epoca_loss,0.69744
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69705357.
INFO:root:   Tempo de treinamento da época             : 0:01:07.
INFO:root:   Tempo parcial processamento               : 0:01:37 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.70302410; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 2 na época 1: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.70302410.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:40 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_5_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▄▅▄▅▄▇▅▄▆▁▄▃▄▅▃█▄▄▆▆▅▅▄▄▅▄▅▂▄▃▇▅▄▅
train_batch_loss,▅█▅▅▅▄▃▆▂█▂▁▁▅▃▅█▅▅▅▅▅▅▅▅▅▅▅▅▅▅▅▅▅▅▅▅▅▅▅

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.70302
media_train_epoca_loss,0.69705
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69595629.
INFO:root:   Tempo de treinamento da época             : 0:01:06.
INFO:root:   Tempo parcial processamento               : 0:03:03 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69317107; Acc: 0.50000000; Rec: 1.00000000; Pre: 0.50000000, F1:0.66666667, vp: 400; vn:   0; fp: 400; fn:   0
INFO:root:   Acurácia do fold 2 na época 2: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69317107.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:06 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_5_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▆▄▄▁▁▄▄▄▃▃▆▆▅▄▄▅▃▆▂█▄▃▄▅▄▄▅▂▄▄▄▃▅▂
train_batch_loss,▅▄▄▃▄▄▃▅▄▃▄▄▄▂▄▅▅▁▄▄▄▄▄▄▄▅▄▆▄▄▄▅▅▄▄▃▇▅█▄

0,1
acuracia,0.5
do_lower_case,False
fn,0
fp,400
max_seq_len,512
media_test_epoca_loss,0.69317
media_train_epoca_loss,0.69596
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69505565.
INFO:root:   Tempo de treinamento da época             : 0:01:05.
INFO:root:   Tempo parcial processamento               : 0:04:28 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69359874; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 2 na época 3: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69359874.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:31 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_5_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▃▄▄▄▅▅▃▇▅▅█▃▅▅█▅▄▅▇▁▃▅▄▃▆▅▄▁▃▄▄▄▆▅▆
train_batch_loss,▅▅▅▅▅▅▂▁▅▆▅▅▅▂▅▅▅▅▅▅▅▅▅▃▅▅▅▅▅▅▅▅█▅▅▅▅▅▅▅

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.6936
media_train_epoca_loss,0.69506
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 2 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69324952.
INFO:root:   Tempo de treinamento da época             : 0:01:54.
INFO:root:   Tempo parcial processamento               : 0:06:42 (h:mm:ss)
INFO:root:Realizando avaliação do fold 2 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.70250235; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 2 na época 4: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.70250235.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:46 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_5_b_23_23_f2_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▄▄▁▄▄▄▄▇▆█▄█▅▂▆▃▁▆▂▆▅▄▄▃▄▂▅▂▄▄▄▆▅▂▂
train_batch_loss,▅▅▅▅▅▇▅▅▄▅▅▆█▅▄▅▅▅▄▅▅▅▄▅▄▁▅▁▅▅▅▅▅▄▅▇▅▅▄▇

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.7025
media_train_epoca_loss,0.69325
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.69532876.
INFO:root:  Média perda(loss) avaliação   : 0.69807407.
INFO:root:  Tempo total treinamento       : 0:07:24.
INFO:root:  Tempo processamento fold: 0:07:38 (h:mm:ss)

INFO:root:Processamendo do fold: 3.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 5e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 3 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69699712; Acc: 0.49875000; Rec: 0.02750000; Pre: 0.47826087, F1:0.05200946, vp:  11; vn: 388; fp:  12; fn: 389
INFO:root:   Acurácia do fold 3 na época 0: 0.49875000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69699712.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_5_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▂▂▃▄▄▃█▄▃▅▂▂▃▃▃▃▄▅▃▃▄▄▄▃▃▃▃▄▄▃▁▂▂▆▁

0,1
acuracia,0.49875
do_lower_case,False
fn,389
fp,12
max_seq_len,512
media_test_epoca_loss,0.697
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69002738.
INFO:root:   Tempo de treinamento da época             : 0:01:05.
INFO:root:   Tempo parcial processamento               : 0:01:37 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.68423807; Acc: 0.51500000; Rec: 0.03000000; Pre: 1.00000000, F1:0.05825243, vp:  12; vn: 400; fp:   0; fn: 388
INFO:root:   Acurácia do fold 3 na época 1: 0.51500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.68423807.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:40 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_5_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▄▄▅▇▆▇▅▄▃▅▆▃▅▅▁▅▅▃▆▅▄▄▄▃▃▃▆▄▂▇██▃▄
train_batch_loss,▃▄▃▃▃▃▂▂▁▁▁▁▁█▆▄▇█▃▃▂▃▁▇▄▃▃▂▃▃▃▂█▂▃▃▃▃▃▃

0,1
acuracia,0.515
do_lower_case,False
fn,388
fp,0
max_seq_len,512
media_test_epoca_loss,0.68424
media_train_epoca_loss,0.69003
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.70240719.
INFO:root:   Tempo de treinamento da época             : 0:01:07.
INFO:root:   Tempo parcial processamento               : 0:03:05 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.71664204; Acc: 0.50000000; Rec: 1.00000000; Pre: 0.50000000, F1:0.66666667, vp: 400; vn:   0; fp: 400; fn:   0
INFO:root:   Acurácia do fold 3 na época 2: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.71664204.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:08 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_5_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▆▅▄▄▄▄▄▃▄▄▄▆█▄▄▄▁▆▂█▂▅▄▄▁▂▆▄▄▄▄▄▄▃
train_batch_loss,▄▄▄▂▄▅▁▄▅▇▄▆▆▃▄▄▅▁▅▅▄▄▄▄▄▃▄█▅▄▄▃▄▄▄▄▅▄▃▅

0,1
acuracia,0.5
do_lower_case,False
fn,0
fp,400
max_seq_len,512
media_test_epoca_loss,0.71664
media_train_epoca_loss,0.70241
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.70044557.
INFO:root:   Tempo de treinamento da época             : 0:01:06.
INFO:root:   Tempo parcial processamento               : 0:04:31 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 3.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69496272; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 3 na época 3: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69496272.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:04:34 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_5_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▅▄▄▁▅▂▄▆▄▅▃▅█▅▄▄▆▄▁▂▄▃▃▄▅▄▃▃▄▆▄▅▅▄
train_batch_loss,█▅▄▅▅▅▁▂▅▄▄▅▅▅▅▅▅▅▅▅▅▅▅▄▅▅▅▅▅▅▅▇▇▅▅▅▅▅▅▅

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.69496
media_train_epoca_loss,0.70045
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 3 na época: 4.


Epoca 4:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.69314789.
INFO:root:   Tempo de treinamento da época             : 0:01:50.
INFO:root:   Tempo parcial processamento               : 0:06:42 (h:mm:ss)
INFO:root:Realizando avaliação do fold 3 na época: 4.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69954188; Acc: 0.50000000; Rec: 0.00000000; Pre: 0.00000000, F1:0.00000000, vp:   0; vn: 400; fp:   0; fn: 400
INFO:root:   Acurácia do fold 3 na época 4: 0.50000000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69954188.
INFO:root:   Tempo de avaliação da época               : 0:00:04.
INFO:root:   Tempo parcial do processamento            : 0:06:46 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_5_b_23_23_f3_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▄▄▄▄▄▇▄▄▇▄▃▄▁█▆▃▂▃▂▄▇▄▃▃▃▅▄▄▄▄▄▄▇▄▁
train_batch_loss,▅▄▄▄▄▄▄▄▂▄▃█▅▄▃▄▄▄▄▄▄▄▄▄▄▃▄▁▄▄▄▄▄▄▄▅▅▅▂▆

0,1
acuracia,0.5
do_lower_case,False
fn,400
fp,0
max_seq_len,512
media_test_epoca_loss,0.69954
media_train_epoca_loss,0.69315
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:04


INFO:root:  Média perda(loss) treinamento : 0.69650701.
INFO:root:  Média perda(loss) avaliação   : 0.69884618.
INFO:root:  Tempo total treinamento       : 0:07:26.
INFO:root:  Tempo processamento fold: 0:07:40 (h:mm:ss)

INFO:root:Processamendo do fold: 4.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   até época 4 e taxa de aprendizagem 5e-05.
INFO:root:Variável URL_MODELO não setada.
INFO:root:Usando modelo BERT pré-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classificação.
Some weights of the model checkpoint at bert-large-cased were not used when initializing BertForSequenceClassification: ['cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.dense.bias', 'cls.predictions.decoder.weight', 'cls.seq_relationship.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForSequenceCla

Épocas:   0%|          | 0/5 [00:00<?, ?épocas/s]

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando avaliação do fold 4 na época: 0.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.69861526; Acc: 0.49750000; Rec: 0.02250000; Pre: 0.45000000, F1:0.04285714, vp:   9; vn: 389; fp:  11; fn: 391
INFO:root:   Acurácia do fold 4 na época 0: 0.49750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.69861526.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:00:14 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_5_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
tempo_train,▁
test_batch_loss,▁▃▅▄▇▁▅▃▃▄▂▃▆▄▄▃▄▆▄▃▄▂▄▅▅▄▅▄▅▄▃▁▄█▅

0,1
acuracia,0.4975
do_lower_case,False
fn,391
fp,11
max_seq_len,512
media_test_epoca_loss,0.69862
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 1.


Epoca 1:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.39062475.
INFO:root:   Tempo de treinamento da época             : 0:01:06.
INFO:root:   Tempo parcial processamento               : 0:01:36 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 1.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.03025822; Acc: 0.99500000; Rec: 1.00000000; Pre: 0.99009901, F1:0.99502488, vp: 400; vn: 396; fp:   4; fn:   0
INFO:root:   Acurácia do fold 4 na época 1: 0.99500000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.03025822.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:01:39 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_5_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▁▁▁▁▁▁▁▁▁▁▁▁▁▆▁▁▁██▁▁▁▁▁▁▁▁▁▁▁█▁▁▁▁
train_batch_loss,▂▃▂▂▂▂▂▂▁▁▁▁▁▁▁▄▁█▃▂▁▁▁▁▁▃▁▁▁▁▁▁▁▁▁▁▂▁▁▁

0,1
acuracia,0.995
do_lower_case,False
fn,0
fp,4
max_seq_len,512
media_test_epoca_loss,0.03026
media_train_epoca_loss,0.39062
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 2.


Epoca 2:   0%|          | 0/314 [00:00<?, ?lotes/s]

INFO:root:   Média perda(loss) do treinamento da época : 0.11717640.
INFO:root:   Tempo de treinamento da época             : 0:01:06.
INFO:root:   Tempo parcial processamento               : 0:03:02 (h:mm:ss)
INFO:root:Realizando avaliação do fold 4 na época: 2.
INFO:root:Criando Lotes Inteligentes de 800 amostras com tamanho de lote 23...
INFO:root:Tokenizando 800 amostra...


Documentos :   0%|          | 0/800 [00:00<?, ?documento/s]

INFO:root:       800 amostras tokenizadas.
INFO:root:       800 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avaliação loss: 0.07103464; Acc: 0.98750000; Rec: 1.00000000; Pre: 0.97560976, F1:0.98765432, vp: 400; vn: 390; fp:  10; fn:   0
INFO:root:   Acurácia do fold 4 na época 2: 0.98750000.
INFO:root:   Média perda(loss) do avaliação da época   : 0.07103464.
INFO:root:   Tempo de avaliação da época               : 0:00:03.
INFO:root:   Tempo parcial do processamento            : 0:03:05 (h:mm:ss)
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Classificacao/P_100_K_100/.
INFO:root:Diretório já existe: /content/COHQUAD_COIN_EN/Classificacao/.
INFO:root:Criando arquivo classificação: /content/COHQUAD_COIN_EN/Classificacao/AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_5_b_23_23_f4_BERT_large.csv.
INFO:root:Diretório já existe: /content/drive/MyDrive/Colab Notebooks/Data/COHQUAD_COIN_EN/validacao_classificacao_palavra/kfold/Avaliacao/P_100_K_100/.
INFO:root:Criando arquivo resultado: /conte

VBox(children=(Label(value='0.000 MB of 0.000 MB uploaded (0.000 MB deduped)\r'), FloatProgress(value=1.0, max…

0,1
acuracia,▁
do_lower_case,▁
fn,▁
fp,▁
max_seq_len,▁
media_test_epoca_loss,▁
media_train_epoca_loss,▁
output_hidden_states,▁
test_batch_loss,▅▁▄▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁█▇▁▁▁▅▁▁▅▁▁▁▁▁▄▄▁
train_batch_loss,▂▁▁▁▁▁▁▁▄▁▁▁▁▁▁▁█▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁

0,1
acuracia,0.9875
do_lower_case,False
fn,0
fp,10
max_seq_len,512
media_test_epoca_loss,0.07103
media_train_epoca_loss,0.11718
nome_execucao,AjusteFinoCohQuADCoI...
output_hidden_states,False
tempo_test,0:00:03


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Criando Lotes Inteligentes de 7,200 amostras com tamanho de lote 23...
INFO:root:Tokenizando 7,200 amostra...


Documentos :   0%|          | 0/7200 [00:00<?, ?documento/s]

INFO:root:     7,200 amostras tokenizadas.
INFO:root:     7,200 amostras após classificação.
INFO:root:Criando lotes de tamanho 23...
INFO:root:  FEITO - Selecionado 314 lotes.
INFO:root:Preenchendo sequências dentro de cada lote...
INFO:root:Realizando treinamento do fold 4 na época: 3.


Epoca 3:   0%|          | 0/314 [00:00<?, ?lotes/s]

## 5.3 Carregando a acurácia média das execuções

In [74]:
# Import das bibliotecas
from tqdm.notebook import tqdm as tqdm_notebook

TAXAS_DE_APRENDIZAGEM = [1e-5, 2e-5, 3e-5, 4e-5, 5e-5]

LISTA_EPOCAS = [*range(0,EPOCAS+1)]

# Guarda um resumo das execuções
lista_resultado_execucoes = []

# Barra de progresso modelos
modelo_bar = tqdm_notebook(enumerate(NOMES_MODELO), desc=f'Modelos ', unit=f'modelo', total=len(NOMES_MODELO))

# Percorre todos os modelos a serem avaliados
for modelo_i, modelo in modelo_bar:

  # Barra de progresso das taxas de aprendizagem
  taxa_de_aprendizagem_bar = tqdm_notebook(enumerate(TAXAS_DE_APRENDIZAGEM), desc=f'Taxas de aprendizagem ', unit=f'taxa', total=len(TAXAS_DE_APRENDIZAGEM))

  # Executa o treinamento e avaliação para diversas taxas de aprendizagem
  for taxas_de_aprendizagem_i, taxa_de_aprendizagem in taxa_de_aprendizagem_bar:

    # Barra de progresso épocas
    epoca_bar = tqdm_notebook(enumerate(LISTA_EPOCAS), desc=f'Épocas ', unit=f'época', total=len(LISTA_EPOCAS))

    # Percorre todos as épocas a serem avaliadas
    for epoca_i, epoca in epoca_bar:

      logging.info("\n")
      logging.info("Acurácia do modelo: {}".format(modelo))
      logging.info("   com época {} e taxa de treinamento {}.".format(epoca, taxa_de_aprendizagem))

      # Seta o parâmetro do modelo
      model_args.pretrained_model_name_or_path = modelo

      # Seta o parâmetro do modelo
      training_args.learning_rate = taxa_de_aprendizagem

      # Seta o parâmetro do modelo
      model_args.epoca = epoca
   
      # Monta o nome do arquivo de log
      NOME_ARQUIVO_AVALIACAO =  NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args, model_args)
      
      # Carrega o resultado
      carregaResultadoAvaliacao(NOME_ARQUIVO_AVALIACAO)

Modelos :   0%|          | 0/1 [00:00<?, ?modelo/s]

Taxas de aprendizagem :   0%|          | 0/5 [00:00<?, ?taxa/s]

Épocas :   0%|          | 0/5 [00:00<?, ?época/s]

INFO:root:

INFO:root:Acurácia do modelo: bert-large-cased
INFO:root:   com época 0 e taxa de treinamento 1e-05.
INFO:root:Média dos arquivos: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_fX_BERT_large
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f1_BERT_large, Data: 01/10/2022 00:30, Tempo: 0:00:14, QtdeTeste: 800, Acc: 0.46000000, Rec: 0.76500000, Pre: 0.47515528, F1:0.58620690, vp:  306; vn:   62; fp:  338; fn:   94
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f2_BERT_large, Data: 01/10/2022 00:35, Tempo: 0:00:10, QtdeTeste: 800, Acc: 0.49375000, Rec: 0.03500000, Pre: 0.42424242, F1:0.06466513, vp:   14; vn:  381; fp:   19; fn:  386
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_f3_BERT_large, Data: 01/10/2022 00:40, Tempo: 0:00:11, QtdeTeste: 800, Acc: 0.49875000, Rec: 0.02750000, Pre: 0.47826087, F1:0.05200946, vp:   11; vn:  388; fp:  

Épocas :   0%|          | 0/5 [00:00<?, ?época/s]

INFO:root:

INFO:root:Acurácia do modelo: bert-large-cased
INFO:root:   com época 0 e taxa de treinamento 2e-05.
INFO:root:Média dos arquivos: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_fX_BERT_large
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f1_BERT_large, Data: 01/10/2022 01:25, Tempo: 0:00:13, QtdeTeste: 800, Acc: 0.48500000, Rec: 0.01250000, Pre: 0.22727273, F1:0.02369668, vp:    5; vn:  383; fp:   17; fn:  395
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f2_BERT_large, Data: 01/10/2022 01:30, Tempo: 0:00:13, QtdeTeste: 800, Acc: 0.49375000, Rec: 0.03500000, Pre: 0.42424242, F1:0.06466513, vp:   14; vn:  381; fp:   19; fn:  386
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_f3_BERT_large, Data: 01/10/2022 01:36, Tempo: 0:00:13, QtdeTeste: 800, Acc: 0.49875000, Rec: 0.02750000, Pre: 0.47826087, F1:0.05200946, vp:   11; vn:  388; fp:  

Épocas :   0%|          | 0/5 [00:00<?, ?época/s]

INFO:root:

INFO:root:Acurácia do modelo: bert-large-cased
INFO:root:   com época 0 e taxa de treinamento 3e-05.
INFO:root:Média dos arquivos: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_fX_BERT_large
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f1_BERT_large, Data: 01/10/2022 02:26, Tempo: 0:00:14, QtdeTeste: 800, Acc: 0.48500000, Rec: 0.01250000, Pre: 0.22727273, F1:0.02369668, vp:    5; vn:  383; fp:   17; fn:  395
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f2_BERT_large, Data: 01/10/2022 02:32, Tempo: 0:00:14, QtdeTeste: 800, Acc: 0.49375000, Rec: 0.03500000, Pre: 0.42424242, F1:0.06466513, vp:   14; vn:  381; fp:   19; fn:  386
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_f3_BERT_large, Data: 01/10/2022 02:39, Tempo: 0:00:14, QtdeTeste: 800, Acc: 0.49875000, Rec: 0.02750000, Pre: 0.47826087, F1:0.05200946, vp:   11; vn:  388; fp:  

Épocas :   0%|          | 0/5 [00:00<?, ?época/s]

INFO:root:

INFO:root:Acurácia do modelo: bert-large-cased
INFO:root:   com época 0 e taxa de treinamento 4e-05.
INFO:root:Média dos arquivos: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_fX_BERT_large
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f1_BERT_large, Data: 01/10/2022 03:33, Tempo: 0:00:15, QtdeTeste: 800, Acc: 0.48500000, Rec: 0.01250000, Pre: 0.22727273, F1:0.02369668, vp:    5; vn:  383; fp:   17; fn:  395
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f2_BERT_large, Data: 01/10/2022 03:40, Tempo: 0:00:16, QtdeTeste: 800, Acc: 0.49375000, Rec: 0.03500000, Pre: 0.42424242, F1:0.06466513, vp:   14; vn:  381; fp:   19; fn:  386
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_f3_BERT_large, Data: 01/10/2022 03:47, Tempo: 0:00:15, QtdeTeste: 800, Acc: 0.49875000, Rec: 0.02750000, Pre: 0.47826087, F1:0.05200946, vp:   11; vn:  388; fp:  

Épocas :   0%|          | 0/5 [00:00<?, ?época/s]

INFO:root:

INFO:root:Acurácia do modelo: bert-large-cased
INFO:root:   com época 0 e taxa de treinamento 5e-05.
INFO:root:Média dos arquivos: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_5_b_23_23_fX_BERT_large
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_5_b_23_23_f1_BERT_large, Data: 01/10/2022 04:46, Tempo: 0:00:15, QtdeTeste: 800, Acc: 0.48500000, Rec: 0.01250000, Pre: 0.22727273, F1:0.02369668, vp:    5; vn:  383; fp:   17; fn:  395
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_5_b_23_23_f2_BERT_large, Data: 01/10/2022 04:54, Tempo: 0:00:15, QtdeTeste: 800, Acc: 0.49375000, Rec: 0.03500000, Pre: 0.42424242, F1:0.06466513, vp:   14; vn:  381; fp:   19; fn:  386
INFO:root:Arquivo: AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_5_b_23_23_f3_BERT_large, Data: 01/10/2022 05:02, Tempo: 0:00:15, QtdeTeste: 800, Acc: 0.49875000, Rec: 0.02750000, Pre: 0.47826087, F1:0.05200946, vp:   11; vn:  388; fp:  

Resumo da execução

Acurácia por época.

In [75]:
for i, linha in enumerate(lista_resultado_execucoes):  
  if "e_1" in linha:
    print(linha)

AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_1_b_23_23_fX_BERT_large;0.9730000000000001;00:12:32
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_2_b_23_23_fX_BERT_large;0.9829999999999999;00:14:18
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_3_b_23_23_fX_BERT_large;0.9546250000000001;00:15:45
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_4_b_23_23_fX_BERT_large;0.842125;00:16:22
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_5_b_23_23_fX_BERT_large;0.7755000000000001;00:16:49


In [76]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_e_2" in linha:
    print(linha)

AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_1_b_23_23_fX_BERT_large;0.99375;00:23:00
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_2_b_23_23_fX_BERT_large;0.9883750000000001;00:26:26
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_3_b_23_23_fX_BERT_large;0.9953749999999999;00:29:09
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_4_b_23_23_fX_BERT_large;0.7378750000000001;00:30:25
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_5_b_23_23_fX_BERT_large;0.725625;00:31:21


In [77]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_e_3" in linha:
    print(linha)

AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_1_b_23_23_fX_BERT_large;0.99825;00:33:41
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_2_b_23_23_fX_BERT_large;0.9960000000000001;00:38:41
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_3_b_23_23_fX_BERT_large;0.9336249999999999;00:42:25
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_4_b_23_23_fX_BERT_large;0.696125;00:44:33
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_5_b_23_23_fX_BERT_large;0.698875;00:45:43


In [78]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_e_4" in linha:
    print(linha)

AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_1_b_23_23_fX_BERT_large;0.9973750000000002;00:47:50
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_2_b_23_23_fX_BERT_large;0.9964999999999999;00:54:49
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_3_b_23_23_fX_BERT_large;0.9481250000000001;01:00:22
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_4_b_23_23_fX_BERT_large;0.620625;01:05:43
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_5_b_23_23_fX_BERT_large;0.650625;01:08:19


Acurácia por taxa de aprendizagem.

In [79]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_lr_1" in linha:
    print(linha)

AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_1_b_23_23_fX_BERT_large;0.490625;00:02:03
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_1_b_23_23_fX_BERT_large;0.9730000000000001;00:12:32
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_1_b_23_23_fX_BERT_large;0.99375;00:23:00
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_1_b_23_23_fX_BERT_large;0.99825;00:33:41
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_1_b_23_23_fX_BERT_large;0.9973750000000002;00:47:50


In [80]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_lr_2" in linha:
    print(linha)

AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_2_b_23_23_fX_BERT_large;0.49312500000000004;00:02:17
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_2_b_23_23_fX_BERT_large;0.9829999999999999;00:14:18
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_2_b_23_23_fX_BERT_large;0.9883750000000001;00:26:26
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_2_b_23_23_fX_BERT_large;0.9960000000000001;00:38:41
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_2_b_23_23_fX_BERT_large;0.9964999999999999;00:54:49


In [81]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_lr_3" in linha:
    print(linha)

AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_3_b_23_23_fX_BERT_large;0.49312500000000004;00:02:21
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_3_b_23_23_fX_BERT_large;0.9546250000000001;00:15:45
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_3_b_23_23_fX_BERT_large;0.9953749999999999;00:29:09
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_3_b_23_23_fX_BERT_large;0.9336249999999999;00:42:25
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_3_b_23_23_fX_BERT_large;0.9481250000000001;01:00:22


In [82]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_lr_4" in linha:
    print(linha)

AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_4_b_23_23_fX_BERT_large;0.49312500000000004;00:02:32
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_4_b_23_23_fX_BERT_large;0.842125;00:16:22
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_4_b_23_23_fX_BERT_large;0.7378750000000001;00:30:25
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_4_b_23_23_fX_BERT_large;0.696125;00:44:33
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_4_b_23_23_fX_BERT_large;0.620625;01:05:43


In [83]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_lr_5" in linha:
    print(linha)

AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_0_lr_5_b_23_23_fX_BERT_large;0.49312500000000004;00:02:32
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_1_lr_5_b_23_23_fX_BERT_large;0.7755000000000001;00:16:49
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_2_lr_5_b_23_23_fX_BERT_large;0.725625;00:31:21
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_3_lr_5_b_23_23_fX_BERT_large;0.698875;00:45:43
AjusteFinoCohQuADCoInen_C_SB_KF_v1_P_100_K_100_E_4_e_4_lr_5_b_23_23_fX_BERT_large;0.650625;01:08:19


# 6 Finalização

## 6.1 Tempo final de processamento



In [84]:
 # Pega o tempo atual menos o tempo do início do processamento.
final_processamento = time.time()
tempo_total_processamento = formataTempo(final_processamento - inicio_processamento)

print("")
print("  Tempo processamento: {:} (h:mm:ss)".format(tempo_total_processamento))


  Tempo processamento: 5:34:57 (h:mm:ss)
