#Ajuste fino do conjunto de dados do CohQuAD In en usando BERT Transformers by HuggingFace e Lotes Inteligentes e Valida√ß√£o Cruzada para todos os Folds

Realiza o ajuste fino do modelo BERT pr√©-treinado com o conjunto de dados para discriminar documentos originais e modificados e avalia utilizando valida√ß√£o cruzada 10 fold.

Classes:
- 1 - Documento original
- 0 - Documento modificado

Caracter√≠sticas:
- Realiza o ajuste fino utilizando documentos originais e modificados em pares.
- O Treinamento do modelo utiliza o conjunto de dados com um treinamento para um fold com 90% dos dados.
- A avalia√ß√£o do modelo utiliza o conjunto de dados de teste para um fold com 10% dos dados.
- Realiza o ajuste fino em 10 pares de folds de treino e teste.
- Utiliza Lotes Inteligentes para otimizar o tempo de execu√ß√£o de treinamento.

- A se√ß√£o 2 - parametriza√ß√£o define os argumentos da execu√ß√£o.

Utiliza o arquivo `COHEBERT_KFOLD_10_PX_KY.zip`, X √© o n√∫mero de documentos modificados e Y o valor de top K predi√ß√µes.
.

----------------------------

**Link biblioteca Transformers:**
https://github.com/huggingface/transformers


**Artigo original BERT:**
https://arxiv.org/pdf/1506.06724.pdf

**Artigo padding din√¢mico:**
https://towardsdatascience.com/divide-hugging-face-transformers-training-time-by-2-or-more-21bf7129db9q-21bf7129db9e

# 1 Prepara√ß√£o do ambiente
Prepara√ß√£o do ambiente para execu√ß√£o do notebook.

## 1.1 Tempo inicial de processamento

In [1]:
import time
import datetime

# Marca o tempo de in√≠cio do processamento
inicio_processamento = time.time()

In [2]:
print("  Tempo de in√≠cio de processamento:  {:} (h:mm:ss)".format(inicio_processamento))

  Tempo de in√≠cio de processamento:  1722363065.6224253 (h:mm:ss)


## 1.2 Fun√ß√µes e classes auxiliares

Verifica se existe o diret√≥rio cohebert no diret√≥rio corrente.   


In [3]:
# Import das bibliotecas.
import os # Biblioteca para manipular arquivos

# ============================
def verificaDiretorioCoheBERT():
    """
      Verifica se existe o diret√≥rio cohebert no diret√≥rio corrente.
    """

    # Verifica se o diret√≥rio existe
    if not os.path.exists(DIRETORIO_COHEBERT):
        # Cria o diret√≥rio
        os.makedirs(DIRETORIO_COHEBERT)
        logging.info("Diret√≥rio Cohebert criado: {}".format(DIRETORIO_COHEBERT))

    return DIRETORIO_COHEBERT

Realiza o download e um arquivo

In [4]:
# Import das bibliotecas.
import requests # Biblioteca de download
from tqdm.notebook import tqdm as tqdm_notebook # Biblioteca para barra de progresso
import os # Biblioteca para manipular arquivos

def downloadArquivo(url_arquivo, nome_arquivo_destino):
    """
      Realiza o download de um arquivo de uma url em salva em nome_arquivo_destino.

      Par√¢metros:
        `url_arquivo` - URL do arquivo a ser feito download.
        `nome_arquivo_destino` - Nome do arquivo a ser salvo.
    """

    # Verifica se existe o diret√≥rio base
    DIRETORIO_COHEBERT = verificaDiretorioCoheBERT()

    # Realiza o download de um arquivo em uma url
    data = requests.get(url_arquivo, stream=True)

    # Verifica se o arquivo existe
    if data.status_code != 200:
        logging.info("Exce√ß√£o ao tentar realizar download {}. Response {}.".format(url_arquivo, data.status_code))
        data.raise_for_status()
        return

    # Recupera o nome do arquivo a ser realizado o download
    nome_arquivo = nome_arquivo_destino.split("/")[-1]

    # Define o nome e caminho do arquivo tempor√°rio
    nome_arquivo_temporario = DIRETORIO_COHEBERT + "/" + nome_arquivo + "_part"

    logging.info("Download do arquivo: {}.".format(nome_arquivo_destino))

    # Baixa o arquivo
    with open(nome_arquivo_temporario, "wb") as arquivo_binario:
        tamanho_conteudo = data.headers.get("Content-Length")
        total = int(tamanho_conteudo) if tamanho_conteudo is not None else None
        # Barra de progresso de download
        progresso_bar = tqdm_notebook(unit="B", total=total, unit_scale=True)
        # Atualiza a barra de progresso
        for chunk in data.iter_content(chunk_size=1024):
            if chunk:
                progresso_bar.update(len(chunk))
                arquivo_binario.write(chunk)

    # Renomeia o arquivo tempor√°rio para o arquivo definitivo
    os.rename(nome_arquivo_temporario, nome_arquivo_destino)

    # Fecha a barra de progresso.
    progresso_bar.close()

Remove tags de um documento

In [5]:
def remove_tags(documento):
    """
      Remove tags de um documento
    """

    import re

    documento_limpo = re.compile("<.*?>")
    return re.sub(documento_limpo, "", documento)

Fun√ß√µes auxiliares de arquivos

In [6]:
def carregar(nome_arquivo, encoding="Windows-1252"):
    """
      Carrega um arquivo texto e retorna as linhas como um √∫nico par√°grafo(texto).

      Par√¢metros:
        `nome_arquivo` - Nome do arquivo a ser carregado.
    """

    # Abre o arquivo
    arquivo = open(nome_arquivo, "r", encoding= encoding)

    paragrafo = ""
    for linha in arquivo:
        linha = linha.splitlines()
        linha = " ".join(linha)
        # Remove as tags existentes no final das linhas
        linha = remove_tags(linha)
        if linha != "":
          paragrafo = paragrafo + linha.strip() + " "

    # Fecha o arquivo
    arquivo.close()

    # Remove os espa√ßos em branco antes e depois do par√°grafo
    return paragrafo.strip()

In [7]:
def carregarLista(nome_arquivo, encoding="Windows-1252"):
    """
      Carrega um arquivo texto e retorna as linhas como uma lista de senten√ßas(texto).

      Par√¢metros:
        `nome_arquivo` - Nome do arquivo a ser carregado.
        `encoding` - Codifica√ß√£o dos caracteres do arquivo.
    """

    # Abre o arquivo
    arquivo = open(nome_arquivo, "r", encoding= encoding)

    sentencas = []
    for linha in arquivo:
        linha = linha.splitlines()
        linha = " ".join(linha)
        linha = remove_tags(linha)
        if linha != "":
          sentencas.append(linha.strip())

    # Fecha o arquivo
    arquivo.close()

    return sentencas

In [8]:
def salvar(nome_arquivo,texto):
    """
      Salva um texto em arquivo.

      Par√¢metros:
        `nome_arquivo` - Nome do arquivo a ser salvo.
        `texto` - Texto a ser salvo.
    """

    arquivo = open(nome_arquivo, "w")
    arquivo.write(str(texto))
    arquivo.close()

Fun√ß√£o auxiliar para formatar o tempo como `hh: mm: ss`

In [9]:
# Import das bibliotecas.
import time
import datetime

def formataTempo(tempo):
    """
      Pega a tempo em segundos e retorna uma string hh:mm:ss
    """
    # Arredonda para o segundo mais pr√≥ximo.
    tempo_arredondado = int(round((tempo)))

    # Formata como hh:mm:ss
    return str(datetime.timedelta(seconds=tempo_arredondado))

Calcula a m√©dia de uma lista tempo string no formato hh:mm:ss.

In [10]:
# Import das bibliotecas.
from cmath import rect, phase
from math import radians, degrees

def mediaAngulo(deg):
    return degrees(phase(sum(rect(1, radians(d)) for d in deg)/len(deg)))

def mediaTempo(tempos):
    '''
    Calcula a m√©dia de uma lista de tempo string no formato hh:mm:ss
    '''
    t = (tempo.split(':') for tempo in tempos)
    # Converte para segundos
    segundos = ((float(s) + int(m) * 60 + int(h) * 3600) for h, m, s in t)
    # Verifica se deu algum dia
    dia = 24 * 60 * 60
    # Converte para angulos
    para_angulos = [s * 360. / dia for s in segundos]
    # Calcula a m√©dia dos angulos
    media_como_angulo = mediaAngulo(para_angulos)
    media_segundos = media_como_angulo * dia / 360.
    if media_segundos < 0:
        media_segundos += dia
    # Recupera as horas e os minutos
    h, m = divmod(media_segundos, 3600)
    # Recupera os minutos e os segundos
    m, s = divmod(m, 60)
    return '{:02d}:{:02d}:{:02d}'.format(int(h), int(m), int(s))

Calcula a soma de uma lista de tempo string no formato hh:mm:ss

In [11]:
def somaTempo(tempos):
    '''
    Calcula a soma de uma lista de tempo string no formato hh:mm:ss
    '''
    t = (tempo.split(':') for tempo in tempos)
    # Converte para segundos
    segundos = ((float(s) + int(m) * 60 + int(h) * 3600) for h, m, s in t)
    # Soma os segundos
    soma_segundos = sum([s * 1. for s in segundos])
    # Recupera as horas e os minutos
    h, m = divmod(soma_segundos, 3600)
    # Recupera os minutos e os segundos
    m, s = divmod(m, 60)
    return '{:02d}:{:02d}:{:02d}'.format(int(h), int(m), int(s))

Em muitos dos meus loops for (de longa dura√ß√£o), imprimirei atualiza√ß√µes peri√≥dicas de progresso. Normalmente, eu escolho o intervalo de atualiza√ß√£o manualmente, mas para este Notebook, defini uma fun√ß√£o auxiliar para fazer essa escolha para mim :)

In [12]:
def obterIntervaloAtualizacao(total_iteracoes, numero_atualizacoes):
    '''
     Esta fun√ß√£o tentar√° escolher um intervalo de atualiza√ß√£o de progresso inteligente
     com base na magnitude das itera√ß√µes totais.

     Par√¢metros:
       `total_iteracoes` - O n√∫mero de itera√ß√µes no loop for.
       `numero_atualizacoes` - Quantas vezes queremos ver uma atualiza√ß√£o sobre o
                               curso do loop for.
     '''

    # Divida o total de itera√ß√µes pelo n√∫mero desejado de atualiza√ß√µes. Provavelmente
    # este ser√° um n√∫mero feio.
    intervalo_exato = total_iteracoes / numero_atualizacoes

    # A fun√ß√£o `arredondar` tem a capacidade de arredondar um n√∫mero para, por exemplo, o
    # mil√©simo mais pr√≥ximo: round (intervalo_exato, -3)
    #
    # Para determinar a magnitude para arredondar, encontre a magnitude do total,
    # e ent√£o v√° uma magnitude abaixo disso.

    # Obtenha a ordem de magnitude do total.
    ordem_magnitude = len(str(total_iteracoes)) - 1

    # Nosso intervalo de atualiza√ß√£o deve ser arredondado para uma ordem de magnitude menor.
    magnitude_arrendonda = ordem_magnitude - 1

    # Arredonde para baixo e lance para um int.
    intervalo_atualizacao = int(round(intervalo_exato, -magnitude_arrendonda))

    # N√£o permita que o intervalo seja zero!
    if intervalo_atualizacao == 0:
        intervalo_atualizacao = 1

    return intervalo_atualizacao

Classe(ModeloArgumentosMedida) de defini√ß√£o dos par√¢metros do modelo para medida

In [13]:
# Import das bibliotecas.
from dataclasses import dataclass, field
from typing import Dict, Optional
from typing import List

@dataclass
class ModeloArgumentosMedida:
    max_seq_len: Optional[int] = field(
        default=None,
        metadata={"help": "max seq len"},
    )
    pretrained_model_name_or_path: str = field(
        default="neuralmind/bert-base-portuguese-cased",
        metadata={"help": "nome do modelo pr√©-treinado do BERT."},
    )
    modelo_spacy: str = field(
        default="pt_core_news_lg",
        metadata={"help": "nome do modelo do spaCy."},
    )
    versao_modelo_spacy: str = field(
        default="-3.2.0",
        metadata={"help": "vers√£o do nome do modelo no spaCy."},
    )
    sentenciar_documento: bool = field(
        default=True,
        metadata={"help": "Dividir o documento em senten√ßas(frases)."},
    )
    do_lower_case: bool = field(
        default=False,
        metadata={"help": "define se o texto do modelo deve ser todo em min√∫sculo."},
    )
    output_attentions: bool = field(
        default=False,
        metadata={"help": "habilita se o modelo retorna os pesos de aten√ß√£o."},
    )
    output_hidden_states: bool = field(
        default=False,
        metadata={"help": "habilita gerar as camadas ocultas do modelo."},
    )
    usar_mcl_ajustado : bool = field(
        default=False,
        metadata={"help": "habilita o carragamento de mcl ajustado."},
    )

Classe(ModeloArgumentosClassificacao) de defini√ß√£o dos par√¢metros do modelo para classifica√ß√£o

In [14]:
# Import das bibliotecas.
from dataclasses import dataclass, field
from typing import Dict, Optional
from typing import List

@dataclass
class ModeloArgumentosClassificacao:
    '''
    Classe(ModeloArgumentosClassificacao) de defini√ß√£o dos par√¢metros do modelo BERT para a classifica√ß√£o de coer√™ncia.
    '''
    max_seq_len: Optional[int] = field(
        default=None,
        metadata={"help": "max seq len"},
    )
    pretrained_model_name_or_path: str = field(
        default="neuralmind/bert-base-portuguese-cased",
        metadata={"help": "nome do modelo pr√©-treinado do BERT."},
    )
    do_lower_case: bool = field(
        default=False,
        metadata={"help": "define se o texto do modelo deve ser todo em min√∫sculo."},
    )
    num_labels: int = field(
        default=2,
        metadata={"help": "n√∫mero de r√≥tulos a serem classificados."},
    )
    output_attentions: bool = field(
        default=False,
        metadata={"help": "habilita se o modelo retorna os pesos de aten√ß√£o."},
    )
    output_hidden_states: bool = field(
        default=False,
        metadata={"help": "habilita gerar as camadas ocultas do modelo."},
    )
    optimizer: str = field(
        default="AdamW",
        metadata={"help": "otimizador do modelo."},
    )
    use_wandb : bool = field(
        default=True,
        metadata={"help": "habilita o uso do wandb."},
    )
    salvar_modelo_wandb : bool = field(
        default=True,
        metadata={"help": "habilita o salvamento do modelo no wandb."},
    )
    salvar_modelo : bool = field(
        default=False,
        metadata={"help": "habilita o salvamento do modelo."},
    )
    salvar_avaliacao : bool = field(
        default=True,
        metadata={"help": "habilita o salvamento do resultado da avalia√ß√£o."},
    )
    salvar_classificacao : bool = field(
        default=False,
        metadata={"help": "habilita o salvamento da classifica√ß√£o."},
    )
    usar_mcl_ajustado: bool = field(
        default=False,
        metadata={'help': 'habilita o carragamento de mcl ajustado.'},
    )
    top_k_predicao: int = field(
        default="100",
        metadata={"help": "Quantidade de previs√µes de palavras recuperadas mais pr√≥ximas da m√°scara."},
    )
    documentos_perturbados: int = field(
        default="1",
        metadata={"help": "Quantidade de documentos perturbados comparados com o seu original."},
    )
    epoca: int = field(
        default="1",
        metadata={"help": "√âpoca a ser avaliada."},
    )
    fold: int = field(
        default="1",
        metadata={"help": "Fold a ser avaliado."},
    )

Biblioteca de limpeza de tela

In [15]:
from IPython.display import clear_output

## 1.3 Tratamento de logs

In [16]:
# Import das bibliotecas.
import logging # Biblioteca de logging

# Formatando a mensagem de logging
logging.basicConfig(format="%(asctime)s : %(levelname)s : %(message)s")

logger = logging.getLogger()
logger.setLevel(logging.INFO)

## 1.4 Identificando o ambiente Colab

In [17]:
# Se estiver executando no Google Colaboratory
import sys

# Retorna true ou false se estiver no Google Colaboratory
IN_COLAB = 'google.colab' in sys.modules

## 1.5 Colaboratory

Usando Colab GPU para Treinamento


Uma GPU pode ser adicionada acessando o menu e selecionando:

`Edit -> Notebook Settings -> Hardware accelerator -> (GPU)`

Em seguida, execute a c√©lula a seguir para confirmar que a GPU foi detectada.

In [18]:
# Import das bibliotecas.
import tensorflow as tf

# Recupera o nome do dispositido da GPU.
device_name = tf.test.gpu_device_name()

# O nome do dispositivo deve ser parecido com o seguinte:
if device_name == "/device:GPU:0":
    logging.info("Encontrei GPU em: {}".format(device_name))
else:
    logging.info("Dispositivo GPU n√£o encontrado")
    #raise SystemError("Dispositivo GPU n√£o encontrado")

INFO:numexpr.utils:Note: NumExpr detected 32 cores but "NUMEXPR_MAX_THREADS" not set, so enforcing safe limit of 16.
INFO:numexpr.utils:NumExpr defaulting to 16 threads.
INFO:root:Encontrei GPU em: /device:GPU:0


Nome da GPU

Para que a torch use a GPU, precisamos identificar e especificar a GPU como o dispositivo. Posteriormente, em nosso ciclo de treinamento, carregaremos dados no dispositivo.

Vale a pena observar qual GPU voc√™ recebeu. A GPU Tesla P100 √© muito mais r√°pido que as outras GPUs, abaixo uma lista ordenada:
- 1o Tesla P100
- 2o Tesla T4
- 3o Tesla P4 (N√£o tem mem√≥ria para execu√ß√£o 4 x 8, somente 2 x 4)
- 4o Tesla K80 (N√£o tem mem√≥ria para execu√ß√£o 4 x 8, somente 2 x 4)

In [19]:
# Import das bibliotecas.
import torch # Biblioteca para manipular os tensores

def getDeviceGPU():
    """
    Retorna um dispositivo de GPU se dispon√≠vel ou CPU.

    Retorno:
    `device` - Um device de GPU ou CPU.
    """

    # Se existe GPU dispon√≠vel.
    if torch.cuda.is_available():

        # Diz ao PyTorch para usar GPU.
        device = torch.device("cuda")

        logging.info("Existem {} GPU(s) dispon√≠veis.".format(torch.cuda.device_count()))
        logging.info("Iremos usar a GPU: {}.".format(torch.cuda.get_device_name(0)))

    # Se n√£o.
    else:
        logging.info("Sem GPU dispon√≠vel, usando CPU.")
        device = torch.device("cpu")

    return device

In [20]:
device = getDeviceGPU()

INFO:root:Existem 1 GPU(s) dispon√≠veis.
INFO:root:Iremos usar a GPU: Tesla T4.


Conecta o modelo ao device

In [21]:
# Import das bibliotecas.
import torch # Biblioteca para manipular os tensores

def conectaGPU(model, device):
    """
      Conecta um modelo BERT a GPU.

      Par√¢metros:
        `model` - Um modelo BERT carregado.
        `device` - Um device de GPU.

      Retorno:
        `model` - Um objeto model BERT conectado a GPU.
    """
    # Associa a GPU ao modelo.
    model.to(device)

    # Se existe GPU dispon√≠vel.
    if torch.cuda.is_available():
        # Diga ao pytorch para rodar este modelo na GPU.
        logging.info("Pytorch rodando o modelo na GPU.")
        model.cuda()

    else:
        logging.info("Pytorch rodando sem GPU.")

    return model

Mem√≥ria

Mem√≥ria dispon√≠vel no ambiente

In [22]:
# Import das bibliotecas.
from psutil import virtual_memory

ram_gb = virtual_memory().total / 1e9
logging.info("Seu ambiente de execu√ß√£o tem {: .1f} gigabytes de RAM dispon√≠vel\n".format(ram_gb))

if ram_gb < 20:
  logging.info("Para habilitar um tempo de execu√ß√£o de RAM alta, selecione menu o ambiente de execu√ß√£o> \"Alterar tipo de tempo de execu√ß√£o\"")
  logging.info("e selecione High-RAM. Ent√£o, execute novamente est√° c√©lula")
else:
  logging.info("Voc√™ est√° usando um ambiente de execu√ß√£o de mem√≥ria RAM alta!")

INFO:root:Seu ambiente de execu√ß√£o tem  126.6 gigabytes de RAM dispon√≠vel

INFO:root:Voc√™ est√° usando um ambiente de execu√ß√£o de mem√≥ria RAM alta!


## 1.6 Monta uma pasta no google drive para carregar os arquivos de dados.



In [23]:
# # Monta o Google Drive para esta inst√¢ncia de notebook.
# from google.colab import drive

# drive.mount('/content/drive')
from google.colab import auth
auth.authenticate_user()

from google.cloud import storage

# Initialize a client
client = storage.Client(project='mestrado-424014')

bucket_name = 'mestrado_rita_01'
bucket = client.get_bucket(bucket_name)


# Fun√ß√£o para listar blobs dentro de uma pasta espec√≠fica
def list_blobs_with_prefix(bucket_name, prefix):
    """Lists all the blobs in the bucket that begin with the prefix."""
    blobs = bucket.list_blobs(prefix=prefix)
    for blob in blobs:
        print(blob.name)

# Exemplo de uso: listar arquivos na pasta 'cohquad/'
list_blobs_with_prefix(bucket_name, 'cohquad/')

# Fun√ß√£o para fazer download de um arquivo do GCS
def download_blob(bucket_name, source_blob_name, destination_file_name):
    """Downloads a blob from the bucket."""
    bucket = client.bucket(bucket_name)
    blob = bucket.blob(source_blob_name)
    blob.download_to_filename(destination_file_name)
    print(f"File {source_blob_name} downloaded to {destination_file_name}.")

# Fun√ß√£o para criar o diret√≥rio local, se n√£o existir
def criaDiretorioLocal(diretorio_local):
    if not os.path.exists(diretorio_local):
        os.makedirs(diretorio_local)
        logging.info(f"Diret√≥rio criado: {diretorio_local}.")
    else:
        logging.info(f"Diret√≥rio j√° existe: {diretorio_local}.")


cohquad/
cohquad/msrp_test.csv
cohquad/msrp_test.xlsx
cohquad/msrp_train.csv
cohquad/msrp_train.xlsx
cohquad/original.zip
cohquad/originalner.zip
cohquad/originalpos.zip
cohquad/validacao_classificacao_palavra/kfold/cohquad_KFOLD_10_P1_K1.zip


## 1.7 Instala√ß√£o do wandb

Instala√ß√£o

In [24]:
!pip install --upgrade wandb

[0m

Login via linha de comando

In [25]:
!wandb login a55ff08814d3b18b89f2e4938ab69b136c33b2e1

[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


## 1.8 Instala√ß√£o BERT da Hugging Face

Instala a interface pytorch para o BERT by Hugging Face.

In [26]:
!pip install -U transformers==4.5.1

[0mCollecting transformers==4.5.1
  Downloading transformers-4.5.1-py3-none-any.whl.metadata (41 kB)
[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m41.0/41.0 kB[0m [31m685.6 kB/s[0m eta [36m0:00:00[0m
Collecting sacremoses (from transformers==4.5.1)
  Downloading sacremoses-0.1.1-py3-none-any.whl.metadata (8.3 kB)
Collecting tokenizers<0.11,>=0.10.1 (from transformers==4.5.1)
  Downloading tokenizers-0.10.3.tar.gz (212 kB)
[2K     [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m212.7/212.7 kB[0m [31m2.3 MB/s[0m eta [36m0:00:00[0m
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
Downloading transformers-4.5.1-py3-none-any.whl (2.1 MB)
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚

# 2 Parametriza√ß√£o

## Gerais

In [27]:
# Prefixo do nome do arquivo usado nas sa√≠das projeto C = Cris, SB = SmartBatch, KF = KFold
NOME_BASE_SAIDA = "AjusteFinoCohQuADInen_C_SB_KF_v1"

# Defini√ß√£o dos par√¢metros a serem avaliados

######## Par√¢metros Individuais ########

# Quantidade de documentos a serem perturbados a partir do original. Usar 1, 20 ou 100.
DOCUMENTOS_PERTURBADOS = 1

# Quantidade de palavras a serem recuperadas mais pr√≥ximas da m√°scara. Usar 1, 20 ou 100.
TOP_K_PREDICAO = 1

# Tamanho dos lotes de treino e avalia√ß√£o. Usar 16 ou 32
TAMANHO_LOTE = 16

######## Par√¢metros de conjunto ########
# Taxas de aprendizagem a serem avaliadas
#TAXAS_DE_APRENDIZAGEM = [1e-5, 2e-5, 3e-5, 4e-5, 5e-5]
TAXAS_DE_APRENDIZAGEM = [1e-5]

# MCLs a serem avaliados
#NOMES_MODELO = ['https://neuralmind-ai.s3.us-east-2.amazonaws.com/nlp/bert-base-portuguese-cased/bert-base-portuguese-cased_pytorch_checkpoint.zip',
#                'https://neuralmind-ai.s3.us-east-2.amazonaws.com/nlp/bert-large-portuguese-cased/bert-large-portuguese-cased_pytorch_checkpoint.zip',
#                'bert-base-multilingual-cased']

NOMES_MODELO = ["bert-large-cased"]

######## Par√¢metros de intervalo ########
# N√∫mero de √©pocas a serem avaliadas
# Todas as √©pocas s√£o avaliadas e os resultados da classifica√ß√£o s√£o salvos de 0 at√© 4.
# A √©poca 0 avalia o modelo sem realizar ajuste fino.
EPOCAS = 4

# Determina o intervalo de folds(Kfold=10m inicio_fold=1 e fim_fold=0) a serem avaliados.
inicio_fold = 1
fim_fold = 10

## Espec√≠ficos

Par√¢metros do treinamento

In [28]:
!pip install transformers[torch] -U

[0mCollecting transformers[torch]
  Using cached transformers-4.43.3-py3-none-any.whl.metadata (43 kB)
Using cached transformers-4.43.3-py3-none-any.whl (9.4 MB)
[0mInstalling collected packages: transformers
Successfully installed transformers-4.43.3
[0m

In [29]:
!pip install accelerate -U

[0m

In [30]:
# Importando as bibliotecas.
from transformers import TrainingArguments

# Defini√ß√£o dos par√¢metros de Treinamento
training_args = TrainingArguments(
    # NOME_BASE_SAIDA = Nome base do arquivo de sa√≠da
    # P = documentos perturbados
    # K = previs√µes palavras
    # E = n√∫mero total de √©pocas de treinamento
    # e = n√∫mero da √©poca executada
    # lr = taxa de aprendizagem
    # b = lotes de treino e avalia√ß√£o
    # f = n√∫mero do fold
    output_dir = NOME_BASE_SAIDA + "K_1_P_1_E_4_e_1_lr_5_b_8_4_f", # √â utilizado somente para logs de arquivo e wandb
    save_steps = 0,
    seed = 42,
    num_train_epochs = EPOCAS, # Intervalo de valores: 2, 3, 4. √â utilizado somente para logs.
    learning_rate = 5e-5, # Intervalo de valores: 1e-5, 2e-5, 3e-5, 4e-5, 5e-5. √â utilizado somente para logs.
    gradient_accumulation_steps = 1,
    per_device_train_batch_size = TAMANHO_LOTE,
    per_device_eval_batch_size = TAMANHO_LOTE,
    evaluation_strategy = 'epoch',
)



Par√¢metros do modelo

In [32]:
# Defini√ß√£o dos par√¢metros do Modelo.
model_args = ModeloArgumentosClassificacao(
    max_seq_len = 512,

    # pretrained_model_name_or_path = "bert-large-cased",
    pretrained_model_name_or_path = "bert-base-cased",
    #pretrained_model_name_or_path = "neuralmind/bert-large-portuguese-cased",
    #pretrained_model_name_or_path = "neuralmind/bert-base-portuguese-cased",
    #pretrained_model_name_or_path = "bert-base-multilingual-cased",
    #pretrained_model_name_or_path = "bert-base-multilingual-uncased",

    do_lower_case = False, # default True
    num_labels = 2,
    output_attentions = False, # default False
    output_hidden_states = False, # default False
    optimizer = 'AdamW',
    use_wandb = True, # Ativa a grava√ß√£o de logs no wandb
    salvar_modelo_wandb = False, # Ativa o salvamento do MCL no wandb
    salvar_modelo = False, # Ativa o salvamento do MCL no googledrive
    salvar_avaliacao = True, # Salva o resultado classifica√ß√µes
    salvar_classificacao = True, # Salva o resultado da avalia√ß√£o das classifica√ß√µes
    usar_mcl_ajustado = False, # Especifica se deve ser carregado um MCL ajustado ou pr√©-treinado. Necess√°rio especificar o tipo do modelo em pretrained_model_name_or_path.
    documentos_perturbados = DOCUMENTOS_PERTURBADOS, # Quantidade de documentos a serem perturbados a partir do original.
    top_k_predicao = TOP_K_PREDICAO, # Conjunto de valores: 1, 10, 100, 500 e 1000. Quantidade de palavras a serem recuperadas mais pr√≥ximas da m√°scara.
    fold = 10 # Intervalo de valores: 1 a 10, √â utilizado somente para logs. Use as vari√°veis do bloco a seguir para definir um intervalo dos folds
)

## Define o caminho para os arquivos de dados

In [33]:
# Diret√≥rio do cohebert
DIRETORIO_COHEBERT = "cohquad"

## Define o caminho para os arquivos de dados

In [34]:
# Diret√≥rio local para os arquivos pr√©-processados
DIRETORIO_LOCAL = "/content/" + DIRETORIO_COHEBERT + "/"

# Diret√≥rio no google drive com os arquivos pr√©-processados
DIRETORIO_DRIVE = "/content/drive/MyDrive/Colab Notebooks/Data/" + DIRETORIO_COHEBERT + "/"

## Inicializa√ß√£o diret√≥rios

Diret√≥rio base local

In [35]:
criaDiretorioLocal(DIRETORIO_LOCAL[:-1])

INFO:root:Diret√≥rio j√° existe: /content/cohquad.


Diret√≥rio para conter as os resultados das classifica√ß√µes

In [36]:
# Import de bibliotecas.
import os

def criaDiretorioClassificacao():
  DIRETORIO_BASE = DIRETORIO_DRIVE + "/validacao_classificacao_palavra"

  # Verifica se o diret√≥rio existe
  if not os.path.exists(DIRETORIO_BASE):
    # Cria o diret√≥rio
    os.makedirs(DIRETORIO_BASE)
    logging.info("Diret√≥rio criado: {}.".format(DIRETORIO_BASE))
  else:
    logging.info("Diret√≥rio j√° existe: {}.".format(DIRETORIO_BASE))

In [37]:
criaDiretorioClassificacao()

INFO:root:Diret√≥rio j√° existe: /content/drive/MyDrive/Colab Notebooks/Data/cohquad//validacao_classificacao_palavra.


Diret√≥rio para conter os arquivos da avalia√ß√£o kfold

In [38]:
# Import de bibliotecas.
import os

def criaDiretorioClassificacaoKfold():
  DIRETORIO_BASE = DIRETORIO_DRIVE + "validacao_classificacao_palavra/kfold"

  # Verifica se o diret√≥rio existe
  if not os.path.exists(DIRETORIO_BASE):
    # Cria o diret√≥rio
    os.makedirs(DIRETORIO_BASE)
    logging.info("Diret√≥rio criado: {}.".format(DIRETORIO_BASE))
  else:
    logging.info("Diret√≥rio j√° existe: {}.".format(DIRETORIO_BASE))

In [39]:
criaDiretorioClassificacaoKfold()

INFO:root:Diret√≥rio j√° existe: /content/drive/MyDrive/Colab Notebooks/Data/cohquad/validacao_classificacao_palavra/kfold.


Diret√≥rio para conter os arquivos de classifica√ß√£o da avalia√ß√£o kfold

In [40]:
# Import de bibliotecas.
import os

def criaDiretorioClassificacaoKfoldClassificacao():

  DIRETORIO_BASE = DIRETORIO_DRIVE + "validacao_classificacao_palavra/kfold/Classificacao"

  # Verifica se o diret√≥rio existe
  if not os.path.exists(DIRETORIO_BASE):
    # Cria o diret√≥rio
    os.makedirs(DIRETORIO_BASE)
    logging.info("Diret√≥rio criado: {}.".format(DIRETORIO_BASE))
  else:
    logging.info("Diret√≥rio j√° existe: {}.".format(DIRETORIO_BASE))

In [41]:
criaDiretorioClassificacaoKfoldClassificacao()

INFO:root:Diret√≥rio j√° existe: /content/drive/MyDrive/Colab Notebooks/Data/cohquad/validacao_classificacao_palavra/kfold/Classificacao.


Diret√≥rio para conter os arquivos de resultado da avalia√ß√£o kfold

In [42]:
# Import de bibliotecas.
import os

def criaDiretorioClassificacaoKfoldAvaliacao():

  DIRETORIO_BASE = DIRETORIO_DRIVE + "validacao_classificacao_palavra/kfold/Avaliacao"

  # Verifica se o diret√≥rio existe
  if not os.path.exists(DIRETORIO_BASE):
    # Cria o diret√≥rio
    os.makedirs(DIRETORIO_BASE)
    logging.info("Diret√≥rio criado: {}.".format(DIRETORIO_BASE))
  else:
    logging.info("Diret√≥rio j√° existe: {}.".format(DIRETORIO_BASE))

In [43]:
criaDiretorioClassificacaoKfoldAvaliacao()

INFO:root:Diret√≥rio j√° existe: /content/drive/MyDrive/Colab Notebooks/Data/cohquad/validacao_classificacao_palavra/kfold/Avaliacao.


# 3 BERT

## 3.1 Modelo Pr√©-treinado BERT

### Fun√ß√µes Auxiliares

In [44]:
def getNomeModeloBERT(model_args):
    '''
    Recupera uma string com uma descri√ß√£o do modelo BERT para nomes de arquivos e diret√≥rios.

    Par√¢metros:
    `model_args` - Objeto com os argumentos do modelo.

    Retorno:
    `MODELO_BERT` - Nome do modelo BERT.
    '''

    # Verifica o nome do modelo(default SEM_MODELO_BERT)
    MODELO_BERT = "SEM_MODELO_BERT"

    if 'neuralmind' in model_args.pretrained_model_name_or_path:
        MODELO_BERT = "_BERTimbau"
    else:
        if 'multilingual' in model_args.pretrained_model_name_or_path:
            MODELO_BERT = "_BERTmultilingual"
        else:
            if 'bert' in model_args.pretrained_model_name_or_path:
                MODELO_BERT = "_BERT"

    return MODELO_BERT

In [45]:
def getTamanhoBERT(model_args):
    '''
    Recupera uma string com o tamanho(dimens√£o) do modelo BERT para nomes de arquivos e diret√≥rios.

    Par√¢metros:
    `model_args` - Objeto com os argumentos do modelo.

    Retorno:
    `TAMANHO_BERT` - Nome do tamanho do modelo BERT.
    '''

    # Verifica o tamanho do modelo(default large)
    TAMANHO_BERT = "_large"

    if 'base' in model_args.pretrained_model_name_or_path:
        TAMANHO_BERT = "_base"

    return TAMANHO_BERT

### Fun√ß√£o download Modelo Pre-treinado BERT

In [46]:
# Import das bibliotecas.
import zipfile # Biblioteca para descompactar
import shutil # iblioteca de manipula√ß√£o arquivos de alto n√≠vel

def downloadModeloPretreinado(model_args):
    """
      Realiza o download do modelo BERT(MODELO) e retorna o diret√≥rio onde o modelo BERT(MODELO) foi descompactado.

      Par√¢metros:
        `model_args` - Objeto com os argumentos do modelo.

      Retorno:
        `DIRETORIO_MODELO` - Diret√≥rio de download do modelo.
    """

    # Nome diret√≥rio base modelo BERT
    NOME_DIRETORIO_BASE_MODELO = "modeloBERT"

    # Verifica se existe o diret√≥rio base do cohebert e retorna o nome do diret√≥rio
    DIRETORIO_COHEBERT = verificaDiretorioCoheBERT()

    # Recupera o nome ou caminho do modelo
    MODELO = model_args.pretrained_model_name_or_path

    # Vari√°vel para setar o arquivo.
    URL_MODELO = None

    if "http" in MODELO:
        URL_MODELO = MODELO

    # Se a vari√°vel foi setada.
    if URL_MODELO:

        # Diret√≥rio do modelo.
        DIRETORIO_MODELO = DIRETORIO_COHEBERT + "/" + NOME_DIRETORIO_BASE_MODELO

        # Recupera o nome do arquivo do modelo da url.
        NOME_ARQUIVO = URL_MODELO.split("/")[-1]

        # Nome do arquivo do vocabul√°rio.
        ARQUIVO_VOCAB = "vocab.txt"

        # Caminho do arquivo na url.
        CAMINHO_ARQUIVO = URL_MODELO[0:len(URL_MODELO)-len(NOME_ARQUIVO)]

        # Verifica se o diret√≥rio de descompacta√ß√£o existe no diret√≥rio corrente
        if os.path.exists(DIRETORIO_MODELO):
            logging.info("Apagando diret√≥rio existente do modelo.")
            # Apaga o diret√≥rio e os arquivos existentes
            shutil.rmtree(DIRETORIO_MODELO)

        # Realiza o download do arquivo do modelo
        downloadArquivo(URL_MODELO, NOME_ARQUIVO)

        # Descompacta o arquivo no diret√≥rio de descompacta√ß√£o.
        arquivo_zip = zipfile.ZipFile(NOME_ARQUIVO, "r")
        arquivo_zip.extractall(DIRETORIO_MODELO)

        # Baixa o arquivo do vocabul√°rio.
        # O vocabul√°rio n√£o est√° no arquivo compactado acima, mesma url mas arquivo diferente.
        URL_MODELO_VOCAB = CAMINHO_ARQUIVO + ARQUIVO_VOCAB
        # Coloca o arquivo do vocabul√°rio no diret√≥rio do modelo.
        downloadArquivo(URL_MODELO_VOCAB, DIRETORIO_MODELO + "/" + ARQUIVO_VOCAB)

        # Apaga o arquivo compactado
        os.remove(NOME_ARQUIVO)

        del arquivo_zip

        logging.info("Diret√≥rio {} do modelo BERT pronta.".format(DIRETORIO_MODELO))

    else:
        DIRETORIO_MODELO = MODELO
        logging.info("Vari√°vel URL_MODELO n√£o setada.")

    return DIRETORIO_MODELO

### Copia o modelo do BERT ajustado

In [47]:
# Import das bibliotecas.
import shutil # iblioteca de manipula√ß√£o arquivos de alto n√≠vel

def download_directory_from_gcs(bucket, source_prefix, destination_dir):
    """Download all files from a GCS bucket directory to a local directory."""
    blobs = bucket.list_blobs(prefix=source_prefix)
    for blob in blobs:
        local_path = os.path.join(destination_dir, blob.name[len(source_prefix):])
        os.makedirs(os.path.dirname(local_path), exist_ok=True)
        blob.download_to_filename(local_path)

def copiaModeloAjustado(model_args):
    """
      Copia o modelo ajustado BERT do GoogleDrive para o projeto.

      Par√¢metros:
        `model_args` - Objeto com os argumentos do modelo.

      Retorno:
        `DIRETORIO_LOCAL_MODELO_AJUSTADO` - Diret√≥rio de download ajustado do modelo.
    """

    # Verifica o nome do modelo BERT a ser utilizado
    MODELO_BERT = getNomeModeloBERT(model_args)

    # Verifica o tamanho do modelo(default large)
    TAMANHO_BERT = getTamanhoBERT(model_args)

    # Verifica se existe o diret√≥rio base do cohebert e retorna o nome do diret√≥rio
    DIRETORIO_COHEBERT = verificaDiretorioCoheBERT()

    # Diret√≥rio local de salvamento do modelo.
    DIRETORIO_LOCAL_MODELO_AJUSTADO = DIRETORIO_COHEBERT + "/modelo_ajustado/"

    # Diret√≥rio remoto de salvamento do modelo no google drive.
    DIRETORIO_REMOTO_MODELO_AJUSTADO = "/content/drive/MyDrive/Colab Notebooks/Data/" + DIRETORIO_COHEBERT + "validacao_classificacao_palavra/holdout/modelo/" + MODELO_BERT + TAMANHO_BERT
    download_directory_from_gcs(bucket, DIRETORIO_REMOTO_MODELO_AJUSTADO, DIRETORIO_LOCAL_MODELO_AJUSTADO)

    # Copia o arquivo do modelo para o diret√≥rio no Google Drive.
    # shutil.copytree(DIRETORIO_REMOTO_MODELO_AJUSTADO, DIRETORIO_LOCAL_MODELO_AJUSTADO)

    logging.info("Modelo BERT ajustado copiado!")

    return DIRETORIO_LOCAL_MODELO_AJUSTADO

### Verifica de onde utilizar o modelo do BERT

In [48]:
def verificaModelo(model_args):
    """
    Verifica de onde utilizar o modelo.

    Par√¢metros:
    `model_args` - Objeto com os argumentos do modelo.

    Retorno:
    `DIRETORIO_MODELO` - Diret√≥rio de download do modelo.
    """

    DIRETORIO_MODELO = None

    if model_args.usar_mcl_ajustado == True:
        # Diret√≥rio do modelo
        DIRETORIO_MODELO = copiaModeloAjustado()

        logging.info("Usando modelo BERT ajustado.")

    else:
        DIRETORIO_MODELO = downloadModeloPretreinado(model_args)
        logging.info("Usando modelo BERT pr√©-treinado.")

    return DIRETORIO_MODELO

## 3.2 Tokenizador BERT

### Fun√ß√£o carrega Tokenizador BERT

O tokenizador utiliza WordPiece, veja em [artigo original](https://arxiv.org/pdf/1609.08144.pdf).



In [49]:
# Import das bibliotecas.
from transformers import BertTokenizer # Importando as bibliotecas do tokenizador BERT.

def carregaTokenizadorModeloPretreinado(DIRETORIO_MODELO, model_args):
    """
      Carrega o tokenizador do DIRETORIO_MODELO.
      O tokenizador utiliza WordPiece.
      Carregando o tokenizador do diret√≥rio "./modelo/" do diret√≥rio padr√£o se vari√°vel `DIRETORIO_MODELO` setada.
      Caso contr√°rio carrega da comunidade
      Por default(`do_lower_case=True`) todas as letras s√£o colocadas para min√∫sculas. Para ignorar a convers√£o para min√∫sculo use o par√¢metro `do_lower_case=False`. Esta op√ß√£o tamb√©m considera as letras acentuadas(√£√ß√©√≠...), que s√£o necess√°rias a l√≠ngua portuguesa.
      O par√¢metro `do_lower_case` interfere na quantidade tokens a ser gerado a partir de um texto. Quando igual a `False` reduz a quantidade de tokens gerados.

      Par√¢metros:
        `DIRETORIO_MODELO` - Diret√≥rio a ser utilizado pelo modelo BERT.
        `model_args` - Objeto com os argumentos do modelo.

      Retorno:
        `tokenizer` - Tokenizador BERT.
    """

    tokenizer = None

    # Se a vari√°vel DIRETORIO_MODELO foi setada.
    if DIRETORIO_MODELO:
        # Carregando o Tokenizador.
        logging.info("Carregando o tokenizador BERT do diret√≥rio {}.".format(DIRETORIO_MODELO))

        tokenizer = BertTokenizer.from_pretrained(DIRETORIO_MODELO, do_lower_case=model_args.do_lower_case)

    else:
        # Carregando o Tokenizador da comunidade.
        logging.info("Carregando o tokenizador BERT da comunidade.")

        tokenizer = BertTokenizer.from_pretrained(model_args.pretrained_model_name_or_path, do_lower_case=model_args.do_lower_case)

    return tokenizer

## 3.3 Carrega o modelo e tokenizador BERT

Lista de modelos da comunidade:
* https://huggingface.co/models

Portugu√™s(https://github.com/neuralmind-ai/portuguese-bert):  
* **"neuralmind/bert-base-portuguese-cased"**
* **"neuralmind/bert-large-portuguese-cased"**

A implementa√ß√£o do huggingface pytorch inclui um conjunto de interfaces projetadas para uma variedade de tarefas de PNL. Embora essas interfaces sejam todas constru√≠das sobre um modelo treinado de BERT, cada uma possui diferentes camadas superiores e tipos de sa√≠da projetados para acomodar suas tarefas espec√≠ficas de PNL.

### Fun√ß√£o carrega modelo BERT medida




In [50]:
# Import das bibliotecas.
from transformers import BertModel # Importando as bibliotecas do Modelo BERT.

def carregaModeloMedida(DIRETORIO_MODELO, model_args):
    """
      Carrega o modelo e retorna o modelo.

      Par√¢metros:
        `DIRETORIO_MODELO` - Diret√≥rio a ser utilizado pelo modelo BERT.
        `model_args` - Objeto com os argumentos do modelo.

      Retorno:
        `model` - Um objeto do modelo BERT carregado.
    """

    # Vari√°vel para setar o arquivo.
    URL_MODELO = None

    if "http" in model_args.pretrained_model_name_or_path:
        URL_MODELO = model_args.pretrained_model_name_or_path

    # Se a vari√°vel URL_MODELO foi setada
    if URL_MODELO:
        # Carregando o Modelo BERT
        logging.info("Carregando o modelo BERT do diret√≥rio {} para c√°lculo de medidas.".format(DIRETORIO_MODELO))

        model = BertModel.from_pretrained(DIRETORIO_MODELO,
                                          output_attentions=model_args.output_attentions,
                                          output_hidden_states=model_args.output_hidden_states)

    else:
        # Carregando o Modelo BERT da comunidade
        logging.info("Carregando o modelo BERT da comunidade {} para c√°lculo de medidas.".format(model_args.pretrained_model_name_or_path))

        model = BertModel.from_pretrained(model_args.pretrained_model_name_or_path,
                                          output_attentions=model_args.output_attentions,
                                          output_hidden_states=model_args.output_hidden_states)

    return model

### Fun√ß√£o carrega modelo BERT classifica√ß√£o



In [51]:
# Import das bibliotecas.
from transformers import BertForSequenceClassification # Importando as bibliotecas do Modelo BERT.

def carregaModeloClassifica(DIRETORIO_MODELO, model_args):
    '''
    Carrega o modelo e retorna o modelo.

    Par√¢metros:
    `DIRETORIO_MODELO` - Diret√≥rio a ser utilizado pelo modelo BERT.
    `model_args` - Objeto com os argumentos do modelo.

    Retorno:
    `model` - Um objeto do modelo BERT carregado.
    '''

    # Vari√°vel para setar o arquivo.
    URL_MODELO = None

    if 'http' in model_args.pretrained_model_name_or_path:
        URL_MODELO = model_args.pretrained_model_name_or_path

    # Se a vari√°vel URL_MODELO foi setada
    if URL_MODELO:
        # Carregando o Modelo BERT
        logging.info("Carregando o modelo BERT do diret√≥rio {} para classifica√ß√£o.".format(DIRETORIO_MODELO))

        model = BertForSequenceClassification.from_pretrained(DIRETORIO_MODELO,
                                                              num_labels=model_args.num_labels,
                                                              output_attentions=model_args.output_attentions,
                                                              output_hidden_states=model_args.output_hidden_states)

    else:
        # Carregando o Modelo BERT da comunidade
        logging.info("Carregando o modelo BERT da comunidade {} para classifica√ß√£o.".format(model_args.pretrained_model_name_or_path))

        model = BertForSequenceClassification.from_pretrained(model_args.pretrained_model_name_or_path,
                                                              num_labels=model_args.num_labels,
                                                              output_attentions=model_args.output_attentions,
                                                              output_hidden_states=model_args.output_hidden_states)
    return model

### Fun√ß√£o carrega o BERT

In [52]:
def carregaBERT(model_args):
    """
      Carrega o BERT para c√°lculo de medida ou classifica√ß√£o e retorna o modelo e o tokenizador.
      O tipo do model retornado pode ser BertModel ou BertForSequenceClassification, depende do tipo de model_args.

      Par√¢metros:
        `model_args` - Objeto com os argumentos do modelo.
          - Se model_args = ModeloArgumentosClassificacao deve ser carregado o BERT para classifica√ß√£o(BertForSequenceClassification).
          - Se model_args = ModeloArgumentosMedida deve ser carregado o BERT para c√°lculo de medida(BertModel).

      Retorno:
        `model` - Um objeto do modelo BERT carregado.
        `tokenizer` - Um objeto tokenizador BERT carregado.
    """

    # Verifica a origem do modelo
    DIRETORIO_MODELO = verificaModelo(model_args)

    # Vari√°vel para conter o modelo
    model = None

    # Verifica o tipo do modelo em model_args
    if type(model_args) == ModeloArgumentosMedida:
        # Carrega o modelo para c√°lculo da medida
        model = carregaModeloMedida(DIRETORIO_MODELO, model_args)

    else:
        # Carrega o modelo para classifica√ß√£o
        model = carregaModeloClassifica(DIRETORIO_MODELO, model_args)

        # Recupera o dispositivo da GPU
        device = getDeviceGPU()

        # Conecta o modelo a GPU
        model = conectaGPU(model, device)

    # Carrega o tokenizador.
    # O tokenizador √© o mesmo para o classificador e medidor.
    tokenizer = carregaTokenizadorModeloPretreinado(DIRETORIO_MODELO, model_args)

    return model, tokenizer

### Recupera detalhes do BERT

In [53]:
# Verifica o nome do modelo BERT a ser utilizado
MODELO_BERT = getNomeModeloBERT(model_args)

# Verifica o tamanho do modelo(default large)
TAMANHO_BERT = getTamanhoBERT(model_args)

# 4 Treino

## 4.1 Wandb

https://wandb.ai/osmar-braz/AjusteFinoCohebert_C_SB_KF_v1/table?workspace=user-osmar-braz



### Fun√ß√£o de inicializa√ß√£o wandb

In [54]:
#¬†Importando¬†a¬†biblioteca.
import wandb

def inicializacaoWandb():

  if model_args.use_wandb:

    #Login via linha de comando
    !wandb login aded3bc0ea651fff536cc08ba69caf8ac4141cfd

    #¬†Inicializando¬†o¬†registro¬†do¬†experimento.
    #¬†Na¬†execu√ß√£o¬†s√≥¬†pode¬†existir¬†de¬†um¬†init¬†¬†para¬†que¬†n√£o¬†gere¬†dois¬†registros¬†no¬†wandb.
    # O projeto no wandb recebe o nome base mais o n√∫mero de um fold especifico.
    wandb.init(project=NOME_BASE_SAIDA, name=training_args.output_dir + str(model_args.fold))

    # Atualiza os par√¢metros do modelo no wandb.
    wandb.config.update(model_args)
    # Atualiza os par√¢metros de treinamento no wandb.
    wandb.config.update(training_args)
    wandb.config.dataset = DIRETORIO_COHEBERT
    wandb.config.batch_size = training_args.per_device_train_batch_size

    #¬†Registra¬†os¬†par√§metros¬†n√£o¬†literais¬†do¬†model_args.
    wandb.log({"max_seq_len": model_args.max_seq_len})
    wandb.log({"do_lower_case": model_args.do_lower_case})
    wandb.log({"output_hidden_states": model_args.output_hidden_states})

    return wandb

## 4.2 Carregamento dos arquivos de dados kfold

### Especifica os nomes dos arquivos de dados



In [55]:
# Nome do arquivo
NOME_ARQUIVO_FOLD_COMPACTADO = DIRETORIO_COHEBERT + "_KFOLD_10" + "_P" +  str(model_args.documentos_perturbados) + "_K" + str(model_args.top_k_predicao) + ".zip"

### Copia os arquivos do Google Drive para o Colaboratory

In [56]:
# def copiaArquivoFold():

#   # Se estiver executando no Google Colaboratory
#   if IN_COLAB:

#     criaDiretorioLocal()

#     !cp "$DIRETORIO_DRIVE""validacao_classificacao_palavra/kfold/""$NOME_ARQUIVO_FOLD_COMPACTADO" "$DIRETORIO_LOCAL"

#     logging.info("Terminei a c√≥pia.")

# Fun√ß√£o para copiar o arquivo do GCS para o diret√≥rio local
def copiaArquivoFold():
    # Caminho no GCS
    source_blob_name = f'{DIRETORIO_COHEBERT}/validacao_classificacao_palavra/kfold/{NOME_ARQUIVO_FOLD_COMPACTADO}'
    # Caminho no diret√≥rio local
    destination_file_name = os.path.join(DIRETORIO_LOCAL, NOME_ARQUIVO_FOLD_COMPACTADO)

    # Se estiver executando no Google Colaboratory
    if IN_COLAB:
        criaDiretorioLocal(DIRETORIO_LOCAL)
        download_blob(bucket_name, source_blob_name, destination_file_name)
        logging.info("Terminei a c√≥pia.")

In [57]:
copiaArquivoFold()

INFO:root:Diret√≥rio j√° existe: /content/cohquad/.
INFO:root:Terminei a c√≥pia.


File cohquad/validacao_classificacao_palavra/kfold/cohquad_KFOLD_10_P1_K1.zip downloaded to /content/cohquad/cohquad_KFOLD_10_P1_K1.zip.


Descompacta os arquivos

Usa o unzip para descompactar:
*   `-o` sobrescreve o arquivo se existir
*   `-j` N√£o cria nenhum diret√≥rio
*   `-q` Desliga as mensagens
*   `-d` Diret√≥rio de destino


In [58]:
def descompactaArquivoFold():

  # Se estiver executando no Google Colaboratory
  if IN_COLAB:
    !unzip -o -j -q "$DIRETORIO_LOCAL$NOME_ARQUIVO_FOLD_COMPACTADO" -d "/content/validacao_kfold"

    logging.info("Terminei a descompacta√ß√£o.")

In [59]:
descompactaArquivoFold()

INFO:root:Terminei a descompacta√ß√£o.


### 4.2.4 Fun√ß√£o de carregamento dos dados de um fold

In [60]:
# Import das bibliotecas.
import pandas as pd

def carregamentoDadosFold(fold):

  logging.info("Carregando os arquivos do fold de treino e avalia√ß√£o.")

  # Diret√≥rio dos arquivos de dados.
  DIRETORIO = "/content/validacao_kfold"

  # Define o prefixo do nome dos arquivos dos folds
  PREFIXO_NOME_ARQUIVO_TREINO = DIRETORIO_COHEBERT + "_Train_f"
  PREFIXO_NOME_ARQUIVO_TESTE = DIRETORIO_COHEBERT + "_Test_f"

  # Nome dos arquivos.
  ARQUIVO_TREINO = DIRETORIO + "/" + PREFIXO_NOME_ARQUIVO_TREINO + str(fold) + ".csv"
  ARQUIVO_TESTE = DIRETORIO + "/" + PREFIXO_NOME_ARQUIVO_TESTE + str(fold) + ".csv"

  logging.info("Carregando arquivo de treino: {}.".format(ARQUIVO_TREINO))
  logging.info("Carregando arquivo de teste: {}.".format(ARQUIVO_TESTE))

  # Verifica se o arquivo existe
  if not os.path.isfile(ARQUIVO_TREINO):
      # Caso contr√°rio copia o arquivo do drive e descompacta
      copiaArquivoFold()
      descompactaArquivoFold()

  # Carrega o conjunto de dados de treino e teste.
  df_dados_train = pd.read_csv(ARQUIVO_TREINO, sep=';')
  df_dados_test = pd.read_csv(ARQUIVO_TESTE, sep=';')
  #logging.info("Qtde de dados de treino: {} e teste {}.".format(len(df_dados_train), len(df_dados_test)))

  return df_dados_train, df_dados_test

## 4.3 An√°lise

### Fun√ß√£o descarte documentos muito grandes

In [61]:

def descarteDocumentosGrandes(tokenizer,
                              tamanho_maximo_token,
                              df_dados_train,
                              df_dados_test):

  logging.info("Descartando documentos grandes dos conjuntos de dados.")

  # Define o tamanho m√°ximo para os tokens.
  tamanho_maximo = tamanho_maximo_token

  # Tokenize a codifica as seten√ßas para o BERT.
  df_dados_train["input_ids"] = df_dados_train["documento"].apply(lambda tokens: tokenizer.encode(tokens, add_special_tokens=True))

  df_dados_train = df_dados_train[df_dados_train["input_ids"].apply(len)<tamanho_maximo]

  # Remove as colunas desnecess√°rias.
  df_dados_train = df_dados_train.drop(columns=["input_ids"])

  # Tokenize a codifica as seten√ßas para o BERT.
  df_dados_test["input_ids"] = df_dados_test["documento"].apply(lambda tokens: tokenizer.encode(tokens, add_special_tokens=True))

  # Corta os inputs para o tamanho m√°ximo 512.
  df_dados_test = df_dados_test[df_dados_test["input_ids"].apply(len)<tamanho_maximo]

  #logging.info("Tamanho do conjunto de dados: {} / Treino: {} / Teste: {}.".format((len(df_dados_train)+len(df_dados_test)),len(df_dados_train), len(df_dados_test)))

  # Remove as colunas desnecess√°rias.
  df_dados_test = df_dados_test.drop(columns=["input_ids"])

  del tokenizer
  del tamanho_maximo

  return df_dados_train, df_dados_test

## 4.4 Treinando o modelo de classifica√ß√£o

### Otimizador e Agendador de Taxas de Aprendizado/Optimizer & Learning Rate Scheduler



Agora que temos nosso modelo carregado, precisamos pegar os hiperpar√¢metros de treinamento no modelo armazenado.

Para fins de ajuste fino, os autores recomendam escolher entre os seguintes valores (no Ap√™ndice A.3 do [artigo BERT](https://arxiv.org/pdf/1810.04805.pdf)):

> - **Tamanho do lote(Batch size):** 16, 32
- **Taxa de aprendizado (Adam):** 5e-5, 3e-5, 2e-5
- **N√∫mero de √©pocas:** 2, 3, 4

O par√¢metro epsilon `eps = 1e-6` √©" um n√∫mero muito pequeno para impedir qualquer divis√£o por zero na implementa√ß√£o "(a partir de [aqui](https://machinelearningmastery.com/adam-optimization-algorithm-for-deep-learning/)).

Voc√™ pode encontrar a cria√ß√£o do otimizador do AdamW em `run_glue.py` [aqui](https://github.com/huggingface/transformers/blob/5bfcd0485ece086ebcbed2d008813037968a9e58/examples/run_glue.py#L109).

### Fun√ß√£o carrega otimizador


In [62]:
# Import das bibliotecas.
from transformers import AdamW

def carregaOtimizador(training_args, model):
  '''
    Esta fun√ß√£o carrega o otimizador utilizado no agendador de aprendizado.
  '''

  # Nota: AdamW √© uma classe da biblioteca huggingface (ao contr√°rio de pytorch).
  # Eu acredito que o 'W' significa 'Corre√ß√£o de redu√ß√£o de peso "
  optimizer = AdamW(model.parameters(),
                  lr = training_args.learning_rate, # (ou alfa) A taxa de aprendizado a ser usada. - default √© 3e-5
                  # betas = (0.9, 0.999), # (beta1, beta2) - default √© (0.9, 0.999)
                    # beta1 √© taxa de decaimento exponencial para as estimativas do primeiro momento.
                    # beta2 √© taxa de decaimento exponencial para as estimativas do segundo momento. Este valor deve ser definido pr√≥ximo a 1,0 em problemas com gradiente esparso (por exemplo, PNL e problemas de vis√£o de computacional)
                  # eps = 1e-6, #  √â um n√∫mero muito pequeno para evitar qualquer divis√£o por zero na implementa√ß√£o - default √© 1e-6.
                  # weight_decay = 0.0, # Corre√ß√£o de redu√ß√£o de peso. - default √© 0.0
                    # A redu√ß√£o da taxa de aprendizagem tamb√©m pode ser usada com Adam. A taxa de decaimento √© atualizada a cada √©poca para a demonstra√ß√£o da regress√£o log√≠stica.
                  # correct_bias = True #  Se n√£o deve corrigir o vi√©s(bias) no Adam mudar para False.- default √© True
                )

  return optimizer

### Fun√ß√£o carrega agendador

A fun√ß√£o **get_linear_schedule_with_warmup** cria um agendador com uma taxa de aprendizado que diminua linearmente da taxa de aprendizagem inicial definido no otimizador at√© 0, ap√≥s um per√≠odo de aquecimento durante o qual ele aumenta linearmente de 0 para a taxa de aprendizagem inicial definido no otimizador.

Se `num_warmup_steps=0` e `weight_decay=0`(otimizador) n√£o ocorre a etapa de aquecimento.

In [63]:
# Import das bibliotecas.
from transformers import get_linear_schedule_with_warmup

def carregaAgendador(training_args, optimizer, numero_etapas):
  '''
    Esta fun√ß√£o carrega o agendador com um taxa de aprendizado que diminua linearmente at√© 0.
  '''

  # O n√∫mero total de etapas de ajuste fino √© [n√∫mero de lotes] x [n√∫mero de √©pocas].
  # (Observe que este n√£o √© o mesmo que o n√∫mero de amostras de ajuste fino).
  total_etapas = numero_etapas * training_args.num_train_epochs

  #Cria o agendador de taxa de aprendizagem.
  scheduler = get_linear_schedule_with_warmup(optimizer, # O otimizador para o qual agendar a taxa de aprendizado.
                                            num_warmup_steps = 0, # O n√∫mero de etapas para a fase de aquecimento. Valor default value em run_glue.py
                                            num_training_steps = total_etapas) # O n√∫mero total de etapas de treinamento.


  logging.info("Total de etapas: {}".format(total_etapas))

  return scheduler

### Fun√ß√£o cria lotes inteligentes

In [64]:
# Import das bibliotecas.
from tqdm.notebook import tqdm as tqdm_notebook
import random

def criarLotesInteligentes(tokenizer,
                           documentos,
                           classes,
                           id_documentos,
                           batch_size):
    '''
    Esta fun√ß√£o combina todos os passos para preparar os lotes.
    '''
    logging.info("Criando Lotes Inteligentes de {:,} amostras com tamanho de lote {:,}...".format(len(documentos), batch_size))

    # ============================
    #   Tokeniza√ß√£o & Truncamento
    # ============================

    input_ids_completos = []

    # Tokeniza todas as amostras de treinamento
    logging.info("Tokenizando {:,} amostra...".format(len(classes)))

    # Escolha o intervalo que o progresso ser√° atualizado.
    intervalo_atualizacao = obterIntervaloAtualizacao(total_iteracoes=len(classes), numero_atualizacoes=10)

    # Barra de progresso dos documentos
    documentos_bar = tqdm_notebook(documentos, desc=f'Documentos ', unit=f'documento', total=len(documentos))

    # Para cada amostra de treinamento...
    for documento in documentos_bar:

        # Relat√≥rio de progresso
        #if ((len(input_ids_completos) % intervalo_atualizacao) == 0):
        #    logging.info("  Tokenizado {:,} amostras.".format(len(input_ids_completos)))

        # Tokeniza a amostra.
        input_ids = tokenizer.encode(text=documento,                    # Documento a ser codificado.
                                    add_special_tokens=True,            # Adiciona os ttokens especiais.
                                    max_length=model_args.max_seq_len,  # Tamanho do truncamento!
                                    truncation=True,                    # Faz o truncamento!
                                    padding=False)                      # N√£o preenche.

        # Adicione o resultado tokenizado √† nossa lista.
        input_ids_completos.append(input_ids)

        del input_ids

    del documentos

    logging.info("{:>10,} amostras tokenizadas.".format(len(input_ids_completos)))

    # =========================
    #      Seleciona os Lotes
    # =========================

    # Classifique as duas listas pelo comprimento da sequ√™ncia de entrada.
    amostras = sorted(zip(input_ids_completos, classes, id_documentos), key=lambda x: len(x[0]))

    del input_ids_completos
    del classes
    del id_documentos

    logging.info("{:>10,} amostras ap√≥s classifica√ß√£o.".format(len(amostras)))

    # Lista de lotes que iremos construir.
    batch_ordered_documentos = []
    batch_ordered_classes = []
    batch_ordered_id_documentos = []

    logging.info("Criando lotes de tamanho {:}...".format(batch_size))

    # Escolha um intervalo no qual imprimir atualiza√ß√µes de progresso.
    intervalo_atualizacao = obterIntervaloAtualizacao(total_iteracoes=len(amostras), numero_atualizacoes=10)

    # Fa√ßa um loop em todas as amostras de entrada ...
    while len(amostras) > 0:

        # Mostra o progresso.
        if ((len(batch_ordered_documentos) % intervalo_atualizacao) == 0 \
            and not len(batch_ordered_documentos) == 0):
            logging.info("  Selecionado {:,} lotes.".format(len(batch_ordered_documentos)))

        # `to_take` √© o tamanho real do nosso lote. Ser√° `batch_size` at√©
        # chegamos ao √∫ltimo lote, que pode ser menor.
        to_take = min(batch_size, len(amostras))

        # Escolha um √≠ndice aleat√≥rio na lista de amostras restantes para come√ßar o nosso lote.
        select = random.randint(0, len(amostras) - to_take)

        # Selecione um lote cont√≠guo de amostras come√ßando em `select`.
        #print ("Selecionando lote de {:} a {:}".format(select, select+to_take))
        batch = amostras[select:(select + to_take)]

        #print("Tamanho do lote:", len(batch))

        # Cada amostra √© uma tupla --divida para criar uma lista separada de
        # sequ√™ncias e uma lista de r√≥tulos para este lote.
        batch_ordered_documentos.append([s[0] for s in batch])
        batch_ordered_classes.append([s[1] for s in batch])
        batch_ordered_id_documentos.append([s[2] for s in batch])

        # Remova a amostra da lista
        del amostras[select:select + to_take]

    logging.info("  FEITO - Selecionado {:,} lotes.".format(len(batch_ordered_documentos)))

    # =========================
    #        Adicionando o preenchimento
    # =========================

    logging.info("Preenchendo sequ√™ncias dentro de cada lote...")

    py_input_ids = []
    py_attention_masks = []
    py_labels = []
    list_id_documentos = []

    # Para cada lote...
    for (batch_input_ids, batch_labels, batch_id_documentos) in zip(batch_ordered_documentos, batch_ordered_classes, batch_ordered_id_documentos):

        # Nova vers√£o do lote, desta vez com sequ√™ncias preenchidas e agora com
        # as m√°scaras de aten√ß√£o definidas.
        batch_padded_input_ids = []
        batch_attention_masks = []

        # Primeiro, encontre a amostra mais longa do lote.
        # Observe que as sequ√™ncias atualmente incluem os tokens especiais!
        max_size = max([len(input) for input in batch_input_ids])

        # Para cada entrada neste lote...
        for input in batch_input_ids:

            # Quantos tokens pad precisam ser adicionados
            num_pads = max_size - len(input)

            # Adiciona `num_pads` do pad token(tokenizer.pad_token_id) at√© o final da sequ√™ncia.
            padded_input = input + [tokenizer.pad_token_id] * num_pads

            # Define a m√°scara de aten√ß√£o --√© apenas um `1` para cada token real
            # e um `0` para cada token de preenchimento(pad).
            attention_mask = [1] * len(input) + [0] * num_pads

            # Adiciona o resultado preenchido ao lote.
            batch_padded_input_ids.append(padded_input)
            batch_attention_masks.append(attention_mask)

            del padded_input
            del attention_mask

        # Nosso lote foi preenchido, portanto, precisamos salvar este lote atualizado.
        # Tamb√©m precisamos que as entradas sejam tensores PyTorch, ent√£o faremos isso aqui.
        py_input_ids.append(torch.tensor(batch_padded_input_ids))
        py_attention_masks.append(torch.tensor(batch_attention_masks))
        py_labels.append(torch.tensor(batch_labels))
        list_id_documentos.append(batch_id_documentos)

        del batch_padded_input_ids
        del batch_attention_masks

    del batch_ordered_documentos
    del batch_ordered_classes
    del batch_ordered_id_documentos

    del tokenizer

    # Retorna o conjunto de dados em lotes inteligentes!
    return (py_input_ids, py_attention_masks, py_labels, list_id_documentos)

### Fun√ß√£o de Treinamento

In [65]:
# Import das bibliotecas
import random
import numpy as np
from tqdm.notebook import tqdm as tqdm_notebook

def realizaTreinamento(model,
                       tokenizer,
                       optimizer,
                       scheduler,
                       documentos_treino,
                       classes_treino,
                       id_documentos_treino,
                       documentos_teste,
                       classes_teste,
                       id_documentos_teste,
                       EPOCAS = 4):

  #logging.info("Realizando treinamento e avalia√ß√£o do fold: {}".format(model_args.fold))

  # Defina o valor da semente em todos os lugares para torn√°-lo reproduz√≠vel.
  seed_val = training_args.seed
  random.seed(seed_val)
  np.random.seed(seed_val)
  torch.manual_seed(seed_val)
  torch.cuda.manual_seed_all(seed_val)

  # Medida do tempo total de treinamento e avalia√ß√£o.
  treinamento_avaliacao_t0 = time.time()

  # Limpa o cache da GPU.
  torch.cuda.empty_cache()

  # Coloque o modelo em modo de treinamento.
  model.train()

  # Acumula as perdas do treinamento.
  train_losses = []
  test_losses = []

  # Barra de progresso da √©poca.
  epoca_bar = tqdm_notebook(range(1,training_args.num_train_epochs+1), desc=f'√âpocas', unit=f'√©pocas')

  # Para cada √©poca.
  for epoca_i in epoca_bar:

    # ========================================
    #               Inicializa√ß√£o
    # ========================================

    # Recupera o lote inteligente
    (py_input_ids, py_attention_masks, py_labels, documentoids) = criarLotesInteligentes(tokenizer, documentos_treino, classes_treino, id_documentos_treino, training_args.per_device_train_batch_size)

    # ========================================
    #               Avalia√ß√£o √©poca 0, sem treinamento
    # ========================================
    if epoca_i == 1:

      # Atualiza a √©poca avaliada
      model_args.epoca = epoca_i-1

      # Atualiza o nome da sa√≠da avaliada
      training_args.output_dir = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args, model_args)

      # Inicializa o wandb para registro
      # Gera uma entrada para cada todas as epocas, com a taxa de aprendizagem, lote e fold
      wandb = inicializacaoWandb()

      # Log das m√©tidas com wandb.
      if model_args.use_wandb:
        wandb.watch(model)

      # Registra o tempo inicial.
      avaliacao_epoca_t0 = time.time()

      # Realiza a avalia√ß√£o do modelo.
      media_test_epoca_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, lista_resultado_avaliacao = realizaAvaliacao(epoca_i-1,
                                                                                                                     model,
                                                                                                                     tokenizer,
                                                                                                                     optimizer,
                                                                                                                     scheduler,
                                                                                                                     wandb,
                                                                                                                     documentos_teste,
                                                                                                                     classes_teste,
                                                                                                                     id_documentos_teste)

      logging.info("   Avalia√ß√£o loss: {:.8f}; Acc: {:.8f}; Rec: {:.8f}; Pre: {:.8f}, F1:{:.8f}, vp: {:3d}; vn: {:3d}; fp: {:3d}; fn: {:3d}".format(media_test_epoca_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s))
      logging.info("   Acur√°cia do fold {} na √©poca {}: {:.8f}.".format(model_args.fold, epoca_i-1, acc))

      # Acumule a perda de treinamento da √©poca para calcular a perda m√©dia do treinamento.
      test_losses.append(media_test_epoca_loss)

      # Medida de quanto tempo levou a execu√ß√£o da avalia√ß√£o
      avaliacao_epoca_total = formataTempo(time.time() - avaliacao_epoca_t0)

      logging.info("   M√©dia perda(loss) do avalia√ß√£o da √©poca   : {0:.8f}.".format(media_test_epoca_loss))
      logging.info("   Tempo de avalia√ß√£o da √©poca               : {:}.".format(avaliacao_epoca_total))
      logging.info("   Tempo parcial do processamento            : {:} (h:mm:ss)".format(formataTempo(time.time()-treinamento_avaliacao_t0)))

      ################# Salva a classifica√ß√£o e avalia√ß√£o para a √©poca

      # Salva o resultado da classifica√ß√£o da √©poca
      salvaResultadoClassificacao(lista_resultado_avaliacao)

      # Salva o resultado da avalia√ß√£o da √©p√≥ca
      treinamento_avaliacao_total_t0 = format(formataTempo(time.time()-treinamento_avaliacao_t0))
      salvaResultadoAvaliacao(media_test_epoca_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, treinamento_avaliacao_total_t0)

      # Log das m√©tricas com wandb.
      if model_args.use_wandb:
        NOME_EXECUCAO = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args,model_args)
        wandb.log({"nome_execucao": NOME_EXECUCAO[:-2], # -2 para retirar "_f" do fina do nome da execu√ß√£o
                  "acuracia": acc,
                  "vp": vp_s ,
                  "vn": vn_s,
                  "fp": fp_s,
                  "fn": fn_s,
                  "media_train_epoca_loss" : 0,
                  "tempo_train" : 0,
                  "media_test_epoca_loss" : media_test_epoca_loss,
                  "tempo_test" : avaliacao_epoca_total})

      # Finaliza o wandb
      if model_args.use_wandb:
        wandb.finish()

    # ========================================
    #               Treinamento e Avalia√ß√£o para as √©pocas > 0
    # ========================================

    # Atualiza a √©poca avaliada
    model_args.epoca = epoca_i

    # Atualiza o nome da sa√≠da avaliada
    training_args.output_dir = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args, model_args)

    # Inicializa o wandb para registro
    # Gera uma entrada para cada todas as epocas, com a taxa de aprendizagem, lote e fold
    wandb = inicializacaoWandb()

    # Log das m√©tidas com wandb.
    if model_args.use_wandb:
      wandb.watch(model)

    # Execute uma passada completa sobre o conjunto de treinamento.

    logging.info("Realizando treinamento do fold {} na √©poca: {}.".format(model_args.fold, model_args.epoca))

    # Medida de quanto tempo leva o per√≠odo de treinamento.
    treinamento_epoca_t0 = time.time()

    # Acumula as perdas do treinamento da √©poca.
    train_batch_losses = []

    # Barras de progresso.
    lote_treino_bar = tqdm_notebook(range(0, len(py_input_ids)), desc=f'Epoca {epoca_i}', unit=f'lotes', total=len(py_input_ids) )

    # Para cada lote dos dados de treinamento.
    for index in lote_treino_bar:

        # Descompacte este lote de treinamento de nosso dataloader.
        #
        # √Ä medida que descompactamos o lote, tamb√©m copiaremos cada tensor para a GPU usando o
        # o m√©todo `to`
        #
        # `lote` √© uma lista cont√©m tr√™s tensores pytorch:
        #   [0]: input ids
        #   [1]: attention masks
        #   [2]: labels

        # Recupera os tensores do lote e copia para a GPU usando o m√©todo `to`
        d_input_ids = py_input_ids[index].to(device)
        d_input_mask = py_attention_masks[index].to(device)
        d_labels = py_labels[index].to(device)

        # Sempre limpe quaisquer gradientes calculados anteriormente antes de realizar um
        # passe para tr√°s. PyTorch n√£o faz isso automaticamente porque
        # acumular os gradientes √© "conveniente durante o treinamento de RNNs".
        # (source: https://stackoverflow.com/questions/48001598/why-do-we-need-to-call-zero-grad-in-pytorch)
        model.zero_grad()

        # Execute um passe para frente (avalie o modelo neste lote de treinamento).
        # A documenta√ß√£o para esta fun√ß√£o `model` est√° aqui:
        # https://huggingface.co/transformers/v2.2.0/model_doc/bert.html#transformers.BertForSequenceClassification
        # Ele retorna diferentes n√∫meros de par√¢metros dependendo de quais argumentos
        # s√£o fornecidos e quais sinalizadores est√£o definidos. Para nosso uso aqui, ele retorna
        # a perda (porque fornecemos r√≥tulos) e os "logits" - o modelo de sa√≠das antes da ativa√ß√£o.

        # last_hidden_state = outputs[0], pooler_output = outputs[1], hidden_states = outputs[2]
        outputs = model(d_input_ids,
                        token_type_ids=None,
                        attention_mask=d_input_mask,
                        labels=d_labels)

        # A perda(loss) √© retornado em outputs[0] porque fornecemos r√≥tulos(labels))
        loss = outputs[0]

        # E outputs[1] os "logits" - o modelo de sa√≠das antes da ativa√ß√£o.
        # logits possui duas dimens√µes, a primeira do lote e a segunda do r√≥tulo da predi√ß√£o
        # A fun√ß√£o `.detach().cpu()` retira da gpu.
        logits = outputs[1].detach().cpu()

        # Acumule a perda de treinamento em todos os lotes da √©poca para que possamos
        # calcular a perda m√©dia no final da √©poca. `loss` √© um tensor contendo um √∫nico valor.
        # A fun√ß√£o `.item ()` retorna apenas o valor Python do tensor.
        train_batch_losses.append(loss.item())

        # Mostra a perda na barra de progresso.
        lote_treino_bar.set_postfix(loss=loss.item())

        # Log das m√©tricas com wandb.
        if model_args.use_wandb:
          wandb.log({"train_batch_loss": loss.item()})

        # Execute uma passagem para tr√°s para calcular os gradientes.
        # Todos os par√¢metros do modelo deve ter sido setado para param.requires_grad = False
        loss.backward()

        # Corte a norma dos gradientes para 1.0.
        # Isso ajuda a evitar o problema de "gradientes explosivos".
        torch.nn.utils.clip_grad_norm_(model.parameters(), 1.0)

        # Atualize os par√¢metros e d√™ um passo usando o gradiente calculado.
        # O otimizador dita a "regra de atualiza√ß√£o" - como os par√¢metros s√£o
        # modificados com base em seus gradientes, taxa de aprendizagem, etc.
        optimizer.step()

        # Atualize a taxa de aprendizagem.
        scheduler.step()

        # Apaga vari√°veis n√£o utilizadas
        del outputs

    # M√©dia da perda do treinamento de todos os lotes da √©poca.
    media_train_epoca_loss = np.mean(train_batch_losses)

    # Acumule a perda de treinamento de todas as √©pocas para calcular a perda m√©dia do treinamento.
    train_losses.append(media_train_epoca_loss)

    # Medida de quanto tempo levou o treinamento desta √©poca.
    treinamento_epoca_total = formataTempo(time.time() - treinamento_epoca_t0)

    logging.info("   M√©dia perda(loss) do treinamento da √©poca : {0:.8f}.".format(media_train_epoca_loss))
    logging.info("   Tempo de treinamento da √©poca             : {:}.".format(treinamento_epoca_total))
    logging.info("   Tempo parcial processamento               : {:} (h:mm:ss)".format(formataTempo(time.time()-treinamento_avaliacao_t0)))

    ################# Avalia√ß√£o da √©poca

    # Registra o tempo inicial.
    avaliacao_epoca_t0 = time.time()

    # Realiza a avalia√ß√£o do modelo.
    media_test_epoca_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, lista_resultado_avaliacao = realizaAvaliacao(epoca_i, model, tokenizer, optimizer, scheduler, wandb, documentos_teste, classes_teste, id_documentos_teste)

    logging.info("   Avalia√ß√£o loss: {:.8f}; Acc: {:.8f}; Rec: {:.8f}; Pre: {:.8f}, F1:{:.8f}, vp: {:3d}; vn: {:3d}; fp: {:3d}; fn: {:3d}".format(media_test_epoca_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s))
    logging.info("   Acur√°cia do fold {} na √©poca {}: {:.8f}.".format(model_args.fold, epoca_i, acc))

    # Acumule a perda de treinamento da √©poca para calcular a perda m√©dia do treinamento.
    test_losses.append(media_test_epoca_loss)

    # Medida de quanto tempo levou a execu√ß√£o da avalia√ß√£o
    avaliacao_epoca_total = formataTempo(time.time() - avaliacao_epoca_t0)

    logging.info("   M√©dia perda(loss) do avalia√ß√£o da √©poca   : {0:.8f}.".format(media_test_epoca_loss))
    logging.info("   Tempo de avalia√ß√£o da √©poca               : {:}.".format(avaliacao_epoca_total))
    logging.info("   Tempo parcial do processamento            : {:} (h:mm:ss)".format(formataTempo(time.time()-treinamento_avaliacao_t0)))

    ################# Salva a classifica√ß√£o e avalia√ß√£o para a √©poca

    # Salva o resultado da classifica√ß√£o da √©poca
    salvaResultadoClassificacao(lista_resultado_avaliacao)

    # Salva o resultado da avalia√ß√£o da √©p√≥ca
    treinamento_avaliacao_total_t0 = format(formataTempo(time.time()-treinamento_avaliacao_t0))
    salvaResultadoAvaliacao(media_test_epoca_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, treinamento_avaliacao_total_t0)

    ################# Salva o modelo ajustado no wandb
    salvaModeloWandb(model, model_args)

    ################# Salva o modelo ajustado
    salvaModelo(model, tokenizer, model_args)

    # Apaga vari√°veis n√£o utilizadas
    del py_input_ids
    del py_attention_masks
    del py_labels
    del train_batch_losses
    del lote_treino_bar

    # Log das m√©tricas com wandb.
    if model_args.use_wandb:
      NOME_EXECUCAO = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args,model_args)
      wandb.log({"nome_execucao": NOME_EXECUCAO[:-2], # -2 para retirar "_f" do fina do nome da execu√ß√£o
                 "acuracia": acc,
                 "vp": vp_s ,
                 "vn": vn_s,
                 "fp": fp_s,
                 "fn": fn_s,
                 "media_train_epoca_loss" : media_train_epoca_loss,
                 "tempo_train" : treinamento_epoca_total,
                 "media_test_epoca_loss" : media_test_epoca_loss,
                 "tempo_test" : avaliacao_epoca_total})

      # Finaliza o wandb
      if model_args.use_wandb:
        wandb.finish()

  # M√©dia da perda do treinamento de todas as √©pocas.
  media_train_loss = np.mean(train_losses)
  media_test_loss = np.mean(test_losses)

  #if model_args.use_wandb:
  #  wandb.log({"media_train_loss": media_train_loss}, step = epoca_i)
  #  wandb.log({"media_test_loss": media_test_loss}, step = epoca_i)

  logging.info("  M√©dia perda(loss) treinamento : {0:.8f}.".format(media_train_loss))
  logging.info("  M√©dia perda(loss) avalia√ß√£o   : {0:.8f}.".format(media_test_loss))

  # Apaga vari√°veis n√£o utilizadas
  del train_losses
  del epoca_bar

  del model
  del tokenizer
  del documentos_treino
  del classes_treino
  del id_documentos_treino
  del documentos_teste
  del classes_teste
  del id_documentos_teste

## 4.5 Avalia√ß√£o

Avaliando o modelo treinado no conjunto de dados de teste.

### Fun√ß√£o de avalia√ß√£o

In [66]:
# Import das bibliotecas.
import torch
from tqdm.notebook import tqdm as tqdm_notebook

def realizaAvaliacao(epoca,
                     model,
                     tokenizer,
                     optimizer,
                     scheduler,
                     wandb,
                     documentos_teste,
                     classes_teste,
                     id_documentos_teste):

  # Armazena o resultado da avalia√ß√£o executada
  lista_resultado_avaliacao = []

  logging.info("Realizando avalia√ß√£o do fold {} na √©poca: {}.".format(model_args.fold, epoca))

  # Use nossa nova fun√ß√£o para preparar completamente nosso conjunto de dados.
  (py_input_ids, py_attention_masks, py_labels, documentosids) = criarLotesInteligentes(tokenizer, documentos_teste, classes_teste, id_documentos_teste, training_args.per_device_eval_batch_size)

  # Coloque o modelo em modo de avalia√ß√£o.
  model.eval()

  # Acumula as perdas dos testes dos lotes.
  test_batch_losses = []

  # Acumula os resultados dos testes.
  vp = [] # Verdadeiro positivo
  vn = [] # Verdadeiro negativo
  fp = [] # Falso positivo
  fn = [] # Falso negativo

  # Barra de progresso dos lotes de teste.
  lote_teste_bar = tqdm_notebook(range(0, len(py_input_ids)), desc=f'Lotes ', unit=f'lotes', total=len(py_input_ids))

  # Para cada lote dos dados de avalia√ß√£o(teste).
  for index in lote_teste_bar:

    # Copia o lote para a GPU.
    d_input_ids = py_input_ids[index].to(device)
    d_input_mask = py_attention_masks[index].to(device)
    d_labels = py_labels[index].to(device)
    d_id_documentos = documentosids[index]

    # Diga a pytorch para n√£o se preocupar em construir o gr√°fico de computa√ß√£o durante
    # o passe para frente, j√° que isso s√≥ √© necess√°rio para backprop (treinamento).
    with torch.no_grad():
        # Obtenha a sa√≠da de "logits" pelo modelo. Os "logits" s√£o a sa√≠da
        # valores antes de aplicar uma fun√ß√£o de ativa√ß√£o como o softmax.
        # Retorno de model quando ¬¥last_hidden_state=True¬¥ √© setado:
        # last_hidden_state = outputs[0], pooler_output = outputs[1], hidden_states = outputs[2]
        outputs = model(d_input_ids,
                        token_type_ids=None,
                        attention_mask=d_input_mask,
                        labels=d_labels)

    # A perda(loss) √© retornado em outputs[0] porque fornecemos r√≥tulos(labels).
    # √â √∫til para comparar com a perda do treinamento, quando √© realizado a avalia√ß√£o entre as √©pocas de treinamento.
    loss = outputs[0]

    # E outputs[1] os "logits" - o modelo de sa√≠das antes da ativa√ß√£o.
    # logits possui duas dimens√µes, a primeira do lote e a segunda do r√≥tulo da predi√ß√£o
    logits = outputs[1]

    # Acumule a perda da avalia√ß√£o em todos os lotes para que possamos
    # calcular a perda m√©dia no final. `loss` √© um tensor contendo um √∫nico valor.
    # A fun√ß√£o '.cpu()' move loss para a cpu.
    # A fun√ß√£o `.item ()` retorna apenas o valor Python do tensor.
    test_batch_losses.append(loss.cpu().item())

    # Log das m√©tricas com wandb.
    if model_args.use_wandb:
        wandb.log({"test_batch_loss": loss.cpu().item()})

    # Recupera o √≠ndice do melhor resultado, maior valor dos tensores para coluna(1)
    _, classificacao = torch.max(logits, 1)

    # Verifica a classifica√ß√£o realizada e o r√≥tulo previsto
    vp.append(((classificacao==1) & (d_labels==1)).sum().cpu().item())
    vn.append(((classificacao==0) & (d_labels==0)).sum().cpu().item())
    fp.append(((classificacao==1) & (d_labels==0)).sum().cpu().item())
    fn.append(((classificacao==0) & (d_labels==1)).sum().cpu().item())

    # Adiciona o documento de teste, o r√≥tulo e a classifica√ß√£o realizada a lista de resultado
    for lote in range(len(d_labels)):

        lista_resultado_avaliacao.append([d_id_documentos[lote],
                                d_labels[lote].cpu().item(),
                                classificacao[lote].cpu().item()])

    del outputs
    del d_input_ids
    del d_input_mask
    del d_labels
    del d_id_documentos

  # Soma as classifica√ß√µes realizadas
  vp_s, vn_s, fp_s, fn_s = sum(vp), sum(vn), sum(fp), sum(fn)

  # Acur√°cia indica uma performance geral do modelo.
  # Dentre todas as classifica√ß√µes, quantas o modelo classificou corretamente(vp=1 e vn=0).
  if (vp_s+vn_s+fp_s+fn_s) != 0:
      acc = (vp_s+vn_s)/(vp_s+vn_s+fp_s+fn_s)
  else:
      acc = 0

  # Recall(Revoca√ß√£o) avalia todas as situa√ß√µes da classe Positivo(vp=1) com o valor esperado e quantas est√£o corretas.
  if (vp_s+fn_s) != 0:
      rec = (vp_s)/(vp_s+fn_s)
  else:
      rec = 0

  # Precis√£o avalia as classifica√ß√µes da classe positivo(vp=1 e fp=0) que o modelo fez e quantas est√£o corretas.
  if (vp_s+fp_s) != 0:
      pre = (vp_s)/(vp_s+fp_s)
  else:
      pre = 0

  # F1 √© a m√©dia harm√¥nica entre precis√£o e recall.
  if (pre + rec) != 0:
    f1 = 2 * ((pre * rec)/(pre + rec))
  else:
    f1 = 0

  # M√©dia da perda da avalia√ß√£o
  media_test_epoca_loss = np.mean(test_batch_losses)

  del py_input_ids
  del py_attention_masks
  del py_labels
  del test_batch_losses
  del lote_teste_bar

  del model
  del tokenizer
  del documentos_teste
  del classes_teste
  del id_documentos_teste

  return media_test_epoca_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, lista_resultado_avaliacao

### Fun√ß√£o que salva o resultado da classifica√ß√£o

In [67]:
def getNomeDiretorioResultados(training_args, model_args):

  # Monta o nome do arquivo com par√¢metros
  nome_arquivo = ""
  nome_arquivo = nome_arquivo + "P_" + str(model_args.documentos_perturbados)
  nome_arquivo = nome_arquivo + "_K_" + str(model_args.top_k_predicao)

  return nome_arquivo

In [68]:
import os
import datetime
import logging
from google.cloud import storage

def salvaResultadoClassificacao(lista_resultado_avaliacao):
    if model_args.salvar_classificacao:
        # Recupera a hora do sistema.
        data_e_hora = datetime.datetime.now()

        # Nome do arquivo de resultado
        NOME_ARQUIVO_CLASSIFICACAO = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args, model_args) + str(model_args.fold) + MODELO_BERT + TAMANHO_BERT

        # Diret√≥rio no Google Cloud Storage para salvar o arquivo.
        DIRETORIO_GCS_CLASSIFICACAO = DIRETORIO_COHEBERT + "/validacao_classificacao_palavra/kfold/Classificacao/" + getNomeDiretorioResultados(training_args, model_args) + "/"

        # Diret√≥rio local para salvar o arquivo temporariamente
        DIRETORIO_CLASSIFICACAO_LOCAL = DIRETORIO_LOCAL + "Classificacao/"
        if not os.path.exists(DIRETORIO_CLASSIFICACAO_LOCAL):
            os.makedirs(DIRETORIO_CLASSIFICACAO_LOCAL)
        logging.info("Diret√≥rio local criado: {}.".format(DIRETORIO_CLASSIFICACAO_LOCAL))

        # Caminho completo do arquivo local e no GCS
        NOME_ARQUIVO_CLASSIFICACAO_LOCAL = os.path.join(DIRETORIO_CLASSIFICACAO_LOCAL, NOME_ARQUIVO_CLASSIFICACAO + ".csv")

        # Gera todo o conte√∫do a ser salvo no arquivo
        novo_conteudo = "data;id;classe;predicao\n" + "".join(
            data_e_hora.strftime("%d/%m/%Y %H:%M") + ";" + str(resultado[0]) + ";" + str(resultado[1]) + ";" + str(resultado[2]) + "\n"
            for resultado in lista_resultado_avaliacao
        )

        # Escreve ou atualiza o arquivo local
        with open(NOME_ARQUIVO_CLASSIFICACAO_LOCAL, 'w') as arquivo:
            arquivo.write(novo_conteudo)

        # Carrega o cliente GCS e o bucket
        client = storage.Client()
        bucket = client.bucket(bucket_name)

        # Caminho do arquivo no GCS
        NOME_ARQUIVO_CLASSIFICACAO_GCS = DIRETORIO_GCS_CLASSIFICACAO + NOME_ARQUIVO_CLASSIFICACAO + ".csv"

        # Faz o upload do arquivo para o GCS
        blob = bucket.blob(NOME_ARQUIVO_CLASSIFICACAO_GCS)
        blob.upload_from_filename(NOME_ARQUIVO_CLASSIFICACAO_LOCAL)
        logging.info("Arquivo classifica√ß√£o salvo no GCS: {}.".format(NOME_ARQUIVO_CLASSIFICACAO_GCS))

        # Limpa o diret√≥rio local
        os.remove(NOME_ARQUIVO_CLASSIFICACAO_LOCAL)


# # Import das bibliotecas.
# import os
# import datetime

# def salvaResultadoClassificacao(lista_resultado_avaliacao):

#   if model_args.salvar_classificacao:

#     # Recupera a hora do sistema.
#     data_e_hora = datetime.datetime.now()

#     # Nome arquivo resultado
#     NOME_ARQUIVO_CLASSIFICACAO = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args, model_args) + str(model_args.fold) + MODELO_BERT + TAMANHO_BERT

#     # Diret√≥rio para salvar o arquivo.
#     DIRETORIO_CLASSIFICACAO_DRIVE = DIRETORIO_DRIVE + "validacao_classificacao_palavra/kfold/Classificacao/" + getNomeDiretorioResultados(training_args, model_args) + "/"

#     # Diret√≥rio local para salvar o arquivo
#     DIRETORIO_CLASSIFICACAO_LOCAL = DIRETORIO_LOCAL + "Classificacao/"

#     # Verifica se o diret√≥rio existe
#     if not os.path.exists(DIRETORIO_CLASSIFICACAO_DRIVE):
#       # Cria o diret√≥rio
#       os.makedirs(DIRETORIO_CLASSIFICACAO_DRIVE)
#       logging.info("Diret√≥rio criado: {}.".format(DIRETORIO_CLASSIFICACAO_DRIVE))
#     else:
#       logging.info("Diret√≥rio j√° existe: {}.".format(DIRETORIO_CLASSIFICACAO_DRIVE))

#     # Verifica se o diret√≥rio existe
#     if not os.path.exists(DIRETORIO_CLASSIFICACAO_LOCAL):
#       # Cria o diret√≥rio
#       os.makedirs(DIRETORIO_CLASSIFICACAO_LOCAL)
#       logging.info("Diret√≥rio criado: {}.".format(DIRETORIO_CLASSIFICACAO_LOCAL))
#     else:
#       logging.info("Diret√≥rio j√° existe: {}.".format(DIRETORIO_CLASSIFICACAO_LOCAL))

#     # Caminho completo do arquivo compactado no drive
#     NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO = DIRETORIO_CLASSIFICACAO_DRIVE + NOME_ARQUIVO_CLASSIFICACAO + ".zip"
#     # print("NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO:", NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO)

#     # Caminho completo do arquivo compactado no local
#     NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO = DIRETORIO_CLASSIFICACAO_LOCAL + NOME_ARQUIVO_CLASSIFICACAO + ".zip"
#     # print("NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO:", NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO)

#     # Caminho completo do arquivo no local
#     NOME_ARQUIVO_CLASSIFICACAO_LOCAL = DIRETORIO_CLASSIFICACAO_LOCAL + NOME_ARQUIVO_CLASSIFICACAO + ".csv"
#     # print("NOME_ARQUIVO_CLASSIFICACAO_LOCAL:", NOME_ARQUIVO_CLASSIFICACAO_LOCAL)

#     # Gera todo o conte√∫do a ser salvo no arquivo
#     novo_conteudo = ""
#     for resultado in lista_resultado_avaliacao:
#       novo_conteudo = novo_conteudo + data_e_hora.strftime("%d/%m/%Y %H:%M") + ";" + str(resultado[0]) + ";" + str(resultado[1]) + ";" + str(resultado[2]) + "\n"

#     # Verifica se o arquivo existe.
#     if os.path.isfile(NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO):

#       # Copia arquivo da classifica√ß√£o compactado do google drive para o drive local
#       !cp "$NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO" "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO"
#       # Descompacta arquivo da classifica√ß√£o compactado no drive local
#       !unzip -o -j -q "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO" -d "$DIRETORIO_CLASSIFICACAO_LOCAL"

#       logging.info("Atualizando arquivo classifica√ß√£o: {}.".format(NOME_ARQUIVO_CLASSIFICACAO_LOCAL))
#       # Abre o arquivo para leitura.
#       arquivo = open(NOME_ARQUIVO_CLASSIFICACAO_LOCAL,'r')
#       #¬†Leitura¬†de¬†todas¬†as¬†linhas¬†do¬†arquivo.
#       conteudo = arquivo.readlines()
#       # Conte√∫do a ser adicionado.
#       conteudo.append(novo_conteudo)

#       #¬†Abre¬†novamente¬†o¬†arquivo¬†(escrita).
#       arquivo = open(NOME_ARQUIVO_CLASSIFICACAO_LOCAL,'w')
#       # escreva¬†o¬†conte√∫do¬†criado¬†anteriormente¬†nele.
#       arquivo.writelines(conteudo)
#       #¬†Fecha¬†o¬†arquivo.
#       arquivo.close()

#       # Compacta o arquivo da classifica√ß√£o
#       !zip -o -q -j "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO" "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL"
#       # Copia o arquivo da classifica√ß√£o compactado para o drive
#       !cp "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO" "$NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO"

#       del conteudo
#       del arquivo
#       del lista_resultado_avaliacao

#     else:
#       logging.info("Criando arquivo classifica√ß√£o: {}.".format(NOME_ARQUIVO_CLASSIFICACAO_LOCAL))
#       #¬†Abre¬†novamente¬†o¬†arquivo¬†(escrita).
#       arquivo = open(NOME_ARQUIVO_CLASSIFICACAO_LOCAL,'w')
#       arquivo.writelines('data;id;classe;predicao\n' + novo_conteudo)  # escreva¬†o¬†conte√∫do¬†criado¬†anteriormente¬†nele.
#       #¬†Fecha¬†o¬†arquivo.
#       arquivo.close()

#       # Compacta o arquivo da classifica√ß√£o
#       !zip -o -q -j "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO" "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL"
#       # Copia o arquivo da classifica√ß√£o compactado para o drive
#       !cp "$NOME_ARQUIVO_CLASSIFICACAO_LOCAL_COMPACTADO" "$NOME_ARQUIVO_CLASSIFICACAO_DRIVE_COMPACTADO"

#       del arquivo
#       del lista_resultado_avaliacao

### Fun√ß√£o que salva o resultado da avalia√ß√£o

Salva o resultado da avalia√ß√£o do conjunto de dados de teste do fold especificado.

In [69]:
import os
import datetime
import logging
from google.cloud import storage

def salvaResultadoAvaliacao(media_test_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, treinamento_total):
    if model_args.salvar_avaliacao:
        # Recupera a hora do sistema.
        data_e_hora = datetime.datetime.now()

        # Nome arquivo resultado
        NOME_ARQUIVO_AVALIACAO = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args, model_args) + str(model_args.fold) + MODELO_BERT + TAMANHO_BERT

        # Diret√≥rio no GCS para salvar o arquivo.
        DIRETORIO_AVALIACAO_GCS = DIRETORIO_COHEBERT + "/validacao_classificacao_palavra/kfold/Avaliacao/" + getNomeDiretorioResultados(training_args, model_args) + "/"

        # Nome completo do arquivo no GCS
        NOME_ARQUIVO_AVALIACAO_COMPLETO = DIRETORIO_AVALIACAO_GCS + NOME_ARQUIVO_AVALIACAO + ".csv"

        # Conte√∫do a ser adicionado.
        novo_conteudo = NOME_ARQUIVO_AVALIACAO + ";" + data_e_hora.strftime("%d/%m/%Y %H:%M") + ";" + treinamento_total + ";" + str(acc) + ";" + str(vp_s) + ";" + str(vn_s) + ";" + str(fp_s) + ";" + str(fn_s) + "\n"

        # Carrega o cliente GCS e o bucket
        client = storage.Client()
        bucket = client.get_bucket(bucket_name)

        # Verifica se o arquivo existe e atualiza ou cria um novo
        try:
            # Baixa o conte√∫do atual do arquivo se ele existir
            blob = bucket.blob(NOME_ARQUIVO_AVALIACAO_COMPLETO)
            conteudo_existente = blob.download_as_text()
            conteudo_atualizado = conteudo_existente + novo_conteudo
            logging.info("Atualizando arquivo resultado: {}.".format(NOME_ARQUIVO_AVALIACAO_COMPLETO))
        except Exception as e:
            # Se o arquivo n√£o existir, inicializa novo conte√∫do com cabe√ßalho
            conteudo_atualizado = 'arquivo;data;tempo;acuracia;vp;vn;fp;fn\n' + novo_conteudo
            logging.info("Criando arquivo resultado: {}.".format(NOME_ARQUIVO_AVALIACAO_COMPLETO))

        # Salva o conte√∫do atualizado no GCS
        blob.upload_from_string(conteudo_atualizado)


# # Import das bibliotecas.
# import os
# import datetime

# def salvaResultadoAvaliacao(media_test_loss, acc, rec, pre, f1, vp_s, vn_s, fp_s, fn_s, treinamento_total):

#   if model_args.salvar_avaliacao:

#     # Recupera a hora do sistema.
#     data_e_hora = datetime.datetime.now()

#     # Nome arquivo resultado
#     NOME_ARQUIVO_AVALIACAO = NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args, model_args) + str(model_args.fold) + MODELO_BERT + TAMANHO_BERT

#     # Diret√≥rio para salvar o arquivo.
#     DIRETORIO_AVALIACAO = DIRETORIO_DRIVE + "validacao_classificacao_palavra/kfold/Avaliacao/" + getNomeDiretorioResultados(training_args, model_args) + "/"

#     # Verifica se o diret√≥rio existe
#     if not os.path.exists(DIRETORIO_AVALIACAO):
#       # Cria o diret√≥rio
#       os.makedirs(DIRETORIO_AVALIACAO)
#       logging.info("Diret√≥rio criado: {}.".format(DIRETORIO_AVALIACAO))
#     else:
#       logging.info("Diret√≥rio j√° existe: {}.".format(DIRETORIO_AVALIACAO))

#     # Nome do arquivo a ser aberto.
#     NOME_ARQUIVO_AVALIACAO_COMPLETO = DIRETORIO_AVALIACAO + NOME_ARQUIVO_AVALIACAO + ".csv"

#     # Conte√∫do a ser adicionado.
#     novo_conteudo = NOME_ARQUIVO_AVALIACAO + ";" +  data_e_hora.strftime("%d/%m/%Y %H:%M") + ";"  + treinamento_total + ";"  + str(acc) + ";"  +  str(vp_s) + ";"  +  str(vn_s) + ";" +  str(fp_s) + ";" +  str(fn_s) + "\n"

#     # Verifica se o arquivo existe.
#     if os.path.isfile(NOME_ARQUIVO_AVALIACAO_COMPLETO):
#       logging.info("Atualizando arquivo resultado: {}.".format(NOME_ARQUIVO_AVALIACAO_COMPLETO))
#       # Abre o arquivo para leitura.
#       arquivo = open(NOME_ARQUIVO_AVALIACAO_COMPLETO,'r')
#       #¬†Leitura¬†de¬†todas¬†as¬†linhas¬†do¬†arquivo.
#       conteudo = arquivo.readlines()
#       # Conte√∫do a ser adicionado.
#       conteudo.append(novo_conteudo)

#       #¬†Abre¬†novamente¬†o¬†arquivo¬†(escrita).
#       arquivo = open(NOME_ARQUIVO_AVALIACAO_COMPLETO,'w')
#       # escreva¬†o¬†conte√∫do¬†criado¬†anteriormente¬†nele.
#       arquivo.writelines(conteudo)
#       #¬†Fecha¬†o¬†arquivo.
#       arquivo.close()

#       del conteudo
#       del arquivo

#     else:
#       logging.info("Criando arquivo resultado: {}.".format(NOME_ARQUIVO_AVALIACAO_COMPLETO))
#       #¬†Abre¬†novamente¬†o¬†arquivo¬†(escrita).
#       arquivo = open(NOME_ARQUIVO_AVALIACAO_COMPLETO,'w')
#       arquivo.writelines('arquivo;data;tempo;acuracia;vp;vn;fp;fn\n' + novo_conteudo)  # escreva¬†o¬†conte√∫do¬†criado¬†anteriormente¬†nele.
#       #¬†Fecha¬†o¬†arquivo.
#       arquivo.close()

#       del arquivo

### Fun√ß√£o que carrega e calcula a m√©dia da acur√°cia dos folds


In [70]:
import logging
import pandas as pd
from google.cloud import storage
from io import BytesIO

def carregaResultadoAvaliacao(NOME_ARQUIVO_AVALIACAO):
    # Sup√µe que 'bucket_name' e 'DIRETORIO_COHEBERT' estejam definidos em algum lugar acess√≠vel
    client = storage.Client()
    bucket = client.bucket(bucket_name)

    NOME_ARQUIVO_EXECUCAO = NOME_ARQUIVO_AVALIACAO + "X" + MODELO_BERT + TAMANHO_BERT
    logging.info("M√©dia dos arquivos: {}".format(NOME_ARQUIVO_EXECUCAO))

    # Define o diret√≥rio base no GCS
    DIRETORIO_AVALIACAO = os.path.join(DIRETORIO_COHEBERT, "validacao_classificacao_palavra/kfold/Avaliacao", getNomeDiretorioResultados(training_args, model_args))

    # Acumuladores.
    soma_acuracia = 0
    listaTempo = []
    conta_folds = 0

    # Percorre os arquivos de resultados.
    for f in range(10):
        # Nome do arquivo a ser aberto no GCS.
        NOME_ARQUIVO_AVALIACAO_COMPLETO = f"{DIRETORIO_AVALIACAO}/{NOME_ARQUIVO_AVALIACAO}{f+1}{MODELO_BERT}{TAMANHO_BERT}.csv"
        blob = bucket.blob(NOME_ARQUIVO_AVALIACAO_COMPLETO)

        if not blob.exists():
            logging.error(f"Arquivo n√£o encontrado: {NOME_ARQUIVO_AVALIACAO_COMPLETO}")
            continue

        # Baixa o arquivo e carrega em um DataFrame
        content = blob.download_as_bytes()
        dados = pd.read_csv(BytesIO(content), sep=';')

        # Processa os dados do arquivo
        for index, linha in dados.iterrows():
            # C√°lculo das estat√≠sticas
            acc = (linha['vp'] + linha['vn']) / (linha['vp'] + linha['vn'] + linha['fp'] + linha['fn'])
            rec = (linha['vp'] / (linha['vp'] + linha['fn'])) if (linha['vp'] + linha['fn']) != 0 else 0
            pre = (linha['vp'] / (linha['vp'] + linha['fp'])) if (linha['vp'] + linha['fp']) != 0 else 0
            f1 = 2 * ((pre * rec) / (pre + rec)) if (pre + rec) != 0 else 0
            qtde_testes = linha['vp'] + linha['vn'] + linha['fp'] + linha['fn']


            # Ajuste para garantir que todos os campos necess√°rios est√£o presentes
            if all(k in linha for k in ["arquivo", "data", "tempo", "vp", "vn", "fp", "fn"]):
                qtde_testes = linha['vp'] + linha['vn'] + linha['fp'] + linha['fn']
                acc = (linha['vp']+linha['vn'])/(linha['vp']+linha['vn']+linha['fp']+linha['fn']) if (linha['vp']+linha['vn']+linha['fp']+linha['fn']) > 0 else 0
                rec = (linha['vp'] / (linha['vp'] + linha['fn'])) if (linha['vp'] + linha['fn']) > 0 else 0
                pre = (linha['vp'] / (linha['vp'] + linha['fp'])) if (linha['vp'] + linha['fp']) > 0 else 0
                f1 = 2 * ((pre * rec) / (pre + rec)) if (pre + rec) > 0 else 0

                logging.info("Arquivo: {}, Data: {}, Tempo: {}, QtdeTeste: {:3d}, Acc: {:.8f}, Rec: {:.8f}, Pre: {:.8f}, F1:{:.8f}, vp: {:4d}; vn: {:4d}; fp: {:4d}; fn: {:4d}".format(
                    linha["arquivo"], linha["data"], linha["tempo"], qtde_testes, acc, rec, pre, f1, linha["vp"], linha["vn"], linha["fp"], linha["fn"]))
            else:
                logging.error("Algum campo necess√°rio est√° faltando no registro.")

            # logging.info("Arquivo: {}, Data: {}, Tempo: {}, QtdeTeste: {:3d}, Acc: {:.8f}, Rec: {:.8f}, Pre: {:.8f}, F1:{:.8f}, vp: {:4d}; vn: {:4d}; fp: {:4d}; fn: {:4d}".format(linha["arquivo"], linha["data"], linha["tempo"], qtde_testes, acc, rec, pre, f1))

            # Guarda o tempo.
            listaTempo.append(str(linha['tempo']))

        # Acumula dados para m√©dia
        soma_acuracia += dados['acuracia'].max()
        conta_folds += 1

    # Finaliza c√°lculos de m√©dia
    if conta_folds != 0:
        media = soma_acuracia / conta_folds
        logging.info(f"A m√©dia da acur√°cia de {conta_folds} folds √©: {media:.8f}.")
        logging.info(f"O tempo gasto na execu√ß√£o do treinamento de {conta_folds} folds √©: {somaTempo(listaTempo)}.")
        logging.info(f"A m√©dia de tempo de execu√ß√£o de {conta_folds} folds √©: {mediaTempo(listaTempo)}.")
        lista_resultado_execucoes.append(f"{NOME_ARQUIVO_EXECUCAO};{media};{somaTempo(listaTempo)}")

    del listaTempo


# # Import das bibliotecas.
# import os
# import pandas as pd

# def carregaResultadoAvaliacao(NOME_ARQUIVO_AVALIACAO):

#   NOME_ARQUIVO_EXECUCAO = NOME_ARQUIVO_AVALIACAO + "X" + MODELO_BERT + TAMANHO_BERT

#   logging.info("M√©dia dos arquivos: {}".format(NOME_ARQUIVO_EXECUCAO))

#   # Diret√≥rio para salvar o arquivo.
#   DIRETORIO_AVALIACAO = DIRETORIO_DRIVE + "validacao_classificacao_palavra/kfold/Avaliacao/" + getNomeDiretorioResultados(training_args, model_args) + "/"

#   # Verifica se o diret√≥rio dos resultados existem.
#   if os.path.exists(DIRETORIO_AVALIACAO):
#     # Acumuladores.
#     soma_acuracia = 0
#     listaTempo = []
#     conta_folds = 0

#     # Percorre os arquivos de resultados.
#     for f in range(10):
#       # Nome do arquivo a ser aberto.
#       NOME_ARQUIVO_AVALIACAO_COMPLETO = DIRETORIO_AVALIACAO + NOME_ARQUIVO_AVALIACAO + str(f+1) + MODELO_BERT + TAMANHO_BERT + ".csv"
#       # Verifica se o arquivo existe.
#       if os.path.isfile(NOME_ARQUIVO_AVALIACAO_COMPLETO):

#         # Carrega os dados do arquivo
#         dados = pd.read_csv(NOME_ARQUIVO_AVALIACAO_COMPLETO, sep=';')
#         # Mostra os dados do teste do fold.
#         for index, linha in dados.iterrows():

#           # C√°lculo das estat√≠sticas
#           acc = (linha['vp']+linha['vn'])/(linha['vp']+linha['vn']+linha['fp']+linha['fn'])
#           if (linha['vp']+linha['fn']) != 0:
#               rec = (linha['vp'])/(linha['vp']+linha['fn'])
#           else:
#               rec = 0
#           if (linha['vp']+linha['fp']) != 0:
#               pre = (linha['vp'])/(linha['vp']+linha['fp'])
#           else:
#               pre = 0
#           if (pre + rec) != 0:
#               f1 = 2 * ((pre * rec)/(pre + rec))
#           else:
#               f1 = 0
#           qtde_testes = linha['vp']+linha['vn']+linha['fp']+linha['fn']
#           logging.info("Arquivo: {}, Data: {}, Tempo: {}, QtdeTeste: {:3d}, Acc: {:.8f}, Rec: {:.8f}, Pre: {:.8f}, F1:{:.8f}, vp: {:4d}; vn: {:4d}; fp: {:4d}; fn: {:4d}".format(
#                linha["arquivo"], linha["data"], linha["tempo"], qtde_testes, acc, rec, pre, f1, linha["vp"], linha["vn"], linha["fp"], linha["fn"]))

#           # Guarda o tempo.
#           listaTempo.append(str(linha['tempo']))

#         # Procura a maior acur√°cia.
#         soma_acuracia = soma_acuracia + dados['acuracia'].max()
#         # Conta o n√∫mero de folds.
#         conta_folds = conta_folds + 1

#         del dados

#     # Mostra a soma da acur√°cia .
#     logging.info("Total acur√°cia                                       : {:.8f}.".format(soma_acuracia))
#     # Mostra a quantidade de folds.
#     logging.info("Quantidade de folds                                  : {}.".format(conta_folds))
#     # Calcula a m√©dia.
#     if conta_folds != 0:
#       media = soma_acuracia/conta_folds
#       logging.info("A m√©dia da acur√°cia de {:2d} folds √©                    : {:.8f}.".format(conta_folds, media))
#       logging.info("O tempo gasto na execu√ß√£o do treinamentoa {:2d} folds √© : {}.".format(conta_folds, somaTempo(listaTempo)))
#       logging.info("A m√©dia de tempo de execu√ß√£o de {:2d} folds √©           : {}.".format(conta_folds, mediaTempo(listaTempo)))
#       # Guarda o resultado da execu√ß√£o
#       lista_resultado_execucoes.append(NOME_ARQUIVO_EXECUCAO + ";" + str(media) + ";" + str(somaTempo(listaTempo)))
#   else:
#     logging.info("Diret√≥rio com os resultados n√£o encontrado.")

#   del listaTempo

## 4.6 Salva e copia o modelo ajustado

### Fun√ß√£o que salva o modelo ajustado no wandb


In [71]:
def salvaModeloWandb(model, model_args):

  # Salvando o Modelo para o wandb
  if model_args.use_wandb and model_args.salvar_modelo_wandb:

    # Salva o modelo para o wandb
    torch.save(model.state_dict(), os.path.join(wandb.run.dir, 'model_dict.pt'))

    logging.info("Modelo salvo no wandb.")

### Fun√ß√£o que salva e copia o modelo ajustado

Salva e  modelo e o tokenizador no disco e copia para o google drive.

In [72]:
import os
import logging
from google.cloud import storage
import torch  # Assegure-se de ter importado torch se voc√™ est√° salvando objetos espec√≠ficos do PyTorch

# Import de bibliotecas.
import os

def salvaModelo(model, tokenizer, model_args):

  if model_args.salvar_modelo:

    # Salvando as melhores pr√°ticas: se voc√™ usar nomes padr√£o para o modelo, voc√™ pode recarreg√°-lo usando from_pretrained ()

    # Diret√≥rio de salvamento do modelo.
    DIRETORIO_LOCAL_MODELO_AJUSTADO = '/content/modelo_ajustado/' + model_args.fold

    # Cria o diret√≥rio de sa√≠da se necess√°rio.
    if not os.path.exists(DIRETORIO_LOCAL_MODELO_AJUSTADO):
      os.makedirs(DIRETORIO_LOCAL_MODELO_AJUSTADO)

    logging.info("Salvando o modelo para {}.".format(DIRETORIO_LOCAL_MODELO_AJUSTADO))

    # Salve um modelo treinado, configura√ß√£o e tokenizer usando `save_pretrained ()`.
    # Eles podem ent√£o ser recarregados usando `from_pretrained ()`.
    model_to_save = model.module if hasattr(model, 'module') else model  # Cuide do treinamento distribu√≠do/paralelo
    model_to_save.save_pretrained(DIRETORIO_LOCAL_MODELO_AJUSTADO)
    tokenizer.save_pretrained(DIRETORIO_LOCAL_MODELO_AJUSTADO)

    # Boa pr√°tica: salve seus argumentos de treinamento junto com o modelo treinado.
    torch.save(model_args, os.path.join (DIRETORIO_LOCAL_MODELO_AJUSTADO, 'mode_args.bin'))
    torch.save(training_args, os.path.join (DIRETORIO_LOCAL_MODELO_AJUSTADO, 'training_args.bin'))

    logging.info("Modelo salvo.")

    # Para salvar seu modelo nas sess√µes do Colab Notebook, fa√ßa o download no seu computador local ou, idealmente, copie-o no seu Google Drive.
    # Copia o arquivo do modelo para o diret√≥rio no Google Drive.
    !cp -r '$DIRETORIO_LOCAL_MODELO_AJUSTADO'* '$DIRETORIO_REMOTO_MODELO_AJUSTADO'

    logging.info("Modelo copiado.")


# # Import de bibliotecas.
# import os

# def salvaModelo(model, tokenizer, model_args):

#   if model_args.salvar_modelo:

#     # Salvando as melhores pr√°ticas: se voc√™ usar nomes padr√£o para o modelo, voc√™ pode recarreg√°-lo usando from_pretrained ()

#     # Diret√≥rio de salvamento do modelo.
#     DIRETORIO_LOCAL_MODELO_AJUSTADO = '/content/modelo_ajustado/' + model_args.fold

#     # Cria o diret√≥rio de sa√≠da se necess√°rio.
#     if not os.path.exists(DIRETORIO_LOCAL_MODELO_AJUSTADO):
#       os.makedirs(DIRETORIO_LOCAL_MODELO_AJUSTADO)

#     logging.info("Salvando o modelo para {}.".format(DIRETORIO_LOCAL_MODELO_AJUSTADO))

#     # Salve um modelo treinado, configura√ß√£o e tokenizer usando `save_pretrained ()`.
#     # Eles podem ent√£o ser recarregados usando `from_pretrained ()`.
#     model_to_save = model.module if hasattr(model, 'module') else model  # Cuide do treinamento distribu√≠do/paralelo
#     model_to_save.save_pretrained(DIRETORIO_LOCAL_MODELO_AJUSTADO)
#     tokenizer.save_pretrained(DIRETORIO_LOCAL_MODELO_AJUSTADO)

#     # Boa pr√°tica: salve seus argumentos de treinamento junto com o modelo treinado.
#     torch.save(model_args, os.path.join (DIRETORIO_LOCAL_MODELO_AJUSTADO, 'mode_args.bin'))
#     torch.save(training_args, os.path.join (DIRETORIO_LOCAL_MODELO_AJUSTADO, 'training_args.bin'))

#     logging.info("Modelo salvo.")

#     # Para salvar seu modelo nas sess√µes do Colab Notebook, fa√ßa o download no seu computador local ou, idealmente, copie-o no seu Google Drive.
#     # Copia o arquivo do modelo para o diret√≥rio no Google Drive.
#     !cp -r '$DIRETORIO_LOCAL_MODELO_AJUSTADO'* '$DIRETORIO_REMOTO_MODELO_AJUSTADO'

#     logging.info("Modelo copiado.")


# 5 Execu√ß√£o do treinamento e avalia√ß√£o

Gera o sufixo do nome do arquivo de sa√≠da com os par√¢metros da execu√ß√£o

Exemplo de formado de sufixo.
`K_1_P_1_E_4_e_1_lr_5_b_8_4_f`
  - P = documentos perturbados
  - K = previs√µes palavras
  - E = n√∫mero total de √©pocas de treinamento
  - e = n√∫mero da √©poca executada
  - lr = taxa de aprendizagem
  - b = lotes de treino e avalia√ß√£o  
  - f = n√∫mero do fold

In [73]:
def getSufixoNomeArquivoSaida(training_args, model_args):

  # Recupera o n√∫mero inteiro da taxa de aprendizagem
  taxa_inteiro = int(training_args.learning_rate*100000)

  # Monta o nome do arquivo com par√¢metros
  nome_arquivo = ""
  nome_arquivo = nome_arquivo + "_P_" + str(model_args.documentos_perturbados)
  nome_arquivo = nome_arquivo + "_K_" + str(model_args.top_k_predicao)
  nome_arquivo = nome_arquivo + "_E_" + str(training_args.num_train_epochs)
  nome_arquivo = nome_arquivo + "_e_" + str(model_args.epoca)
  nome_arquivo = nome_arquivo + "_lr_" + str(taxa_inteiro)
  nome_arquivo = nome_arquivo + "_b_" + str(training_args.per_device_train_batch_size)
  nome_arquivo = nome_arquivo + "_" + str( training_args.per_device_eval_batch_size)
  nome_arquivo = nome_arquivo + "_f"

  return nome_arquivo

## 5.1 Fun√ß√£o de treinamento e avalia√ß√£o de todos os folds

Carrega os folds para serem avaliados

In [74]:
# Import das bibliotecas
from tqdm.notebook import tqdm as tqdm_notebook
import time
import datetime
import gc

def procedimentoTreinamentoAvaliacaoFolds(modelo, taxa_de_aprendizagem):

  # Barra de progresso dos folds
  fold_bar = tqdm_notebook(range(inicio_fold, fim_fold+1), desc=f'Folds ', unit=f'fold', total=fim_fold)

  # Percorre todos os folds do intervalo de inicio_fold at√© fim_fold
  for ifold in fold_bar:

    # Seta o par√¢metro do fold
    model_args.fold = ifold

    logging.info("Processamendo do fold: {}.".format(model_args.fold))
    logging.info("   com o modelo: {}".format(modelo))
    logging.info("   at√© √©poca {} e taxa de aprendizagem {}.".format(training_args.num_train_epochs, taxa_de_aprendizagem))

    # Marca o tempo de in√≠cio do processamento
    processamento_fold_t0 = time.time()

    # Carregando o modelo
    model, tokenizer = carregaBERT(model_args)

    # Conecta o modelo a GPU
    model = conectaGPU(model, device)

    # Fun√ß√£o de carregamento dos dados de um fold
    df_dados_train, df_dados_test = carregamentoDadosFold(model_args.fold)

    # Descartando documentos muito grandes
    df_dados_train, df_dados_test = descarteDocumentosGrandes(tokenizer, model_args.max_seq_len, df_dados_train, df_dados_test)

    # Pega as listas de documentos de treino e seus r√≥tulos.
    documentos_treino = df_dados_train.documento.values
    classes_treino = df_dados_train.classe.values
    id_documentos_treino = df_dados_train.id.values

    # Pega as listas de documentos teste e seus r√≥tulos.
    documentos_teste = df_dados_test.documento.values
    classes_teste = df_dados_test.classe.values
    id_documentos_teste = df_dados_test.id.values

    del df_dados_train
    del df_dados_test

    # Mostra o resultado dos dados carregados.
    logging.info("Tamanho do conjunto de dados : {} / Treino: {} / Teste: {}.".format(len(documentos_treino) + len(documentos_teste), len(documentos_treino), len(documentos_teste)))

    #################  Treinamento

    # Carrega o otimizador
    optimizer = carregaOtimizador(training_args, model)

    # Carrega o agendador
    scheduler = carregaAgendador(training_args, optimizer, numero_etapas=len(documentos_treino))

    # Registra o tempo inicial.
    treinamento_t0 = time.time()

    # Realiza o treinamento.
    realizaTreinamento(model, tokenizer, optimizer, scheduler,
                       documentos_treino, classes_treino, id_documentos_treino,
                       documentos_teste, classes_teste, id_documentos_teste, training_args.num_train_epochs)

    # Medida de quanto tempo levou a execu√ß√£o do treinamento.
    treinamento_f = time.time()
    treinamento_total = formataTempo(treinamento_f - treinamento_t0)
    logging.info("  Tempo total treinamento       : {:}.".format(treinamento_total))

    #################  Treinamento

    # Apaga os dados
    del documentos_treino
    del classes_treino
    del id_documentos_treino

    del documentos_teste
    del classes_teste
    del id_documentos_teste

    del optimizer
    del scheduler
    del model
    del tokenizer

    # Pega o tempo atual menos o tempo do in√≠cio do processamento.
    processamento_fold_f = time.time()
    processamento_fold_total = formataTempo(processamento_fold_f - processamento_fold_t0)
    logging.info("  Tempo processamento fold: {:} (h:mm:ss)\n".format(processamento_fold_total))

    # Chama o coletor de lixo para esvaziar a mem√≥ria
    gc.collect()

## 5.2 Execu√ß√£o o procedimento de treinamento e avalia√ß√£o para todos os par√¢metros

In [75]:
# Import das bibliotecas
from tqdm.notebook import tqdm as tqdm_notebook

# Barra de progresso modelos
modelo_bar = tqdm_notebook(enumerate(NOMES_MODELO), desc=f'Modelos ', unit=f'modelo', total=len(NOMES_MODELO))

# Percorre todos os modelos a serem avaliados
for modelo_i, modelo in modelo_bar:

  # Seta o par√¢metro do modelo
  model_args.pretrained_model_name_or_path = modelo

  # Barra de progresso das taxas de aprendizagem
  taxa_de_aprendizagem_bar = tqdm_notebook(enumerate(TAXAS_DE_APRENDIZAGEM), desc=f'Taxas de aprendizagem ', unit=f'taxa', total=len(TAXAS_DE_APRENDIZAGEM))

  # Executa o treinamento e avalia√ß√£o para diversas taxas de aprendizagem
  for taxas_de_aprendizagem_i, taxa_de_aprendizagem in taxa_de_aprendizagem_bar:

    # Atualiza a taxa de aprendizagem da avalia√ß√£o
    training_args.learning_rate = taxa_de_aprendizagem

    # Marca o tempo de in√≠cio do processamento dos folds
    processamento_todos_fold_t0 = time.time()

    # Executa o treinamento e avaliacao de todos folds para o modelo e taxa de aprendizagem
    procedimentoTreinamentoAvaliacaoFolds(modelo, taxa_de_aprendizagem)

    # Pega o tempo atual menos o tempo do in√≠cio do processamento.
    processamento_todos_fold_f = time.time()
    processamento_todos_fold_total = formataTempo(processamento_todos_fold_f - processamento_todos_fold_t0)
    logging.info("  Tempo processamento de todos os folds: {:} (h:mm:ss)\n".format(processamento_todos_fold_total))


Modelos :   0%|          | 0/1 [00:00<?, ?modelo/s]

Taxas de aprendizagem :   0%|          | 0/1 [00:00<?, ?taxa/s]

Folds :   0%|          | 0/10 [00:00<?, ?fold/s]

INFO:root:Processamendo do fold: 1.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   at√© √©poca 4 e taxa de aprendizagem 1e-05.
INFO:root:Vari√°vel URL_MODELO n√£o setada.
INFO:root:Usando modelo BERT pr√©-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classifica√ß√£o.
The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.
Some weights of BertForSequenceClassification were not initialized from the model checkpoint at bert-large-cased and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for prediction

√âpocas:   0%|          | 0/4 [00:00<?, ?√©pocas/s]

INFO:root:Criando Lotes Inteligentes de 4,986 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,986 amostra...


Documentos :   0%|          | 0/4986 [00:00<?, ?documento/s]

INFO:root:     4,986 amostras tokenizadas.
INFO:root:     4,986 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


[34m[1mwandb[0m: Currently logged in as: [33mosmar-braz[0m. Use [1m`wandb login --relogin`[0m to force relogin


INFO:root:Realizando avalia√ß√£o do fold 1 na √©poca: 0.
INFO:root:Criando Lotes Inteligentes de 555 amostras com tamanho de lote 16...
INFO:root:Tokenizando 555 amostra...


Documentos :   0%|          | 0/555 [00:00<?, ?documento/s]

INFO:root:       555 amostras tokenizadas.
INFO:root:       555 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.64591121; Acc: 0.68108108; Rec: 0.97637795; Pre: 0.68888889, F1:0.80781759, vp: 372; vn:   6; fp: 168; fn:   9
INFO:root:   Acur√°cia do fold 1 na √©poca 0: 0.68108108.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.64591121.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:10.
INFO:root:   Tempo parcial do processamento            : 0:00:29 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f1_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f1_BERT_base.csv.


VBox(children=(Label(value='0.005 MB of 0.023 MB uploaded\r'), FloatProgress(value=0.20335107267586894, max=1.‚Ä¶

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
tempo_train,‚ñÅ
test_batch_loss,‚ñÉ‚ñÉ‚ñá‚ñÑ‚ñÖ‚ñÇ‚ñÅ‚ñÑ‚ñà‚ñÉ‚ñÖ‚ñÇ‚ñá‚ñÉ‚ñÉ‚ñá‚ñÖ‚ñÜ‚ñÑ‚ñÖ‚ñÉ‚ñá‚ñÑ‚ñÖ‚ñÑ‚ñÇ‚ñÇ‚ñÇ‚ñÇ‚ñÉ‚ñÇ‚ñÅ‚ñÉ‚ñÖ‚ñÑ

0,1
acuracia,0.68108
do_lower_case,False
fn,9
fp,168
max_seq_len,512
media_test_epoca_loss,0.64591
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:10


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 1 na √©poca: 1.


Epoca 1:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.52704121.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:14.
INFO:root:   Tempo parcial processamento               : 0:03:55 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 1 na √©poca: 1.
INFO:root:Criando Lotes Inteligentes de 555 amostras com tamanho de lote 16...
INFO:root:Tokenizando 555 amostra...


Documentos :   0%|          | 0/555 [00:00<?, ?documento/s]

INFO:root:       555 amostras tokenizadas.
INFO:root:       555 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.36415481; Acc: 0.82342342; Rec: 0.91338583; Pre: 0.84261501, F1:0.87657431, vp: 348; vn: 109; fp:  65; fn:  33
INFO:root:   Acur√°cia do fold 1 na √©poca 1: 0.82342342.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.36415481.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:04:03 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f1_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f1_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.023 MB uploaded\r'), FloatProgress(value=0.18040920086924433, max=1.‚Ä¶

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÇ‚ñÇ‚ñÖ‚ñÇ‚ñà‚ñÜ‚ñÑ‚ñÑ‚ñá‚ñÇ‚ñÑ‚ñÅ‚ñÇ‚ñÑ‚ñÉ‚ñÑ‚ñÜ‚ñÉ‚ñÅ‚ñÖ‚ñÜ‚ñÉ‚ñÑ‚ñÑ‚ñÑ‚ñÑ‚ñÇ‚ñÉ‚ñÑ‚ñÖ‚ñà‚ñÖ‚ñÉ‚ñÑ‚ñÇ
train_batch_loss,‚ñÜ‚ñÖ‚ñÜ‚ñÜ‚ñÖ‚ñà‚ñá‚ñÑ‚ñÜ‚ñá‚ñá‚ñÑ‚ñá‚ñá‚ñÖ‚ñÖ‚ñÜ‚ñÉ‚ñÖ‚ñá‚ñÜ‚ñÜ‚ñÖ‚ñÖ‚ñÅ‚ñà‚ñÖ‚ñÉ‚ñÉ‚ñÅ‚ñÇ‚ñÖ‚ñÉ‚ñÉ‚ñÑ‚ñá‚ñÇ‚ñÉ‚ñÇ‚ñÅ

0,1
acuracia,0.82342
do_lower_case,False
fn,33
fp,65
max_seq_len,512
media_test_epoca_loss,0.36415
media_train_epoca_loss,0.52704
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:Criando Lotes Inteligentes de 4,986 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,986 amostra...


Documentos :   0%|          | 0/4986 [00:00<?, ?documento/s]

INFO:root:     4,986 amostras tokenizadas.
INFO:root:     4,986 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 1 na √©poca: 2.


Epoca 2:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.27675189.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:07:30 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 1 na √©poca: 2.
INFO:root:Criando Lotes Inteligentes de 555 amostras com tamanho de lote 16...
INFO:root:Tokenizando 555 amostra...


Documentos :   0%|          | 0/555 [00:00<?, ?documento/s]

INFO:root:       555 amostras tokenizadas.
INFO:root:       555 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.41866426; Acc: 0.83423423; Rec: 0.93963255; Pre: 0.83840749, F1:0.88613861, vp: 358; vn: 105; fp:  69; fn:  23
INFO:root:   Acur√°cia do fold 1 na √©poca 2: 0.83423423.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.41866426.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:07:38 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f1_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f1_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÜ‚ñÉ‚ñÅ‚ñÇ‚ñÇ‚ñÜ‚ñÖ‚ñÑ‚ñà‚ñÉ‚ñÜ‚ñÅ‚ñÅ‚ñÇ‚ñÉ‚ñÇ‚ñÅ‚ñÇ‚ñÑ‚ñÖ‚ñÖ‚ñÖ‚ñÑ‚ñÉ‚ñÜ‚ñÇ‚ñÖ‚ñÑ‚ñÅ‚ñÉ‚ñà‚ñÑ‚ñÑ‚ñÜ‚ñÉ
train_batch_loss,‚ñÜ‚ñÑ‚ñÉ‚ñÉ‚ñÇ‚ñÉ‚ñÖ‚ñÖ‚ñÅ‚ñÇ‚ñÅ‚ñÑ‚ñÇ‚ñÅ‚ñÉ‚ñÇ‚ñÇ‚ñÇ‚ñÑ‚ñÑ‚ñÇ‚ñÑ‚ñà‚ñÇ‚ñÖ‚ñÖ‚ñÅ‚ñÉ‚ñÇ‚ñÇ‚ñÇ‚ñÖ‚ñÖ‚ñÇ‚ñÇ‚ñÉ‚ñÅ‚ñÖ‚ñÅ‚ñÇ

0,1
acuracia,0.83423
do_lower_case,False
fn,23
fp,69
max_seq_len,512
media_test_epoca_loss,0.41866
media_train_epoca_loss,0.27675
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,986 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,986 amostra...


Documentos :   0%|          | 0/4986 [00:00<?, ?documento/s]

INFO:root:     4,986 amostras tokenizadas.
INFO:root:     4,986 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 1 na √©poca: 3.


Epoca 3:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.12260183.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:11:08 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 1 na √©poca: 3.
INFO:root:Criando Lotes Inteligentes de 555 amostras com tamanho de lote 16...
INFO:root:Tokenizando 555 amostra...


Documentos :   0%|          | 0/555 [00:00<?, ?documento/s]

INFO:root:       555 amostras tokenizadas.
INFO:root:       555 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.77839719; Acc: 0.83783784; Rec: 0.95538058; Pre: 0.83295195, F1:0.88997555, vp: 364; vn: 101; fp:  73; fn:  17
INFO:root:   Acur√°cia do fold 1 na √©poca 3: 0.83783784.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.77839719.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:11:15 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f1_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f1_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.023 MB uploaded\r'), FloatProgress(value=0.18039842597147074, max=1.‚Ä¶

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÉ‚ñÑ‚ñÑ‚ñÑ‚ñÜ‚ñÖ‚ñÜ‚ñá‚ñÅ‚ñÅ‚ñá‚ñÉ‚ñÉ‚ñÑ‚ñÇ‚ñÉ‚ñÉ‚ñÉ‚ñÖ‚ñÉ‚ñÖ‚ñÇ‚ñÜ‚ñÉ‚ñÜ‚ñÉ‚ñÜ‚ñÇ‚ñÉ‚ñÖ‚ñà‚ñÉ‚ñá‚ñÇ‚ñÜ
train_batch_loss,‚ñÉ‚ñÇ‚ñÇ‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÖ‚ñÅ‚ñÅ‚ñÇ‚ñÅ‚ñÑ‚ñÅ‚ñÅ‚ñà‚ñÑ‚ñÑ‚ñÅ‚ñÅ‚ñÖ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÑ‚ñá‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÖ‚ñÅ

0,1
acuracia,0.83784
do_lower_case,False
fn,17
fp,73
max_seq_len,512
media_test_epoca_loss,0.7784
media_train_epoca_loss,0.1226
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:Criando Lotes Inteligentes de 4,986 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,986 amostra...


Documentos :   0%|          | 0/4986 [00:00<?, ?documento/s]

INFO:root:     4,986 amostras tokenizadas.
INFO:root:     4,986 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 1 na √©poca: 4.


Epoca 4:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.04452126.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:14.
INFO:root:   Tempo parcial processamento               : 0:14:48 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 1 na √©poca: 4.
INFO:root:Criando Lotes Inteligentes de 555 amostras com tamanho de lote 16...
INFO:root:Tokenizando 555 amostra...


Documentos :   0%|          | 0/555 [00:00<?, ?documento/s]

INFO:root:       555 amostras tokenizadas.
INFO:root:       555 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.95402966; Acc: 0.84684685; Rec: 0.91601050; Pre: 0.86815920, F1:0.89144317, vp: 349; vn: 121; fp:  53; fn:  32
INFO:root:   Acur√°cia do fold 1 na √©poca 4: 0.84684685.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.95402966.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:14:56 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f1_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f1_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÖ‚ñÅ‚ñÉ‚ñÇ‚ñÜ‚ñÖ‚ñÅ‚ñÑ‚ñÑ‚ñÜ‚ñà‚ñÜ‚ñÖ‚ñÇ‚ñá‚ñÅ‚ñá‚ñÜ‚ñá‚ñÉ‚ñÉ‚ñÉ‚ñá‚ñÇ‚ñÇ‚ñà‚ñÅ‚ñà‚ñÖ‚ñÖ‚ñÖ‚ñá‚ñá‚ñÇ‚ñÜ
train_batch_loss,‚ñÅ‚ñÅ‚ñÅ‚ñÜ‚ñÑ‚ñÜ‚ñÅ‚ñÅ‚ñà‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñà‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñá‚ñÅ‚ñÅ‚ñÑ‚ñÅ‚ñÇ

0,1
acuracia,0.84685
do_lower_case,False
fn,32
fp,53
max_seq_len,512
media_test_epoca_loss,0.95403
media_train_epoca_loss,0.04452
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:  M√©dia perda(loss) treinamento : 0.24272905.
INFO:root:  M√©dia perda(loss) avalia√ß√£o   : 0.63223143.
INFO:root:  Tempo total treinamento       : 0:15:01.
INFO:root:  Tempo processamento fold: 0:15:29 (h:mm:ss)

INFO:root:Processamendo do fold: 2.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   at√© √©poca 4 e taxa de aprendizagem 1e-05.
INFO:root:Vari√°vel URL_MODELO n√£o setada.
INFO:root:Usando modelo BERT pr√©-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classifica√ß√£o.
Some weights of BertForSequenceClassification were not initialized from the model checkpoint at bert-large-cased and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
INFO:root:Existem 1 GPU(s) dispon√≠veis.
INFO:root:Iremos usar a GPU: Tesla T4.
INFO:root:Pytorch rodando o modelo na GPU.
INFO:root:Carregando o tokenizador BERT do dir

√âpocas:   0%|          | 0/4 [00:00<?, ?√©pocas/s]

INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando avalia√ß√£o do fold 2 na √©poca: 0.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.77394152; Acc: 0.35740072; Rec: 0.01662050; Pre: 0.85714286, F1:0.03260870, vp:   6; vn: 192; fp:   1; fn: 355
INFO:root:   Acur√°cia do fold 2 na √©poca 0: 0.35740072.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.77394152.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:00:21 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f2_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f2_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
tempo_train,‚ñÅ
test_batch_loss,‚ñÇ‚ñÅ‚ñÖ‚ñÜ‚ñÜ‚ñÑ‚ñá‚ñÇ‚ñÉ‚ñÖ‚ñÉ‚ñÑ‚ñá‚ñÉ‚ñÖ‚ñÉ‚ñà‚ñÖ‚ñÑ‚ñà‚ñÉ‚ñÇ‚ñÑ‚ñá‚ñÉ‚ñÖ‚ñÑ‚ñÜ‚ñÖ‚ñÜ‚ñÖ‚ñÖ‚ñÖ‚ñÖ‚ñÑ

0,1
acuracia,0.3574
do_lower_case,False
fn,355
fp,1
max_seq_len,512
media_test_epoca_loss,0.77394
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 2 na √©poca: 1.


Epoca 1:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.54028877.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:03:45 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 2 na √©poca: 1.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.43905493; Acc: 0.79963899; Rec: 0.78670360; Pre: 0.89308176, F1:0.83652430, vp: 284; vn: 159; fp:  34; fn:  77
INFO:root:   Acur√°cia do fold 2 na √©poca 1: 0.79963899.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.43905493.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:03:53 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f2_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f2_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÖ‚ñÇ‚ñá‚ñÑ‚ñÉ‚ñÖ‚ñà‚ñÉ‚ñÇ‚ñÅ‚ñÜ‚ñÖ‚ñÉ‚ñÉ‚ñÑ‚ñÑ‚ñÖ‚ñá‚ñÉ‚ñÖ‚ñÉ‚ñÇ‚ñÅ‚ñÑ‚ñÖ‚ñÉ‚ñÑ‚ñÇ‚ñÇ‚ñÅ‚ñÖ‚ñÉ‚ñÖ‚ñÖ‚ñÖ
train_batch_loss,‚ñá‚ñÜ‚ñÖ‚ñÜ‚ñÖ‚ñá‚ñà‚ñÖ‚ñá‚ñÖ‚ñÉ‚ñÉ‚ñÖ‚ñÜ‚ñÖ‚ñÉ‚ñÜ‚ñÑ‚ñÅ‚ñÑ‚ñÜ‚ñÅ‚ñá‚ñÜ‚ñÇ‚ñá‚ñÖ‚ñá‚ñÖ‚ñÖ‚ñÇ‚ñÅ‚ñÑ‚ñÉ‚ñÖ‚ñÉ‚ñÑ‚ñÖ‚ñÉ‚ñÉ

0,1
acuracia,0.79964
do_lower_case,False
fn,77
fp,34
max_seq_len,512
media_test_epoca_loss,0.43905
media_train_epoca_loss,0.54029
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 2 na √©poca: 2.


Epoca 2:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.34528039.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:07:23 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 2 na √©poca: 2.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.37166266; Acc: 0.84115523; Rec: 0.87811634; Pre: 0.87811634, F1:0.87811634, vp: 317; vn: 149; fp:  44; fn:  44
INFO:root:   Acur√°cia do fold 2 na √©poca 2: 0.84115523.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.37166266.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:07:30 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f2_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f2_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÖ‚ñÖ‚ñÑ‚ñÇ‚ñÉ‚ñÑ‚ñÇ‚ñÇ‚ñÅ‚ñÅ‚ñÑ‚ñÉ‚ñÖ‚ñÉ‚ñÅ‚ñÇ‚ñÅ‚ñÇ‚ñÇ‚ñÖ‚ñÑ‚ñÖ‚ñÇ‚ñÖ‚ñÇ‚ñÑ‚ñÑ‚ñÑ‚ñÅ‚ñÑ‚ñÇ‚ñà‚ñÜ‚ñÉ‚ñÑ
train_batch_loss,‚ñÖ‚ñÇ‚ñÖ‚ñÑ‚ñÉ‚ñÇ‚ñÇ‚ñÇ‚ñÖ‚ñÉ‚ñÉ‚ñÇ‚ñÉ‚ñÉ‚ñÇ‚ñÉ‚ñà‚ñÇ‚ñÜ‚ñÉ‚ñÜ‚ñà‚ñá‚ñÇ‚ñÑ‚ñÖ‚ñÖ‚ñÇ‚ñÅ‚ñÑ‚ñÜ‚ñà‚ñÜ‚ñÑ‚ñÉ‚ñÑ‚ñÖ‚ñÑ‚ñÉ‚ñÑ

0,1
acuracia,0.84116
do_lower_case,False
fn,44
fp,44
max_seq_len,512
media_test_epoca_loss,0.37166
media_train_epoca_loss,0.34528
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 2 na √©poca: 3.


Epoca 3:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.19637510.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:11:00 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 2 na √©poca: 3.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.45941659; Acc: 0.85920578; Rec: 0.86980609; Pre: 0.91014493, F1:0.88951841, vp: 314; vn: 162; fp:  31; fn:  47
INFO:root:   Acur√°cia do fold 2 na √©poca 3: 0.85920578.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.45941659.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:11:08 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f2_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f2_BERT_base.csv.


VBox(children=(Label(value='0.023 MB of 0.023 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÑ‚ñÇ‚ñà‚ñÅ‚ñÉ‚ñÉ‚ñÑ‚ñÇ‚ñÅ‚ñÑ‚ñÑ‚ñÖ‚ñÑ‚ñÑ‚ñá‚ñÜ‚ñÇ‚ñÑ‚ñÑ‚ñÇ‚ñÖ‚ñÑ‚ñÉ‚ñÇ‚ñÑ‚ñÇ‚ñÉ‚ñÖ‚ñÇ‚ñÇ‚ñÖ‚ñÉ‚ñÑ‚ñÇ‚ñÜ
train_batch_loss,‚ñÇ‚ñà‚ñÅ‚ñÉ‚ñÑ‚ñÅ‚ñÉ‚ñÉ‚ñÉ‚ñÖ‚ñÇ‚ñÉ‚ñÅ‚ñÉ‚ñá‚ñÅ‚ñÉ‚ñà‚ñÇ‚ñÖ‚ñÅ‚ñÉ‚ñÉ‚ñÖ‚ñÉ‚ñÇ‚ñÇ‚ñÇ‚ñÉ‚ñÅ‚ñÅ‚ñÖ‚ñÑ‚ñÉ‚ñÑ‚ñÖ‚ñÇ‚ñÉ‚ñÉ‚ñÉ

0,1
acuracia,0.85921
do_lower_case,False
fn,47
fp,31
max_seq_len,512
media_test_epoca_loss,0.45942
media_train_epoca_loss,0.19638
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 2 na √©poca: 4.


Epoca 4:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.11112135.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:14:39 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 2 na √©poca: 4.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.60754063; Acc: 0.85018051; Rec: 0.89750693; Pre: 0.87567568, F1:0.88645691, vp: 324; vn: 147; fp:  46; fn:  37
INFO:root:   Acur√°cia do fold 2 na √©poca 4: 0.85018051.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.60754063.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:14:46 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f2_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f2_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÑ‚ñÜ‚ñÉ‚ñÉ‚ñÖ‚ñà‚ñÉ‚ñÑ‚ñÖ‚ñÇ‚ñÉ‚ñÇ‚ñÉ‚ñÜ‚ñÅ‚ñÇ‚ñÉ‚ñÑ‚ñÖ‚ñÉ‚ñÉ‚ñÉ‚ñÅ‚ñÖ‚ñÅ‚ñÇ‚ñÇ‚ñÑ‚ñÉ‚ñÉ‚ñÇ‚ñÉ‚ñÇ‚ñÇ‚ñÑ
train_batch_loss,‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÑ‚ñÉ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñÇ‚ñÅ‚ñÑ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÇ‚ñÉ‚ñÅ‚ñÅ‚ñÑ‚ñÅ‚ñÑ‚ñÅ‚ñá‚ñÅ‚ñà‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñÖ‚ñÅ‚ñÅ

0,1
acuracia,0.85018
do_lower_case,False
fn,37
fp,46
max_seq_len,512
media_test_epoca_loss,0.60754
media_train_epoca_loss,0.11112
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:  M√©dia perda(loss) treinamento : 0.29826640.
INFO:root:  M√©dia perda(loss) avalia√ß√£o   : 0.53032327.
INFO:root:  Tempo total treinamento       : 0:14:51.
INFO:root:  Tempo processamento fold: 0:15:00 (h:mm:ss)

INFO:root:Processamendo do fold: 3.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   at√© √©poca 4 e taxa de aprendizagem 1e-05.
INFO:root:Vari√°vel URL_MODELO n√£o setada.
INFO:root:Usando modelo BERT pr√©-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classifica√ß√£o.
Some weights of BertForSequenceClassification were not initialized from the model checkpoint at bert-large-cased and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
INFO:root:Existem 1 GPU(s) dispon√≠veis.
INFO:root:Iremos usar a GPU: Tesla T4.
INFO:root:Pytorch rodando o modelo na GPU.
INFO:root:Carregando o tokenizador BERT do dir

√âpocas:   0%|          | 0/4 [00:00<?, ?√©pocas/s]

INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando avalia√ß√£o do fold 3 na √©poca: 0.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.79524125; Acc: 0.31768953; Rec: 0.00263852; Pre: 1.00000000, F1:0.00526316, vp:   1; vn: 175; fp:   0; fn: 378
INFO:root:   Acur√°cia do fold 3 na √©poca 0: 0.31768953.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.79524125.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:00:21 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f3_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f3_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
tempo_train,‚ñÅ
test_batch_loss,‚ñÉ‚ñá‚ñÜ‚ñÖ‚ñá‚ñÜ‚ñÑ‚ñà‚ñÇ‚ñÑ‚ñÜ‚ñà‚ñÑ‚ñÖ‚ñÜ‚ñÜ‚ñÇ‚ñÉ‚ñÑ‚ñà‚ñà‚ñÜ‚ñá‚ñá‚ñÅ‚ñÉ‚ñá‚ñá‚ñÜ‚ñÖ‚ñÑ‚ñÖ‚ñÑ‚ñÜ‚ñÑ

0,1
acuracia,0.31769
do_lower_case,False
fn,378
fp,0
max_seq_len,512
media_test_epoca_loss,0.79524
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 3 na √©poca: 1.


Epoca 1:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.57326030.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:03:46 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 3 na √©poca: 1.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.51418802; Acc: 0.75270758; Rec: 0.84696570; Pre: 0.80250000, F1:0.82413350, vp: 321; vn:  96; fp:  79; fn:  58
INFO:root:   Acur√°cia do fold 3 na √©poca 1: 0.75270758.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.51418802.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:03:53 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f3_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f3_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÇ‚ñÉ‚ñÉ‚ñÇ‚ñÅ‚ñÑ‚ñÖ‚ñÇ‚ñÑ‚ñÖ‚ñÉ‚ñÉ‚ñÉ‚ñÇ‚ñÑ‚ñÜ‚ñÉ‚ñÑ‚ñÇ‚ñÑ‚ñÑ‚ñÖ‚ñÑ‚ñÖ‚ñÉ‚ñÖ‚ñà‚ñÇ‚ñÇ‚ñÑ‚ñÉ‚ñÉ‚ñÑ‚ñÉ‚ñÑ
train_batch_loss,‚ñá‚ñÜ‚ñÖ‚ñÜ‚ñÖ‚ñÜ‚ñÜ‚ñÑ‚ñÖ‚ñÖ‚ñá‚ñÖ‚ñÑ‚ñà‚ñÖ‚ñÖ‚ñá‚ñÉ‚ñÉ‚ñÑ‚ñÜ‚ñÑ‚ñÖ‚ñÖ‚ñÇ‚ñÜ‚ñÑ‚ñÉ‚ñÖ‚ñÉ‚ñÖ‚ñÇ‚ñÖ‚ñÑ‚ñÇ‚ñÑ‚ñÑ‚ñÇ‚ñÑ‚ñÅ

0,1
acuracia,0.75271
do_lower_case,False
fn,58
fp,79
max_seq_len,512
media_test_epoca_loss,0.51419
media_train_epoca_loss,0.57326
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 3 na √©poca: 2.


Epoca 2:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.35729702.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:07:25 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 3 na √©poca: 2.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.59282319; Acc: 0.77797834; Rec: 0.96833773; Pre: 0.76778243, F1:0.85647608, vp: 367; vn:  64; fp: 111; fn:  12
INFO:root:   Acur√°cia do fold 3 na √©poca 2: 0.77797834.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.59282319.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:07:33 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f3_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f3_BERT_base.csv.


VBox(children=(Label(value='0.006 MB of 0.023 MB uploaded\r'), FloatProgress(value=0.26654366543665436, max=1.‚Ä¶

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÉ‚ñÉ‚ñÉ‚ñÑ‚ñÑ‚ñÖ‚ñÇ‚ñÑ‚ñÖ‚ñá‚ñÖ‚ñÉ‚ñÇ‚ñá‚ñÅ‚ñÇ‚ñÑ‚ñÜ‚ñÇ‚ñÜ‚ñá‚ñà‚ñÅ‚ñÉ‚ñÉ‚ñÖ‚ñÅ‚ñÖ‚ñÉ‚ñÖ‚ñÇ‚ñÑ‚ñÖ‚ñÉ‚ñÖ
train_batch_loss,‚ñÑ‚ñÑ‚ñÉ‚ñÇ‚ñÉ‚ñÇ‚ñÑ‚ñÅ‚ñÉ‚ñÑ‚ñÉ‚ñÜ‚ñÉ‚ñÇ‚ñÇ‚ñÑ‚ñÜ‚ñÑ‚ñÑ‚ñÉ‚ñá‚ñÑ‚ñÖ‚ñÑ‚ñà‚ñÉ‚ñÅ‚ñÉ‚ñÇ‚ñÑ‚ñÑ‚ñá‚ñÇ‚ñÇ‚ñÉ‚ñÅ‚ñÉ‚ñÑ‚ñÇ‚ñÇ

0,1
acuracia,0.77798
do_lower_case,False
fn,12
fp,111
max_seq_len,512
media_test_epoca_loss,0.59282
media_train_epoca_loss,0.3573
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 3 na √©poca: 3.


Epoca 3:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.17431102.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:11:24 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 3 na √©poca: 3.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.68836252; Acc: 0.81949458; Rec: 0.83113456; Pre: 0.89743590, F1:0.86301370, vp: 315; vn: 139; fp:  36; fn:  64
INFO:root:   Acur√°cia do fold 3 na √©poca 3: 0.81949458.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.68836252.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:11:32 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f3_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f3_BERT_base.csv.


VBox(children=(Label(value='0.023 MB of 0.023 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÑ‚ñÖ‚ñÉ‚ñÇ‚ñÇ‚ñÇ‚ñÖ‚ñÅ‚ñÇ‚ñÑ‚ñÑ‚ñÇ‚ñÖ‚ñÇ‚ñÇ‚ñÉ‚ñÉ‚ñÇ‚ñà‚ñÉ‚ñÇ‚ñÇ‚ñÇ‚ñÉ‚ñÑ‚ñÇ‚ñÇ‚ñÉ‚ñÖ‚ñÇ‚ñÇ‚ñÑ‚ñÅ‚ñÅ‚ñá
train_batch_loss,‚ñÅ‚ñÑ‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñÉ‚ñÉ‚ñÅ‚ñÉ‚ñÑ‚ñÅ‚ñÖ‚ñÅ‚ñÇ‚ñà‚ñÇ‚ñÉ‚ñÅ‚ñÅ‚ñÅ‚ñÇ‚ñÇ‚ñÅ‚ñÅ‚ñÉ‚ñÇ‚ñÅ‚ñÑ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÉ‚ñÇ

0,1
acuracia,0.81949
do_lower_case,False
fn,64
fp,36
max_seq_len,512
media_test_epoca_loss,0.68836
media_train_epoca_loss,0.17431
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


VBox(children=(Label(value='Waiting for wandb.init()...\r'), FloatProgress(value=0.01111307771111064, max=1.0)‚Ä¶

INFO:root:Realizando treinamento do fold 3 na √©poca: 4.


Epoca 4:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.08477338.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:15:04 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 3 na √©poca: 4.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 1.16754198; Acc: 0.82310469; Rec: 0.95250660; Pre: 0.81859410, F1:0.88048780, vp: 361; vn:  95; fp:  80; fn:  18
INFO:root:   Acur√°cia do fold 3 na √©poca 4: 0.82310469.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 1.16754198.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:15:12 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f3_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f3_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÅ‚ñÑ‚ñÜ‚ñÉ‚ñÖ‚ñÉ‚ñÉ‚ñÅ‚ñÉ‚ñÉ‚ñÜ‚ñÇ‚ñÉ‚ñÖ‚ñÑ‚ñÇ‚ñÉ‚ñÉ‚ñÉ‚ñÖ‚ñÑ‚ñÇ‚ñÇ‚ñÇ‚ñÑ‚ñÖ‚ñÅ‚ñÑ‚ñÅ‚ñÅ‚ñÑ‚ñÉ‚ñÜ‚ñÑ‚ñà
train_batch_loss,‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñá‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñÅ‚ñÖ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñà‚ñÅ‚ñÑ‚ñÅ‚ñÜ‚ñÅ‚ñÅ‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÇ‚ñÅ

0,1
acuracia,0.8231
do_lower_case,False
fn,18
fp,80
max_seq_len,512
media_test_epoca_loss,1.16754
media_train_epoca_loss,0.08477
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:  M√©dia perda(loss) treinamento : 0.29741043.
INFO:root:  M√©dia perda(loss) avalia√ß√£o   : 0.75163139.
INFO:root:  Tempo total treinamento       : 0:15:17.
INFO:root:  Tempo processamento fold: 0:15:26 (h:mm:ss)

INFO:root:Processamendo do fold: 4.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   at√© √©poca 4 e taxa de aprendizagem 1e-05.
INFO:root:Vari√°vel URL_MODELO n√£o setada.
INFO:root:Usando modelo BERT pr√©-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classifica√ß√£o.
Some weights of BertForSequenceClassification were not initialized from the model checkpoint at bert-large-cased and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
INFO:root:Existem 1 GPU(s) dispon√≠veis.
INFO:root:Iremos usar a GPU: Tesla T4.
INFO:root:Pytorch rodando o modelo na GPU.
INFO:root:Carregando o tokenizador BERT do dir

√âpocas:   0%|          | 0/4 [00:00<?, ?√©pocas/s]

INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando avalia√ß√£o do fold 4 na √©poca: 0.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.78849922; Acc: 0.32851986; Rec: 0.01072386; Pre: 0.57142857, F1:0.02105263, vp:   4; vn: 178; fp:   3; fn: 369
INFO:root:   Acur√°cia do fold 4 na √©poca 0: 0.32851986.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.78849922.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:00:22 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f4_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f4_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.014 MB uploaded\r'), FloatProgress(value=0.31007751937984496, max=1.‚Ä¶

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
tempo_train,‚ñÅ
test_batch_loss,‚ñÑ‚ñÑ‚ñÅ‚ñÖ‚ñÉ‚ñÑ‚ñÖ‚ñÉ‚ñÖ‚ñÇ‚ñÖ‚ñÉ‚ñÇ‚ñÇ‚ñÖ‚ñÇ‚ñà‚ñÖ‚ñÑ‚ñÜ‚ñÜ‚ñÉ‚ñÜ‚ñÇ‚ñÜ‚ñÜ‚ñÇ‚ñÉ‚ñÖ‚ñÉ‚ñÉ‚ñà‚ñÑ‚ñÉ‚ñÉ

0,1
acuracia,0.32852
do_lower_case,False
fn,369
fp,3
max_seq_len,512
media_test_epoca_loss,0.7885
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 4 na √©poca: 1.


Epoca 1:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.55865856.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:03:46 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 4 na √©poca: 1.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.42016505; Acc: 0.83935018; Rec: 0.86595174; Pre: 0.89226519, F1:0.87891156, vp: 323; vn: 142; fp:  39; fn:  50
INFO:root:   Acur√°cia do fold 4 na √©poca 1: 0.83935018.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.42016505.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:03:53 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f4_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f4_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÉ‚ñÑ‚ñÜ‚ñÖ‚ñÇ‚ñÜ‚ñÜ‚ñà‚ñÉ‚ñÑ‚ñÜ‚ñá‚ñÅ‚ñÑ‚ñÇ‚ñÖ‚ñÖ‚ñÖ‚ñÇ‚ñà‚ñÖ‚ñÑ‚ñá‚ñÑ‚ñÖ‚ñÖ‚ñÉ‚ñÖ‚ñÖ‚ñÖ‚ñá‚ñÇ‚ñÜ‚ñá‚ñÖ
train_batch_loss,‚ñà‚ñÜ‚ñÜ‚ñÜ‚ñÜ‚ñá‚ñà‚ñÜ‚ñà‚ñÖ‚ñÑ‚ñÑ‚ñÖ‚ñÜ‚ñÑ‚ñÖ‚ñá‚ñÑ‚ñÉ‚ñÖ‚ñÜ‚ñÉ‚ñÖ‚ñÜ‚ñÖ‚ñÑ‚ñÉ‚ñÑ‚ñÑ‚ñÉ‚ñÑ‚ñÉ‚ñÉ‚ñÑ‚ñÉ‚ñÖ‚ñÅ‚ñÉ‚ñÖ‚ñÅ

0,1
acuracia,0.83935
do_lower_case,False
fn,50
fp,39
max_seq_len,512
media_test_epoca_loss,0.42017
media_train_epoca_loss,0.55866
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 4 na √©poca: 2.


Epoca 2:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.35019646.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:07:26 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 4 na √©poca: 2.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.37927140; Acc: 0.84115523; Rec: 0.95978552; Pre: 0.83062645, F1:0.89054726, vp: 358; vn: 108; fp:  73; fn:  15
INFO:root:   Acur√°cia do fold 4 na √©poca 2: 0.84115523.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.37927140.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:07:33 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f4_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f4_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÑ‚ñÇ‚ñà‚ñÇ‚ñÑ‚ñÇ‚ñá‚ñÉ‚ñÜ‚ñÅ‚ñÑ‚ñÉ‚ñÉ‚ñÖ‚ñÑ‚ñÉ‚ñÅ‚ñÜ‚ñÑ‚ñÉ‚ñÇ‚ñá‚ñÉ‚ñÜ‚ñÉ‚ñÉ‚ñÇ‚ñÇ‚ñÑ‚ñÖ‚ñÇ‚ñÜ‚ñÉ‚ñÑ‚ñà
train_batch_loss,‚ñÇ‚ñÜ‚ñÜ‚ñÑ‚ñÑ‚ñÇ‚ñÑ‚ñÇ‚ñÉ‚ñÇ‚ñÑ‚ñÉ‚ñÑ‚ñÅ‚ñÑ‚ñÇ‚ñá‚ñÅ‚ñÑ‚ñÇ‚ñÉ‚ñÉ‚ñÜ‚ñÇ‚ñÇ‚ñÇ‚ñÉ‚ñÅ‚ñÉ‚ñÇ‚ñÜ‚ñÑ‚ñÖ‚ñÖ‚ñÅ‚ñÖ‚ñÑ‚ñÑ‚ñÅ‚ñà

0,1
acuracia,0.84116
do_lower_case,False
fn,15
fp,73
max_seq_len,512
media_test_epoca_loss,0.37927
media_train_epoca_loss,0.3502
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 4 na √©poca: 3.


Epoca 3:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.17858218.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:11:05 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 4 na √©poca: 3.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.62500730; Acc: 0.82671480; Rec: 0.79624665; Pre: 0.93690852, F1:0.86086957, vp: 297; vn: 161; fp:  20; fn:  76
INFO:root:   Acur√°cia do fold 4 na √©poca 3: 0.82671480.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.62500730.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:11:12 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f4_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f4_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñá‚ñÑ‚ñá‚ñÖ‚ñÖ‚ñÇ‚ñÖ‚ñÇ‚ñÜ‚ñà‚ñÑ‚ñÇ‚ñÇ‚ñÜ‚ñÉ‚ñÜ‚ñÉ‚ñÖ‚ñÉ‚ñÑ‚ñÑ‚ñÑ‚ñÜ‚ñÅ‚ñÉ‚ñÖ‚ñÑ‚ñà‚ñÖ‚ñÅ‚ñÉ‚ñÑ‚ñÉ‚ñá‚ñÜ
train_batch_loss,‚ñá‚ñÉ‚ñÉ‚ñÅ‚ñÖ‚ñÅ‚ñÖ‚ñÅ‚ñÉ‚ñÑ‚ñÅ‚ñÑ‚ñÑ‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñà‚ñÇ‚ñÜ‚ñÅ‚ñÇ‚ñÑ‚ñÉ‚ñÇ‚ñÖ‚ñÅ‚ñÉ‚ñÅ‚ñÑ‚ñÖ‚ñÑ‚ñÅ‚ñÅ‚ñÉ‚ñÑ‚ñÑ‚ñÑ‚ñÜ

0,1
acuracia,0.82671
do_lower_case,False
fn,76
fp,20
max_seq_len,512
media_test_epoca_loss,0.62501
media_train_epoca_loss,0.17858
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 4 na √©poca: 4.


Epoca 4:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.09039487.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:14.
INFO:root:   Tempo parcial processamento               : 0:14:46 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 4 na √©poca: 4.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.82422032; Acc: 0.83935018; Rec: 0.82305630; Pre: 0.93030303, F1:0.87339972, vp: 307; vn: 158; fp:  23; fn:  66
INFO:root:   Acur√°cia do fold 4 na √©poca 4: 0.83935018.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.82422032.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:14:53 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f4_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f4_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñà‚ñÉ‚ñÑ‚ñÉ‚ñÑ‚ñÑ‚ñÉ‚ñÉ‚ñÅ‚ñÇ‚ñÖ‚ñÖ‚ñÉ‚ñÅ‚ñÉ‚ñÑ‚ñÑ‚ñÉ‚ñÜ‚ñÖ‚ñÇ‚ñÑ‚ñÉ‚ñÇ‚ñÇ‚ñÑ‚ñÑ‚ñÉ‚ñÅ‚ñÜ‚ñÉ‚ñÑ‚ñÑ‚ñÇ‚ñÖ
train_batch_loss,‚ñÅ‚ñÅ‚ñÇ‚ñÇ‚ñÅ‚ñÅ‚ñÖ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñà‚ñÅ‚ñÅ‚ñÉ‚ñá‚ñÇ‚ñÅ‚ñÅ‚ñà‚ñà‚ñÅ‚ñÅ‚ñÅ‚ñÖ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ

0,1
acuracia,0.83935
do_lower_case,False
fn,66
fp,23
max_seq_len,512
media_test_epoca_loss,0.82422
media_train_epoca_loss,0.09039
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:  M√©dia perda(loss) treinamento : 0.29445802.
INFO:root:  M√©dia perda(loss) avalia√ß√£o   : 0.60743266.
INFO:root:  Tempo total treinamento       : 0:14:58.
INFO:root:  Tempo processamento fold: 0:15:07 (h:mm:ss)

INFO:root:Processamendo do fold: 5.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   at√© √©poca 4 e taxa de aprendizagem 1e-05.
INFO:root:Vari√°vel URL_MODELO n√£o setada.
INFO:root:Usando modelo BERT pr√©-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classifica√ß√£o.
Some weights of BertForSequenceClassification were not initialized from the model checkpoint at bert-large-cased and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
INFO:root:Existem 1 GPU(s) dispon√≠veis.
INFO:root:Iremos usar a GPU: Tesla T4.
INFO:root:Pytorch rodando o modelo na GPU.
INFO:root:Carregando o tokenizador BERT do dir

√âpocas:   0%|          | 0/4 [00:00<?, ?√©pocas/s]

INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando avalia√ß√£o do fold 5 na √©poca: 0.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.78009945; Acc: 0.35379061; Rec: 0.01111111; Pre: 0.66666667, F1:0.02185792, vp:   4; vn: 192; fp:   2; fn: 356
INFO:root:   Acur√°cia do fold 5 na √©poca 0: 0.35379061.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.78009945.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:00:22 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f5_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f5_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
tempo_train,‚ñÅ
test_batch_loss,‚ñÜ‚ñÉ‚ñÅ‚ñÉ‚ñÖ‚ñÜ‚ñÖ‚ñÜ‚ñÉ‚ñÉ‚ñÖ‚ñá‚ñÇ‚ñÑ‚ñà‚ñÑ‚ñÅ‚ñÜ‚ñÉ‚ñÖ‚ñÑ‚ñÜ‚ñÖ‚ñÖ‚ñà‚ñÜ‚ñÅ‚ñÑ‚ñÜ‚ñÜ‚ñÇ‚ñÑ‚ñÉ‚ñÑ‚ñÖ

0,1
acuracia,0.35379
do_lower_case,False
fn,356
fp,2
max_seq_len,512
media_test_epoca_loss,0.7801
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 5 na √©poca: 1.


Epoca 1:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.56764874.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:03:47 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 5 na √©poca: 1.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.47419503; Acc: 0.76534296; Rec: 0.94444444; Pre: 0.75555556, F1:0.83950617, vp: 340; vn:  84; fp: 110; fn:  20
INFO:root:   Acur√°cia do fold 5 na √©poca 1: 0.76534296.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.47419503.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:03:55 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f5_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f5_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÜ‚ñÇ‚ñÑ‚ñÉ‚ñÑ‚ñá‚ñÖ‚ñÑ‚ñÑ‚ñÖ‚ñÑ‚ñÖ‚ñÖ‚ñÑ‚ñÅ‚ñÖ‚ñÜ‚ñá‚ñá‚ñÑ‚ñá‚ñÜ‚ñÜ‚ñÇ‚ñÜ‚ñÜ‚ñÉ‚ñÇ‚ñÇ‚ñá‚ñÉ‚ñà‚ñÇ‚ñÜ‚ñÇ
train_batch_loss,‚ñá‚ñÜ‚ñÖ‚ñÖ‚ñÑ‚ñÜ‚ñÜ‚ñÖ‚ñÜ‚ñÖ‚ñÇ‚ñÉ‚ñÜ‚ñá‚ñà‚ñÑ‚ñÜ‚ñÉ‚ñÇ‚ñÅ‚ñÖ‚ñÖ‚ñÉ‚ñà‚ñÇ‚ñÖ‚ñÑ‚ñÉ‚ñÖ‚ñÜ‚ñÑ‚ñÑ‚ñÖ‚ñÑ‚ñÉ‚ñÅ‚ñÖ‚ñÑ‚ñÖ‚ñÇ

0,1
acuracia,0.76534
do_lower_case,False
fn,20
fp,110
max_seq_len,512
media_test_epoca_loss,0.4742
media_train_epoca_loss,0.56765
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 5 na √©poca: 2.


Epoca 2:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.36592015.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:07:27 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 5 na √©poca: 2.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.40054460; Acc: 0.82490975; Rec: 0.92222222; Pre: 0.82793017, F1:0.87253614, vp: 332; vn: 125; fp:  69; fn:  28
INFO:root:   Acur√°cia do fold 5 na √©poca 2: 0.82490975.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.40054460.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:07:34 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f5_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f5_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÇ‚ñÇ‚ñà‚ñÜ‚ñá‚ñÇ‚ñÜ‚ñÉ‚ñÑ‚ñÑ‚ñÉ‚ñÑ‚ñÖ‚ñÜ‚ñÉ‚ñÉ‚ñÑ‚ñÖ‚ñÉ‚ñÖ‚ñá‚ñÜ‚ñÇ‚ñÉ‚ñÑ‚ñÇ‚ñÉ‚ñÉ‚ñÑ‚ñÑ‚ñÅ‚ñÖ‚ñà‚ñÅ‚ñÉ
train_batch_loss,‚ñÉ‚ñÖ‚ñÖ‚ñÑ‚ñÑ‚ñÉ‚ñÖ‚ñÑ‚ñÑ‚ñÉ‚ñÖ‚ñÑ‚ñÉ‚ñÉ‚ñÉ‚ñÜ‚ñà‚ñÜ‚ñÖ‚ñÑ‚ñÑ‚ñÅ‚ñÖ‚ñÑ‚ñÅ‚ñá‚ñÜ‚ñá‚ñÅ‚ñÉ‚ñÖ‚ñÉ‚ñÜ‚ñÑ‚ñÑ‚ñÉ‚ñÇ‚ñÉ‚ñÅ‚ñÑ

0,1
acuracia,0.82491
do_lower_case,False
fn,28
fp,69
max_seq_len,512
media_test_epoca_loss,0.40054
media_train_epoca_loss,0.36592
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 5 na √©poca: 3.


Epoca 3:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.19389188.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:11:05 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 5 na √©poca: 3.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.50183474; Acc: 0.85379061; Rec: 0.90833333; Pre: 0.87200000, F1:0.88979592, vp: 327; vn: 146; fp:  48; fn:  33
INFO:root:   Acur√°cia do fold 5 na √©poca 3: 0.85379061.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.50183474.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:11:12 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f5_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f5_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÇ‚ñÖ‚ñÅ‚ñÑ‚ñÑ‚ñÇ‚ñÜ‚ñÉ‚ñÉ‚ñÉ‚ñÇ‚ñà‚ñÉ‚ñÖ‚ñÅ‚ñà‚ñÉ‚ñÑ‚ñÖ‚ñÖ‚ñÜ‚ñÇ‚ñÉ‚ñÅ‚ñÖ‚ñÖ‚ñÉ‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÇ‚ñÑ‚ñÅ‚ñÜ
train_batch_loss,‚ñÉ‚ñÑ‚ñÇ‚ñÇ‚ñÉ‚ñÅ‚ñÅ‚ñÇ‚ñÅ‚ñÑ‚ñÖ‚ñÑ‚ñÅ‚ñÉ‚ñÇ‚ñÉ‚ñÜ‚ñÅ‚ñÇ‚ñÇ‚ñÑ‚ñÉ‚ñÅ‚ñÅ‚ñÑ‚ñÅ‚ñÉ‚ñÅ‚ñÅ‚ñÅ‚ñá‚ñà‚ñÉ‚ñÅ‚ñÜ‚ñÇ‚ñÑ‚ñÅ‚ñÅ‚ñÅ

0,1
acuracia,0.85379
do_lower_case,False
fn,33
fp,48
max_seq_len,512
media_test_epoca_loss,0.50183
media_train_epoca_loss,0.19389
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 5 na √©poca: 4.


Epoca 4:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.11883380.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:14.
INFO:root:   Tempo parcial processamento               : 0:14:45 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 5 na √©poca: 4.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.63902243; Acc: 0.85920578; Rec: 0.92500000; Pre: 0.86718750, F1:0.89516129, vp: 333; vn: 143; fp:  51; fn:  27
INFO:root:   Acur√°cia do fold 5 na √©poca 4: 0.85920578.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.63902243.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:14:53 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f5_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f5_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÇ‚ñÑ‚ñÑ‚ñÑ‚ñà‚ñÑ‚ñÉ‚ñÑ‚ñÅ‚ñÅ‚ñÉ‚ñÉ‚ñÖ‚ñÑ‚ñÖ‚ñÅ‚ñà‚ñÇ‚ñÖ‚ñÇ‚ñÇ‚ñÇ‚ñÉ‚ñÜ‚ñÉ‚ñÑ‚ñÉ‚ñÉ‚ñÅ‚ñÉ‚ñÜ‚ñÖ‚ñÑ‚ñÑ‚ñÜ
train_batch_loss,‚ñÅ‚ñÉ‚ñÅ‚ñÉ‚ñÑ‚ñÑ‚ñÅ‚ñÅ‚ñÖ‚ñÉ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÑ‚ñÅ‚ñÅ‚ñÇ‚ñÇ‚ñà‚ñÅ‚ñÅ‚ñÖ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÖ‚ñÅ‚ñÅ‚ñÅ

0,1
acuracia,0.85921
do_lower_case,False
fn,27
fp,51
max_seq_len,512
media_test_epoca_loss,0.63902
media_train_epoca_loss,0.11883
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:  M√©dia perda(loss) treinamento : 0.31157364.
INFO:root:  M√©dia perda(loss) avalia√ß√£o   : 0.55913925.
INFO:root:  Tempo total treinamento       : 0:14:58.
INFO:root:  Tempo processamento fold: 0:15:07 (h:mm:ss)

INFO:root:Processamendo do fold: 6.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   at√© √©poca 4 e taxa de aprendizagem 1e-05.
INFO:root:Vari√°vel URL_MODELO n√£o setada.
INFO:root:Usando modelo BERT pr√©-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classifica√ß√£o.
Some weights of BertForSequenceClassification were not initialized from the model checkpoint at bert-large-cased and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
INFO:root:Existem 1 GPU(s) dispon√≠veis.
INFO:root:Iremos usar a GPU: Tesla T4.
INFO:root:Pytorch rodando o modelo na GPU.
INFO:root:Carregando o tokenizador BERT do dir

√âpocas:   0%|          | 0/4 [00:00<?, ?√©pocas/s]

INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando avalia√ß√£o do fold 6 na √©poca: 0.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.78771157; Acc: 0.33754513; Rec: 0.01089918; Pre: 0.50000000, F1:0.02133333, vp:   4; vn: 183; fp:   4; fn: 363
INFO:root:   Acur√°cia do fold 6 na √©poca 0: 0.33754513.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.78771157.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:00:22 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f6_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f6_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
tempo_train,‚ñÅ
test_batch_loss,‚ñÑ‚ñÅ‚ñÖ‚ñÜ‚ñá‚ñÖ‚ñÜ‚ñÅ‚ñÑ‚ñÅ‚ñÖ‚ñÜ‚ñÑ‚ñÖ‚ñÜ‚ñÇ‚ñÑ‚ñá‚ñÉ‚ñÜ‚ñÉ‚ñÜ‚ñÉ‚ñÜ‚ñÉ‚ñÖ‚ñÜ‚ñÖ‚ñÜ‚ñÜ‚ñÜ‚ñÉ‚ñÑ‚ñÇ‚ñà

0,1
acuracia,0.33755
do_lower_case,False
fn,363
fp,4
max_seq_len,512
media_test_epoca_loss,0.78771
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 6 na √©poca: 1.


Epoca 1:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.54682050.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:03:47 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 6 na √©poca: 1.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.49224750; Acc: 0.73285199; Rec: 0.64032698; Pre: 0.93625498, F1:0.76051780, vp: 235; vn: 171; fp:  16; fn: 132
INFO:root:   Acur√°cia do fold 6 na √©poca 1: 0.73285199.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.49224750.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:03:54 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f6_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f6_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÉ‚ñÇ‚ñÑ‚ñÜ‚ñÜ‚ñÖ‚ñá‚ñÉ‚ñà‚ñÇ‚ñÖ‚ñà‚ñÉ‚ñá‚ñÇ‚ñÖ‚ñá‚ñÜ‚ñÇ‚ñÑ‚ñÜ‚ñÇ‚ñÉ‚ñÖ‚ñÇ‚ñÖ‚ñÖ‚ñÉ‚ñÑ‚ñÑ‚ñÖ‚ñÑ‚ñÖ‚ñÑ‚ñÅ
train_batch_loss,‚ñá‚ñÜ‚ñÜ‚ñá‚ñÜ‚ñà‚ñá‚ñÜ‚ñÜ‚ñÜ‚ñÑ‚ñÖ‚ñà‚ñá‚ñÜ‚ñÖ‚ñÖ‚ñÑ‚ñÑ‚ñÑ‚ñÖ‚ñÉ‚ñá‚ñÖ‚ñÉ‚ñÖ‚ñÜ‚ñÖ‚ñÖ‚ñÖ‚ñÉ‚ñÅ‚ñÑ‚ñÇ‚ñá‚ñÉ‚ñÉ‚ñÑ‚ñÑ‚ñÅ

0,1
acuracia,0.73285
do_lower_case,False
fn,132
fp,16
max_seq_len,512
media_test_epoca_loss,0.49225
media_train_epoca_loss,0.54682
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 6 na √©poca: 2.


Epoca 2:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.34340404.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:07:26 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 6 na √©poca: 2.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.38010656; Acc: 0.82129964; Rec: 0.85013624; Pre: 0.87640449, F1:0.86307054, vp: 312; vn: 143; fp:  44; fn:  55
INFO:root:   Acur√°cia do fold 6 na √©poca 2: 0.82129964.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.38010656.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:07:34 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f6_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f6_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÉ‚ñÇ‚ñÖ‚ñÉ‚ñÖ‚ñà‚ñá‚ñÖ‚ñÖ‚ñÇ‚ñÖ‚ñÉ‚ñÇ‚ñÖ‚ñÖ‚ñÑ‚ñÅ‚ñÖ‚ñÉ‚ñÇ‚ñÉ‚ñÜ‚ñÑ‚ñÅ‚ñÑ‚ñÜ‚ñà‚ñÑ‚ñÉ‚ñÉ‚ñÇ‚ñÑ‚ñÑ‚ñÖ‚ñÉ
train_batch_loss,‚ñà‚ñÖ‚ñÉ‚ñÑ‚ñÖ‚ñÑ‚ñÑ‚ñÇ‚ñÖ‚ñÑ‚ñÇ‚ñÑ‚ñÑ‚ñÉ‚ñÇ‚ñÖ‚ñá‚ñÉ‚ñÜ‚ñÖ‚ñÑ‚ñÖ‚ñÜ‚ñÑ‚ñÇ‚ñÖ‚ñÅ‚ñÖ‚ñÇ‚ñÜ‚ñÖ‚ñÜ‚ñÖ‚ñÑ‚ñÖ‚ñÇ‚ñÇ‚ñÜ‚ñÑ‚ñÜ

0,1
acuracia,0.8213
do_lower_case,False
fn,55
fp,44
max_seq_len,512
media_test_epoca_loss,0.38011
media_train_epoca_loss,0.3434
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 6 na √©poca: 3.


Epoca 3:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.19251694.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:11:05 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 6 na √©poca: 3.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.69239700; Acc: 0.81227437; Rec: 0.86920981; Pre: 0.85066667, F1:0.85983827, vp: 319; vn: 131; fp:  56; fn:  48
INFO:root:   Acur√°cia do fold 6 na √©poca 3: 0.81227437.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.69239700.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:11:13 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f6_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f6_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.014 MB uploaded\r'), FloatProgress(value=0.3027384064951149, max=1.0‚Ä¶

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÅ‚ñÑ‚ñÉ‚ñÇ‚ñÇ‚ñÉ‚ñÖ‚ñÅ‚ñÑ‚ñÉ‚ñÇ‚ñÇ‚ñÉ‚ñÅ‚ñÉ‚ñÇ‚ñÇ‚ñÖ‚ñÉ‚ñÉ‚ñÉ‚ñÉ‚ñÖ‚ñà‚ñÉ‚ñÉ‚ñÉ‚ñÅ‚ñÇ‚ñÇ‚ñÉ‚ñÑ‚ñÉ‚ñÉ‚ñÑ
train_batch_loss,‚ñÉ‚ñà‚ñÅ‚ñÜ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÖ‚ñÜ‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÑ‚ñÉ‚ñÅ‚ñÑ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñÉ‚ñÇ‚ñÖ‚ñÉ‚ñÅ‚ñÅ‚ñÑ‚ñÑ‚ñÅ‚ñÅ‚ñÅ‚ñÖ‚ñÅ‚ñÅ‚ñÅ

0,1
acuracia,0.81227
do_lower_case,False
fn,48
fp,56
max_seq_len,512
media_test_epoca_loss,0.6924
media_train_epoca_loss,0.19252
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 6 na √©poca: 4.


Epoca 4:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.10533357.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:14:44 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 6 na √©poca: 4.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.65824215; Acc: 0.84476534; Rec: 0.89645777; Pre: 0.87267905, F1:0.88440860, vp: 329; vn: 139; fp:  48; fn:  38
INFO:root:   Acur√°cia do fold 6 na √©poca 4: 0.84476534.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.65824215.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:14:52 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f6_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f6_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÑ‚ñÉ‚ñÇ‚ñÜ‚ñÑ‚ñÑ‚ñÑ‚ñÜ‚ñÇ‚ñÅ‚ñÉ‚ñá‚ñÜ‚ñÑ‚ñÖ‚ñÜ‚ñÑ‚ñÑ‚ñÅ‚ñÑ‚ñÜ‚ñÑ‚ñÖ‚ñÅ‚ñÇ‚ñÜ‚ñÖ‚ñÖ‚ñÖ‚ñÖ‚ñà‚ñÑ‚ñÜ‚ñÑ‚ñÇ
train_batch_loss,‚ñÅ‚ñÅ‚ñÇ‚ñÅ‚ñÑ‚ñÉ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÖ‚ñÅ‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÑ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñá‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÑ‚ñÅ‚ñÑ‚ñÅ‚ñà

0,1
acuracia,0.84477
do_lower_case,False
fn,38
fp,48
max_seq_len,512
media_test_epoca_loss,0.65824
media_train_epoca_loss,0.10533
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:  M√©dia perda(loss) treinamento : 0.29701877.
INFO:root:  M√©dia perda(loss) avalia√ß√£o   : 0.60214096.
INFO:root:  Tempo total treinamento       : 0:14:59.
INFO:root:  Tempo processamento fold: 0:15:08 (h:mm:ss)

INFO:root:Processamendo do fold: 7.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   at√© √©poca 4 e taxa de aprendizagem 1e-05.
INFO:root:Vari√°vel URL_MODELO n√£o setada.
INFO:root:Usando modelo BERT pr√©-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classifica√ß√£o.
Some weights of BertForSequenceClassification were not initialized from the model checkpoint at bert-large-cased and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
INFO:root:Existem 1 GPU(s) dispon√≠veis.
INFO:root:Iremos usar a GPU: Tesla T4.
INFO:root:Pytorch rodando o modelo na GPU.
INFO:root:Carregando o tokenizador BERT do dir

√âpocas:   0%|          | 0/4 [00:00<?, ?√©pocas/s]

INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando avalia√ß√£o do fold 7 na √©poca: 0.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.78890503; Acc: 0.31949458; Rec: 0.01570681; Pre: 0.85714286, F1:0.03084833, vp:   6; vn: 171; fp:   1; fn: 376
INFO:root:   Acur√°cia do fold 7 na √©poca 0: 0.31949458.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.78890503.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:00:22 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f7_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f7_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
tempo_train,‚ñÅ
test_batch_loss,‚ñÜ‚ñÜ‚ñà‚ñÜ‚ñà‚ñÉ‚ñÑ‚ñÉ‚ñÜ‚ñÑ‚ñÑ‚ñÑ‚ñá‚ñÜ‚ñÜ‚ñÇ‚ñá‚ñÑ‚ñÑ‚ñÖ‚ñÖ‚ñÜ‚ñÖ‚ñÇ‚ñá‚ñÜ‚ñÜ‚ñÅ‚ñà‚ñÖ‚ñÖ‚ñÉ‚ñÜ‚ñÖ‚ñÉ

0,1
acuracia,0.31949
do_lower_case,False
fn,376
fp,1
max_seq_len,512
media_test_epoca_loss,0.78891
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 7 na √©poca: 1.


Epoca 1:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.53998594.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:03:46 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 7 na √©poca: 1.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.40340051; Acc: 0.83212996; Rec: 0.93455497; Pre: 0.84000000, F1:0.88475836, vp: 357; vn: 104; fp:  68; fn:  25
INFO:root:   Acur√°cia do fold 7 na √©poca 1: 0.83212996.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.40340051.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:03:54 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f7_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f7_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÜ‚ñÉ‚ñÑ‚ñÉ‚ñÖ‚ñÅ‚ñÉ‚ñÖ‚ñÇ‚ñà‚ñÖ‚ñÉ‚ñÇ‚ñÑ‚ñÉ‚ñÑ‚ñÖ‚ñÉ‚ñÇ‚ñÖ‚ñÅ‚ñÅ‚ñÖ‚ñÅ‚ñÉ‚ñÅ‚ñá‚ñÑ‚ñÖ‚ñÖ‚ñá‚ñÉ‚ñÇ‚ñÑ‚ñá
train_batch_loss,‚ñÜ‚ñÖ‚ñÖ‚ñÖ‚ñÖ‚ñÜ‚ñÜ‚ñÖ‚ñÜ‚ñÜ‚ñá‚ñÑ‚ñÖ‚ñÖ‚ñÖ‚ñÑ‚ñÖ‚ñÑ‚ñÑ‚ñà‚ñÜ‚ñÉ‚ñÜ‚ñÖ‚ñÑ‚ñÑ‚ñà‚ñÉ‚ñÖ‚ñÑ‚ñÑ‚ñÑ‚ñÉ‚ñÉ‚ñÑ‚ñÖ‚ñÇ‚ñÑ‚ñÉ‚ñÅ

0,1
acuracia,0.83213
do_lower_case,False
fn,25
fp,68
max_seq_len,512
media_test_epoca_loss,0.4034
media_train_epoca_loss,0.53999
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 7 na √©poca: 2.


Epoca 2:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.30138442.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:07:25 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 7 na √©poca: 2.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.40802719; Acc: 0.85379061; Rec: 0.90837696; Pre: 0.88295165, F1:0.89548387, vp: 347; vn: 126; fp:  46; fn:  35
INFO:root:   Acur√°cia do fold 7 na √©poca 2: 0.85379061.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.40802719.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:07:33 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f7_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f7_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÉ‚ñÇ‚ñÜ‚ñÑ‚ñÅ‚ñÖ‚ñÑ‚ñÖ‚ñÑ‚ñÑ‚ñÉ‚ñà‚ñÜ‚ñÖ‚ñÜ‚ñá‚ñÖ‚ñÜ‚ñÇ‚ñÅ‚ñÉ‚ñÉ‚ñÜ‚ñÜ‚ñÜ‚ñÑ‚ñá‚ñÑ‚ñÉ‚ñÖ‚ñÇ‚ñÉ‚ñá‚ñÉ‚ñá
train_batch_loss,‚ñÉ‚ñÖ‚ñÖ‚ñÇ‚ñÅ‚ñÉ‚ñÖ‚ñÇ‚ñÉ‚ñÉ‚ñÉ‚ñÉ‚ñÉ‚ñÅ‚ñÇ‚ñÇ‚ñÑ‚ñÑ‚ñÑ‚ñÖ‚ñÉ‚ñÉ‚ñÑ‚ñÇ‚ñÑ‚ñÉ‚ñÉ‚ñÑ‚ñÅ‚ñÉ‚ñÉ‚ñÑ‚ñÑ‚ñÅ‚ñÇ‚ñÅ‚ñÜ‚ñÅ‚ñÑ‚ñà

0,1
acuracia,0.85379
do_lower_case,False
fn,35
fp,46
max_seq_len,512
media_test_epoca_loss,0.40803
media_train_epoca_loss,0.30138
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 7 na √©poca: 3.


Epoca 3:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.13971940.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:11:05 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 7 na √©poca: 3.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.67283185; Acc: 0.82490975; Rec: 0.87696335; Pre: 0.87012987, F1:0.87353325, vp: 335; vn: 122; fp:  50; fn:  47
INFO:root:   Acur√°cia do fold 7 na √©poca 3: 0.82490975.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.67283185.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:11:12 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f7_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f7_BERT_base.csv.


VBox(children=(Label(value='0.023 MB of 0.023 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÑ‚ñÖ‚ñÑ‚ñà‚ñÉ‚ñá‚ñÇ‚ñÉ‚ñÖ‚ñÉ‚ñÇ‚ñÖ‚ñÑ‚ñÖ‚ñÅ‚ñÉ‚ñÖ‚ñÑ‚ñÑ‚ñÅ‚ñÑ‚ñÉ‚ñÜ‚ñÉ‚ñÉ‚ñÑ‚ñÉ‚ñÇ‚ñÑ‚ñÑ‚ñÉ‚ñÑ‚ñÑ‚ñÇ‚ñÜ
train_batch_loss,‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÇ‚ñÑ‚ñÅ‚ñÑ‚ñÅ‚ñà‚ñÅ‚ñÅ‚ñÅ‚ñÑ‚ñÅ‚ñá‚ñÅ‚ñÑ‚ñÇ‚ñÑ‚ñÅ‚ñÑ‚ñÉ‚ñÅ‚ñÇ‚ñÜ‚ñÇ‚ñÅ‚ñÑ‚ñÅ‚ñÅ‚ñÑ‚ñÑ‚ñÅ‚ñÑ‚ñÜ‚ñÅ

0,1
acuracia,0.82491
do_lower_case,False
fn,47
fp,50
max_seq_len,512
media_test_epoca_loss,0.67283
media_train_epoca_loss,0.13972
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 7 na √©poca: 4.


Epoca 4:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.07506422.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:14:43 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 7 na √©poca: 4.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.93978442; Acc: 0.83032491; Rec: 0.86649215; Pre: 0.88502674, F1:0.87566138, vp: 331; vn: 129; fp:  43; fn:  51
INFO:root:   Acur√°cia do fold 7 na √©poca 4: 0.83032491.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.93978442.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:14:51 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f7_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f7_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñá‚ñÅ‚ñÖ‚ñÜ‚ñá‚ñÉ‚ñÉ‚ñá‚ñÇ‚ñÑ‚ñÇ‚ñÖ‚ñÖ‚ñÇ‚ñÑ‚ñÜ‚ñÑ‚ñá‚ñÜ‚ñÇ‚ñà‚ñÉ‚ñÉ‚ñÉ‚ñÉ‚ñÇ‚ñá‚ñÖ‚ñÜ‚ñÉ‚ñÖ‚ñÉ‚ñÅ‚ñÑ‚ñà
train_batch_loss,‚ñÅ‚ñÖ‚ñÅ‚ñÅ‚ñÜ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÑ‚ñÅ‚ñà‚ñÑ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÜ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÉ‚ñÅ‚ñÅ‚ñÅ‚ñÖ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñà‚ñÅ‚ñÅ

0,1
acuracia,0.83032
do_lower_case,False
fn,51
fp,43
max_seq_len,512
media_test_epoca_loss,0.93978
media_train_epoca_loss,0.07506
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:  M√©dia perda(loss) treinamento : 0.26403849.
INFO:root:  M√©dia perda(loss) avalia√ß√£o   : 0.64258980.
INFO:root:  Tempo total treinamento       : 0:14:57.
INFO:root:  Tempo processamento fold: 0:15:06 (h:mm:ss)

INFO:root:Processamendo do fold: 8.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   at√© √©poca 4 e taxa de aprendizagem 1e-05.
INFO:root:Vari√°vel URL_MODELO n√£o setada.
INFO:root:Usando modelo BERT pr√©-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classifica√ß√£o.
Some weights of BertForSequenceClassification were not initialized from the model checkpoint at bert-large-cased and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
INFO:root:Existem 1 GPU(s) dispon√≠veis.
INFO:root:Iremos usar a GPU: Tesla T4.
INFO:root:Pytorch rodando o modelo na GPU.
INFO:root:Carregando o tokenizador BERT do dir

√âpocas:   0%|          | 0/4 [00:00<?, ?√©pocas/s]

INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando avalia√ß√£o do fold 8 na √©poca: 0.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.77957762; Acc: 0.35379061; Rec: 0.01381215; Pre: 0.83333333, F1:0.02717391, vp:   5; vn: 191; fp:   1; fn: 357
INFO:root:   Acur√°cia do fold 8 na √©poca 0: 0.35379061.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.77957762.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:00:22 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f8_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f8_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
tempo_train,‚ñÅ
test_batch_loss,‚ñà‚ñÅ‚ñÑ‚ñÜ‚ñÉ‚ñÖ‚ñÉ‚ñÜ‚ñÉ‚ñÉ‚ñá‚ñÖ‚ñÜ‚ñÅ‚ñá‚ñÉ‚ñÖ‚ñÜ‚ñÉ‚ñÜ‚ñÜ‚ñÜ‚ñÑ‚ñÖ‚ñÜ‚ñÜ‚ñà‚ñÖ‚ñÜ‚ñÜ‚ñá‚ñÜ‚ñÉ‚ñÖ‚ñÖ

0,1
acuracia,0.35379
do_lower_case,False
fn,357
fp,1
max_seq_len,512
media_test_epoca_loss,0.77958
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 8 na √©poca: 1.


Epoca 1:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.51077472.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:03:46 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 8 na √©poca: 1.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.40229658; Acc: 0.81588448; Rec: 0.88397790; Pre: 0.84210526, F1:0.86253369, vp: 320; vn: 132; fp:  60; fn:  42
INFO:root:   Acur√°cia do fold 8 na √©poca 1: 0.81588448.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.40229658.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:03:54 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f8_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f8_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÖ‚ñÉ‚ñÉ‚ñÇ‚ñÖ‚ñà‚ñÜ‚ñÑ‚ñÇ‚ñÑ‚ñÖ‚ñá‚ñÇ‚ñá‚ñÖ‚ñÉ‚ñÖ‚ñÉ‚ñÅ‚ñÖ‚ñÇ‚ñÉ‚ñÇ‚ñÖ‚ñÇ‚ñÇ‚ñÇ‚ñá‚ñÇ‚ñÖ‚ñÜ‚ñÅ‚ñÑ‚ñÑ‚ñà
train_batch_loss,‚ñÖ‚ñÜ‚ñÖ‚ñÖ‚ñÖ‚ñÖ‚ñÑ‚ñÖ‚ñÜ‚ñÜ‚ñÉ‚ñÖ‚ñà‚ñÖ‚ñÖ‚ñÇ‚ñÇ‚ñÉ‚ñÖ‚ñÖ‚ñÇ‚ñÉ‚ñÑ‚ñÜ‚ñÅ‚ñÉ‚ñÑ‚ñÖ‚ñÑ‚ñÉ‚ñÜ‚ñÇ‚ñÑ‚ñÑ‚ñÇ‚ñÖ‚ñÉ‚ñÑ‚ñÇ‚ñÅ

0,1
acuracia,0.81588
do_lower_case,False
fn,42
fp,60
max_seq_len,512
media_test_epoca_loss,0.4023
media_train_epoca_loss,0.51077
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 8 na √©poca: 2.


Epoca 2:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.28856811.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:07:25 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 8 na √©poca: 2.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.62891113; Acc: 0.79422383; Rec: 0.95303867; Pre: 0.78054299, F1:0.85820896, vp: 345; vn:  95; fp:  97; fn:  17
INFO:root:   Acur√°cia do fold 8 na √©poca 2: 0.79422383.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.62891113.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:07:32 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f8_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f8_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.006 MB uploaded\r'), FloatProgress(value=0.676714856967087, max=1.0)‚Ä¶

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñá‚ñÑ‚ñá‚ñÇ‚ñÜ‚ñÖ‚ñá‚ñÑ‚ñÉ‚ñÖ‚ñÅ‚ñÉ‚ñÇ‚ñÇ‚ñÑ‚ñÅ‚ñÅ‚ñÑ‚ñÑ‚ñÖ‚ñÅ‚ñÉ‚ñÑ‚ñá‚ñÇ‚ñá‚ñÉ‚ñá‚ñÇ‚ñÜ‚ñÇ‚ñà‚ñÖ‚ñÑ‚ñá
train_batch_loss,‚ñÜ‚ñÑ‚ñÉ‚ñÇ‚ñÑ‚ñÉ‚ñÉ‚ñÇ‚ñÖ‚ñÖ‚ñÉ‚ñÇ‚ñÜ‚ñÇ‚ñÖ‚ñÉ‚ñá‚ñÖ‚ñÖ‚ñÇ‚ñÜ‚ñÑ‚ñà‚ñÇ‚ñÇ‚ñÇ‚ñÅ‚ñÜ‚ñÇ‚ñÑ‚ñÉ‚ñÉ‚ñÇ‚ñÜ‚ñÑ‚ñÖ‚ñÇ‚ñá‚ñÅ‚ñÅ

0,1
acuracia,0.79422
do_lower_case,False
fn,17
fp,97
max_seq_len,512
media_test_epoca_loss,0.62891
media_train_epoca_loss,0.28857
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 8 na √©poca: 3.


Epoca 3:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.14327015.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:11:02 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 8 na √©poca: 3.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.81458100; Acc: 0.79783394; Rec: 0.94475138; Pre: 0.78801843, F1:0.85929648, vp: 342; vn: 100; fp:  92; fn:  20
INFO:root:   Acur√°cia do fold 8 na √©poca 3: 0.79783394.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.81458100.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:11:09 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f8_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f8_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.006 MB uploaded\r'), FloatProgress(value=0.676660516605166, max=1.0)‚Ä¶

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñà‚ñÑ‚ñÜ‚ñÇ‚ñÖ‚ñÑ‚ñÖ‚ñÇ‚ñÅ‚ñà‚ñÑ‚ñÖ‚ñÉ‚ñÉ‚ñÇ‚ñÅ‚ñÖ‚ñÜ‚ñÖ‚ñÖ‚ñÜ‚ñá‚ñÑ‚ñÜ‚ñÅ‚ñÉ‚ñÉ‚ñÉ‚ñÇ‚ñÉ‚ñÇ‚ñÜ‚ñÑ‚ñÉ‚ñÉ
train_batch_loss,‚ñÅ‚ñÇ‚ñÅ‚ñÇ‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÇ‚ñÑ‚ñÅ‚ñÇ‚ñà‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñÉ‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÅ

0,1
acuracia,0.79783
do_lower_case,False
fn,20
fp,92
max_seq_len,512
media_test_epoca_loss,0.81458
media_train_epoca_loss,0.14327
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 8 na √©poca: 4.


Epoca 4:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.06032488.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:14:41 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 8 na √©poca: 4.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 1.06695030; Acc: 0.81949458; Rec: 0.88397790; Pre: 0.84656085, F1:0.86486486, vp: 320; vn: 134; fp:  58; fn:  42
INFO:root:   Acur√°cia do fold 8 na √©poca 4: 0.81949458.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 1.06695030.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:14:49 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f8_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f8_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÇ‚ñÑ‚ñÉ‚ñà‚ñÇ‚ñÇ‚ñÉ‚ñÜ‚ñà‚ñÇ‚ñÑ‚ñÑ‚ñÖ‚ñÖ‚ñÉ‚ñÅ‚ñÜ‚ñÑ‚ñÑ‚ñÇ‚ñÑ‚ñÉ‚ñÉ‚ñÇ‚ñÑ‚ñÇ‚ñÉ‚ñÖ‚ñÇ‚ñÇ‚ñÑ‚ñÖ‚ñÖ‚ñÅ‚ñá
train_batch_loss,‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñà‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñÅ‚ñÑ‚ñÅ‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÇ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÑ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ

0,1
acuracia,0.81949
do_lower_case,False
fn,42
fp,58
max_seq_len,512
media_test_epoca_loss,1.06695
media_train_epoca_loss,0.06032
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:  M√©dia perda(loss) treinamento : 0.25073447.
INFO:root:  M√©dia perda(loss) avalia√ß√£o   : 0.73846333.
INFO:root:  Tempo total treinamento       : 0:14:55.
INFO:root:  Tempo processamento fold: 0:15:03 (h:mm:ss)

INFO:root:Processamendo do fold: 9.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   at√© √©poca 4 e taxa de aprendizagem 1e-05.
INFO:root:Vari√°vel URL_MODELO n√£o setada.
INFO:root:Usando modelo BERT pr√©-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classifica√ß√£o.
Some weights of BertForSequenceClassification were not initialized from the model checkpoint at bert-large-cased and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
INFO:root:Existem 1 GPU(s) dispon√≠veis.
INFO:root:Iremos usar a GPU: Tesla T4.
INFO:root:Pytorch rodando o modelo na GPU.
INFO:root:Carregando o tokenizador BERT do dir

√âpocas:   0%|          | 0/4 [00:00<?, ?√©pocas/s]

INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando avalia√ß√£o do fold 9 na √©poca: 0.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.79375663; Acc: 0.31768953; Rec: 0.00795756; Pre: 0.42857143, F1:0.01562500, vp:   3; vn: 173; fp:   4; fn: 374
INFO:root:   Acur√°cia do fold 9 na √©poca 0: 0.31768953.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.79375663.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:00:22 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f9_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f9_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
tempo_train,‚ñÅ
test_batch_loss,‚ñÖ‚ñÖ‚ñÉ‚ñÉ‚ñÇ‚ñÉ‚ñÑ‚ñá‚ñÇ‚ñÜ‚ñÑ‚ñÅ‚ñÉ‚ñÉ‚ñÜ‚ñÉ‚ñÜ‚ñÜ‚ñÖ‚ñà‚ñá‚ñÇ‚ñÉ‚ñÜ‚ñÅ‚ñÑ‚ñá‚ñÑ‚ñÑ‚ñÜ‚ñá‚ñÉ‚ñá‚ñÇ‚ñÉ

0,1
acuracia,0.31769
do_lower_case,False
fn,374
fp,4
max_seq_len,512
media_test_epoca_loss,0.79376
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 9 na √©poca: 1.


Epoca 1:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.51772113.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:03:47 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 9 na √©poca: 1.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.46522917; Acc: 0.75992780; Rec: 0.67639257; Pre: 0.95864662, F1:0.79315708, vp: 255; vn: 166; fp:  11; fn: 122
INFO:root:   Acur√°cia do fold 9 na √©poca 1: 0.75992780.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.46522917.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:03:54 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f9_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f9_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÉ‚ñÉ‚ñÇ‚ñÇ‚ñÅ‚ñÜ‚ñÜ‚ñÇ‚ñÅ‚ñÇ‚ñÜ‚ñÜ‚ñÇ‚ñÇ‚ñÇ‚ñÅ‚ñÖ‚ñÇ‚ñÉ‚ñá‚ñÑ‚ñÇ‚ñÖ‚ñÖ‚ñÉ‚ñÇ‚ñÉ‚ñÇ‚ñÅ‚ñÑ‚ñÉ‚ñÉ‚ñÇ‚ñÑ‚ñà
train_batch_loss,‚ñÜ‚ñÜ‚ñÜ‚ñÖ‚ñÖ‚ñÖ‚ñÖ‚ñÑ‚ñÑ‚ñÑ‚ñÖ‚ñÉ‚ñÜ‚ñà‚ñÖ‚ñÑ‚ñá‚ñÑ‚ñÇ‚ñÉ‚ñÑ‚ñÇ‚ñÑ‚ñÑ‚ñÅ‚ñÉ‚ñÑ‚ñÑ‚ñÖ‚ñÇ‚ñÇ‚ñÑ‚ñÅ‚ñÇ‚ñÉ‚ñÇ‚ñÉ‚ñÖ‚ñÉ‚ñÇ

0,1
acuracia,0.75993
do_lower_case,False
fn,122
fp,11
max_seq_len,512
media_test_epoca_loss,0.46523
media_train_epoca_loss,0.51772
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 9 na √©poca: 2.


Epoca 2:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.30641460.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:07:26 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 9 na √©poca: 2.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.35293149; Acc: 0.85018051; Rec: 0.90450928; Pre: 0.87886598, F1:0.89150327, vp: 341; vn: 130; fp:  47; fn:  36
INFO:root:   Acur√°cia do fold 9 na √©poca 2: 0.85018051.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.35293149.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:07:34 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f9_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f9_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñà‚ñÑ‚ñÖ‚ñÇ‚ñÑ‚ñÜ‚ñá‚ñÉ‚ñÑ‚ñÉ‚ñÇ‚ñÑ‚ñÜ‚ñÑ‚ñÜ‚ñÖ‚ñÇ‚ñÉ‚ñÜ‚ñÖ‚ñÑ‚ñÑ‚ñÉ‚ñÜ‚ñÉ‚ñá‚ñÇ‚ñÑ‚ñÖ‚ñÑ‚ñÅ‚ñÜ‚ñÑ‚ñÉ‚ñÇ
train_batch_loss,‚ñÑ‚ñÉ‚ñÖ‚ñÇ‚ñÜ‚ñÉ‚ñÑ‚ñÉ‚ñÇ‚ñÇ‚ñÇ‚ñÑ‚ñÖ‚ñÅ‚ñÇ‚ñÜ‚ñá‚ñÑ‚ñÑ‚ñÑ‚ñÉ‚ñÇ‚ñà‚ñÅ‚ñÉ‚ñÖ‚ñÇ‚ñÇ‚ñÅ‚ñá‚ñÉ‚ñá‚ñÇ‚ñÉ‚ñÖ‚ñÑ‚ñÑ‚ñà‚ñÑ‚ñÇ

0,1
acuracia,0.85018
do_lower_case,False
fn,36
fp,47
max_seq_len,512
media_test_epoca_loss,0.35293
media_train_epoca_loss,0.30641
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 9 na √©poca: 3.


Epoca 3:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.15297665.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:11:05 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 9 na √©poca: 3.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.62661498; Acc: 0.83393502; Rec: 0.80636605; Pre: 0.94117647, F1:0.86857143, vp: 304; vn: 158; fp:  19; fn:  73
INFO:root:   Acur√°cia do fold 9 na √©poca 3: 0.83393502.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.62661498.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:11:13 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f9_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f9_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÜ‚ñÑ‚ñÉ‚ñÉ‚ñà‚ñÇ‚ñÑ‚ñÅ‚ñÇ‚ñá‚ñÜ‚ñÖ‚ñÜ‚ñÇ‚ñÉ‚ñÑ‚ñÖ‚ñÖ‚ñÇ‚ñÜ‚ñÖ‚ñÜ‚ñÉ‚ñÉ‚ñÖ‚ñÖ‚ñÉ‚ñÇ‚ñÑ‚ñÑ‚ñÇ‚ñÑ‚ñÉ‚ñÖ‚ñÉ
train_batch_loss,‚ñÅ‚ñÇ‚ñÅ‚ñÉ‚ñÅ‚ñÅ‚ñÖ‚ñÅ‚ñÅ‚ñÅ‚ñÑ‚ñÉ‚ñà‚ñÅ‚ñÉ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñÑ‚ñÅ‚ñá‚ñÑ‚ñÉ‚ñÇ‚ñÅ‚ñÇ‚ñÅ‚ñÑ‚ñÅ‚ñÅ‚ñÅ‚ñÇ‚ñÖ‚ñÉ‚ñÇ‚ñÑ

0,1
acuracia,0.83394
do_lower_case,False
fn,73
fp,19
max_seq_len,512
media_test_epoca_loss,0.62661
media_train_epoca_loss,0.15298
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 9 na √©poca: 4.


Epoca 4:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.07143612.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:14:46 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 9 na √©poca: 4.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.76383875; Acc: 0.85920578; Rec: 0.90716180; Pre: 0.88831169, F1:0.89763780, vp: 342; vn: 134; fp:  43; fn:  35
INFO:root:   Acur√°cia do fold 9 na √©poca 4: 0.85920578.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.76383875.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:08.
INFO:root:   Tempo parcial do processamento            : 0:14:54 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f9_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_f9_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñà‚ñÑ‚ñÉ‚ñÑ‚ñÉ‚ñÅ‚ñÖ‚ñÅ‚ñà‚ñÉ‚ñÖ‚ñÑ‚ñÜ‚ñÉ‚ñÖ‚ñÉ‚ñÜ‚ñÉ‚ñÜ‚ñÜ‚ñÉ‚ñÖ‚ñÖ‚ñÑ‚ñÖ‚ñÖ‚ñÑ‚ñÉ‚ñÑ‚ñÇ‚ñà‚ñÖ‚ñÉ‚ñÜ‚ñÑ
train_batch_loss,‚ñÅ‚ñÅ‚ñÑ‚ñÅ‚ñà‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñÑ‚ñÑ‚ñÜ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñá‚ñÅ‚ñÅ‚ñÜ‚ñÅ‚ñÅ‚ñÑ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÑ‚ñÇ‚ñÜ‚ñÅ‚ñÖ

0,1
acuracia,0.85921
do_lower_case,False
fn,35
fp,43
max_seq_len,512
media_test_epoca_loss,0.76384
media_train_epoca_loss,0.07144
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:08


INFO:root:  M√©dia perda(loss) treinamento : 0.26213712.
INFO:root:  M√©dia perda(loss) avalia√ß√£o   : 0.60047420.
INFO:root:  Tempo total treinamento       : 0:14:59.
INFO:root:  Tempo processamento fold: 0:15:08 (h:mm:ss)

INFO:root:Processamendo do fold: 10.
INFO:root:   com o modelo: bert-large-cased
INFO:root:   at√© √©poca 4 e taxa de aprendizagem 1e-05.
INFO:root:Vari√°vel URL_MODELO n√£o setada.
INFO:root:Usando modelo BERT pr√©-treinado.
INFO:root:Carregando o modelo BERT da comunidade bert-large-cased para classifica√ß√£o.
Some weights of BertForSequenceClassification were not initialized from the model checkpoint at bert-large-cased and are newly initialized: ['classifier.bias', 'classifier.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
INFO:root:Existem 1 GPU(s) dispon√≠veis.
INFO:root:Iremos usar a GPU: Tesla T4.
INFO:root:Pytorch rodando o modelo na GPU.
INFO:root:Carregando o tokenizador BERT do di

√âpocas:   0%|          | 0/4 [00:00<?, ?√©pocas/s]

INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando avalia√ß√£o do fold 10 na √©poca: 0.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.79898010; Acc: 0.30505415; Rec: 0.02056555; Pre: 0.66666667, F1:0.03990025, vp:   8; vn: 161; fp:   4; fn: 381
INFO:root:   Acur√°cia do fold 10 na √©poca 0: 0.30505415.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.79898010.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:00:22 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f10_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f10_BERT_base.csv.


VBox(children=(Label(value='0.023 MB of 0.023 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
tempo_train,‚ñÅ
test_batch_loss,‚ñÜ‚ñÅ‚ñÜ‚ñÖ‚ñÉ‚ñÉ‚ñÑ‚ñà‚ñÅ‚ñÉ‚ñÑ‚ñÑ‚ñÑ‚ñÑ‚ñÖ‚ñÖ‚ñÑ‚ñÑ‚ñÅ‚ñá‚ñá‚ñÉ‚ñÜ‚ñÑ‚ñÑ‚ñÉ‚ñÉ‚ñÅ‚ñÅ‚ñà‚ñÖ‚ñÉ‚ñÉ‚ñÖ‚ñÖ

0,1
acuracia,0.30505
do_lower_case,False
fn,381
fp,4
max_seq_len,512
media_test_epoca_loss,0.79898
media_train_epoca_loss,0
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 10 na √©poca: 1.


Epoca 1:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.54348558.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:03:47 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 10 na √©poca: 1.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.42995625; Acc: 0.81588448; Rec: 0.92544987; Pre: 0.83140878, F1:0.87591241, vp: 360; vn:  92; fp:  73; fn:  29
INFO:root:   Acur√°cia do fold 10 na √©poca 1: 0.81588448.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.42995625.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:03:54 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f10_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_f10_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÅ‚ñÉ‚ñÜ‚ñÖ‚ñÉ‚ñá‚ñÜ‚ñá‚ñá‚ñÉ‚ñÅ‚ñá‚ñá‚ñÉ‚ñÑ‚ñÑ‚ñÜ‚ñÑ‚ñÑ‚ñÑ‚ñÑ‚ñá‚ñÖ‚ñÉ‚ñÇ‚ñÜ‚ñÜ‚ñá‚ñÉ‚ñÑ‚ñÑ‚ñÖ‚ñÅ‚ñá‚ñà
train_batch_loss,‚ñÜ‚ñÜ‚ñÑ‚ñÜ‚ñÑ‚ñá‚ñÜ‚ñÜ‚ñá‚ñÜ‚ñÖ‚ñÉ‚ñà‚ñá‚ñá‚ñÑ‚ñÑ‚ñÑ‚ñÑ‚ñÑ‚ñÜ‚ñÅ‚ñà‚ñÜ‚ñÇ‚ñÖ‚ñÅ‚ñÑ‚ñÑ‚ñÇ‚ñÇ‚ñÇ‚ñÇ‚ñÑ‚ñà‚ñÑ‚ñÉ‚ñÅ‚ñÖ‚ñÑ

0,1
acuracia,0.81588
do_lower_case,False
fn,29
fp,73
max_seq_len,512
media_test_epoca_loss,0.42996
media_train_epoca_loss,0.54349
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 10 na √©poca: 2.


Epoca 2:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.30956295.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:13.
INFO:root:   Tempo parcial processamento               : 0:07:26 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 10 na √©poca: 2.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.43408038; Acc: 0.84115523; Rec: 0.93316195; Pre: 0.85411765, F1:0.89189189, vp: 363; vn: 103; fp:  62; fn:  26
INFO:root:   Acur√°cia do fold 10 na √©poca 2: 0.84115523.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.43408038.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:07:34 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f10_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_f10_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÇ‚ñÑ‚ñÉ‚ñÅ‚ñÉ‚ñÑ‚ñÉ‚ñÇ‚ñÑ‚ñÇ‚ñÑ‚ñÇ‚ñÇ‚ñÉ‚ñÅ‚ñÉ‚ñÉ‚ñÇ‚ñÉ‚ñÉ‚ñÉ‚ñÉ‚ñÑ‚ñÑ‚ñÖ‚ñÑ‚ñÅ‚ñÑ‚ñÑ‚ñÉ‚ñÑ‚ñÖ‚ñà‚ñÇ‚ñÑ
train_batch_loss,‚ñÉ‚ñÜ‚ñÉ‚ñÇ‚ñÉ‚ñÉ‚ñÉ‚ñÇ‚ñÅ‚ñÅ‚ñÑ‚ñÉ‚ñÉ‚ñÅ‚ñÇ‚ñÅ‚ñÉ‚ñÑ‚ñà‚ñÑ‚ñÉ‚ñÅ‚ñÖ‚ñÜ‚ñÇ‚ñÑ‚ñÅ‚ñÑ‚ñÅ‚ñÇ‚ñÑ‚ñÇ‚ñÇ‚ñÑ‚ñÅ‚ñÅ‚ñÇ‚ñÉ‚ñÅ‚ñÉ

0,1
acuracia,0.84116
do_lower_case,False
fn,26
fp,62
max_seq_len,512
media_test_epoca_loss,0.43408
media_train_epoca_loss,0.30956
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 10 na √©poca: 3.


Epoca 3:   0%|          | 0/312 [00:00<?, ?lotes/s]

INFO:root:   M√©dia perda(loss) do treinamento da √©poca : 0.13235904.
INFO:root:   Tempo de treinamento da √©poca             : 0:03:12.
INFO:root:   Tempo parcial processamento               : 0:11:06 (h:mm:ss)
INFO:root:Realizando avalia√ß√£o do fold 10 na √©poca: 3.
INFO:root:Criando Lotes Inteligentes de 554 amostras com tamanho de lote 16...
INFO:root:Tokenizando 554 amostra...


Documentos :   0%|          | 0/554 [00:00<?, ?documento/s]

INFO:root:       554 amostras tokenizadas.
INFO:root:       554 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 35 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


Lotes :   0%|          | 0/35 [00:00<?, ?lotes/s]

INFO:root:   Avalia√ß√£o loss: 0.70908121; Acc: 0.83935018; Rec: 0.93573265; Pre: 0.85046729, F1:0.89106487, vp: 364; vn: 101; fp:  64; fn:  25
INFO:root:   Acur√°cia do fold 10 na √©poca 3: 0.83935018.
INFO:root:   M√©dia perda(loss) do avalia√ß√£o da √©poca   : 0.70908121.
INFO:root:   Tempo de avalia√ß√£o da √©poca               : 0:00:07.
INFO:root:   Tempo parcial do processamento            : 0:11:13 (h:mm:ss)
INFO:root:Diret√≥rio local criado: /content/cohquad/Classificacao/.
INFO:root:Arquivo classifica√ß√£o salvo no GCS: cohquad/validacao_classificacao_palavra/kfold/Classificacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f10_BERT_base.csv.
INFO:root:Criando arquivo resultado: cohquad/validacao_classificacao_palavra/kfold/Avaliacao/P_1_K_1/AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_f10_BERT_base.csv.


VBox(children=(Label(value='0.004 MB of 0.004 MB uploaded\r'), FloatProgress(value=1.0, max=1.0)))

0,1
acuracia,‚ñÅ
do_lower_case,‚ñÅ
fn,‚ñÅ
fp,‚ñÅ
max_seq_len,‚ñÅ
media_test_epoca_loss,‚ñÅ
media_train_epoca_loss,‚ñÅ
output_hidden_states,‚ñÅ
test_batch_loss,‚ñÑ‚ñÉ‚ñÑ‚ñÅ‚ñÅ‚ñÅ‚ñÑ‚ñÅ‚ñÑ‚ñÖ‚ñÇ‚ñÑ‚ñÅ‚ñÑ‚ñà‚ñÇ‚ñÜ‚ñÖ‚ñÉ‚ñá‚ñÖ‚ñÑ‚ñÖ‚ñÖ‚ñÖ‚ñÑ‚ñÑ‚ñÑ‚ñÑ‚ñà‚ñÇ‚ñÅ‚ñÅ‚ñÇ‚ñÉ
train_batch_loss,‚ñÉ‚ñÉ‚ñÅ‚ñÇ‚ñÉ‚ñÅ‚ñÉ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñÅ‚ñÜ‚ñÇ‚ñÑ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÉ‚ñÅ‚ñà‚ñÅ‚ñÅ‚ñÖ‚ñÉ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÅ‚ñÑ‚ñÑ‚ñÖ

0,1
acuracia,0.83935
do_lower_case,False
fn,25
fp,64
max_seq_len,512
media_test_epoca_loss,0.70908
media_train_epoca_loss,0.13236
nome_execucao,AjusteFinoCohQuADIne...
output_hidden_states,False
tempo_test,0:00:07


INFO:root:Criando Lotes Inteligentes de 4,987 amostras com tamanho de lote 16...
INFO:root:Tokenizando 4,987 amostra...


Documentos :   0%|          | 0/4987 [00:00<?, ?documento/s]

INFO:root:     4,987 amostras tokenizadas.
INFO:root:     4,987 amostras ap√≥s classifica√ß√£o.
INFO:root:Criando lotes de tamanho 16...
INFO:root:  FEITO - Selecionado 312 lotes.
INFO:root:Preenchendo sequ√™ncias dentro de cada lote...


[34m[1mwandb[0m: Appending key for api.wandb.ai to your netrc file: /root/.netrc


INFO:root:Realizando treinamento do fold 10 na √©poca: 4.


Epoca 4:   0%|          | 0/312 [00:00<?, ?lotes/s]

Buffered data was truncated after reaching the output size limit.

6## 5.3 Carregando a acur√°cia m√©dia das execu√ß√µes

In [76]:
# Import das bibliotecas
from tqdm.notebook import tqdm as tqdm_notebook

#TAXAS_DE_APRENDIZAGEM = [1e-5, 2e-5, 3e-5, 4e-5, 5e-5]
TAXAS_DE_APRENDIZAGEM = [1e-5]

LISTA_EPOCAS = [*range(0,EPOCAS+1)]

# Guarda um resumo das execu√ß√µes
lista_resultado_execucoes = []

# Barra de progresso modelos
modelo_bar = tqdm_notebook(enumerate(NOMES_MODELO), desc=f'Modelos ', unit=f'modelo', total=len(NOMES_MODELO))

# Percorre todos os modelos a serem avaliados
for modelo_i, modelo in modelo_bar:

  # Barra de progresso das taxas de aprendizagem
  taxa_de_aprendizagem_bar = tqdm_notebook(enumerate(TAXAS_DE_APRENDIZAGEM), desc=f'Taxas de aprendizagem ', unit=f'taxa', total=len(TAXAS_DE_APRENDIZAGEM))

  # Executa o treinamento e avalia√ß√£o para diversas taxas de aprendizagem
  for taxas_de_aprendizagem_i, taxa_de_aprendizagem in taxa_de_aprendizagem_bar:

    # Barra de progresso √©pocas
    epoca_bar = tqdm_notebook(enumerate(LISTA_EPOCAS), desc=f'√âpocas ', unit=f'√©poca', total=len(LISTA_EPOCAS))

    # Percorre todos as √©pocas a serem avaliadas
    for epoca_i, epoca in epoca_bar:

      logging.info("\n")
      logging.info("Acur√°cia do modelo: {}".format(modelo))
      logging.info("   com √©poca {} e taxa de treinamento {}.".format(epoca, taxa_de_aprendizagem))

      # Seta o par√¢metro do modelo
      model_args.pretrained_model_name_or_path = modelo

      # Seta o par√¢metro do modelo
      training_args.learning_rate = taxa_de_aprendizagem

      # Seta o par√¢metro do modelo
      model_args.epoca = epoca

      # Monta o nome do arquivo de log
      NOME_ARQUIVO_AVALIACAO =  NOME_BASE_SAIDA + getSufixoNomeArquivoSaida(training_args, model_args)

      # Carrega o resultado
      carregaResultadoAvaliacao(NOME_ARQUIVO_AVALIACAO)

Modelos :   0%|          | 0/1 [00:00<?, ?modelo/s]

Taxas de aprendizagem :   0%|          | 0/1 [00:00<?, ?taxa/s]

√âpocas :   0%|          | 0/5 [00:00<?, ?√©poca/s]

INFO:root:

INFO:root:Acur√°cia do modelo: bert-large-cased
INFO:root:   com √©poca 0 e taxa de treinamento 1e-05.
INFO:root:M√©dia dos arquivos: AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_fX_BERT_base
INFO:root:Arquivo: AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f1_BERT_base, Data: 30/07/2024 18:17, Tempo: 0:00:29, QtdeTeste: 555, Acc: 0.68108108, Rec: 0.97637795, Pre: 0.68888889, F1:0.80781759, vp:  372; vn:    6; fp:  168; fn:    9
INFO:root:Arquivo: AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f2_BERT_base, Data: 30/07/2024 18:32, Tempo: 0:00:21, QtdeTeste: 554, Acc: 0.35740072, Rec: 0.01662050, Pre: 0.85714286, F1:0.03260870, vp:    6; vn:  192; fp:    1; fn:  355
INFO:root:Arquivo: AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_f3_BERT_base, Data: 30/07/2024 18:47, Tempo: 0:00:22, QtdeTeste: 554, Acc: 0.31768953, Rec: 0.00263852, Pre: 1.00000000, F1:0.00526316, vp:    1; vn:  175; fp:    0; fn:  378
INFO:root:A

Resumo da execu√ß√£o

Acur√°cia por √©poca.

In [77]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "e_1" in linha:
    print(linha)

AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_fX_BERT_base;0.7937141834975769;00:39:10


In [78]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_e_2" in linha:
    print(linha)

AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_fX_BERT_base;0.8280082609685497;01:15:35


In [79]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_e_3" in linha:
    print(linha)

AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_fX_BERT_base;0.8305346863108596;01:52:22


In [80]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_e_4" in linha:
    print(linha)

AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_fX_BERT_base;0.8404608579698832;02:29:00


Acur√°cia por taxa de aprendizagem.

In [81]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_lr_1" in linha:
    print(linha)

AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_0_lr_1_b_16_16_fX_BERT_base;0.36720558103229584;00:03:47
AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_1_lr_1_b_16_16_fX_BERT_base;0.7937141834975769;00:39:10
AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_2_lr_1_b_16_16_fX_BERT_base;0.8280082609685497;01:15:35
AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_3_lr_1_b_16_16_fX_BERT_base;0.8305346863108596;01:52:22
AjusteFinoCohQuADInen_C_SB_KF_v1_P_1_K_1_E_4_e_4_lr_1_b_16_16_fX_BERT_base;0.8404608579698832;02:29:00


In [82]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_lr_2" in linha:
    print(linha)

In [83]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_lr_3" in linha:
    print(linha)

In [84]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_lr_4" in linha:
    print(linha)

In [85]:
for i, linha in enumerate(lista_resultado_execucoes):
  if "_lr_5" in linha:
    print(linha)

# 6 Finaliza√ß√£o

## 6.1 Tempo final de processamento



In [86]:
 # Pega o tempo atual menos o tempo do in√≠cio do processamento.
final_processamento = time.time()
tempo_total_processamento = formataTempo(final_processamento - inicio_processamento)

print("")
print("  Tempo processamento: {:} (h:mm:ss)".format(tempo_total_processamento))


  Tempo processamento: 2:37:39 (h:mm:ss)
