# Etiquetador de datos para ajustar un clasificador con Hugging Face
### PLN - ACT 02
### Equipo D1

### Notas

> Python 3.8.19.

> Entornos conda.

>https://rubrix.readthedocs.io/en/master/tutorials/01-labeling-finetuning.html

> https://rubrix.readthedocs.io/en/master/getting_started/setup%26installation.html


In [69]:
# Crear entorno con conda
#!conda create -n pln_act2 python=3.8
#!conda activate pln_act2

## Instalar librerias necesarias

> transformers[torch] : Biblioteca de Hugging Face para trabajar con modelos de procesamiento de lenguaje natural (NLP).

> datasets: Biblioteca de Hugging Face que facilita la carga y gestión de conjuntos de datos para tareas de aprendizaje automático y NLP.

> sklearn (scikit-learn): Biblioteca de aprendizaje automático de Python que ofrece herramientas simples y eficientes para el análisis de datos y la minería de datos. Incluye algoritmos para clasificación, regresión, clustering, preprocesamiento de datos y evaluación de modelos.

> ipywidgets: Biblioteca que permite la creación de widgets interactivos en Jupyter Notebooks y JupyterLab. Estos widgets permiten construir interfaces de usuario interactivas para explorar y visualizar datos, así como interactuar con modelos y resultados en tiempo real.


In [2]:
# AL TENER UN ENTORNO ESTE ESTA VACÍO - INSTALAR LIBRERIAS
#!pip install transformers[torch] datasets sklearn ipywidgets -qqq

# Datasets de Hugging Face
#!pip install datasets

#!pip install transformers torch 

# Introducción
Ajustar un clasificador de sentimientos para dominio propio, comenzando sin datos etiquetados.

### Conjunto de datos: Banking 77
- Este conjunto de datos contiene consultas de usuarios de banca en línea anotadas con sus intenciones correspondientes.

- En nuestro caso, weizll etiquetar el sentimiento de estas consultas. Esto podría ser útil para asistentes digitales y análisis de servicio al cliente.

Permite cargar el conjunto de datos directamente desde el concentrador y dividir el conjunto de datos en dos subconjuntos del 50. Weothll empezar con el to_label1 dividir para la exploración de datos y anotación, y mantener to_label2 para más iteraciones.

In [5]:
# Utilizar data sets y separar
from datasets import load_dataset

# Cargar el conjunto de datos "banking77" desde datasets de Hugging Face
banking_ds = load_dataset("banking77")

# Dividir el conjunto de entrenamiento en dos partes (to_label1 y to_label2)
# train_test_split divide el conjunto de entrenamiento en train y test sets
# con test_size=0.5 especificamos que el 50% del conjunto de entrenamiento se usará como test set
# seed=42 asegura que la división sea reproducible
to_label1, to_label2 = banking_ds['train'].train_test_split(test_size=0.5, seed=42).values()

In [6]:
from transformers import pipeline

# Cargar un clasificador de sentimientos utilizando DistilBERT preentrenado en SST-2
sentiment_classifier = pipeline(
    model="distilbert-base-uncased-finetuned-sst-2-english", # Modelo preentrenado específico
    task="sentiment-analysis",  # Tarea específica: análisis de sentimientos
    return_all_scores=True,# Devolver todos los puntajes de clases posibles
)

# Acceder al texto del tercer ejemplo en to_label1 y clasificar su sentimiento
to_label1[3]['text'], sentiment_classifier(to_label1[3]['text'])

text_example = to_label1[3]['text']
classified_sentiment = sentiment_classifier(text_example)

# Imprimir el texto y los resultados del clasificador de sentimientos
print("Texto:", text_example)
print("Resultados de Sentimiento:", classified_sentiment)




Texto: Hi, Last week I have contacted the seller for a refund as directed by you, but i have not received the money yet. Please look into this issue with seller and help me in getting the refund.
Resultados de Sentimiento: [[{'label': 'NEGATIVE', 'score': 0.9934700727462769}, {'label': 'POSITIVE', 'score': 0.006529910024255514}]]


# 1. Corre el modelo pre-entrenado sobre el conjunto de datos y registre las predicciones
Como primer paso, los permisos utilizan el modelo pre-entrenado para predecir sobre nuestro conjunto de datos sin procesar. Para esto, usaremos la práctica dataset.map método de la datasets biblioteca.

In [7]:
# Utiliza el clasificador de sentimientos para predecir los sentimientos en el texto dado
# El parámetro `truncation=True` indica que se debe truncar el texto si es demasiado largo
def predict(examples):
    return {"predictions": sentiment_classifier(examples['text'], truncation=True)}

# add .select(range(10)) before map if you just want to test this quickly with 10 examples
to_label1 = to_label1.map(predict, batched=True, batch_size=4)

###   Instalación del servidor de Argilla

In [19]:
# Descargar Argilla
!pip install argilla


# Iniciar servidor  
!python -m argilla

# Levantado el servidor 
# http://localhost:6900/datasets
# user: rubrix, password: 1234

# !pip install -U git+https://github.com/argilla-io/argilla.git
#!pip install --upgrade pydantic
#!pip install argilla[all]

# !python -m argilla users create-apikey --username rubrix


^C


In [None]:
# !pip install huggingface_hub

### Obtener token

Logueado en argilla, entrar al network y de cualquier petición obtener el token!
![image.png](attachment:image.png)

In [8]:
import argilla as rg

# Utilizar token obtenido
tokenArgilla = "eyJhbGciOiJIUzI1NiIsInR5cCI6IkpXVCJ9.eyJzdWIiOiJydWJyaXgiLCJleHAiOjE3MjIxNzA5OTR9.VI5vCpf3_BYfw099l7sM6N3WeEhBY1aOSyOY8LiQ8JE"

# Iniciar servidor
rg.init(api_key=tokenArgilla, api_url="http://localhost:6900")


### Crear registros
El siguiente código construye una lista de registros de Rubrix con las predicciones.

In [9]:
#import rubrix as rb -

# Lista vacía para almacenar los registros
records = []

# Itera sobre los ejemplos en to_label1 después de mezclarlos
for example in to_label1.shuffle():
    # Crea un registro de clasificación de texto usando argilla
    record = rg.TextClassificationRecord(
        text=example["text"], 
        # Texto del ejemplo
        metadata={'category': example['label']}, 
        # log the intents for exploration of specific intents
        prediction=[(pred['label'], pred['score']) for pred in example['predictions']], 
        # Predicciones del ejemplo, una lista de tuplas (etiqueta, puntaje)
        prediction_agent="distilbert-base-uncased-finetuned-sst-2-english" 
        # Agente de predicción utilizado, en este caso, el modelo específico de DistilBERT
    )
    
    # Agrega el registro a la lista de registros
    records.append(record)
    
    # Ahora `records` contiene una lista de objetos `TextClassificationRecord` listos para ser utilizados o almacenados.


### Almacenar los datos en Huggins Face

> Registrarse

> Crear New Space: https://huggingface.co/new-space

> Con el Space creado obtener la url del hub

![image.png](attachment:image.png)

> Generar token: https://huggingface.co/settings/tokens utilizado para acceder a la cuenta de usuario creada en Huggins Face

Crear token del tipo: Write
![image-2.png](attachment:image-2.png)




In [11]:

# Crea un DatasetForTextClassification en Argilla
dataset_rb = rg.DatasetForTextClassification(records)

# Convierte el DatasetForTextClassification a un objeto Dataset de datasets library
dataset_ds = dataset_rb.to_datasets()

HuggingsFaceHub = "DenisFZelaya/sentiment-banking"
HuggingsFaceHubTokenUser = "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"

# Push the dataset to Hugging Face Hub, antes haber creado un workspace en hugging face
dataset_ds.push_to_hub(HuggingsFaceHub, token=HuggingsFaceHubTokenUser)

Creating parquet from Arrow format: 100%|██████████| 6/6 [00:00<00:00, 209.24ba/s]
Uploading the dataset shards: 100%|██████████| 1/1 [00:00<00:00,  2.89it/s]


CommitInfo(commit_url='https://huggingface.co/datasets/DenisFZelaya/sentiment-banking/commit/ccae1c0b8362168642b4150ec35b4e7d78546824', commit_message='Upload dataset', commit_description='', oid='ccae1c0b8362168642b4150ec35b4e7d78546824', pr_url=None, pr_revision=None, pr_num=None)

Después de empujar el conjunto de datos al concentrador, simplemente puede recuperarlo a través de load_dataset y rb.read_datasets.

In [12]:
# Cargar el conjunto de datos desde Hugging Face Hub
dataset_ds = load_dataset(HuggingsFaceHub, split="train")

# Leer el conjunto de datos utilizando argilla y especificar la tarea como "TextClassification"
dataset_rb = rg.read_datasets(dataset_ds, task="TextClassification")

# Ahora `dataset_rb` es un conjunto de datos en el formato compatible con argilla

Downloading readme: 100%|██████████| 871/871 [00:00<00:00, 686kB/s]
Downloading data: 100%|██████████| 451k/451k [00:01<00:00, 429kB/s]
Generating train split: 100%|██████████| 5001/5001 [00:00<00:00, 231888.59 examples/s]


### Registro
Ahora permite registrar los registros en Rubrix para explorar el conjunto de datos y etiquetar nuestro primer conjunto de entrenamiento.

In [13]:
# Registrar los registros en argilla bajo el nombre 'labeling_with_pretrained' en nuestro servidor de Argilla
rg.log(name='labeling_with_pretrained', records=dataset_rb)

100%|██████████| 5001/5001 [00:43<00:00, 115.66it/s]

5001 records logged to http://localhost:6900/datasets/rubrix/labeling_with_pretrained





BulkResponse(dataset='labeling_with_pretrained', processed=5001, failed=0)

In [14]:
# Envía los registros al servidor de Argilla - propio no necesario
rg.log(records, name='banking77')

print(f"Se han enviado {len(records)} registros a Argilla.")

  0%|          | 0/5001 [00:00<?, ?it/s]

100%|██████████| 5001/5001 [00:43<00:00, 114.89it/s]

5001 records logged to http://localhost:6900/datasets/rubrix/banking77
Se han enviado 5001 registros a Argilla.





# 2. Explore y etiquete los datos con el modelo preentrenado
En este paso, comenzaremos explorando cómo se está desempeñando el modelo pre-entrenado con nuestro conjunto de datos.

Teniendo en cuenta este análisis, podemos empezar a etiquetar nuestros datos.

![image-2.png](attachment:image-2.png)

# 3. Ajuste el modelo pre-entrenado
En este paso, se cargará nuestro conjunto de entrenamiento desde Rubrix y ajustará utilizando el Trainer API de Hugging Face transformers. Para esto, seguimos de cerca la guía Ajustar un modelo pre-entrenado de la transformers docs.

![image.png](attachment:image.png)

In [15]:
# Cargar el conjunto de datos desde argilla con una consulta específica
rb_dataset = rg.load(name='labeling_with_pretrained', query="status:Validated")

# Cargar el conjunto de datos desde argilla con una consulta específica
rb_dataset.to_pandas().head(3)

# Convertir el conjunto de datos a un DataFrame de pandas y mostrar las primeras 3 filas
df = rb_dataset.to_pandas()
df.head(3)


Unnamed: 0,text,inputs,prediction,prediction_agent,annotation,annotation_agent,multi_label,explanation,id,metadata,status,event_timestamp,metrics,search_keywords
0,I've made a horrible mistake! I transferred m...,{'text': 'I've made a horrible mistake! I tra...,"[(NEGATIVE, 0.9997112154960632), (POSITIVE, 0....",distilbert-base-uncased-finetuned-sst-2-english,NEGATIVE,rubrix,False,,000313a8-e225-4043-9cae-cd34c9beb148,{'category': 8},Validated,,{'text_length': 163},
1,How do I replace my card?,{'text': 'How do I replace my card?'},"[(NEGATIVE, 0.9991331696510315), (POSITIVE, 0....",distilbert-base-uncased-finetuned-sst-2-english,NEGATIVE,rubrix,False,,0007648f-4e4a-4c08-a216-eccec9f1ec26,{'category': 9},Validated,,{'text_length': 25},
2,"I got double charged from something, what can ...","{'text': 'I got double charged from something,...","[(NEGATIVE, 0.9919479489326477), (POSITIVE, 0....",distilbert-base-uncased-finetuned-sst-2-english,NEGATIVE,rubrix,False,,0028fb53-4df5-4125-a2fc-873a86483f5c,{'category': 63},Validated,,{'text_length': 51},


### Preparar conjuntos de datos de entrenamiento y prueba
Ahora preparemos nuestro conjunto de datos para entrenar y probar nuestro clasificador de sentimientos, utilizando el datasets biblioteca:

In [16]:
# Preparar el conjunto de datos para entrenamiento
train_ds = rb_dataset.prepare_for_training()

In [17]:
train_ds

Dataset({
    features: ['text', 'label'],
    num_rows: 20
})

In [18]:
from transformers import AutoTokenizer

# Cargar el tokenizador preentrenado
tokenizer = AutoTokenizer.from_pretrained("distilbert-base-uncased-finetuned-sst-2-english")

def tokenize_function(examples):
    # Tokenizar los textos en los ejemplos, aplicando padding y truncamiento
    return tokenizer(examples["text"], padding="max_length", truncation=True)

# Aplicar la función de tokenización al conjunto de datos de entrenamiento en lotes
tokenized_train_ds = train_ds.map(tokenize_function, batched=True)

Map: 100%|██████████| 20/20 [00:00<00:00, 1620.71 examples/s]


In [19]:
# split the data into a training and evaluation set
train_dataset, eval_dataset = tokenized_train_ds.train_test_split(test_size=0.2, seed=42).values()

### Entrena a nuestro clasificador de sentimientos
Como mencionamos antes, vamos a afinar el distilbert-base-uncased-finetuned-sst-2-english modelo. Otra opción será afinar un modelo de lenguaje enmascarado de Distilbert desde cero, pero te dejamos este experimento.

In [20]:
from transformers import AutoModelForSequenceClassification

# Cargar el modelo
model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased-finetuned-sst-2-english")

In [23]:
#!pip install accelerate===0.21.0 -U
# !pip install transformers[torch]
# !pip install --upgrade transformers datasets
# !pip install setfit
#!pip install evaluate
!python -c "import evaluate; print(evaluate.load('exact_match').compute(references=['hello'], predictions=['hello']))"

{'exact_match': 1.0}



Downloading builder script:   0%|          | 0.00/5.67k [00:00<?, ?B/s]
Downloading builder script: 100%|██████████| 5.67k/5.67k [00:00<00:00, 3.75MB/s]


In [21]:
import numpy as np
from datasets import load_metric
from transformers import TrainingArguments, Trainer
import evaluate

# Configurar argumentos de entrenamiento
training_args = TrainingArguments(
    output_dir="./results",
    eval_strategy="epoch",
    logging_steps=30,
    per_device_train_batch_size=8,
    per_device_eval_batch_size=8,
    num_train_epochs=3,
)

# load_metric("accuracy")
metric = evaluate.load("accuracy")

# Definir función para calcular métricas
def compute_metrics2(pred):
    # Ejemplo de cómo calcular la exactitud
    labels = pred.label_ids
    preds = pred.predictions.argmax(-1)
    accuracy = (preds == labels).mean()
    return {"accuracy": accuracy}

def compute_metrics(eval_pred):
    logits, labels = eval_pred
    predictions = np.argmax(logits, axis=-1)
    return metric.compute(predictions=predictions, references=labels)


In [22]:
trainer = Trainer(
    args=training_args,
    model=model,
    train_dataset=train_dataset,
    eval_dataset=eval_dataset,
    compute_metrics=compute_metrics,
)

In [24]:
# Entrenar el modelo utilizando el entrenador previamente configurado
trainer.train()

                                             
 33%|███▎      | 2/6 [00:34<01:00, 15.18s/it]

{'eval_loss': 0.001007280545309186, 'eval_accuracy': 1.0, 'eval_runtime': 4.0243, 'eval_samples_per_second': 0.994, 'eval_steps_per_second': 0.248, 'epoch': 1.0}


                                             
 67%|██████▋   | 4/6 [01:09<00:32, 16.49s/it]

{'eval_loss': 0.0007136391941457987, 'eval_accuracy': 1.0, 'eval_runtime': 3.9973, 'eval_samples_per_second': 1.001, 'eval_steps_per_second': 0.25, 'epoch': 2.0}


                                             
100%|██████████| 6/6 [01:45<00:00, 17.62s/it]

{'eval_loss': 0.0007225737790577114, 'eval_accuracy': 1.0, 'eval_runtime': 4.1636, 'eval_samples_per_second': 0.961, 'eval_steps_per_second': 0.24, 'epoch': 3.0}
{'train_runtime': 105.7254, 'train_samples_per_second': 0.454, 'train_steps_per_second': 0.057, 'train_loss': 0.1839291254679362, 'epoch': 3.0}





TrainOutput(global_step=6, training_loss=0.1839291254679362, metrics={'train_runtime': 105.7254, 'train_samples_per_second': 0.454, 'train_steps_per_second': 0.057, 'total_flos': 6358435135488.0, 'train_loss': 0.1839291254679362, 'epoch': 3.0})

# 4. Prueba del modelo afinado
En este paso, primero probemos el modelo que acabamos de entrenar.

Vamos a crear una nueva tubería con nuestro modelo:

In [23]:
#!pip install transformers accelerate --upgrade


In [27]:
# Definir el clasificador de sentimientos finetuned_sentiment_classifier
finetuned_sentiment_classifier = pipeline(
    model=model.to("cpu"), # Utiliza el modelo definido, moviéndolo a la CPU si estaba en GPU
    tokenizer=tokenizer,
    task="sentiment-analysis",
    return_all_scores=True # Devuelve todos los puntajes de clasificación
)



In [28]:
#Luego, podemos comparar sus predicciones con el modelo pre-entrenado y un ejemplo:
finetuned_sentiment_classifier(
    'I need to deposit my virtual card, how do i do that.'
), sentiment_classifier(
    'I need to deposit my virtual card, how do i do that.'
)

([[{'label': 'NEGATIVE', 'score': 0.9988963603973389},
   {'label': 'POSITIVE', 'score': 0.0011036305222660303}]],
 [[{'label': 'NEGATIVE', 'score': 0.9992493987083435},
   {'label': 'POSITIVE', 'score': 0.0007506064721383154}]])

Como puede ver, nuestro modelo ajustado ahora clasifica estas preguntas generales (no relacionadas con problemas o problemas) como POSITIVE, mientras que el modelo pre-entrenado todavía clasifica esto como NEGATIVE.

Veamos ahora un ejemplo relacionado con un problema en el que ambos modelos funcionan como se esperaba:

In [29]:
# Llamada al clasificador finetuned_sentiment_classifier con un ejemplo de texto
finetuned_sentiment_classifier(
    'Why is my payment still pending?'
), sentiment_classifier(
    'Why is my payment still pending?'
)

([[{'label': 'NEGATIVE', 'score': 0.9988934397697449},
   {'label': 'POSITIVE', 'score': 0.001106548123061657}]],
 [[{'label': 'NEGATIVE', 'score': 0.9983781576156616},
   {'label': 'POSITIVE', 'score': 0.00162184564396739}]])

# 5. Corre nuestro modelo afinado sobre el conjunto de datos y registre las predicciones
Ahora creamos un conjunto de datos de los registros restantes (aquellos que no hemos anotado en la primera sesión de anotación).

Weothll hacer esto usando el Default estado, lo que significa que al registro no se le ha asignado una etiqueta.

In [30]:
# Cargar un conjunto de datos etiquetado en Argilla con estado "Default
rb_dataset = rg.load(name='labeling_with_pretrained', query="status:Default")

In [31]:
# Definir una función para predecir las etiquetas de ejemplos
def predict(examples):
    
    # Extraer los textos de entrada de cada ejemplo
    texts = [example["text"] for example in examples["inputs"]]
    
    # Realizar las predicciones usando el modelo `finetuned_sentiment_classifier`
    return {
        "prediction": finetuned_sentiment_classifier(texts), # Predicciones de sentimiento para los textos
        "prediction_agent": ["distilbert-base-uncased-banking77-sentiment"]*len(texts)  # Agente de predicción usado
    }

# Mapear la función predict sobre el dataset `rb_dataset` transformado a datasets
# Esto procesa en lotes de tamaño 8 (batched=True) para eficiencia
ds_dataset = rb_dataset.to_datasets().map(predict, batched=True, batch_size=8)

Map: 100%|██████████| 14983/14983 [09:40<00:00, 25.82 examples/s]


In [32]:
# Leer el dataset desde Argilla, asumiendo que `ds_dataset` es el nombre del dataset en Argilla
records = rg.read_datasets(ds_dataset, task="TextClassification")

# Guardar los registros en Argilla con el nombre "labeling_with_finetuned"
rg.log(records=records, name='labeling_with_finetuned')

100%|██████████| 14983/14983 [02:01<00:00, 123.61it/s]

14983 records logged to http://localhost:6900/datasets/rubrix/labeling_with_finetuned





BulkResponse(dataset='labeling_with_finetuned', processed=14983, failed=0)

# 6. Explore y etiquete los datos con el modelo ajustado
En este paso, comenzaremos explorando cómo se está desempeñando el modelo ajustado con nuestro conjunto de datos.

A primera vista, utilizando lo predicho como filtro por POSITIVE y luego por NEGATIVE, podemos observar que las predicciones del modelo afinado están más alineadas con nuestra política de anotación “”.

Ahora que el modelo se está desempeñando mejor para nuestro caso de uso, weizll ampliará nuestro conjunto de capacitación con ejemplos altamente informativos. Un flujo de trabajo típico para hacer esto es el siguiente:

Utilice el filtro de puntuación de predicción para etiquetar ejemplos inciertos.

Ejemplos de etiquetas predichos por nuestro modelo afinado como POSITIVE y luego predijo como NEGATIVE para corregir las predicciones.

Después de pasar unos minutos, etiquetamos casi 2% de nuestro conjunto de datos sin procesar con alrededor de 80 ejemplos anotados, que es un pequeño conjunto de datos, pero con suerte con ejemplos altamente informativos.

Dataset creado en Argilla

![image.png](attachment:image.png)

# 7. Ajuste con el conjunto de datos de entrenamiento extendido
En este paso, weizll agregará los nuevos ejemplos a nuestro conjunto de capacitación y ajustará una nueva versión de nuestro clasificador de sentimientos bancarios.

In [33]:
# Cargar el dataset etiquetado desde Argilla
rb_dataset = rg.load("labeling_with_finetuned")

# Preparar el dataset para entrenamiento
train_ds = rb_dataset.prepare_for_training()

# Aplicar la función de tokenización al dataset preparado, procesando por lotes
tokenized_train_ds = train_ds.map(tokenize_function, batched=True)

In [34]:
from datasets import concatenate_datasets

# Concatenar los conjuntos de datos `train_dataset` y `tokenized_train_ds`
train_dataset = concatenate_datasets([train_dataset, tokenized_train_ds])

### Entrenando a nuestro clasificador de sentimientos
Como queremos medir el efecto de agregar ejemplos a nuestro conjunto de entrenamiento, lo haremos:

- Ajuste de los pesos de sentimiento pre-entrenados (como lo hicimos antes)

- Utilice el conjunto de pruebas anterior y el conjunto de trenes extendido (obteniendo una métrica que utilizamos para comparar esta nueva versión con nuestro modelo anterior)

In [35]:
from transformers import AutoModelForSequenceClassification

# Cargar el modelo preentrenado para clasificación de secuencias
model = AutoModelForSequenceClassification.from_pretrained("distilbert-base-uncased-finetuned-sst-2-english")

In [37]:
# Mezclar el conjunto de datos de entrenamiento
train_ds = train_dataset.shuffle(seed=42)

# Crear el objeto Trainer para entrenar el modelo
trainer = Trainer(
    args=training_args,
    model=model,
    train_dataset=train_dataset,
    eval_dataset=eval_dataset,
    compute_metrics=compute_metrics,
)

# Iniciar el entrenamiento del modelo
trainer.train()

 33%|███▎      | 2/6 [00:30<01:01, 15.44s/it]
 33%|███▎      | 2/6 [00:35<01:01, 15.44s/it]

{'eval_loss': 0.001007280545309186, 'eval_accuracy': 1.0, 'eval_runtime': 4.2282, 'eval_samples_per_second': 0.946, 'eval_steps_per_second': 0.237, 'epoch': 1.0}


 67%|██████▋   | 4/6 [01:09<00:35, 17.51s/it]
 67%|██████▋   | 4/6 [01:13<00:35, 17.51s/it]

{'eval_loss': 0.0007136391941457987, 'eval_accuracy': 1.0, 'eval_runtime': 4.0949, 'eval_samples_per_second': 0.977, 'eval_steps_per_second': 0.244, 'epoch': 2.0}


100%|██████████| 6/6 [01:44<00:00, 17.47s/it]
100%|██████████| 6/6 [01:52<00:00, 18.70s/it]

{'eval_loss': 0.0007225737790577114, 'eval_accuracy': 1.0, 'eval_runtime': 3.9243, 'eval_samples_per_second': 1.019, 'eval_steps_per_second': 0.255, 'epoch': 3.0}
{'train_runtime': 112.2208, 'train_samples_per_second': 0.428, 'train_steps_per_second': 0.053, 'train_loss': 0.1839291254679362, 'epoch': 3.0}





TrainOutput(global_step=6, training_loss=0.1839291254679362, metrics={'train_runtime': 112.2208, 'train_samples_per_second': 0.428, 'train_steps_per_second': 0.053, 'total_flos': 6358435135488.0, 'train_loss': 0.1839291254679362, 'epoch': 3.0})

In [38]:
# Guardar el modelo entrenado en el directorio especificado
model.save_pretrained("distilbert-base-uncased-sentiment-banking")

: 

Resumen
En este tutorial, aprendimos a construir un conjunto de entrenamiento desde cero con la ayuda de un modelo pre-entrenado, realizando dos iteraciones de predict > log > label.

Este flujo de trabajo se puede aplicar a proyectos para adaptar los modelos existentes o construirlos desde cero.

En este tutorial, se cubrió una forma de construir conjuntos de entrenamiento: etiquetado manual.
