<a href="https://colab.research.google.com/github/davinnnnn/Fine-tuning/blob/main/pytorch_2_0_bert_text_classification.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## PyTorch 2.0 및 Hugging Face Transformers 시작하기

2022년 12월 2일, PyTorch 팀은 PyTorch 컨퍼런스에서 더 나은 성능, 더 빠른 속도, 더 파이썬스러운 방식 및 이전과 같이 동적인 특징을 중점으로 한 PyTorch 2.0을 발표했습니다.

이 블로그 글에서는 오늘날의 PyTorch 2.0 및 Hugging Face Transformers를 시작하는 방법을 설명합니다. 이는 가장 최신의 PyTorch 2.0 기능을 사용하여 텍스트 분류를 위한 BERT 모델을 미세 조정하는 방법을 다룰 것입니다.

여러분은 다음을 배울 수 있습니다:

1. 환경 설정 및 Pytorch 2.0 설치
2. 데이터셋 불러오기 및 준비
3. Hugging Face `Trainer`를 사용하여 BERT 모델 미세 조정 및 평가
4. 추론 실행 및 모델 테스트

시작하기 전에, 아티팩트와 실험을 저장하기 위한 **[Hugging Face 계정](https://huggingface.co/join)**이 있는지 확인하세요.

## Pytorch 2.0 간략 소개

PyTorch 2.0 (또는 정확히는 1.14)는 완전히 하위 호환됩니다. Pytorch 2.0은 기존의 PyTorch 코드를 수정할 필요는 없지만 `model = torch.compile(model)`의 한 줄의 코드를 추가함으로써 코드를 최적화할 수 있습니다.
새로운 주요 버전이 있으면서 왜 중대한 변경 사항이 없는지 궁금하실 수 있는데, PyTorch 팀은 이 질문에 [FAQ](https://pytorch.org/get-started/pytorch-2.0/#faqs)에서 다음과 같이 답했습니다: *“PyTorch의 사용 방식에 의미있는 변화를 가져올 것이라고 생각하는 중요한 새로운 기능들을 출시하고 있기 때문에, 우리는 이를 2.0으로 부르기로 했습니다.”*

이러한 새로운 기능들은 TorchDynamo, AOTAutograd, PrimTorch 및 TorchInductor에 대한 최상위 지원을 포함합니다.

이를 통해 PyTorch 2.0은 [HuggingFace Transformers의 현재 46개의 모델 아키텍처](https://github.com/pytorch/torchdynamo/issues/681)를 지원하면서 1.3x-2x의 훈련 시간 가속을 달성할 수 있습니다.

PyTorch 2.0에 대해 더 알고 싶다면 공식 [“GET STARTED”](https://pytorch.org/get-started/pytorch-2.0/)를 확인하세요.

---

이제 PyTorch 2.0이 어떻게 작동하는지 알게 되었으니 시작해봅시다. 🚀

*참고: 이 튜토리얼은 NVIDIA A10G GPU가 포함된 g5.xlarge AWS EC2 인스턴스에서 생성 및 실행되었습니다.*

## 환경 설정 및 Pytorch 2.0 설치

우리의 첫 번째 단계는 PyTorch 2.0 및 Hugging Face 라이브러리, `transformers` 및 `datasets`를 포함하여 설치하는 것입니다.

In [None]:
# Install PyTorch 2.0

# `pip install`: pip를 사용하여 라이브러리를 설치하는 명령입니다.
# `"torch>=2.0"`: PyTorch 라이브러리의 버전이 2.0 이상이어야 함을 지정합니다.
# `--extra-index-url https://download.pytorch.org/whl/cu117`:
#    - PyTorch를 설치하기 위해 추가적인 인덱스 URL을 제공합니다.
#    - 이 URL은 PyTorch의 특정 버전(여기서는 CUDA 11.7 버전)을 위한 바퀴 파일(.whl)을 포함하고 있습니다.
# `--upgrade`: 이미 설치된 PyTorch가 있다면 2.0 버전 이상으로 업그레이드합니다.
# `--quiet`: 설치 과정 중 불필요한 출력을 최소화합니다.

!pip install "torch>=2.0" --extra-index-url https://download.pytorch.org/whl/cu117 --upgrade --quiet


게다가, 우리는 메인 git 브랜치에서 `transformers`의 최신 버전을 설치하고 있습니다. 이 버전에는 PyTorch 2.0이 `Trainer`에 기본적으로 통합되어 있습니다.

In [None]:
# PyTorch 2.0 설치 (CUDA 11.7 호환 버전)
!pip install "torch>=2.0" --extra-index-url https://download.pytorch.org/whl/cu117 --upgrade --quiet

# 필요한 라이브러리 설치:
# - transformers (자연어 처리를 위한 사전 훈련된 모델 제공)
# - datasets (데이터 로딩을 위한 라이브러리)
# - accelerate (딥러닝 모델 훈련 가속화)
# - evaluate (모델 평가 라이브러리, 구체적인 기능 확인 필요)
# - tensorboard (텐서플로우 시각화 도구)
# - scikit-learn (머신러닝 알고리즘 및 도구 제공)
!pip install "transformers==4.27.1" "datasets==2.9.0" "accelerate==0.17.1" "evaluate==0.4.0" tensorboard scikit-learn --upgrade --quiet

# Hugging Face hub에 대용량의 모델 및 로그를 푸시하기 위해 git-lfs 설치
!sudo apt-get install git-lfs --yes


[?25l     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/199.7 kB[0m [31m?[0m eta [36m-:--:--[0m[2K     [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[91m╸[0m[90m━[0m [32m194.6/199.7 kB[0m [31m6.9 MB/s[0m eta [36m0:00:01[0m[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m199.7/199.7 kB[0m [31m5.3 MB/s[0m eta [36m0:00:00[0m
[?25h[31mERROR: pip's dependency resolver does not currently take into account all the packages that are installed. This behaviour is the source of the following dependency conflicts.
tensorflow 2.14.0 requires tensorboard<2.15,>=2.14, but you have tensorboard 2.15.0 which is incompatible.[0m[31m
Reading package lists... Done
Building dependency tree... Done
Reading state information... Done
git-lfs is already the newest version (3.0.2-1ubuntu0.2).
0 upgraded, 0 newly installed, 0 to remove and 18 not upgraded.


이 예제는 [Hugging Face Hub](https://huggingface.co/models)를 원격 모델 버전 관리 서비스로 사용할 것입니다. Hub에 모델을 푸시하기 위해서는 [Hugging Face](https://huggingface.co/join)에 등록해야 합니다. 이미 계정이 있다면 이 단계를 건너뛸 수 있습니다. 계정이 생기면, `huggingface_hub` 패키지의 로그인 유틸리티를 사용하여 우리 계정에 로그인하고 우리의 토큰(액세스 키)을 디스크에 저장합니다.

In [None]:
# Hugging Face Hub 라이브러리 임포트
from huggingface_hub import login

# Hugging Face Hub에 로그인
# token: 사용자의 허브 토큰. 토큰은 보안 정보이므로 공개적으로 공유되어서는 안 됩니다.
# add_to_git_credential: 이 옵션이 True로 설정되면, Git 자격 증명에 토큰이 추가되어 Hugging Face Hub에 모델과 데이터를 푸시할 때 사용됩니다.
login(
  token="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", # ADD YOUR TOKEN HERE
  add_to_git_credential=True
)


Token is valid (permission: write).
Your token has been saved in your configured git credential helpers (store).
Your token has been saved to /root/.cache/huggingface/token
Login successful


## 2. 데이터셋 로드 및 준비

이 예제를 간결하게 유지하기 위해, 우리는 [BANKING77](https://huggingface.co/datasets/banking77) 데이터셋에 대한 텍스트 분류 모델을 훈련시킬 것입니다. BANKING77 데이터셋은 은행/금융 분야에서의 세밀한 의도(클래스) 집합을 제공합니다. 이 데이터셋은 77개의 의도로 레이블링된 13,083개의 고객 서비스 쿼리로 구성되어 있습니다. 이것은 세밀한 단일 도메인 의도 감지에 중점을 둡니다.

우리는 [🤗 Datasets](https://huggingface.co/docs/datasets/index) 라이브러리의 `load_dataset()` 메서드를 사용하여 `banking77`을 로드할 것입니다.

In [None]:
# Hugging Face의 datasets 라이브러리 임포트
from datasets import load_dataset

# 데이터셋 ID 설정 (huggingface.co/dataset에서 확인할 수 있음)
dataset_id = "banking77"

# 지정된 ID를 사용하여 데이터셋 로드
raw_dataset = load_dataset(dataset_id)

# 훈련 데이터셋의 크기 출력
print(f"Train dataset size: {len(raw_dataset['train'])}")
# 테스트 데이터셋의 크기 출력
print(f"Test dataset size: {len(raw_dataset['test'])}")


Downloading builder script:   0%|          | 0.00/7.46k [00:00<?, ?B/s]

Downloading metadata:   0%|          | 0.00/5.89k [00:00<?, ?B/s]

Downloading readme:   0%|          | 0.00/14.3k [00:00<?, ?B/s]



Downloading and preparing dataset banking77/default to /root/.cache/huggingface/datasets/banking77/default/1.1.0/9898c11f6afa9521953d2ef205667b527bad14ef9cab445d470f16240c8c8ec4...


Downloading data:   0%|          | 0.00/158k [00:00<?, ?B/s]

Downloading data:   0%|          | 0.00/51.1k [00:00<?, ?B/s]

Generating train split:   0%|          | 0/10003 [00:00<?, ? examples/s]

Generating test split:   0%|          | 0/3080 [00:00<?, ? examples/s]

Dataset banking77 downloaded and prepared to /root/.cache/huggingface/datasets/banking77/default/1.1.0/9898c11f6afa9521953d2ef205667b527bad14ef9cab445d470f16240c8c8ec4. Subsequent calls will reuse this data.


  0%|          | 0/2 [00:00<?, ?it/s]

Train dataset size: 10003
Test dataset size: 3080


데이터셋의 예제를 살펴보겠습니다.

In [None]:
# 무작위 숫자 생성을 위한 라이브러리 임포트
from random import randrange

# 훈련 데이터셋의 길이 내에서 무작위로 하나의 인덱스 생성
random_id = randrange(len(raw_dataset['train']))

# 생성된 무작위 인덱스에 해당하는 데이터를 훈련 데이터셋에서 추출
raw_dataset['train'][random_id]
# 예제 출력: {'text': "I can't get google pay to work right.", 'label': 2}


{'text': 'Why is there a fee for using my card?', 'label': 15}

우리의 모델을 학습시키기 위해서는 "자연어"를 토큰 ID로 변환해야 합니다. 이 작업은 토크나이저에 의해 수행되는데, 입력을 토크나이즈하며 (토큰을 사전 훈련된 어휘의 해당 ID로 변환하는 것 포함) 토큰화됩니다. 이에 대해 더 자세히 알고 싶다면, [Hugging Face Course](https://huggingface.co/course/chapter1/1)의 **[chapter 6](https://huggingface.co/course/chapter6/1?fw=pt)**를 참조하세요.

In [None]:
# transformers 라이브러리에서 AutoTokenizer 임포트
from transformers import AutoTokenizer

# 토큰화를 위해 로드할 모델의 ID 설정
model_id = "bert-base-uncased"
# 해당 모델 ID를 기반으로 토큰화기 로드
tokenizer = AutoTokenizer.from_pretrained(model_id)

# 토큰화 도우미 함수
# - 텍스트를 토큰화하며, 지정된 최대 길이를 초과하는 경우 잘라냅니다.
# - "pt"는 PyTorch 텐서를 반환하라는 의미입니다.
def tokenize(batch):
    return tokenizer(batch['text'], padding='max_length', truncation=True, return_tensors="pt")

# 원래의 'label' 열 이름을 'labels'로 변경 (Trainer와 호환성을 위해)
raw_dataset =  raw_dataset.rename_column("label", "labels")

# 데이터셋 토큰화
# - batched=True는 데이터를 배치로 처리하도록 지정합니다.
# - remove_columns=["text"]는 텍스트 열을 제거하라는 의미입니다.
tokenized_dataset = raw_dataset.map(tokenize, batched=True, remove_columns=["text"])

# 토큰화된 데이터셋의 기능(열) 키를 출력
print(tokenized_dataset["train"].features.keys())
# 예제 출력: dict_keys(['input_ids', 'token_type_ids', 'attention_mask','labels'])


(…)cased/resolve/main/tokenizer_config.json:   0%|          | 0.00/28.0 [00:00<?, ?B/s]

(…)rt-base-uncased/resolve/main/config.json:   0%|          | 0.00/570 [00:00<?, ?B/s]

(…)bert-base-uncased/resolve/main/vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

(…)base-uncased/resolve/main/tokenizer.json:   0%|          | 0.00/466k [00:00<?, ?B/s]

  0%|          | 0/11 [00:00<?, ?ba/s]

  0%|          | 0/4 [00:00<?, ?ba/s]

dict_keys(['labels', 'input_ids', 'token_type_ids', 'attention_mask'])


## 3. Hugging Face `Trainer`로 BERT 모델 미세 조정 및 평가

데이터셋을 처리한 후, 우리는 모델 학습을 시작할 수 있습니다. 우리는 bert-base-uncased 모델을 사용할 것입니다. 첫 번째 단계는 [Hugging Face Hub](https://huggingface.co/bert-base-uncased)의 `AutoModelForSequenceClassification` 클래스를 사용하여 모델을 로드하는 것입니다. 이것은 사전 훈련된 BERT 가중치 위에 분류 헤드를 초기화합니다. 여기서 우리는 추론을 위해 읽을 수 있는 출력을 가지기 위해 데이터셋에서의 클래스(77)의 수와 라벨 이름을 전달합니다.

In [None]:
# transformers 라이브러리에서 필요한 모델 클래스 임포트
from transformers import AutoModelForSequenceClassification

# 로드할 모델의 ID 설정
model_id = "bert-base-uncased"

# 토큰화된 데이터셋에서 레이블 정보 가져오기 - 추론(inference) 시 유용
labels = tokenized_dataset["train"].features["labels"].names
num_labels = len(labels)

# 레이블을 숫자 ID로 변환하고, 숫자 ID를 레이블로 변환하는 사전(dictionary) 생성
label2id, id2label = dict(), dict()
for i, label in enumerate(labels):
    label2id[label] = str(i)
    id2label[str(i)] = label

# Hugging Face의 모델 허브에서 Sequence Classification 모델 로드
# num_labels: 분류할 레이블의 수
# label2id: 레이블을 숫자 ID로 변환하는 사전
# id2label: 숫자 ID를 레이블로 변환하는 사전
model = AutoModelForSequenceClassification.from_pretrained(
    model_id, num_labels=num_labels, label2id=label2id, id2label=id2label
)


pytorch_model.bin:   0%|          | 0.00/440M [00:00<?, ?B/s]

Some weights of the model checkpoint at bert-base-uncased were not used when initializing BertForSequenceClassification: ['cls.predictions.transform.dense.bias', 'cls.seq_relationship.weight', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.LayerNorm.weight', 'cls.seq_relationship.bias', 'cls.predictions.transform.LayerNorm.bias', 'cls.predictions.decoder.weight', 'cls.predictions.bias']
- This IS expected if you are initializing BertForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForSequenceClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).
Some weights of BertForSequenceClassification were not initialized from the model checkpoint at

We evaluate our model during training. The `Trainer` supports evaluation during training by providing a `compute_metrics` method. We use the `evaluate` library to calculate the [f1 metric](https://huggingface.co/spaces/evaluate-metric/f1) during training on our test split.

In [None]:
# 필요한 라이브러리와 모듈 임포트
import evaluate
import numpy as np

# 메트릭 ID 설정 (여기서는 "f1"이 사용되었습니다)
metric = evaluate.load("f1")

# 메트릭 계산 도우미 함수
def compute_metrics(eval_pred):
    # eval_pred는 (예측값, 실제 레이블)의 형태의 튜플입니다.
    predictions, labels = eval_pred

    # 예측값 중 가장 높은 확률을 가진 클래스의 인덱스를 선택
    predictions = np.argmax(predictions, axis=1)

    # F1 점수 계산
    # predictions: 모델의 예측값
    # references: 실제 레이블 값
    # average="weighted": 각 클래스의 지지도(샘플 수)를 고려하여 F1 점수 계산
    return metric.compute(predictions=predictions, references=labels, average="weighted")


Downloading builder script:   0%|          | 0.00/6.77k [00:00<?, ?B/s]

마지막 단계는 훈련에 사용할 하이퍼파라미터 (`TrainingArguments`)를 정의하는 것입니다. 여기서는 빠른 훈련 시간을 위해 PyTorch 2.0에서 도입된 기능들을 추가하고 있습니다. PyTorch 2.0의 최신 개선 사항을 사용하기 위해서는 `TrainingArguments`에 `torch_compile` 옵션만 전달하면 됩니다.

또한 `Trainer`의 [Hugging Face Hub](https://huggingface.co/models) 통합을 활용하여 훈련 중에 체크포인트, 로그 및 메트릭을 저장소에 푸시합니다.

In [None]:
# 필요한 라이브러리와 모듈 임포트
from huggingface_hub import HfFolder
from transformers import Trainer, TrainingArguments

# 원격 저장소 ID 설정
repository_id = "bert-base-banking77-pt2"

# 훈련 설정 정의
training_args = TrainingArguments(
    output_dir=repository_id,  # 출력 디렉토리 설정
    per_device_train_batch_size=16,  # 장치별 훈련 배치 크기 설정
    per_device_eval_batch_size=8,  # 장치별 평가 배치 크기 설정
    learning_rate=5e-5,  # 학습률 설정
    num_train_epochs=3,  # 훈련 에포크 수 설정
    # PyTorch 2.0 특성
    fp16=True,  # fp16 훈련 사용
    torch_compile=True,  # 최적화 사용
    optim="adamw_torch_fused",  # 개선된 옵티마이저 사용
    # 로깅 및 평가 전략
    logging_dir=f"{repository_id}/logs",  # 로깅 디렉토리 설정
    logging_strategy="steps",  # 로깅 전략 설정
    logging_steps=200,  # 로깅 간격 설정
    evaluation_strategy="epoch",  # 평가 전략 설정
    save_strategy="epoch",  # 모델 저장 전략 설정
    save_total_limit=2,  # 최대 저장 모델 수 제한 설정
    load_best_model_at_end=True,  # 훈련 종료 시 최적의 모델 로드 설정
    metric_for_best_model="f1",  # 최적 모델 판단 기준 설정
    # 허브에 푸시 설정
    report_to="tensorboard",  # TensorBoard에 로깅 설정
    push_to_hub=True,  # 허브에 푸시 설정
    hub_strategy="every_save",  # 저장할 때마다 허브에 푸시 설정
    hub_model_id=repository_id,  # 허브 모델 ID 설정
    hub_token=HfFolder.get_token(),  # 허브 토큰 설정
)

# Trainer 인스턴스 생성
trainer = Trainer(
    model=model,  # 모델 설정
    args=training_args,  # 훈련 설정 설정
    train_dataset=tokenized_dataset["train"],  # 훈련 데이터셋 설정
    eval_dataset=tokenized_dataset["test"],  # 평가 데이터셋 설정
    compute_metrics=compute_metrics,  # 메트릭 계산 함수 설정
)


The speedups for torchdynamo mostly come wih GPU Ampere or higher and which is not detected here.
Cloning https://huggingface.co/davinnnnn/bert-base-banking77-pt2 into local empty directory.


Download file pytorch_model.bin:   0%|          | 8.00k/418M [00:00<?, ?B/s]

Download file logs/events.out.tfevents.1697023928.d8bb436500da.3625.2: 100%|##########| 11.7k/11.7k [00:00<?, …

Download file logs/events.out.tfevents.1697104659.32357d76ef77.720.0: 100%|##########| 11.7k/11.7k [00:00<?, ?…

Clean file logs/events.out.tfevents.1697023928.d8bb436500da.3625.2:   9%|8         | 1.00k/11.7k [00:00<?, ?B/…

Download file logs/events.out.tfevents.1696984089.0334d43243a1.5570.0: 100%|##########| 11.7k/11.7k [00:00<?, …

Download file logs/events.out.tfevents.1697176077.1f911d31e2cd.944.0: 100%|##########| 11.7k/11.7k [00:00<?, ?…

Clean file logs/events.out.tfevents.1697104659.32357d76ef77.720.0:   9%|8         | 1.00k/11.7k [00:00<?, ?B/s…

Download file logs/events.out.tfevents.1697102096.a1119047f044.1561.0: 100%|##########| 11.7k/11.7k [00:00<?, …

Clean file logs/events.out.tfevents.1696984089.0334d43243a1.5570.0:   9%|8         | 1.00k/11.7k [00:00<?, ?B/…

Clean file logs/events.out.tfevents.1697176077.1f911d31e2cd.944.0:   9%|8         | 1.00k/11.7k [00:00<?, ?B/s…

Download file logs/events.out.tfevents.1697172224.c33e37aec130.792.0:  12%|#1        | 1.40k/11.7k [00:00<?, ?…

Clean file logs/events.out.tfevents.1697102096.a1119047f044.1561.0:   9%|8         | 1.00k/11.7k [00:00<?, ?B/…

Download file logs/events.out.tfevents.1696985992.0334d43243a1.15239.0: 100%|##########| 11.7k/11.7k [00:00<?,…

Clean file logs/events.out.tfevents.1696985992.0334d43243a1.15239.0:   9%|8         | 1.00k/11.7k [00:00<?, ?B…

Clean file logs/events.out.tfevents.1697172224.c33e37aec130.792.0:   9%|8         | 1.00k/11.7k [00:00<?, ?B/s…

Download file logs/events.out.tfevents.1697017055.be771c5cc278.837.0: 100%|##########| 11.7k/11.7k [00:00<?, ?…

Clean file logs/events.out.tfevents.1697017055.be771c5cc278.837.0:   9%|8         | 1.00k/11.7k [00:00<?, ?B/s…

Download file logs/events.out.tfevents.1697019224.4e597d3a05cf.1813.0: 100%|##########| 9.08k/9.08k [00:00<?, …

Clean file logs/events.out.tfevents.1697019224.4e597d3a05cf.1813.0:  11%|#1        | 1.00k/9.08k [00:00<?, ?B/…

Download file logs/events.out.tfevents.1697023828.d8bb436500da.3625.0: 100%|##########| 9.08k/9.08k [00:00<?, …

Clean file logs/events.out.tfevents.1697023828.d8bb436500da.3625.0:  11%|#1        | 1.00k/9.08k [00:00<?, ?B/…

Download file logs/events.out.tfevents.1697101162.5775380822c6.2723.0: 100%|##########| 9.85k/9.85k [00:00<?, …

Clean file logs/events.out.tfevents.1697101162.5775380822c6.2723.0:  10%|#         | 1.00k/9.85k [00:00<?, ?B/…

Download file logs/events.out.tfevents.1696983455.0334d43243a1.1625.0: 100%|##########| 9.08k/9.08k [00:00<?, …

Clean file logs/events.out.tfevents.1696983455.0334d43243a1.1625.0:  11%|#1        | 1.00k/9.08k [00:00<?, ?B/…

Download file logs/events.out.tfevents.1697019379.4e597d3a05cf.1813.2: 100%|##########| 11.7k/11.7k [00:00<?, …

Clean file logs/events.out.tfevents.1697019379.4e597d3a05cf.1813.2:   9%|8         | 1.00k/11.7k [00:00<?, ?B/…

Download file logs/1696983455.1430132/events.out.tfevents.1696983455.0334d43243a1.1625.1: 100%|##########| 5.7…

Clean file logs/1696983455.1430132/events.out.tfevents.1696983455.0334d43243a1.1625.1:  18%|#7        | 1.00k/…

Download file logs/1697023928.8083463/events.out.tfevents.1697023928.d8bb436500da.3625.3: 100%|##########| 5.7…

Clean file logs/1697023928.8083463/events.out.tfevents.1697023928.d8bb436500da.3625.3:  18%|#7        | 1.00k/…

Download file logs/1697176077.103359/events.out.tfevents.1697176077.1f911d31e2cd.944.1: 100%|##########| 5.71k…

Clean file logs/1697176077.103359/events.out.tfevents.1697176077.1f911d31e2cd.944.1:  18%|#7        | 1.00k/5.…

Download file logs/1697102096.392321/events.out.tfevents.1697102096.a1119047f044.1561.1: 100%|##########| 5.71…

Clean file logs/1697102096.392321/events.out.tfevents.1697102096.a1119047f044.1561.1:  18%|#7        | 1.00k/5…

Download file logs/1697104659.7227416/events.out.tfevents.1697104659.32357d76ef77.720.1: 100%|##########| 5.71…

Clean file logs/1697104659.7227416/events.out.tfevents.1697104659.32357d76ef77.720.1:  18%|#7        | 1.00k/5…

Download file logs/1697172224.8315413/events.out.tfevents.1697172224.c33e37aec130.792.1: 100%|##########| 5.71…

Clean file logs/1697172224.8315413/events.out.tfevents.1697172224.c33e37aec130.792.1:  18%|#7        | 1.00k/5…

Download file logs/1697101162.202802/events.out.tfevents.1697101162.5775380822c6.2723.1: 100%|##########| 5.71…

Clean file logs/1697101162.202802/events.out.tfevents.1697101162.5775380822c6.2723.1:  18%|#7        | 1.00k/5…

Download file logs/1697023828.120644/events.out.tfevents.1697023828.d8bb436500da.3625.1: 100%|##########| 5.71…

Clean file logs/1697023828.120644/events.out.tfevents.1697023828.d8bb436500da.3625.1:  18%|#7        | 1.00k/5…

Download file logs/1697019379.8324525/events.out.tfevents.1697019379.4e597d3a05cf.1813.3: 100%|##########| 5.7…

Clean file logs/1697019379.8324525/events.out.tfevents.1697019379.4e597d3a05cf.1813.3:  18%|#7        | 1.00k/…

Download file logs/1697019224.6461759/events.out.tfevents.1697019224.4e597d3a05cf.1813.1: 100%|##########| 5.7…

Clean file logs/1697019224.6461759/events.out.tfevents.1697019224.4e597d3a05cf.1813.1:  18%|#7        | 1.00k/…

Download file logs/1697017055.2294087/events.out.tfevents.1697017055.be771c5cc278.837.1: 100%|##########| 5.71…

Clean file logs/1697017055.2294087/events.out.tfevents.1697017055.be771c5cc278.837.1:  18%|#7        | 1.00k/5…

Download file logs/1696985992.8530924/events.out.tfevents.1696985992.0334d43243a1.15239.1: 100%|##########| 5.…

Clean file logs/1696985992.8530924/events.out.tfevents.1696985992.0334d43243a1.15239.1:  18%|#7        | 1.00k…

Download file training_args.bin: 100%|##########| 3.99k/3.99k [00:00<?, ?B/s]

Clean file training_args.bin:  25%|##5       | 1.00k/3.99k [00:00<?, ?B/s]

Download file logs/1696984089.4570017/events.out.tfevents.1696984089.0334d43243a1.5570.1: 100%|##########| 5.7…

Clean file logs/1696984089.4570017/events.out.tfevents.1696984089.0334d43243a1.5570.1:  18%|#7        | 1.00k/…

Clean file pytorch_model.bin:   0%|          | 1.00k/418M [00:00<?, ?B/s]

In [None]:
# torch._dynamo 모듈 임포트
# 주의: 이 모듈은 PyTorch의 내부적인 부분이므로 외부에서 사용하는 것은 추천되지 않을 수 있습니다.
import torch._dynamo

# Dynamo 컴파일러의 오류 출력을 억제하는 설정
# 이 설정은 Dynamo 컴파일러에서 발생하는 오류 메시지를 출력하지 않도록 설정합니다.
torch._dynamo.config.suppress_errors = True


We can start our training by using the **`train`** method of the `Trainer`.

In [None]:
# 모델 훈련 시작
# 앞서 정의한 TrainingArguments 설정에 따라 훈련이 진행됩니다.
trainer.train()




Epoch,Training Loss,Validation Loss,F1
1,1.1816,0.829639,0.837487
2,0.3968,0.38143,0.917809
3,0.1924,0.308425,0.930015


TrainOutput(global_step=1878, training_loss=1.0028659715946997, metrics={'train_runtime': 1409.856, 'train_samples_per_second': 21.285, 'train_steps_per_second': 1.332, 'total_flos': 7901016582896640.0, 'train_loss': 1.0028659715946997, 'epoch': 3.0})



transformers에서 지원하는 Pytorch 2.0 및 해당 기능을 사용하면 10_000 개의 샘플에 대한 BERT 모델을 457.7964 초 안에 훈련시킬 수 있습니다.

훈련 시간을 비교하기 위해 torch_compile 옵션 없이 훈련을 실행해 보았습니다. torch_compile 없이 훈련하는 데 457초가 걸렸으며, train_samples_per_second 값은 65.55이고 f1 점수는 0.931이었습니다.

```bash
{'train_runtime': 696.2701, 'train_samples_per_second': 43.1, 'eval_f1': 0.928788}
```

torch_compile 옵션과 adamw_torch_fused 최적화를 사용하면, PyTorch 2.0 없이 훈련에 비해 훈련 시간이 52.5% 줄어든 것을 볼 수 있습니다.

```bash
{'train_runtime': 457.7964, 'train_samples_per_second': 65.55, 'eval_f1': 0.931773}
```

우리의 절대 훈련 시간은 696초에서 457초로 줄었습니다. train_samples_per_second 값은 43에서 59로 증가했습니다. f1 점수는 torch_compile 없이 훈련한 것과 동일하거나 약간 더 좋습니다.

Pytorch 2.0은 놀랍도록 강력합니다! 🚀

결과와 토크나이저를 Hugging Face Hub에 저장하고 모델 카드를 생성합시다.

In [None]:
# 토크나이저 저장
# 훈련된 모델과 함께 토크나이저를 저장하여 나중에 모델을 재사용할 때 동일한 토크나이저 설정을 사용할 수 있게 합니다.
tokenizer.save_pretrained(repository_id)

# 모델 카드 생성
# 모델 카드는 모델의 정보, 사용법, 성능 메트릭 등을 포함하는 메타데이터 파일입니다.
# 이 메서드를 사용하면 자동으로 기본 모델 카드가 생성됩니다.
trainer.create_model_card()

# 모델 및 관련 자원을 Hugging Face Hub에 푸시
# 이 작업은 훈련된 모델, 토크나이저, 모델 카드 등을 Hugging Face Hub에 업로드합니다.
# 따라서 다른 사용자들이 이 모델을 손쉽게 불러와 사용할 수 있게 됩니다.
trainer.push_to_hub()


Several commits (2) will be pushed upstream.
The progress bars may be unreliable.


Upload file pytorch_model.bin:   0%|          | 1.00/418M [00:00<?, ?B/s]

Upload file logs/events.out.tfevents.1697983994.9b59c3c5d31d.928.0:   0%|          | 1.00/11.7k [00:00<?, ?B/s…

To https://huggingface.co/davinnnnn/bert-base-banking77-pt2
   4929fde..3ee1347  main -> main

   4929fde..3ee1347  main -> main



'https://huggingface.co/davinnnnn/bert-base-banking77-pt2/commit/3ee1347134a16b6dba0f67465dbf38e2ef046c19'

## 4. 추론 실행 & 모델 테스트

이 튜토리얼을 마무리하기 위해, 몇 가지 예제에 대한 추론을 실행하고 모델을 테스트해 보겠습니다. 우리는 transformers 라이브러리의 pipeline 메서드를 사용하여 모델에서 추론을 실행할 것입니다..

In [None]:
# 필요한 라이브러리와 함수를 임포트합니다.
from transformers import pipeline

# Hugging Face Hub에서 우리의 모델과 토크나이저를 불러옵니다.
# 이를 위해 훈련 시 사용한 repository_id를 사용합니다.
# device=0은 GPU를 사용하여 추론을 수행하겠다는 의미입니다.
classifier = pipeline("sentiment-analysis", model=repository_id, tokenizer=repository_id, device=0)

# 분석할 샘플 문장을 지정합니다.
sample = "I have been waiting longer than expected for my bank card, could you provide information on when it will arrive?"

# 불러온 모델로 샘플 문장의 감정 또는 의도를 분석합니다.
pred = classifier(sample)

# 분석 결과를 출력합니다.
# 이 예에서는 "card_arrival" 라벨로 예측되었으며, 예측의 확신도는 약 99.03%입니다.
print(pred)
# [{'label': 'card_arrival', 'score': 0.9903606176376343}]


## 결론

이 튜토리얼에서는 BANKING77 데이터셋에서 텍스트 분류 모델을 훈련하기 위해 PyTorch 2.0을 사용하는 방법을 배웠습니다. PyTorch 2.0은 교육 시간을 단축하는 데 있어 강력한 도구임을 확인할 수 있었습니다. NVIDIA A10G에서 실행한 우리의 예제에서는 52.5% 더 나은 성능을 달성할 수 있었습니다. Hugging Face Trainer는 `TrainingArguments`에 `torch_compile` 옵션을 단순히 추가함으로써 훈련 파이프라인에 PyTorch 2.0을 쉽게 통합할 수 있게 해줍니다. bf16이 사용 가능할 때 새로운 결합된 AdamW 최적화 도구를 사용함으로써 PyTorch 2.0에서 더 많은 이점을 얻을 수 있습니다.

더불어, 우리가 교육 시간을 52% 줄였다는 점을 언급하고 싶습니다. 이는 교육 비용이 52% 절감되었다는 것을 의미하거나 52% 더 빠른 반복 주기와 생산까지의 시간을 의미할 수 있습니다. A100 GPU를 사용하거나 "Trainer" 오버헤드를 줄임으로써(예: 평가 및 로깅 제거) 더 나은 개선 사항을 확인할 수 있어야 합니다.

PyTorch 2.0은 이제 공식적으로 출시되었고, 앞으로 어떤 변화가 있을지 기대하고 있습니다. 🚀