In [1]:
# 오토클래스
# 오토클래스는 주어진 체크포인트에서 올바른 아키텍처를 자동으로 추론하여 불러온다. 
# 오토클래스를 사용하면 모델을 처음부터 학습하는데 시간과 리소스를 투입하지 않아도 된다. 
# 체크포인트에 구애받지 않는 코드를 생성한다는 것은 코드가 한 체크포인트에서 작동하면 아키텍처가 다르더라도 
# 다른 체크포인트에서도 작동한다는 것을 의미한다. 
#
# 아키텍처는 모델의 골격(기반)을 의미하고 체크포인트는 주어진 아키텍처에 대한 가중치(파생)이다. 
# 예를 들면 BERT는 아키텍쳐이고 bert-base-uncased는 체크포인트이다. 모델은 아키텍처일 수 있고 체크포인트일 수 있다. 
# 이 튜토리얼에서는 5개를 로드할 것이다.(토크나이저, 이미지 프로세서, 특징추출기, 프로세서, 모델)

In [None]:
# 오토 토크나이저
# 거의 모든 자연어처리 작업은 토크나이저로 시작된다. 
# 토크나이저는 사용자의 입력을 모델에서 처리할 수 있는 형식으로 변환한다. 
from transformers import AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained("bert-base-uncased")
sequence = "In a hole in the ground there lived a hobbit."
print(tokenizer(sequence))

# 토큰화는 다음과 같이 이루어질 것이다. 
{'input_ids': [101, 1999, 1037, 4920, 1999, 1996, 2598, 2045, 2973, 1037, 7570, 10322, 4183, 1012, 102], 
 'token_type_ids': [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], 
 'attention_mask': [1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]}

In [None]:
# 오토 이미지 프로세서
# 비전작업의 경우 이미지 프로세서가 이미지를 올바른 입력방식으로 처리한다. 
from transformers import AutoImageProcessor
image_processor = AutoImageProcessor.from_pretrained("google/vit-base-patch16-224")

In [None]:
# 오토 피쳐 익스트렉터(특징추출기)
# 오디오 작업의 경우 특징 추출기가 오디오 신호를 올바른 입력형식으로 처리한다. 
from transformers import AutoFeatureExtractor

feature_extractor = AutoFeatureExtractor.from_pretrained(
    "ehcalabres/wav2vec2-lg-xlsr-en-speech-emotion-recognition"
)

In [None]:
# 오토 프로세서
# 멀티모달 작업에는 두 가지 유형의 전처리 도구를 결합한 프로세서가 필요하다. 만약 LayoutLMV2