# **🤗Transformers (신경망 언어모델 라이브러리) 강좌**

ref: https://wikidocs.net/book/8056

# Import

In [1]:
# !pip install transformers
import transformers

  from .autonotebook import tqdm as notebook_tqdm


# 1장

## 2. 🤗Transformers가 할 수 있는 일들

**pipeline**: transformer의 가장 기본적인 개체

In [2]:
from transformers import pipeline

In [3]:
classifier = pipeline("sentiment-analysis")

No model was supplied, defaulted to distilbert-base-uncased-finetuned-sst-2-english and revision af0f99b (https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english).
Using a pipeline without specifying a model name and revision in production is not recommended.
config.json: 100%|██████████| 629/629 [00:00<00:00, 4.62MB/s]
model.safetensors: 100%|██████████| 268M/268M [00:05<00:00, 48.9MB/s] 
tokenizer_config.json: 100%|██████████| 48.0/48.0 [00:00<00:00, 341kB/s]
vocab.txt: 100%|██████████| 232k/232k [00:00<00:00, 588kB/s]


In [4]:
classifier("I've been waiting for a HuggingFace course my whole life.")

[{'label': 'POSITIVE', 'score': 0.9598049521446228}]

In [5]:
classifier(["I've been waiting for a HuggingFace course my whole life.",
            "I hate this so much!"])

[{'label': 'POSITIVE', 'score': 0.9598049521446228},
 {'label': 'NEGATIVE', 'score': 0.9994558691978455}]

사용 가능한 pipeline

- `feature-extraction` (텍스트에 대한 벡터 표현 제공)
- `fill-mask`
- `ner` (named entity recognition, 개체명 인식)
- `question-answering`
- `sentiment-analysis`
- `summarization`
- `text-generation`
- `translation`
- `zero-shot-classification`

`인코더 전용 모델(Encoder-only models)`: 문장 분류(sentence classification) 및 개체명 인식(named-entity recognition)과 같이 입력에 대한 분석 및 이해(understanding)가 필요한 태스크에 적합합니다.

`디코더 전용 모델(Decoder-only models)`: 텍스트 생성(text generation) 등과 같은 생성 태스크(generative tasks)에 좋습니다.

`인코더-디코더 모델(Encoder-Decoder models)` 혹은 `시퀀스-투-시퀀스 모델(sequence-to-sequence model)`: 번역(translation)이나 요약(summarization)과 같이 입력이 수반되는 생성 태스크(generative tasks)에 적합합니다.

`아키텍처(Architectures)`: 이 용어는 모델의 뼈대(skeleton)를 의미합니다. 모델 내에서 발생하는 각 레이어(layer)와 오퍼레이션(operation, 연산) 등을 정의합니다.

`체크포인트(Checkpoints)`: 해당 아키텍처에서 로드될 가중치 값들을 나타냅니다.

`모델(Model)`: 이것은 "아키텍처(architecture)" 또는 "체크포인트(checkpoint)" 보다는 덜 명확한 포괄적인 용어(umbrella term)입니다. 두 가지 모두를 의미할 수도 있습니다. 본 강좌에서는 표기의 명확성이 필요할 경우 모델이라는 용어보다는 아키텍처(architecture) 또는 체크포인트(checkpoint)를 주로 사용할 것입니다.

- 사전 학습된 모델(pretrained model)은 미세 조정(fine-tuning)에 사용할 데이터셋과 유사한 데이터를 바탕으로 이미 학습되었습니다. 따라서, 미세 조정(fine-tuning) 과정에서, 사전 학습 과정에서 얻은 지식을 활용할 수 있습니다.

https://wikidocs.net/166795