# Zero Shot Pipeline

In [1]:
!pip install transformers==3.1.0

Collecting transformers==3.1.0
  Downloading transformers-3.1.0-py3-none-any.whl (884 kB)
[K     |████████████████████████████████| 884 kB 4.2 MB/s 
[?25hCollecting sacremoses
  Downloading sacremoses-0.0.46-py3-none-any.whl (895 kB)
[K     |████████████████████████████████| 895 kB 48.1 MB/s 
Collecting sentencepiece!=0.1.92
  Downloading sentencepiece-0.1.96-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.2 MB)
[K     |████████████████████████████████| 1.2 MB 43.5 MB/s 
Collecting tokenizers==0.8.1.rc2
  Downloading tokenizers-0.8.1rc2-cp37-cp37m-manylinux1_x86_64.whl (3.0 MB)
[K     |████████████████████████████████| 3.0 MB 54.3 MB/s 
Installing collected packages: tokenizers, sentencepiece, sacremoses, transformers
Successfully installed sacremoses-0.0.46 sentencepiece-0.1.96 tokenizers-0.8.1rc2 transformers-3.1.0


In [2]:
from transformers import pipeline

In [3]:
# classifier = pipeline("zero-shot-classification")
classifier = pipeline("zero-shot-classification", device=0) # to utilize GPU

Downloading:   0%|          | 0.00/908 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/899k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/456k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/1.63G [00:00<?, ?B/s]

Some weights of the model checkpoint at facebook/bart-large-mnli were not used when initializing BartForSequenceClassification: ['model.encoder.version', 'model.decoder.version']
- This IS expected if you are initializing BartForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPretraining model).
- This IS NOT expected if you are initializing BartForSequenceClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


sequence와 후보 레이블 list를 전달하여 이 파이프라인을 사용할 수 있습니다. 파이프라인은 기본적으로 후보 레이블 중 하나만 true라고 가정하고 각 레이블에 대해 합이 1이 되는 점수 목록을 반환합니다.

In [4]:
sequence = "Who are you voting for in 2020?"
candidate_labels = ["politics", "public health", "economics"]

classifier(sequence, candidate_labels)

{'labels': ['politics', 'economics', 'public health'],
 'scores': [0.9725188612937927, 0.014584126882255077, 0.01289697177708149],
 'sequence': 'Who are you voting for in 2020?'}

다중 클래스 분류를 수행하려면 `multi_class=True`를 전달하기만 하면 됩니다. 이 경우 점수는 독립적이지만 각각은 0에서 1 사이입니다.

In [5]:
sequence = "Who are you voting for in 2020?"
candidate_labels = ["politics", "public health", "economics", "elections"]

classifier(sequence, candidate_labels, multi_class=True)

{'labels': ['politics', 'elections', 'public health', 'economics'],
 'scores': [0.972069501876831,
  0.9676108360290527,
  0.03248697891831398,
  0.006164435762912035],
 'sequence': 'Who are you voting for in 2020?'}

다음은 감성 분류의 예입니다.

In [6]:
sequence = "I hated this movie. The acting sucked."
candidate_labels = ["positive", "negative"]

classifier(sequence, candidate_labels)

{'labels': ['negative', 'positive'],
 'scores': [0.9916268587112427, 0.008373171091079712],
 'sequence': 'I hated this movie. The acting sucked.'}

### 작동 원리

기본 모델은 NLI(자연어 추론) 작업에 대해 훈련되며, 이 작업은 두 시퀀스를 사용하여 서로 모순되는지, 서로를 수반하는지 또는 둘 다 아닌지를 결정합니다.

이것은 분류하려는 시퀀스를 하나의 NLI 시퀀스(전제라고 함)로 처리하고 후보 레이블을 다른 것(가설)로 전환하여 제로샷 분류 작업에 적용할 수 있습니다. 모델이 구성된 전제가 가설을 수반한다고 예측하는 경우 레이블이 텍스트에 적용된다는 예측으로 간주할 수 있습니다. 자세한 설명은 [이 블로그 게시물](https://joeddav.github.io/blog/2020/05/29/ZSL.html)을 확인하세요.

기본적으로 파이프라인은 `This example is {class_name}.` 템플릿을 사용하여 레이블을 가설로 바꿉니다. 이는 많은 설정에서 잘 작동하지만 특정 설정에 맞게 사용자 지정할 수도 있습니다. 위의 감성 분류 예제에 조금 더 어려운 또 다른 리뷰를 추가해 보겠습니다.

In [None]:
sequences = [
    "I hated this movie. The acting sucked.",
    "This movie didn't quite live up to my high expectations, but overall I still really enjoyed it."
]
candidate_labels = ["positive", "negative"]

classifier(sequences, candidate_labels)

[{'labels': ['negative', 'positive'],
  'scores': [0.9916267991065979, 0.008373182266950607],
  'sequence': 'I hated this movie. The acting sucked.'},
 {'labels': ['negative', 'positive'],
  'scores': [0.8148515820503235, 0.1851484179496765],
  'sequence': "This movie didn't quite live up to my high expectations, but overall I still really enjoyed it."}]

두 번째 예는 조금 더 어렵습니다. 리뷰 감정 분석 설정에 보다 구체적인 가설 템플릿을 사용하여 결과를 개선할 수 있는지 봅시다. 기본값인 `This example is {}.` 대신 `The sentiment of this review is {}.`를 사용합니다(여기서 `{}`는 후보 클래스 이름으로 대체됨).

In [None]:
sequences = [
    "I hated this movie. The acting sucked.",
    "This movie didn't quite live up to my high expectations, but overall I still really enjoyed it."
]
candidate_labels = ["positive", "negative"]
hypothesis_template = "The sentiment of this review is {}."

classifier(sequences, candidate_labels, hypothesis_template=hypothesis_template)

[{'labels': ['negative', 'positive'],
  'scores': [0.9890093207359314, 0.010990672744810581],
  'sequence': 'I hated this movie. The acting sucked.'},
 {'labels': ['positive', 'negative'],
  'scores': [0.9581228494644165, 0.0418771356344223],
  'sequence': "This movie didn't quite live up to my high expectations, but overall I still really enjoyed it."}]

보다 정확한 가설 템플릿을 제공함으로써 두번째 리뷰가 보다 정확히 분류된 것을 볼 수 있습니다.

> 여기서 감정 분류는 예시로 사용되었습니다. [Hugging Face Model Hub](https://huggingface.co/models?filter=text-classification)에는 sentiment task에 사용할 수 있는 특별히 훈련된 여러 모델들이 있습니다.

### 100개 언어로 된 제로샷 분류 모델

영어 이외의 언어에 파이프라인을 사용하는 데 관심이 있으십니까? 파이프라인을 생성할 때 `model='joeddav/xlm-roberta-large-xnli'`를 전달하여, XLM RoBERTa 을 기반으로 하여 사전 훈련한 교차 언어 모델이 있습니다.

In [7]:
classifier = pipeline("zero-shot-classification", model='joeddav/xlm-roberta-large-xnli')

Downloading:   0%|          | 0.00/734 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/150 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/25.0 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/2.24G [00:00<?, ?B/s]

모든 언어 조합과 함께 사용할 수 있습니다. 예를 들어 러시아어 문장을 영어 후보 레이블로 분류해 보겠습니다.

In [8]:
sequence = "2021년에 누구에게 투표하겠습니까?" # translation: "Who are you voting for in 2020?"
candidate_labels = ["Europe", "public health", "politics"]

classifier(sequence, candidate_labels)

{'labels': ['politics', 'Europe', 'public health'],
 'scores': [0.9590178728103638, 0.024478500708937645, 0.016503622755408287],
 'sequence': '2021년에 누구에게 투표하겠습니까?'}

- 러시아어에 적용해 봅니다.

In [12]:
sequence = "За кого вы голосуете в 2020 году?" # translation: "Who are you voting for in 2020?"
candidate_labels = ["Europe", "public health", "politics"]

classifier(sequence, candidate_labels)

{'labels': ['politics', 'Europe', 'public health'],
 'scores': [0.9048489332199097, 0.05722159147262573, 0.0379294790327549],
 'sequence': 'За кого вы голосуете в 2020 году?'}

지난 섹션에서 논의한 것처럼 기본 가설 템플릿은 `This text is {}.`라는 영어입니다. 엄격하게 한 언어 내에서 작업하는 경우 이를 작업 중인 언어로 번역하는 것이 좋습니다.

In [14]:
sequence = "2021년에 누구에게 투표하겠습니까"
candidate_labels = ["건강", "문화", "정치"]
hypothesis_template = "이 텍스트는 {}에 관한 내용 입니다."

classifier(sequence, candidate_labels, hypothesis_template=hypothesis_template)

{'labels': ['정치', '문화', '건강'],
 'scores': [0.9586170315742493, 0.031597331166267395, 0.009785706177353859],
 'sequence': '2021년에 누구에게 투표하겠습니까'}

- 프랑스어에 적용해 봅니다.

In [15]:
sequence = "¿A quién vas a votar en 2020?"
candidate_labels = ["Europa", "salud pública", "política"]
hypothesis_template = "Este ejemplo es {}."

classifier(sequence, candidate_labels, hypothesis_template=hypothesis_template)

{'labels': ['política', 'Europa', 'salud pública'],
 'scores': [0.9109598994255066, 0.05954746529459953, 0.029492629691958427],
 'sequence': '¿A quién vas a votar en 2020?'}

이 모델은 아랍어, 불가리아어, 중국어, 영어, 프랑스어, 독일어, 그리스어, 힌디어, 러시아어, 스페인어, 스와힐리어, 태국어, 터키어, 우르두어, 베트남어 등 15개 언어를 포함하는 XNLI에서 미세 조정됩니다. 기본 모델은 85개 이상에서 훈련되므로 모델은 XLM RoBERTa 훈련 말뭉치의 모든 모델에 대해 어느 정도 작동합니다([XLM Roberata 논문](https://arxiv.org/abs/1911.02116)의 부록 A참조).

자세한 내용은 [모델 페이지](https://huggingface.co/joeddav/xlm-roberta-large-xnli)를 참조하세요.