## XLM benchmarking

This notebook contains code for testing and benchmarking the XLM model and its' variations.

In [1]:
!pip install transformers sentencepiece
from transformers import pipeline

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting transformers
  Downloading transformers-4.30.1-py3-none-any.whl (7.2 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.2/7.2 MB[0m [31m57.0 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting sentencepiece
  Downloading sentencepiece-0.1.99-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.3/1.3 MB[0m [31m78.8 MB/s[0m eta [36m0:00:00[0m
Collecting huggingface-hub<1.0,>=0.14.1 (from transformers)
  Downloading huggingface_hub-0.15.1-py3-none-any.whl (236 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m236.8/236.8 kB[0m [31m29.6 MB/s[0m eta [36m0:00:00[0m
Collecting tokenizers!=0.11.3,<0.14,>=0.11.1 (from transformers)
  Downloading tokenizers-0.13.3-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (7.8 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━

## Testing benchmark
This is a very simple benchmark with a set of prompts regarding bank account management and intent classification.

In [2]:
labels = ['account', 'close', 'savings', 'open', 'loan', 'credit card', 'cheque', 'special offer', 'bank deposit']
prompts = [
  'Chciałbym zamknąć swoje konto bankowe', 
  'Jak zamknąć konto bankowe?',
  'Chciałbym usunąć konto w waszym banku',
  'Witam, chciałbym sprawdzić wyciąg z mojej karty kredytowej',
  'Skąd wzięła się ta transakcja na mojej karcie? Niczego takiego nie płaciłem',
  'Chciałbym zamówić nową kartę',
  'Dzień dobry. Chciałbym założyć nowe konto bankowe - słyszałem, że jest promocja dla młodych.'
  'Czy można założyć u was konto przez internet?',
  'Jakie są opłaty za prowadzenie konta?',
  'Jakie oprocentowanie ma ta lokata i na jaki czas?',
  'Czy macie jakieś ciekawe oferty lokat?',
  'czy macie jakąś ofertę lokat dla nowych klientów?',
  'Ile pozostało mi rat mojego kredytu?',
  'Jakie jest RRSO tego kredytu?',
  'Jakie są dodatkowe koszty tej pożyczki?',
  'Witam, zakupiłem u was ciągnikowy kultywator sprężynowy z zapasowym kompletem lemieszy półsztywnych i skaryfikatorem. Zauważyłem jednak, że uszkodzone jest łożysko toczne baryłkowe wachliwe w mimośrodzie oraz brakuje połączeń gwintowych ze śrubą pasowaną o trzpieniu stożkowym. Chciałbym zatem zgłosić reklamację.'
]

In [3]:
def classify(classifier, prompts, labels):
  results_raw = []
  for prompt in prompts:
    results_raw.append(classifier(prompt, labels, multi_label=True))

  results = {}
  for result in results_raw:
    results[result['sequence']] = dict(zip(result['labels'], result['scores']))
  
  return results

## XLM-RoBERTa-large-XNLI-ANLI

[XLM-RoBERTa-large-XNLI-ANLI on HuggingFace](https://huggingface.co/vicgalle/xlm-roberta-large-xnli-anli)

This is an `XLM-RoBERTa-large` model finetuned over several NLI datasets, ready to use for zero-shot classification.

As it appears, in these datasets there are no polish tasks, however it's worth checking how it will perform.

In [23]:
classifier = pipeline("zero-shot-classification",
                      model="vicgalle/xlm-roberta-large-xnli-anli")

classify(classifier, prompts, labels)

{'Chciałbym zamknąć swoje konto bankowe': {'account': 0.997530996799469,
  'close': 0.9709629416465759,
  'savings': 0.7537415027618408,
  'credit card': 0.41498568654060364,
  'bank deposit': 0.33821138739585876,
  'special offer': 0.1786104142665863,
  'loan': 0.12049593031406403,
  'cheque': 0.08947661519050598,
  'open': 0.0023220519069582224},
 'Jak zamknąć konto bankowe?': {'account': 0.9968974590301514,
  'close': 0.7507851123809814,
  'savings': 0.6553680896759033,
  'credit card': 0.15024185180664062,
  'bank deposit': 0.10449860990047455,
  'loan': 0.01299325656145811,
  'cheque': 0.001636797678656876,
  'open': 0.0006978035089559853,
  'special offer': 0.0006195480818860233},
 'Chciałbym usunąć konto w waszym banku': {'open': 0.9991266131401062,
  'account': 0.9978540539741516,
  'close': 0.9499123692512512,
  'credit card': 0.7180381417274475,
  'savings': 0.46168363094329834,
  'loan': 0.3731320798397064,
  'bank deposit': 0.35368940234184265,
  'special offer': 0.35280242

## joeddav/xlm-roberta-large-xnli

[joeddav/xlm-roberta-large-xnli on HuggingFace](https://huggingface.co/joeddav/xlm-roberta-large-xnli)

This is an `xlm-roberta-large` finetuned on `XNLI` dataset, which didn't include polish language.

In [24]:
classifier = pipeline("zero-shot-classification",
                      model="joeddav/xlm-roberta-large-xnli",
                      use_auth_token='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')

classify(classifier, prompts, labels)

Some weights of the model checkpoint at joeddav/xlm-roberta-large-xnli were not used when initializing XLMRobertaForSequenceClassification: ['roberta.pooler.dense.weight', 'roberta.pooler.dense.bias']
- This IS expected if you are initializing XLMRobertaForSequenceClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing XLMRobertaForSequenceClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


{'Chciałbym zamknąć swoje konto bankowe': {'credit card': 0.9816272854804993,
  'account': 0.9492811560630798,
  'bank deposit': 0.8092331290245056,
  'close': 0.7790639996528625,
  'special offer': 0.7723423838615417,
  'savings': 0.6949192881584167,
  'loan': 0.6354372501373291,
  'cheque': 0.5996214747428894,
  'open': 0.022735262289643288},
 'Jak zamknąć konto bankowe?': {'account': 0.9441959857940674,
  'credit card': 0.9408594369888306,
  'bank deposit': 0.6844592094421387,
  'cheque': 0.6094049215316772,
  'loan': 0.5285153985023499,
  'savings': 0.4736921191215515,
  'special offer': 0.4548178017139435,
  'close': 0.1875595599412918,
  'open': 0.05548989400267601},
 'Chciałbym usunąć konto w waszym banku': {'credit card': 0.9932696223258972,
  'account': 0.9696618318557739,
  'close': 0.8905304670333862,
  'bank deposit': 0.8244794011116028,
  'loan': 0.7794999480247498,
  'savings': 0.7714745998382568,
  'special offer': 0.7645817399024963,
  'cheque': 0.47524377703666687,
  '

## MoritzLaurer/xlm-v-base-mnli-xnli

[MoritzLaurer/xlm-v-base-mnli-xnli on HuggingFace](https://huggingface.co/morit/XLM-T-full-xnli)

This is a `XLM-V-base` finetuned on `XNLI` dataset, which did not include polish language.

In [4]:
classifier = pipeline("zero-shot-classification",
                      model="MoritzLaurer/xlm-v-base-mnli-xnli",
                      use_auth_token='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')

classify(classifier, prompts, labels)

Downloading (…)okenizer_config.json:   0%|          | 0.00/499 [00:00<?, ?B/s]

Downloading (…)tencepiece.bpe.model:   0%|          | 0.00/18.2M [00:00<?, ?B/s]

Downloading tokenizer.json:   0%|          | 0.00/61.3M [00:00<?, ?B/s]

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/280 [00:00<?, ?B/s]

{'Chciałbym zamknąć swoje konto bankowe': {'account': 0.9900709390640259,
  'close': 0.9593678712844849,
  'bank deposit': 0.8170998692512512,
  'credit card': 0.616482675075531,
  'cheque': 0.5985189080238342,
  'special offer': 0.2687637507915497,
  'loan': 0.259208619594574,
  'savings': 0.029968660324811935,
  'open': 0.0038586549926549196},
 'Jak zamknąć konto bankowe?': {'account': 0.9219379425048828,
  'close': 0.8272143006324768,
  'bank deposit': 0.6055616140365601,
  'cheque': 0.38639700412750244,
  'loan': 0.3135068714618683,
  'credit card': 0.2092592865228653,
  'special offer': 0.12372083961963654,
  'savings': 0.05651545897126198,
  'open': 0.007259382400661707},
 'Chciałbym usunąć konto w waszym banku': {'close': 0.8698008060455322,
  'loan': 0.4581184387207031,
  'bank deposit': 0.4243343472480774,
  'credit card': 0.3812263011932373,
  'special offer': 0.3205379247665405,
  'cheque': 0.231989324092865,
  'account': 0.18376938998699188,
  'savings': 0.1355936974287033,

# Mask filling

In [15]:
prompts = [
  'Chciałbym zamknąć swoje <mask> bankowe', 
  'Jak zamknąć <mask> bankowe?',
  'Chciałbym usunąć <mask> w waszym banku',
  'Witam, chciałbym sprawdzić wyciąg z mojej <mask>',
  'Skąd wzięła się ta transakcja na mojej <mask>? Niczego takiego nie płaciłem',
  'Chciałbym zamówić nową <mask>',
  'Dzień dobry. Chciałbym założyć nowe <mask> bankowe - słyszałem, że jest promocja dla młodych.',
  'Czy można założyć u was <mask> przez internet?',
  'Jakie są opłaty za prowadzenie <mask>?',
  'Jakie oprocentowanie ma ta <mask> i na jaki czas?',
  'Czy macie jakieś ciekawe oferty <mask>?',
  'czy macie jakąś ofertę <mask> dla nowych klientów?',
  'Ile pozostało mi rat mojego <mask>?',
  'Jakie jest RRSO tego <mask>?',
  'Jakie są dodatkowe koszty tej <mask>?',
  'Witam, zakupiłem u was ciągnikowy <mask> sprężynowy z zapasowym kompletem lemieszy półsztywnych i skaryfikatorem. Zauważyłem jednak, że uszkodzone jest łożysko toczne baryłkowe wachliwe w mimośrodzie oraz brakuje połączeń gwintowych ze śrubą pasowaną o trzpieniu stożkowym. Chciałbym zatem zgłosić reklamację.'
]

In [16]:
def unmask(unmasker, prompts):
  results_raw = []
  for prompt in prompts:
    results_raw.append(unmasker(prompt))

  results = {}
  for result_list in results_raw:
    for result in result_list:
      results[result['sequence']] = result['score']
  
  return results

## xlm-v-base
[facebook/xlm-v-base on HuggingFace](https://huggingface.co/facebook/xlm-v-base)

In [17]:
unmasker = pipeline('fill-mask', model='facebook/xlm-v-base')
unmask(unmasker, prompts)

{'Chciałbym zamknąć swoje konto bankowe': 0.9886958599090576,
 'Chciałbym zamknąć swoje konta bankowe': 0.008982136845588684,
 'Chciałbym zamknąć swoje Konto bankowe': 0.00042003922862932086,
 'Chciałbym zamknąć swoje operacje bankowe': 0.0002557540428824723,
 'Chciałbym zamknąć swoje rachunku bankowe': 0.00023611732467543334,
 'Jak zamknąć konto bankowe?': 0.8937973380088806,
 'Jak zamknąć konta bankowe?': 0.07496580481529236,
 'Jak zamknąć karty bankowe?': 0.009928358718752861,
 'Jak zamknąć okno bankowe?': 0.0024249874986708164,
 'Jak zamknąć kredyty bankowe?': 0.002362513681873679,
 'Chciałbym usunąć konto w waszym banku': 0.7597362399101257,
 'Chciałbym usunąć konta w waszym banku': 0.057003479450941086,
 'Chciałbym usunąć rachunek w waszym banku': 0.01879345066845417,
 'Chciałbym usunąć Konto w waszym banku': 0.014646630734205246,
 'Chciałbym usunąć wpisy w waszym banku': 0.0051365504041314125,
 'Witam, chciałbym sprawdzić wyciąg z mojej...': 0.1726597100496292,
 'Witam, chciałby

## xlm-roberta-base
[xlm-roberta-base on HuggingFace](https://huggingface.co/xlm-roberta-base)

In [18]:
unmasker = pipeline('fill-mask', model='xlm-roberta-base')
unmask(unmasker, prompts)

Downloading (…)lve/main/config.json:   0%|          | 0.00/615 [00:00<?, ?B/s]

Downloading model.safetensors:   0%|          | 0.00/1.12G [00:00<?, ?B/s]

Downloading (…)tencepiece.bpe.model:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

Downloading (…)/main/tokenizer.json:   0%|          | 0.00/9.10M [00:00<?, ?B/s]

{'Chciałbym zamknąć swoje konto bankowe': 0.8187665343284607,
 'Chciałbym zamknąć swoje konta bankowe': 0.14851242303848267,
 'Chciałbym zamknąć swoje oszczędności bankowe': 0.0073486692272126675,
 'Chciałbym zamknąć swoje karty bankowe': 0.005763242021203041,
 'Chciałbym zamknąć swoje środki bankowe': 0.0032224201131612062,
 'Jak zamknąć konto bankowe?': 0.9385979175567627,
 'Jak zamknąć konta bankowe?': 0.044548459351062775,
 'Jak zamknąć karty bankowe?': 0.006288378499448299,
 'Jak zamknąć połączenie bankowe?': 0.001111532561480999,
 'Jak zamknąć Konto bankowe?': 0.0009907393250614405,
 'Chciałbym usunąć konto w waszym banku': 0.2673066556453705,
 'Chciałbym usunąć błąd w waszym banku': 0.24823886156082153,
 'Chciałbym usunąć problem w waszym banku': 0.1461794674396515,
 'Chciałbym usunąć błędy w waszym banku': 0.07355134189128876,
 'Chciałbym usunąć konta w waszym banku': 0.048561643809080124,
 'Witam, chciałbym sprawdzić wyciąg z mojej pracy': 0.458366721868515,
 'Witam, chciałbym

## xlm-roberta-large
[xlm-roberta-large on HuggingFace](https://huggingface.co/xlm-roberta-large)

In [20]:
unmasker = pipeline('fill-mask', model='xlm-roberta-large')
unmask(unmasker, prompts)

Downloading (…)lve/main/config.json:   0%|          | 0.00/616 [00:00<?, ?B/s]

Downloading model.safetensors:   0%|          | 0.00/2.24G [00:00<?, ?B/s]

Downloading (…)tencepiece.bpe.model:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

Downloading (…)/main/tokenizer.json:   0%|          | 0.00/9.10M [00:00<?, ?B/s]

{'Chciałbym zamknąć swoje konto bankowe': 0.8745877146720886,
 'Chciałbym zamknąć swoje konta bankowe': 0.12429016828536987,
 'Chciałbym zamknąć swoje Konto bankowe': 0.0005127032636664808,
 'Chciałbym zamknąć swoje karty bankowe': 0.00015789833560120314,
 'Chciałbym zamknąć swoje usługi bankowe': 0.00014063497656024992,
 'Jak zamknąć konto bankowe?': 0.9327574968338013,
 'Jak zamknąć konta bankowe?': 0.06529726833105087,
 'Jak zamknąć Konto bankowe?': 0.0009154410217888653,
 'Jak zamknąć karty bankowe?': 0.00012692481686826795,
 'Jak zamknąć połączenie bankowe?': 6.65596526232548e-05,
 'Chciałbym usunąć konto w waszym banku': 0.6957229971885681,
 'Chciałbym usunąć konta w waszym banku': 0.22560898959636688,
 'Chciałbym usunąć Konto w waszym banku': 0.014742551371455193,
 'Chciałbym usunąć profil w waszym banku': 0.007296226918697357,
 'Chciałbym usunąć kredyt w waszym banku': 0.005636280402541161,
 'Witam, chciałbym sprawdzić wyciąg z mojej': 0.35437342524528503,
 'Witam, chciałbym sp

## facebook/xlm-roberta-xl
[facebook/xlm-roberta-xl on HuggingFace](https://huggingface.co/facebook/xlm-roberta-xl)

In [None]:
unmasker = pipeline('fill-mask', model='facebook/xlm-roberta-xl')
unmask(unmasker, prompts)

Downloading (…)lve/main/config.json:   0%|          | 0.00/659 [00:00<?, ?B/s]

Downloading pytorch_model.bin:   0%|          | 0.00/13.9G [00:00<?, ?B/s]

In [1]:
## nie mieści się w ramie xD