In [12]:
from transformers import pipeline

In [200]:
unmasker_bert = pipeline('fill-mask', model='bert-base-multilingual-cased')
unmasker_roberta = pipeline('fill-mask', model='xlm-roberta-base')
unmasker_distilbert = pipeline('fill-mask', model='distilbert-base-multilingual-cased')

Some weights of the model checkpoint at bert-base-multilingual-cased were not used when initializing BertForMaskedLM: ['cls.seq_relationship.weight', 'cls.seq_relationship.bias']
- This IS expected if you are initializing BertForMaskedLM from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForMaskedLM from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


In [180]:
unmasker_bert("Cześć jestem [MASK] model.")

[{'score': 0.4260772466659546,
  'token': 10114,
  'token_str': 'to',
  'sequence': 'Cześć jestem to model.'},
 {'score': 0.0634026974439621,
  'token': 118,
  'token_str': '-',
  'sequence': 'Cześć jestem - model.'},
 {'score': 0.06284543871879578,
  'token': 117,
  'token_str': ',',
  'sequence': 'Cześć jestem, model.'},
 {'score': 0.0355927012860775,
  'token': 10701,
  'token_str': 'jako',
  'sequence': 'Cześć jestem jako model.'},
 {'score': 0.031229058280587196,
  'token': 119,
  'token_str': '.',
  'sequence': 'Cześć jestem. model.'}]

In [177]:
def show_result(text: str) -> None:
    print(f"{'bert-base-multilingual-cased':<30}{'|':<2}{'xlm-roberta-base':<25}{'|':<2}{'distilbert-base-multilingual-cased'}")
    bert_res = unmasker_bert(text)
    roberta_res = unmasker_roberta(text.replace("[MASK]", "<mask>"))
    distilbert_res = unmasker_distilbert(text)
    for bert, xlm, distilbert in zip(bert_res, roberta_res, distilbert_res):
        print(f"{round(bert['score'],2):<5} : {bert['token_str']:<21} {'|':<1} {round(xlm['score'],2):<5} : {xlm['token_str']:<16} {'|'} {round(distilbert['score'],2):<5} : {distilbert['token_str']}")

In [178]:
show_result("Jestem [MASK]")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.51  : .                     | 0.06  : online           | 0.24  : :
0.12  : ,                     | 0.04  : .                | 0.11  : ?
0.04  : :                     | 0.04  : tutaj            | 0.03  : !
0.03  : !                     | 0.04  : ...              | 0.02  : .
0.02  : -                     | 0.02  : ...              | 0.01  : ##em


# Devise a method to test if the langage model understands Polish cases. E.g. testing for nominal case could be expressed as "Warszawa to największe [MASK]", and the masked word should be in nominative case. Create sentences for each case.

## Mianownik

In [181]:
show_result("Warszawa to największe [MASK]")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.62  : .                     | 0.3   : ...              | 0.56  : miasto
0.16  : miasto                | 0.16  : miasto           | 0.1   : miasta
0.03  : Miasto                | 0.07  : !                | 0.02  : Miasto
0.02  : miasta                | 0.05  : ...              | 0.01  : .
0.01  : :                     | 0.05  : city             | 0.01  : ##sza


## Dopełniacz

In [183]:
show_result("Kasia nie zrobiła [MASK]")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.89  : .                     | 0.45  : nic              | 0.21  : ?
0.03  : ,                     | 0.11  : .                | 0.14  : .
0.02  : ;                     | 0.08  : zdjęcia          | 0.1   : !
0.01  : :                     | 0.06  : ...              | 0.03  : :
0.0   : !                     | 0.06  : zdjęć            | 0.03  : ;


## Celownik

In [184]:
show_result("Poskarżyłem się [MASK] na nieuprzejmego klienta")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.09  : nawet                 | 0.24  : jak              | 0.02  : tylko
0.09  : tylko                 | 0.07  : nawet            | 0.02  : wszystkim
0.06  : nie                   | 0.05  : już              | 0.02  : 丫
0.05  : również               | 0.05  : tylko            | 0.02  : pracy
0.04  : także                 | 0.05  : ostatnio         | 0.01  : miejsca


## Biernik

In [186]:
show_result("Matka usypia małe [MASK]")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.53  : .                     | 0.67  : dziecko          | 0.43  : dzieci
0.02  : ;                     | 0.09  : dzieci           | 0.03  : :
0.02  : ,                     | 0.06  : j                | 0.03  : utanas
0.02  : dni                   | 0.02  : mu               | 0.02  : .
0.02  : ...                   | 0.02  : go               | 0.02  : ২০০১


## Narzędnik

In [187]:
show_result("Idę sobie na spacer razem z [MASK]")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.35  : nią                   | 0.33  : dziećmi          | 0.06  : innymi
0.05  : nim                   | 0.21  : dzieckiem        | 0.04  : siebie
0.04  : żoną                  | 0.19  : ...              | 0.04  : nim
0.04  : tym                   | 0.03  : nią              | 0.03  : :
0.02  : którą                 | 0.03  : ...              | 0.03  : nimi


## Miejscownik

In [188]:
show_result("Rozmawialiśmy wczoraj o [MASK]. Ma jutro padać.")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.12  : tym                   | 0.04  : 12               | 0.34  : 1596
0.04  : to                    | 0.04  : 10               | 0.06  : ##czu
0.03  : co                    | 0.03  : tym              | 0.03  : ziemi
0.03  : północy               | 0.03  : 11               | 0.02  : Ziemi
0.02  : tom                   | 0.02  : 6                | 0.01  : wiele


## Wołacz

In [189]:
show_result("[MASK]! Czas na obiad!")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.3   : !                     | 0.12  : Hej              | 0.02  : !
0.02  : -                     | 0.04  : Super            | 0.01  : Oh
0.01  : ...                   | 0.02  : Ah               | 0.01  : Polonia
0.01  : ¡                     | 0.02  : Wow              | 0.01  : Nie
0.01  : Pan                   | 0.02  : OK               | 0.01  : Pan


# Devise a method to test long-range relationships such as gender. E.e. you can use two verbs where withe masculine and feminine gender, where one of the verbs is masked. Both verbs should have the same gender, assuming the subject is the same. Define at least 3 such sentences.

In [192]:
show_result("Byłam tam razem z nim. Od początku [MASK], że coś jest nie tak")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.28  : to                    | 0.36  : wiem             | 0.12  : ἶ
0.11  : tego                  | 0.09  : myślę            | 0.1   : tego
0.06  : pokazuje              | 0.09  : wiedział         | 0.02  : ##няя
0.02  : jest                  | 0.07  : widać            | 0.02  : jest
0.02  : ,                     | 0.06  : stwierdził       | 0.02  : to


In [191]:
show_result("Rozwiązywałem zadanie domowe, a potem [MASK] coś zjeść")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.48  : na                    | 0.45  : miałem           | 0.12  : przez
0.06  : to                    | 0.12  : chciał           | 0.04  : ich
0.05  : za                    | 0.09  : musiał           | 0.04  : gdy
0.02  : przez                 | 0.05  : mieliśmy         | 0.04  : jak
0.02  : on                    | 0.05  : miałam           | 0.02  : na


In [193]:
show_result("Wspólnie podrózowaliśmy po Europie. Zawsze kiedy prosiłem [MASK] o pomoc, była przy mnie")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.68  : ##my                  | 0.83  : ją               | 0.09  : sobie
0.04  : ##y                   | 0.13  : jej              | 0.08  : ich
0.03  : ##ś                   | 0.01  : je               | 0.06  : sie
0.03  : mu                    | 0.01  : kogoś            | 0.05  : było
0.02  : ##mu                  | 0.0   : nią              | 0.03  : się


# Check if the model captures real-world knolwedge. For instance a sentence "[MASK] wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza." checks if the model "knows" the description of water. Define at least 3 such sentences.

In [194]:
show_result("[MASK] wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.04  : Jego                  | 0.11  : Najlepiej        | 0.09  : Na
0.03  : Za                    | 0.1   : -                | 0.05  : We
0.03  : Po                    | 0.04  : Najczęściej      | 0.03  : Od
0.02  : Na                    | 0.04  : –                | 0.03  : W
0.02  : W                     | 0.03  : Następnie        | 0.03  : we


In [198]:
show_result("Temepratura słońca wynosi [MASK] stopni Celsjusza")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.1   : nie                   | 0.03  : Strona           | 0.07  : Film
0.09  : ma                    | 0.02  : Nie              | 0.04  : Program
0.04  : -                     | 0.02  : •                | 0.03  : Miasto
0.03  : Ma                    | 0.01  : -                | 0.03  : Muzeum
0.02  : życie                 | 0.01  : Ona              | 0.02  : Parafia


In [199]:
show_result("Rok przestępny ma [MASK] dni")

bert-base-multilingual-cased  | xlm-roberta-base         | distilbert-base-multilingual-cased
0.06  : 6                     | 0.07  : 365              | 0.05  : kilka
0.04  : 3                     | 0.04  : 180              | 0.02  : trzy
0.03  : 4                     | 0.04  : 90               | 0.02  : 3
0.03  : 5                     | 0.03  : 30               | 0.01  : 6
0.03  : 7                     | 0.03  : 14               | 0.01  : cztery


## Answer the following questions:

###    Which of the models produced the best results?
Biorąc pod uwagę wszystkie zadania najlepiej poradził sobie model XLM
### Was any of the models able to capture Polish grammar?
Żaden model w 100% nie poradził sobie z tym zadaniem. Najlepiej poszło XLM, po nim distiblert a na końcu bert
### Was any of the models able to capture long-distant relationships between the words?
Tak. Model XLM dał sobie radę.
### Was any of the models able to capture world knowledge?
Niestety, ale tylko w jednym przypadku poradził sobie model XLM
### What are the most striking errors made by the models?
Wyrzucanie artefaktów typu ##няя i wstawianie wyrazu z dużej litery w środku zdania np. Film, Program, Miasto, Muzeum, Parafia
