In [1]:
from transformers import pipeline
from IPython.display import display, Markdown

## Init

In [2]:
unmasker_herbert = pipeline("fill-mask", model="allegro/herbert-base-cased")

Some weights of the model checkpoint at allegro/herbert-base-cased were not used when initializing BertForMaskedLM: ['cls.sso.sso_relationship.bias', 'cls.sso.sso_relationship.weight']
- This IS expected if you are initializing BertForMaskedLM from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForMaskedLM from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


In [3]:
unmasker_bert = pipeline("fill-mask", model="dkleczek/bert-base-polish-cased-v1")

Some weights of the model checkpoint at dkleczek/bert-base-polish-cased-v1 were not used when initializing BertForMaskedLM: ['cls.seq_relationship.weight', 'cls.seq_relationship.bias']
- This IS expected if you are initializing BertForMaskedLM from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForMaskedLM from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


In [4]:
unmasker_distilbert = pipeline("fill-mask", model="Geotrend/distilbert-base-pl-cased")

In [5]:
models = [ (unmasker_herbert, "herbert"), (unmasker_bert, "bert"), (unmasker_distilbert, "distilbert") ]

## Grammatical Case Sentences
(M) Warszawa to największe [MASK].\
(D) Te zabawki należą do [MASK].\
(C) Policjant przygląda się [MASK].\
(B) Na środku skrzyżowania widać [MASK].\
(N) Właściciel samochodu widział złodzieja z [MASK].\
(Ms) Prezydent z premierem rozmawiali wczoraj o [MASK].\
(W) Witaj drogi [MASK].

In [6]:
MASK_TOKEN = "[TOKEN]"

def evaluate_model(sentence, umasker_model):
    return umasker_model(sentence)

def evaluate_models(sentence, models):
    for ummodel, name in models:
        display(Markdown('#### '+name))
        masked_sentence = sentence.replace(MASK_TOKEN, ummodel.tokenizer.mask_token)
        best_ans = evaluate_model(masked_sentence, ummodel)[:5]
        best_ans_str = map(lambda f: f"{f['sequence']}\t\t{f['score']}", best_ans)
        print('\n'.join(best_ans_str))

def evaluate_sentences(sentences, models):
    for sentence in sentences:
        display(Markdown(f"### Evaluating: {sentence}"))
        evaluate_models(sentence, models)

In [7]:
sentences = [
    f"Warszawa to największe {MASK_TOKEN}.",
    f"Te zabawki należą do {MASK_TOKEN}.",
    f"Policjant przygląda się {MASK_TOKEN}.",
    f"Na środku skrzyżowania widać {MASK_TOKEN}.",
    f"Właściciel samochodu widział złodzieja z {MASK_TOKEN}.",
    f"Prezydent z premierem rozmawiali wczoraj o {MASK_TOKEN}.",
    f"Witaj drogi {MASK_TOKEN}."
]

evaluate_sentences(sentences, models)

### Evaluating: Warszawa to największe [TOKEN].

#### herbert

Warszawa to największe miasto.		0.8103950023651123
Warszawa to największe lotnisko.		0.08249199390411377
Warszawa to największe centrum.		0.02652076445519924
Warszawa to największe miasta.		0.017986927181482315
Warszawa to największe atrakcje.		0.005562830250710249


#### bert

Warszawa to największe miasto.		0.9553058743476868
Warszawa to największe województwo.		0.006508143153041601
Warszawa to największe lotnisko.		0.005074844229966402
Warszawa to największe miasteczko.		0.004880094435065985
Warszawa to największe państwo.		0.004011814948171377


#### distilbert

Warszawa to największe miasto.		0.6985588073730469
Warszawa to największe miasta.		0.08950246125459671
Warszawa to największe Miasto.		0.03916599974036217
Warszawa to największe centrum.		0.016345124691724777
Warszawa to największe dzielnicy.		0.013264858163893223


### Evaluating: Te zabawki należą do [TOKEN].

#### herbert

Te zabawki należą do rodziny.		0.0833359807729721
Te zabawki należą do nas.		0.07163650542497635
Te zabawki należą do nich.		0.06476955860853195
Te zabawki należą do najlepszych.		0.062136389315128326
Te zabawki należą do..		0.04569815844297409


#### bert

Te zabawki należą do ciebie.		0.19078467786312103
Te zabawki należą do mnie.		0.1857418268918991
Te zabawki należą do nas.		0.05014022812247276
Te zabawki należą do pana.		0.03315545991063118
Te zabawki należą do niego.		0.02505095861852169


#### distilbert

Te zabawki należą do klasyfikacji.		0.09180326759815216
Te zabawki należą do gry.		0.03872612863779068
Te zabawki należą do rodziny.		0.02968529984354973
Te zabawki należą do grupy.		0.027729257941246033
Te zabawki należą do zespołu.		0.02668699063360691


### Evaluating: Policjant przygląda się [TOKEN].

#### herbert

Policjant przygląda się mężczyźnie.		0.14210954308509827
Policjant przygląda się kobiecie.		0.08927589654922485
Policjant przygląda się mu.		0.07798375189304352
Policjant przygląda się dziewczynie.		0.05407796800136566
Policjant przygląda się sprawie.		0.04702714830636978


#### bert

Policjant przygląda się temu.		0.15562939643859863
Policjant przygląda się sprawie.		0.10590638220310211
Policjant przygląda się im.		0.04426174983382225
Policjant przygląda się wszystkiemu.		0.03768893703818321
Policjant przygląda się panu.		0.03690262883901596


#### distilbert

Policjant przygląda się przeciwko.		0.028363091871142387
Policjant przygląda się LGBT.		0.02539011649787426
Policjant przygląda się walki.		0.0209842249751091
Policjant przygląda się nie.		0.017033295705914497
Policjant przygląda się ludzi.		0.015886077657341957


### Evaluating: Na środku skrzyżowania widać [TOKEN].

#### herbert

Na środku skrzyżowania widać rondo.		0.04156508296728134
Na środku skrzyżowania widać samochody.		0.033592186868190765
Na środku skrzyżowania widać radiowóz.		0.029607480391860008
Na środku skrzyżowania widać samochód.		0.026813512668013573
Na środku skrzyżowania widać wiadukt.		0.02188505046069622


#### bert

Na środku skrzyżowania widać rzekę.		0.05592972785234451
Na środku skrzyżowania widać ulicę.		0.04646577686071396
Na środku skrzyżowania widać drzewa.		0.029843300580978394
Na środku skrzyżowania widać drogę.		0.025307446718215942
Na środku skrzyżowania widać las.		0.02129337377846241


#### distilbert

Na środku skrzyżowania widać wody.		0.04051743075251579
Na środku skrzyżowania widaćały.		0.02319084294140339
Na środku skrzyżowania widać miejsca.		0.019159577786922455
Na środku skrzyżowania widać brak.		0.018739474937319756
Na środku skrzyżowania widaćły.		0.015900157392024994


### Evaluating: Właściciel samochodu widział złodzieja z [TOKEN].

#### herbert

Właściciel samochodu widział złodzieja z samochodu.		0.07134420424699783
Właściciel samochodu widział złodzieja z włamaniem.		0.060669269412755966
Właściciel samochodu widział złodzieja z auta.		0.03344728797674179
Właściciel samochodu widział złodzieja z kierowcą.		0.027661370113492012
Właściciel samochodu widział złodzieja z parkingu.		0.026863349601626396


#### bert

Właściciel samochodu widział złodzieja z bronią.		0.18247674405574799
Właściciel samochodu widział złodzieja z tyłu.		0.08082474023103714
Właściciel samochodu widział złodzieja z ulicy.		0.04090377315878868
Właściciel samochodu widział złodzieja z bliska.		0.028885921463370323
Właściciel samochodu widział złodzieja z zewnątrz.		0.02216586098074913


#### distilbert

Właściciel samochodu widział złodzieja z Warszawy.		0.13469655811786652
Właściciel samochodu widział złodzieja z pochodzenia.		0.043958116322755814
Właściciel samochodu widział złodzieja z Niemiec.		0.03511570394039154
Właściciel samochodu widział złodzieja z Łodzi.		0.029652932658791542
Właściciel samochodu widział złodzieja z Rosji.		0.0245027095079422


### Evaluating: Prezydent z premierem rozmawiali wczoraj o [TOKEN].

#### herbert

Prezydent z premierem rozmawiali wczoraj o przyszłości.		0.033482540398836136
Prezydent z premierem rozmawiali wczoraj o Polsce.		0.02936149574816227
Prezydent z premierem rozmawiali wczoraj o bezpieczeństwie.		0.028243351727724075
Prezydent z premierem rozmawiali wczoraj o polityce.		0.025227518752217293
Prezydent z premierem rozmawiali wczoraj o Warszawie.		0.023644879460334778


#### bert

Prezydent z premierem rozmawiali wczoraj o tym.		0.17878158390522003
Prezydent z premierem rozmawiali wczoraj o Polsce.		0.04206346720457077
Prezydent z premierem rozmawiali wczoraj o budżecie.		0.03967057168483734
Prezydent z premierem rozmawiali wczoraj o ASF.		0.03752078488469124
Prezydent z premierem rozmawiali wczoraj o ustawie.		0.02724410779774189


#### distilbert

Prezydent z premierem rozmawiali wczoraj o prezydenta.		0.10132688283920288
Prezydent z premierem rozmawiali wczoraj o referendum.		0.09290867298841476
Prezydent z premierem rozmawiali wczoraj o władze.		0.053506869822740555
Prezydent z premierem rozmawiali wczoraj o premiera.		0.02867402508854866
Prezydent z premierem rozmawiali wczoraj o LGBT.		0.028474319726228714


### Evaluating: Witaj drogi [TOKEN].

#### herbert

Witaj drogi Łukasz.		0.052066851407289505
Witaj drogi Boże.		0.04442755877971649
Witaj drogi człowieku.		0.031571950763463974
Witaj drogi Karol.		0.02868962287902832
Witaj drogi Marcin.		0.021383196115493774


#### bert

Witaj drogi chłopcze.		0.10708712041378021
Witaj drogi przyjacielu.		0.08946747332811356
Witaj drogi bracie.		0.041904374957084656
Witaj drogi kolego.		0.03567584604024887
Witaj drogi synu.		0.034891653805971146


#### distilbert

Witaj drogi drogi.		0.03955933824181557
Witaj drogi narodowej.		0.025738487020134926
Witaj drogi polskiej.		0.015549941919744015
Witaj drogiwej.		0.015403548255562782
Witaj drogi wschodniej.		0.01382057461887598


## "Gdybym" sentences
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie [MASK].\
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie [MASK].


In [8]:
sentences = [
    f"Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie {MASK_TOKEN}.",
    f"Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie {MASK_TOKEN}."
]

evaluate_sentences(sentences, models)

### Evaluating: Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie [TOKEN].

#### herbert

Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie poddał.		0.11784490942955017
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie zdziwił.		0.08924290537834167
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie dowiedział.		0.08604370057582855
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie zastanawiał.		0.05854702368378639
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie przyznał.		0.051072634756565094


#### bert

Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie zgodził.		0.16778035461902618
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie bał.		0.06955228000879288
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie dowiedział.		0.06697956472635269
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie pojawił.		0.06324417144060135
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie zabił.		0.06266851723194122


#### distilbert

Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie było.		0.1598736196756363
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie stanie.		0.08419004827737808
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie udało.		0.0632275938987732
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie tylko.		0.03790418803691864
Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie odbył.		0.01873672753572464


### Evaluating: Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie [TOKEN].

#### herbert

Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie dowiedziała.		0.2564222514629364
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie przyznała.		0.14438189566135406
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie bała.		0.11880426853895187
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie zmieniła.		0.07193319499492645
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie zgodziła.		0.0586412250995636


#### bert

Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie zgodziła.		0.30042004585266113
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie bała.		0.14670626819133759
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie dowiedziała.		0.10883668810129166
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie pojawiła.		0.07736910879611969
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie zabiła.		0.07481027394533157


#### distilbert

Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie było.		0.1824844628572464
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie udało.		0.08469732850790024
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie stanie.		0.06681223213672638
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie tylko.		0.032014910131692886
Gdybym wiedziała wtedy dokładnie to, co wiem teraz, to bym się nie ma.		0.02377212606370449


## Fact Sentences
[MASK] wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.\
W wakacje odwiedziłem [MASK], który jest stolicą Islandii.\
Informatyka na [MASK] należy do najlepszych kierunków w Polsce.


In [10]:
sentences = [
    f"{MASK_TOKEN} wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",
    f"W wakacje odwiedziłem {MASK_TOKEN}, który jest stolicą Islandii.",
    f"Informatyka na {MASK_TOKEN} należy do najlepszych kierunków w Polsce."
]

evaluate_sentences(sentences, models)

### Evaluating: [TOKEN] wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.

#### herbert

Woda wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.3619919419288635
Słońce wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.04559851437807083
Ziemia wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.04044831544160843
Następnie wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.029730435460805893
Ciało wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.02254605107009411


#### bert

Woda wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.167125403881073
Mięso wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.06379467993974686
Słońce wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.06294798851013184
Nie wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.05818329378962517
Ziemia wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.03854728117585182


#### distilbert

Na wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.07191677391529083
We wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.05382804945111275
Od wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.0419539250433445
Maja wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.0390627346932888
Zmarł wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.		0.03851768746972084


### Evaluating: W wakacje odwiedziłem [TOKEN], który jest stolicą Islandii.

#### herbert

W wakacje odwiedziłem Kraków, który jest stolicą Islandii.		0.15435504913330078
W wakacje odwiedziłem Oslo, który jest stolicą Islandii.		0.14198605716228485
W wakacje odwiedziłem Londyn, który jest stolicą Islandii.		0.05218754708766937
W wakacje odwiedziłem Gdańsk, który jest stolicą Islandii.		0.048521824181079865
W wakacje odwiedziłem Toruń, który jest stolicą Islandii.		0.02907756343483925


#### bert

W wakacje odwiedziłem kraj, który jest stolicą Islandii.		0.29018425941467285
W wakacje odwiedziłem Cypr, który jest stolicą Islandii.		0.045035939663648605
W wakacje odwiedziłem Meksyk, który jest stolicą Islandii.		0.03142372891306877
W wakacje odwiedziłem Gibraltar, który jest stolicą Islandii.		0.028165629133582115
W wakacje odwiedziłem Wellington, który jest stolicą Islandii.		0.026536082848906517


#### distilbert

W wakacje odwiedziłem kraju, który jest stolicą Islandii.		0.04946371167898178
W wakacje odwiedziłem pochodzi, który jest stolicą Islandii.		0.01846936158835888
W wakacje odwiedziłem flag, który jest stolicą Islandii.		0.017351115122437477
W wakacje odwiedziłem wody, który jest stolicą Islandii.		0.015321622602641582
W wakacje odwiedziłem referendum, który jest stolicą Islandii.		0.014857359230518341


### Evaluating: Informatyka na [TOKEN] należy do najlepszych kierunków w Polsce.

#### herbert

Informatyka na pewno należy do najlepszych kierunków w Polsce.		0.3519022464752197
Informatyka na AGH należy do najlepszych kierunków w Polsce.		0.07368846982717514
Informatyka na UW należy do najlepszych kierunków w Polsce.		0.04948342218995094
Informatyka na studiach należy do najlepszych kierunków w Polsce.		0.040828049182891846
Informatyka na UMK należy do najlepszych kierunków w Polsce.		0.03897861763834953


#### bert

Informatyka na wsi należy do najlepszych kierunków w Polsce.		0.10025089234113693
Informatyka na świecie należy do najlepszych kierunków w Polsce.		0.09419262409210205
Informatyka na żywo należy do najlepszych kierunków w Polsce.		0.0857362151145935
Informatyka na pewno należy do najlepszych kierunków w Polsce.		0.07408226281404495
Informatyka na odległość należy do najlepszych kierunków w Polsce.		0.03856080397963524


#### distilbert

Informatyka na stacji należy do najlepszych kierunków w Polsce.		0.30438029766082764
Informatyka na Uniwersytecie należy do najlepszych kierunków w Polsce.		0.03257318586111069
Informatyka na Ziemi należy do najlepszych kierunków w Polsce.		0.01626773364841938
Informatyka na terenie należy do najlepszych kierunków w Polsce.		0.011560886166989803
Informatyka na ulicy należy do najlepszych kierunków w Polsce.		0.011300485581159592


## Questions


##### Which of the models produced the best results?
allegro/herbert-base-cased

##### Was any of the models able to capture Polish grammar?
Yes! Almost all of them, e.g. wiedziała - zgodziła. Only "Geotrend/distilbert-base-pl-cased" had problems

##### Was any of the models able to capture long-distant relationships between the words?
Yes! AGH - UW - UMK

##### Was any of the models able to capture world knowledge?
For the water it was possible because the score is much higher for water than for other, but all models failed while checking what is the capital of Iceland.

##### What are the most striking errors made by the models?
"Informatyka na UW należy do najlepszych kierunków w Polsce."

...


"Gdybym wiedział wtedy dokładnie to, co wiem teraz, to bym się nie zabił."
"Policjant przygląda się nie." - not gramatically correct