In [None]:
!pip install transformers
!pip install sacremoses

In [4]:
from transformers import pipeline
import pandas as pd

In [5]:
#RoBERTa
roberta = pipeline('fill-mask', model='xlm-roberta-base')

Downloading:   0%|          | 0.00/615 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/1.12G [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/9.10M [00:00<?, ?B/s]

In [6]:
#HerBERT Allegro
herbert = pipeline('fill-mask', model='allegro/herbert-base-cased')

Downloading:   0%|          | 0.00/472 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/654M [00:00<?, ?B/s]

Some weights of the model checkpoint at allegro/herbert-base-cased were not used when initializing BertForMaskedLM: ['cls.sso.sso_relationship.bias', 'cls.sso.sso_relationship.weight']
- This IS expected if you are initializing BertForMaskedLM from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForMaskedLM from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


Downloading:   0%|          | 0.00/229 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/907k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/556k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/129 [00:00<?, ?B/s]

In [7]:
# DistilBERT
distilbert = pipeline("fill-mask", model="distilbert-base-multilingual-cased")

Downloading:   0%|          | 0.00/466 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/542M [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/29.0 [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/996k [00:00<?, ?B/s]

Downloading:   0%|          | 0.00/1.96M [00:00<?, ?B/s]

### Devise a method to test if the langage model understands Polish cases. E.g. testing for nominal case could be expressed as "Warszawa to największe [MASK]", and the masked word should be in nominative case. Create sentences for each case.

In [27]:
def test_model(model, cases, replace_mask = False):
    results = pd.DataFrame(columns = ['case', 'content', 'prediction', 'score'])
    for case, content in cases.items():
        if replace_mask:
            content = content.replace("<mask>", "[MASK]")
        predictions = model(content)
        for prediction in predictions:
            results = results.append({
              'case' : case,
              'content' : content,
              'prediction' : prediction['sequence'],
              'score' : prediction['score']
          }, ignore_index=True)
        return results

In [28]:
cases = {
  "Nominative": "Warszawa to największe <mask>",
  "Genitive": "Szarlotka <mask> nie ma sobie równych.",
  "Dative": "Mówiłem <mask>, żeby tego nie robił.", 
  "Accusative": "Za tym wzniesieniem świetnie widać <mask>",
  "Instrumental": "Do domu zawsze wracam <mask>", 
  "Locative": "Przed snem zawsze myślę o <mask>",
  "Vocative": "Ożeż ty <mask>!"
}

roberta_1 = test_model(roberta, cases)
herbert_1 = test_model(herbert, cases)
distilbert_1 = test_model(distilbert, cases, True)

In [30]:
final_df_1 = pd.DataFrame({
        "case": roberta_1.case, 
        "sentence": roberta_1.content,
        "roberta_prediction": roberta_1.prediction,
        "roberta_score": roberta_1.score,
        "herbert_prediction": herbert_1.prediction,
        "herbert_score": herbert_1.score,
        "distilbert_prediction": distilbert_1.prediction,
        "distilbert_score": distilbert_1.score,           
})

In [31]:
final_df_1

Unnamed: 0,case,sentence,roberta_prediction,roberta_score,herbert_prediction,herbert_score,distilbert_prediction,distilbert_score
0,Nominative,Warszawa to największe <mask>,Warszawa to największe...,0.296859,Warszawa to największe miasto,0.853428,Warszawa to największe miasto,0.5586
1,Nominative,Warszawa to największe <mask>,Warszawa to największe miasto,0.164943,Warszawa to największe …,0.029933,Warszawa to największe miasta,0.103281
2,Nominative,Warszawa to największe <mask>,Warszawa to największe!,0.066985,Warszawa to największe miasta,0.024026,Warszawa to największe Miasto,0.023797
3,Nominative,Warszawa to największe <mask>,Warszawa to największe...,0.053526,Warszawa to największe lotnisko,0.021139,Warszawa to największe.,0.013984
4,Nominative,Warszawa to największe <mask>,Warszawa to największe city,0.053058,Warszawa to największe centrum,0.015283,Warszawa to największesza,0.008158
5,Genitive,Szarlotka <mask> nie ma sobie równych.,"Szarlotka, nie ma sobie równych.",0.248807,Szarlotka ta nie ma sobie równych.,0.060571,Szarlotka 缚 nie ma sobie równych.,0.030699
6,Genitive,Szarlotka <mask> nie ma sobie równych.,Szarlotka też nie ma sobie równych.,0.088874,Szarlotka jednak nie ma sobie równych.,0.042849,Szarlotka wody nie ma sobie równych.,0.02857
7,Genitive,Szarlotka <mask> nie ma sobie równych.,Szarlotka to nie ma sobie równych.,0.067007,Szarlotka wciąż nie ma sobie równych.,0.023965,Szarlotka nie nie ma sobie równych.,0.026713
8,Genitive,Szarlotka <mask> nie ma sobie równych.,Szarlotka nigdy nie ma sobie równych.,0.055717,Szarlotka nadal nie ma sobie równych.,0.020215,Szarlotka ta nie ma sobie równych.,0.021784
9,Genitive,Szarlotka <mask> nie ma sobie równych.,Szarlotka - nie ma sobie równych.,0.047522,Szarlotka też nie ma sobie równych.,0.019942,Szarlotka człowieka nie ma sobie równych.,0.019279


### Devise a method to test long-range relationships such as gender. E.e. you can use two verbs where withe masculine and feminine gender, where one of the verbs is masked. Both verbs should have the same gender, assuming the subject is the same. Define at least 3 such sentences.

In [33]:
cases_gender = {
  "sequence_1" : 'Chciałem iść na lodowisko, ale zaczęła się burza śnieżna, więc <mask> czytać książkę.', #zaczalem
  "sequence_2" : 'Gdy mama, dowiedziała się o stanie zdrowia babci, <mask>, aby się nią zająć.', #przyjechala
  "sequence_3" : 'W jednej z wersji Edyp z Koryntu podbił Teby, został królem, poślubił Jokastę, kapłankę Hery  i <mask>, że odtąd królestwo będzie przekazywane z ojca na syna.' #oznajmił
}

roberta_2 = test_model(roberta, cases_gender)
herbert_2 = test_model(herbert, cases_gender)
distilbert_2 = test_model(distilbert, cases_gender, True)

In [37]:
pd.options.display.max_colwidth = 200
print(roberta_2)

          case  \
0   sequence_1   
1   sequence_1   
2   sequence_1   
3   sequence_1   
4   sequence_1   
5   sequence_2   
6   sequence_2   
7   sequence_2   
8   sequence_2   
9   sequence_2   
10  sequence_3   
11  sequence_3   
12  sequence_3   
13  sequence_3   
14  sequence_3   

                                                                                                                                                           content  \
0                                                                            Chciałem iść na lodowisko, ale zaczęła się burza śnieżna, więc <mask> czytać książkę.   
1                                                                            Chciałem iść na lodowisko, ale zaczęła się burza śnieżna, więc <mask> czytać książkę.   
2                                                                            Chciałem iść na lodowisko, ale zaczęła się burza śnieżna, więc <mask> czytać książkę.   
3                                              

In [38]:
print(herbert_2)

          case  \
0   sequence_1   
1   sequence_1   
2   sequence_1   
3   sequence_1   
4   sequence_1   
5   sequence_2   
6   sequence_2   
7   sequence_2   
8   sequence_2   
9   sequence_2   
10  sequence_3   
11  sequence_3   
12  sequence_3   
13  sequence_3   
14  sequence_3   

                                                                                                                                                           content  \
0                                                                            Chciałem iść na lodowisko, ale zaczęła się burza śnieżna, więc <mask> czytać książkę.   
1                                                                            Chciałem iść na lodowisko, ale zaczęła się burza śnieżna, więc <mask> czytać książkę.   
2                                                                            Chciałem iść na lodowisko, ale zaczęła się burza śnieżna, więc <mask> czytać książkę.   
3                                              

In [39]:
print(distilbert_2)

          case  \
0   sequence_1   
1   sequence_1   
2   sequence_1   
3   sequence_1   
4   sequence_1   
5   sequence_2   
6   sequence_2   
7   sequence_2   
8   sequence_2   
9   sequence_2   
10  sequence_3   
11  sequence_3   
12  sequence_3   
13  sequence_3   
14  sequence_3   

                                                                                                                                                           content  \
0                                                                            Chciałem iść na lodowisko, ale zaczęła się burza śnieżna, więc [MASK] czytać książkę.   
1                                                                            Chciałem iść na lodowisko, ale zaczęła się burza śnieżna, więc [MASK] czytać książkę.   
2                                                                            Chciałem iść na lodowisko, ale zaczęła się burza śnieżna, więc [MASK] czytać książkę.   
3                                              

### Check if the model captures real-world knolwedge. For instance a sentence "[MASK] wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza." checks if the model "knows" the description of water. Define at least 3 such sentences.

In [46]:
cases_knowledge = {
    'sequence_1' : "<mask> wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",
    'sequence_2' : "Mount <mask> to najwyższy szczyt świata.",
    'sequence_3' : "Powietrze składa się głownie z azotu i <mask>.",
}

roberta_3 = test_model(roberta, cases_knowledge)
herbert_3 = test_model(herbert, cases_knowledge)
distilbert_3 = test_model(distilbert, cases_knowledge, True)

In [47]:
final_df_3 = pd.DataFrame({
        "case": roberta_3.case, 
        "sentence": roberta_3.content,
        "roberta_prediction": roberta_3.prediction,
        "roberta_score": roberta_3.score,
        "herbert_prediction": herbert_3.prediction,
        "herbert_score": herbert_3.score,
        "distilbert_prediction": distilbert_3.prediction,
        "distilbert_score": distilbert_3.score,           
})

In [48]:
final_df_3

Unnamed: 0,case,sentence,roberta_prediction,roberta_score,herbert_prediction,herbert_score,distilbert_prediction,distilbert_score
0,sequence_1,"<mask> wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.","Najlepiej wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.114664,"Woda wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.36199,"Na wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.088129
1,sequence_1,"<mask> wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.","- wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.101124,"Słońce wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.045598,"We wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.049293
2,sequence_1,"<mask> wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.","Najczęściej wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.04048,"Ziemia wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.040449,"Od wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.033522
3,sequence_1,"<mask> wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.","– wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.036354,"Następnie wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.029731,"W wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.032501
4,sequence_1,"<mask> wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.","Następnie wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.033539,"Ciało wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.022546,"we wrze w temperaturze 100 stopni, a zamarza w temperaturze 0 stopni Celsjusza.",0.029776
5,sequence_2,Mount <mask> to najwyższy szczyt świata.,Mount Everest to najwyższy szczyt świata.,0.853797,Mount Sky to najwyższy szczyt świata.,0.319353,Mount Jerzy to najwyższy szczyt świata.,0.117299
6,sequence_2,Mount <mask> to najwyższy szczyt świata.,Mount Kilimanjaro to najwyższy szczyt świata.,0.106505,Mount Ben to najwyższy szczyt świata.,0.08954,Mount 僅 to najwyższy szczyt świata.,0.087421
7,sequence_2,Mount <mask> to najwyższy szczyt świata.,Mount Fuji to najwyższy szczyt świata.,0.021932,Mount Hill to najwyższy szczyt świata.,0.046483,Mount Fuji to najwyższy szczyt świata.,0.021483
8,sequence_2,Mount <mask> to najwyższy szczyt świata.,Mount Carmel to najwyższy szczyt świata.,0.005713,Mount Rashid to najwyższy szczyt świata.,0.044928,Mount Terror to najwyższy szczyt świata.,0.011461
9,sequence_2,Mount <mask> to najwyższy szczyt świata.,Mount Buda to najwyższy szczyt świata.,0.000958,Mount Jackson to najwyższy szczyt świata.,0.025725,Mount Everest to najwyższy szczyt świata.,0.009276


### Answer the following questions:
- Which of the models produced the best results?
- Was any of the models able to capture Polish grammar?
- Was any of the models able to capture long-distant relationships between the words?
- Was any of the models able to capture world knowledge?
- What are the most striking errors made by the models?

W 1, 2 i 3 zadaniu herbert był najlepszy.

Bywa różnie, raz lepiej sobie radzą z gramatyką raz gorzej.

Tak, herbert.

Nie do końca. Nie zawsze prawidłowa odpowiedź miała największy score.

