# Language modelling
Mateusz Wojtulewicz

## 1. Read the documentation of [Language modelling in the Transformers](https://huggingface.co/docs/transformers/task_summary#language-modeling).



In [78]:
from IPython.display import clear_output 

!pip install transformers
!pip install sacremoses

clear_output()
print("Done.")

Done.


In [23]:
from transformers import (
    AutoTokenizer, 
    AutoModelForMaskedLM, 
    AutoModelWithLMHead, 
    BertTokenizer, 
    BertForMaskedLM, 
    AutoModel,
    pipeline
)

from pprint import pprint

## 2. Download three [Polish models](https://huggingface.co/models?filter=pl) from the Huggingface repository.

I'm using a Polish BERT model, a Polish GPT-2 model and a multilingual XLM-RoBERT model.

In [74]:
polbert = {
    "tokenizer": BertTokenizer.from_pretrained("dkleczek/bert-base-polish-uncased-v1"),
    "model": BertForMaskedLM.from_pretrained("dkleczek/bert-base-polish-uncased-v1")
}

def use_polbert(*parts):
    unmasker = pipeline(
        "fill-mask", 
        model=polbert["model"], 
        tokenizer=polbert["tokenizer"]
    )
    sentence = f" {unmasker.tokenizer.mask_token} ".join(parts)
    outputs = unmasker(sentence)
    for i, out in enumerate(outputs):
        print(f"{i+1} (score = {out['score']:.3f}): {out['sequence']}")

Some weights of the model checkpoint at dkleczek/bert-base-polish-uncased-v1 were not used when initializing BertForMaskedLM: ['cls.seq_relationship.bias', 'cls.seq_relationship.weight']
- This IS expected if you are initializing BertForMaskedLM from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForMaskedLM from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


In [75]:
use_polbert("S≈Çowacki wielkim", "by≈Ç.")

1 (score = 0.112): s≈Çowacki wielkim poeta by≈Ç.
2 (score = 0.095): s≈Çowacki wielkim cz≈Çowiekiem by≈Ç.
3 (score = 0.066): s≈Çowacki wielkim bohaterem by≈Ç.
4 (score = 0.056): s≈Çowacki wielkim kutasem by≈Ç.
5 (score = 0.048): s≈Çowacki wielkim nie by≈Ç.


In [76]:
use_polbert("", "wrze w 100 stopniach Celsjusza.")

1 (score = 0.275): woda wrze w 100 stopniach celsjusza.
2 (score = 0.112): temperatura wrze w 100 stopniach celsjusza.
3 (score = 0.045): nie wrze w 100 stopniach celsjusza.
4 (score = 0.041): tlen wrze w 100 stopniach celsjusza.
5 (score = 0.037): - wrze w 100 stopniach celsjusza.


In [84]:
papuga = {
    "model": AutoModelWithLMHead.from_pretrained("flax-community/papuGaPT2"),
    "tokenizer": AutoTokenizer.from_pretrained("flax-community/papuGaPT2")
}

def use_papuga(sentence: str):
    input_ids = papuga["tokenizer"].encode(sentence, return_tensors="pt")

    outputs = papuga["model"].generate(
        input_ids,
        do_sample=True, 
        max_new_tokens=15, 
        top_k=50, 
        top_p=0.95, 
        num_return_sequences=5
    )
    sentences = [
        papuga["tokenizer"].decode(out, skip_special_tokens=True) 
        for out in outputs
    ]

    clear_output()
    for i, s in enumerate(sentences):
        print(f"{i+1}: {s}")



In [85]:
use_papuga("W 100 stopniach Celsjusza wrze")

1: W 100 stopniach Celsjusza wrze na rozgrzanej grza≈Çce, co powoduje wzrost temperatury o 20 stopni Celsjusza.
2: W 100 stopniach Celsjusza wrze z g√≥ry i w ≈õrodku. Jak ostygnie - jest to tzw. wrzƒÖ
3: W 100 stopniach Celsjusza wrze. Nastƒôpnie do ciasta dodajemy startƒÖ czekoladƒô i mieszamy, a≈º do po≈ÇƒÖczenia sk≈Çadnik√≥w
4: W 100 stopniach Celsjusza wrzeƒá nale≈ºy 1 minutƒô i 10 sekund. Dodaƒá ≈Çy≈ºkƒô mƒÖki. Mieszamy mƒÖkƒô
5: W 100 stopniach Celsjusza wrzecionko, by je podgrzaƒá. Podgrzewam wodƒô do temperatury


In [86]:
use_papuga("Bitwa pod Grunwaldem mia≈Ça miejsce w")

1: Bitwa pod Grunwaldem mia≈Ça miejsce w dniach 11 ‚Äì 15 lipca 1657 r. Na polach Grunwaldu mia≈Çy miejsce
2: Bitwa pod Grunwaldem mia≈Ça miejsce w roku 1210. Do dzi≈õ nie wiadomo, kto pokona≈Ç Grunwald ‚Äì czy
3: Bitwa pod Grunwaldem mia≈Ça miejsce w 1094 roku i trwa≈Ça 12 dni, podczas kt√≥rych armia polsko-litewska
4: Bitwa pod Grunwaldem mia≈Ça miejsce w latach 1410‚Äì1411. Z czasem by≈Ça jednak bardziej spektakularna i
5: Bitwa pod Grunwaldem mia≈Ça miejsce w 1656r. Pod Grunwaldem w 1657r. wojska krzy≈ºackie


In [81]:
roberta = {
    "model": AutoModelForMaskedLM.from_pretrained("xlm-roberta-large"),
    "tokenizer": AutoTokenizer.from_pretrained("xlm-roberta-large")
}

def use_roberta(*parts):
    unmasker = pipeline(
        "fill-mask", 
        model=roberta["model"], 
        tokenizer=roberta["tokenizer"]
    )
    sentence = f" {unmasker.tokenizer.mask_token} ".join(parts)
    outputs = unmasker(sentence)
    for i, out in enumerate(outputs):
        print(f"{i+1} (score = {out['score']:.3f}): {out['sequence']}")

In [82]:
use_roberta("Na g√≥rze", ", na dole fio≈Çki, a my siƒô kochamy jak dwa anio≈Çki.")

1 (score = 0.154): Na g√≥rze s≈Ço≈Ñce, na dole fio≈Çki, a my siƒô kochamy jak dwa anio≈Çki.
2 (score = 0.150): Na g√≥rze ≈õnieg, na dole fio≈Çki, a my siƒô kochamy jak dwa anio≈Çki.
3 (score = 0.139): Na g√≥rze kwiaty, na dole fio≈Çki, a my siƒô kochamy jak dwa anio≈Çki.
4 (score = 0.080): Na g√≥rze g√≥ry, na dole fio≈Çki, a my siƒô kochamy jak dwa anio≈Çki.
5 (score = 0.018): Na g√≥rze r√≥≈º, na dole fio≈Çki, a my siƒô kochamy jak dwa anio≈Çki.


In [83]:
use_polbert("Na g√≥rze", ", na dole fio≈Çki, a my siƒô kochamy jak dwa anio≈Çki.")

1 (score = 0.236): na gorze roze, na dole fio≈Çki, a my sie kochamy jak dwa anio≈Çki.
2 (score = 0.052): na gorze kwiaty, na dole fio≈Çki, a my sie kochamy jak dwa anio≈Çki.
3 (score = 0.014): na gorze lody, na dole fio≈Çki, a my sie kochamy jak dwa anio≈Çki.
4 (score = 0.013): na gorze czekoladki, na dole fio≈Çki, a my sie kochamy jak dwa anio≈Çki.
5 (score = 0.012): na gorze jab≈Çka, na dole fio≈Çki, a my sie kochamy jak dwa anio≈Çki.


## 3. Devise a method to test if the langage model understands Polish cases. Create sentences for each case.

### 1. Mianownik

In [87]:
use_polbert("S≈Ço≈Ñ to najwiƒôksze", "na ≈õwiecie.")

1 (score = 0.473): s≈Çon to najwieksze zwierze na swiecie.
2 (score = 0.102): s≈Çon to najwieksze stworzenie na swiecie.
3 (score = 0.049): s≈Çon to najwieksze z≈Ço na swiecie.
4 (score = 0.048): s≈Çon to najwieksze jab≈Çko na swiecie.
5 (score = 0.032): s≈Çon to najwieksze miasto na swiecie.


In [88]:
use_roberta("S≈Ço≈Ñ to najwiƒôksze", "na ≈õwiecie.")

1 (score = 0.614): S≈Ço≈Ñ to najwiƒôksze s≈Ço≈Ñce na ≈õwiecie.
2 (score = 0.118): S≈Ço≈Ñ to najwiƒôksze ≈∫r√≥d≈Ço na ≈õwiecie.
3 (score = 0.059): S≈Ço≈Ñ to najwiƒôksze ≈õwiat≈Ço na ≈õwiecie.
4 (score = 0.053): S≈Ço≈Ñ to najwiƒôksze cia≈Ço na ≈õwiecie.
5 (score = 0.033): S≈Ço≈Ñ to najwiƒôksze planeta na ≈õwiecie.


In [89]:
use_papuga("Najwiƒôksze zwierze na ≈õwiecie to")

1: Najwiƒôksze zwierze na ≈õwiecie to pies rasy husky, kt√≥ry ≈ºyje tylko przez oko≈Ço 40 sekund. W tym
2: Najwiƒôksze zwierze na ≈õwiecie to ≈õwinka morska. Jest to zwierzƒô z gatunku ≈ºbik√≥w. Mo≈ºna spotkaƒá
3: Najwiƒôksze zwierze na ≈õwiecie to lwy i delfiny. Do ich najwiƒôkszych wrog√≥w nale≈ºƒÖ lwy morskie,
4: Najwiƒôksze zwierze na ≈õwiecie to pies, kt√≥ry w ten spos√≥b zosta≈Ç udomowiony, jest bardzo p≈Ço
5: Najwiƒôksze zwierze na ≈õwiecie to ssaki kopytne. SƒÖ one tak zr√≥≈ºnicowane, ≈ºe stanowiƒÖ o ich charakterze


### 2. Dope≈Çniacz

In [91]:
use_polbert("Od tygodnia szukam", ", nie wiem gdzie siƒô podzia≈Ç.")

1 (score = 0.045): od tygodnia szukam syna, nie wiem gdzie sie podzia≈Ç.
2 (score = 0.040): od tygodnia szukam ch≈Çopaka, nie wiem gdzie sie podzia≈Ç.
3 (score = 0.038): od tygodnia szukam przyjaciela, nie wiem gdzie sie podzia≈Ç.
4 (score = 0.028): od tygodnia szukam brata, nie wiem gdzie sie podzia≈Ç.
5 (score = 0.025): od tygodnia szukam cia≈Ça, nie wiem gdzie sie podzia≈Ç.


In [92]:
use_roberta("Od tygodnia szukam", ", nie wiem gdzie siƒô podzia≈Ç.")

1 (score = 0.085): Od tygodnia szukam go, nie wiem gdzie siƒô podzia≈Ç.
2 (score = 0.072): Od tygodnia szukam kompa, nie wiem gdzie siƒô podzia≈Ç.
3 (score = 0.063): Od tygodnia szukam telefonu, nie wiem gdzie siƒô podzia≈Ç.
4 (score = 0.039): Od tygodnia szukam jej, nie wiem gdzie siƒô podzia≈Ç.
5 (score = 0.029): Od tygodnia szukam syna, nie wiem gdzie siƒô podzia≈Ç.


In [93]:
use_papuga("Nie mogƒô znale≈∫ƒá swojego")

1: Nie mogƒô znale≈∫ƒá swojego. A mo≈ºe on jest ju≈º schowany do kieszeni i nie ma go w
2: Nie mogƒô znale≈∫ƒá swojego laptopa. Nie wiem, czy go oddam. Nie mam te≈º komputera stacjonarnego
3: Nie mogƒô znale≈∫ƒá swojego imienia, kt√≥re by≈Ço by dla ciebie ciekawe i kt√≥re ciƒô fascynowa≈Ço, a
4: Nie mogƒô znale≈∫ƒá swojego stylu pisania i stylu nie mogƒô. Moje dialogi sƒÖ nie do ko≈Ñca sp√≥jne
5: Nie mogƒô znale≈∫ƒá swojego zdjƒôcia? To jest m√≥j ulubiony blog. I m√≥j ulubiony blog o modzie,


### 3. Celownik

In [95]:
use_polbert("Da≈Çem swojej", "pi≈Çkƒô.")

1 (score = 0.446): da≈Çem swojej mamie pi≈Çke.
2 (score = 0.179): da≈Çem swojej matce pi≈Çke.
3 (score = 0.162): da≈Çem swojej dziewczynie pi≈Çke.
4 (score = 0.044): da≈Çem swojej siostrze pi≈Çke.
5 (score = 0.020): da≈Çem swojej dziewczynce pi≈Çke.


In [97]:
use_roberta("Da≈Çem swojej", "pi≈Çkƒô.")

1 (score = 0.250): Da≈Çem swojej stronie pi≈Çkƒô.
2 (score = 0.111): Da≈Çem swojej szkole pi≈Çkƒô.
3 (score = 0.040): Da≈Çem swojej m≈Çodzie≈ºy pi≈Çkƒô.
4 (score = 0.039): Da≈Çem swojej firmie pi≈Çkƒô.
5 (score = 0.032): Da≈Çem swojej grze pi≈Çkƒô.


In [98]:
use_papuga("PrzyglƒÖdam siƒô")

1: PrzyglƒÖdam siƒô jego pracy w internecie i muszƒô przyznaƒá, ≈ºe mnie te≈º ona zachwyci≈Ça.
2: PrzyglƒÖdam siƒô im od d≈Çu≈ºszego czasu...Wg mnie to jest fajny zaw√≥d. Nie ma
3: PrzyglƒÖdam siƒô sobie cotygodniowym felietonom. Tak, bardzo czƒôsto widzƒô w nich
4: PrzyglƒÖdam siƒô w ostatnim momencie (co za szczƒô≈õcie). W ko≈Ñcu za chwilƒô siƒô obudzƒô
5: PrzyglƒÖdam siƒô temu cz≈Çowiekowi w nadziei, ≈ºe i on sam bƒôdzie mia≈Ç dzieci i rodzinƒô jak


### 4. Biernik

In [105]:
use_polbert("Moja mam kupi≈Ça mi", ".")

1 (score = 0.091): moja mam kupi≈Ça mi go.
2 (score = 0.089): moja mam kupi≈Ça mi to.
3 (score = 0.044): moja mam kupi≈Ça mi je.
4 (score = 0.030): moja mam kupi≈Ça mi samochod.
5 (score = 0.024): moja mam kupi≈Ça mi loda.


In [106]:
use_roberta("Moja mama kupi≈Ça mi", ".")

1 (score = 0.065): Moja mama kupi≈Ça mi samoch√≥d.
2 (score = 0.059): Moja mama kupi≈Ça mi ksiƒÖ≈ºkƒô.
3 (score = 0.036): Moja mama kupi≈Ça mi to.
4 (score = 0.035): Moja mama kupi≈Ça mi dom.
5 (score = 0.032): Moja mama kupi≈Ça mi rower.


In [107]:
use_papuga("Moja mama kupi≈Ça mi")

1: Moja mama kupi≈Ça mi w tym sklepie i polecam z ca≈Çego serca. A jak mam jeszcze problem z
2: Moja mama kupi≈Ça mi taki model, wiƒôc od razu narobi≈Çam baton√≥w na ≈õniadanie. SƒÖ
3: Moja mama kupi≈Ça mi te ≈õwiece za grosze i sƒÖ one dostƒôpne praktycznie u ka≈ºdej z Was. Uwa≈ºam
4: Moja mama kupi≈Ça mi dzisiaj nowy olej i w sumie nie wiem czy bym z niego wyrobi≈Ça.
5: Moja mama kupi≈Ça mi na urodziny nowy zestaw do manicure hybrydowego ‚Äì krem o nazwie Serene


### 5. Narzƒôdnik

In [108]:
use_polbert("Ta dziewczyna z d≈Çugimi", "by≈Ça bardzo ≈Çadna.")

1 (score = 0.918): ta dziewczyna z d≈Çugimi w≈Çosami by≈Ça bardzo ≈Çadna.
2 (score = 0.062): ta dziewczyna z d≈Çugimi nogami by≈Ça bardzo ≈Çadna.
3 (score = 0.007): ta dziewczyna z d≈Çugimi oczami by≈Ça bardzo ≈Çadna.
4 (score = 0.003): ta dziewczyna z d≈Çugimi ustami by≈Ça bardzo ≈Çadna.
5 (score = 0.001): ta dziewczyna z d≈Çugimi stopami by≈Ça bardzo ≈Çadna.


In [109]:
use_roberta("Ta dziewczyna z d≈Çugimi", "by≈Ça bardzo ≈Çadna.")

1 (score = 0.863): Ta dziewczyna z d≈Çugimi w≈Çosy by≈Ça bardzo ≈Çadna.
2 (score = 0.067): Ta dziewczyna z d≈Çugimi w≈Ços√≥w by≈Ça bardzo ≈Çadna.
3 (score = 0.012): Ta dziewczyna z d≈Çugimi w≈Ços by≈Ça bardzo ≈Çadna.
4 (score = 0.011): Ta dziewczyna z d≈Çugimi czasami by≈Ça bardzo ≈Çadna.
5 (score = 0.008): Ta dziewczyna z d≈Çugimi bikini by≈Ça bardzo ≈Çadna.


In [110]:
use_papuga("Bardzo spodoba≈Ça mi siƒô ta dziewczyna z d≈Çugimi")

1: Bardzo spodoba≈Ça mi siƒô ta dziewczyna z d≈Çugimi w≈Çosami, kt√≥ra jak tylko zobaczy≈Ça jej zdjƒôcie powiedzia≈Ça, ≈ºe to ju≈º koniec jej
2: Bardzo spodoba≈Ça mi siƒô ta dziewczyna z d≈Çugimi w≈Çosami! :D Nie wiem czy to dlatego ≈ºe mam za d≈Çugie w≈Çosy,
3: Bardzo spodoba≈Ça mi siƒô ta dziewczyna z d≈Çugimi w≈Çosami... jak to siƒô ma do w≈Ços√≥w? WyglƒÖdasz w niej ca≈Çkiem fajnie
4: Bardzo spodoba≈Ça mi siƒô ta dziewczyna z d≈Çugimi w≈Çosami i jest to jedna z najlepszych stylizacji jakie widzia≈Çam. Uwielbiam ten styl i
5: Bardzo spodoba≈Ça mi siƒô ta dziewczyna z d≈Çugimi w≈Çosami, w og√≥le to jej siƒô podoba, poza tym, ≈ºe mia≈Ça kr√≥tkie


### 6. Miejscownik

In [111]:
use_polbert("Nie mogƒô przestaƒá my≈õleƒá o", ".")

1 (score = 0.286): nie moge przestac myslec o tobie.
2 (score = 0.068): nie moge przestac myslec o niej.
3 (score = 0.055): nie moge przestac myslec o tym.
4 (score = 0.037): nie moge przestac myslec o nim.
5 (score = 0.030): nie moge przestac myslec o sobie.


In [112]:
use_roberta("Nie mogƒô przestaƒá my≈õleƒá o", ".")

1 (score = 0.394): Nie mogƒô przestaƒá my≈õleƒá o nim.
2 (score = 0.174): Nie mogƒô przestaƒá my≈õleƒá o tym.
3 (score = 0.165): Nie mogƒô przestaƒá my≈õleƒá o niej.
4 (score = 0.053): Nie mogƒô przestaƒá my≈õleƒá o Nim.
5 (score = 0.022): Nie mogƒô przestaƒá my≈õleƒá o nich.


In [113]:
use_papuga("Nie mogƒô przestaƒá my≈õleƒá o")

1: Nie mogƒô przestaƒá my≈õleƒá o tym jak wspaniale bawi siƒô w tym miejscu. To tak, jakby siƒô tam
2: Nie mogƒô przestaƒá my≈õleƒá o tym, jak bardzo nie doceniasz mojego wk≈Çadu w edukacjƒô i dobrostanie,
3: Nie mogƒô przestaƒá my≈õleƒá o tym jak wyglƒÖda≈Ça moja przygoda z ta≈Ñcem i jakie moje marzenie siƒô spe≈Çni≈Ço
4: Nie mogƒô przestaƒá my≈õleƒá o sobie jak o zwierzƒôciu, a czujƒô siƒô zupe≈Çnie jak ona. ZdƒÖ
5: Nie mogƒô przestaƒá my≈õleƒá o Twoich wspania≈Çych zdjƒôciach i o Twojej tw√≥rczo≈õci :) Pozdrawiam.
Piƒôknie! Ale


### 7. Wo≈Çacz

In [128]:
use_polbert("O ty", "!")

1 (score = 0.132): o ty sukinsynu!
2 (score = 0.068): o ty suko!
3 (score = 0.045): o ty dupku!
4 (score = 0.042): o ty draniu!
5 (score = 0.032): o ty boze!


In [127]:
use_roberta("≈öwiƒôty", ", m√≥dl siƒô za nami.")

1 (score = 0.268): ≈öwiƒôty Bo≈ºe, m√≥dl siƒô za nami.
2 (score = 0.153): ≈öwiƒôty J√≥zef, m√≥dl siƒô za nami.
3 (score = 0.061): ≈öwiƒôty Miko≈Çaj, m√≥dl siƒô za nami.
4 (score = 0.043): ≈öwiƒôty Andrzej, m√≥dl siƒô za nami.
5 (score = 0.037): ≈öwiƒôty Stanis≈Çaw, m√≥dl siƒô za nami.


In [131]:
use_papuga("Nie rozumiesz mnie, m√≥j")

1: Nie rozumiesz mnie, m√≥j ch≈Çopcze, to i ja ciƒô proszƒô bardzo‚Äù - wo≈Ça≈Ç Jezus na
2: Nie rozumiesz mnie, m√≥j przyjacielu... - w jego g≈Çosie nie by≈Ço nutki zadowolenia, bo jak
3: Nie rozumiesz mnie, m√≥j ma≈Çy ptaszku. Ja nie chcƒô, by wszyscy siƒô dowiedzieli. Ja chcƒô
4: Nie rozumiesz mnie, m√≥j Bo≈ºe, tak daleki jeste≈õ od zrozumienia, ≈ºe nie mogƒô uwierzyƒá. To
5: Nie rozumiesz mnie, m√≥j kolega to by≈Ç prawdziwy leszcz. Co ciekawe mia≈Ç wtedy ponad 13lat i


## 4. Devise a method to test long-range relationships such as gender. Define at least 3 sentences.

In [133]:
use_polbert("", ", kt√≥rƒÖ dosta≈Çam od Kuby, to naj≈Çadniejsza jakƒÖ widzia≈Çem w ≈ºyciu.")

1 (score = 0.352): ta, ktora dosta≈Çam od kuby, to naj≈Çadniejsza jaka widzia≈Çem w zyciu.
2 (score = 0.067): sukienka, ktora dosta≈Çam od kuby, to naj≈Çadniejsza jaka widzia≈Çem w zyciu.
3 (score = 0.038): bransoletka, ktora dosta≈Çam od kuby, to naj≈Çadniejsza jaka widzia≈Çem w zyciu.
4 (score = 0.037): dziewczyna, ktora dosta≈Çam od kuby, to naj≈Çadniejsza jaka widzia≈Çem w zyciu.
5 (score = 0.031): kurtka, ktora dosta≈Çam od kuby, to naj≈Çadniejsza jaka widzia≈Çem w zyciu.


In [134]:
use_roberta("", ", kt√≥rƒÖ dosta≈Çam od Kuby, to naj≈Çadniejsza jakƒÖ widzia≈Çem w ≈ºyciu.")

1 (score = 0.388): Ta, kt√≥rƒÖ dosta≈Çam od Kuby, to naj≈Çadniejsza jakƒÖ widzia≈Çem w ≈ºyciu.
2 (score = 0.082): Karta, kt√≥rƒÖ dosta≈Çam od Kuby, to naj≈Çadniejsza jakƒÖ widzia≈Çem w ≈ºyciu.
3 (score = 0.051): Maska, kt√≥rƒÖ dosta≈Çam od Kuby, to naj≈Çadniejsza jakƒÖ widzia≈Çem w ≈ºyciu.
4 (score = 0.027): ta, kt√≥rƒÖ dosta≈Çam od Kuby, to naj≈Çadniejsza jakƒÖ widzia≈Çem w ≈ºyciu.
5 (score = 0.021): Kawa, kt√≥rƒÖ dosta≈Çam od Kuby, to naj≈Çadniejsza jakƒÖ widzia≈Çem w ≈ºyciu.


In [135]:
use_papuga("Nigdy nie widzia≈Çam ≈Çadniejszej")

1: Nigdy nie widzia≈Çam ≈Çadniejszej i co najwa≈ºniejsze - na luzie, bo po raz pierwszy nie by≈Çam w
2: Nigdy nie widzia≈Çam ≈Çadniejszej kobiety. Jestem z Polski. Czy to na pla≈ºy? Tak. Z chƒôciƒÖ
3: Nigdy nie widzia≈Çam ≈Çadniejszej i jeszcze lepiej zachowanej czƒô≈õci ulicy z czas√≥w okupacji. A potem siƒô z
4: Nigdy nie widzia≈Çam ≈Çadniejszej kobiety. Za ka≈ºdym razem, kiedy jƒÖ widzƒô, mam ochotƒô uciec z tƒÖ
5: Nigdy nie widzia≈Çam ≈Çadniejszej! üôÇ Ja te≈º od wielu lat szyjƒô g≈Ç√≥wnie na potrzeby w≈Çasne, wiƒôc nawet


In [137]:
use_polbert("Wszystkie", "mia≈Çy bia≈Çe ubrania i czarne buty.")

1 (score = 0.688): wszystkie ofiary mia≈Çy bia≈Çe ubrania i czarne buty.
2 (score = 0.128): wszystkie kobiety mia≈Çy bia≈Çe ubrania i czarne buty.
3 (score = 0.048): wszystkie dziewczyny mia≈Çy bia≈Çe ubrania i czarne buty.
4 (score = 0.025): wszystkie dzieci mia≈Çy bia≈Çe ubrania i czarne buty.
5 (score = 0.009): wszystkie one mia≈Çy bia≈Çe ubrania i czarne buty.


In [138]:
use_roberta("Wszystkie", "mia≈Çy bia≈Çe ubrania i czarne buty.")

1 (score = 0.647): Wszystkie kobiety mia≈Çy bia≈Çe ubrania i czarne buty.
2 (score = 0.139): Wszystkie dzieci mia≈Çy bia≈Çe ubrania i czarne buty.
3 (score = 0.027): Wszystkie modele mia≈Çy bia≈Çe ubrania i czarne buty.
4 (score = 0.010): Wszystkie trzy mia≈Çy bia≈Çe ubrania i czarne buty.
5 (score = 0.009): Wszystkie osoby mia≈Çy bia≈Çe ubrania i czarne buty.


In [139]:
use_papuga("W zamkniƒôtym przedziale znajdujƒÖ zasztyletowanego")

1: W zamkniƒôtym przedziale znajdujƒÖ zasztyletowanego w nocy na ulicy. Jest kilka os√≥b, kt√≥re go szukajƒÖ, nikt nie
2: W zamkniƒôtym przedziale znajdujƒÖ zasztyletowanego, po d≈Çugim i mƒôczƒÖcym tygodniu. W ciƒÖgu ostatnich dni na korytarzach
3: W zamkniƒôtym przedziale znajdujƒÖ zasztyletowanego. Na drzwiach od kabiny znajduje siƒô krata z otworami drzwiowymi,
4: W zamkniƒôtym przedziale znajdujƒÖ zasztyletowanego m≈Çodzie≈Ñca, jego matkƒô oraz starszego brata z czw√≥rkƒÖ ma≈Çych dzieci, kt√≥rzy
5: W zamkniƒôtym przedziale znajdujƒÖ zasztyletowanego psa, kt√≥ry uciek≈Ç z ulicy, z pomocƒÖ kt√≥rej uratowano go przed ≈õmierciƒÖ


In [166]:
use_polbert("Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie", ".")

1 (score = 0.237): gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym sie nie dowiedzia≈Ç.
2 (score = 0.084): gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym sie nie martwi≈Ç.
3 (score = 0.075): gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym sie nie przyzna≈Ç.
4 (score = 0.075): gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym sie nie zgodzi≈Ç.
5 (score = 0.037): gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym sie nie zdziwi≈Ç.


In [161]:
use_roberta("Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie", ".")

1 (score = 0.415): Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie zmieni≈Ç.
2 (score = 0.076): Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie zdecydowa≈Ç.
3 (score = 0.068): Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie wybra≈Ç.
4 (score = 0.057): Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie pojawi≈Ç.
5 (score = 0.046): Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie przygotowa≈Ç.


In [164]:
use_papuga("Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie")

1: Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie zgodzi≈Ç. Tak jak ja jestem przekonany, ≈ºe jest to czƒô≈õƒá procesu my≈õlenia i
2: Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie martwi≈Ç, ≈ºe przez brak wiary straci≈Çem sw√≥j udzia≈Ç w budowaniu tej ziemi
3: Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie zastanawia≈Ç.
Co do tego, ≈ºe co≈õ jest dobre, to ja nie
4: Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie zgodzi≈Ç! (1) A wtedy Pan odpowiedzia≈Ç mi: Zaprawdƒô, m√≥wiƒô
5: Gdybym wiedzia≈Ç wtedy dok≈Çadnie to, co wiem teraz, to bym siƒô nie zgodzi≈Ç, bo gdybym wiedzia≈Ç z ≈Çatwo≈õciƒÖ to, co wiem dzi≈õ, by≈Çbym g≈Çup


## 5. Check if the model captures real-world knowledge. Define at lest 3 sentences.

In [146]:
sentence = ["Bitwa pod Grunwaldem mia≈Ça miejsce w", "roku."]

In [147]:
use_polbert(*sentence)

1 (score = 0.060): bitwa pod grunwaldem mia≈Ça miejsce w 1920 roku.
2 (score = 0.037): bitwa pod grunwaldem mia≈Ça miejsce w 1919 roku.
3 (score = 0.037): bitwa pod grunwaldem mia≈Ça miejsce w 1939 roku.
4 (score = 0.029): bitwa pod grunwaldem mia≈Ça miejsce w 1792 roku.
5 (score = 0.029): bitwa pod grunwaldem mia≈Ça miejsce w 1945 roku.


In [149]:
use_roberta(*sentence)

1 (score = 0.142): Bitwa pod Grunwaldem mia≈Ça miejsce w 1918 roku.
2 (score = 0.138): Bitwa pod Grunwaldem mia≈Ça miejsce w 1945 roku.
3 (score = 0.127): Bitwa pod Grunwaldem mia≈Ça miejsce w 1939 roku.
4 (score = 0.081): Bitwa pod Grunwaldem mia≈Ça miejsce w 1914 roku.
5 (score = 0.056): Bitwa pod Grunwaldem mia≈Ça miejsce w 1920 roku.


In [151]:
use_papuga(sentence[0])

1: Bitwa pod Grunwaldem mia≈Ça miejsce w 1421 roku, a jej pomys≈ÇodawcƒÖ by≈Ç Jan D≈Çugosz. Jednak dopiero
2: Bitwa pod Grunwaldem mia≈Ça miejsce w latach 1410-1414. W tym czasie pa≈Ñstwo krzy≈ºackie by≈Ço ju≈º
3: Bitwa pod Grunwaldem mia≈Ça miejsce w roku 1412, kiedy to w bitwie pod Grunwaldem wojska krzy≈ºackie straci≈Çy
4: Bitwa pod Grunwaldem mia≈Ça miejsce w roku 1410. Kr√≥l W≈Çadys≈Çaw Jagie≈Ç≈Ço og≈Çosi≈Ç jƒÖ w 1421 roku.
5: Bitwa pod Grunwaldem mia≈Ça miejsce w roku 1454, a wiƒôc mniej wiƒôcej w tym samym czasie, w kt√≥rym


In [152]:
sentence = ["Najwiƒôkszym kontynentem jest", "."]

In [153]:
use_polbert(*sentence)

1 (score = 0.118): najwiekszym kontynentem jest australia.
2 (score = 0.049): najwiekszym kontynentem jest afryka.
3 (score = 0.040): najwiekszym kontynentem jest ameryka.
4 (score = 0.030): najwiekszym kontynentem jest anglia.
5 (score = 0.030): najwiekszym kontynentem jest brazylia.


In [154]:
use_roberta(*sentence)

1 (score = 0.250): Najwiƒôkszym kontynentem jest Australia.
2 (score = 0.132): Najwiƒôkszym kontynentem jest Madagaskar.
3 (score = 0.118): Najwiƒôkszym kontynentem jest Europa.
4 (score = 0.044): Najwiƒôkszym kontynentem jest USA.
5 (score = 0.034): Najwiƒôkszym kontynentem jest India.


In [155]:
use_papuga(sentence[0])

1: Najwiƒôkszym kontynentem jest oczywi≈õcie Australia, a konkretnie jej p√≥≈Çnocna czƒô≈õƒá - Australia Po≈Çudniowa (po≈Çudni
2: Najwiƒôkszym kontynentem jest Australia, a w szczeg√≥lno≈õci okolice Melbourne. Tamtejsza natura jest
3: Najwiƒôkszym kontynentem jest Afryka ≈örodkowa na wysoko≈õci 1200-1300 m n.p.m
4: Najwiƒôkszym kontynentem jest Azja ‚Äì tam ma sw√≥j poczƒÖtek Azjƒô, w kt√≥rej mo≈ºna zaobserwowaƒá najwiƒôkszƒÖ ilo≈õƒá
5: Najwiƒôkszym kontynentem jest w≈Ça≈õnie Afryka.
W tym regionie, je≈õli siƒô nie chce, mo≈ºna znale≈∫ƒá


In [156]:
sentence = ["JednƒÖ z planet Uk≈Çadu S≈Çonecznego jest", "."]

In [157]:
use_polbert(*sentence)

1 (score = 0.137): jedna z planet uk≈Çadu s≈Çonecznego jest ziemia.
2 (score = 0.048): jedna z planet uk≈Çadu s≈Çonecznego jest andromeda.
3 (score = 0.041): jedna z planet uk≈Çadu s≈Çonecznego jest planeta.
4 (score = 0.040): jedna z planet uk≈Çadu s≈Çonecznego jest wenus.
5 (score = 0.028): jedna z planet uk≈Çadu s≈Çonecznego jest tutaj.


In [158]:
use_roberta(*sentence)

1 (score = 0.362): JednƒÖ z planet Uk≈Çadu S≈Çonecznego jest Saturn.
2 (score = 0.309): JednƒÖ z planet Uk≈Çadu S≈Çonecznego jest Mars.
3 (score = 0.085): JednƒÖ z planet Uk≈Çadu S≈Çonecznego jest Jupiter.
4 (score = 0.078): JednƒÖ z planet Uk≈Çadu S≈Çonecznego jest Neptun.
5 (score = 0.027): JednƒÖ z planet Uk≈Çadu S≈Çonecznego jest Luna.


In [159]:
use_papuga(sentence[0])

1: JednƒÖ z planet Uk≈Çadu S≈Çonecznego jest Wenus, zwana tak≈ºe w skr√≥cie Wenus, po≈Ço≈ºona na granicy miƒôdzy Zie
2: JednƒÖ z planet Uk≈Çadu S≈Çonecznego jest Ksiƒô≈ºyc, kt√≥ry jest obecnie najbardziej oddalonym od Ziemi cia≈Çem niebieskim, a w
3: JednƒÖ z planet Uk≈Çadu S≈Çonecznego jest Wenus, kt√≥ra jest uwa≈ºana za najbardziej znanƒÖ planetƒô Uk≈Çadu S≈Çonecznego
4: JednƒÖ z planet Uk≈Çadu S≈Çonecznego jest kometa (Gaia), a dok≈Çadniej ich najbli≈ºsza rodzina komet.
5: JednƒÖ z planet Uk≈Çadu S≈Çonecznego jest planeta ‚Äì S≈Ço≈Ñce. Jej nazwa nawiƒÖzuje do nazwy planety oraz jej koloru.


## 7. Answer the following questions:

### a. Which of the models produced the best results?

In my opinion the best results were produces by Polish BERT. Most of its guesses were matching the context and grammar.

### b. Was any of the models able to capture Polish grammar?

Papuga was generating sentences with mostly correct grammar. Polbert was excellent in polish cases, while Robert did some mistakes.

### c. Was any of the models able to capture long-distant relationships between the words?

Every model did a good job in capturing long-distance relationships beetwen the words (such as gender).

### d. Was any of the models able to capture world knowledge?

None of the models has a very accurate world knowledge, such as what is the biggest continent (although most guesses were continents) or in which year did the Grunwald battle take place (apart from Papuga in some guesses). But when it came to naming planets, the guesses where much closer.

### e. What are the most striking errors made by the models?

The most striking errors are when the model did not understand the context, and, although the form of the word is correct, it doesn't fit in the sentence. For example `S≈Ço≈Ñ to najwiƒôksze ≈∫r√≥d≈Ço na ≈õwiecie.`, `Ta dziewczyna z d≈Çugimi czasami by≈Ça bardzo ≈Çadna.`. Most of such mistakes were made by the RoBERT model, which is the biggest of all three. This might be because it was trained on 94 languages while the remaining two only on Polish language.