In [63]:
from transformers import *
from termcolor import colored

# Models

In [None]:
dkleczek_bert_model = BertForMaskedLM.from_pretrained("dkleczek/bert-base-polish-cased-v1")
dkleczek_bert_tokenizer = BertTokenizer.from_pretrained("dkleczek/bert-base-polish-cased-v1")

allegro_base_model = BertForMaskedLM.from_pretrained("allegro/herbert-base-cased")
allegro_base_tokenizer = AutoTokenizer.from_pretrained("allegro/herbert-base-cased")

allegro_large_model = BertForMaskedLM.from_pretrained("allegro/herbert-large-cased")
allegro_large_tokenizer = AutoTokenizer.from_pretrained("allegro/herbert-large-cased")

In [60]:
def dkleczek_bert_predict(sentence):
    nlp = pipeline('fill-mask', model=dkleczek_bert_model, tokenizer=dkleczek_bert_tokenizer)
    sentence = sentence.replace('<mask>', f'{nlp.tokenizer.mask_token}')
    predictions = list(map(lambda p: p['token_str'], nlp(sentence)))
    return predictions

def allegro_base_predict(sentence):
    nlp = pipeline('fill-mask', model=allegro_base_model, tokenizer=allegro_base_tokenizer)
    predictions = list(map(lambda p: p['token_str'], nlp(sentence)))
    return predictions

def allegro_large_predict(sentence):
    nlp = pipeline('fill-mask', model=allegro_large_model, tokenizer=allegro_large_tokenizer)
    predictions = list(map(lambda p: p['token_str'], nlp(sentence)))
    return predictions

# Produce the predictions for the following sentences (use each model and check 5 predictions):
* (M) Warszawa to największe [MASK].
* (D) Te zabawki należą do [MASK].
* (C) Policjant przygląda się [MASK].
* (B) Na środku skrzyżowania widać [MASK].
* (N) Właściciel samochodu widział złodzieja z [MASK].
* (Ms) Prezydent z premierem rozmawiali wczoraj o [MASK].
* (W) Witaj drogi [MASK].

In [93]:
sentences = [
    f'Warszawa to największe <mask>',
    f'Te zabawki należą do <mask>',
    f'Policjant przygląda się <mask>',
    f'Na środku skrzyżowania widać <mask>',
    f'Właściciel samochodu widział złodzieja z <mask>',
    f'Prezydent z premierem rozmawiali wczoraj o <mask>',
    f'Witaj drogi <mask>'
]

def print_prediction(predictions, model_name, sentence):
    print(f'\tUsing: {model_name}')
    for predicted_word in predictions:
        prediction = sentence.replace('<mask>', colored(predicted_word, 'blue'))
        print(f'\t\t{prediction}')
    print('\n')
    
def print_predictions_for(sentences):
    for sentence in sentences:
        print(f'Prediction for: {sentence}')
        print_prediction(dkleczek_bert_predict(sentence)[:5], 'dkleczek/bert-base-polish-cased-v1', sentence)
        print_prediction(allegro_base_predict(sentence)[:5], 'allegro/herbert-base-cased', sentence)
        print_prediction(allegro_large_predict(sentence)[:5], 'allegro/herbert-large-cased', sentence)

In [94]:
print_predictions_for(sentences)

Prediction for: Warszawa to największe <mask>
	Using: dkleczek/bert-base-polish-cased-v1
		Warszawa to największe [34mmiasto[0m
		Warszawa to największe [34m.[0m
		Warszawa to największe [34mmiejsce[0m
		Warszawa to największe [34mwojewództwo[0m
		Warszawa to największe [34mlotnisko[0m


	Using: allegro/herbert-base-cased
		Warszawa to największe [34mmiasto</w>[0m
		Warszawa to największe [34m…</w>[0m
		Warszawa to największe [34mmiasta</w>[0m
		Warszawa to największe [34mlotnisko</w>[0m
		Warszawa to największe [34mcentrum</w>[0m


	Using: allegro/herbert-large-cased
		Warszawa to największe [34mmiasto</w>[0m
		Warszawa to największe [34m…</w>[0m
		Warszawa to największe [34mcentrum</w>[0m
		Warszawa to największe [34mmiasta</w>[0m
		Warszawa to największe [34mlotnisko</w>[0m


Prediction for: Te zabawki należą do <mask>
	Using: dkleczek/bert-base-polish-cased-v1
		Te zabawki należą do [34mciebie[0m
		Te zabawki należą do [34mdzieci[0m
		Te zabawki na

# Check the model predictions for the following sentences (using each model):
* Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym się nie [MASK].
* Gdybym wiedziała wtedy dokładnie to co wiem teraz, to bym się nie [MASK].

In [95]:
sentences2 = [
    'Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym się nie <mask>',
    'Gdybym wiedziała wtedy dokładnie to co wiem teraz, to bym się nie <mask>'
]

In [96]:
print_predictions_for(sentences2)

Prediction for: Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym się nie <mask>
	Using: dkleczek/bert-base-polish-cased-v1
		Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym się nie [34mbał[0m
		Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym się nie [34mprzyznał[0m
		Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym się nie [34mzgodził[0m
		Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym się nie [34mśmiał[0m
		Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym się nie [34mmartwił[0m


	Using: allegro/herbert-base-cased
		Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym się nie [34mdowiedział</w>[0m
		Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym się nie [34mzdziwił</w>[0m
		Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym się nie [34mpoddał</w>[0m
		Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym się nie [34mzastanawiał</w>[0m
		Gdybym wiedział wtedy dokładnie to co wiem teraz, to bym 

# Check the model predictions for the following sentences:
* [MASK] wrze w temperaturze 100 stopni, a zamarza w temeraturze 0 stopni Celsjusza.
* W wakacje odwiedziłem [MASK], który jest stolicą Islandii.
* Informatyka na [MASK] należy do najlepszych kierunków w Polsce.

In [97]:
sentences3 = [
    '<mask> wrze w temperaturze 100 stopni, a zamarza w temeraturze 0 stopni Celsjusza.',
    'W wakacje odwiedziłem <mask>, który jest stolicą Islandii.',
    'Informatyka na <mask> należy do najlepszych kierunków w Polsce.'
]

In [98]:
print_predictions_for(sentences3)

Prediction for: <mask> wrze w temperaturze 100 stopni, a zamarza w temeraturze 0 stopni Celsjusza.
	Using: dkleczek/bert-base-polish-cased-v1
		[34mWoda[0m wrze w temperaturze 100 stopni, a zamarza w temeraturze 0 stopni Celsjusza.
		[34mMięso[0m wrze w temperaturze 100 stopni, a zamarza w temeraturze 0 stopni Celsjusza.
		[34mSłońce[0m wrze w temperaturze 100 stopni, a zamarza w temeraturze 0 stopni Celsjusza.
		[34mNie[0m wrze w temperaturze 100 stopni, a zamarza w temeraturze 0 stopni Celsjusza.
		[34mPiwo[0m wrze w temperaturze 100 stopni, a zamarza w temeraturze 0 stopni Celsjusza.


	Using: allegro/herbert-base-cased
		[34mWoda</w>[0m wrze w temperaturze 100 stopni, a zamarza w temeraturze 0 stopni Celsjusza.
		[34mSłońce</w>[0m wrze w temperaturze 100 stopni, a zamarza w temeraturze 0 stopni Celsjusza.
		[34mZiemia</w>[0m wrze w temperaturze 100 stopni, a zamarza w temeraturze 0 stopni Celsjusza.
		[34mNastępnie</w>[0m wrze w temperaturze 100 stopni, a zamarza 

# Answer the following questions:
## Which of the models produced the best results?
W wielu przypadkach _allegro_herbert_large_ oraz model _dkleczek_ dawały wyniki, które są równie prawdopodobne, ale np. dla "Właściciel samochodu widział złodzieja z" _dkleczek_ podpowiedział słowo "tyłu" jako jedyny, dla "Policjant przygląda się __sprawie__" to _allegro_large jako jedyne podpowiedziało naturalne słowo "sprawie". W innych przypadkach jeśli miałbym wskazać jeden to zastanowiłbym się który szybciej działa (_allegro_large_ czy _dkleczek_) gdyż oba poradziły sobie równie dobrze, być może z małym wskazaniem na _dkleczek_. Miał on tylko jedną duża wpadkę: "Informatyka na wsi należy do najlepszych kierunków w Polsce." podczas gdy _allegro_herbert_large_ podpowiedziało nazwy uczelni (z AGH na pierwszym miejscu :D ). Jeżeli chodzi o wybrany przez mnie dla porównania model _allegro_ w wersji podstawowej (_allegro/herbert-base-cased_) to tak jak się spodziewałem dał on gorsze wyniki od swojej większej wersji, natomiast były one również zadowalające.

## Was any of the models able to capture Polish grammar?
Oceniając po drugiej grupie zdań (_sentences2_) gdzie należało dobrać rodzaj męski lub żeński to wszystkie modele poradziły sobie z tym zadaniem dobrze.

## Was any of the models able to capture long-distant relationships between the words?
Analogicznie do powyższego pytania jedyna różnica w grupie drugiej leżała 11 słów wcześniej, a wszystkie modele poradziły sobie dobrze.

## Was any of the models able to capture world knowledge?
Żadnemu modelowi nie udało się odgadnąć jaka jest stolica Islandii pomimo podpowiadania różnych miast. Jeżeli natomiast popatrzymy na zdanie w którym ewidętnie choidziło o wodę ("\<mask> wrze w temperaturze 100 stopni, a zamarza w temeraturze 0 stopni Celsjusza.") to wszystkie modele sobie z nim poradziły i na pierwszym miejscu zwróciły właśnie słowo "woda". Ciężko więc jednoznacznie ocenińc jaką wiedzę są wstanie przenosić te modele, natomiast model _allegro_large_ był w stanie również w sensowny sposób podpowiedzieć "Prezydent z premierem rozmawiali wczoraj o __Ukrainie__" co sugeruje uczenie go nie tylko na książkach/wikipedii.

## What are the most striking errors made by the models?
Śmieszną odpowiedzią _allegro_large_ jest "Właściciel samochodu widział złodzieja z __BMW__" co sugeruję, że właśnie to jest marka złodzieji. Mało prawdopodobną odpowiedzią jest również "Witaj drogi __człowieku__" zaproponowane również przez _allegro_large_. Model _dkleczek_ zaproponował "Prezydent z premierem rozmawiali wczoraj o __tym__" co nie wnosi zbyt dużo do tego zdania.