# PlWordNet Demo

## Utility code

In [1]:
from time import time

# just a simple class for measuring execution time
class timer:
    def __enter__(s):
        s.t = time()
    def __exit__(s,x,y,z):
        print(f'took {time() - s.t:.2f} seconds')

## Loading `PlWordNet`

In [2]:
import plwordnet

You can load .xml, .pkl files. They can also be compressed gzip, lzma or bzip2 (.gz/.xz/.bz2).

Alternatively, you can pass an opened file object (rb) to `load`.

Passing the emotion/sentiment file is optional.

The argument `full_parse=True` causes the lexical unit descriptions to be parsed after loading.

In [3]:
with timer():
    wn = plwordnet.load('../local/plwordnet_4_2.xml', '../local/sentiment_4_2.csv', full_parse=True)

took 32.89 seconds


Calling `str` on `Wordnet` shows basic statistics.

In [4]:
wn

Słowosieć
  lexical units: 513410
  synsets: 353585
  relation types: 306
  synset relations: 1477851
  lexical relations: 393137
  emotional annotations: 60438
  rich descriptions: 294496

Pickle the `Wordnet` object for faster loading. Note that the pickled object may not be compatible between different `plwordnet` library versions.

In [5]:
wn.dump('../local/plwordnet_4_2.pkl')

In [6]:
with timer():
    wn_from_pickle = plwordnet.load('../local/plwordnet_4_2.pkl')

took 10.63 seconds


## Examples 

Find all lexical units with a given name (case-insensitive)

In [7]:
wn.find('jabłko')

[LexicalUnit(id=12131, name='jabłko', variant=1, pos='rzeczownik', language='pl', domain='jedz', tag_count=0, description='##K: og. ##D: owoc (wielopestkowiec) jabłoni. [##P: Jabłka są kształtem zbliżone do kuli, z zagłębieniem na szczycie, z którego wystaje ogonek.] {##L: http://pl.wikipedia.org/wiki/Jab%C5%82ko}', rich_description=Description(qualifier='og.', definition='owoc (wielopestkowiec) jabłoni.', examples=['Jabłka są kształtem zbliżone do kuli, z zagłębieniem na szczycie, z którego wystaje ogonek.'], links=['http://pl.wikipedia.org/wiki/Jab%C5%82ko'], unparsed=' ', from_synset=False), sentiment=[], synset=Synset(id=4605, definition='', split=1, abstract=False, description='', lexical_units=[...])),
 LexicalUnit(id=43481, name='jabłko', variant=2, pos='rzeczownik', language='pl', domain='wytw', tag_count=0, description='##K: og. ##D: jeden z trzech symboli władzy królewskiej, obok korony i berła. {##L: http://pl.wikipedia.org/wiki/Jabłko_królewskie}', rich_description=Descript

Get a specific LU variant. Notice the pretty printing of lexical units in Jupyter!

In [8]:
lu = wn.find('jabłko.1')
print(repr(lu))

LexicalUnit(id=12131, name='jabłko', variant=1, pos='rzeczownik', language='pl', domain='jedz', tag_count=0, description='##K: og. ##D: owoc (wielopestkowiec) jabłoni. [##P: Jabłka są kształtem zbliżone do kuli, z zagłębieniem na szczycie, z którego wystaje ogonek.] {##L: http://pl.wikipedia.org/wiki/Jab%C5%82ko}', rich_description=Description(qualifier='og.', definition='owoc (wielopestkowiec) jabłoni.', examples=['Jabłka są kształtem zbliżone do kuli, z zagłębieniem na szczycie, z którego wystaje ogonek.'], links=['http://pl.wikipedia.org/wiki/Jab%C5%82ko'], unparsed=' ', from_synset=False), sentiment=[], synset=Synset(id=4605, definition='', split=1, abstract=False, description='', lexical_units=[...]))


In [9]:
lu

#12131,NOUN PL jabłko 1
DEFINITION,owoc (wielopestkowiec) jabłoni.
DOMAIN,jedz
EXAMPLES,"Jabłka są kształtem zbliżone do kuli, z zagłębieniem na szczycie, z którego wystaje ogonek."
LINKS,http://pl.wikipedia.org/wiki/Jab%C5%82ko


In [10]:
wn.find('abstrakcyjny.1')

#14,ADJ PL abstrakcyjny 1
DEFINITION,"oryginalny, niesztampowy, nieco oderwany od rzeczywistości."
DOMAIN,jak
EXAMPLES,"Był to dość abstrakcyjny pomysł, zwłaszcza w Łodzi, gdzie nikt nie słyszał ani o Piłsudskim, ani o „Sokole” czy „Zarzewiu”, do których Jerzy dołączył w Krakowie. Mam abstrakcyjny pomysł na wakacje, ale to się może udać!"
SENTIMENT ANNOTATION,"POLARITYstrong negativeEMOTIONSwstręt, złość, zaskoczenieVALUATIONSniewiedza, błąd, nieużytecznośćEXAMPLESJej propozycje są zupełnie abstrakcyjne, nie do zastosowania w świecie realnym."
SENTIMENT ANNOTATION,"POLARITYstrong negativeEMOTIONSwstręt, złośćVALUATIONSniewiedza, błąd, nieużytecznośćEXAMPLESNie wiem, jak powinnam powiedzieć mężowi, że jego plan jest totalnie abstrakcyjny i nic z tego nie wyjdzie."

0,1
POLARITY,strong negative
EMOTIONS,"wstręt, złość, zaskoczenie"
VALUATIONS,"niewiedza, błąd, nieużyteczność"
EXAMPLES,"Jej propozycje są zupełnie abstrakcyjne, nie do zastosowania w świecie realnym."

0,1
POLARITY,strong negative
EMOTIONS,"wstręt, złość"
VALUATIONS,"niewiedza, błąd, nieużyteczność"
EXAMPLES,"Nie wiem, jak powinnam powiedzieć mężowi, że jego plan jest totalnie abstrakcyjny i nic z tego nie wyjdzie."


Show some relations and their ids

In [11]:
for x in list(wn.relation_types.values())[:5]:
    print('---')
    print(x.id, x.name, x.type, sep=', ')
    print(x.description)

---
10, hiponimia, relacja pomiędzy synsetami
Relacja łącząca znaczenie z drugim, ogólniejszym, niż to pierwsze, ale należącym do tej samej części mowy, co ono.
---
11, hiperonimia, relacja pomiędzy synsetami
Relacja łącząca znaczenie z drugim, szczegółowszym, niż to pierwsze, ale należącym do tej samej części mowy, co ono.
---
12, antonimia, relacja leksykalna
Relacja łącząca przeciwne znaczenia reprezentowane przez tę samą część mowy. Może być właściwa, kiedy oprócz przeciwnych znaczeń X i Y dopuszczamy istnienie jakiegoś Z, lub komplementarna, kiedy nie dopuszczamy takiej możliwości (istnieje albo X, albo Y).
---
13, konwersja, relacja leksykalna
Relacja łącząca znaczenia reprezentowane przez tę samą część mowy, które opisują to samo zjawisko, ale z dwóch różnych (przeciwnych sobie) punktów widzenia.
---
14, meronimia, relacja pomiędzy synsetami
Relacja łączy rzeczownik, który jest częścią (porcją, elementem grupy, miejscem, materiałem) czegoś innego, z drugim rzeczownikiem, oznacza

Show first 10 synset relations with predicate 11 (hyperonymy). Use the short relation name for printing.

In [12]:
for s, p, o in wn.synset_relations_where(predicate=11)[:10]:
    print(p.format(s, o, short=True))

{rozmowa.1 konwersacja.1 dialog.1 dyskurs.1} hipero {pogawędka.1 pogaduszka.1 pogwarka.1 pogaducha.1 rozmówka.1 gawędka.1 gawęda.3 gadu-gadu.1}
{rozmowa.1 konwersacja.1 dialog.1 dyskurs.1} hipero {dyskusja.1 dysputa.1 debata.1 debatowanie.3 dysputacja.1}
{brudas.2 smoluch.2} hipero {rumun.3}
{dyskusja.1 dysputa.1 debata.1 debatowanie.3 dysputacja.1} hipero {obrady.1 posiedzenie.7 rada.3 narada.1 sesja.2}
{zranić.2} hipero {odstręczyć.1 zrazić.1}
{wypowiedź.1} hipero {przemówienie.6 przemowa.1 mowa.1}
{tekst.3} hipero {rozprawa.2 elaborat.1 traktat.1}
{komunikat.1} hipero {aluzja.1}
{wypowiedź.1} hipero {orzeczenie.1 postanowienie.2}
{ciapaty.1 ciapek.2} hipero {pakol.1}


Show all relations where a lexical unit 'miód.1' is a subject or an object:

In [13]:
print(wn.show_relations(wn.find('miód.1')))

LEXICAL RELATIONS
kolokacyjność → gęsty.4
kolokacyjność ← plaster.3
derywacyjność ← miodówka.3
derywacyjność ← miodarka.1
podobieństwo ← miodny.1
podobieństwo ← miodowy.2
derywacyjność ← miodny.2
kolokacyjność ← beczka.1
derywacyjność ← miododajny.1
derywacyjność ← miododajny.2
derywacyjność ← miodownik.2
podobieństwo ← miodny.4
kolokacyjność ← słodziuchny.1
derywacyjność ← miód.3
derywacyjność ← miodonośny.2
ekspresywność | augmentatywność ← miodek.1
derywacyjność ← miodonośny.1
rola: materiał ← miodowy.3
synonimia międzyparadygmatyczna dla relacyjnych ← miodowy.4
podobieństwo ← miodowy.1

SYNSET RELATIONS
Syn_plWN-PWN → {honey.1}
hiperonimia → {miód pszczeli.1}
materiał → {pożytek.2 pożytek pszczeli.1}
hiperonimia → {manuka.2}
część → {fruktoza.1 cukier owocowy.1}
hiponimia → {surowiec farmaceutyczny.1}
mmateriał_plWN-PWN → {hydromel.1}
fuzzynimia_synsetów ⟷ {plaster.3}
materiał → {glukoza.1 cukier gronowy.1 dekstroza.1 ...}
fuzzynimia_synsetów ⟷ {pszczoła.1}
hiponimia → {przyprawa.1

Show all subjects of relations with predicate 13 (konwersja), where a lexical unit with lemma 'prababcia' is an object. Also show the part of speech and synset of the found subjects.

In [14]:
for lu in wn.find('prababcia'):
    for s, p, o in wn.lexical_relations_where(predicate=13, object=lu):
        print('---')
        print(s)
        print('part of speech =', s.pos)
        print('synset =', s.synset)

---
prawnuczę.1
part of speech = rzeczownik
synset = {prawnuczę.1}
---
prawnuk.1
part of speech = rzeczownik
synset = {prawnuk.1 prawnuczek.1}
---
prawnuczka.1
part of speech = rzeczownik
synset = {prawnuczka.1}
