# WordNet

In [1]:
import nltk
nltk.download('wordnet')

[nltk_data] Downloading package wordnet to
[nltk_data]     C:\Users\ДР\AppData\Roaming\nltk_data...
[nltk_data]   Package wordnet is already up-to-date!


True

In [2]:
from nltk.corpus import wordnet as wn

### Задание 1

Cоставьте с помощью WordNet список существительных, которые могут выступать в качестве прямого дополнения при глаголе eat в предложениях вида John eats N (через поиск общего гиперонима для слов meat и potatos).

Сначала проверяем, к каким синсетам относятся слова meat и potatos, и выбираем нужные. Для этого смотрим на определения:

In [4]:
for synset in wn.synsets('meat', pos=wn.NOUN):
    print (synset.name(), synset.definition())

meat.n.01 the flesh of animals (including fishes and birds and snails) used as food
kernel.n.01 the inner and usually edible part of a seed or grain or nut or fruit stone
kernel.n.03 the choicest or most essential or most vital part of some idea or experience


In [5]:
for synset in wn.synsets('potatos', pos=wn.NOUN):
    print (synset.name(), synset.definition())

potato.n.01 an edible tuber native to South America; a staple food of Ireland
potato.n.02 annual native to South America having underground stolons bearing edible starchy tubers; widely cultivated as a garden vegetable; vines are poisonous


Нам подходят meat.n.01 и potato.n.01, дальше работаем с ними: ищем их ближайший общий гипероним, а потом берем леммы из всех синсетов, которые являются его гипонимами.

In [6]:
print(wn.synset('meat.n.01').lowest_common_hypernyms(wn.synset('potato.n.01')))

[Synset('food.n.02')]


In [9]:
hypo = lambda s: s.hyponyms()
food_lemmas = set()
for synset in wn.synset('food.n.02').closure(hypo):
    for lemma in synset.lemma_names():
        food_lemmas.add(lemma)

for item in food_lemmas:
    print(item)

seafood
kiwi
Jerusalem_artichoke
spinach_beet
panfish
quahog
chou
bitter_orange
nonpareil
rockfish
ananas
Valencia_orange
dumpling
buffalofish
salad_green
hard_roll
Yellow_Delicious
zucchini
muskmelon
loaf_of_bread
Swiss_chard
fish
beurre_noisette
white_cake
calf's_liver
junk_food
hamburger_roll
farm_cheese
spice_cake
beet_green
salt-rising_bread
tunny
french-fried_potatoes
tamarindo
rose_apple
scrag
water_lemon
aitchbone
salt_cod
pandowdy
sinker
netted_melon
chocolate_bar
finnan_haddock
chop
boxberry
finnan
chine
Jewish_rye
lime
pasta
huckleberry
Bibb_lettuce
bean
mascarpone
turban_squash
chuck
smoked_eel
zwieback
tuna_fish
minute_steak
tortilla
mandarin
blintz
strudel
matzah_ball
ugli
yellow_turnip
wonton
spareribs
hen
rosefish
stomach_sweetbread
giblet
caviare
bully_beef
rainbow_trout
citron
mustard_greens
swordfish
lichi
triple_creme
rump_steak
pork_pie
red_onion
sieva_bean
dika_bread
coral
blue_point
langoustine
profiterole
cuke
green_soybean
cabbage
unleavened_bread
honey_bun
slo

### Задание 2

Найдите 10 ближайших синсетов к синсету 'cow.n.01' (или один самый близкий).

Проходим по всем синсетам имен существительных и составляем из них словарь, ключами которого будут синсеты, а значениями - path_similarity этого синсета и интересующего нас cow.n.01.

In [10]:
dist_dict = {}
for synset in wn.all_synsets('n'):
    dist_dict[synset.name()] = wn.synset('cow.n.01').path_similarity(synset)

Затем сортируем словарь по убыванию (NB! не по ключам, а по значениям) и берем любое количество верхних элементов.

In [18]:
for element in sorted(dist_dict, key=lambda i: dist_dict[i], reverse=True)[:10]:
    print (element, dist_dict[element])

cow.n.01 1.0
cattle.n.01 0.5
springer.n.02 0.5
heifer.n.01 0.5
bovine.n.01 0.3333333333333333
ox.n.01 0.3333333333333333
stirk.n.01 0.3333333333333333
bullock.n.02 0.3333333333333333
bull.n.01 0.3333333333333333
beef.n.01 0.3333333333333333


Самый близкий синсет можно найти иначе, без словаря. Например, так:

In [12]:
cow_similarity = 0.0
closest_synset = None
for synset in wn.all_synsets('n'):
    if wn.synset('cow.n.01').path_similarity(synset) > cow_similarity and synset.name() != 'cow.n.01':
        cow_similarity = wn.synset('cow.n.01').path_similarity(synset)
        closest_synset = synset
print (closest_synset.name())

cattle.n.01


Обратите внимание, что так мы получаем ровно один синсет, хотя по словарю выше видно, что ближайших к cow.n.01 синсетов на самом деле три.

### Задание 3

Напишите программу, которая будет позволять использовать MultiWordNet в качестве мультиязычного словаря. Пусть на вход она принимает слово на английском языке,
а на выходе дает:

- список его значений (т.е. синсетов, к которым оно относится, с определением к каждому синсету);
- для каждого значения - варианты его перевода на любой язык, который есть в MultiWordNet (например, на французский или хорватский).

In [13]:
nltk.download('omw')

[nltk_data] Downloading package omw to
[nltk_data]     C:\Users\ДР\AppData\Roaming\nltk_data...
[nltk_data]   Package omw is already up-to-date!


True

In [23]:
input_word = input()

throw


In [26]:
synsets = wn.synsets(input_word)
for synset in synsets:
    print ('Synset: ', synset.name(), synset.definition())
    print ('English lemmas: ', synset.lemma_names())
    print ('French lemmas: ', synset.lemma_names('fra'))

Synset:  throw.n.01 the act of throwing (propelling something with a rapid movement of the arm and wrist)
English lemmas:  ['throw']
French lemmas:  ['jet', 'jeter']
Synset:  throw.n.02 a single chance or instance
English lemmas:  ['throw']
French lemmas:  ['jeter']
Synset:  throw.n.03 the maximum movement available to a pivoted or reciprocating piece by a cam
English lemmas:  ['throw', 'stroke', 'cam_stroke']
French lemmas:  ['accident_vasculaire_cérébral', 'coup', 'jet', 'jeter', 'mouvement']
Synset:  throw.n.04 bedclothes consisting of a lightweight cloth covering (an afghan or bedspread) that is casually thrown over something
English lemmas:  ['throw']
French lemmas:  ['jeter']
Synset:  throw.n.05 casting an object in order to determine an outcome randomly
English lemmas:  ['throw']
French lemmas:  ['jeter']
Synset:  throw.v.01 propel through the air
English lemmas:  ['throw']
French lemmas:  ['jeter']
Synset:  throw.v.02 move violently, energetically, or carelessly
English lemmas:

# FrameNet

### Задание 4

Найдите все ядерные элементы фрейма Removing.

In [27]:
nltk.download('framenet_v17')

[nltk_data] Downloading package framenet_v17 to
[nltk_data]     C:\Users\ДР\AppData\Roaming\nltk_data...
[nltk_data]   Package framenet_v17 is already up-to-date!


True

In [28]:
from nltk.corpus import framenet as fn

In [30]:
removing = fn.frame('Removing')
for element in removing.FE:
    if removing.FE[element].coreType == "Core": #или: if removing['FE'][element]['coreType'] == 'Core':
        print (element)

Agent
Theme
Source
Cause


### Задание 5

Найдите 5 примеров употребления лексемы take.v из фрейма Removing (с разметкой).

In [32]:
take = removing.lexUnit['take.v']
print (take.exemplars[:5])

[exemplar sentence (848036):
[sentNo] 0
[aPos] 101100749

[LU] (1149) take.v in Removing

[frame] (63) Removing

[annotationSet] 2 annotation sets

[POS] 32 tags

[POS_tagset] BNC

[GF] 3 relations

[PT] 3 phrases

[Sent] 1 entry

[text] + [Target] + [FE]

` There are always exceptions to the rule , " he said flatly , 
                                              --               
                                              Ag               
 
taking the laden tray from her hands and turning to go along the 
****** -------------- --------------
       Theme          Source        
 
terrace to the dining-room . 
 
 
 (Ag=Agent)

, exemplar sentence (848037):
[sentNo] 0
[aPos] 36998910

[LU] (1149) take.v in Removing

[frame] (63) Removing

[annotationSet] 2 annotation sets

[POS] 14 tags

[POS_tagset] BNC

[GF] 3 relations

[PT] 3 phrases

[Sent] 1 entry

[text] + [Target] + [FE]

The maid took the plate from her mistress as if it were hot . 
-------- **** --------- ----------------

### Задание 6

Найдите все фреймы, в которых Source входит в число ядерных элементов.

In [33]:
for frame in fn.frames():
    if 'Source' in frame['FE'] and frame['FE']['Source']['coreType'] == 'Core':
        print(frame.name)

Becoming_detached
Being_detached
Bringing
Cause_fluidic_motion
Cause_motion
Container_focused_removing
Correctness
Cotheme
Departing
Detaching
Emanating
Emptying
Excreting
Fleeing
Fluidic_motion
Food_gathering
Getting_underway
Getting_vehicle_underway
Intentional_traversing
Level_of_light
Light_movement
Mass_motion
Motion
Motion_directional
Motion_noise
Motion_scenario
Operate_vehicle
Operate_vehicle_scenario
Optical_image
Passing
Path_shape
Planned_trajectory
Quitting_a_place
Removing
Removing_scenario
Ride_vehicle
Robbery
Self_motion
Sensation
Setting_out
Smuggling
Source_of_getting
Source_path_goal
Taking
Theft
Travel
Traversing
Use_vehicle
Vehicle_departure_initial_stage
Visiting_scenario_departing
Visitor_departure
