# Структурна лінгвістика

## Побудуйте ланцюжок походження слів за зразком:

оженитися: (о + (женити + ся))

1. несприйнятливість: (не + (сприйнят + лив + ість))
2. атиповий: (а + ((тип + ов) + ий)
3. безвідповідально: (без + (відповід + альн + о))
4. мореплавання: (море + плав + ання)
5. оподаткувати: (о + податк + ува + ти)
6. перевтілитися: (пере + ((в + тіл + ити) + ся))
7. схилившись: ((((с + хил) + ив) + ши) + сь)
8. трьохярусний: ((тр + ьох) + (ярус + ний))
9. підсніжник: (під + сніж + ник)
10. зужиткований: (з ((ужитк + ова) + н + ий))

## Перевірте роботу [SnowballStem](http://snowballstem.org/) для спільнокореневих слів. Напишіть ваші спостереження.

1. truth, truthful, truthfulness, countertruth, untruthful, truthology
2. flaw, flaws, flawed, flawless, flawlessness, flawlessly, 
2. лес, лесной, лесник, лесничий, лесничество, пролесье
3. окно, окошко, подоконник, оконный, окнище

In [4]:
from nltk.stem.snowball import SnowballStemmer

stemmer_en = SnowballStemmer('english')
stemmer_ru = SnowballStemmer('russian')

wordlists = [
    {'lang': 'en', 'words': ['truth', 'truthful', 'truthfulness', 'countertruth', 'untruthful', 'truthology']},
    {'lang': 'en', 'words': ['flaw', 'flaws', 'flawed', 'flawless', 'flawlessness', 'flawlessly']},
    {'lang': 'ru', 'words': ['лес', 'лесной', 'лесник', 'лесничий', 'лесничество', 'пролесье']},
    {'lang': 'ru', 'words': ['окно', 'окошко', 'подоконник', 'оконный', 'окнище']},
]

for wlist in wordlists:
    stemmer = stemmer_en if wlist['lang'] == 'en' else stemmer_ru
    print(', '.join([stemmer.stem(w) for w in wlist['words']]))

truth, truth, truth, countertruth, untruth, trutholog
flaw, flaw, flaw, flawless, flawless, flawless
лес, лесн, лесник, леснич, лесничеств, пролес
окн, окошк, подоконник, окон, окнищ


**Коментарі:**
Стемер фактично ігнорує префікси, і часто прибирає лише перший суфікс, лишаючи інші. Схоже, в англійській мові стемер розрізняє формотворчі суфікси, і прибирає лиш їх - "flawless" незмінне. У російській мові в результаті ми не отримали одного кореня для слів, у випадку "окно" ще бачимо, що чергування в корені слова теж ускладнюють стемінг. Чи має ця процедура сенс для російської, української мови і їм подібних взагалі?

## Визначте частину мови виділеного слова і зв'язок до його батька (за зразком):

{I} like turtles.: pronoun, nsubj(like, I)  
I {like} turtles.: verb, root(ROOT, like)  
I like {turtles}.: noun, dobj(like, turtles)

In [1]:
import spacy, re
from spacy import displacy
nlp = spacy.load('en_core_web_md')

In [74]:
sentences = [
    {"sent": "We can {but} hope that everything will be fine.", "target": 2},
    {"sent": "It's sad {but} true.", "target": 3},
    {"sent": "Jack brings nothing {but} trouble.", "target": 3},
    {"sent": "{As} we were talking, I realised how to solve the issue.", "target": 0},
    {"sent": "This hot dog isn't {as} big as usual.", "target": 5},
    {"sent": "This hot dog isn't as big {as} usual.", "target": 7},
    {"sent": "This hot dog isn't as big {as} I expected.", "target": 7},
    {"sent": "I work {as} a teacher.", "target": 2},
    {"sent": "Let's do it this {way}!", "target": 5},
    {"sent": "This is {way} too much!", "target": 2},
    {"sent": "The prices are going {down}.", "target": 4},
    {"sent": "Someone pushed him and he fell {down} the stairs.", "target": 6},
    {"sent": "I’ve been feeling rather {down} lately.", "target": 5},
    {"sent": "It's not easy to {down} a cup of coffee in one gulp.", "target": 5},
    {"sent": "Bring a {down} jacket and a pair of gloves, and you'll be fine.", "target": 2},
]

In [None]:
for sent in sentences:
    doc = nlp(re.sub('[{}]', '', sent['sent']))
    for i, token in enumerate(doc):
        if i == sent['target']:
            print(f'{sent["sent"]}\n\t{token.pos_}, {token.dep_}({token.head.text}, {token.text})\n')

1. We can {but} hope that everything will be fine.<br/>
	CCONJ, cc(can, but)<br/>

2. It's sad {but} true.<br/>
	ADP, mark(sad, but) ~~CCONJ, cc(sad, but)~~ * but is like "despite": is is sad despite it is true

3. Jack brings nothing {but} trouble.<br/>
	ADP, cc(nothing, but)
    
4. {As} we were talking, I realised how to solve the issue.<br/>
	ADP, mark(talking, As)

5. This hot dog isn't {as} big as usual.<br/>
	ADV, advmod(big, as)

6. This hot dog isn't as big {as} usual.<br/>
	ADP, prep(big, as)

7. This hot dog isn't as big {as} I expected.<br/>
	ADP, mark(expected, as)

8. I work {as} a teacher.<br/>
	ADP, prep(work, as)

9. Let's do it this {way}!<br/>
	NOUN, npadvmod(do, way)

10. This is {way} too much!<br/>
	ADV, **npadvmod**(much, way) ~~ADV, advmod(much, way)~~<br/>
    *because "way" is not adverb*

11. The prices are going {down}.<br/>
	ADV, prt(going, down)

12. Someone pushed him and he fell {down} the stairs.<br/>
	ADP, prep(fell, down)

13. I’ve been feeling rather {down} lately.<br/>
	ADV, advmod(feeling, down)

14. It's not easy to {down} a cup of coffee in one gulp.<br/>
	ADV, xcomp('s, down)

15. Bring a {down} jacket and a pair of gloves, and you'll be fine.<br/>
	PART, amod(jacket, down)

## Визначте частину мови виділеного слова, його лему і зв'язок до його батька (за зразком):


1. Рада міністрів Європейського союзу затвердила угоду про спрощений порядок видачі {віз} для України.<br/>
   іменник, віза, nn(видачі, віз)

2. Батько Себастьяна {віз} на санях їх театральний гурт до Львова.<br/>
    дієслово, везти, root(ROOT, віз)

3. А ще дивний елемент інтер’єру – {віз} із продукцією одного з херсонських виробників.<br/>
    іменник, віз, appos(елемент , віз)

4. У цю мить {повз} Євгена пролетів останній вагон товарняка.<br/>
    прийменник, повз, pcomp(пролетів, повз)

5. Кліпнув очима і побачив малого песика, який саме пробігав {повз} у бік села.<br/>
    прийменник, повз, advmod(пробігав, повз)

6. Степанко перестав кричати, тільки ламкий стогін {повз} йому із грудей.<br/>
    дієслово, повзти, mark(тільки, повз)

7. Часу не {гай} – декларацію подай!<br/>
    дієслово, гаяти, root(ROOT, гай)

8. І коляд заспівали, і {гай} врятували.<br/>
    іменник, гай, dobj(врятували, гай)

9. {Гай}, чи ви забулися, братове?<br/>
    вигук, гай, vocative(забулися, Гай) *як вигуки позначаються в стенфордській типології?*

10. Ось присіла на {край} ліжка.<br/>
    іменник, край, pobj(на, край)

11. Поставив ту кузню не {край} дороги, як було заведено, а на Красній горі, біля Прадуба.<br/>
    прийменник, край, prep(Поставив, край)

12. Розповідаючи про передній {край} лінґвістики, фон Лібіх, як завжди, мислив широко і глобально.<br/>
    іменник, край, pobj(про, край)

13. Не {край} мені серце.<br/>
    дієслово, краяти, root(ROOT, край)

14. І {щойно} тоді додаємо до борщу смажену цибулю.<br/>
    частка, щойно, advmod(тоді, щойно) *advmod тому, що виконує функцію прислівника - посилює значення*

15. Бо {щойно} я задрімав, віддавши тіло подушці з периною, як мене розбудив поштовх у бік.<br/>
    прислівник, щойно, advmod(задрімав, щойно)

## Побудуйте синтаксичну структуру речень за зразком:

Я люблю черепашок.  
nsubj(люблю, Я)  
root(ROOT, люблю)  
dobj(люблю, черепашок)

1. Пригадую, уже згодом, коли я відбував свій термін у таборі № 36 у Кучино Пермської області, я отримав від Михасі листівку з жартівливим описом того, як Київ готується до святкування свого 1500-ліття.<br/>
    * root(ROOT, Пригадую)<br/>
    advmod(Пригадую, згодом)<br/>
    advmod(згодом, уже)<br/>
    ccomp(Пригадую, отримав)<br/>
    nsubj(отримав, я\[1\])<br/>
    dobj(отримав, листівку)<br/>
    prep(отримав, від)<br/>
    pobj(від, Михасі)<br/>
    prep(листівку, з)<br/>
    pobj(з, описом)<br/>
    amod(описом, жартівливим)<br/>
    prep(описом, того)<br/>
    mark(готується, як)<br/>
    pcomp(того, готується)<br/>
    nsubj(готується, Київ)<br/>
    prep(готується, до)<br/>
    pobj(до, святкування)<br/>
    dobj(святкування, 1500-ліття) *як розбити 1500-ліття, і чи потрібно це?* <br/>
    poss(1500-ліття, свого)<br/>
    advcl(отримав, відбував)<br/>
    mark(коли, відбував)<br/>
    nsubj(відбував, я\[0\])<br/>
    dobj(відбував, термін)<br/>
    poss(термін, свій)<br/>
    prep(термін, у\[0\])<br/>
    pobj(у, таборі) *це як npadvmod з прислівником, але як провести зв'язки і назвати?*<br/>
    nummod(таборі, № 36)<br/>
    prep(термін, у\[1\])<br/>
    pobj(у, Кучино)<br/>
    npadvmod(Кучино, області)<br/>
    amod(області, Пермської)<br/><br/>

2. 6C приземляється на плече, перекочуючись, пролітає метрів п’ятдесят і витягується на снігу за кілька кроків від забризканої палаючими уламками посадкової смуги.
    * root(ROOT, приземляється)
    nsubj(приземляється, 6C)<br/>
    prep(приземляється, на)<br/>
    pobj(на, плече)<br/>
    advcl(приземляється, перекочуючись)<br/>
    conj(приземляється, пролітає)<br/>
    dobj(пролітає, метрів)br/>
    nummod(метрів, п’ятдесят)<br/>
    conj(пролітає, витягується)<br/>
    cc(витягується, і)<br/>
    prep(витягується, на)<br/>
    pobj(на, снігу)<br/>
    prep(витягується, за)<br/>
    pobj(за, кроків)<br/>
    nummod(кроків, кілька)<br/>
    prep(кроків, від)<br/>
    pobj(від, смуги)<br/>
    amod(смуги, посадкової)
    advcl(смуги, забризканої)<br/>
    dobj(забризканої, уламками)<br/>
    amod(уламками, палаючими)<br/><br/>

3. Дівчина стояла там, де й була, і намагалася привести до ладу скуйовджене волосся, вкрай розлючена тим, що це побачили водії, які чекали на переїзді.
    * root(ROOT, стояла)<br/>
    nsubj(стояла, Дівчина)<br/>
    advcl(стояла, була)<br/>
    mark(була, де)<br/>
    mark(була, там)<br/>
    prep(була, й)<br/>
    conj(стояла, намагалася)<br/>
    cc(стояла, і)<br/>
    xcomp(намагалася, привести)<br/>
    dobj(привести, волосся)<br/>
    amod(волосся, скуйовджене)<br/>
    prep(волосся, до)<br/>
    pobj(до, ладу)<br/>
    amod(Дівчина, розлючена)<br/>
    advmod(розлючена, вкрай)<br/>
    ccomp(розлючена, побачили)<br/>
    mark(побачили, що)<br/>
    dobj(побачили, це)<br/>
    nsubj(побачили, водії)<br/>
    rcmod(водії, чекали)<br/>
    ref(водії, які)<br/>
    prep(чекали, на)<br/>
    pobj(на, переїзді)<br/>

## Виберіть одне cлово зі списку та побудуйте лексико-семантичні зв'язки до трьох різних значень цього слова. Фактично, потрібно побудувати WordNet-подібні вузли. Значення слів можна перевірити у [СУМі](http://sum.in.ua/) та [Словниках України](http://lcorp.ulif.org.ua/dictua/).
Слова на вибір: вік, стіна, добро, серце, центр, куля, міст, ланцюг, бік, дух.

#### Серце - центральний орган кровоносної системи 
* **Гіпероніми:** 
Орган, кардіологія, біологія, анатомія, організм
* **Сестринські терміни:** 
Печінка, нирка, шлунок, мозок
* **Гіпоніми:** 
Клапан, міокард, перикард
* **Холоніми:**
Кровотік, орган, людина

#### Серце - орган людини як символ зосередження почуттів, настроїв, переживань
* **Гіпероніми:**
Почуття, емоція, інтуїція

* **Сестринські терміни:** 
Зад (жаргонне "задом відчуваю")

* **Гіпоніми:** 
Неспокій, радість, сум, тривога

* **Синоніми:**
Відчуття, (перед-)чуття

#### Серце - медуза
* **Гіпероніми:** 
Кнідарії, море, тварина, безхребетне
* **Сестринські терміни:** 
Поліпи, корали, актинії
* **Гіпоніми:** 
Помацки, шапка
* **Синонніми:**
Медуза
* **Холоніми:**
Планктон
* **Мероніми:**
Гідроїдні, Кубомедуза, Ставромедуза, Сцифоїдні