In [1]:
import pandas as pd
from sklearn import metrics

from CYK_Parser import CYKParser

def all_metrics_together(y, y_hat, average = 'micro'):
    accuracy = metrics.accuracy_score(y, y_hat)
    recall = metrics.recall_score(y, y_hat, average = average)
    precision = metrics.precision_score(y, y_hat, average = average)
    f1 = metrics.f1_score(y, y_hat, average = average)

    df = pd.DataFrame({'Accuracy': accuracy, 'Recall': recall, 'Precision': precision, 'F1': f1}, index = ['Score'])
    return df

In [2]:
all_metrics_together(['b', 'b', 'b', 'a'], ['a', 'b', 'c', 'a'])

Unnamed: 0,Accuracy,Recall,Precision,F1
Score,0.5,0.5,0.5,0.5


### CYK Parser

### Example Sentences for Syntax Based Agreement Phenomena

In [3]:
g = CYKParser('Grammar/turkish_grammar_with_morphology_v3.txt')

In [4]:
sentence = 'ben gel dim'
g.parse(sentence)

Given sentence is gramatically CORRECT
ben gel dim
['PRO1', 'VP', 'PAST1']


In [5]:
sentence = 'sen gel dim'
g.parse(sentence)

Given sentence is gramatically INCORRECT


In [6]:
sentence = 'ben gel din'
g.parse(sentence)

Given sentence is gramatically INCORRECT


In [7]:
sentence = 'sen gel din'
g.parse(sentence)

Given sentence is gramatically CORRECT
sen gel din
['PRO2', 'VP', 'PAST2']


In [8]:
sentence = 'ben roman oku dum'
g.parse(sentence)

Given sentence is gramatically CORRECT
ben roman oku dum
['PRO1', 'NP', 'VP', 'PAST1']


In [9]:
sentence = 'sen roman oku dum'
g.parse(sentence)

Given sentence is gramatically CORRECT
sen roman oku dum
['PRO2', 'NP', 'VP', 'PAST1']


In [10]:
sentence = 'ben kitap oku du'
g.parse(sentence)

Given sentence is gramatically CORRECT
ben kitap oku du
['PRO1', 'NP', 'VP', 'PAST3']


In [11]:
sentence = 'ben arkadaşıma hediye al dı'
g.parse(sentence)

Given sentence is gramatically CORRECT
ben arkadaşıma hediye al dı
['PRO1', 'NP', 'NP', 'VP', 'PAST3']


In [12]:
sentence = 'arkadaşıma hediye al dı'
g.parse(sentence)

Given sentence is gramatically CORRECT
arkadaşıma hediye al dı
['NP', 'NP', 'VP', 'PAST3']


### Example Sentences for Semantic Based Agreement Phenomena

In [13]:
sentence = 'ben okul a git dim'
g.parse(sentence)

Given sentence is gramatically CORRECT
ben okul a git dim
['PRO1', 'NP', 'PREPA', 'VTYPE2', 'PAST1']


In [14]:
sentence = 'ben okul da git dim'
g.parse(sentence)

Given sentence is gramatically INCORRECT


In [15]:
sentence = 'ben okul git dim'
g.parse(sentence)

Given sentence is gramatically INCORRECT


In [16]:
sentence = 'ben okul da öğren dim'
g.parse(sentence)

Given sentence is gramatically CORRECT
ben okul da öğren dim
['PRO1', 'NP', 'PREPDA', 'VTYPE3', 'PAST1']


In [17]:
sentence = 'ben okul a öğren dim'
g.parse(sentence)

Given sentence is gramatically INCORRECT


In [18]:
sentence = 'ben dün gel dim'
g.parse(sentence)

Given sentence is gramatically CORRECT
ben dün gel dim
['PRO1', 'PASTNOUN', 'VP', 'PAST1']


In [19]:
sentence = 'ben yarın gel dim'
g.parse(sentence)

Given sentence is gramatically INCORRECT


In [20]:
sentence = 'tarihi bir roman lar oku dum'
g.parse(sentence)

Given sentence is gramatically CORRECT
tarihi bir roman lar oku dum
['ADJ', 'SING', 'NP', 'PL', 'VP', 'PAST1']


In [21]:
sentence = 'tarihi roman lar oku dum'
g.parse(sentence)

Given sentence is gramatically CORRECT
tarihi roman lar oku dum
['ADJ', 'NP', 'PL', 'VP', 'PAST1']


In [22]:
sentence = 'tarihi bir roman oku dum'
g.parse(sentence)

Given sentence is gramatically CORRECT
tarihi bir roman oku dum
['ADJ', 'SING', 'NP', 'VP', 'PAST1']


### Example Sentences for Metric Calculation

In [23]:
sentence = 'karpuz en güzel meyve dir'
g.parse(sentence)
g.print_parsed_table()

Given sentence is gramatically CORRECT
karpuz en güzel meyve dir
['NP', 'ADJ', 'ADJ', 'NP', 'PREPART']

------  ---------------  ---------------  ------  -----------
['S']
['NP']  ['S']
[]      ['ADJNP', 'NP']  ['S']
[]      ['ADJ']          ['ADJNP', 'NP']  ['S']
['NP']  ['ADJ']          ['ADJ']          ['NP']  ['PREPART']
karpuz  en               güzel            meyve   dir
------  ---------------  ---------------  ------  -----------



In [24]:
sentence = 'okul bizim köye epey uzak dı'
g.parse(sentence)
g.print_parsed_table()

Given sentence is gramatically CORRECT
okul bizim köye epey uzak dı
['NP', 'NP', 'NP', 'ADJ', 'ADJ', 'PAST3']

------  ------  ------  -----------  -----------  --------
['S']
[]      ['S']
[]      []      ['S']
['NP']  []      []      ['ADJPAST']
['NP']  ['NP']  []      ['ADJ']      ['ADJPAST']
['NP']  ['NP']  ['NP']  ['ADJ']      ['ADJ']      ['PAST']
okul    bizim   köye    epey         uzak         dı
------  ------  ------  -----------  -----------  --------



In [25]:
sentence = 'destan lar milli kültürümüzü ve tarihimizi güzelce anlat ır'
g.parse(sentence)
g.print_parsed_table()

Given sentence is gramatically CORRECT
destan lar milli kültürümüzü ve tarihimizi güzelce anlat ır
['NP', 'PL', 'NP', 'NP', 'PP', 'NP', 'ADV', 'VP', 'PREPART']

--------------  ------------  --------  -----------  ------  ----------  -------------  -------------  -----------
['S']
['NPVP']        []
[]              []            ['S']
['NP']          []            ['NPVP']  ['S']
['NP']          []            []        ['NPVP']     []
['NP']          []            ['NP']    []           []      ['S']
['NP']          []            ['NP']    ['NP']       []      ['NPVP']    ['VPPREPART']
['NP', 'NPPL']  []            ['NP']    ['NP']       []      []          ['VP']         ['VPPREPART']
['NP']          ['POSPROPL']  ['NP']    ['NP']       ['PP']  ['NP']      ['ADV']        ['VP']         ['PREPART']
destan          lar           milli     kültürümüzü  ve      tarihimizi  güzelce        anlat          ır
--------------  ------------  --------  -----------  ------  ----------  -----------

In [26]:
sentence = 'siz buraya en son ne zaman gel diniz'
g.parse(sentence)
g.print_parsed_table()

Given sentence is gramatically CORRECT
siz buraya en son ne zaman gel diniz
['PROPL2', 'NP', 'ADJ', 'NP', 'Q', 'NP', 'VP', 'PASTPL2']

---------  --------------  ---------------  --------------  ------------  --------------  ------------  ----------
['S']
[]         ['NPVPPASTPL']
[]         ['NPVP']        ['NPVPPASTPL']
[]         []              ['NPVP']         ['NPVPPASTPL']
[]         []              []               ['NPVP']        ['VPPASTPL']
[]         ['NP']          []               []              ['VP']        ['NPVPPASTPL']
[]         []              ['ADJNP', 'NP']  []              ['QP']        ['NPVP']        ['VPPASTPL']
['PROPL']  ['NP']          ['ADJ']          ['NP']          ['Q']         ['NP']          ['VP']        ['PASTPL']
siz        buraya          en               son             ne            zaman           gel           diniz
---------  --------------  ---------------  --------------  ------------  --------------  ------------  ----------



In [27]:
sentence = 'sen şimdi keyifle roman oku yor sun'
g.parse(sentence)
g.print_parsed_table()

Given sentence is gramatically CORRECT
sen şimdi keyifle roman oku yor sun
['PRO2', 'PRENOUN', 'ADV', 'NP', 'VP', 'PRE', 'POSPRO2']

-------  ----------------  ---------  --------  ---------  -------------  ----------
['S']
[]       ['PRENOUNVPPRE']
[]       ['PRENOUNVPPRE']  ['VPPRE']
[]       []                ['VPPRE']  []
[]       []                ['VP']     []        ['VPPRE']
[]       []                []         ['NPVP']  ['VPPRE']  ['PREPOSPRO']
['PRO']  ['PRENOUN']       ['ADV']    ['NP']    ['VTYPE']  ['PRE']        ['POSPRO']
sen      şimdi             keyifle    roman     oku        yor            sun
-------  ----------------  ---------  --------  ---------  -------------  ----------



In [28]:
sentence = 'akşam yemeği için yardım et dim'
g.parse(sentence)
g.print_parsed_table()

Given sentence is gramatically CORRECT
akşam yemeği için yardım et dim
['NP', 'NP', 'PP', 'NP', 'VP', 'PAST1']

---------------------------  ---------------------------  ------------  ---------------------------  ----------  --------
['NPVPPAST', 'S', 'VPPAST']
['NPVP']                     ['NPVPPAST', 'S', 'VPPAST']
['NP']                       ['NPVP']                     ['PPVPPAST']
['NP']                       ['NP']                       []            ['NPVPPAST', 'S', 'VPPAST']
['NP']                       ['NP']                       []            ['NPVP']                     ['VPPAST']
['NP']                       ['NP']                       ['PP']        ['NP']                       ['VP']      ['PAST']
akşam                        yemeği                       için          yardım                       et          dim
---------------------------  ---------------------------  ------------  ---------------------------  ----------  --------



In [29]:
sentence = 'yüksek sesle müzik dinle me'
g.parse(sentence)
g.print_parsed_table()

Given sentence is gramatically CORRECT
yüksek sesle müzik dinle me
['ADJ', 'NP', 'NP', 'VP', 'IMP']

---------------  --------  --------  ---------  -------
['S']
['NPVP']         ['S']
['ADJNP', 'NP']  ['NPVP']  ['S']
['ADJNP', 'NP']  ['NP']    ['NPVP']  ['VPIMP']
['ADJ']          ['NP']    ['NP']    ['VP']     ['IMP']
yüksek           sesle     müzik     dinle      me
---------------  --------  --------  ---------  -------



In [30]:
sentence = 'arkadaşıma hediye ler al dım'
g.parse(sentence)
g.print_parsed_table()

Given sentence is gramatically CORRECT
arkadaşıma hediye ler al dım
['NP', 'NP', 'PL', 'VP', 'PAST1']

---------------------------  ---------------------------  ------  ----------  --------
['NPVPPAST', 'S', 'VPPAST']
['NPVP']                     ['NPVPPAST', 'S', 'VPPAST']
['NP', 'NPPL']               ['NPVP']                     []
['NP']                       ['NP', 'NPPL']               []      ['VPPAST']
['NP']                       ['NP']                       ['PL']  ['VP']      ['PAST']
arkadaşıma                   hediye                       ler     al          dım
---------------------------  ---------------------------  ------  ----------  --------



In [31]:
sentence = 'ben yarın gel ecek im'
g.parse(sentence)
g.print_parsed_table()

Given sentence is gramatically CORRECT
ben yarın gel ecek im
['PRO1', 'FUTNOUN', 'VP', 'FUT', 'POSPRO1']

-------  ----------------  ---------  -------------  ----------
['S']
[]       ['FUTNOUNVPFUT']
[]       ['FUTNOUNVPFUT']  ['VPFUT']
[]       []                ['VPFUT']  ['FUTPOSPRO']
['PRO']  ['FUTNOUN']       ['VP']     ['FUT']        ['POSPRO']
ben      yarın             gel        ecek           im
-------  ----------------  ---------  -------------  ----------



In [32]:
sentence = 'bu akşamki toplantıya katıl acak mı sınız'
g.parse(sentence)
g.print_parsed_table()

Given sentence is gramatically CORRECT
bu akşamki toplantıya katıl acak mı sınız
['ADJ', 'NP', 'NP', 'VP', 'FUT', 'Q', 'POSPROPL2']

---------------  -----------  -----------  ---------  -------  -------------  ------------
['S']
[]               ['S']
['NPVPFUT']      []           ['S']
['NPVP']         ['NPVPFUT']  []           []
['ADJNP', 'NP']  ['NPVP']     ['NPVPFUT']  []         []
['ADJNP', 'NP']  ['NP']       ['NPVP']     ['VPFUT']  []       ['QPOSPROPL']
['ADJ']          ['NP']       ['NP']       ['VP']     ['FUT']  ['Q']          ['POSPROPL']
bu               akşamki      toplantıya   katıl      acak     mı             sınız
---------------  -----------  -----------  ---------  -------  -------------  ------------



In [33]:
g.grammar_rules

{'ADJ ADJ': ['ADJ'],
 'bu': ['ADJ'],
 'en': ['ADJ'],
 'epey': ['ADJ'],
 'güzel': ['ADJ'],
 'tarihi': ['ADJ'],
 'uzak': ['ADJ'],
 'yüksek': ['ADJ'],
 'ADJ NP': ['ADJNP', 'NP'],
 'ADJ PAST3': ['ADJPAST3'],
 'ADJ PREPART': ['ADJPREPART'],
 'güzelce': ['ADV'],
 'keyifle': ['ADV'],
 'acak': ['FUT'],
 'ecek': ['FUT'],
 'yarın': ['FUTNOUN'],
 'FUTNOUN VPFUT1': ['FUTNOUNVPFUT1'],
 'FUTNOUN VPFUT2': ['FUTNOUNVPFUT2'],
 'FUTNOUN VPFUT3': ['FUTNOUNVPFUT3'],
 'FUT POSPRO1': ['FUTPOSPRO1'],
 'FUT POSPRO2': ['FUTPOSPRO2'],
 'ma': ['IMP'],
 'me': ['IMP'],
 'ADJ NPPL': ['NP'],
 'ADJ SINGNP': ['NP'],
 'ADJNP PL': ['NP'],
 'NP NP': ['NP'],
 'NP PL': ['NP', 'NPPL'],
 'NP PP': ['NP'],
 'SING ADJNP': ['NP'],
 'SING NP': ['NP', 'SINGNP'],
 'akşam': ['NP'],
 'akşamki': ['NP'],
 'anneme': ['NP'],
 'arkadaşıma': ['NP'],
 'bizim': ['NP'],
 'buraya': ['NP'],
 'destan': ['NP'],
 'hediye': ['NP'],
 'kalem': ['NP'],
 'karpuz': ['NP'],
 'kitap': ['NP'],
 'köye': ['NP'],
 'kültürümüzü': ['NP'],
 'meyve': ['NP'],
 'mi