# Latin Syllabifier Function Testing and Analysis

In [1]:
from latinsyllabifier import *
from pathlib import Path

## Selecting a passage
Choose the default Aeneid text or another text in the directory **latin_texts** of the repo.

In [2]:
def passage_picker(data_folder, file_to_open):
    path = Path(data_folder) / file_to_open
    with open(path, 'r') as file:
        passage = file.read()
    return passage

# This notebook is currently using the Aeneid text.
# Uncomment out the last line of this cell and change the path to select another text
passage = passage_picker('', 'aeneid_example.txt')
# passage = passage_picker('latin_texts/caesar.de_bello_gallico/', 'caesar.de_bello_gallico.part.1.tess')

## Function Testing
### Sounder Function Testing
This function divides lines of input (passage) from latin.txt into component vowel/consonant sounds, accounting for many pronunciation phenomena

In [3]:
# Aeneid 1.3 Sounder Test
line3 = liner(passage)[2]

print(line3)

soundsline3 = sounder(line3)
print_sounder(soundsline3)

<verg. aen. 1.3>	litora, multum ille et terris iactatus et alto

litora multillet terris iactatus et alto
[['c', 'l'], ['v', 'i'], ['c', 't'], ['v', 'o'], ['c', 'r'], ['v', 'a']]
[['c', 'm'], ['v', 'u'], ['c', 'l'], ['c', 't'], ['v', 'i'], ['c', 'l'], ['c', 'l'], ['v', 'e'], ['c', 't']]
[['c', 't'], ['v', 'e'], ['c', 'r'], ['c', 'r'], ['v', 'i'], ['c', 's']]
[['c', 'i'], ['v', 'a'], ['c', 'c'], ['c', 't'], ['v', 'a'], ['c', 't'], ['v', 'u'], ['c', 's']]
[['v', 'e'], ['c', 't']]
[['v', 'a'], ['c', 'l'], ['c', 't'], ['v', 'o']]


In [4]:
# Aeneid 1.64 Sounder Test
line64 = liner(passage)[63]

print(line64)

soundsline64 = sounder(line64)
print_sounder(soundsline64)

<verg. aen. 1.64>	Ad quem tum Iuno supplex his vocibus usa est:

ad quem tum iuno supplecs his vocibus usast
[['v', 'a'], ['c', 'd']]
[['c', 'qu'], ['v', 'e'], ['c', 'm']]
[['c', 't'], ['v', 'u'], ['c', 'm']]
[['c', 'i'], ['v', 'u'], ['c', 'n'], ['v', 'o']]
[['c', 's'], ['v', 'u'], ['c', 'p'], ['c', 'pl'], ['v', 'e'], ['c', 'c'], ['c', 's']]
[['c', 'h'], ['v', 'i'], ['c', 's']]
[['c', 'v'], ['v', 'o'], ['c', 'c'], ['v', 'i'], ['c', 'b'], ['v', 'u'], ['c', 's']]
[['v', 'u'], ['c', 's'], ['v', 'a'], ['c', 's'], ['c', 't']]


### Syllabifier Function Testing
This function builds off of sounder function output, stringing together consonant and vowel sounds into syllables based off of syllabification rules.

In [5]:
# Aeneid 1.1-5 Syllabifier Test
list_lister(liner(passage)[:5])
list_lister(syllabifier_line_numbers(passage)[:5])

<verg. aen. 1.1>	     Arma virumque cano, Troiae qui primus ab oris
<verg. aen. 1.2>	Italiam, fato profugus, Laviniaque venit
<verg. aen. 1.3>	litora, multum ille et terris iactatus et alto
<verg. aen. 1.4>	vi superum saevae memorem Iunonis ob iram;
<verg. aen. 1.5>	multa quoque et bello passus, dum conderet urbem,
(1, ['ar', 'ma', 'vi', 'rum', 'que', 'ca', 'no', 'tro', 'iae', 'qui', 'pri', 'mus', 'ab', 'o', 'ris'])
(2, ['i', 'ta', 'li', 'am', 'fa', 'to', 'pro', 'fu', 'gus', 'la', 'vi', 'ni', 'a', 'que', 've', 'nit'])
(3, ['li', 'to', 'ra', 'mul', 'til', 'let', 'ter', 'ris', 'iac', 'ta', 'tus', 'et', 'al', 'to'])
(4, ['vi', 'su', 'pe', 'rum', 'sae', 'vae', 'me', 'mo', 'rem', 'iu', 'no', 'nis', 'ob', 'i', 'ram'])
(5, ['mul', 'ta', 'quo', 'quet', 'bel', 'lo', 'pas', 'sus', 'dum', 'con', 'de', 'ret', 'ur', 'bem'])


## Analysis
### Syllabifier Output Syllable Count
The following code counts the total number of syllables in the syllabifier output for Aeneid 1

In [6]:
syllables = syllabifier(passage)
def listOlists_counter(listOlists):
    count = 0
    for line in listOlists:
        count += len(line)
    return count
print("Total # of Syllables in Aeneid Book 1")
print(listOlists_counter(syllables))

Total # of Syllables in Aeneid Book 1
11057


### Syllabifier Output Unique Syllable Frequencies
The following code counts the frequencies of each unique syllable in Aeneid 1

In [7]:
# Unique Syllables and their Frequencies
from collections import Counter
def listOlists_combiner(listOlists):
    if len(listOlists) == 0:
        return []
    else:
        return listOlists[0] + listOlists_combiner(listOlists[1:])
allSyllables = listOlists_combiner(syllables)
print("Syllables and their Occurences in Aeneid Book 1")
count = Counter(allSyllables)
print(count)

Syllables and their Occurences in Aeneid Book 1
Counter({'a': 292, 're': 277, 'que': 210, 'ta': 163, 'ti': 161, 'li': 153, 'ni': 137, 'te': 130, 'o': 129, 'ne': 119, 'de': 116, 'ra': 115, 'et': 115, 'di': 115, 'ri': 107, 'mi': 104, 'na': 104, 'ma': 103, 'in': 98, 'to': 94, 'si': 94, 'la': 93, 'bus': 90, 'tis': 89, 'vi': 87, 'no': 82, 'se': 82, 'ci': 81, 'tu': 80, 'e': 79, 'ae': 79, 'pe': 77, 've': 73, 'me': 71, 'tur': 69, 'tum': 69, 'tus': 67, 'per': 67, 'tem': 67, 'ter': 66, 'mo': 63, 'i': 62, 'pi': 61, 'do': 60, 'bi': 59, 'ge': 58, 'sa': 57, 'gi': 57, 'ca': 56, 'ce': 55, 'su': 54, 'cum': 52, 'nis': 50, 'lo': 50, 'rum': 49, 'cu': 49, 'qui': 48, 'ar': 47, 'da': 47, 'pa': 46, 'as': 46, 'le': 44, 'ris': 42, 'fa': 42, 'so': 40, 'ro': 39, 'qua': 38, 'po': 38, 'iu': 36, 'con': 36, 'at': 36, 'mis': 35, 'lis': 35, 'ret': 34, 'res': 34, 'quae': 34, 'nus': 33, 'pu': 33, 'co': 33, 'nos': 33, 'tes': 33, 'vo': 33, 'tro': 31, 'fu': 31, 'us': 31, 'rat': 31, 'men': 31, 'pri': 30, 'pro': 30, 'an': 30,

In [8]:
# List of Unique Syllables
print("The Unique Syllables of Aeneid Book 1")
print(list(count))

The Unique Syllables of Aeneid Book 1
['ar', 'ma', 'vi', 'rum', 'que', 'ca', 'no', 'tro', 'iae', 'qui', 'pri', 'mus', 'ab', 'o', 'ris', 'i', 'ta', 'li', 'am', 'fa', 'to', 'pro', 'fu', 'gus', 'la', 'ni', 'a', 've', 'nit', 'ra', 'mul', 'til', 'let', 'ter', 'iac', 'tus', 'et', 'al', 'su', 'pe', 'sae', 'vae', 'me', 'mo', 'rem', 'iu', 'nis', 'ob', 'ram', 'quo', 'quet', 'bel', 'lo', 'pas', 'sus', 'dum', 'con', 'de', 'ret', 'ur', 'bem', 'in', 'fer', 'os', 'ti', 'ge', 'nus', 'un', 'num', 'ba', 'pa', 'tres', 'at', 'qual', 'tae', 'moe', 'ro', 'mae', 'mu', 'sa', 'mi', 'hi', 'cau', 'sas', 'nu', 'ne', 'lae', 'so', 'quid', 'do', 'lens', 're', 'gi', 'na', 'deum', 'tot', 'vol', 'sig', 'nem', 'pi', 'e', 'te', 'di', 'bo', 'res', 'im', 'pu', 'le', 'rit', 'tan', 'mis', 'cae', 'les', 'bus', 'rae', 'urbs', 'an', 'qua', 'fuit', 'ty', 'ri', 'co', 'kar', 'tha', 'tra', 'be', 'lon', 'ves', 'pum', 'stu', 'is', 'quas', 'per', 'quam', 'tur', 'gis', 'om', 'u', 'nam', 'pos', 'bi', 'luis', 'se', 'mic', 'il', 'us', 'hi

### Syllabifier Output Error Analysis
The following is error analysis of the syllabifier function, based off of a manually syllabifier section of Aeneid 1.

In [9]:
# Manually syllabified Aeneid 1.1-100
manualSyllables = [
    ['ar', 'ma', 'vi', 'rum', 'que', 'ca', 'no', 'tro', 'iae', 'qui', 'pri', 'mus', 'ab', 'o', 'ris'],
    ['i', 'ta', 'li', 'am', 'fa', 'to', 'pro', 'fu', 'gus', 'la', 'vi', 'ni', 'a', 'que', 've', 'nit'],
    ['li', 'to', 'ra', 'mul', 'til', 'let', 'ter', 'ris', 'iac', 'ta', 'tus', 'et', 'al', 'to'],
    ['vi', 'su', 'pe', 'rum', 'sae', 'vae', 'me', 'mo', 'rem', 'iu', 'no', 'nis', 'ob', 'i', 'ram'],
    ['mul', 'ta', 'quo', 'quet', 'bel', 'lo', 'pas', 'sus', 'dum', 'con', 'de', 'ret', 'ur', 'bem'],
    ['in', 'fer', 'ret', 'que', 'de', 'os', 'la', 'ti', 'o', 'ge', 'nus', 'un', 'de', 'la', 'ti', 'num'],
    ['al', 'ba', 'ni', 'que', 'pa', 'tres', 'at', 'qual', 'tae', 'moe', 'ni', 'a', 'ro', 'mae'],
    ['mu', 'sa', 'mi', 'hi', 'cau', 'sas', 'me', 'mo', 'ra', 'quo', 'nu', 'mi', 'ne', 'lae', 'so'],
    ['quid', 've', 'do', 'lens', 're', 'gi', 'na', 'de', 'um', 'tot', 'vol', 've', 're', 'ca', 'sus'],
    ['in', 'sig', 'nem', 'pi', 'e', 'ta', 'te', 'vi', 'rum', 'tot', 'a', 'di', 're', 'la', 'bo', 'res'],
    ['im', 'pu', 'le', 'rit', 'tan', 'tae', 'na', 'ni', 'mis', 'cae', 'les', 'ti', 'bus', 'i', 'rae'],
    ['urbs', 'an', 'ti', 'qua', 'fuit', 'ty', 'ri', 'i', 'te', 'nu', 'e', 're', 'co', 'lo', 'ni'],
    ['kar', 'tha', 'gi', 'ta', 'li', 'am', 'con', 'tra', 'ti', 'be', 'ri', 'na', 'que', 'lon', 'ge'],
    ['os', 'ti', 'a', 'di', 'ves', 'o', 'pum', 'stu', 'di', 'is', 'quas', 'per', 'ri', 'ma', 'bel', 'li'],
    ['quam', 'iu', 'no', 'fer', 'tur', 'ter', 'ris', 'ma', 'gis', 'om', 'ni', 'bus', 'u', 'nam'],
    ['post', 'ha', 'bi', 'ta', 'co', 'lu', 'is', 'se', 'sa', 'mo', 'hic', 'il', 'li', 'us', 'ar', 'ma'],
    ['hic', 'cur', 'rus', 'fu', 'it', 'hoc', 'reg', 'num', 'de', 'a', 'gen', 'ti', 'bus', 'es', 'se'],
    ['si', 'qua', 'fa', 'ta', 'si', 'nant', 'iam', 'tum', 'ten', 'dit', 'que', 'fo', 'vet', 'que'],
    ['pro', 'ge', 'ni', 'em', 'sed', 'e', 'nim', 'tro', 'ia', 'na', 'san', 'gui', 'ne', 'du', 'ci'],
    ['au', 'di', 'e', 'rat', 'ty', 'ri', 'as', 'o', 'lim', 'quae', 'ver', 'te', 'ret', 'ar', 'ces'],
    ['hinc', 'po', 'pu', 'lum', 'la', 'te', 're', 'gem', 'bel', 'lo', 'que', 'su', 'per', 'bum'],
    ['ven', 'tu', 'recs', 'ci', 'di', 'o', 'li', 'by', 'ae', 'sic', 'vol', 've', 're', 'par', 'cas'],
    ['id', 'me', 'tu', 'ens', 've', 'te', 'ris', 'que', 'me', 'mor', 'sa', 'tur', 'ni', 'a', 'bel', 'li'],
    ['pri', 'ma', 'quod', 'ad', 'tro', 'iam', 'pro', 'ca', 'ris', 'ges', 'se', 'rat', 'ar', 'gis'],
    ['nec', 'de', 'ti', 'am', 'cau', 'si', 'ra', 'rum', 'sae', 'vi', 'que', 'do', 'lo', 'res'],
    ['ecs', 'ci', 'de', 'rant', 'a', 'ni', 'mo', 'ma', 'net', 'al', 'ta', 'men', 'te', 're', 'pos', 'tum'],
    ['iu', 'di', 'ci', 'um', 'pa', 'ri', 'dis', 'spre', 'tae', 'qui', 'ni', 'u', 'ri', 'a', 'for', 'mae'],
    ['et', 'ge', 'nus', 'in', 'vi', 'set', 'rap', 'ti', 'ga', 'ny', 'me', 'dis', 'ho', 'no', 'res'],
    ['his', 'ac', 'cen', 'sa', 'su', 'per', 'iac', 'ta', 'tos', 'ae', 'quo', 're', 'to', 'to'],
    ['tro', 'as', 're', 'li', 'qui', 'as', 'da', 'na', 'at', 'quim', 'mi', 'tis', 'ac', 'hil', 'li'],
    ['ar', 'ce', 'bat', 'lon', 'ge', 'la', 'ti', 'o', 'mul', 'tos', 'que', 'per', 'an', 'nos'],
    ['er', 'ra', 'bant', 'ac', 'ti', 'fa', 'tis', 'ma', 'ri', 'om', 'ni', 'a', 'cir', 'cum'],
    ['tan', 'tae', 'mo', 'lis', 'e', 'rat', 'ro', 'ma', 'nam', 'con', 'de', 're', 'gen', 'tem'],
    ['vics', 'e', 'cons', 'pec', 'tu', 'si', 'cu', 'lae', 'tel', 'lu', 'ris', 'in', 'al', 'tum'],
    ['ve', 'la', 'da', 'bant', 'lae', 'tet', 'spu', 'mas', 'sa', 'lis', 'ae', 're', 'ru', 'e', 'bant'],
    ['cum', 'iu', 'nae', 'ter', 'num', 'ser', 'vans', 'sub', 'pec', 'to', 're', 'vol', 'nus'],
    ['haec', 'se', 'cum', 'me', 'nin', 'cep', 'to', 'de', 'sis', 'te', 're', 'vic', 'tam'],
    ['nec', 'pos', 'si', 'ta', 'li', 'a', 'teu', 'cro', 'ra', 'ver', 'te', 're', 're', 'gem'],
    ['quip', 'pe', 've', 'tor', 'fa', 'tis', 'pal', 'las', 'nec', 'su', 're', 're', 'clas', 'sem'],
    ['ar', 'gi', 'vat', 'quip', 'sos', 'po', 'tu', 'it', 'sub', 'mer', 'ge', 're', 'pon', 'to'],
    ['u', 'ni', 'us', 'ob', 'noc', 'set', 'fu', 'ri', 'as', 'a', 'ia', 'cis', 'o', 'i', 'lei'],
    ['ip', 'sa', 'io', 'vis', 'ra', 'pi', 'dum', 'ia', 'cu', 'la', 'te', 'nu', 'bi', 'bus', 'ig', 'nem'],
    ['dis', 'ie', 'cit', 'que', 'ra', 'tes', 'e', 'ver', 'tit', 'quae', 'quo', 'ra', 'ven', 'tis'],
    ['il', 'lecs', 'pi', 'ran', 'tem', 'trans', 'fic', 'so', 'pec', 'to', 're', 'flam', 'mas'],
    ['tur', 'bi', 'ne', 'cor', 'ri', 'pu', 'it', 'sco', 'pu', 'lo', 'quin', 'fic', 'sit', 'a', 'cu', 'to'],
    ['ast', 'e', 'go', 'quae', 'di', 'vin', 'ce', 'do', 're', 'gi', 'na', 'io', 'vis', 'que'],
    ['et', 'so', 'ror', 'et', 'con', 'iuncs', 'u', 'na', 'cum', 'gen', 'te', 'tot', 'an', 'nos'],
    ['bel', 'la', 'ge', 'ret', 'quis', 'quam', 'nu', 'men', 'iu', 'no', 'nis', 'a', 'do', 'ret'],
    ['prae', 'te', 're', 'aut', 'sup', 'plecs', 'a', 'ris', 'im', 'po', 'net', 'ho', 'no', 'rem'],
    ['ta', 'li', 'a', 'flam', 'ma', 'to', 'se', 'cum', 'de', 'a', 'cor', 'de', 'vo', 'lu', 'tans'],
    ['nim', 'bo', 'rin', 'pa', 'tri', 'am', 'lo', 'ca', 'fe', 'ta', 'fu', 'ren', 'ti', 'bus', 'aus', 'tris'],
    ['ae', 'o', 'li', 'am', 've', 'nit', 'hic', 'vas', 'to', 'recs', 'ae', 'o', 'lus', 'an', 'tro'],
    ['luc', 'tan', 'tes', 'ven', 'tos', 'tem', 'pes', 'ta', 'tes', 'que', 'so', 'no', 'ras'],
    ['im', 'pe', 'ri', 'o', 'pre', 'mit', 'ac', 'vin', 'clis', 'et', 'car', 'ce', 're', 'fre', 'nat'],
    ['il', 'lin', 'dig', 'nan', 'tes', 'mag', 'no', 'cum', 'mur', 'mu', 're', 'mon', 'tis'],
    ['cir', 'cum', 'claus', 'tra', 'fre', 'munt', 'cel', 'sa', 'se', 'det', 'ae', 'o', 'lus', 'ar', 'ce'],
    ['scep', 'tra', 'te', 'nens', 'mol', 'lit', 'qua', 'ni', 'mos', 'et', 'tem', 'pe', 'rat', 'i', 'ras'],
    ['ni', 'fa', 'ci', 'at', 'ma', 'ri', 'ac', 'ter', 'ras', 'cae', 'lum', 'que', 'pro', 'fun', 'dum'],
    ['quip', 'pe', 'fe', 'rant', 'ra', 'pi', 'di', 'se', 'cum', 'ver', 'rant', 'que', 'per', 'au', 'ras'],
    ['sed', 'pa', 'ter', 'om', 'ni', 'po', 'tens', 'spe', 'lun', 'cis', 'ab', 'di', 'dit', 'a', 'tris'],
    ['hoc', 'me', 'tu', 'ens', 'mo', 'lem', 'quet', 'mon', 'tis', 'in', 'su', 'per', 'al', 'tos'],
    ['im', 'po', 'su', 'it', 're', 'gem', 'que', 'de', 'dit', 'qui', 'foe', 'de', 're', 'cer', 'to'],
    ['et', 'pre', 'me', 'ret', 'lac', 'sas', 'sci', 'ret', 'da', 're', 'ius', 'sus', 'ha', 'be', 'nas'],
    ['ad', 'quem', 'tum', 'iu', 'no', 'sup', 'plecs', 'his', 'vo', 'ci', 'bus', 'u', 'sast'],
    ['ae', 'o', 'le', 'nam', 'que', 'ti', 'bi', 'di', 'vom', 'pa', 'ter', 'at', 'quo', 'mi', 'num', 'recs'],
    ['et', 'mul', 'ce', 're', 'de', 'dit', 'fluc', 'tus', 'et', 'tol', 'le', 're', 'ven', 'to'],
    ['gens', 'i', 'ni', 'mi', 'ca', 'mi', 'hi', 'tyrr', 'he', 'num', 'na', 'vi', 'gat', 'ae', 'quor'],
    ['i', 'li', 'in', 'i', 'ta', 'li', 'am', 'por', 'tans', 'vic', 'tos', 'que', 'pe', 'na', 'tes'],
    ['in', 'cu', 'te', 'vim', 'ven', 'tis', 'sub', 'mer', 'sas', 'quo', 'bru', 'e', 'pup', 'pes'],
    ['aut', 'a', 'ge', 'di', 'ver', 'sos', 'et', 'dis', 'ii', 'ce', 'cor', 'po', 'ra', 'pon', 'to'],
    ['sunt', 'mi', 'hi', 'bis', 'sep', 'tem', 'praes', 'tan', 'ti', 'cor', 'po', 're', 'nym', 'phae'],
    ['qua', 'rum', 'quae', 'for', 'ma', 'pul', 'cher', 'ri', 'ma', 'de', 'i', 'o', 'pe', 'a'],
    ['co', 'nu', 'bio', 'iun', 'gam', 'sta', 'bi', 'li', 'pro', 'pri', 'am', 'que', 'di', 'ca', 'bo'],
    ['om', 'nis', 'ut', 'te', 'cum', 'me', 'ri', 'tis', 'pro', 'ta', 'li', 'bus', 'an', 'nos'],
    ['ec', 'si', 'gat', 'et', 'pulch', 'ra', 'fa', 'ci', 'at', 'te', 'pro', 'le', 'pa', 'ren', 'tem'],
    ['ae', 'o', 'lus', 'haec', 'con', 'tra', 'tu', 'us', 'o', 're', 'gi', 'na', 'quid', 'op', 'tes'],
    ['ecs', 'plo', 'ra', 're', 'la', 'bor', 'mi', 'hi', 'ius', 'sa', 'ca', 'pes', 'se', 're', 'fas', 'est'],
    ['tu', 'mi', 'hi', 'quod', 'cum', 'quoc', 'reg', 'ni', 'tu', 'scep', 'tra', 'io', 'vem', 'que'],
    ['con', 'ci', 'li', 'as', 'tu', 'das', 'e', 'pu', 'lis', 'ac', 'cum', 'be', 're', 'di', 'vom'],
    ['nim', 'bo', 'rum', 'que', 'fa', 'cis', 'tem', 'pes', 'ta', 'tum', 'que', 'po', 'ten', 'tem'],
    ['haec', 'u', 'bi', 'dic', 'ta', 'ca', 'vum', 'con', 'ver', 'sa', 'cus', 'pi', 'de', 'mon', 'tem'],
    ['im', 'pu', 'lit', 'in', 'la', 'tus', 'ac', 'ven', 'ti', 've', 'lut', 'ag', 'mi', 'ne', 'fac', 'to'],
    ['qua', 'da', 'ta', 'por', 'ta', 'ru', 'unt', 'et', 'ter', 'ras', 'tur', 'bi', 'ne', 'per', 'flant'],
    ['in', 'cu', 'bu', 'e', 're', 'ma', 'ri', 'to', 'tum', 'qua', 'se', 'di', 'bus', 'i', 'mis'],
    ['u', 'neu', 'rus', 'que', 'no', 'tus', 'que', 'ru', 'unt', 'cre', 'ber', 'que', 'pro', 'cel', 'lis'],
    ['a', 'fri', 'cus', 'et', 'vas', 'tos', 'vol', 'vunt', 'ad', 'li', 'to', 'ra', 'fluc', 'tus'],
    ['in', 'se', 'qui', 'tur', 'cla', 'mor', 'que', 'vi', 'rum', 'stri', 'dor', 'que', 'ru', 'den', 'tum'],
    ['e', 'ri', 'pi', 'unt', 'su', 'bi', 'to', 'nu', 'bes', 'cae', 'lum', 'que', 'di', 'em', 'que'],
    ['teu', 'cro', 'recs', 'o', 'cu', 'lis', 'pon', 'to', 'nocs', 'in', 'cu', 'bat', 'a', 'tra'],
    ['in', 'to', 'nu', 'e', 're', 'po', 'let', 'cre', 'bris', 'mi', 'cat', 'ig', 'ni', 'bus', 'ae', 'ther'],
    ['prae', 'sen', 'tem', 'que', 'vi', 'ris', 'in', 'ten', 'tant', 'om', 'ni', 'a', 'mor', 'tem'],
    ['ecs', 'tem', 'plae', 'ne', 'ae', 'sol', 'vun', 'tur', 'fri', 'go', 're', 'mem', 'bra'],
    ['in', 'ge', 'mit', 'et', 'du', 'pli', 'cis', 'ten', 'dens', 'ad', 'si', 'de', 'ra', 'pal', 'mas'],
    ['ta', 'li', 'a', 'vo', 'ce', 're', 'fert', 'o', 'ter', 'que', 'qua', 'ter', 'que', 'be', 'a', 'ti'],
    ['quis', 'an', 'to', 'ra', 'pa', 'trum', 'tro', 'iae', 'sub', 'moe', 'ni', 'bus', 'al', 'tis'],
    ['con', 'ti', 'git', 'op', 'pe', 'te', 'ro', 'da', 'na', 'um', 'for', 'tis', 'si', 'me', 'gen', 'tis'],
    ['ty', 'di', 'de', 'me', 'ni', 'li', 'a', 'cis', 'oc', 'cum', 'be', 're', 'cam', 'pis'],
    ['non', 'po', 'tu', 'is', 'se', 'tu', 'a', 'qua', 'ni', 'manc', 'ef', 'fun', 'de', 're', 'decs', 'tra'],
    ['sae', 'vus', 'u', 'bae', 'a', 'ci', 'dae', 'te', 'lo', 'ia', 'cet', 'hec', 'tor', 'u', 'bin', 'gens'],
    ['sar', 'pe', 'don', 'u', 'bi', 'tot', 'si', 'mo', 'is', 'cor', 'rep', 'ta', 'sub', 'un', 'dis']
]

The following code compares the manually syllabified Aeneid 1.1-100 to a syllabifier function output for Aeneid 1.1-100.

In [10]:
# Syllabifier Test Error Analysis for Aeneid 1.1-100
automaticSyllables = syllabifier(passage)[:100]
syllableError = []
# [true positive, false positive, false negative]
syllableErrors = []
# ([false positives], [false negatives])
totalTruePositive = 0
totalFalsePositive = 0
totalFalseNegative = 0
for line in range(100):
    manualLine = manualSyllables[line]
    automaticLine = automaticSyllables[line]
    truePositive = []
    falseNegative = []
    for syl in manualLine:
        if syl in automaticLine:
            automaticLine.remove(syl)
            truePositive.append(syl)
        else:
            falseNegative.append(syl)
    falsePositive = automaticLine
    totalTruePositive += len(truePositive)
    totalFalsePositive += len(falsePositive)
    totalFalseNegative += len(falseNegative)
    syllableError.append([len(truePositive), len(falsePositive), len(falseNegative)])
    syllableErrors.append((falsePositive, falseNegative))
totalSyllableError = [totalTruePositive, totalFalsePositive, totalFalseNegative]
print('Total True Positive, False Positive, and False Negative Syllables Found by Syllabifier in lines 1-100 of Aeneid 1')
print(totalSyllableError)

Total True Positive, False Positive, and False Negative Syllables Found by Syllabifier in lines 1-100 of Aeneid 1
[1438, 26, 33]


The following are line-by-line results of the error analysis function [TP, FP, FN]

In [11]:
list_lister(syllableError)

[15, 0, 0]
[16, 0, 0]
[14, 0, 0]
[15, 0, 0]
[14, 0, 0]
[16, 0, 0]
[14, 0, 0]
[15, 0, 0]
[13, 1, 2]
[16, 0, 0]
[15, 0, 0]
[15, 0, 0]
[15, 0, 0]
[16, 0, 0]
[14, 0, 0]
[10, 4, 6]
[13, 1, 2]
[14, 0, 0]
[15, 0, 0]
[15, 0, 0]
[14, 0, 0]
[15, 0, 0]
[16, 0, 0]
[14, 0, 0]
[14, 0, 0]
[16, 0, 0]
[16, 0, 0]
[15, 0, 0]
[14, 0, 0]
[11, 3, 4]
[14, 0, 0]
[14, 0, 0]
[14, 0, 0]
[14, 0, 0]
[15, 0, 0]
[13, 0, 0]
[13, 0, 0]
[14, 0, 0]
[14, 0, 0]
[12, 1, 2]
[15, 0, 0]
[16, 0, 0]
[12, 3, 2]
[13, 0, 0]
[14, 1, 2]
[14, 0, 0]
[12, 3, 2]
[14, 0, 0]
[14, 0, 0]
[15, 0, 0]
[16, 0, 0]
[15, 0, 0]
[13, 0, 0]
[15, 0, 0]
[13, 0, 0]
[15, 0, 0]
[15, 0, 0]
[15, 0, 0]
[15, 0, 0]
[15, 0, 0]
[14, 0, 0]
[13, 1, 2]
[15, 0, 0]
[13, 0, 0]
[16, 0, 0]
[14, 0, 0]
[15, 0, 0]
[15, 0, 0]
[14, 0, 0]
[13, 3, 2]
[14, 0, 0]
[12, 1, 2]
[14, 2, 1]
[14, 0, 0]
[15, 0, 0]
[15, 0, 0]
[16, 0, 0]
[14, 0, 0]
[15, 0, 0]
[14, 0, 0]
[15, 0, 0]
[16, 0, 0]
[15, 0, 0]
[15, 0, 0]
[15, 0, 0]
[14, 0, 0]
[15, 0, 0]
[15, 0, 0]
[14, 0, 0]
[16, 0, 0]
[14, 0, 0]

The following are line-by-line results of the specific syllables missing from or added to the syllabifier output compared to the manually syllabified portion in the format [FP,FN]

In [12]:
list_lister(syllableErrors)

([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
(['deum'], ['de', 'um'])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
(['pos', 'tha', 'luis', 'mic'], ['post', 'ha', 'lu', 'is', 'mo', 'hic'])
(['fuit'], ['fu', 'it'])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
(['nat', 'a', 'chil'], ['na', 'at', 'ac', 'hil'])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
(['tuit'], ['tu', 'it'])
([], [])
([], [])
(['di', 'si', 'e'], ['dis', 'ie'])
([], [])
(['puit'], ['it', 'pu'])
([], [])
(['co', 'ni', 'uncs'], ['con', 'iuncs'])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
(['suit'], ['su', 'it'])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
([], [])
(['di', 'si', 'i'], ['dis', 'ii'])
([], [])
(['io'], ['i', 'o'])
(['o', 'bi'], ['bio'])
([], [])
([], [])
([], [])
([], [])
([], [])
([]

The following are error analysis results of different configurations of the syllabifier function. The current configuration is "errorAllDipthongs" and "errorJustQU"

In [13]:
# ERROR ANALYSIS RESULTS
# Testing diphthongs
errorAllDiphthongs = [1438, 26, 33]
errorNoAE = [1392, 118, 79]
errorNoAU = [1434, 40, 37]
errorNoEI = [1437, 28, 34]
errorNoEU = [1437, 31, 34]
errorNoOE = [1435, 32, 36]
errorNoUI = [1448, 24, 23]

# Testing su and gu consonant pair additions
errorJustQU = [1438, 26, 33]
errorWithGU = [1433, 29, 38]
errorWithSU = [1398, 45, 73]