In [46]:
import pandas as pd
import re
import string
import time

from collections import Counter, defaultdict

from needleman_wunsch import needleman_wunsch

from fuzzywuzzy import fuzz

from operator import itemgetter

pd.set_option('display.max_rows', 1000)

In [2]:
with open('data/dataYiddish/hebis/json_parallels.txt') as f:
    text = f.read()

In [3]:
pairs = re.findall('\["(.+?)", "(.+?)"\]', text)

In [6]:
heb = []
lat = []

for pair in pairs:
    title = re.sub('[^\u0590-\u05fe \-]+', '', pair[1])
    heb.append(title)
    trans = re.sub('[^\w \-]+', '', pair[0])
    trans = re.sub('datl[\d\-]+', '', trans)
    lat.append(trans)

In [9]:
len(pairs)

6535

In [10]:
letterpairs = [(pair[0][0], pair[1][0].lower()) for pair in zip(heb, lat)]

In [None]:
letterdict = defaultdict(str)

for tup in Counter(letterpairs).most_common()[::-1]:
    letterdict[tup[0][0]] = tup[0][1]

In [14]:
letterdict

defaultdict(str,
            {' ': ' ',
             'פ': 'f',
             'ג': 'g',
             'מ': 'm',
             'ל': 'l',
             'ח': 'ḥ',
             'כ': 'k',
             'ד': 'd',
             'ז': 'z',
             'ע': 'ʿ',
             'ת': 't',
             'א': 'a',
             'ה': 'h',
             'ש': 's',
             'ב': 'b',
             '-': '2',
             'ר': 'r',
             'ס': 's',
             'ט': 'ṭ',
             'צ': 't',
             'נ': 'n',
             'ק': 'k',
             'װ': 'ṿ',
             'י': 'y',
             '״': 's',
             'ו': 'ṿ',
             'ײ': 'y'})

In [105]:
letterdict['כ'] = 'kh'
letterdict['ך'] = 'kh'
letterdict['צ'] = 'ts'
letterdict['ץ'] = 'ts'
letterdict['ש'] = 'sh'
letterdict['-'] = '-'
letterdict['ע'] = 'e'
letterdict['ן'] = 'n'
letterdict['ם'] = 'm'
letterdict['ף'] = 'f'
#letterdict['א'] = 'a'
#letterdict['י'] = 'i'
#letterdict['ײ'] = 'ey'
#letterdict['־'] = '-'

for num in range(10):
    letterdict[str(num)] = str(num)
    
for punct in string.punctuation:
    letterdict[punct] = punct

In [110]:
wordlist = []
worddict = {'אין': 'in', 'און': 'un'}

for h, l in zip(heb, lat):
    matches = defaultdict(lambda: ('', 0),)
    for i, word in enumerate(h.split()):
        if word in worddict.keys():
            pseudotrans = worddict[word]
        else:
            pseudotrans = ''.join([letterdict[letter] for letter in word]) 
        ratios = []
        for j, trans in enumerate(l.split()):
            ratio = fuzz.ratio(pseudotrans.lower(), trans.lower()) - abs(i-j)
            ratios.append((trans, pseudotrans, ratio))
        maxratio = max(ratios, key=itemgetter(2))
        print(maxratio)
        if maxratio[2] >= 50:
            if matches[maxratio[0]][1] >= maxratio[2]:
                pass
            elif matches[maxratio[0]][1] < maxratio[2]:
                matches[maxratio[0]] = (word, maxratio[2])
    for key, val in matches.items():
        wordlist.append((val[0], key))
        print(val[0], key)
    print()

('Lomir', 'lamyr', 60)
('lernen', 'lernen', 100)
לאמיר Lomir
לערנען lernen

('lernbukh', 'lernbṿkh', 88)
('farn', 'farn', 100)
('driṭn', 'dryṭn', 80)
('yor', 'yar', 67)
('folḳshul', 'falkshṿl', 62)
לערנבוך lernbukh
פארן farn
דריטן driṭn
יאר yor
פאלקשול folḳshul

('tsuzamengeshṭelṭ', 'tsṿzamengeshṭelṭ', 94)
('durkh', 'dṿrkh', 80)
('di', 'dy', 50)
('lerer', 'lerer', 100)
('fun', 'fṿn', 67)
('der', 'der', 100)
('yidisher', 'ydysher', 80)
('shul', 'shṿl', 75)
('in', 'in', 100)
('Meḳsiḳe', 'meksyke', 57)
('loyt', 'lṭ', 33)
('Lebediḳe', 'lebedyke', 75)
('ḳlangen', 'klangen', 86)
('fun', 'fṿn', 67)
('Sh', 'sh', 100)
('Basṭomsḳi', 'basṭamsky', 67)
('un', 'un', 100)
('M', 'm', 100)
('Ḥayimson', 'ḥymsan', 71)
צוזאמענגעשטעלט tsuzamengeshṭelṭ
דורך durkh
די di
לערער lerer
פון fun
דער der
ײדישער yidisher
שול shul
אין in
מעקסיקע Meḳsiḳe
לעבעדיקע Lebediḳe
קלאנגען ḳlangen
ש Sh
באסטאמסקי Basṭomsḳi
און un
מ M
חײמסאן Ḥayimson

('Bastomski', 'basṭamsky', 67)
('Shelomoh', 'shlmh-', 71)
באסטאמסקי Bastomski
ש

סלאוועס Slowes

('Slovès', 'slṿbs', 55)
('Henri', 'ḥyym-', 0)
סלובס Slovès

('Nju-Jork', 'nyṿ', 18)
('Nju-Jork', 'yark', 32)

('IKUF', 'aykṿf', 44)

('Zeks', 'zeks', 100)
('jidiše', 'yydyshe', 31)
('kriṭiker', 'kryṭyker', 75)
זעקס Zeks
קריטיקער kriṭiker

('Aleksander', 'aleksander', 100)
('Tzederboim', 'tsederbṿym', 70)
('J', 'yy', 0)
('Lerner', 'lerner', 99)
('Ḥ', 'yḥ', 65)
('Rawnitzki', 'raṿṿnytsky', 51)
('Aleksander', 'yṿal', 23)
('Enṭin', 'enṭyn', 78)
('Joiel', 'bel', 50)
('Bal-Maḥšoves', 'mḥshbṿt', 31)
('Bal-Maḥšoves', 'sh', 14)
('Niger', 'nyger', 79)
אלעקסאנדער Aleksander
צעדערבוים Tzederboim
לערנער Lerner
יח Ḥ
ראווניצקי Rawnitzki
ענטין Enṭin
בעל Joiel
ניגער Niger

('N', 'nḥṿm', 40)
('B', 'brṿkh', 33)
('Minkow', 'mynkaṿṿ', 46)

('Minkoff', 'mynkṿb', 46)
('Nahum', 'nḥṿm', 44)
('B', 'brṿkh-', 29)

('Buenos-Aires', 'bṿenas', 56)
('Buenos-Aires', 'ayyres', 43)
בוענאס Buenos-Aires

('Farlag', 'farlag', 100)
('Jidbuch', 'yydbṿkh', 43)
פארלאג Farlag

('Sotsyale', 'satsyale', 88)
('refor

('firer', 'fyrer', 80)
('fun', 'fṿn', 67)
('der', 'der', 100)
('ṿelṭ', 'ṿṿelṭ', 89)
געשטאלטן geshṭalṭn
און un
בילדער bilder
פון fun
די di
פירער firer
דער der
וועלט ṿelṭ

('Tsevi', 'tsby', 44)
('Kahn', 'khhn', 75)
כהן Kahn

('Di', 'dy', 50)
('heldn', 'heldn', 100)
('in', 'in', 100)
('der', 'der', 100)
('ṿelṭ-geshikhṭe', 'ṿṿelṭ-geshykhṭe', 90)
('geshṭalṭn', 'geshṭalṭn', 100)
('un', 'un', 100)
('bilder', 'bylder', 83)
('fun', 'fṿn', 67)
('di', 'dy', 50)
('firer', 'fyrer', 80)
('fun', 'fṿn', 67)
('der', 'der', 100)
('ṿelṭ', 'ṿṿelṭ', 89)
('Tsevi', 'tsby', 44)
('Kahn', 'khhn', 75)
די Di
העלדן heldn
אין in
דער der
וועלט-געשיכטע ṿelṭ-geshikhṭe
געשטאלטן geshṭalṭn
און un
בילדער bilder
פון fun
די di
פירער firer
וועלט ṿelṭ
כהן Kahn

('Di', 'dy', 50)
('heldn', 'heldn', 100)
('in', 'in', 100)
('der', 'der', 100)
('ṿelṭ-geshikhṭe', 'ṿṿelṭ-geshykhṭe', 90)
די Di
העלדן heldn
אין in
דער der
וועלט-געשיכטע ṿelṭ-geshikhṭe

('geshṭalṭn', 'geshṭalṭn', 100)
('un', 'un', 100)
('bilder', 'bylder', 83)
('fun', 'f

('Unzer', 'aṿnzer', 73)
('Tsayṭ', 'tsyyṭ', 80)
אונזער Unzer
צייט Tsayṭ

('Doyres', 'dṿrṿt', 36)
('Bundisṭn', 'bṿndysṭn', 75)
בונדיסטן Bundisṭn

('redagirṭ', 'redagyrṭ', 88)
('fun', 'fṿn', 67)
('Y', 'y', 100)
('Sh', 'sh', 100)
('Herts', 'herts', 100)
רעדאגירט redagirṭ
פון fun
י Y
ש Sh
הערץ Herts

('Doyres', 'dṿrṿt', 36)
('Bundisṭn', 'bṿndysṭn', 75)
('redagirṭ', 'redagyrṭ', 88)
('fun', 'fṿn', 67)
('Y', 'y', 100)
('Sh', 'sh', 100)
('Herts', 'herts', 100)
בונדיסטן Bundisṭn
רעדאגירט redagirṭ
פון fun
י Y
ש Sh
הערץ Herts

('Doyres', 'dṿrṿt', 36)
('Bundisṭn', 'bṿndysṭn', 75)
בונדיסטן Bundisṭn

('redagirṭ', 'redagyrṭ', 88)
('fun', 'fṿn', 67)
('Y', 'y', 100)
('Sh', 'sh', 100)
('Herts', 'herts', 100)
רעדאגירט redagirṭ
פון fun
י Y
ש Sh
הערץ Herts

('Hertz', 'herts', 80)
('Jacob', 'yekb', 22)
('S', 'shlṿm-', 29)
הערץ Hertz

('Nyu', 'nyṿ', 67)
('Yorḳ', 'yark', 50)
ניו Nyu
יארק Yorḳ

('Unzer', 'aṿnzer', 73)
('Tsayṭ', 'tsyyṭ', 80)
אונזער Unzer
צייט Tsayṭ

('Di', 'dy', 50)
('geshikhṭe', 'geshykhṭe', 89

וועגנ ṿegn

('lider', 'lyder', 80)
לידער lider

('Sh', 'sh', 100)
('Halḳin', 'ḥlkyn', 36)
ש Sh

('Halḳin', 'halkyn', 67)
('Shemuʾel', 'shmṿel-', 67)
האלקין Halḳin
שמועל- Shemuʾel

('Di', 'dy', 50)
('lange', 'lange', 100)
('nachṭ', 'nakhṭ', 80)
די Di
לאנגע lange
נאכט nachṭ

('Eliezer', 'alyezr', 62)
('Grinberg', 'grynberg', 88)
אליעזר Eliezer
גרינבערג Grinberg

('Greenberg', 'grynbrg', 75)
('Eliezer', 'alyezr-', 57)
גרינברג Greenberg
אליעזר- Eliezer

('Nju-Jork', 'nyṿ-yark', 50)
ניו-יארק Nju-Jork

('Lipkaner', 'lyfkaner', 75)
('Besaraber', 'besaraber', 100)
('Sosaieti', 'sasyyeṭy', 38)
ליפקאנער Lipkaner
בעסאראבער Besaraber

('In', 'in', 100)
('fremdn', 'fremdn', 100)
('land', 'land', 100)
אין In
פרעמדן fremdn
לאנד land

('M', 'm', 100)
('Olitzki', 'alytsky', 43)
מ M

('Farṿoḳsene', 'farṿṿaksene', 76)
('ṿegn', 'ṿṿegn', 89)
פארוואקסענע Farṿoḳsene
וועגן ṿegn

('lider', 'lyder', 80)
('un', 'un', 100)
('poemes', 'faemes', 67)
לידער lider
און un
פאעמעס poemes

('Ḥayim', 'ḥyym', 67)
('Grade', 

('hosafti', 'hṿsfty', 62)
('ani', 'any', 67)
('Binyamin', 'bnymyn', 71)
('Segal', 'sgsl', 67)
('Melits', 'mksk', 39)
('Melits', 'melyts', 83)
('kol', 'khl', 67)
('ha-devarim', 'hdbrym', 50)
('ha-magiʿim', 'hmgeym', 50)
('le-hitʿorer', 'lhteṿrr', 56)
('lev', 'lb', 40)
('ha-adam', 'hadm', 73)
('la-shuv', 'lshṿb', 50)
('me-ḥataʾaṿ', 'mḥṭayṿ', 50)
('bi-leshon', 'blshṿn', 67)
('Ashkenaz', 'ashkhnz', 80)
('gam', 'gm', 80)
('ken', 'khn', 67)
('Tefilat', 'tflt', 73)
('ha-derekh', 'hdrkh', 71)
('ṿe-Ḳidush', 'ṿkydṿsh', 50)
('ha-levanah', 'hlbnh', 53)
נאים naʾim
וחבוט ṿe-ḥibuṭ
וצוואת ṿe-tsavaʾat
ר׳ r
יודא Yuda
חסיד Ḥasid
בלשון bi-leshon
הקודש ha-ḳodesh
ועתה ṿe-ʿatah
הוספתי hosafti
אני ani
בנימין Binyamin
סג״ל Segal
מעליץ Melits
כל kol
הדברים ha-devarim
המגעים ha-magiʿim
להתעורר le-hitʿorer
האדם ha-adam
לשוב la-shuv
מחטאיו me-ḥataʾaṿ
אשכנז Ashkenaz
גם gam
כן ken
תפלת Tefilat
הדרך ha-derekh
וקידוש ṿe-Ḳidush
הלבנה ha-levanah

('Sefer', 'sfr', 75)
('Marganita', 'mrgnyta', 75)
ספר Sefer
מרגניתא Margan

('Ḥokhmat', 'ḥkhmt', 83)
('ha-yad', 'hyd', 67)
זה Zeh
ספר sefer
תולדות Toldot
אדם adam
ונקרא ṿe-niḳra
חכמת Ḥokhmat
היד ha-yad

('Sēfer', 'sfr', 75)
('Refāēl', 'rfal', 60)
ספר Sēfer
רפאל Refāēl

('worinn', 'ṿṿarynn', 46)
('zich', 'zykh', 50)
('bfindn', 'bfyndn', 83)
('zeks', 'zekhs', 89)
('middôt', 'mdṿt', 60)
('mittûn', 'mtṿn', 58)
('kaf', 'khf', 65)
('zekût', 'zkhṿt', 58)
('nemlich', 'enṿh', 34)
('savlānût', 'sblnyt', 55)
('haknāʿā', 'hkhneh', 44)
('rāṣôn', 'rtsṿn', 38)
זיך zich
בפינדן bfindn
זעכס zeks
מדות middôt
מתון mittûn
כף kaf
זכות zekût
סבלנית savlānût

('Sefer', 'sfr', 75)
('Metsiʾat', 'mtsyat', 71)
('ʿezri', 'ezry', 67)
ספר Sefer
מציאת Metsiʾat
עזרי ʿezri

('reʾu', 'raṿ', 29)
('zeh', 'zh', 80)
('davar', 'dbr', 50)
('ḥadash', 'ḥdsh', 80)
('ḥadash', 'ashr', 59)
('lo', 'la', 49)
('hayah', 'hyh', 74)
('le-ʾolamim', 'leṿlmym', 58)
('me-ʿen', 'meyn', 59)
('kol', 'khl', 66)
('ḥai', 'ḥy', 39)
('hayu', 'hyṿ', 56)
('neʿelamim', 'nelmym', 66)
('ṿe-zeh', 'ṿzh', 66)
('ha-sefer', 'hsfr', 6

('Mikhah', 'mykhh', 73)
('Yosef', 'yṿsf', 67)
('Bin', 'bn', 80)
('Guryon', 'gryṿn', 73)
יודישע Yudishe
פון fun
א a
ווייטען ṿayṭen
איבערגעגעבען ibergegeben
צום tsum
דרוק druḳ
על-ידי ʿal-yede
מיכה Mikhah
יוסף Yosef
בן Bin
גריון Guryon

('Yudishe', 'yṿdyshe', 71)
('ksovim', 'khtbym', 33)
יודישע Yudishe

('fun', 'fṿn', 67)
('a', 'a', 100)
('ṿayṭen', 'ṿṿyyṭen', 77)
('ḳarov', 'krṿb', 22)
פון fun
א a
ווייטען ṿayṭen

('ibergegeben', 'aybergegeben', 87)
('tsum', 'tsṿm', 75)
('druḳ', 'drṿk', 50)
('ʿal-yede', 'el-ydy', 57)
('Mikhah', 'mykhh', 73)
('Yosef', 'yṿsf', 67)
('Bin', 'bn', 80)
('Guryon', 'gryṿn', 73)
איבערגעגעבען ibergegeben
צום tsum
דרוק druḳ
על-ידי ʿal-yede
מיכה Mikhah
יוסף Yosef
בן Bin
גריון Guryon

('Bin-Gorion', 'bngryṿn', 59)
('Micha', 'mykhh', 40)
('Josef', 'yṿsf-', 40)
בן־גריון Bin-Gorion

('Berlin', 'berlyn', 83)
בערלין Berlin

('Shṭibl', 'shṭybl', 83)
שטיבל Shṭibl

('In', 'in', 100)
('der', 'der', 100)
('fremd', 'fremd', 100)
אין In
דער der
פרעמד fremd

('D', 'd', 100)
('Zakali

('in', 'in', 100)
('fun', 'fṿyln', 42)
('tzwišn', 'tsṿṿyshn', 29)
('baide', 'byyde', 60)
('welṭ-milhamos', 'ṿṿelṭ-mlḥmṿt', 56)
פון fun
און un
צייטשריפטן tzaiṭšrifṭn
ארויסגעגעבן aroisgegebn
אין in
ביידע baide
וועלט-מלחמות welṭ-milhamos

('hēkîn', 'hkhyn', 60)
('Yeḥîēl', 'yḥyal', 54)
('Šaynṭûk', 'shyynṭṿkh', 49)
הכין hēkîn
יחיאל Yeḥîēl

('Shainṭukh', 'shyynṭṿkh', 67)
('Yeḥiʾel', 'yḥyal-', 46)
שיינטוך Shainṭukh

('Yešaʿyāhû', 'ysheyhṿ', 50)
('Špîgl', 'shfygl', 36)
('-', '-', 100)
('prôzā', 'frṿzh', 40)
('sîppûrît', 'syfṿryt', 40)
('mig-gêṭṭô', 'mgyṭṿ', 43)
('Lôdž', 'lṿdz', 50)
ישעיהו Yešaʿyāhû
- -
לודז Lôdž

('ham-meḥabbēr', 'shyshh-eshr', 24)
('sîppûrîm', 'syfṿrym', 40)
('mefûʿnāḥîm', 'mfṿenḥym', 56)
('ʿal', 'el', 40)
('kitvê-yād', 'fy', 17)
('kitvê-yād', 'khtby-yd', 59)
('šen-nîṣlû', 'shnytslṿ', 24)
('be-ṣêrûf', 'btsyrṿf', 40)
('ʿim', 'mbṿa', 27)
('we-rēāyôn', 'ṿrayṿn', 40)
('ʿim', 'em', 40)
('ham-meḥabbēr', 'hmḥbr', 59)
מפוענחים mefûʿnāḥîm
כתבי-יד kitvê-yād
המחבר ham-meḥabbēr

('Ješaja

('mi-khol', 'mkhl', 73)
('ha-masekhtot', 'hmskhtṿt', 70)
('ha-muvaʾim', 'hmṿbaym', 47)
('be-sefer', 'bsfr', 67)
('ʿEn', 'eyn', 67)
('ʿEn', 'yekb', 28)
('ṿe-ḳara', 'ṿkra', 55)
('shemo', 'shmṿ', 67)
('ʿEn', 'eyṿn', 53)
('Yitsḥaḳ', 'ytsḥk', 67)
('u-perusho', 'ṿfyrṿshṿ', 35)
('bi-leshon', 'blshṿn', 67)
('Ashkenaz', 'ashkhnz', 80)
('ḳara', 'kra', 57)
('Halikhot', 'hlykhṿt', 67)
('Yitsḥaḳ', 'ytsḥk', 67)
לקט liḳeṭ
מכל mi-khol
המסכתות ha-masekhtot
בספר be-sefer
עין ʿEn
וקרא ṿe-ḳara
שמו shemo
יצחק Yitsḥaḳ
בלשון bi-leshon
אשכנז Ashkenaz
קרא ḳara
הליכות Halikhot

('Tefilot', 'tflṿt', 67)
('be-yom', 'byṿm', 60)
('kipur', 'khfṿr', 40)
('ḳaṭon', 'kṭṿn', 44)
תפלות Tefilot
ביום be-yom

('be-taʿanit', 'btenyt', 50)
('ʿerev', 'erb', 50)
('rḥ', 'rsḥ', 80)
('le-aḥar', 'laḥr', 73)
('minḥah', 'mnḥh', 80)
('gedolah', 'gdṿlh', 67)
('nidpas', 'ndfs', 60)
('bi-leshon', 'blshṿn', 67)
('ha-ḳodesh', 'hkṿdsh', 53)
('bi-leshon', 'ṿblshṿn', 60)
('Ashkenaz', 'ashkhnz', 80)
בתענית be-taʿanit
ערב ʿerev
ר״ח rḥ
לאחר le-aḥ

('noenṭe', 'naenṭe', 83)
('bakanṭe', 'bakanṭe', 100)
אונזערע Unzere
נאענטע noenṭe
באקאנטע bakanṭe

('Seder', 'sdr', 75)
('Hagadah', 'hgdh', 73)
('shel', 'shl', 86)
('Pesaḥ', 'fsḥ', 50)
סדר Seder
הגדה Hagadah
של shel
פסח Pesaḥ

('oder', 'ader', 75)
('forṭrag', 'farṭrag', 86)
('oyf', 'aṿyf', 57)
('di', 'dya', 40)
('beyden', 'byyden', 83)
('erzṭen', 'erzṭen', 100)
('abende', 'abende', 100)
('Pesaḥ', 'fsḥ', 50)
('inz', 'aynz', 55)
('erzṭen', 'ryyn', 36)
('rayn-dayṭshe', 'dyyṭshe', 62)
('iberzeṭtsṭ', 'ayberzeṭtsṭ', 85)
('abende', 'eṿd', 38)
('timtsa', 'tmtsa', 85)
('perush', 'fyrṿsh', 44)
('Tseli', 'tsly', 61)
('Esh', 'ash', 61)
אדער oder
פארטראג forṭrag
אויף oyf
ביידען beyden
ערזטען erzṭen
אבענדע abende
פסח Pesaḥ
אינז inz
דייטשע rayn-dayṭshe
איבערזעטצט iberzeṭtsṭ
תמצא timtsa
צלי Tseli
אש Esh

('Hagadah', 'hgdh', 73)
('shel', 'shl', 86)
('Pesaḥ', 'fsḥ', 50)
הגדה Hagadah
של shel
פסח Pesaḥ

('Goydo', 'gṿyda', 60)
('Yitsḥaḳ', 'ytsḥk', 67)
('Yitsḥaḳ', 'bn', -1)
('Goydo', 'ḥyym-', 17)
גוידא Goyd

הידנהים Heidenheim

('Mahadura', 'mhdṿra', 71)
('teminaʾah', 'tmynah', 67)
('naye', 'nyye', 75)
('durkhoys', 'dṿrkhaṿyz', 59)
('ferbeserṭe', 'ferhesrṭe', 84)
('und', 'aṿnd', 57)
('fermehrṭe', 'fermehrṭe', 100)
('originaloyflage', 'arygynalaṿyflage', 71)
מהדורא Mahadura
תמינאה teminaʾah
נייע naye
דורכאויז durkhoys
פערהעסרטע ferbeserṭe
אונד und
פערמעהרטע fermehrṭe
אריגינאלאויפלאגע originaloyflage

('Sefer', 'sfr', 75)
('ḳerovot', 'krṿbṿt', 31)
('hu', 'hṿa', 40)
('maḥzor', 'mḥzṿr', 73)
ספר Sefer
מחזור maḥzor

('mesudar', 'msṿdr', 67)
('be-shlemut', 'bshlmṿt', 71)
('ha-sidur', 'hsdṿr', 62)
('ṿe-meduyak', 'ṿmdṿyk', 62)
('be-takhlit', 'btkhlyt', 71)
('hadiyuk', 'hdyṿk', 67)
מסודר mesudar
בשלמות be-shlemut
הסדור ha-sidur
ומדויק ṿe-meduyak
בתכלית be-takhlit
הדיוק hadiyuk

('me-iti', 'maty', 40)
('Ṿolf', 'ṿṿalf', 67)
('b', 'bsr', 50)
('Shimshon', 'shmshṿn', 79)
('b', 'dṿb', 48)
('ish', 'aysh', 56)
('Haydenhaim', 'hyydnhyym', 62)
וואלף Ṿolf
ב״ר b
שמשון Shimshon
איש ish
היידנהיים Haydenhaim

('Se

('Ḳalmanoṿiṭsh', 'klmnaṿṿyṭsh', 60)
('mit', 'myṭ', 32)
('fil', 'fyl', 66)
('ilusṭratsyes', 'aylṿsṭratsyes', 79)
וועלס Ṿels
געשיכטע Ṿelṭ-geshikhṭe
ה H
פון fun
דער der
פינפטערענגלישער Englisher
אויסגאבע oysgabe
הערות heoreś
און un
דערקלערונגען derḳlerungen
ז Z
קלמנאוויטש Ḳalmanoṿiṭsh
פיל fil
אילוסטראציעס ilusṭratsyes

('Ṿilne', 'ṿṿylne', 73)
ווילנע Ṿilne

('Ṿilner', 'ṿṿylner', 77)
('Farlag', 'farlag', 100)
('fun', 'fṿn', 67)
('B', 'b', 100)
('Ḳletsḳin', 'kletskyn', 62)
ווילנער Ṿilner
פארלאג Farlag
פון fun
ב B
קלעצקין Ḳletsḳin

('Ṿelṭ-geshikhṭe', 'ṿṿelṭ', 42)
('Ṿelṭ-geshikhṭe', 'geshykhṭe', 69)
געשיכטע Ṿelṭ-geshikhṭe

('H', 'h', 100)
('Ṿels', 'ṿṿels', 89)
('fun', 'fṿn', 67)
('der', 'der', 100)
('Englisher', 'fynfṭerenglysher', 63)
('oysgabe', 'aṿysgabe', 79)
('oysgabe', 'aybergezetsṭ', 32)
('mit', 'myṭ', 33)
('heoreś', 'herṿt', 55)
('un', 'un', 100)
('derḳlerungen', 'derklerṿngen', 83)
('Z', 'z', 100)
('Ḳalmanoṿiṭsh', 'klmnaṿṿyṭsh', 61)
('mit', 'myṭ', 33)
('fil', 'fyl', 67)
('ilusṭratsyes

ספר Sefer
סם Sam
חיים ḥayim

('Abweichender', 'khṿtr', 24)
('Abweichender', 'nṿsf', 11)

('Metsiʾat', 'mtsyat', 71)
('ʿAzari', 'ezry', 40)
מציאת Metsiʾat

('Mah', 'mh', 80)
('nishtanah', 'nshtnh', 80)
מה Mah
נשתנה nishtanah

('gedruḳṭ', 'gdrṿkṭ', 62)
('hipsh', 'hyfsh', 60)
('un', 'un', 100)
('fon', 'fṿn', 67)
('mit', 'myṭ', 33)
('ale', 'aly', 67)
('tsiyurim', 'tsyṿrym', 67)
('ale', 'akh', 31)
('gedruḳṭ', 'gṿṭ', 32)
('tsiyurim', 'ffyr', 30)
('un', 'aṿn', 32)
('un', 'ṭynṭ', 24)
גדרוקט gedruḳṭ
היפש hipsh
און un
פון fon
אלי ale
ציורים tsiyurim

('Hagadah', 'hgdh', 73)
('shel', 'shl', 86)
('Pesaḥ', 'fsḥ', 50)
הגדה Hagadah
של shel
פסח Pesaḥ

('Prag', 'frag', 75)
פראג Prag

('Baḳ', 'bk', 40)

('Hebrew', 'lyder', 33)
('Hebrew', 'der', 42)
('Josher', 'yydyshen', 39)
('Hebrew', 'byhne', 36)
('Meliz', 'melyts', 54)
('Josher', 'yṿsher', 66)
מעליץ Meliz
יושער Josher

('Ḳuni', 'kṿny', 25)
('lemel', 'lemel', 100)
לעמעל lemel

('Hebrew', 'lyder', 33)
('Duet', 'der', 45)
('Gehenim', 'yydyshen', 37)
('H

('ʿerev', 'erb', 50)
('rḥ', 'rsḥ', 80)
('le-aḥar', 'laḥr', 73)
('minḥah', 'mnḥh', 80)
('gedolah', 'gdṿlh', 67)
('nidpas', 'ndfs', 60)
('bi-leshon', 'blshṿn', 67)
('ha-ḳodesh', 'hkṿdsh', 53)
('bi-leshon', 'ṿblshṿn', 60)
('Ashkenaz', 'ashkhnz', 80)
בתענית be-taʿanit
ערב ʿerev
ר״ח rḥ
לאחר le-aḥar
מנחה minḥah
גדולה gedolah
נדפס nidpas
בלשון bi-leshon
הקודש ha-ḳodesh
אשכנז Ashkenaz

('ḥibur', 'ḥybṿr', 60)
('ha-perush', 'hfyrṿsh', 50)
('she-ḳorin', 'shkṿryn', 50)
('ṭayṭsh', 'ṭyyṭsh', 83)
('Natan', 'ntn', 75)
('ḥazan', 'ḥzn', 75)
('de-ḳḳ', 'dksk', 22)
('Prostits', 'frṿsṭyts', 50)
חיבור ḥibur
הפירוש ha-perush
שקורין she-ḳorin
טייטש ṭayṭsh
נתן Natan
חזן ḥazan
פרוסטיץ Prostits

('Seliḥot', 'slyḥṿt', 62)
('Yom', 'yṿm', 67)
('kipur', 'khyfṿr', 36)
('ḳaṭan', 'kṭn', 50)
סליחות Seliḥot
יום Yom
קטן ḳaṭan

('Nathan', 'ntn', 67)
('Prosnitz', 'mfrṿsṭyts', 34)
נתן Nathan

('Fränkel', 'frnkl', 83)
('Meschullam', 'mshlm', 67)
('Salman', 'zlmn', 60)
('ben', 'bn', 80)
('Ahron', 'ahrn-', 80)
פרנקל Fränkel
משלם

המגעים ha-magiʿim
להתעורר le-hitʿorer
האדם ha-adam
לשוב la-shuv
מחטאיו me-ḥataʾaṿ
אשכנז Ashkenaz
גם gam
כן ken
תפלת Tefilat
הדרך ha-derekh
וקידוש ṿe-Ḳidush
הלבנה ha-levanah

('Sefer', 'sfr', 75)
('Marganita', 'mrgnyta', 75)
ספר Sefer
מרגניתא Marganita

('bo', 'bṿ', 50)
('ʿinyene', 'enyny', 50)
('musar', 'mṿsr', 67)
('ḳets', 'kts', 57)
('bene', 'bny', 57)
('adam', 'adm', 86)
('ṿe-ʿatah', 'ṿeth', 67)
('be-ram', 'brm', 67)
('zakhor', 'zkhṿr', 73)
('le-ṭov', 'lṭṿb', 40)
('et', 'at', 50)
('Binyamin', 'bnymn', 77)
('Segal', 'sgsl', 67)
('Melits', 'mksk', 39)
('Melits', 'melyts', 83)
('asher', 'ashr', 89)
('hitʾamets', 'htamts', 80)
('le-hadpi', 'lhdfy', 46)
('me-ḥadash', 'mḥdsh', 71)
('bi-lhḳ', 'blhsk', 55)
('bi-lhḳ', 'ṿblshṿn', 45)
('Ashkenaz', 'ashkhnz', 80)
בו bo
עניני ʿinyene
מוסר musar
קץ ḳets
בני bene
אדם adam
ועתה ṿe-ʿatah
ברם be-ram
זכור zakhor
את et
בנימן Binyamin
סג״ל Segal
מעליץ Melits
אשר asher
התאמץ hitʾamets
מחדש me-ḥadash
בלה״ק bi-lhḳ
אשכנז Ashkenaz

('Yoreh', 'yṿrh', 67)
('ḥa

('maṭerialn', 'maṭeryaln', 89)
('gezamlṭ', 'gezamlṭ', 100)
('un', 'un', 100)
('redaḳṭirṭ', 'redakṭyrṭ', 78)
('fun', 'fṿn', 67)
('Zalmen', 'zlmn', 80)
('Zilbertsṿayg', 'zylbertsṿṿyg', 83)
לעקסיקאן Leḳsiḳon
פון fun
יידישן yidishn
טעאטער ṭeaṭer
מאטעריאלן maṭerialn
געזאמלט gezamlṭ
און un
רעדאקטירט redaḳṭirṭ
זלמן Zalmen
זילבערצוויג Zilbertsṿayg

('Zylbercweig', 'zylbertsṿṿyyg', 58)
('Zalmen', 'zlmn-', 73)
זילבערצווייג Zylbercweig
זלמן- Zalmen

('Leḳsiḳon', 'leksykan', 50)
('fun', 'fṿn', 67)
('yidishn', 'yydyshn', 71)
('ṭeaṭer', 'ṭeaṭer', 100)
לעקסיקאן Leḳsiḳon
פון fun
יידישן yidishn
טעאטער ṭeaṭer

('maṭerialn', 'maṭeryaln', 89)
('gezamlṭ', 'gezamlṭ', 100)
('un', 'un', 100)
('redaḳṭirṭ', 'redakṭyrṭ', 78)
('fun', 'fṿn', 67)
('Zalmen', 'zlmn', 80)
('Zilbertsṿayg', 'zylbertsṿṿyg', 83)
מאטעריאלן maṭerialn
געזאמלט gezamlṭ
און un
רעדאקטירט redaḳṭirṭ
פון fun
זלמן Zalmen
זילבערצוויג Zilbertsṿayg

('Leḳsiḳon', 'leksykan', 50)
('fun', 'fṿn', 67)
('yidishn', 'yydyshn', 71)
('ṭeaṭer', 'ṭeaṭer', 100)
('m

('zayn', 'zyyn', 75)
('80sṭen', 'sṭn', 67)
('geburtsṭog', 'gebṿrṭsṭag', 70)
צו tsu
זיין zayn
סטן 80sṭen
געבורטסטאג geburtsṭog

('Naḥmen', 'nḥmn', 80)
('Mayzil', 'myyzyl', 67)
נחמן Naḥmen
מייזיל Mayzil

('Mayzel', 'myyzyl', 67)
('Naḥmān', 'nḥmn-', 73)
מייזיל Mayzel
נחמן- Naḥmān

('Sholem', 'shlṿm', 73)
('Aleykhem', 'elykhm-', 67)
שלום Sholem
עליכם- Aleykhem

('Der', 'der', 100)
('raiṭwogn', 'ryyṭṿṿagn', 47)
דער Der

('Moiše', 'mshh', 22)
('Dluzšnowski', 'dlṿzshnaṿṿsky', 50)
דלוזשנאווסקי Dluzšnowski

('Tzwišn', 'tsṿṿyshn', 29)
('šwartz', 'shṿṿarts', 43)
('un', 'un', 100)
('wais', 'ṿṿyys', 22)
און un

('eseien', 'esyyen', 67)
('un', 'un', 100)
('feljeṭonen', 'felyeṭanen', 80)
עסייען eseien
און un
פעליעטאנען feljeṭonen

('Avrom', 'abrhm', 60)
('Šulman', 'shṿlman', 62)
אברהם Avrom
שולמאן Šulman

('Shulman', 'shṿlman', 86)
('Abraham', 'abrhm', 83)
שולמאן Shulman
אברהם Abraham

('Pariz', 'faryz', 60)
פאריז Pariz

('Waiṭer', 'ṿṿyyṭer', 45)

('Di', 'dy', 50)
('grine', 'gryne', 80)
('brik', 'bry

('Torah', 'tṿrh', 67)
('Neviʾim', 'nbyaym', 31)
('u-Khetuvim', 'ṿkhtṿbym', 44)
תורה Torah

('Blits', 'blyts', 80)
('Yitsḥak', 'ykṿtyal', 41)
('ben', 'b', 50)
('Yitsḥak', 'ytsḥk', 83)
בליץ Blits
ב ben
יצחק Yitsḥak

('Amśṭerdam', 'amsṭrdm', 75)
אמסטרדם Amśṭerdam

('Aharon', 'aṿry', 37)
('Ṿaybesh', 'ṿyybsh', 77)
('b', 'b', 100)
('Aharon', 'ahrn', 80)
('ha-Leṿi', 'hlṿy', 55)
וייבש Ṿaybesh
ב b
אהרן Aharon
הלוי ha-Leṿi

('ḥumšê', 'ḥmshh', 39)
('ḥumšê', 'ḥṿmshy', 36)
('Tôrā', 'tṿrh', 50)
תורה Tôrā

('we-gam', 'em', 46)
('û-birkôt', 'ktst', 26)
('hā-hafṭārôt', 'fyrṿsh', 21)
('Rašî', 'rshy', 25)
('we-gam', 'ṿgm', 44)
('hā-hafṭārôt', 'hhfṭrṿt', 67)
('ʿim', 'ṿḥmsh', 19)
('megîllôt', 'mgylṿt', 57)
('û-birkôt', 'ṿbrkhṿt', 53)
('hat-Tôrā', 'htṿrh', 46)
ההפטרות hā-hafṭārôt
מגילות megîllôt
וברכות û-birkôt

('Ḥinukh', 'ḥynṿkh', 67)
('ḳaṭan', 'kṭn', 50)
חינוך Ḥinukh
קטן ḳaṭan

('unzre', 'aṿnzry', 55)
('seyfer', 'sfr', 67)
('muser', 'mṿsr', 67)
('shraybn', 'shryybn', 86)
('ḳoydesh', 'dsh', 47)
('ayedr', 

('Hershl-Tsvi', 'hrshl-tsby', 76)
('Kanar', 'khnr', 67)
('haḳdamah', 'hkdmh', 62)
('Mikhaʾel', 'mykhal', 71)
('Felzenbaum', 'felzenbaṿm', 90)
('hile', 'hyle', 75)
('serye-logo', 'serya-laga', 70)
('un', 'un', 100)
('tseykhenungen', 'tsyykhenṿngen', 85)
('Moysheh', 'mshh', 73)
('Himeyn', 'hymyyn', 67)
הרשל-צבי Hershl-Tsvi
כנר Kanar
הקדמה haḳdamah
מיכאל Mikhaʾel
פעלזענבאום Felzenbaum
הילע hile
סעריא-לאגא serye-logo
און un
צייכענונגען tseykhenungen
משה Moysheh
הימיין Himeyn

('Kanar', 'khnr', 67)
('Ṣevî', 'tsby-', 0)
כנר Kanar

('Felzenbaum', 'felzenbaṿm', 90)
('Mîḵāʾēl', 'mykhal-', 29)
פעלזענבאום Felzenbaum

('Himeyn', 'hymyyn', 67)
('Moysheh', 'mshh', 73)
הימיין Himeyn
משה Moysheh

('Tel', 'tl', 80)
('Oviv', 'abyb', 0)
תל Tel

('ha-Rashut', 'hrshṿt', 67)
('ha-leʾumit', 'hlaṿmyt', 47)
('le-Tarbut', 'ltrbṿt', 67)
('ha-Yidish', 'hyydysh', 62)
('Natsyonale', 'natsyanale', 90)
('insṭants', 'aynsṭants', 82)
('far', 'far', 100)
('Yidisher', 'yydysher', 75)
('ḳulṭur', 'kṿlṭṿr', 50)
הרשות ha-Ras

רובינ Rub

('Peretz', 'frts', 40)
('Isaac', 'ytsḥk', 20)
('Leib', 'lybṿsh-', 36)

('Rubina', 'rṿbyn', 55)
('R', 'ryṿṿke', 28)
רובין Rubina

('Mosḳṿe', 'maskṿṿe', 62)
מאסקווע Mosḳṿe

('Melukhe-farlag', 'melṿkhe', 57)
('Melukhe-farlag', 'farlag', 59)
('fun', 'fṿn', 66)
('ḳinsṭlerisher', 'kynsṭlerysher', 76)
('liṭeraṭur', 'lyṭeraṭṿr', 77)
פארלאג Melukhe-farlag
פון fun
קינסטלערישער ḳinsṭlerisher
ליטעראטור liṭeraṭur

('Yunge', 'yṿnge', 80)
('yorn', 'yarn', 75)
יונגע Yunge
יארן yorn

('roman', 'raman', 80)
('in', 'in', 100)
('perzn', 'ferzn', 80)
ראמאן roman
אין in
פערזן perzn

('Leyb', 'lyyb', 75)
('Ḳṿiṭḳo', 'kṿṿyṭka', 31)
לייב Leyb

('Kvitko', 'kṿṿyṭka', 31)
('Leib', 'lyyb-', 44)

('Mosḳṿe', 'maskṿṿe', 62)
מאסקווע Mosḳṿe

('Farlag', 'farlag', 100)
('Soṿeṭsḳi', 'ssaṿṿeṭsky', 56)
('Pisaṭel', 'fysaṭels', 67)
פארלאג Farlag
״סאוועטסקי Soṿeṭsḳi
פיסאטעל״ Pisaṭel

('Tsum', 'tsṿm', 75)
('lebn', 'lebn', 100)
צום Tsum
לעבן lebn

('dertseylungen', 'dertsyylṿngen', 85)
דערציילונגען dertseylungen

('Y',

ערווין Erṿin
קיש Ḳish

('Elsḳi', 'elsky', 60)
('Ṭ', 'ṭ', 100)
עלסקי Elsḳi
ט Ṭ

('Ḳish', 'kysh', 50)
('Egon', 'egṿn', 75)
('Erṿin', 'erṿṿyn', 73)
קיש Ḳish
עגון Egon
ערווין Erṿin

('Pariz', 'fryz', 44)

('Tseraṭa', 'farlag', 30)
('Tseraṭa', 'fṿn', 0)
('AB', 'a', 65)
('AB', 'b', 64)
('Tseraṭa', 'tseaṭa', 89)
א AB
צעאטא Tseraṭa

('In', 'in', 100)
('der', 'der', 100)
('shṭiler', 'shṭyler', 86)
('shoh', 'sheh', 75)
אין In
דער der
שטילער shṭiler
שעה shoh

('lider', 'lyder', 80)
('un', 'un', 100)
('tseykenungen', 'tsyykhenṿngen', 80)
לידער lider
און un
צייכענונגען tseykenungen

('Mosheh', 'mshh', 80)
('Bernshṭeyn', 'bernshṭyyn', 90)
משה Mosheh
בערנשטיין Bernshṭeyn

('Bernshṭayn', 'bernshṭyyn', 90)
('Mosheh', 'mshh-', 73)
בערנשטיין Bernshṭayn
משה- Mosheh

('Tel', 'tl', 80)
('Aviv', 'abyb', 25)
תל Tel

('H', 'h', 100)
('Leyṿiḳ-farlag', 'lyyṿṿykfarlag', 69)
ה H
לייוויק־פארלאג Leyṿiḳ-farlag

('Sefer', 'sfr', 75)
('Ṿayiḳra', 'ṿykra', 67)
ספר Sefer
ויקרא Ṿayiḳra

('Premsla', 'frmsla', 77)
('Yitsḥaḳ'

אהרן Aharon
וואלפסוהן Ṿolfsohn

('Shraybn', 'shryybn', 86)
('des', 'des', 100)
('Herrn', 'herrn', 100)
('Daṿid', 'dṿd', 75)
('Fridlender', 'frydlendr', 84)
('an', 'an', 100)
('den', 'den', 100)
('profeser', 'frfazer', 53)
שרייבן Shraybn
דעס des
העררן Herrn
דוד Daṿid
פרידלענדר Fridlender
אן an
דען den
פרפאזער profeser

('Wolfsohn', 'ṿṿlfsṿn', 53)
('Aaron', 'ahrn', 67)
('Aaron', 'bn', 28)
('Aaron', 'zab', 23)
('Wolfsohn', 'mhlh-', 27)
וולפסון Wolfsohn
אהרן Aaron

('Friedländer', 'frydlndr', 74)
('David', 'dṿd-', 44)
פרידלנדר Friedländer

('Igrot', 'agrṿt', 60)
('el', 'al', 50)
('raʿyato', 'reytṿ', 50)
('Manyah', 'manyh', 91)
אגרות Igrot
אל el
רעיתו raʿyato
מאניה Manyah

('be-livyat', 'blṿṿyt', 53)
('temunot', 'tmṿnṿt', 62)
('ṿe-avtografim', 'ṿabṭṿgrafym', 58)
בלווית be-livyat
תמונות temunot
ואבטוגראפים ṿe-avtografim

('ḤN', 'ḥn', 100)
('Byaliḳ', 'byalyk', 67)
חנ ḤN
ביאליק Byaliḳ

('Byaliḳ', 'byalyk', 67)
('Ḥayim', 'ḥyym', 67)
('Naḥman', 'nḥmn-', 73)
ביאליק Byaliḳ
חיים Ḥayim
נחמן- Naḥman


('Aleykhems', 'shlṿm-elykhms', 63)
('ṿerḳ', 'ṿṿerk', 66)
('Moṭl', 'maṭl', 74)
('Peysi', 'fyysy', 39)
('dem', 'dem', 99)
('ḥazns', 'ḥzns', 88)
('yingel', 'yyngl', 72)
זעכצען zekhtsen
צייכענונגען tsaykhenungen
צו tsu
שלום-עליכמס Aleykhems
ווערק ṿerḳ
מאטל Moṭl
דעם dem
חזנס ḥazns
יינגל yingel

('Fr', 'fr', 100)
('Marḳus-Shaliṭ', 'markṿs-shalyṭ', 77)
('baleyṭ-ṿorṭ', 'balyyṭ-ṿṿarṭ', 78)
('Baʿal-Maḥshoveś', 'bel-mḥshbṿt', 54)
פר Fr
מארקוס-שאליט Marḳus-Shaliṭ
באלייט-ווארט baleyṭ-ṿorṭ
בעל-מחשבות Baʿal-Maḥshoveś

('Rahel', 'mrkṿs-shlyṭ', 37)
('Rahel', 'rḥl-', 44)

('Berlin', 'berlyn', 83)
בערלין Berlin

('Klal-farlag', 'khll-farlag', 91)
כלל-פארלאג Klal-farlag

('Ṿiṭebsḳ', 'ṿṿyṭebsk', 67)
('amol', 'amal', 75)
וויטעבסק Ṿiṭebsḳ
אמאל amol

('geshikhṭe', 'geshykhṭe', 89)
('zikhroynes', 'zkhrṿnṿt', 56)
('ḥurbn', 'ḥṿrbn', 80)
געשיכטע geshikhṭe
זכרונות zikhroynes
חורבן ḥurbn

('redaḳtsye', 'redaktsye', 89)
('Grigori', 'grygary', 57)
('Aronson', 'aransan', 71)
('redaḳtsye', 'yekb', 28)
('Leshtsinsḳi', '

יידישער yidisher
קולטור־קאָנגעס ḳulṭur-ḳongres

('Di', 'dy', 50)
('geshikhṭe', 'geshykhṭe', 89)
('fun', 'fṿn', 67)
('der', 'der', 100)
('liṭeraṭur', 'lyṭeraṭṿr', 78)
('bay', 'by', 80)
('Yidn', 'ydn', 86)
די Di
געשיכטע geshikhṭe
פון fun
דער der
ליטעראטור liṭeraṭur
בײ bay
ײדן Yidn

('Yiśraʾel', 'yshral', 57)
('Tsinberg', 'tsynbrg', 80)
ישראל Yiśraʾel
צינברג Tsinberg

('Di', 'dy', 50)
('geshikhṭe', 'geshykhṭe', 89)
('fun', 'fṿn', 67)
('der', 'der', 100)
('liṭeraṭur', 'lyṭeraṭṿr', 78)
('bay', 'by', 80)
('Yidn', 'ydn', 86)
('Yiśroʾel', 'yshral', 43)
('Tsinberg', 'tsynbrg', 80)
די Di
געשיכטע geshikhṭe
פון fun
דער der
ליטעראטור liṭeraṭur
בײ bay
ײדן Yidn
צינברג Tsinberg

('Berliner', 'berlynger', 82)
('haśkoleh', 'hshlkhh', 40)
בערלינגער Berliner

('Buenos-Aires', 'bṿenas', 56)
('Buenos-Aires', 'ayyres', 43)
בוענאָס Buenos-Aires

('Alṿelṭlekher', 'alṿṿelṭlekher', 96)
('yidisher', 'yydysher', 75)
('ḳulṭur-ḳongres', 'kṿlṭṿrkanges', 54)
אַלוועלטלעכער Alṿelṭlekher
יידישער yidisher
קולטור־קאָנגעס ḳ

פארן farn
פאלק folḳ

('Erets', 'arts', 67)
('Yiśraʾel', 'yshral', 57)
ארץ Erets
ישראל Yiśraʾel

('Lider', 'lyder', 80)
('fun', 'fṿn', 67)
('ḥurbn', 'ḥṿrbn', 80)
לידער Lider
פון fun
חורבן ḥurbn

('700-705', 'tsshtshsh', 0)

('tsuzamengeshṭelṭ', 'tsṿzamengeshṭel', 90)
('Ḳadye', 'kadye', 80)
('Molodoṿsḳi', 'maladaṿṿsky', 48)
צוזאמענגעשטעל tsuzamengeshṭelṭ
קאדיע Ḳadye

('Molodowsky', 'mṿlṿdṿbsky', 60)
('Kadia', 'kdyh-', 40)
מולודובסקי Molodowsky

('ha-Shir', 'h', 25)
('ha-Shir', 'shyr', 54)
('ṿe-ha-shevaḥ', 'ṿhshbḥ', 55)
שיר ha-Shir
והשבח ṿe-ha-shevaḥ

('leḳeṭ', 'lkṭ', 50)
('shirim', 'shyrym', 67)
('be-ʿIdish', 'baydysh', 50)
לקט leḳeṭ
שירים shirim
באידיש be-ʿIdish

('Bene', 'bny', 57)
('Beraḳ', 'brk', 50)
בני Bene
ברק Beraḳ

('Yahlam', 'yhlm', 80)
יהלם Yahlam

('Anṭologye', 'anṭalagye', 78)
('fun', 'fṿn', 67)
('der', 'der', 100)
('yidisher', 'yydysher', 75)
('liṭeraṭur', 'lyṭeraṭṿr', 78)
('liṭeraṭur', 'far', 32)
('Anṭologye', 'yṿgnṭ', 23)
('yidisher', 'tsṿṿyyṭer', 31)
('Anṭologye', 'ṭyyl'

('redagirt', 'redagyrṭ', 75)
('fun', 'fṿn', 67)
('M', 'm', 100)
('Speḳṭor', 'sfekṭar', 57)
רעדאגירט redagirt
פון fun
מ M
ספעקטאר Speḳṭor

('2-ṭes', '-ṭes', 89)
('bukh', 'bṿkh', 75)
-טעס 2-ṭes
בוך bukh

('Hoyz-fraynd', 'hzfrynd', 78)
('a', 'a', 100)
('hisṭorish-liṭerarisches', 'hysṭaryshlyṭeraryshes', 73)
('bukh', 'bṿkh', 75)
('redagirt', 'redagyrṭ', 75)
('fun', 'fṿn', 67)
('M', 'm', 100)
('Spektor', 'sfekṭar', 57)
הױז־פרײנד Hoyz-fraynd
א a
היסטאריש־ליטערארישעס hisṭorish-liṭerarisches
בוך bukh
רעדאגירט redagirt
פון fun
מ M
ספעקטאר Spektor

('Speḳṭor', 'sfekṭar', 57)
('Mordekhai', 'mmrdkhy-', 59)
ספעקטאר Speḳṭor
ממרדכי- Mordekhai

('Hoyz-fraynd', 'hzfrynd', 78)
הױז־פרײנד Hoyz-fraynd

('a', 'a', 100)
('hisṭorish-liṭerarisches', 'hysṭaryshlyṭeraryshes', 73)
('bukh', 'bṿkh', 75)
א a
היסטאריש־ליטערארישעס hisṭorish-liṭerarisches
בוך bukh

('redagirt', 'redagyrṭ', 75)
('fun', 'fṿn', 67)
('M', 'm', 100)
('Speḳṭor', 'sfekṭar', 57)
רעדאגירט redagirt
פון fun
מ M
ספעקטאר Speḳṭor

('1-ṭes', '-ṭes', 

('oyf', 'aṿyf', 56)
('der', 'der', 99)
('Yidishe', 'yydysher', 66)
('bine', 'byne', 74)
ארויסגעגעבן Aroysgegebn
דורך durkh
דעם dem
געזעלשאפטלעכן Gezelshafṭlekhn
קאמיטעט ḳomiṭeṭ
צו tsu
פייערן fayern
יאר yor
טעטיקייט ṭeṭiḳeyṭ
פון fun
שמעון Shimʿon
דזשיגאן Dzshigan
אויף oyf
דער der
יידישער Yidishe
בינע bine

('Tel-Aviv', 'tl', 40)
('Tel-Aviv', 'abyb', 16)

('Defus', 'dfṿs', 67)
('Or-li', 'aṿrly', 40)
דפוס Defus

('Zikhroynes', 'zkhrṿnṿt', 56)
('fun', 'fṿn', 67)
('a', 'a', 100)
('maran', 'maran', 100)
('in', 'in', 100)
('der', 'der', 100)
('teḳufeh', 'tkṿfh', 50)
('fun', 'fṿn', 67)
('der', 'der', 100)
('natsi-ḳaṭasṭrofe', 'natsy-kaṭasṭrafe', 81)
זכרונות Zikhroynes
פון fun
א a
מאראן maran
אין in
דער der
תקופה teḳufeh
נאצי-קאטאסטראפע natsi-ḳaṭasṭrofe

('Zikhronot', 'zkhrṿnṿt', 71)
('shel', 'shl', 86)
('anus', 'anṿs', 75)
('bi-teḳufat', 'btkṿft', 50)
('ha-Shoʾah', 'hshṿah', 67)
('ha-natsit', 'hnatsyt', 75)
זכרונות Zikhronot
של shel
אנוס anus
בתקופת bi-teḳufat
השואה ha-Shoʾah
הנאצית ha-natsit


פארווערטס Forṿerṭs

('Di', 'dy', 50)
('geshikhṭe', 'geshykhṭe', 89)
('fun', 'fṿn', 67)
('idishen', 'aydyshen', 67)
('ṭheaṭer', 'ṭheaṭer', 100)
די Di
געשיכטע geshikhṭe
פון fun
אידישען idishen
טהעאטער ṭheaṭer

('tsṿey', 'tsṿṿyy', 73)
('ṭoyzenṭ', 'ṭṿyzenṭ', 86)
('yohr', 'yahr', 75)
('ṭheaṭer', 'ṭheaṭer', 100)
('bay', 'byy', 67)
('iden', 'ayden', 67)
צוויי tsṿey
טויזענט ṭoyzenṭ
יאהר yohr
טהעאטער ṭheaṭer
ביי bay
אידען iden

('B', 'b', 100)
('Gorin', 'garyn', 60)
('Y', 'y', 100)
('Goido', 'gṿyda', 40)
ב B
גארין Gorin
י Y

('Y', 'dy', 54)
('geshikhṭe', 'geshykhṭe', 89)
('fun', 'fṿn', 67)
('idishen', 'aydyshen', 67)
('ṭheaṭer', 'ṭheaṭer', 100)
('tsṿey', 'tsṿṿyy', 73)
('ṭoyzenṭ', 'ṭṿyzenṭ', 86)
('yohr', 'yahr', 75)
('ṭheaṭer', 'ṭheaṭer', 100)
('bay', 'byy', 67)
('iden', 'ayden', 67)
('B', 'b', 100)
('Gorin', 'garyn', 60)
('Y', 'y', 100)
('Goido', 'gṿyda', 40)
י Y
געשיכטע geshikhṭe
פון fun
אידישען idishen
טהעאטער ṭheaṭer
צוויי tsṿey
טויזענט ṭoyzenṭ
יאהר yohr
ביי bay
אידען iden
ב B
גארין Gorin

(

In [111]:
len(wordlist)

19052

In [112]:
unique_wordlist = list(set(wordlist))
len(unique_wordlist)

5322

In [None]:
pair_df = pd.DataFrame({'yiddish': [tup[0] for tup in wordlist], 'translit': [tup[1] for tup in wordlist]})

In [114]:
pair_df.groupby(['yiddish', 'translit']).size().head(1000)

yiddish                  translit                
-                        -                            26
                         1-2                           1
-טן                      100-ṭen                       1
                         5-ṭn                          2
                         6-ṭn                          2
-טעס                     1-ṭes                         1
                         2-ṭes                         1
                         3-ṭes                         1
                         4-ṭes                         1
-טער                     50-ṭer                        1
-סטער                    25-sṭer                       1
ֻנטרגַנג                 unṭergang                     2
ֻרַלטר                   uralṭer                       1
א                        A                            84
                         AB                            1
                         a                           107
                         ʾA           

In [118]:
pair_df['source'] = 'hebis'

In [119]:
pair_df.drop_duplicates().to_csv('data/processed-parallel/hebis.csv', index=False)