### 02 2 Language detection: analysis & results
This notebook dedicated to the analysis of language detection results:
* check the number and variation of languages detected;
* filter errors;
* clean data for visualisations

In [1]:
library(tidyverse)

── [1mAttaching packages[22m ─────────────────────────────────────── tidyverse 1.3.1 ──

[32m✔[39m [34mggplot2[39m 3.3.5     [32m✔[39m [34mpurrr  [39m 0.3.4
[32m✔[39m [34mtibble [39m 3.1.6     [32m✔[39m [34mdplyr  [39m 1.0.8
[32m✔[39m [34mtidyr  [39m 1.2.0     [32m✔[39m [34mstringr[39m 1.4.0
[32m✔[39m [34mreadr  [39m 2.1.2     [32m✔[39m [34mforcats[39m 0.5.1

── [1mConflicts[22m ────────────────────────────────────────── tidyverse_conflicts() ──
[31m✖[39m [34mdplyr[39m::[32mfilter()[39m masks [34mstats[39m::filter()
[31m✖[39m [34mdplyr[39m::[32mlag()[39m    masks [34mstats[39m::lag()



In [6]:
langs <- read.csv("data/prerevol_sections_lang.csv")

In [7]:
glimpse(langs)

Rows: 223,330
Columns: 3
$ X          [3m[90m<int>[39m[23m 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, …
$ section_id [3m[90m<chr>[39m[23m "ekmteataja18530105.2.1", "ekmteataja18530105.2.2", "ekmtea…
$ lang       [3m[90m<chr>[39m[23m "german", "russian-iso8859_5", "german", "german", "russian…


In [36]:
langs <- langs %>% 
    # add column with the newspaper's name
    mutate(keyid = str_remove_all(section_id, "\\d+|[[:punct:]]")) %>% 
    # clean languages from encoding info as -iso8859_5
    mutate(lang_cln = str_remove_all(lang, "-.*?$"))

langs_groups <- langs %>% 
    group_by(lang_cln) %>% 
    count(sort = T) %>% 
    ungroup() %>% 
    summarise(lang_cln = lang_cln,
              n_total = n, 
              perc = (n_total/sum(n_total))*100)

In [38]:
head(langs_groups, 20)

lang_cln,n_total,perc
<chr>,<int>,<dbl>
russian,126937,56.83831102
german,83578,37.42354363
ukrainian,6257,2.80168361
english,1495,0.66941298
estonian,1299,0.58165047
bulgarian,1078,0.48269377
middle_frisian,886,0.39672234
rumantsch,305,0.1365692
latvian,290,0.12985268
belarus,276,0.12358393


##### Import texts to check language detection restuls

In [19]:
texts <- read.csv("data/prerevol_texts_sections.csv") # very large file of 1GB
str(texts)

'data.frame':	240506 obs. of  3 variables:
 $ X         : int  1 2 3 4 5 6 7 8 9 10 ...
 $ section_id: chr  "ekmteataja18530105.2.1" "ekmteataja18530105.2.2" "ekmteataja18530105.2.3" "ekmteataja18530105.2.4" ...
 $ text      : chr  "Эстляндские губернские ведомости  Издаются еженедsжио по Понсдъльпикамъ Щ,l&gt;ва въ годъ 3 руб. сер., для част"| __truncated__ "I. Отделъ общий.  На основанш 161 §. приложешя къ 648 ст VI продолжен!» 2. тома Свода Закон овъ , распространен"| __truncated__ "I. Allgemeine Abtheilung.  Nach Grundlage des 161. §. der Beilage zum 648. Artikel der VI. Fortsetzung des 2. B"| __truncated__ "II. Местный Отделъ.  II. Oertliche Abtheilung. " ...


In [25]:
langs_joined <- left_join(texts %>% select(-X), 
                          langs %>% select(-X), 
                          by = "section_id") %>% 
                    select(keyid, section_id, text, lang_cln, lang)
str(langs_joined)

'data.frame':	240506 obs. of  5 variables:
 $ keyid     : chr  "ekmteataja" "ekmteataja" "ekmteataja" "ekmteataja" ...
 $ section_id: chr  "ekmteataja18530105.2.1" "ekmteataja18530105.2.2" "ekmteataja18530105.2.3" "ekmteataja18530105.2.4" ...
 $ text      : chr  "Эстляндские губернские ведомости  Издаются еженедsжио по Понсдъльпикамъ Щ,l&gt;ва въ годъ 3 руб. сер., для част"| __truncated__ "I. Отделъ общий.  На основанш 161 §. приложешя къ 648 ст VI продолжен!» 2. тома Свода Закон овъ , распространен"| __truncated__ "I. Allgemeine Abtheilung.  Nach Grundlage des 161. §. der Beilage zum 648. Artikel der VI. Fortsetzung des 2. B"| __truncated__ "II. Местный Отделъ.  II. Oertliche Abtheilung. " ...
 $ lang_cln  : chr  "german" "russian" "german" "german" ...
 $ lang      : chr  "german" "russian-iso8859_5" "german" "german" ...


##### Check
Language of particular interest: 
* the ones that should indeed exist in the local newspapers: Estonian, Latvian;
* the ones that might be language detection tool errors: Ukrainian, English, Bulgarian, Belarus.

In [41]:
languages_local <- c("estonian", "latvian")

langs_joined %>% 
    filter(lang_cln %in% languages_local) %>% 
    group_by(lang_cln) %>% 
    sample_n(10)

keyid,section_id,text,lang_cln,lang
<chr>,<chr>,<chr>,<chr>,<chr>
livzeitung,livzeitung18930707.2.8,"Kahe hobuste woorimehed. 1) Ühe sõidu eest linnan 1 ehk S inimeistega 15 3 „ 4 „ 20 """" 2) Sõidude eest linnan I—4 inimeistega otmise ajaga ühes: ' ' """" Va tunni eest . . 30 „ % » » . • 45 „ j. n- e. iga neljandik» tunni eest edasi 15 kop"""" rohkem, kelle """" juures iga alustud neljandik tund terwe eest rehkendad saab 3) Sõidude eest waksali ja uwwe kabelide poole saab 15 kop. juurdelisatud, ükskõik kas troska ühest ehk neljast immeistest saab prugitud. Ajasõidude juures, mis rohkem kui 1 tund aega wõttawa saawad sõidud waksali ja uwwe kabelide jurde mitte esteralikuld arwatud ja es makseta nende eest mitte kõrgendedud ajataksi järel. 4) Kuni 30 minutid pale raudtee sisse sõidu maksab üks raudteejamast algaw sõit linna. . ..... . . , . . . . 4 50 Sõidude eest mis waksalist alustama saab'kahe hobuse """" woorimees 85 kop. ükskordlik juurde maks. 5) Pukseerimise sõidut linnas sawad Va tunni eest. . . . . . 50 % „ „ . 75 I «) Maksud sõidude eest politsei piirist wälja on prii lepimine. ' . M 5059.",estonian,estonian
livzeitung,livzeitung18990215.2.4,"Rahaminifteriumist. Kõigekõrgemalt 29. Aprilil 1896 aastal kinnitub Riigi Nvnukogu arwamise põhjusel on 1887 aasta wormi järele Kõigekõrgema käsu peale 26. Maist 1888 aastal walmiStnd 23 rbl , 10 rbl. ja 3 rnbtaliste paberirahade ümberwahetamise wiimaseks tähtpäewakS määratud Nt. Detsember 1899 aastal. Pärast seda tähtaega ei wöeta eespool täheudud 1887 aasta wormi paberirahasid kroonnmaksudeks ja ka erainimeste keskel ei ole neil ümberkäimiseks wöimu. 5, 10 ja 2S rnblaliste paberirahade tundemärgid, mille ümberkäimine 91. Detsembril 1899 aastal lõpeb, on: Esimene külg on tumesinist wärwi walkjas-pruunil põhjal. Walmistamise aasta on esimese külje alumisel äärel b rublalisel (mitte hiljem kui 1894 a.) pahemal pool, aga 10 rublalisel (mitte hiljem kui 1892 a.) ja 25 rublalisel (kõik 1887 a.) keskpaikas. Te»se kuhe peal on Pöikjoonestuse keskel riigi mapp, pahemal pool jämedalt trükitud nummer ja paremal pool wäljawvte manifestist trükitud: б rublalisel sinise wärwiga, 10 „ punase „ 25 „ - lilla",estonian,estonian
livzeitung,livzeitung19000605.2.12,"äratrükimise päevast, selleS Liiwi kuber« mang« teatajas, peale arvateS) pärast selle tähtaja möödaminemist saamad pärijad pärimise õigvSteS kinnitatud ja ei saa enam leegi kuulda võetud, ning mitte ilmunud võlglased langevad, sellekohase seaduse järele, vastutamise alla. M 172. 2 Wana - AntSla wallakohuS, Mõru kreifiS, annab selleläbi teada, et selle valla Laksi Jt 79 taluomanik Märt Jani poeg Zeiger, LI. nowemhrU 1878 a. Bulgaria maal ära on surnud, liikumata varandust järele jätteS; sellepärast saavad wallafohtu seaduse II ja» Z 222 ja 224 põhjusel koik need, keS nimetud Märt Zeiger varandusest pärimise õigusi arvavad olevad, üleSkutsutud, oma õigust selle wallakohtule SleSandma kuue kuu jooksul, arvatud kolmandamast selle kuulutuse äratrsikimise kuupäevast Liiwi kubermangu teatajas. Jt 103. 2",estonian,estonian
ekmteataja,ekmteataja19070308.2.5.2,"Разрядъ III. О вывовЪ яаолЪдшовъ : По 1-му разу. Равельсмй Окружный Судъ, на основами 2011, 2012, 2059—2062 ст. Уст. Гражд. Суд. и 2589 ст. 111 части Свода Ыестныхъ Узаконений Губернш Остзейскихъ, симъ вызываетъ наследниковъ кредиторовъ и вообще вейхъ зицъ, инЬющихъ каш либо права на наследство, оставшееся после умершей въ городе Ревеле I декабря 1 906 года мещанки Терезы Готлвбовой Таубенталь, заявить ихъ Ревельскону Окружному Суду въ шестимесячный, считая со дня припечатан!« въ Санктпетербургскихъ Сенатскихъ Объявлешяхъ третьей публякацш, срокъ, подъ опасен!емъ потери правъ. (231). Lehtse Walla Kohus, Paide Ülema Talurahwa kohtu ringkonnas, Walla kohtu seaduse II jiiu § Ü 22 põhjusel kutsub Lehtse wallaS Pruuna Kogukonnas 7 oktobril 1906 a. ära surnnd „Mihkli"""" talu rentniku Peeter Roode pärijaid, wõla nõudjäid ja wõlgnikka oma õiguseid temast järele jäänud waranduse kohta seia walla kohtule üles andma 6 kuu jooksul, seda täht aega kolinandama kuulutuse ilmumist Eestimaa Kubermangu Ajalehes arwates, selle kartusega. et peale selle täht-aja oma õigused kautannd on. (238). Paadenorme Walla Kohus, Lihula Ülema Talurahwa kohtu ringkonnas, walla kohtu seaduse II jäu art. 222 põhjusel kutsub pärijaid, wõlauskujaid, wõlgnikusi ja Ülepea kõiki neid inimesi, kellel mingisuguseid õigusi on Paaderma wallaS 27 detsembril 1906 a. ära surnud „Ennikse Aru"""" koha omaniku Juhan Juri p. Kiwi järele jäennd waranduse kohta, oma õigusi Paadenorme walla kohtule iilesse andma, kuue kuu jooksul, pärast kolmandama kuulutuse ilmumist EeStimaa Kubermangu Teatajas, selle kartusega, et õigused kaduma lähewad. (211). По 2-му разу. РевемиШ Окрушнык Судъ синъ вызываетъ иасдЪднивовъ, кредиторовъ и вообще всйхъ лицъ, ии®ющихъ Basis либо права на наследство, оставшееся иоодЬ умершей въ г.РевелЪ 19 ноября 1906 года вдовы нЪщанвна Ольги-Mapia Августовой Келеръ равно в всбхъ' лицъ, ииЪющихъ вакш лабо опоры а возразвешя протавъ оглашеннаго въ заеЪданю Суда &lt;l2&gt; февраля 1907 года дуювнаго завЪищшя названной Ольги Велеръ, заявить ихъ Ревельсвоыу Окружному Суду въ шестимесячный, считая со дня ирвнечаташя въС.-Петербуршгахъ Сенатсвихъ Объявленшхъ третьей иубликацш, сровъ, съ предварешеыъ, что, въ случай ненредъявлешя своихъ правъ, споровъ в возражений въ сровъ вызова, они будутъ признаны отказавшимися отъ оныхт,. ' (226). Wohnja Walla Kohus, Rakwere Ülema Talurahwa Kohtu ringkonnas, Walla koht» sead.ll jao s 222 põhjusel kutsub Pärijaid, wõlauskujaid, wSlgnikusi ja ülepea kõiki neid inimesi, kellel mingisuguseid õiguseid on Wohnja wallas li septembril 1906 a, ära surnud Undla walla talupoja Anton Juhani poja Rüüteli järel jäänud waranduse kohta, oma õigusi Wohnja walla kohtule ülesandma, kuue kuu jooksul, pärast kolmandama kuulutuse ilmumist Eestimaa Kubermangu Ajalehes, selle kartusega, et õigused kaduma lähewad, (229). По 3-му разу. РевмьсиШ Окружный Судъ, на основанш 2011, '2012, 2059 2062 ст. Уст. Гражд. Суд. и 2589 ст. Ш части Свода Мстныхъ УзаконенШ Губврн!й Оотзейскихъ, сниъ вызываетъ кредиторов! и вообще вебхъ тцъ, вы'бющвхъ Kasin либо права на наследство, оставшееся посдЪ унершаго, 15 января 1907 года въ городЪ Feeeit мбщанина Михаила Георпевича (онъ же Юрьевъ и Eruровъ) Теслона, заявить ихъ Ревельекону Овружнону Суду въ шеетиийсячвыа, считая со дна припечаташя въ С.-Петербургских! Сенатсвихъ Объявлешяхъ третьей пубаивацщ, сровъ, подъ опасешеиъ потери правъ. (-72)",estonian,estonian
ekmteataja,ekmteataja18841229.2.5.3,"Tallinnas. Losfi peal, kubermangu trükkimaias on sada: Maksu ramatltd Kogukonna tigcdcie",estonian,estonian
livzeitung,livzeitung19010502.2.13,"Судебный приставь Рижско-Больмарскаго съезда мировыхъ судей 1 и 2 мировымъ участк. г. Риги Шимкевичъ, жит. въ г. РигЪ, но Суворовской ул. въ дозИз подъ № 4, объявляете, что 23 мая 1901 года, въ 10 час. утра, будете производиться публичная продажа движимаго имущества, принадлежащая Iозеф-Ь Короли Hf&gt; Герцфельдъ. заключающаяся въ мебели и Черной«« й волостной судъ, Юрьевскаго уезда, Лифляндской губернш, симъ доводить до всеобщаго св'Ьд'lлия, что крестъянинъ Черновской волости Лфонатй Егоровъ Кулаков?), умеръ 2 февраля 1885 года, оставивъ въ нос. Черномъ недвижимое имущество, почему волостной судъ, на основан in 222 - 226 ст. II отдела вол. суд. уст. 1889 года, вызываетъ всЬхъ лицъ, им'Ьющихъ кашя либо права къ его имуществу въ качестве наследииковъ, легатарlевъ, кредиторовъ и проч., предъявить свои права сему суду въ течеше шести мЪсяцевъ со дня третьей о семъ публикацш въ Лифляндскихъ Губернскихъ В'Ьдомостяхъ, въ противномъ случай ein права будутъ признаны утратившимися, а явивниеся наследники, будутъ утверждены въ нравахъ наследства. № 54. 8 Лаздонстй волостной судъ, Лифландской губернш, Венденскаго уЬзда, симъ доводить до всеобщаго тя, что, согласно протоколу сего суда отъ 2 марта сего года приписанные къ Биксерской волости крестьяне Петръ Зельтинъ и его жена Эде, не mrfciouste д'бтей, усыновили сына умершихъ крестьянъ Карла Авотина и его жены Эды Яна Александра Авотина , родившагося 25 мая 1892 г. А потому ЛаздонскАй волостной судъ вызываетъ всlзхъ имйющихъ кашялибо претензия къ этому усыновленпо, заявить таковыя сему суду въ течете 3 м'Ьсядевъ со дня припечаташя третьей публикацш въ Лифляндскихъ Губернскихъ Б'Ьдомостяхъ, съ предварешемъ, что въ срокъ не заявленный претенз!я будутъ признаны утративпшми свои права и усыновлена вступить въ законную силу. Ш 212. 2 Nitaures pagasta tecfct, Rigas aprinki, pamatojotees us pagasta teesu ustawa II dalas 222 un 224 p. Ar scho usaiziua wisus 20. junijä 1899 gada miruscha Jiitaures pagasta Jarul-Ruhkmun mahjas ihpaschueeka Jehkaba Wihtola mautiucctuS seschu mehneschu laika, skaitot no pehdeja sludiuajuma uodrukaschauas Widsenws gubernas awise, peeteikt un peerahdit sawas mantojuma teesidas us miruscha Jehkaba Wihtola kustamu un nekustamu mautibu, pehz kuva termina notezeschanas wairs uekahda peeteikschana netiks peenemta, det ar scho mnutojumu tiks likuungi isdarits. 70. 9 Naukschenu pagasta teesa, Walmeeras aprinki, pamatojotees us pagasta teesas ustawa II dalas 222, 224—226 paut., zaur scho usaiziua wisus miruscha 21. jauwari sch. g. scheijeenes Puslauga mahjas ihpaschueeka Karla Saschas mantineekus, peeteiktees ar sawahm mautoschanas teesibahm pee schihs pagasta teesas seschu mehneschu laika, skaitot no tahs deeuas, kad schis sludiuajums buhs trescho reisi eespeests Widsemes gubernas awise. № 90. 3 Behrsones pagasta teesa, Jehsn aprinkk, Behrsones drandse, pa&gt;uatojotees us sawa nolehmuma no 11. apriia sch. g. usaizina zam scho wisns, kam duhtu kahdas teesibas us nelaika Ändreja Bree s ch kal n a pakal palikuschn mantll, ka ari paradu dewejus un nehmajus, meldetees ar sawahm teesibam nn peenahkmneem pee augschminetas pagasta teesas triju mchneschu laika, pehz scha sludinajmna nodrukaschauas trescho reist Widsemes gubernas awise, jo pehz ta ilekahdas eerunaS wairs uetaps eewehrotas un ar paradn slehpejeem pehz likrnua darits. 193. 3 Zeswaines pagasta teefa, Zehsu aprinkk, panratojotees us pagasta teesu ustawa II dalas 222 un 224—226 panteem, zaur scho usaizina Zeswaines pagasta Widus Vtotschkreewinu mahjä 23. dczembevT 1899 gadä miruscha nimetas Widus Motschkrecwinu mahjas ihpaschireeka semneeka Jahna Stiprais mantineekus, paradu prasitajns un paradneekus, peeteiktees pee schahs teesas se-schu mehneschu laika, skaitot no scha sludinajuma treschas reifes eespeeschanas Widsemes gubernas awise. Wehlakas peeteikschanas us mantojumll schi teesa wairs nepeenems un ar paradu slehpejeem darits pehz likumeem. Я 349. 3 .Mrbischu pagasta teesa, Walmeeras apnnki, pamatojotees us pagasta teesas ustawa II dalas 222—226 panteem, zaur scho usaizina Kirbischu pagasta miruscha „Jaun - Lemschkul"""" mahjas saimneeka Gusta Osolina mantineekus, peeteiktees ml peerahdii sawas mantoschanas teesibas pee schis pagasta teesas seschu mehneschu laita, pee kam teel peeminets, ka pehz mineta laika notezeschanas, t. i. skaitot no scha sludinajuma nodrukaschanas deenas trescho reisi Widsemes gubernas awise netiks wairs nekahdas usdoschanas usnemtas, bet ar miruscha Gusta Osolina pakal palikuschu mantibu tiks pehz augschä miueteettl likuma panteem darits. Я 61. 2 Aderkasa pagasta teefa, Rigas aprittlt, Bcadalinas (Sissegall) braubfc, ar scho sino, ka Aderkasa pagasta semneeks Mäkels Silmsch ar sawu seewu Leem, pehz schis teesas protokola no 22. februara sch. g. peenehmuschi dehla weetä Aberkasa pagasta semneeka Andreja Plawina un wwa seewas Ilses dehlu Andreju Plawinu, dsim. 26. februari 1891 g., pamatojotees us pagasta teesu ustawa II dalas 276 un 277 p. pagasta teesa usaizina wisus, kam schajä leetä buhtu kahda prerruna jeb prasiba, to usdot schal teesai seschu tnehneschu laika, rehkinot no tas deenas, kad schis sludinajums buhs pehdejo reist drukats Widsemes gubernas awise. Pehz tä pretrunas netikS wairs peenemtas. № 324. 1 Aderkasa pagasta teesa, Rigas aprinki, Aiadalinas (Sissegall) draudse, ar scho sino, ka Aderkasa pagasta Kalku mahjas ihpaschneeks Jahnis T'ahwa d. Ahbolinsch miris, ka pehz. pamatojotees us pagasta teesu ustawa II dalas 220—226 paut., teek usaizinati uelaika Jahna Ahbolina mantneeki, peeteikt schai teesai sawas prasibas seschu mehneschu laika, rehkinot uo scha sludiuajuma pehdejas reises nodrukaschanas Widsemes gubernas awise. Pehz schä laika peeteikumi netiks wairs peencmti un leeta tiks turpinata likumös noteiktä kahrtä. X- 323. 1 Saweenas pagasta tccfa, Zehsu aprinki, drandse, zaur scho usaizina wisus 1. fcbvuavi sch. g. miruscha Saweeuaö .Uuitzu № 19 mahjas gvuutineefa Jahn Turilla uiantilieekus lihdf 25. scptemberam 1901 gada peeteikt sawas umntojama teesibas us miruscha Jahn Turina atstahjuma, jo pehz mineta terinina notezeschanas wairs nekahda peeteikschanas netiks peenemta, bet ar scho maatojumu leetu liknmigi isdarits. Xt 22. 1 Ainaschu pagasta teesa, Walmeeras aprinki, pamatojotees us pagasta teesu ust. II dalas 222—226 p. Ar scho usaizina wisus, 25. septembri 1900 g. miruscha „Mehrneeku"""" — SAunenan übieo'ra) pusmuischas ihpaschneeka Jahna Mikela d. Nemmika, paradu dewejus lttl nehmejus ar sawam teesibam un peerahdijumeem peeteiktees pee schis pagasta teesas seschu mehneschu laikä, skaitot no tahs deenas, kad schis sludinajums trescho reisi nodrukats Widsemes gubernas awise. Pehz scha termina notezeschanas mantojums tiks nodot pehz peederibas, bet ar paradu slehpejeem darits pehz likuma. Xs 80. 1 Arakstes pagasta teesa, Walmeeras aprinki, Rujenes draudse, pamatojotees us pagasta teesas ustawa II datas 222 un 224 panta usaizina wisus 26. februari 1901 g. miruscha Lobes „Lejas Melke"""" mahjäs rentneeka Wikum Leitlanda mantineekus, peeteikt schai teesai us atstahto mantojumu sawas mantoschanas teesibas, ka ari paradu dewejus un nehmejus, newehlak ka seschu mehneschu laika, skaitot no tahs deenas, kad - schis sludinajums trescho reist nodrukats Widsemes gubernas awise. Wehlak nekahdas peeteikschanas uetiks eewehrotas, bet ar paradu slehpejeem pehz likuma darits. № 114. 1 Kaarma-Suure wallakohus, inis Kuresaare kreisis, Liiwi kubermangus on, kuulutab seega, et selle wallaliige talu lesknaene Mari Abbi on selle samma walla liikme Karl Jaani poja Auusi selle Kaarma-Suure walla kohtu protokolli põhjusel 8. märtsist 1901 aastal omale kasupojaks wötnud kõige lihaliku lapse õigustega; sellepärast kutsub kohus neid, kellel selle pojaks wötmise wastu midagi rääkimist on, kuue kuu jooksul selle kuulutuse kolmandamast äratrükimise korrast arwatud, oma awaldusi ülesandma; peale nimetud tähtaja möödaminemist jäeb walla kohtu otsus seaduse jõu sisse ja ei saa enam kedagi kuulda wöetud. 88. 3 Wastse-Antsla wallakohus, Wõru kreisis, Liiwi kubermangus, wallakohtu seaduse II jao § 221, 222 ja 224 põhjusel 1889 a. annab sellega teada, et Wastse-Antsla walla liige Karl Jüri poeg Kriidi on ära surnud 1900 a., Laskese talus WastseAntsla wallas, ja liikumata warandust järele jättes; sellepärast kutsutakse siis kõiki, kelledel sellest pärandusest saamise õigust on, seda kuue kuu aja jooksul, selle kuulutuse Liiwi kubermangu teatajas kolmandat korda äratrükimise päewast peale arwates, siin kohtu ees ülesandma. 56 109. 1 tfuiüa wallakohus, Jurjewi kreisis, Liimi kubermangus, waltakohtu seaduse II jao § 221, 222 ja 224 Põhjusel 1889 aastal annab seega teada, et Luuia, end. WeSneri, wallaliige Jaan Jüri p. Hendriks on on ära surnud 25. aprillil 1897 aastal Lnnia wallas, liikuwat ja liikumata warandust järele jättes; sellepärast kõik, kellel sellesse päranduse tompu midagi maksa ehk sellest saada on, niisama kellel selle päranduse waranduse pärimise öigusid on, saatvad üleskutsutud seda siin kohtule ülesandma kuue kuu aja jooksul, selle kuulutuse kolmandana äratrükimise päewast, selles Liimi kubermangu teatajas, peale arwates; pärast selle tähtaja möödaminemist saawad pärijad pärimise õigustes kinnitatud ja ei saa enam keegi kuulda wöetud, ning mitteilmunud wölglased langemad, sellekohase seaduse järele, wastutamise alla. № 40. 1",estonian,estonian
livzeitung,livzeitung18910923.2.16,"Verzeichnis. Lehdurgas Pagasta teefa, Rigas apvin-tt, zaur scho usaizina wisus miruscha Jnzeema Kansas mahjas grüntueeka Jahna Miljmm parada dewejus un uehmejus, ka an mantineekus im nlantoschanas teesi gus 6 mehneschu laikä, stattet t»o tahs deeuas, kad schis sludinajums beidsamo reist uodrukats, Peeteiktees ar sawahm prasibahm, pildischanahm un teestbahm pee schihs teesas. Wehlaki netiks wairs nekahdas prastbas eewehrotas un paradtt slehpaji kritihs likumigä sodä. Л5 282. 2 Löwe kohus, Wiljaüdi kreisis, Helme kihelkonnas, annab sellega teada, et siit walla liikmed weunaksed Hans ja Jaak Rätsep oma surnud wenna Ado Rätsepa järele jäänud warandnse pärimise õiguse Pärast lepingut on teinud ja järge jäänud warandust isekeskel nendawiist ära jaganud, et Hans Rätsep * Leebiku wallas seisma Lohu talukoha omale jäädawaks otnauduseks pärib. Kui ntiüd hend keegi avwav sellest pärandusest osalik olewat, selle päranduse jagantise wasta nndani ütlemist on, siis saab igaühte üleskntsntttd oma wastaräUitnist kuue tun aja sees, kolmandama kuulutamise päewast peale arwatos, selle kohtule ülesandina, Mastasel järjel eelpool nimetatud waranduse jagamine kindlaks jääb ja Lohu talukoht Hans Rätsepale omanduseks mõistetud № lve. 2 ' • Der zu beleihenden Gesinde. Der Güter, zu denen sie gehören. Der Anleihenehmer. Alla Paali № 18. Teppani M 13. Terli M 21. Reino M 20. Dorpat-Werroscher Kreis. Groß-Caml?y. do. do. do. Jaan Lanbek. Johann Kokk. Jürri Puskar^ Jiim Plahr. № 2995. 1",estonian,estonian
ekmteataja,ekmteataja18880811.2.6.2,"ja kassuks seatud, wäljäantnd 11-mae Jani-ku p. 1866 a. 4. Seadused selle ülle, mis Tallinna-kubber-mangu mõisa herra peawad tassumci nende tallu-kohha-rentnikudele, kes aunawad kohhad taggasi, kas selle parrast, et saab rendi hind pärritud, ehk selle parrast, et kohhad on äramüdud, ja sawad rentniku käest ärrawöetud. 5. Mis tulleb küllaks arwada (TalliMa kubbermangu seitungi 1866 a. 75 -ma numbr. makele ümberpandud. 6. Kässud kronu-maksude ajamisse pärast. 7. Kohtu-Seadus koggukonna kõhtudele Tallinnamal kohtu-liikmete, kohtu-wöimusse ja kohw-as-jade toimetamisse ülle. По 20 коп. за экз. Въ Типографии Эстляндскаго Губернскаго Правлещя продаются : Köige körgemalt kinnitatud Seadus Jtem mäifa Mtijek Sßstimaal. По 10 коп. за зкз.",estonian,estonian
ekmteataja,ekmteataja18930506.2.5.8,"Катентакский Волостной Судъ, округа Везенбергскаго верхняго крестьянскаго суда, на основанш ВЫСОЧАЙШЕ утвержд. 9 тля 1889 г. ст. 222 II отд. вол. суд. уст., вызываетъ въ продолжеше шести ыЬсяцевъ, т. е. съ 17 апреля по 17 ОЕТября 1893 г. насл'Ьдвиаовъ умершаго крестьянина Ганса Рейнера, Альтенгофской волости, Везенбергскаго уйзда, Эстляндской губернш, чтобы они заявили свои права на наследство, а тякже Всехъ техъ, которымъ онъ остался долженъ и т4хъ, которые ему остались должны. Aaspere Walla kohus, Nakwerc ii lein li talu rahwa ringkonnas, Kõigekõrgemalt kinnitub 9 Juulist 1839 aastast Walla kohto sead. § 222 II jao määrust mööda, kutsutakse kuue kuu jooksul see on 17 Aprillist kuni 17 Oktoobrini 1892 aastal surnud talupoea Hans R e i n e r i, Wanarnoisa Wallast, päranduse pärijad endid Aaspere kogokonna kohto üles andma, uiisama ka need keS furmib Hans Reinerilc wölga on, ehk tema käest tasumist nöudwad. (419.)",estonian,estonian
ekmteataja,ekmteataja18890119.2.3.3,"J-J Щ Eestimaa kubermangu walitsuft S wäljaandja juures, kes D äeres paroni proua Rausch &gt; jas elab, ning ka linnades ja Balti &lt;£ Ш Mil tn mam - ш on i m Kokkuseadmld ja waljaandnud lwenekeeles) il m Selles raamatus on kokkukogutud kõik seadused talumaade korduse kohta, mis künni 1-se Aprilli k. p. 1888 waljaantud ja ülesse pandud on: „Seaduste kogus"""", Mis 1857 kuuni 1886 aastani awaldatud"""", „Kohaliku seaduste kogus"""", „Täieliku seaduste kogus"""", „Walitsuse kasude ja seaduste kogus"""", „Eestimaa kubermangu walitsuse kirjades, ringkirjades ja kuulutustes"""" j. n. e. Sest et selles raamatus seaduste seas ka need awaldatud ou, mis igalpool Weneriigis inakswad ehk Balti kubermangude kohta kuulutatud on, sellepärast saab se raamat ka Liiwimaa ja Kuuramaa kuberinangude kohta tululik olema. Raamatu suurus on: põhjakirja 948 lehekülge, lisalehte ja juhtkirja 165 lehek., eessõna ja pealkirja 17 lehek., üleüldse 1130 lehek. ii 1 Raamatu I. Besüntaa Seadus 1856 a, (pae, I—-276).1 —-276). а) T&amp;eiutikonlraljfi iegemijest. Il) SalumljTOa maade opmijekonfaajjfi fegemijcff. 11. 9£6igek&lt;h'getnalf J.859 a, kinnttud fija ' Jeadmjed Sesfxmaa Taluraljroa Seadufe juute, 111. Seadused 18. %ееЬвиа«lр 1866 а,, mis järel fatumifmkud möisni' kufe poolest kjiifiid jaamad. IV. Seadufed SejnfuJe-kofjhi üte. V. 9£utdfts (atui!ftT)ioas keooniuuõi» jades maäjtd osfa wöib. VI. Seadused, mis jatet ükjrkutf inimeste efjk koguduste otnandujed jundimije roitfit riigi ja aroalikn fatroifujeks wöiwad amtuöefud jaada. Waamatu hind posti lühidelt fifn. VI!. Seadused paiguti maa-ä?awõlmi-jest kihelkondade iarwilumeks. VIII. Be«timaa moimiikuke Akreäik-kas- № IX. Э£«ооп maa- (fiinu») inakjudejf. X. ТШве kasjafl. XI. AdradeJl. XII. Advavaama ludest. XIII. möieiiiku-moijadc, krafcumötfade ja prii-kohlade jaädaro patiskoljufejt kõik kroomi' ja nialla-makjud ja maksfa ja faila. (lleattajfen). XIV. Täiimisiest ja majijudejr, XV. Maade rajamisest ja panemisest. Ыlщй ühes 6 mbla h. ii 1 i •«TrrlCT Симъ объявляется, что къ тарифу на перевозку грузовъ въ нрнмомъ внутреннемъ и заморскомъ сообщенlяхъ изъ Ревеля, Риги и Либавы въ Москву, также какъ и въ прям омъ заморскомъ изъ Кенигсберга въ Москву сообщенш, издашя 1-го Апреля 1884 года для служебной надобности, вышло 111 добавление действующее съ 1-го Января 1889 года по ст. стилю» Экземпляры этого дополнешя продаются въ Правлен in хъ Обществъ : Балтшской и Либаво-Роменской дорогъ въ въ Уиравленlя Общества Юго-восточной Прусской железной дороги въ Кенигсбергй и въ тариФномъ отделен!» Правления Общества РигоДинабургской железной дороги въ Риг г Ь, а также на станщяхъ Ревель, Рит, Либава и IХенигсбергъ. Правлеже Общества Риго-Динабургской железной дороги, (1-2,00). 1 сундукъ (Koffer) сапожный товаръ, 1 ящикъ; сапожный товаръ. (578.)",estonian,estonian


In [42]:
languages_error <- c("ukrainian", "english", "bulgarian", "belarus")

langs_joined %>% 
    filter(lang_cln %in% languages_error) %>% 
    group_by(lang_cln) %>% 
    sample_n(10)

keyid,section_id,text,lang_cln,lang
<chr>,<chr>,<chr>,<chr>,<chr>
ekmteataja,ekmteataja19131010.2.1.1,"(Оффяцшшв Нрибамен'ш кз № 41 &lt;.Эстл. Туб. Вид.г oim 10 октября 1913 года). в-вдомость о повальныхъ на скот% въ Эстляндской губернш за АВГУСТЪ м£снцъ 1913 года. S)ÜW, Губ, THD.",belarus,belarus-windows1251
livzeitung,livzeitung19020814.2.23,"X«Mil-Zlonn»Sd Нар. изд. Я. Бермана. Для ознакомлеш одна кн. высыл. беаплатно. Спб., Фонтанна 9S-",belarus,belarus-windows1251
ekmteataja,ekmteataja18920312.2.7.1,"ё ё ё ё A Нумера J . Сумма Нумера J Сумма Нумера J Сумма Нумера J Сумма Нумера g Сумма cepiS. выигрыша. cepifi. д выигрыша. cepiii. д выигрыша. ccpifi. д выигрыша. серш. д выигрыша. 'М -- 08.19 1 024 250 08.531 085 250 08.841 |о89 250 09.080 071 250 09.374 058 SOO 08.195 049 250 08.533 009 250 08 844 y!8 250 09.082 015 250 09.378 093 250 08.200 014 250 08.536 021 250 08.845 W75 250 09.083 025 250 09.380 095 SOO 08.205 056 250 08.537 053 250 08.847 958 250 09.086 097 1.004» 09.382 076 250 08.210 091 SOO 08.549 032 250 08.850 019 250 .09.100 080 250 09.385 006 250 08.212 048 250 08.554 074 250 08.853 034 250 09.104 058 250 09.386 047 250 08.215 090 250 08.562 096 250 08.853 088 l.OOO 09.110 053 250 09.387 046 250 08.229 053 250 08.574 066 250 08.855 041 250 09.122 021 250 09.392 074 250 08.240 070 250 08 574 084 250 08.863 034 250 09.123 001 250 09.394 098 250 08.245 036 250 08.577 006 250 08.866 058 SOO 09.125 915 250 09.395 100 250 08.247 088 250 08.582 015 250 08.866 063 250 09.126 076 250 09.401 035 250 08.256 005 250 08.588 037 250 08.867 004 250 09.128 007 250 09.404 017 250 08.257 026 250 08,596 056 SOI» 08 868 028 250 09.143 057 250 09.406 047 250 08.257 052 250 08.598 959 250 03.868 056 250 09.144 029 2 50 09.414 959 250 08.268 097 250 08.601 077 250 08.869 ,024 250 09.147 055 250 09 440 013 250 08.276 098 250 08.609 013 250 08.871 '030 250 09.147 057 250 09.441 067 250 08.286 017 250 08.610 077 250 08.873 048 250 09.156 036 250 09.443 083 250 08.286 098 250 08.611 023 250 08.874 032 250 09.156 067 250 09.445 026 250 08.290 083 250 .08.616; 018 250 08.879 063 250 09.156 090 250 09.447 024 250 08.301 099 250 08.620 073 250 08.879 073 250 09.160 098 250 09.452 039 250 08.302 079 250 08.635 015 250 08.883 035 250 09. [65 082 250 09.454 096 250 08.309 086 250 08.636 030 SOO 08.886 057 250 03.167 001 250 09.465 056 250 08.313 003 250 08.648 087 250 08.894 054 SOO 09.169 010 250 03.466 009 250 08.314 075 250 08.653 076 250 08.897 062 250 09.173 015 250 09.469 043 250 08.317 089 250 OIU55 038 250 03.898 021 250 09. 177 045 250 09.475 092 250 08.325 026 250 08.656 033 SOO 08.902 024 250 09.178 022 250 09.476 065 250 08.326 004 250 08.661 046 250 08.902 045 l.OOO 09.178 091 250 09.478 096 250 08.326 070 250 08.665 095 250 08.907 020 250 09.179 086 l.OOO 09.483 096 250 08.330 035 ; 250 08.672 068 250 08.908 050 250 09.180 0»2 250 09.484 092 250 08.344 070 250 08.675 076 250 08.910 059 250 09.181 078 250 09.489 073 250 08.347 05i: 250 08.679 049 SOO 08.912 099 250 09.186 092 250 09.495 074 250 08.369 048 250 08.680 023 SOO 08.918 008 250 09.187 089 250 09.499 059 SOO 08.369 099' 250 08.681 044 250 08.919 035 250 09.188 033 SOO 09.504 003 250 08.380 (136 2 50 08.688 074 250 08.922 001 250 09. 133 077 250 09.504 010 250 08,383 057 250 08.689 048 250 08.928 081 250 09.193 085 250 03.505 070 250 08.387 027 250 08.691 057 250 08.939 031 250 09.199 019 250 09.506 072 250 ,08.392 U80 250 08.692 035 250 08.942 044 250 09.204 095 250 09.513 031 250 08.397 07 9 250 08.699 086 250 08.947 048 250 09.2 19 042 250 09.514 072 250 08.400 089 250 08.700 084 250 08.949 034 . . 250 09.222 037 250 09.518 077 250 08.403 060 250 08.702 001 250 08 958 043 l.OOO 09.224 027 SO® 09.525 019 250 08.405 042 250 08.716 096 250 08.959 041 250 09.239 044 250 09.528 010 250 08.405 083 250 08.727 038 2,50 08.959- 061 250 09.239 065 250 09.545 054 l.OOO 08.406 097 250 08.729 007 250 08.359 098 250 09.241 004 250 09.549 006 250 08.408 009 SO*l 08.731 023 250 08.964 039 250 09.246 100 250 09.554 031 250 08.420 096 250 08.732 003 250 08.964 o56 250 0-1.26 ! 022 250 09.569 005 250 08.421 014 250 08.734 028 lO.OOO 08.968 081 250 09.261 046 250 09.569 100 250 08.428 046 250 08.742 040 250 08.9/0 068 250 09.261 084 250 09.570 046 250 08.433 094 250 08.745 010 250 08.975 060 SOO 09.262 055 250 09.572 092 250 08.436 076 250 08.747' 007 SOO ■ 08.980 089 250 09.263 089 250 09.574 045 250 08.438 021 250 08.752 066 250 08.984 076 250 09.268 020 250 09.576 098 250 08.438 035 250 08.758 060 SOO 08.987 069 SOO 09.271 026 250 09.578 084 250 08.439 092 250 08.761 074 250 03.988 021 250 09.274 078 250 09.590 029 250 08.446 040 250 08.765 088 250 08.995 063 2o0 09.279 039 250 09.595 004 250 08.453 060 250 08.766 043 250 09.003 032 250 09.282 041 S.OOO 09.597 009 250 08.455 009 250 08.769 046 250 09.010 083 250 09.288 038 250 09.597 031 250 08.459 020 250 08.770 029 250 09.012 003 250 09.288 061 250 09.602 056 250 08.462 oio 250 08.771 048 250 09.012 076 250 09.295 059 SOO 09.602 078 250 08.462 045 250 08.774 058 250 09.018 059 250 09.298 042 l.OOO 09.605 070 250 08.473 025 250 08.778 079 SOO 09.018 098 250 09.312 088 250 09-607 001 250 08.482 064 250 08,785 024 250 09.019 006 250 09.317 099 250 09.611 098 250 08.484 074 250 08.789 057 250 09.019 097 250 09.321 028 lo ООО 09.612 006 l.OOO 08.490 014 250 08.794 012 250 09.025 018 250 09.323 013 250 09.615 089 250 08,490 063 250 08.798 089 250 09.030 092 250 09.326 016 250 09.616 003 250 08.494 062 250 08.800 071 250 09.036 056 250 09.326 020 250 09.622 057 250 08.504 050 250 08.804 033 250 09.052 068 250 09.327 079 250 09.628 081 250 08.506 086 SOO 08.815 034 250 09.056 100 250 09.332 022 S.OOO 09.628 082 250 08.508 031 250 08818 040 250 09.059 005 250 09.333 037 250 09.629 048 250 08.511 070 250 08.818 077 250 09.062 012 250 09.339 065 250 09.631 030 250 08.512 050 250 08.819 031 SOO 09.062 088 250 09.352 059 250 09.640 015 250 08.513 065 250 08.824 056 250 09.065 089 250 09.364 051 250 09.640 042 SOO 08.513 077 250 08.826 002 250 09.066 080 250 09.366 085 250 09.641 002 250 08.513 079 250 08.828 078 250 09.069 074 250 09.367 032 250 09.641 074 250 08.516 077 250 08.832 004 250 09.076 047 250 09.367 090 250 09.648 088 250 08.522 023 250 08.837 022 250 09.076 097 250 09.370 035 250 09.651 063 250 08.529 027 250 08.838 029 250 09.077 073 SOO 09.373 068 250 09.678 033 250",belarus,belarus-windows1251
ekmteataja,ekmteataja18690604.2.4.4,"Курсы. Ревель, 4 Iюня 1869 г. С.-Петербурга , 3 Iюня 1869 г. На Лондона ..на 3 Mic. 30 т \, | .... за I руб. „ Гамбурга . „ 27 »;. f . .. . „ „ Амстердам® „ 153|-, j- .. . „ „ Паришь . . „ 321, 320 ... „",belarus,belarus-windows1251
livzeitung,livzeitung18960207.2.5,"11. s°|o закладные листы Рига, 27 Января 1896 г. По S50 тал. альбертовыхъ: Ла 1263 (1895). „ БОО ш. альбертовыхъ: № 822 (1895). „ ЮОО руб. сер. Ла 3827 (1895) № 9274 (1895) Л° 18199 (1895) № 22627 (1894) Да 26825 (1895) 4991 (1895) 9375 (1895) 18294 (1895) 22640 &lt;4895) 27965 (1894) 5034 (1895) 9470 (1895) 19473 (1895) 23045 (1895) 29300 (1895) 6100 (1893) 9835 (1895) 21047 (1895) 23200 (1895) 29440 (1895) 6918 (1895) 11095 (1895) 21217 (1895) 23665 (1894) 35053 (1889) 7023 (1895 13676 (1896) 21864 (1887) (1895) 23698 (1895) 37462 (1895) 7429 (1895) 15128 (1895) 22428 24589 (1895) 42291 (1895) 8498 (1895) 16641 (1894) 22451 (1895) 25987 (1895) 8551 (1895) 16644 (1895) 22516 (1890) 26012 (1895) По 650 руб. сер.: № 9317 (1895). „ 500 руб. сер.: Л» 3516 (1895) № 8754 (1895) № 12464 (1894) № 17065 (1895) № 19659 (1895) 3866 (1895) 9729 (1895) 16068 (1895) 17233 (1895) 20328 (1894) 6835 (1895) 10507 (1894) 16733 (1895) 18231 (1890) 22684 (1895) 7585 (1895) 12108 (1395) 17057 (1895) 18789 (1894) 30579 (1893) По ЮО руб. сер.: N&gt; 2790 (1895) Ла 5739 (1895) № 12436 (1895) Да 19337 (1894) Да 28833 (1895) 2809 (1895) 6838 (1895) 12709 (1895) (1894) . 21093 (1892) 29089 (1895) 2841 /1891) 6876 (1894) 14204 22554 61833) 29265 (1895) 3028 (1892) 7282 (1891) 14495 (1895) 22555 (1878) 29989 (1895) 3164 (1895) 8262 (1895) 14997 (1894), 22667 (1893) 30318 (1894) 3815 (1895) 8649 (1893) 16147 (1894) 23315 (1894) 31401 (1895) 3937 (1892) 9289 (1887) 17019 (1894) 27758 (1894) 5314 (1895) 10400 (1894) 18118 (1892) 28640 (1893) 5438 (1894) 10915 (1895) 18571 (1895) , 28678 (1888) По lOOO тал. альбертовыхъ: № 2071 (1895). „ 800 тал. альбертовыхъ: № 462 (1835). „ ЮОО руб. сер.: № 73 (1895) № 4214 (1894) 8974 (1894) № 20618 (1895) I № 26720 (1895) 652 (1895) 4333 (1895) 9067 (1895) 20654 (1895) 28178 (1895) 719 С1894) 5528 (1895) 14220 (1895) 21732 (1894) 28301 4 L 895) 2153 (1895) 5979 (1895) 14756 (1895) 22062 (1895) 29380 (1894) 2384 (1895) 6097 (1889) 15851 (1895) 22132 (1895) 32373 (1895) 2429 (1895) 6273 (1895) 16670 (1895) 22153 (1895) 2882 (1895) 6445 (1895) 16985 (1895) 23174 (1895) 3356 (1895) 8209 (1895) 19289 (1894) 23681 (1893) 3390 (1895) 8407 (1895) 19290 (1894) 24551 (1894) ' По 650 руб. С )р : № 2632 (1895). „ бОО руб. сер : № 4404 (1895). „ 650 руб. сер : № 8166 (1895). „ бОО руб. сер.: № 2379 (1895) № 9930 (1895) 1 № 12586 (1895) № 13974 (1895) № 21759 (1895) 3196 (1894) 11937 (1895) 12953 (1894) 13982 (1895) 23631 (1895) 5386 (1893) 12101 (1893) 13028 (1895) 14721 (1894) 28532 (1895) 5431 (1891) 12271 (1895) 13717 (1894) 14917 (1895) 28554 (1893) 6345 (1893) 12580 (1895) 1 13904 (1894) 14951 (1894) 32368 (1895) По ЮО руб. сер. № 3220 (1895) Кя 5033 (1894) № 7102 (1895) № 12678 (1895) AS 22607 (1895) 3503 (1893) 5034 (1893) 7289 (1895) 13433 (1895) 23439 (1895) 3718 (1895) 5174 (1895) 7658 (1894) 13531 (1894) 23463 (1890) 3723 (1891) 5187 (1895) 7686 (1894) 14267 (1894) 24273 (1894) 3849 (1894) 5405 (1895) 7768 (1895) 15016 (1894) 24656 (1895) 4205 (1895) 5911 (1895) 7951 (1893) 15455 (1894) 26911 (1891) 4244 (1894) 6052 (1895) 8742 (1894) 18020 (1876) 28000 (1895) 4464 (1895) 6057 (1895) 9567 (1895) 16082 (1894) 28476 (1895) 4490 (1893) 6417 (1895) 9649 (1895) 19220 (1895) 28642 (1892) 4533 (1895) 6468 (1895') 9723 (1895) 19834 (1892) 29840 (1895) 4997 (1895) 6786 (1895) 9892 (1895) 21320 (1895) 5031 (1893) 6820 (1895) 10431 (1894) 22470 (1894)",belarus,belarus-windows1251
livzeitung,livzeitung19060529.2.5,"Кандидаты. 1) Петръ В-Ьлоусовъ, 2) Карлъ Эйзенталь, 3) КМусъ Ансбергъ, 4) Петръ Мартинсонъ, 3) Иванъ Цинисъ, 6) Давъ Пейчъ № 728.",belarus,belarus-windows1251
ekmteataja,ekmteataja19050421.2.7.1,"Фонъ Бременъ, Александра Карловна, проситъ считать недействительною утерянную ею 15-го марта 1905 года паспортную книжку, выданную ей Канцелярlею Эстляндскаго Дворянства 7 сентября 1904 г. за № 24, безъ срока. (326).",belarus,belarus-windows1251
livzeitung,livzeitung18960923.2.7,"25 Сентября 1896 года. I Умершего ьъ гор. Рвг*, 26 Августа 1896 »сда, дворявива Iсси«а Михаила Евlеп*еввча Каеперовича. М 88107. II Умершей вт. гор. РягЬ, 11 Iх&gt;ля 1866 года, вдовы переплетчика Эммы Bлвяы Катерввы Феяьцерн , сна же Вфельцерь, урсжд. Шлиннь. М 88120.",belarus,belarus-windows1251
ekmteataja,ekmteataja18710508.2.4.5,"С.-Петербургъ, 4 Мая 1871 г. Спб. Биржа. Курсъ на три иЬсица 4-го Мая 1811 года. На Лондонъ 31 f / t с; Л и пенс. » Амстердам 156 %, цевц. » Гамбургъ 2S'/ le , """"/ g; шил. банк. » Бельп'ю 332.",belarus,belarus-windows1251
ekmteataja,ekmteataja18690410.2.3.3,"КУРСЫ. ■ Ревель, 9. Апреля 1869 г. . С.-Пстербургъ, 8. Апреля 1869 г. , На Лондонъ ..на3 м. 31 -f S4 Wi i*за I руб. „Гамбурга.. „ 28$, 28-Д-. , „ ~ Амстердам® 156|- „ „ Парижъ ... ~ 328, 327... „",belarus,belarus-windows1251


In [43]:
# more pseudo-Ukrainian examples
langs_joined %>% 
    filter(lang_cln == "ukrainian") %>% 
    sample_n(10)

keyid,section_id,text,lang_cln,lang
<chr>,<chr>,<chr>,<chr>,<chr>
ekmteataja,ekmteataja19080911.2.12.1,"(jJLg ГОРОПСНЙХЪ ИЗБИРАТЕЛЕЙ ПО Г. РЕВЕЛЮ 1908 г. Напечатанъ отдЪльнымъ прюжешемъ къ № 37 Зстл. Губ. В""""Ьд. отъ 11-го Сентября 1908 г. г. 1908 r. Типографа Эстляндскаго Губернскаго Правления.",ukrainian,ukrainian-koi8_r
livzeitung,livzeitung18890911.2.3,"НЕОФФИЦИАЛЬНАЯ ЧАСТЬ. C?&gt; Л число Сентябри месяца 1881) г. все письма для мыанаго унраиденш Иоклюае адресовать прем, Смнльтснъ. 91о 1. !pcpkmSei""""i fd}š gada ir wkst pagaflrt sichti'iuim Meksch Siksch»«muischas Waldes par Smilteni suhtami. ПРАВШЕ ТОВАРИЩЕСТВА РИШАГО ЦЕМЕНТНАГО ЗАВОДА И МАШВПЙВИ К. X. Шмидта покорпейгне пробить гг, пайщиков* полой овить mi обыкновенное еобршие 1Vh */Убботу * октябри «что ГОДн н'ь 12 ч о сонь дин, Li, «pnitLHM« в?» Мог KB1I, lift Bupnapuli, пъ ДОМ l&gt; кунощ-гкиго ЩШЦЧТШЦ дла обсуэдсша .- k.дующих.*!) предметен?.: 1} Рааомотрешс и утверждение отчета » баланса за истекипй Tiiuuaiuaтый отчетный годъ. 2) Утперждсше сметным, расходов* н плана дЪйстшй масгулиашаго отчетнаго года. * ' 3) Избран!« одного директора н одного кандидата. 4) Избраше членов?, ронлашиной ком n rein.",ukrainian,ukrainian-koi8_r
ekmteataja,ekmteataja19070628.2.28.1,"- 29 РшьсвШ . . СтарооокодьсвШ СуджаижШ ТВЫСБIЙ . , ФатевсвШ . ЩигровсвlВ 21. Лифляндскан. РижскШ .... Валвсшй . . Вевдевсвгё ФелдивсвlВ ЭзельсЕl3 . 22. Минская. МинсвШ . . . Бобруйшй . . . БорвсовсвШ . . . ИгуыевевШ . . МозырсвШ . . . HoßorpjACEiE . . IIBBCBiS . . . РЪЧПНиШ . . . СлуцкШ . . . .33. Ыошлевская Могилевшй Buiobce'iß . ГоыельсвШ ГорецвШ . КлимовичсеШ МстиславсвИ) oршавскlй . Рогачевсвй Мшвянсеш Чауешв lepasoßcsiß 24. Московски Moi'EOßCüifi Богороде.кш БровввцыВ BepeScEiß . ВолоколамсиШ ДнптровшП Звенигородсвlб Кливскш . Коломевшй МожаВсвШ . НоДОЛЬСЕIЙ . РузевШ CepiiyiOßC.uiö 25 Нижегородская Нижегородец!!! Ардатовшй Арзанассвгё . БадахввнгЕЙ . ВасвльсурсвШ . Горбатовшй . Квягввввсе|В . Лj' KOJiHoucitifi . М аиарьевскН! . Ceueuoßcitifl Cepmcsiß . 137 10! 11 78 137 125 94 10 10 31 41 35 71 12 I 43 5 12 10 6 10 6 6 10 6 71 17 16 10 I 10 12 64 100 21 42 II 13 12 15 13 50 15 1 26. ИоагороОамя БороввзскШ СтарорусскШ ТвхвввсвШ УстюжевсвlЙ ЧерезовецкШ 27 Олонецкая. BHTeropcEiS КарговольсвШ Лодейвопольсвш Оловецкш . . (IовlшецЕlй ИудожишЧ . 28. Оренбургская. ОревбургсвШ . ВерхвеуральсЕlВ OpcKiß . . . Tpoauuiü . . Челябившй . 29. Орловская OBCEiS . БолховскШ . ДмитровскШ ЕлецвШ . . Вврачевсвш Кроыешй . ЛввенсвШ . МалоархавгельсвШ Мцевсшй Ctßciiiö . . Трубчевскш 30. Пензенская Певиеншй . . Городшцеш:кш . КеренсвШ . . Ераснослободсвгё Мокшавтй . НаровчатевШ . Ннж и о л (I S] оисEt i Л Саранлкш . . ЧембарсаШ . 31. Пермская. ПеришЗ . . ВерхотурскlЙ . Еиатеривбургшй ИрбнтсвШ . . БамышливсвЛ! . Ерасвоуфиншй Kyarypcuifi . . Осивсеш ОхавсвШ . . 98 60, 66 16 55 17 26 съ-бгда |уподно--13 1119 32 »I 113 23 58 !17 I I II IH 10 7 7 I 1 6 8 9 11 92 14 1 1 14 6 7 12 6 8 II 22 &gt; 47 II",ukrainian,ukrainian-koi8_r
livzeitung,livzeitung18951108.2.1,"№ 127. Годъ сорвкъ трет 1 й. «805. ■ШФЖНДСКИ ГУБЕРНСКIЯ ВЕДОМОСТИ. Т I ОД.ОЕГ Oligž-M Нагодъ. На выгода. Ka3«tc. Ha Ute P. JL Р. E. Р. К. Р. E. Безъ пересыява н доставай »3 2 1 5С Съ доставкой на доьъ въ город« 4 2 50 1 50 7S Оъ нер зелгкой но очт* ,5 3 2 1 Частная объявлешя ддн наяечатанlя нринилаюмя въ Iн«дяядсвоl Губерневой Тнпограош ежедневно, sa ictHoieiütm ввеервшаъ л праздничных» двай от* 10 чае. утра до 4 чае» ноддо л. Плата ea чаетныя sa строжу въ одан» столбец» . . 6 лов ta строжу в» два столбца . , . 16 , РИГА. Выхедлтл s pasa въ неделю : яо Паиедгдьиккаиъ, Срвдагь я Ляткмяар&gt; Среда, § Ноября.",ukrainian,ukrainian-koi8_r
ekmteataja,ekmteataja18891228.2.4,ЧАСТЬ НЕОФИЦИАЛЬНАЯ. № 50. 28 Декабря 1889 г. № 50.,ukrainian,ukrainian-koi8_r
livzeitung,livzeitung19090701.2.13,"спис о к ъ Имя крестъянскаго двора. на который испрашивается ссуда. Йия дворянскаго шйшл, на которомъ расположенъ втотъ креетьяисий дворъ. Имя заемщика. Юрьево- Во рроскаго У Ъ з д а. Тракси X 31. Саккерья и Видлеми. Цема X 5. Пени-Петеръ X. 101. Фриденталъ. Гермиго X 49. Кольга. Липпарди X 8. Кимаго X 97. Кимаго X 98. Иссако X II. Мямуста X 14. Рейно X 16. Турба X 17. Тууле X 20. Паддусеппа X 2. Пракси X 2. Сапа. Урда X 30. Перрапалло X 5. Раудна (Эриванда). Терве X 39. Садъервъ. Падлоперъ. Замокъ Оденпе. Замокъ Нейгаузенъ. Луденгофъ. Косее. Зоммерпаленъ. Спанкау. Замокъ Нейгаузенъ. Замокъ Нейгаузенъ. Курриста. Курриста. Курриста. Курриста. Курриста. Фиренгофъ. Керимойзъ. Ново-Койкюль. Ново-Кустгофъ. Мексъ. Серристъ. Саддокюль. Микъ Лемусъ. Густавъ Бернаковъ. Карлъ Сусси. Давидъ Церусъ. Гиндрикъ Шасминъ. КШусъ Гернидъ. Петръ Пданги. Яанъ Спеекъ. ' Самуилъ Грюнталь. Самуилъ Грюнталь. Яковъ Кузикъ. Петръ Соосааръ. Яанъ Пегапъ. 1оганъ Пегапъ. Куста Пайде. Константинъ Адсонъ. Куста Праксонъ. Яанъ Сядитъ. Яанъ Иллиссонъ (Ильвесъ). Петръ Сорга. Гендрикъ Лемусъ. Рудольфъ фонъ Коссартъ. Перново-Фелдинскаго уЬзда. Вирроюрри X 3. Соликсе X 23. Кунги X 2. Няри. Еауби Теннисъ X 22. Лауке X 87. Вправо X 86. Нигула X 25. Удзо X 56. Паксу X 25. Пярна X 32. АЙдо Гансъ X 33. Вирро Якобъ X 35. Кристьяни X 49. Сикко X 54. Тяммо X 52. Побболи XI. Побболи X 3. Бекгофъ. Бекгофъ. Абенкатъ. Бекгофъ. Ново-Суйслепъ. Паюсъ. Паюсъ. Аддаферъ. Полленгофъ. Вастемойзъ. Курриста. Курриста. Курриста. Курриста. Курриста. Курриста. Курриста. Курриста. Эрнстъ Вальбергъ. Яанъ Трейфельдъ. Яанъ Эйхенбаумъ. 1оганъ Лауль. Гансъ Мартсонъ. Карлъ Циммерманъ. Карлъ Циммерманъ. Адо Лаукъ. Яанъ Юусаласъ. Юрри Соонъ. Теннисъ Рянкель, Фридрихъ Лентсъ. Оговъ. Тенно Пялъ. Теннисъ Микъ. Теннисъ Лясаръ. Mapin Пярсманъ. Тенно Рянкель. X 3910.",ukrainian,ukrainian-koi8_r
ekmteataja,ekmteataja19100812.2.1,"Эстляндские губернские ведомости M 32 ЧЕТBЕРГ """"b, 12 АВГУСТА 1910 г. №32. ЧЕТВЕРГЬ, 12 АВГУСТА ,81« г. LVIIIJ ГОДЪ.",ukrainian,ukrainian-koi8_r
livzeitung,livzeitung18930705.2.2,ИНСТРУКЦШ чинамъ Полищи округа С.-Петербургской Судебной Палаш (состав. Прокуроромъ СПБ. Суд. Палаты Кузминскимъ). Ц-Ьна вь 3|s коп.,ukrainian,ukrainian-koi8_r
livzeitung,livzeitung18960717.2.5,"Р«дlм|&gt;яж«иlя и обълвлгИ|я «ЩВНФТРИТИМЫЯ Г. 11«Ш1С»нг Губерввтороиъ pupUiMo г I Андрею Гринбереу устройство *аб реи, бе#ъ дароиаго двигателя, для наготовлен« нолесно! маан, въ гор. Part, чо Матв*евсяоl улиц* въ дои* оодъ Л# 145. М 6197. II Сидоршателю дориальноЯ аптели въ вн. Синльтсп в, Вмвсяаго у*?да, цровиаору Е. Бергману перевести ого aateij въ собственный доиъ въ юнг лс аи*вш. *V 1681. 111 Kyany В гильдlа Фридриху iosanмму отврыть въ вн. Замовъ-Загижцъ, ЮръиЯвввго у*&gt;дв . «введете длл ирг чж&gt;влаиlя na продажу нсиуествен«яяъъ тгаерйлъиып. яодъ, А твмге прохладительны го вруктовыго водь И ЛНИОВАДОВЪ. М 1693.",ukrainian,ukrainian-koi8_r
ekmteataja,ekmteataja18871203.2.5.2,"ЧАСТНЫЯ ОБЪЯВЛЕН! Я. Изъ нихъ въ вспоыогат. фоядъ 20°!о . » 117 90 За разность °lо при поауп. цЪнн. бум. . » 29 48 442 12 1,442 12 Р а с х о д ъ: За 2 смертныхъ случая, 1-ый 200 руб., 2-ой 400 руб. 600",ukrainian,ukrainian-koi8_r


In [45]:
langs_samples <- langs_joined %>% 
    filter(lang_cln %in% languages_local | lang_cln %in% languages_error) %>% 
    group_by(lang_cln) %>% 
    sample_n(10)

head(langs_samples %>% ungroup() %>% sample_n(5))

keyid,section_id,text,lang_cln,lang
<chr>,<chr>,<chr>,<chr>,<chr>
livzeitung,livzeitung19050530.2.42,"Роспмснн Рижской Конторы Гоеударственяаго Банка по вкладами на хранение за 235 3Т. 1504В, 17404 я 18553 въ приняты ею на хранеше отъ Преображенской церквы на Александровской ВысотЬ разныхъ нрояевтныхъ бумагь на общую номинальную сумму 600 рублей * 1 з К"""" утеряны. """"ЧЩ",ukrainian,ukrainian-koi8_r
ekmteataja,ekmteataja19061120.2.18.1,"npUMOtcmie къ X 47 «Эетляндеюиап, Губсрнсшхъ Ведомостей«, отъ SO Яоября 1906 г. Сяпс о к ъ лицъ, имЪющпхъ право, на основанш 11. 2 отд. IY ВЫСОЧАЙШАГО Указа отъ 11 Декабря 1905 г. объ измЪненщ Положетя о выборахъ въ Государственную Думу и изданныхъ въ дополнение къ нему узаконешй, участвовать въ предварительныхъ (под. о выб. ст. 14) по избрашю уполномоченныхъ въ съ'Ьздъ землевдадЬльцевъ по Везенбергскому уЬзду. Фамилия, ИМЯ И отчество, Авдерсоаъ Кпрлъ Юрг.евъ Авнвъ Ннхдаь Югавовъ Арро Гансъ Сииовъ Автъ Явобъ Маднвовъ Абрамовъ Абраыъ Яаовъ Адевергъ Юганъ Явовъ Авнвъ Гуотавъ Югавовъ Адьысовъ Бирлъ Тенновъ Аазо Гансъ Цевтовъ Авелшт. Явь Яво&amp;овъ Альнавъ Iогааяоеъ Авель Двдрихъ Мадвсовъ Аруеъ Милей. Югановъ Адаыоовъ Ьгавъ-Готлвбъ Кардовь АСрииовъ Андрей Петровъ Алевоандровъ Яванъ Адевсандровъ Амтуиъ Андресъ Мартыновь Авнусъ Яаъ Аядресовъ Арышаяъ Мартъ Маковъ Аданеовъ Явъ Юрьевъ Алевъ Гвадрваъ Гввдрааовъ Авдре NZiti Ащрееввчъ Абраыоовъ Алевиандръ Абрановъ Анауоъ Iогавъ Юрьевъ Анвуеь Яаъ Iогавовъ Авнусъ Антокъ Iогавовъ Авнувъ Егоръ Егоровъ Анбергъ Алецсандрг Нвавовь Абраиовъ Алввсадлръ Иваиовъ Аябергь Iоганаеоъ Явовъ Алаая Барлъ Гуотавовъ Авнусъ Яаъ Гогаяовъ Аавусъ Антонъ Ьгановъ АлеыгЬевъ Нванъ Степановъ БоАиаго Тевно Яаовъ Боровчевво Алексавдръ Нвавовъ Бпрвъ Iоэепъ Явобовъ Бевдеръ Аадрссъ Крвстьдаовъ Вороввовь ВаонлlВ Вороввовь Енельаыъ В'Ьлаевъ Алем4o Мвхайловъ Бвргеръ Барлъ Петровъ Борманъ Бовотавтвнъ Явановъ Борхертъ Георпй Алеиавдровъ Врутуеъ Iогавъ ЫатвЪевъ Брутуоъ Бовлгавтваъ Нмиовъ Брутуоъ Авдрей Густавовь Бабевяо АлеивЪб Еиедьавовъ Брутугь Мадвсъ Iогановъ Бабекоо Нвколаб Енелышовъ Вовдаревъ МатвЫ Авдреевъ Вальднавъ Явобъ Юрьевъ Витсуть Гансъ Тонасовъ Вельтаеъ Барлъ Явовъ ВеВдед&amp;ауыъ Гуетавъ Ганоовь Валь Тенво Тонасовъ Водькюллеръ Iоаепъ Iогацовъ Вейннавъ, Яаобъ Товопо&amp;ъ Ввхмавъ, Авгуетъ Явовъ Вявгольыъ, 51нъ Юрьепь Вврро Яаъ Яаобовъ Внлло, Iоаеаъ Гаваовъ Ввзв, Теннвоъ Мыкелеьъ Вахьнанъ, Iозелъ ]озеповъ Ввламъ, Яаъ IоBевовъ Весов Тоиавъ Мвlкелевъ Ввльбвргь Тевао Явобовъ Влравъ Юганъ Югавовъ Ввнбергъ Гансъ Юрьевъ Вабъ Кардъ Явовъ Вндерыанъ Барлъ Яаовъ Васвльевъ АлавоЬй Васвльввъ Ваоыьевъ Ывхавл» Фнлвпповъ Воронввъ I'авргвлъ Авдрмвъ Вял да Гансъ Ганеовъ Вахтеръ Мартвлъ Явовъ Вуукъ Барлъ Гуотавовъ Ввпвавъ Рейаъ Явовъ Избирательный денз-ь, Нааваше отд*Ь||еннгlго отъ яыэной земли участкАТ, Редлвхсау Й 6 ПоФраавсгофъ Буэелья iö VI вн. Бохдоферъ Тозепъ Блавсъ Jö 22 и 23 Гавеъ Арро Jft 20i_ Явобъ Аатъ Абранъ Абраиовъ tä 39^_ }&amp; IV вн. Пальыоъ Лаусна, ан. Меттвпэ ЮлlеЕl'офъ, вы. Фональ Пестъ Арро, uu. Еерро Петергофъ, ни, Ладвгферъ Сввадн № 2, tau. ЧудлеЙп, Рад, в». Ухе М 24, не. Iевв loaißüCTajb № НО тохе Кк 172 тоже ЛЬ 104^. тоже 169 тоже Jä 33 тоге ЛЬ 22Б тохо 139 тоже Ла 102 тозе й 68 .в öS Буоавье Нарва Ли 98б_ тоже ЛЬ 15G портъ Нарва ЛЬ 96] 38 тохе N 96 138 Бувавье Нарва 69 Буаавъо Нарва ЛЬ IЬЗ^_ Порть Нарва N 85 тоже ЛЬ 61 тв&amp;е ЛЬ 193 Бувавье Нарва № 139|&gt;_ тоже ЛЬ 139^ Порть Нарва ЛЬ 125 Тевно Бойвлаю ЛЬ 18, иж. Пальиоъ Валла Bapsi, ус. Родевэль Пвнда, ус. Родбвиь Вогсава М 67. ян. Ухе Воггава ЛЬ 71, в». Ухе Баттавъ, вн. Террбферъ Iоахвнвталь № 230 |Шмецве Ха 1 Луга ЛЬ I в 2 Буиаиьи Нарви № 58 |llуоанье Нарва Jü 1 S B^_ Порть Нарва № 17^ Купавье Нарва ЛЬ 73»/Шо тиае ЛЬ 211 Исртъ Нарва № 169 тоае ЛЬ 177 тоже № 165 Купавье Нарва'ЛЬ 223 Вальднаиа Юганъ Эрна ЛЬ 5 I Барлъ Вальтасъ ЛЬ 16 Мало-Пеллу Тево Валь 41 Iогеоъ Вольввиеръ Хз 13 ЛЬ 3 в 9, вн. Иальыеъ ЛЬ 15, вн. Пильнеъ ЛЬ 24, вн. Пальнсъ Коплв, вн, Ватоль в Уввувсъ | Свллаотоа, вн. Гульель Кубкя, Jöi 1, вы. Гуль&amp;ль Imotöu ДЬ 111 ( вн. Увдель Катко, ЛЬ 29, au. Увдель Ульрвютал. в Лвыеив, вы. Каопель Аррокюдь, вн. Адднналь Казнко, ни. Раггаферъ Нерекюлавееии Л 3, вы.Ннвисъ j Оллвваре, вн. Керро Ьахаывталь й 132 тоже ЛЬ 134 тоже № 171 |тоже ЛЬ 106 ЛЬ 108 тоге ЛЬ 184 , тоже Jft тож« ЛЬ 137 [oaiBHOTUb ЛЬ 226 510,16 I 1711, БО 940 1106 111,80 311,80 223,20 324,60 227,50 161 83,40) 19&amp;J iib! Фамшпя, имя и отчество. Вальтеръ, Югавъ Ялобовъ Вайно Автоаъ BifiKb Гааеъ Егоровъ Вейдврпас-ь Явобъ Яаобовъ Ввльденау Гогажнееъ Фрвдрпховъ Воосъ Юррв Iогавовъ Ваонльевъ Bacuiä Пвтровъ Ведаиъ Аданъ Явовъ Вааверъ Янобъ Мвртыновъ Вавиатоа Явъ Ялобовъ Вас&amp;льевъ Федоръ Ваеадьевъ Вакыаиъ Авгувго Фрвдрвховъ ВЪтровъ Хорвтовъ Нжвнфоровъ Вшь Ививъ Петровъ й'утиааъ Ввлыельнъ Юрьевъ Грвнъ Владанвръ Авгуоговнть ГрЪшъ Ceprfci Давваовъ Грюнбвргь Эдуараъ Ге&amp;говъ Гольдвагь Гуотавъ Оиыовъ Гюбверъ Янъ Ганеовъ Гауневюрфъ Густавъ Адаыовъ Гаузендорфъ Карлъ Адановъ Горяъ Тевнвоовъ Гарнанвъ Югавъ Барловъ Гвадебергь Гуотавъ Эдуардовъ Гунгъ Юрlй Петровъ Гердверъ Мнзавлъ Егоровъ Грагорьевъ Вгоръ Трвгорьевъ Грудаввъ АлеыЬЙ Савельевъ Гордаковъ Мнровъ Твхавовъ Гаяоыавъ Гавоъ Марювъ Гаввуоъ Дашыь Юрьевъ Галапоаъ Сеневъ Ваввльевъ Гавъ Адольфъ Федороввчъ Горшшовъ Артешй Андреевъ Годьцъ Авгуотъ Федоровъ Гершельманъ [огавиеоъ Леопозьдовъ Гршатиль Ивааъ Еуэьнвчъ Герноытъ Наишъ Сижвновачъ Голубевъ Федоръ Ваеяльевъ Гольдъ Фрвдрвгь Августовъ Гавсовъ Алевшндръ Ыартовъ Гвшllувъ Андрей Явобовъ Даапу Явъ Ююновъ Дадвв ЮрЛ Явовъ Депо Вольдецарь Нвколаевнть Дупаеъ Эрнстъ Виокльевъ Доаумнъ Мавовнъ Петровъ Даваль Внллеиъ Буотавъ Лвдво Степанъ Антововъ Даугву Якобовъ Яковлевъ EiTH Ывхабль Павловъ Баровъ-Жврархъ-де Сукаитонъ &amp;тьенъ Артуровнчъ Зоннеръ Эдуардъ Югавовъ Зеелвбъ Танель Тлма&amp;овъ Зиьберглебгъ Алоксаадръ Мартовъ ЗвльБергде&amp;гь Гавсъ Мартовъ Захаровъ Тарасъ Захаровъ Звонвовъ Навелъ Ивановъ Знеовьевъ Алекеаадръ Днатрlевнчг Зкошеовъ Вгоръ Авдреевъ Изопъ Гернаыъ Iозеиовъ Ивовъ Магву&lt;ть Гнндрнковъ Вллавъ Явъ Даввдовъ Йльввеь Азюыъ Иванова Нвааовъ Нетръ Вааильевъ Ивановъ Алекеаадръ йввновъ Яювъ Нвановъ Иэбирательннй цензъ, Иазванlе отд-кленнаго отъ мызной земли участка. тоже ЛЬ 38 tose ЛЬ 165 тоже ЛЬ 11&amp;а_ тоже ЛЬ 1391 U 17, вн. Ьве Порть Нарва ЛЬ тоже ЛЬ 212 тоже ЛЬ 206 Купавье Нарва ЛЬ 217^_ Порть Нарва ЛЬ 200 тоже № 141 Буианье Нарва ЛЬ Порть Нарва ЛЬ 68 Буааыье Нарва Лг 212 Ккниельвгофъ вн. Фональ Моортяль, вы. Шломъ ВезенКристельгофъ ЛЬ VI. Явъ Штейвбергъ ЛЬ VII. Mapia Вевдрвяь ЛЬ Ш. Ячъ Габверъ Гуотавъ в Барлъ Гаузбвдорфъ Якъ Гораъ J6 19 5_ ЛЬ 20, вн. Ныьмсъ Аеовтвнеагофъ, вн. Ававдусъ Уле {оаынсталь ЛЬ 8 тоже ЛЬ 72. 73 в 74 тоже JA 159 тоге ЛЬ 180 ± тоже М 36 тоае ЛЬ 214 I тоже J&amp; 20 в 18 | tt 27, 28 в 29 |lоахннотадь № 148 Поргь Нарва № 88 Буаавье Нарва ЛЬ 11 Порть Нарва № 51 I тоже ЛЬ 16 I ЛЬ 64 в. купанье Нарва ЛЬ 192 » Порть Нирва ЛЬ 246 Фердвнандсгофъ Порть Нарва ЛЬ 172 Купавье Нарва JÜ """"V""""» тоже №221 Нортъ Нарва Jü Iв/«1 в /« Koito № 24, вн. У вдоль Сено, вн. Гульедь Ш!Ь 16 в 17, uil Пальнсъ Нллунегв, в». Эррнналь }õ 25, вн. Iевв loBXBHCTUb 49^_ Тоже ЛЬ 216 Купавье Нарва ЛЬ 132/194 Купааье Нарва ЛЬ 171|209 Блвхеръ, вы. Вувда Энуардъ ЛЬ 3 ЛЬ VII вн, Нальыцъ Арро I, вн. Рипюль IloaißHflTUb ЛЬ 120 ЛЬ 122 Порть Нарва ЛЬ 44^_ |Вуиааье Нарва № 78 Нортъ Нарва ЛЬ 167 I Буианье Нарва № 153&amp;_ Ауга Jft 11 ЛЬ 7в_, 8»_, вн, Пальноъ ЛЬ 14 ни. Пильноъ Иллаву ЛЬ 8, ув. Родеваль IoaiBHCTOJH ЛЬ 81 Тоае Jft 183 Гоже № 80 Порть Нарва ЛЬ Б9 ЛЬ 46». Количество въ участка земди.",ukrainian,ukrainian-koi8_r
livzeitung,livzeitung18560924.2.9,ЧАСТЬ ОФФИЦИАЛЬНАЯ. Отделъ местный. Officieller Theil. Locale Abtheilung.,english,english
livzeitung,livzeitung18930514.2.8,"ilma et ärawidamiseks tarwis oleks, üle luiteta piire, ehk üle uulitsa, lufttec j. n. t. ЭДл. s 2) Paks roojus, mis masina läbi wäljapumbatud ei wöi saada, peab kindlas, käanedegä kaetud aga turbamulläga ehk muu asjadega, mis tema haisu kautawad, faam. fM Tähendus. Niisugune desinsitseerimine peab ka tähenduses § 1 juure nimetatud korrädel ette ivöetama, kui päks roorüs tahetakse äjählatside töäetamiseks ' ' * ' 'i Ф.+Ъ 3) On kangeste selle üle walwata. et asjad, mis peldikude rookimist pumpade läbi raskemaks teewad, nagu pühkmed, ehitamise prügi, kiwi ja klaasi-nöu-kiltud, liiw, kiivid, nartsud, mitte peldikude sisse ei jaa wisatud. 4) Maja omanikud on sunnitud, röokM'laSft, --fxti nende kastid, tonnid ehk kaewud (haukud) kuni kölmandämaosani täidetud on/ Tühjendamine peab iga kord töielik olema ja ön seepärast roojus Mi kasti ehk Haugu ehk tonni põhjani wälja wotta. '' - 5) Tahawad maja-omanikud rookimist linna rookimise asutuse läbi laske toimetada, siis on neil selle üle sellele, keha linna wDtsMekS' 'siimetafy ' teadM anda; keige hildamalt 8 pääwa sees peab siis röÄtWüe MhiMa.? """" 6) Rookimine masinaga wöib igal pääwa-jaöö-ajal sundida. Paksu roojuse ärawidamine peab suwel: öösel kella Mi kella 4., tällvel: Vösel kella 11 kuni kella 6 sündima. f - м f ц,.., : 7) Kõik peldikude rookimise juures pruugitawad masinad, kummi-kolid (torud), wankred j. n e. peawad alati heas prüüKtalvüs TötraS ' olema, tet Mnide ehk kastide ja roojuse kaewude tühjendamine woimalt ilma lähata (haisuta) sündida wöiks. 8) Kes ülemal tähendatud seadluste wastu teeb, langeb trahwi seaduse põhjusel wastutamise alla. 9) Selle seadluse täitmine algab selle päewaga, millel ta kuulutatud saab. v ' , № 558. 1",estonian,estonian
livzeitung,livzeitung18990924.2.3,"Ro stnanzministrijas. Ns 1896. gada SV. aprilk Wisäugstaki apstiprinatü Walstspadomes uolehmuma pamata, preeksch 1887. gada mustem SS rubl., 10 rubt. j im S TIIW. walstS OrevitbGetu pahrmainistchanas, kuras islaistaS uf Wisaugstakä ukasa no LK. maija 1888. gada pamata, par pehdejo ter- ! min« UPteiftd 1§99 igob« dezembra m. 31. deena. I Pehz scha termina notezefehanaS, 1887. gada mnftnra kredit- ! biietes, mineta wehrtiba, pee krvna maVfafehanäm netiks preti- ; nemtaS un nebuhs obtigatorislaS leetoschanai starp priwat- &gt; persona«. ! Kreditbiietti.? S rutt., 10 rutt. un SV rubl. wehrtibä, kuru pahrmainii schana un leetvschana nobeidsäs ar 1899. gada 31. dezembri, ir fehahdas ? pästWchanaS fkhmes: loitetu preePfchejaS pufeS fkhmejnms ir drukats beesä silS krahsä, j ttf gaischi-Hruhna pamata. ! Jslaidvma gads ir ulssthmetS biketu preekschejäs puseS apakschä: us ! b rubl. bilettm (isl. ne wchlak ka 1894. g.) pa kreist, bei us 10 rutt. (isl. ne j! wchlak ka 1802. g.) un ZV rutt. biletöm (isl. wisaS 1887. g.) bileteS widü. Btketes oträ puse ir sihmejums ar WalstSehrgli widü, leelu skaitli | pa kreist un iswilkumu is Manifesta — pa labi, pee kam schi puse ir drukata: K «cht. bilNdm filä krahsä, t 10 „ „ sarkanä krahsä, I 26 „ M litt krahsä. §",latvian,latvian


In [46]:
# save sampled example for the rmd display
write.csv(file = "data/langs_samples.csv", langs_samples)

##### Some more cleaning for the languages output & joining with metadata

In [47]:
str(langs)

'data.frame':	223330 obs. of  5 variables:
 $ X         : int  1 2 3 4 5 6 7 8 9 10 ...
 $ section_id: chr  "ekmteataja18530105.2.1" "ekmteataja18530105.2.2" "ekmteataja18530105.2.3" "ekmteataja18530105.2.4" ...
 $ lang      : chr  "german" "russian-iso8859_5" "german" "german" ...
 $ keyid     : chr  "ekmteataja" "ekmteataja" "ekmteataja" "ekmteataja" ...
 $ lang_cln  : chr  "german" "russian" "german" "german" ...


In [48]:
metadata <- read.csv("data/prerevol_meta_sections.csv")
str(metadata)

'data.frame':	252993 obs. of  18 variables:
 $ X                                 : int  1 2 3 4 5 6 7 8 9 10 ...
 $ .id                               : int  31 31 31 31 31 31 31 31 31 31 ...
 $ docid                             : chr  "ekmteataja18530105" "ekmteataja18530105" "ekmteataja18530105" "ekmteataja18530105" ...
 $ LogicalSectionFirstPageID         : chr  "ekmteataja18530105.1.1" "ekmteataja18530105.1.1" "ekmteataja18530105.1.1" "ekmteataja18530105.1.1" ...
 $ LogicalSectionID                  : chr  "ekmteataja18530105.2.1" "ekmteataja18530105.2.2" "ekmteataja18530105.2.3" "ekmteataja18530105.2.4" ...
 $ attrs                             : int  1 2 3 4 6 7 8 9 10 11 ...
 $ LogicalSectionTitle               : chr  "Kopfleiste" "I. Отделъ общий." "I. Allgemeine Abtheilung." "II. Местный Отделъ. II. Oertliche Abtheilung." ...
 $ LogicalSectionType                : chr  "TITLE_SECTION+ILLUSTRATION" "ARTICLE" "ARTICLE" "SECTION" ...
 $ LogicalSectionViewURL             : chr  "/cg

In [49]:
meta_langs <- left_join(langs %>% select(-X), 
          metadata %>% 
              select(-X) %>% 
              mutate(section_id = LogicalSectionID),
          by = "section_id")

str(meta_langs)

'data.frame':	223330 obs. of  21 variables:
 $ section_id                        : chr  "ekmteataja18530105.2.1" "ekmteataja18530105.2.2" "ekmteataja18530105.2.3" "ekmteataja18530105.2.4" ...
 $ lang                              : chr  "german" "russian-iso8859_5" "german" "german" ...
 $ keyid                             : chr  "ekmteataja" "ekmteataja" "ekmteataja" "ekmteataja" ...
 $ lang_cln                          : chr  "german" "russian" "german" "german" ...
 $ .id                               : int  31 31 31 31 31 31 31 31 31 31 ...
 $ docid                             : chr  "ekmteataja18530105" "ekmteataja18530105" "ekmteataja18530105" "ekmteataja18530105" ...
 $ LogicalSectionFirstPageID         : chr  "ekmteataja18530105.1.1" "ekmteataja18530105.1.1" "ekmteataja18530105.1.1" "ekmteataja18530105.1.1" ...
 $ LogicalSectionID                  : chr  "ekmteataja18530105.2.1" "ekmteataja18530105.2.2" "ekmteataja18530105.2.3" "ekmteataja18530105.2.4" ...
 $ attrs              

In [51]:
# save meta w/detected languages for viz
write.csv(file = "data/prerevol_meta_langs.csv", meta_langs)