In [216]:
import pycld2
import bs4
import re
import json
import datetime

In [60]:
with open("religioussystemo00call_djvu.xml") as f:
    soup = bs4.BeautifulSoup(f, "xml")

In [150]:
# Page regions (corresponds to chapters in book)

pagerngs = {
    "Unkulunkulu": (9, 107),
    "Utikxo": (122,124),
    "Lord of heavens": (126,131),
    "Amatongo": (137, 234),
    "Dreams": (236, 260),
    "Inkosazana": (261, 264),
    "Izinyanga Zokubula": (267,382),
    "Heaven-doctors": (383, 421),
    "Abatakati": (425, 456)
}

In [161]:
def append_text(t, a, unite_char=" "):
    """If previous paragraph ends with '-', complete the last word with the new string. Otherwise,
    append it along as new line/paragraph."""
    
    if t == "":
        return a
    elif t.endswith("-"):
        return t[:-1] + a
    else:
        return t + unite_char + a

In [87]:
def get_content(region):
    "Get the text content of the xml tag."
    
    r = ""
    for par in region.find_all("PARAGRAPH"):
        if not r.endswith("-") and r != "":
            r += "\n\n"
        for ln in par.find_all("LINE"):
            lntxt = " ".join(i.get_text() for i in ln.find_all("WORD"))
            r = append_text(r, lntxt)
    return r.strip()

In [183]:
def get_split(page):
    "Find the mid-page split between columns."
    
    xmin = xmax = []
    for r in page.find_all("REGION"):
        x1,y1,x2,y2 = get_rect(r)
        xmin.append(x1)
        xmax.append(x2)
    return min(xmin) + int((max(xmax)-min(xmin))/2)
    
def get_rect(region):
    
    x1, y1, x2, y2, y3 = [int(i) for i in region.find("WORD").attrs["coords"].split(",")]
    
    for w in region.find_all("WORD"):
        wx1, wy1, wx2, wy2, wy3 = [int(i) for i in w.attrs["coords"].split(",")]
        x1 = min(x1, wx1)
        y1 = max(y1, wy1)
        x2 = max(x2, wx2)
        y2 = min(y2, wy2)
    
    return (x1, y1, x2, y2)

In [212]:
def get_lang(region):
    "Use cld2 to infer language for the text in the xml tag."
    
    reliable, txtbytes, scores = pycld2.detect(get_content(region))
    return reliable, scores[0][1]

In [209]:
def region_pos(region):
    """Find out whether the xml tag is situated is on the left column (1), right column (3)
    or goes across the mid-page split (2)."""
    
    split = get_split(region.find_parent("OBJECT"))
    x1,y1,x2,y2 = get_rect(region)
    
    if x2 <= split:
        return 1 # Left of center split
    elif x1 < split and x2 > split:
        return 2 # Across center
    elif x1 >= split:
        return 3 # Right of center

In [225]:
def is_top(region):
    "Finds out whether it's the page header."
    x1, y1, x2, y2 = get_rect(region)
    px1, py1, px2, py2 = get_rect(region.find_parent("OBJECT"))
    
    return (y1 <= py2 + 70)

In [229]:
author = "Henry Callaway"
pubdate = 1870


# Roll through chapters
for chpname, pages in pagerngs.items():
    
    text = "" # New chapter → reinitialise text
    
    # Roll through pages
    for pagenum  in range(pages[0], pages[1]+1):
        # Load the specific page
        page = soup.find("OBJECT", usemap="religioussystemo00call_%04d.djvu" % pagenum)
        
        pagetxt = []  # We'll be putting text content in there
        
        # Roll through region tags
        for r in page.find_all("REGION"):
            pos = region_pos(r)
            
            if is_top(r): continue # Ignore if we're in the header
            
            langrel, lang = get_lang(r)
            rtxt = get_content(r)
            
            # Ignore if it looks like a header, title or page number, or if it's in English
            if rtxt.isupper() or rtxt.isalpha() or (lang=="en" and langrel):
                continue
                
            # Now to adding text
            if pos == 1 and lang == "zu" and langrel: # Safe case
                pagetxt.append(get_content(r))
                
            elif pos == 1 and lang == 'zu' and not langrel: # Uncertain language call
                print("**Uncertain language call on page %d (IsiZulu)**" % pagenum)
                print("\t>> p=%d, lang='%s', rel=%s" % (pos, lang, langrel))
                print("\t%s" % get_content(r))
                pagetxt.append(get_content(r)) # We still save it
                
            elif pos == 1 and lang != 'zu': # Text is on the left column, but language seems wrong
                print("**IsiZulu expected, but different language call on page %d (%s, rel=%s)**" % (pagenum, lang, langrel))
                print("\t%s" % get_content(r))
                pagetxt.append(get_content(r)) # We still save it
                
            elif pos > 1 and lang == 'zu': # Not in left column → we don't save it
                print("**Language called is IsiZulu (rel: %s) but not left bound on page %d (ignored)**" % (langrel,pagenum))
                print("\t%s" % get_content(r))
            
        text = append_text(text, "\n\n".join(pagetxt), unite_char="\n\n") # Append this page
    
    # Save it
    fname = "southafrica_folktale_religioussystem/southafrica_folktale_religioussystem_" + chpname.replace(" ", "_").lower()
    
    # Save the content
    with open(fname + ".txt", "w") as f:
        f.write(text)
    
    # Save the metadata
    metadata = {
        "title": "Religious system of the Amazulu: " + chpname,
        "author": author,
        "date_published": str(pubdate),
        "date_retrieved": datetime.datetime.now().strftime("%Y%M%d"),
        "url": "https://archive.org/details/religioussystemo00call"
    }
    
    with open(fname + ".json", "w") as f:
        json.dump(metadata, f)

**Uncertain language call on page 11 (IsiZulu)**
	>> p=1, lang='zu', rel=False
	Ku tiwa wa turn a unwaba ; wa ti, " Hamba, lunwaba, u ye ii yokuti, Abautu ina ba nga fi." Lwa hamba unwaba, hva hamba kancinane, lwa libala end/deleiii ; lwa hamba lwa dAla umuti, o igama lawo ku ubukwebezane.^

 Wa za Unkulunkulu wa tuma intulo ngasemva kwonwaba, se lu hambile ngesikati esipambili unwaba. Ya hamba intulo, ya gijima, ya tshetsha kakulu, ngokuba Unkulunkulu e tize, " Ntulo, u fike u ti, Abantu a ba fe," Ya hamba ke intulo, ya ti, " Ngi ti, Ku tiwa, Abantu ma ba fe." Ya buya intulo, ya fika kunkulunkulu ; lwa ba unwaba lu nga ka fiki, lona lwa tuny wa kukg-ala ; lona lwa tunywa ku tiwa, ma lu yokuti, " Abantu ma ba nca fi."
**IsiZulu expected, but different language call on page 12 (un, rel=False)**
	Lwa za Iwa fika, Iwa memeza, Iwa ti, " Ku tiwa, Abantu ma ba nga fi !" Ba ti abantu ba ti, " O ! si bambe izwi lentulo ; yona i si tshelile, ya ti, * Ku tiwa, Abantu ma ba fe.* A si sa li zwa el

**IsiZulu expected, but different language call on page 29 (un, rel=False)**
	Umpengula Mbanda.
**IsiZulu expected, but different language call on page 35 (un, rel=False)**
	koMwe ukuba si nga ti ni ngoiikulunkukx ; loku si nga s' azi nokwa/ilukana kwetu naye, nezwi a si shiya nalo. I ngaloko si zifunela aniad/tlozi, ukiize si libale si nga /ilali si kcamauga ngonkulunkulu, nkuti, " Unknlunkula wa si shiya;" nokuti, " U s' enzele ni na?"
**IsiZulu expected, but different language call on page 35 (un, rel=False)**
	Sa zenzela ke amad/ilozi etu, nabanye awabo, nabanye awabo. Se si fulatelene abanye nabanye ; a ku se ko o ti, " DAlozi lakwabani." Bonke se be ti, " DAlozi lakwiti, ekutinitini, n ngi bheke.' Ku njalo ke ukuma kwetu.
**IsiZulu expected, but different language call on page 35 (un, rel=False)**
	Na kulawo 'madAlozi a si nasiniiuya ; ngoba na labo 'bantu e si ba bougayo, si bonga abantu aba te nabo b' emuka kulo 'm/ilaba, ba be nga vumi ukumuka, ba b' ala kakulu, be si kataza n

**IsiZulu expected, but different language call on page 53 (xh, rel=True)**
	Si nga sa vela elu/ilaugeni ; a s' azi lapa sa bunjwa kona. Tina bantu 'bamnyama sa vela kunye nani 'belungu. Kodwa tina 'bantu 'bamnyama ukuvela kwetu sa vela sa nikwa izinkomo namagejo okulima ngemikono nezikali zokulwa. Kwa tiwa ke, " Okuningi ; se ni ya 'kuzenzela." S' emuka ke, s' eza neno. Nina 'belungu na sala nezinto zonke ezin/Je nemiteto futi e si nga banga nayo tina.
**IsiZulu expected, but different language call on page 53 (xh, rel=True)**
	Sa si va uma si i zekelwa bobaba, be ti nabo ba i va, ba ti, kwa k^'ala kwa vela umuntu o indoda ; kwa vela emuva umfazi. Kwa ti ngemva kwa vela inkomo ; ya vela i kamba nenkunzi ; kwa ti emva injakazana, kwa ti emva kwa vela inja e induna ; kwa ti ngemva zonke ke izilwanyane ezincinane lezi, nezind/dovu, zi vela ngambili njalo.

 Kwa ti ngemva kwa vela 'libele ; li ti 'libele uba li vele li ti nya, "wa ti lo 'muntu kumfazi, " Ku 'nto o ku bona nje ke, mfazi nd

**IsiZulu expected, but different language call on page 74 (un, rel=False)**
	nsvv'e kona aba d/iluhiko kuso isivivane, amancane amatshe namakulu e ponswa kona, ku tiwa, " Sivivane saokoko, ngi ti ketsheketshe nkuhamba kalula."

 Umpengula Mbanda.
**Uncertain language call on page 75 (IsiZulu)**
	>> p=1, lang='zu', rel=False
	lunkulu nal" Ukupendula kukalangeni, wa ti, " E tslio umuntii wokiik^'ala kiibo boiike abantu, owa vezwa Utiku:;o kuk(^ala. Kepa abautu ba m bona. Utika;o wa sita kuukvJunkiilu, ka bonwaiiga iimuntu ; abantu ba bona yena TJnkulunkulu, ba ti umenzi wako konke, XJmvelinyangi, be tslio ngokuba lowo ow' enza Unkulunkulu be nga m bonanga. Ba ti ke u yena e Utikso. I loko e ngi k\v aziyo ngonkulunkulu."
**IsiZulu expected, but different language call on page 76 (un, rel=False)**
	ku ng' aziwa uma u ti ni na, e lal' end/ile, e nga lali ekaya ; kepa lima e bona umuzi a ye kuwo ; nakuba ukukuluraa kwabantu e uga kw azi, a k^vitize njalo kubantu, ba koAlwe uaia ii ti ni na.

**Language called is IsiZulu (rel: False) but not left bound on page 97 (ignored)**
	komlia amabele e uiilile, wa ti, "Ka-iiini.^* Nank' amabele," e tsho Unkulunkulu wamandulo,^^ Ukgili. TJkgili kambe Unkulunkulu ■wokuk^'ala owa puma emAlangeni, wa zala abantu.

 TJmuntu wokuk^fala u tiwa Unkulunkulu. Wa vela nomfazi ; nabanye abantu ba vela em/ilangeni emva kwake, abantu bonke bendulo. Yena owokuk^'ala e mkulu kambe, yena a zala abantu. Si tsbo tina 'bantu, si ti, " Ba zaIwa nguye yena a vela kukgala."

 Abantu bendulo a si b' azi ukuzalwa kwabo. Ba vela em/Jangeni nje ; naye Unkulunkulu wa vela

 ^* Ka-nini, Pluck, for Yika ni.

 ^^ Wamandulo. — The most ancient Unkulunkulu

 Ba kona abantu bendulo abaningi, kepa e si ti owaraandulo o ngapambili kwalabo bendulo.
**IsiZulu expected, but different language call on page 97 (xh, rel=True)**
	Ku tshiwo iimuutu ow azi kakulu ; ngaloko ke ngoku/Jakanipa kwake a ku sa tshiwo ukuti ik^'ili, se ku tiwa Uk^'ili. Owokuk(7ala ku tiwa Uk^^ili, ngo

**IsiZulu expected, but different language call on page 139 (un, rel=False)**
	A ti um' e kona osindileyo, a ti, " Mina, ngi hqahuke, ngi sinda ke ; ku be se ku tiwa nje, ma si pele sonke ; kw ale umuntu wa ba munye ; ngabe si te si kyedwa impi nje, yena owa be j)i nal Ngi kgabuke, ngi sinda ; ngi be ngi nga s' azi uma ngi za 'usinda, ngi bona abantu bonke bakwiti se be pelile."
**IsiZulu expected, but different language call on page 140 (un, rel=False)**
	I^a labo abafayo empini se be ya 'kuba a wona amadAlozi futL

 Ba ti abasindileyo ab' amadAlozi akubo e ba bhekile, ba sinde, ba ti, " Si sindiswe amadAlozi akwiti." Ba fike ba buye, be vela empini, ba fike, ba wa gwazele izinkomo ; ba bonge ukuba be ti a ba pilisile ; ba zitele ngenyongo emzimbeni, be ti, " Ma kcakcambe, a be raAlope, a nga bi mnyama," \ikuze a ba pilise ngolunye usuku fati. Ba bonge ku be kuAle.
**IsiZulu expected, but different language call on page 141 (un, rel=False)**
	ku tiwe, id/ilozi labo limnyama. Ba ze b' 

**IsiZulu expected, but different language call on page 153 (un, rel=False)**
	pata kwake e se kona, ba ku mise nokuti, *' U sa 'ku si pata kanjalo noma e file. A s' azi uma xi ya 'kubuye a bh.eke aobani ngapandAle kwetu na ; 'kupela u ya 'kubheka tina."

 Ku njalo ko noma be kuleka kwamaningi amatongo akubo, b' enza iig£inge olukulu Iwoku ba vikela ; kepa uyise u dAlulisisile ekupatweni kwamatongo amanye. Uyise 11 igiigu kakulu kubantwana bake noma e nga se ko. Ku ti labo a se be kulile be m azisisa kakulu ukuba-mnene kwake nobuk(7awe bake, Ku ti uma ku kona ubu/iluugu pakati kwomuzi, indodaua enkuki i m bonge ngezibongo zake a zi zuza umAla e Iwa empini, a wa weze ngamazibukwana ouke ; i m tetisa ngokuti, " Ku nga ze ku fe tina nje. U se u bheke 'bani? A si fe si pele, si bone uma u ya 'ungcna pi na 1 U ya 'kud/ila izintete ; ku sa yi 'kubizwa 'ndawo uma u bulale owako unuizi."
**IsiZulu expected, but different language call on page 154 (un, rel=False)**
	Ku tiwa ku kona itongo, inyo

**IsiZulu expected, but different language call on page 163 (un, rel=False)**
	fiinda ukudAla; ba tokoza en^liziyweni zabo, loku be be se be Alezi be novalo ukuti, " Umakazi. ka ku dAli nje xikud/ila, isifo sikulu 1 " Ba ba nokujabula en/tliziy weni ; ka ba pumisela emlonyeni, ba bhekana kodwa ngameAlo. Wa bu puza utshwala, wa kcela uguai, wa ti, " Banta bami, ngi shiyele ni noguai, ke ngi beme." Ba m shiyela, loku noguai e be e nga sa m bemi. Abafazi bake ba bhekana, ba mangala ukubona umuutu e se bema uguai, loku idAlozi li be li m vimbele na kuguai, e nga sa m bemi. Abafazi be pika enAliziyweni zabo, ukuti, " Elinjani id/ilozi e se li m vimbele na kuguai na ? " Ba be nokwesaba, be ti, " Isifo j a si lo itongo."
**IsiZulu expected, but different language call on page 163 (un, rel=False)**
	Wa m bema uguai, wa lala ; u te uma a lale, bwa fika ubutongo, wa lala. U ti pakati kwamasuku wa fika umfo wabo, wa ti, " Mfo wetu, konje u tize izinkomo ? u ya 'ku zi Alaba kusasa na ? " "Wa vuma 

**IsiZulu expected, but different language call on page 173 (un, rel=False)**
	Unjikiza kakcuba, Und/ilebekazizwa, Unotshehvaezitshela, kwa ku ik^-awe elikulu e namand/ila kakulu, e nomzimba onikulu ; ku isijakg-aba sendoda e lukuni ; e sukile e u dedele umAlaba.

 Kwa ti kwancolosi lapa a e konza kona, kwa fika Amazulu e ishumi e hamba e bulala lapa e timyelwe kona. Kepa a nga yi iigomteto wenkosi ; a zenzele pakati kwemizi lap' e nga tunyelwe kona, a pate kabi abantu, e dAla 'magiila nokudAla ngokuti, " Loku si abantu bakomkulu, amapandAle a ya 'kubaleka si sa vela nje. Ubani wasemapandAleni o ya 'kuya kwomkulu, a ye 'ku si mangalela ua 1 Si ya 'kuzenzela nje, si diye ngefusi letu." Nembala ke
**IsiZulu expected, but different language call on page 174 (un, rel=False)**
	Nembala kwa ti ku 'sikati wa fika, w' ezwa uiusindo wokukala e sesangweni. Wa tsliaya ngewisa lake elikulu, e ti, " U lambile ke UnodAlolamazibuko. U za 'kwesuta ke namAla,"
**IsiZulu expected, but different language

**IsiZulu expected, but different language call on page 183 (un, rel=False)**
	nembala ke ku tule, kii ti nya ekaya, ku nga bi ko unisindo \vokiikuluma ; ku kulume yena lowo 'muntu yedwa ; abantu be lalele, e knluma namad/ilozi, e ti,) " K.xihle ini, abantu be njengani nje, ukuba ui zinge ni ti lapa nga ni kcela ukud/ila ; kepa ni zinge ni fika ugokufa ngezikati zonke na 1 Kuh\e loku na ? Ai ! A ni boni ke nam/da ni /dazekile, ni nukiwe inyanga? Loku ku fanele ukuba uma ni biza ukudMa, a ngi yi 'kunr^aba. Nako ke ukud/da kwenu. Bizana ni nonke nina 'bakwiti, A ngi zi 'kutslio ukuti, ' Bani, nank' ukudAla kwako/ ngokuba ni nomoua. Kodwa wena, 'bani, o gulisa lo 'muntu, mema bonke, ni ze 'kiid/da loku 'kud/da. Uma ku uwena ngi za 'ubona pela ngalo 'muntu e ku tiwa u patwe uwe. A ng' azi ke loko e u ku bizayo. Se ngi ku nikile. Ka sinde lo 'mimtu. Ni /dangane nonke, nina 'basekutini, e na ti na ti " (e tslio e ba weza ngamazibuko e bala iibuk^^awe babo uma be sa liamba).
**IsiZulu expecte

**IsiZulu expected, but different language call on page 193 (un, rel=False)**
	sa bonisisa ka/ile njengokukf^ala, li muke ke, a zi clAle zouke izidAlo, a nga zili 'luto.

 Kepa kwabanye u vinjwa, ku ye ngako ; kwabanye a kii yi ngako ; ku y' a/duleka, lo 'muntu a fe n";okubans[wa aniatons;o iiabahanibayo ; a fe masiiiyane. I loko ke e ngi ku zwayo.
**IsiZulu expected, but different language call on page 194 (xh, rel=True)**
	k^-alwe ile 'nto njengokungati u ya fika emzini wamakolwa^

 Nga fika si nopaulu, si hamba ngoku m zuma ukuti, " Ka nga si zwa, ka nga si boni • ka kg'abvxke si ngena nje end/ilini e nga ka ziluiigisi, si bone ukuma kwake uma e nga boni 'muntu iikuba u se njani na."
**IsiZulu expected, but different language call on page 194 (un, rel=False)**
	Sa fika e lele, 'embete izingubo ezimbili — enye imnyama, enye impofu, se i guga. Wa si bona, wa lak, wa tula. Nga m vusa, nga ti, *' Vuka." Wa zibinya, e ti, " Ake w enze ka/tle ; ngi za 'iiviika. Ngi pangise ni ! Ngi pangis

**IsiZulu expected, but different language call on page 205 (xh, rel=True)**
	hlvrsLzi, aniakosika^i ke lawo. Enye ubulube ukuti iukwakwa, nomzingand/ilu, kupela kwezinyoka ezi abautu.
**IsiZulu expected, but different language call on page 205 (un, rel=False)**
	Kepa iikubonwa kwazo uma zi abantu, zi bonwa ekungeneni kwazo end/ilini ; a zi vaiui ukungena ngomnyango. Kumbe zi ngeua kii nge ko 'rauutu, z' enyuke zi y' emsamo, zi Alale kona, zi zibute. I nga li d/ili isele nempuku, i hlale nje, i ze i bonwe iimuutu, a bize abanye ; i ng' etuki ukubaleka, i ze i shiywe nje. Abanye ba ti, " A i bulawe." Abanye ba ti, " Umuntu lo 1 "
**IsiZulu expected, but different language call on page 205 (un, rel=False)**
	Uma i nena;eba o/tlangotini, a vale ow* azi ubanibani wakona owafayo, a tsho ukuti, " Ubani lo. A ni li boni ina;eba leli oAlangotini na ? " I yekwe ke. Ku lalwe.
**IsiZulu expected, but different language call on page 205 (un, rel=False)**
	Ku ti ebusuku umninimuzi a pupe ipujio uku

**IsiZulu expected, but different language call on page 218 (un, rel=False)**
	" Amanga lawo.

 Limel' u Alole amazimw etu asesi■wandiye.

 Amanga lawo.

 Asesiwandiye, I-i-i-zi — asesiwandiye.

 Amanga lawo."

 Kw' enziwa umkumbu omkulu ngapandAle kwenxiwa. Kwa gujwa, lokii se ku pelele abafazi notshwala nezintombi. Kwa za kwa kcitekwa, se li tshona, izulu se li na ; kwa yiwa ekaya emziui wakwiti, lokupela utshwala bu y' esabeka Tibuningi ; kwa dAliwa ke utshwala nenyama, kwa kcwaywa umkcwayo.

 Ku te ku se njalo kwa puma omunye o ikeAla; ku tiwa UmaAlati ibizo lake ; u t' e buya wa e tsho ukuba " Inkosi se i fikile, si kcwaya nje. Nansi lapa se i butene kona pezu kwend/du." Kwa boboswa ind/du pezulu, ukuze i buke umkcwayo. Kwa kcwaywa kwa za kwa nga ku nga sa ngokujabula okukulu, ukuba ku tiwa, " Id/ilozi lakwiti li Alangene nati namuMa ; umuzi u za 'kuma," Kwa ba njalo ke. Ukupela ke kwendaba leyo.
**IsiZulu expected, but different language call on page 219 (un, rel=False)**
	itongo

**IsiZulu expected, but different language call on page 230 (un, rel=False)**
	Ngokuba ku tiwa, amngoili uma c nibululwa ku kalwa, lowo 'miintii ka yi 'kuluuga, uma nembala e liAla amand/Ja eruiti ; u ya 'kufa. Ku njalo ke. Kwiti ku y' esabeka ukuba inyanga i yokala emagodini ; ngaloko ku tiwa, ku bang' ukufa loko 'kwenza njalo kwenyaiiga. I loko kc ukukala cmagodiui.
**IsiZulu expected, but different language call on page 231 (un, rel=False)**
	Nengane wvna i timiila, knyo ko kvi tiwa, " Tiitiika ! " ku tshiwo iikuhambela pambili en/ilaiiAleui njalo. Ku isibonakaliso sokupila kwomuntu, nesokupatwa itongo.

 Ku njalo ke nkntiniula knbantu abamnyama ku vusa amaud/ila okuba umuntu a kumbule ukiiba itongo li ngene, li kumina. A bonge ngokutokoza okukulu, e nga n<][abazi njrako loko.

 Lapa umuntu e ti " Makosi " ek\itimuleni, ka tandi ukuti, " Baiii wakiti," ngokuba e ng' azi ukuba u mu pi o yena e mu pe loku 'kupila na ; ku ngaloko ke u ya /ilanganisa ngokuti, " Makosi, ni nga ngi fulate

**IsiZulu expected, but different language call on page 241 (un, rel=False)**
	Ba vumelane. Ivu se kusasa ba puma, ba hamba. Ku ti ekiihambeni a tslio, a ti, " Madoda, kodwa ngi bonile ekulaleni kwami, noko si ya 'uzingela, a no zingela ngobudoda. Izinyati, ngi ti, zi nolaka." Mbala, ku be njalo eku zi fumaneni kwabo ; noma zi nga bulalanga 'muntu, zi vame uku ba ponsa noma izinja. Ba ya ya knzo se be Alakanipile ngokupupa kwake ; ba ya 'kuvika futifuti.
**Uncertain language call on page 241 (IsiZulu)**
	>> p=1, lang='zu', rel=False
	Sa m bona ukuti, noko e nge si inyanga, kodwa vikupupa kwake kuAle. Futi wa e indoda e kalipayo, e nesibindi ; uma inyati i ya 'kumisa obala, lapo ku nge ko 'muti wokukwela umuntu, yena a ti, " Kwela ni emitini niua. Ngi za 'kuya, ngi ye 'kuyoka ukuze i ze kunina, si i bulale." Kodwa abantu b' aAluleke, ukuti, " U za 'kuyoka e nga hambi pezulu, e nge najubane nje"? U ya'kwenza njani na ? U ya 'kubaleka kanjani na ]" Noko a hambe a ye kuyo, a i k^^ale ngomk

**IsiZulu expected, but different language call on page 252 (un, rel=False)**
	ya kumbula lawo 'mapupo a ng' eiiza ngapambili ; in/iliziyo yami ya ti, ' Umakazi leli 'pupo lomjadu li iigi Alonze nje, uma kulungile nje iia ekaya na ? Loku nga skiya ku gula iimfazi wami, ku gul' uraame. Ini nkuba ngi pupe ipi^po e nga li pupa kukg^ala, kwa bonakala nal"

 Ba pendiila ba ti abakwiti Ompengula, ba ti, *' 0, libi ipupo lomjadu. Iii/iliziyo yako imbi ngakona ; ipupo lomjadu li fana iiepupo lokuba ku gula iimuntu. Uma u m pupa e gula kakulu, ii nga m pupa e kulupele, e fak' izinto zake zonke ezinAle, impa/ila yake ; lo 'muntu vi ba u file ; ka sindi. TJmuntu um' e gula, ku ba ku/ile u m pupe e file, e kalelwa isililo ; lo 'muntu ke u ya 'usinda ; a ka yi 'kufa."
**IsiZulu expected, but different language call on page 252 (un, rel=False)**
	O tslio njalo kumina, ku pendula Umpengula ; wa ti, *' Ehe, guaise, kodwa i 'kuba u pupe uinjadu, umjadu u 'pupo 'libi." A ti Uklas, *' O, loko, guaise, el

**IsiZulu expected, but different language call on page 272 (un, rel=False)**
	ngelelene amatambo ; ku se ku tiwa eli ngomso ilanga a li yi 'ku m sliiya. Ba mangale abantu, b' ezwa e Alaba igaiua, ba m tsbayele ke. Ba kgale ukuma isibiudi ngokuti, " Yebo ke ; manje si ya i bona in/doko."

 Ngaloko ke ngaleso 'sikati unia e se tasa, abantu balowo 'muzi ba Alupeke ngoku nga lali 'biitongo ; ngokuba umuntu ow etasayo u ya Alupa kakuhi, ngokuba ka lali, u ya sebenza kakulu ngeuAloko ; ukulala kwake u ti /ilwati nje, u ya vuka u se vuka namagama amauingi ; nemizi e seduze nowakubo i puma kona ebusuku, i zwe ukuba izwi lake se li pezulu, ba ye 'ku m vumela. Kumbe a Alabelele ku ze ku se, ku nga lalwanga. Abantu bomuzi be m tsbayela izand/ila zi ze zi be 'bu/ilungu. Lapo ke u se lingisa kweselesele pakati kwend^lu ; ind/Ju se incinane ukukccok^oma, 'esuka 'ekqa e Alabelela, e vevezela, e lingisa kwom/tlanga u pakati kwamanzi, a juluke a be 'manzi.
**IsiZulu expected, but different language ca

**IsiZulu expected, but different language call on page 284 (un, rel=False)**
	" Amanga ; ka V ezwa ; a ku puniele ingcozaua entabeni e sobala, II za 'ubuya u tshoue kule 'ntalm e sesita."

 Mbala V esiika ngoktxtsho kwetongo, wa pumela entabeni e sobala, wa haiza ; ba mu zwa bouke iikuti Ubani. " Konje, 'madoda," (lapa se be pikisana futi, kyede ba rau zwe ukuti u yena,) "konje, 'madoda, n za ngayo leyo 'ndaba e sa si pikisana ngayo, si ti, u xihldnya na?"

 Ba ti, " O, ni sa bnza ni na ? U za ngayo, uma nga nembala na kuluma iikuti, ka v' e inyanga,^^ u ii/ilanya."

 A ti umuntu omkulu wakona, lapa ekaya kulowo 'muzi, lapa i ya kona inyanga, e ti, " Nami ngi ya tsho Iikuti u u/jlanya. Ake ni tate izinto, ni yoku zi tukusa, si bone lima u ya 'ku zi kipa na."

 Ba zi tate izinto, ubuAlalu, ba yoku bu tukusa ; abanye ba tukuse amageja; abanye ba tvikuse imikonto ; abanye ba tukuse amasongo ; abanye ba tukuse izinduku zabo ; abanye ba tukuse imintsha yabo ; abanye ba tukuse izipand/ila z

**IsiZulu expected, but different language call on page 294 (un, rel=False)**
	kwiti, ku Iniige. Ngokiiba tina ka si sa tsho ukuti u ya- 'kusiiida. Ngokuba inyanga eya nukwa umiigane wako, s' etemba ezin/tliziy weni zetu, sa jabula, sa ti, " Loku ku tsho ibuda, li si tsliela inyanga yoku m siza, n se ya 'kusizeka, a pile.' Sa ya kuleyo 'nyanga e tshiwo umngane wako ; sa bona nanku nkiifa ku dMule, ku bhekise panibili ; sa kgala ukumangala, ukuti, ' Yeka ! ' Loku si be se s' etemba, si mi 'sibindi, si ti, * M/ilaumbe u ya 'kupila, loku se ku tsho ibuda, li tsho njalo.' " Ba ti, " Se si wa tsho nje la wo 'mazwi, ngokuba kukf^ala e kulunywe u we ; wa u bona uma sa ka sa ya kwelinye ibuda. Uma lawo 'mazwi u be u nga wa tshougo ukuti, sa ka sa ya kwelinye ibuda, si be si nga yi 'kvi wa kuluma ; se si wa kuluma ngokuba nawe u se u wa bonile."
**IsiZulu expected, but different language call on page 294 (un, rel=False)**
	Li ti, " Tshaya ni, ngi ni tshele umuti o ya 'ku m siza, a pile."

 Ba t

**IsiZulu expected, but different language call on page 304 (un, rel=False)**
	Ba ti, " Nkosi, ka si ze nalnto. TJma u m sizile, u ya 'kuziketela ekaya iziukomo o zi tandayo."
**IsiZulu expected, but different language call on page 304 (un, rel=False)**
	Ya ti, " Ni zoku ngi kipa ngani ekaya lapa na ] "

 Ba ti, "Nkosi, si zoku ku kipa. Into yoku ku kipa i sekaya — imbuzi."

 Ya ti, " Ni be ni ng' eza 'ku ngi tata ngembiizi na, lo 'muntu o ngi ya 'ku m siza njalo na ] "

 Ba ti, " 0, 'mngane, u nga zikatazi ngokukuluma ; nenkomo i sekaya yoku ku tata. Si tsho, kona ibuda li tshilo nje, si ti tina ku za wa m siza, ngokuba u ya gula kakulu."

 Ya ti, " Mina ngi ya 'ku m siza, loku ku tsho ibuda, la ti, woza ni kumina." I buze kubona, i ti, " I te leyo 'nyanga, ngi ya 'ku m siza ngamuti muni na 1 "

 Ba ti, " O, 'mngane, i te, u ya 'ku m siza ngekambi ; kw' and' ukuba u m ncindise, u m gcabe.
**IsiZulu expected, but different language call on page 305 (un, rel=False)**
	I te, II ya 'kupil

**IsiZulu expected, but different language call on page 315 (un, rel=False)**
	za 'like ngi bone. Loku ka pete 'iicluku, ukuba ugongolo olungaka u za 'u Iw enza njani na 1 A lu z' 'ii mu d/tla ini 1 " Wa faka isa-
**IsiZulu expected, but different language call on page 317 (un, rel=False)**
	wa si kipa, wa k' elulcla kuyo ; y' etuka, y' emis' ikanda, ya tshoba i fuua vikubaleka. Kepa isandAla sake sa ba loku si i landela njalo emtini, i buye, Ngi ti, i za 'ugalela en/Joko, a tambe, i ng' eiizi 'Into ; a buye a pakaruise isand/ila ; ya za ya tamba, ya beka in/iloko esandAleni, i nga i beki ngakiilwa, i se i beka ngokuzetvila kanyekanye esand/tleni sake, se i zila/ila ukuba 'enze a ku tandayo. Wa i bamba in/tloko, wa i faka emlonyeni, wa i Mofoza ngamazinyo ; amazinyo ayo 'apukela emlonyeni wake ; wa wa kumula lapa e se i bulele, a kwa ba 'ndaba zaluto ; kwa nga ti u kumula ameva nje ; ka dMa 'mnti iikuze ku pele isi/ilungu ; kwa ukupela.
**IsiZulu expected, but different language call o

**IsiZulu expected, but different language call on page 330 (xh, rel=True)**
	'nyanga ya i dAla impepo." I leyo ke e tshiwoyo abantu benyanga.

 I yona le 'mpepo e si i bonayo ; kodwa leyo 'mpepo e si i tsboko, a si tsho ukuti umuntu a nga i d/ila ngokuba ku tiwa i kcakcambisa izinyanga, naye a be se u ba inyanga. Kg-a; i nge m enze i yodwa ukuba iiiyanga, kii nge ko dkw ngapakati oku nga Alangana nempepo, ku m kcakcambise.
**IsiZulu expected, but different language call on page 331 (un, rel=False)**
	Ku nga ku kona ubukgili obukulu enyangeni, ngokuba lapa i bulako i ti, *' Tsbaya ni, ngi zwe uma ni ze ugani." Ba tsliaye abantu.

 I ti, " Into inye e ni ze ngayo." Ba ti k^^oto ukutshaya. I linge ukukginisela kuloko e ku tsboyo, i ti, " Tskaya ni." Ba piude ba k^/otoze njengokukg-ala.
**IsiZulu expected, but different language call on page 332 (un, rel=False)**
	I pume kuloko e b' i ku tsho, i bone ukuti, ** Kg-a, ba ya pika ; ngi y' ecluka." I hambe se i Alan/ilata i ze i fike lapo b' 

**IsiZulu expected, but different language call on page 345 (un, rel=False)**
	ngulo, i beke noxna ukamba pezu kwosungiilo, 111 nga za Iwa wa. Ku tiwa umlingo lowo.

 Nga ka nga bona nami, Ku fakwe amatambo entanjeni, Ku tiwa umabukula loko. Nga bona inyanga i w' enze njalo ke amatambo : i "wa fake entanjeni, y eza kwiti, i zokubulela iibaba. Ya k^'ala, ya tshanela jiansi, ya liingisa ibala elibanzi ; ya wa pata ezand/ileni, ya wa kajukuza, i wa bonga nganiagama, ya ti, " Ngi za ke ngi zwe ke, bu/iluza-bonungu ! mabala-maji ! " Ya wa falagaAla pansi, a bekelela udwendwe, 'emi em/ikxbeni, a komba kuyo esinyeni. Ya se i wa Alazulela ukuti, " Amatambo a ti, isifo si sesinyeni." Ba se b' azi ngaloku ukuti umsizi, isifo esi /ilala esinyeni.
**IsiZulu expected, but different language call on page 346 (un, rel=False)**
	Ku kona knbantn abamnyama into e ukubula ngapakati kwomuntu. Ku ti unia ku la/ileke into e igugu, i funwe masinyane ukuze i tolwe ; ku ti ngokwepuza uku i tola, ku be i lowo a

**IsiZulu expected, but different language call on page 360 (un, rel=False)**
	\;kuti umd/ilebc nembiiya nezinto ezinye ezibulalayo, "vva zi Alanganisa aiegade lomtondo wake, wa tiinga izingcaba, wa zi mbela eziko ngapansi kwomlilo, ukuze ku ti ngesikati lapa owesifazana e piswa ixmtondo, a ti lapa e ti ka tunde, ku be bu/ilungu esinyeni, ku tsliise. Wa m bulala ngaloko. Bala ngemva kwaloko wa be 'ya tata isisu, sa d/ilula. Kepa tina 'milozi si namand/ila ukuya 'ku ku mbulula loko. Si nga ya si ku tabate, si buye nako, ni ku bone ngarae/ilo eiiu. A si naraandAla okuti, 'Hamba, u ye enyaugeni ngokwelapa, i bozise loko.' Z' a/iluleka zonke. Ku ya 'kuya tina 'milozi. Si ya 'kuhamba ngomso. Nam/da nje si katele. Si se za 'upumula."
**IsiZulu expected, but different language call on page 360 (un, rel=False)**
	Kwa vela nabanye aba bulawa kauye naye, ba ti, " Nati, makosi, ni y' azi ukuba sa s' ake 'ndawo aiye, s' aleka kvilowo 'muntu."
**IsiZulu expected, but different language call on page

**IsiZulu expected, but different language call on page 369 (un, rel=False)**
	I si tungele okwayo, iikuza 'kutabata inkomo yetu. A si ku boni ukumbululwa kwetii ; si fela pezu kwako. Kii ze ku be namuAla, u ya felwa Umantshayo."
**IsiZulu expected, but different language call on page 369 (un, rel=False)**
	Nondayeni ka tolanga 'sikala sokupuraula ; kwa ba i loku wa gula, wa za wa fa, ku iige ko 'iiyanga nanye e m sizayo, z' aAluleka zonke. W eza wa dAlala ngomkababa lo o nge nanyanga ; z' a/iluleka zonke. Nabo bakondayeni ba kala ngakukala kunye nati.

 TJmpengula Mbanda.
**IsiZulu expected, but different language call on page 369 (un, rel=False)**
	Nga ka nga ya kuwo umlozi, ngi ya 'kubula umfana wakwetu, e gula, e nesifo, e kg'uleka. Sa mangala nobaba nomfo wetu naomame uma isifo sini lesi, loku e kade e nge naso lesi *sifo. Si ya si kg-abuka esokuba si zwiwe. Sa hamba, sa fika kuwo umlozi. Sa kiileka, sa ti, " E, mngane j indab' ezinAla" Sa Alala. Ya ti, " Sa ni bona." Sa vuma, sa 

**IsiZulu expected, but different language call on page 377 (un, rel=False)**
	bulala umfana lowo nje, li ti, ' A ku pume umvizi.' Impongo leyo emAlope ni ya 'ku i /ilabela unyokokulu, o yena 'ala naye umfaua lowo um' a fe, ngokuba yena uyi/ilomkiilu II be tsliele ukuba a m bulale, a fe, a la/ilwe ngokukayi/ilomkulu. Ngi ya ni tshela loko ke uma ni dele. Ngi ni tsliela, ukuze ku ti loku 'kufa ku nga buyela, ni ze ni ze kumina, ni zoku i tata imali yenu. Mina ngi ti, ngi ni tsliela nje ukuba leso 'sifo s' enziwa id/Jozi, ngokuba li ti, * A ku pume umuzi.' "

 Ya tslio kitina, ya ti, " Se ngi ni bulele ; leti ni imali yami ke."

 Sa i veza imali.

 Ya ti ke kumnikaziyo, ya ti, " Tabata ke ; nansi imali."

 Ya ti, " Ngi i tata nje imali yenu le. Ni ya 'kubuya, ni zoku i tabata, si nga buyela leso 'sifo. Ngi ti, a si sa yi 'kubuyela."

 Umnikaziyo wa Alala pakati kwend/ilu ngesikati sasemini lapa si bula ; ngokuba ka i namandAla okubamba yodwa uma i ya 'kubula ; ku hamba umnikaziyo. Ngokub

**IsiZulu expected, but different language call on page 392 (un, rel=False)**
	e lu pete wa lu kumiila esikwameni sake ; nga bona nembala, nga tsho iikuti, " Hau ! olwenyoni esabekayo." Wa ngi bonisa netambo layo ; la fana netambo li fakwe umtanjana omuncinyane wegazi nomtsliwana o Alangana nompofana ; nga bona imitshwe eminingi etanjeni layo, nga ti, "Nembala." I loko ke e nga ku zwa ngaleyo 'ndaba. Kwa pela ngaloko ke, e nga zibonela kona ngawami ameh\o.

 Izinyanga zokwalusa si kuluma iigomfanekiso, ngokiiba umuntii owalusa izinkomo u nezikali neg^okwe lemvula. Sa tata lelo 'gama lomalusi wezinkomo, si biza omelana nonyazi, ngoknba uma e lu tiba u ya memeza njengomfana weziukomo ; yena uma e ngena esibayeni nezikali zake, a tule nje, zi nge puma izinkomo ; kepa ngokuAlo/ila ikwelo, izinkomo zi y' ezwa iikuba n ti nga z' aluka, iiknti a zi pume esibayeni. Na lowo 'malusi owalusa nnyazi w enza njeugalowo wezinkomo; w enza njalo ke ngoku/JoAla ikwelo ; a ti, '' Tsliui-i-i. Hamba, u ye 

**IsiZulu expected, but different language call on page 404 (un, rel=False)**
	puma s' azi ke ukuba li bu gcinile ubusika, se li landa i/ilobo ; nenibala li ye li hambela ku ze ku ti ukukula kwe/tlobo li iigene end/ilini yase/tlobo iziusukwana, li pume njalo.
**IsiZulu expected, but different language call on page 404 (un, rel=False)**
	Inyanga ukutwasa kwayo si ti i twasile inyanga ngokuba si i bona entshonalanga. Kwa ku tiwa inyanga i fa nya ; kanti a ku njalo ; i dAliwa izinsuku, i ye i ncipa, i ze i be ngangozipo uje enie/ilweni ; lapo ke se i tatwa ilanga ; li i fumana empumalanga, li hambe nayo, li ze li i shiye entslionalaiiga, i bonwe lapa ku kgala ukuti zibe uku/ilwa, ku tiwe i twasile inyanga ; i ye i kula ; i ze i fulatele enzansi, si ti inyanga se i bheka enzansi, i ye i Alangane ukutshona kwelanga, i ze i selwe ; i buye i ncipe futi, i ze i fe.
**IsiZulu expected, but different language call on page 404 (xh, rel=True)**
	Izinkanyezi a si tslio ukuba zi ya hamba njengelanga

**IsiZulu expected, but different language call on page 414 (rw, rel=True)**
	u /ilangauise nemiuye ke imiti ; amagama ayo a ngi w' azi. I leyo ke e ngi y aziyo imiti yezulu.
**IsiZulu expected, but different language call on page 414 (xh, rel=True)**
	Ku ti inyanga ey alusa izulu ngam/ila i d/ila imifino yonyaka
**IsiZulu expected, but different language call on page 415 (un, rel=False)**
	omiitsha, Icii tiwe i y' csliwama, ku zilwe ku nga setslienzwa ; abantu ba /ilalc emakaya, ba nga sebenzi. Futi ku ti uma li wisa isik(7oto, ba nga sebenzi, ba zile ngokuti, " O, nma si sebenza si banga izulu." Konke loko a kw enziwa. Noma li vungiiza umoya ngesikati sokuba se ku linywa, ku njalo futi a ku linywa, ku ya zihva njalo, ngokuti, " Uma si lima si ya zibangela. Ku/tle ukuba si zile, kona umoya ngomso u nga yi 'kufika ngamauclAla."
**IsiZulu expected, but different language call on page 415 (un, rel=False)**
	I loko ke e ngi kw aziyo ngezulu. Kepa imiti yona e patwa izinyanga miningi, emin

**IsiZulu expected, but different language call on page 433 (un, rel=False)**
	wa zibika ukuti, "Na kumi ku njalo." Kepa leyo 'nyama a ba i k^yedanga, ba ba se be bulawa na amakanda; kwa ba se ku ukungena kwokugula iijalo.

 Lokupela Aman/dwenga a ya s' azi leso 'sifo uku s' elapa. Unofi/tlela wa kqala, ukuk^/umba, isisu a sa be si sa pela ; wa ba loku 'esuti njalo. Nomndava wa ba njalo ; kwa za kwa ba hhudisa loko 'kufa.

 U te umlungu wabo, um' a bone ukuba ku njalo, abantu be za 'kufa; lokupela baningi, kwa ba /daba bonke,ukupela umlungu lowo e ku nga m Alabanga ; (kauti naye wa ka wa gula pambili ngokuya kwake kwokukr/ala, w' elatshwa; kanti u se pinda ukuya;) wa biza izinyanga zakona, za b' elapa. Kepa ekufikeni kwabo kuman/dwenga,bafikaa}ianyebenga se ko, se be file. Kepa labo abab' elapayo ba ba tshela ukuti, " Ni nga wa puzi amanzi, futi ni nga wa d/di amasi ; uma ni d/da amasi, ni ya 'kufa ezind/deleni ; a ni yi 'kutika."

 Nembala ke, lokupela ba ti be s' elatsbwa, ibunu la t

**IsiZulu expected, but different language call on page 448 (xh, rel=True)**
	ndeki ; ku ya gwiy wa, kw apnlwa izinti ebusweni bayo. Ukwapula uti ebusweni benkosi kubantu abamnyarna ukufunga okukuhi, ukuti, " U ya 'u ngi buza, uma u ng' ezwanga indaba yami."
**IsiZulu expected, but different language call on page 451 (un, rel=False)**
	shiye." Kwa ku ng* enziwa, ngokuba ku tiw;v i ya tshetsha iaipi uku m /ilaba o gubuzelisileyo, uktiti uiDakoti. Ku ngaloko ke ku be kona iudoda e m tshelayo unilisa lowo, noma xiyise, a ti, " Wena, u iiga yi ; Mala," e tslio ngasesc.

 Kepa loko kwamazulu kwa pela ; iigokuba amabuto onke a ku taiidwaiiga ukuba a gaiiwe ; kwa tiwa bouke a ba nga ganwa, iikuze ba ng' esabi. Ku be ku njalo pakati kwetu ; kwa kw esatshwa uma uniuntu e puma impi e shiya 6 gobisile. Kwa yekwa ngokuti, " O, ai ! loku abautu ba ya 'kuti, * XJmuutu o gobisileyo u y' esaba ; Ti tanda umfazi kuuobukiyawe.' " Se ku pelile manje ; a ku se ko.
**IsiZulu expected, but different languag