Skip to content
Browse files

initial Icelandic support

  • Loading branch information...
1 parent 711afc8 commit 705bbc3bae7b4fdefef2dca3611afac6e7f5cad8 @nifgraup committed Apr 16, 2012
Showing with 6 additions and 1 deletion.
  1. +6 −1 brain/stopmap.py
View
7 brain/stopmap.py
@@ -9,6 +9,8 @@
'fi': [u"olla", u"olen", u"olet", u"on", u"olemme", u"olette", u"ovat", u"ole", u"oli", u"olisi", u"olisit", u"olisin", u"olisimme", u"olisitte", u"olisivat", u"olit", u"olin", u"olimme", u"olitte", u"olivat", u"ollut", u"olleet", u"en", u"et", u"ei", u"emme", u"ette", u"eivät", u"minä", u"minun", u"minut", u"minua", u"minussa", u"minusta", u"minuun", u"minulla", u"minulta", u"minulle", u"sinä", u"sinun", u"sinut", u"sinua", u"sinussa", u"sinusta", u"sinuun", u"sinulla", u"sinulta", u"sinulle", u"hän", u"hänen", u"hänet", u"häntä", u"hänessä", u"hänestä", u"häneen", u"hänellä", u"häneltä", u"hänelle", u"me", u"meidän", u"meidät", u"meitä", u"meissä", u"meistä", u"meihin", u"meillä", u"meiltä", u"meille", u"te", u"teidän", u"teidät", u"teitä", u"teissä", u"teistä", u"teihin", u"teillä", u"teiltä", u"teille", u"he", u"heidän", u"heidät", u"heitä", u"heissä", u"heistä", u"heihin", u"heillä", u"heiltä", u"heille", u"tämä", u"tämän", u"tätä", u"tässä", u"tästä", u"tähän", u"tällä", u"tältä", u"tälle", u"tänä", u"täksi", u"tuo", u"tuon", u"tuota", u"tuossa", u"tuosta", u"tuohon", u"tuolla", u"tuolta", u"tuolle", u"tuona", u"tuoksi", u"se", u"sen", u"sitä", u"siinä", u"siitä", u"siihen", u"sillä", u"siltä", u"sille", u"sinä", u"siksi", u"nämä", u"näiden", u"näitä", u"näissä", u"näistä", u"näihin", u"näillä", u"näiltä", u"näille", u"näinä", u"näiksi", u"nuo", u"noiden", u"noita", u"noissa", u"noista", u"noihin", u"noilla", u"noilta", u"noille", u"noina", u"noiksi", u"ne", u"niiden", u"niitä", u"niissä", u"niistä", u"niihin", u"niillä", u"niiltä", u"niille", u"niinä", u"niiksi", u"kuka", u"kenen", u"kenet", u"ketä", u"kenessä", u"kenestä", u"keneen", u"kenellä", u"keneltä", u"kenelle", u"kenenä", u"keneksi", u"ketkä", u"keiden", u"ketkä", u"keitä", u"keissä", u"keistä", u"keihin", u"keillä", u"keiltä", u"keille", u"keinä", u"keiksi", u"mikä", u"minkä", u"minkä", u"mitä", u"missä", u"mistä", u"mihin", u"millä", u"miltä", u"mille", u"minä", u"miksi", u"mitkä", u"joka", u"jonka", u"jota", u"jossa", u"josta", u"johon", u"jolla", u"jolta", u"jolle", u"jona", u"joksi", u"jotka", u"joiden", u"joita", u"joissa", u"joista", u"joihin", u"joilla", u"joilta", u"joille", u"joina", u"joiksi", u"että", u"ja", u"jos", u"koska", u"kuin", u"mutta", u"niin", u"sekä", u"sillä", u"tai", u"vaan", u"vai", u"vaikka", u"kanssa", u"mukaan", u"noin", u"poikki", u"yli", u"kun", u"niin", u"nyt", u"itse",],
'fr': [u"au", u"aux", u"avec", u"ce", u"ces", u"dans", u"de", u"des", u"du", u"elle", u"en", u"et", u"eux", u"il", u"je", u"la", u"le", u"leur", u"lui", u"ma", u"mais", u"me", u"même", u"mes", u"moi", u"mon", u"ne", u"nos", u"notre", u"nous", u"on", u"ou", u"par", u"pas", u"pour", u"qu", u"que", u"qui", u"sa", u"se", u"ses", u"son", u"sur", u"ta", u"te", u"tes", u"toi", u"ton", u"tu", u"un", u"une", u"vos", u"votre", u"vous", u"c", u"d", u"j", u"l", u"à", u"m", u"n", u"s", u"t", u"y", u"été", u"étée", u"étées", u"étés", u"étant", u"suis", u"es", u"est", u"sommes", u"êtes", u"sont", u"serai", u"seras", u"sera", u"serons", u"serez", u"seront", u"serais", u"serait", u"serions", u"seriez", u"seraient", u"étais", u"était", u"étions", u"étiez", u"étaient", u"fus", u"fut", u"fûmes", u"fûtes", u"furent", u"sois", u"soit", u"soyons", u"soyez", u"soient", u"fusse", u"fusses", u"fût", u"fussions", u"fussiez", u"fussent", u"ayant", u"eu", u"eue", u"eues", u"eus", u"ai", u"as", u"avons", u"avez", u"ont", u"aurai", u"auras", u"aura", u"aurons", u"aurez", u"auront", u"aurais", u"aurait", u"aurions", u"auriez", u"auraient", u"avais", u"avait", u"avions", u"aviez", u"avaient", u"eut", u"eûmes", u"eûtes", u"eurent", u"aie", u"aies", u"ait", u"ayons", u"ayez", u"aient", u"eusse", u"eusses", u"eût", u"eussions", u"eussiez", u"eussent", u"ceci", u"celà ", u"cet", u"cette", u"ici", u"ils", u"les", u"leurs", u"quel", u"quels", u"quelle", u"quelles", u"sans", u"soi",],
'hu': [u"a", u"ahogy", u"ahol", u"aki", u"akik", u"akkor", u"alatt", u"által", u"általában", u"amely", u"amelyek", u"amelyekben", u"amelyeket", u"amelyet", u"amelynek", u"ami", u"amit", u"amolyan", u"amíg", u"amikor", u"át", u"abban", u"ahhoz", u"annak", u"arra", u"arról", u"az", u"azok", u"azon", u"azt", u"azzal", u"azért", u"aztán", u"azután", u"azonban", u"bár", u"be", u"belül", u"benne", u"cikk", u"cikkek", u"cikkeket", u"csak", u"de", u"e", u"eddig", u"egész", u"egy", u"egyes", u"egyetlen", u"egyéb", u"egyik", u"egyre", u"ekkor", u"el", u"elég", u"ellen", u"elõ", u"elõször", u"elõtt", u"elsõ", u"én", u"éppen", u"ebben", u"ehhez", u"emilyen", u"ennek", u"erre", u"ez", u"ezt", u"ezek", u"ezen", u"ezzel", u"ezért", u"és", u"fel", u"felé", u"hanem", u"hiszen", u"hogy", u"hogyan", u"igen", u"így", u"illetve", u"ill.", u"ill", u"ilyen", u"ilyenkor", u"ison", u"ismét", u"itt", u"jó", u"jól", u"jobban", u"kell", u"kellett", u"keresztül", u"keressünk", u"ki", u"kívül", u"között", u"közül", u"legalább", u"lehet", u"lehetett", u"legyen", u"lenne", u"lenni", u"lesz", u"lett", u"maga", u"magát", u"majd", u"majd", u"már", u"más", u"másik", u"meg", u"még", u"mellett", u"mert", u"mely", u"melyek", u"mi", u"mit", u"míg", u"miért", u"milyen", u"mikor", u"minden", u"mindent", u"mindenki", u"mindig", u"mint", u"mintha", u"mivel", u"most", u"nagy", u"nagyobb", u"nagyon", u"ne", u"néha", u"nekem", u"neki", u"nem", u"néhány", u"nélkül", u"nincs", u"olyan", u"ott", u"össze", u"õ", u"õk", u"õket", u"pedig", u"persze", u"rá", u"s", u"saját", u"sem", u"semmi", u"sok", u"sokat", u"sokkal", u"számára", u"szemben", u"szerint", u"szinte", u"talán", u"tehát", u"teljes", u"tovább", u"továbbá", u"több", u"úgy", u"ugyanis", u"új", u"újabb", u"újra", u"után", u"utána", u"utolsó", u"vagy", u"vagyis", u"valaki", u"valami", u"valamint", u"való", u"vagyok", u"van", u"vannak", u"volt", u"voltam", u"voltak", u"voltunk", u"vissza", u"vele", u"viszont", u"volna",],
+# frequency list from here: https://invokeit.wordpress.com/frequency-word-lists/
+ 'is': [u"ég", u"að", u"er", u"það", u"ekki", u"í", u"og", u"þú", u"við", u"á", u"hann", u"þetta", u"hvað", u"sem", u"mér", u"til", u"með", u"þér", u"en", u"fyrir", u"um", u"af", u"var", u"þig", u"mig", u"því", u"já", u"hún", u"nei", u"allt", u"þá", u"ef", u"eru", u"bara", u"ert", u"svo", u"þeir", u"þið", u"okkur", u"eftir", u"vera", u"eins", u"ertu", u"hér", u"veit", u"gera", u"lagi", u"hefur", u"nú", u"frá", u"e", u"þegar", u"hvernig", u"fara", u"honum", u"hef", u"út", u"verður", u"aftur", u"upp", u"þessu", u"vel", u"verið", u"ekkert", u"minn", u"sé", u"hver", u"svona", u"hana", u"eða", u"ykkur", u"vil", u"hverju", u"úr", u"get", u"segja", u"komdu", u"erum", u"hvar", u"aldrei", u"hafa", u"eitthvað", u"gott", u"hérna", u"maður", u"hjá", u"viltu", u"fá", u"sagði", u"þau", u"getur", u"inn", u"koma", u"okkar", u"herra", u"núna", u"þarna", u"kannski", u"hans", u"mín", u"þar", u"tala", u"þarf", u"þess", u"þeim", u"þín", u"væri", u"farðu", u"henni", u"takk", u"fer", u"líka", u"þinn", u"held", u"sjá", u"rétt", u"áfram", u"sér", u"mjög", u"verð", u"kemur", u"gert", u"vegna", u"þessi", u"enn", u"sá", u"þakka", u"saman", u"einn", u"komið", u"gæti", u"a", u"alltaf", u"kom", u"allir", u"of", u"vita", u"skal", u"enginn", u"má", u"yfir", u"farið", u"hafi", u"ætla", u"dag", u"förum", u"þær", u"heldur", u"veistu", u"hr", u"hefði", u"hingað", u"sig", u"niður", u"sama", u"mitt", u"mikið", u"átt", u"guð", u"höfum", u"láttu", u"segðu", u"pabbi", u"einhver", u"heim", u"aðeins", u"bíddu", u"áður", u"segir", u"þessa", u"finnst", u"vertu", u"getum", u"tíma", u"i", u"vildi", u"góður", u"fyrirgefðu", u"vill", u"hefurðu", u"meira", u"mamma", u"gerðu", u"satt", u"verðum", u"eitt", u"þitt", u"jæja", u"fór", u"stað", u"halda", u"taka", u"annað", u"verða", u"veist", u"ykkar", u"hvert", u"sagt", u"alla", u"voru", u"vilt", u"gerir", u"leið", u"sjáðu", u"menn", u"fram", u"séð", u"gerði", u"mun", u"láta", u"hvaða", u"kvöld", u"hvort", u"öll", u"fólk", u"ó", u"elskan", u"myndi", u"fjandinn", u"þ", u"einu", u"ao", u"ár", u"hennar", u"vinur", u"geri", u"síðan", u"hélt", u"eina", u"hættu", u"vissi", u"auðvitað", u"ætti", u"sinni", u"þeirra", u"þessum", u"þannig", u"eruð", u"halló", u"pú", u"drepa", u"mína", u"strax", u"þína", u"alveg", u"skil", u"reyna", u"án", u"langar", u"finna", u"þennan", u"neitt", u"geturðu", u"vinna", u"viss", u"öllum", u"morgun", u"undir", u"engin", u"taktu", u"hvers", u"hugsa", u"áttu", u"frú", u"hæ", u"mínum", u"gengur", u"varð", u"heyrðu", u"einmitt", u"lengi", u"kem", u"haltu", u"heldurðu", u"elska", u"hvenær", u"þangað", u"fimm", u"varst", u"fékk", u"virðist", u"segi", u"góða", u"komast", u"eigum", u"lengur", u"líður", u"vilja", u"gerðist", u"þarft", u"gaman", u"kominn", u"átti", u"ná", u"mann", u"eiga", u"jack", u"þínum", u"sæll", u"burt", u"lífi", u"èg", u"fyrsta", u"inni", u"fyrst", u"geta", u"þykir", u"hafði", u"petta", u"öllu", u"handa", u"frábært", u"betur", u"leitt", u"þurfum", u"héðan", u"ætlarðu", u"ú", u"hægt", u"illa", u"fyrr", u"hitta", u"góð", u"málið", u"nóg", u"sinn", u"alvöru", u"hjálpa", u"einhvern", u"nótt", u"r", u"jú", u"komum", u"aò", u"nema", u"ára", u"ferð", u"gegn", u"hlýtur", u"víst", u"fengið", u"sjálfur", u"mál", u"ad", u"daginn", u"ein", u"áhyggjur", u"annars", u"leita", u"hafið", u"búinn", u"à", u"pao", u"tveir", u"orðið", u"heiti", u"langt", u"haldið", u"deyja", u"ættir", u"gat", u"erfitt", u"faðir", u"líf", u"hve", u"heima", u"minni", u"máli", u"enga", u"mátt", u"engar", u"h", u"hætta", u"meðan", u"spyrja", u"aõ", u"skiptir", u"mínu", u"samt", u"john", u"heyra", u"mínútur", u"gerum", u"sýna", u"kann", u"gefa", u"tvö", u"vorum", u"tekur", u"mínir", u"maðurinn", u"fæ", u"hvern", u"fær", u"heitir", u"ætlar", u"gerast", u"ganga", u"skilurðu", u"komst", u"gangi", u"klukkan", u"fínt", u"bless", u"lítur", u"sagðir", u"tíu", u"stundum", u"tók", u"vio", u"allar", u"nokkuð", u"baka", u"uppi", u"sért", u"gerist", u"heyrt", u"alls", u"hjálp", u"skjóta", u"stendur", u"þinni", u"sex", u"g", u"líkar", u"vantar", u"látið", u"skilið", u"góðan", u"líklega", u"fann", u"allan", u"þótt", u"sérðu", u"nota", u"kona", u"færð", u"segirðu", u"þessari", u"fannst", u"ö", u"verði", u"fleiri", u"manni", u"jafnvel", u"afsakið", u"engan", u"úti", u"trúi", u"man", u"hefðir", u"þekki", u"pér", u"afsakaðu", u"lokið", u"árum", u"bílinn", u"yrði", u"tvær", u"sjáumst", u"mömmu", u"s", u"m", u"nógu", u"konan", u"daga", u"kemst", u"hví", u"hlustaðu", u"milli", u"tvo", u"tekið", u"varstu", u"hugmynd", u"tími", u"manstu", u"byrja", u"værir", u"þó", u"new", u"sú", u"fjandans", u"engu", u"búið", u"betra", u"kalla", u"bíða", u"besta", u"leyfðu", u"ættum", u"eigin", u"ha", u"undan", u"beint", u"annan", u"næstum", u"konu", u"svolítið", u"sonur", u"orð",],
'it': [u"ad", u"al", u"allo", u"ai", u"agli", u"all", u"agl", u"alla", u"alle", u"con", u"col", u"coi", u"da", u"dal", u"dallo", u"dai", u"dagli", u"dall", u"dagl", u"dalla", u"dalle", u"di", u"del", u"dello", u"dei", u"degli", u"dell", u"degl", u"della", u"delle", u"in", u"nel", u"nello", u"nei", u"negli", u"nell", u"negl", u"nella", u"nelle", u"su", u"sul", u"sullo", u"sui", u"sugli", u"sull", u"sugl", u"sulla", u"sulle", u"per", u"tra", u"contro", u"io", u"tu", u"lui", u"lei", u"noi", u"voi", u"loro", u"mio", u"mia", u"miei", u"mie", u"tuo", u"tua", u"tuoi", u"tue", u"suo", u"sua", u"suoi", u"sue", u"nostro", u"nostra", u"nostri", u"nostre", u"vostro", u"vostra", u"vostri", u"vostre", u"mi", u"ti", u"ci", u"vi", u"lo", u"la", u"li", u"le", u"gli", u"ne", u"il", u"un", u"uno", u"una", u"ma", u"ed", u"se", u"perché", u"anche", u"come", u"dov", u"dove", u"che", u"chi", u"cui", u"non", u"più", u"quale", u"quanto", u"quanti", u"quanta", u"quante", u"quello", u"quelli", u"quella", u"quelle", u"questo", u"questi", u"questa", u"queste", u"si", u"tutto", u"tutti", u"a", u"c", u"e", u"i", u"l", u"o", u"ho", u"hai", u"ha", u"abbiamo", u"avete", u"hanno", u"abbia", u"abbiate", u"abbiano", u"avrò", u"avrai", u"avrà", u"avremo", u"avrete", u"avranno", u"avrei", u"avresti", u"avrebbe", u"avremmo", u"avreste", u"avrebbero", u"avevo", u"avevi", u"aveva", u"avevamo", u"avevate", u"avevano", u"ebbi", u"avesti", u"ebbe", u"avemmo", u"aveste", u"ebbero", u"avessi", u"avesse", u"avessimo", u"avessero", u"avendo", u"avuto", u"avuta", u"avuti", u"avute", u"sono", u"sei", u"è", u"siamo", u"siete", u"sia", u"siate", u"siano", u"sarò", u"sarai", u"sarà", u"saremo", u"sarete", u"saranno", u"sarei", u"saresti", u"sarebbe", u"saremmo", u"sareste", u"sarebbero", u"ero", u"eri", u"era", u"eravamo", u"eravate", u"erano", u"fui", u"fosti", u"fu", u"fummo", u"foste", u"furono", u"fossi", u"fosse", u"fossimo", u"fossero", u"essendo", u"faccio", u"fai", u"facciamo", u"fanno", u"faccia", u"facciate", u"facciano", u"farò", u"farai", u"farà", u"faremo", u"farete", u"faranno", u"farei", u"faresti", u"farebbe", u"faremmo", u"fareste", u"farebbero", u"facevo", u"facevi", u"faceva", u"facevamo", u"facevate", u"facevano", u"feci", u"facesti", u"fece", u"facemmo", u"faceste", u"fecero", u"facessi", u"facesse", u"facessimo", u"facessero", u"facendo", u"sto", u"stai", u"sta", u"stiamo", u"stanno", u"stia", u"stiate", u"stiano", u"starò", u"starai", u"starà", u"staremo", u"starete", u"staranno", u"starei", u"staresti", u"starebbe", u"staremmo", u"stareste", u"starebbero", u"stavo", u"stavi", u"stava", u"stavamo", u"stavate", u"stavano", u"stetti", u"stesti", u"stette", u"stemmo", u"steste", u"stettero", u"stessi", u"stesse", u"stessimo", u"stessero", u"stando",],
'nl': [u"de", u"en", u"van", u"ik", u"te", u"dat", u"die", u"in", u"een", u"hij", u"het", u"niet", u"zijn", u"is", u"was", u"op", u"aan", u"met", u"als", u"voor", u"had", u"er", u"maar", u"om", u"hem", u"dan", u"zou", u"of", u"wat", u"mijn", u"men", u"dit", u"zo", u"door", u"over", u"ze", u"zich", u"bij", u"ook", u"tot", u"je", u"mij", u"uit", u"der", u"daar", u"haar", u"naar", u"heb", u"hoe", u"heeft", u"hebben", u"deze", u"u", u"want", u"nog", u"zal", u"me", u"zij", u"nu", u"ge", u"geen", u"omdat", u"iets", u"worden", u"toch", u"al", u"waren", u"veel", u"meer", u"doen", u"toen", u"moet", u"ben", u"zonder", u"kan", u"hun", u"dus", u"alles", u"onder", u"ja", u"eens", u"hier", u"wie", u"werd", u"altijd", u"doch", u"wordt", u"wezen", u"kunnen", u"ons", u"zelf", u"tegen", u"na", u"reeds", u"wil", u"kon", u"niets", u"uw", u"iemand", u"geweest", u"andere",],
'no': [u"og", u"i", u"jeg", u"det", u"at", u"en", u"et", u"den", u"til", u"er", u"som", u"på", u"de", u"med", u"han", u"av", u"ikke", u"ikkje", u"der", u"så", u"var", u"meg", u"seg", u"men", u"ett", u"har", u"om", u"vi", u"min", u"mitt", u"ha", u"hadde", u"hun", u"nå", u"over", u"da", u"ved", u"fra", u"du", u"ut", u"sin", u"dem", u"oss", u"opp", u"man", u"kan", u"hans", u"hvor", u"eller", u"hva", u"skal", u"selv", u"sjøl", u"her", u"alle", u"vil", u"bli", u"ble", u"blei", u"blitt", u"kunne", u"inn", u"når", u"være", u"kom", u"noen", u"noe", u"ville", u"dere", u"som", u"deres", u"kun", u"ja", u"etter", u"ned", u"skulle", u"denne", u"for", u"deg", u"si", u"sine", u"sitt", u"mot", u"å", u"meget", u"hvorfor", u"dette", u"disse", u"uten", u"hvordan", u"ingen", u"din", u"ditt", u"blir", u"samme", u"hvilken", u"hvilke", u"sånn", u"inni", u"mellom", u"vår", u"hver", u"hvem", u"vors", u"hvis", u"både", u"bare", u"enn", u"fordi", u"før", u"mange", u"også", u"slik", u"vært", u"være", u"båe", u"begge", u"siden", u"dykk", u"dykkar", u"dei", u"deira", u"deires", u"deim", u"di", u"då", u"eg", u"ein", u"eit", u"eitt", u"elles", u"honom", u"hjå", u"ho", u"hoe", u"henne", u"hennar", u"hennes", u"hoss", u"hossen", u"ikkje", u"ingi", u"inkje", u"korleis", u"korso", u"kva", u"kvar", u"kvarhelst", u"kven", u"kvi", u"kvifor", u"me", u"medan", u"mi", u"mine", u"mykje", u"no", u"nokon", u"noka", u"nokor", u"noko", u"nokre", u"si", u"sia", u"sidan", u"so", u"somt", u"somme", u"um", u"upp", u"vere", u"vore", u"verte", u"vort", u"varte", u"vart",],
@@ -26,6 +28,7 @@
'es': 'es_ES',
'fi': 'fi_FI',
'fr': 'fr_FR',
+ 'is': 'is_IS',
'it': 'it_IT',
'nl': 'nl_NL',
# 'no': '',
@@ -46,4 +49,6 @@
stopstems={'de': set(['andere', 'all', 'weiter', 'andern', 'dasselbe', 'selbst', 'anders', 'als', 'wirst', 'dessen', 'dazu', 'auf', 'dich', 'wen', 'demselben', 'aus', 'derselbe', 'sonst', 'hatte', 'hat', 'bin', 'musste', 'waren', 'mein', 'da', 'doch', 'einmal', 'etwa', 'du', 'bis', 'hin', 'viel', 'die', 'haben', 'ihn', 'dir', 'nur', 'sollen', 'hinter', 'welch', 'zu', 'wo', 'es', 'er', 'ohne', 'ich', 'meinen', 'werden', 'indem', 'dein', 'jede', 'denselben', 'wollen', 'dort', 'und', 'manch', 'kannst', 'nicht', 'weg', 'habe', 'auch', 'zur', 'uns', 'bist', 'ob', 'ist', 'weil', 'hier', 'einig', 'solch', 'zum', 'wie', 'aber', 'ihr', 'nach', 'gewesen', 'desselben', 'damit', 'wir', 'ihm', 'einen', 'jene', 'sind', 'oder', 'einigen', 'euer', 'dieselbe', 'was', 'von', 'sondern', 'willst', 'mich', 'nun', 'bei', 'musst', 'der', 'des', 'um', 'dann', 'dem', 'den', 'sein', 'ein', 'wieder', 'noch', 'vom', 'unter', 'gegen', 'am', 'an', 'im', 'zwischen', 'vor', 'in', 'euch', 'derer', 'also', 'sich', 'sie', 'so', 'mir', 'mit', 'durch', 'zwar', 'dies', 'sehr', 'jetzt', 'man', 'kein', 'wird', 'machen', 'unser']),
'en': set(['all', "she'll", 'just', "don't", 'being', 'over', 'both', 'four', "won't", 'during', 'go', 'still', 'its', 'before', 'now', 'also', "we've", 'less', 'had', 'should', "he'd", 'to', 'only', "here's", 'th', 'under', 'has', 'ought', 'do', 'them', 'his', 'above', 'get', 'very', "they'd", 'cannot', 'every', "you've", 'they', 'not', 'yourselves', 'one', 'him', 'nor', "we'll", 'like', 'did', "they've", "wasn't", 'she', 'each', 'further', 'through', 'where', "mustn't", "isn't", 'few', 'because', 'says', "you'd", 'doing', 'some', 'back', 'up', 'see', 'are', 'our', 'ourselves', "shan't", 'even', 'what', 'said', 'for', 'since', 'below', 'does', "shouldn't", "they'll", 'between', 'new', 'three', 'ever', 'be', 'we', "doesn't", 'never', 'however', 'here', 'let', "hadn't", "aren't", 'by', 'on', 'about', 'would', 'of', 'could', 'against', "weren't", 'or', "can't", 'first', 'this', 'own', 'into', 'yourself', 'down', 'put', 'least', "couldn't", 'old', 'your', 'second', "you're", 'long', 'from', 'her', 'their', 'there', 'two', 'been', 'why', 'whom', "we're", 'goes', 'themselves', 'was', 'until', 'more', 'himself', 'way', 'that', 'with', "didn't", 'but', 'too', 'herself', 'than', 'those', 'he', 'me', "they're", 'myself', 'made', 'these', "hasn't", 'while', "haven't", 'were', 'my', "wouldn't", 'say', "we'd", 'and', 'is', 'am', 'it', 'an', 'high', 'as', 'itself', 'at', 'have', 'in', 'seen', 'any', 'if', 'again', 'no', 'make', 'when', 'same', 'how', 'another', 'other', 'take', 'which', 'aft', 'you', 'out', 'who', 'most', 'whether', 'such', "he'll", 'a', 'off', 'i', 'many', 'well', "she'd", "you'll", 'so', 'five', 'the', 'once']),
- 'hu': set([u"által", u"jó", u"valaki", u"azonban", u"nagy", u"itt", u"volta", u"néhány", u"újra", u"olyan", u"kell", u"talán", u"továbbá", u"össze", u"lett", u"valami", u"ami", u"belül", u"számára", u"éppen", u"közül", u"de", u"persze", u"keresztül", u"néha", u"minden", u"egyes", u"volt", u"ilyenkor", u"egész", u"más", u"már", u"valamint", u"saját", u"míg", u"el", u"szemben", u"ismét", u"kívül", u"vele", u"meg", u"eddig", u"egyre", u"ez", u"ilyen", u"sem", u"így", u"jobban", u"csak", u"mely", u"emilyen", u"tovább", u"legalább", u"viszont", u"ekkor", u"be", u"ahol", u"felé", u"s", u"ill.", u"maga", u"semmi", u"vagyis", u"amíg", u"milyen", u"nélkül", u"aki", u"szerint", u"amely", u"mindenki", u"sok", u"mert", u"én", u"erre", u"át", u"és", u"azért", u"akkor", u"illetve", u"szinte", u"hogy", u"hogyan", u"amolyan", u"miért", u"új", u"van", u"fel", u"mintha", u"utolsó", u"aztán", u"teljes", u"nagyon", u"vissza", u"hiszen", u"keres", u"igen", u"mivel", u"egyetlen", u"ott", u"jól", u"általában", u"cikk", u"amikor", u"egyik", u"mindig", u"mikor", u"mellett", u"alatt", u"elég", u"való", u"ugyanis", u"még", u"tehát", u"nincs", u"az", u"bár", u"ezért", u"után", u"arra", u"mint", u"pedig", u"úgy", u"ne", u"másik", u"arról", u"ellen", u"hanem", u"most", u"nem", u"között", u"ahogy", u"rá", u"a", u"egy", u"e", u"azután", u"majd", u"ki", u"benne", u"utána", u"egyéb"])}
+ 'hu': set([u"által", u"jó", u"valaki", u"azonban", u"nagy", u"itt", u"volta", u"néhány", u"újra", u"olyan", u"kell", u"talán", u"továbbá", u"össze", u"lett", u"valami", u"ami", u"belül", u"számára", u"éppen", u"közül", u"de", u"persze", u"keresztül", u"néha", u"minden", u"egyes", u"volt", u"ilyenkor", u"egész", u"más", u"már", u"valamint", u"saját", u"míg", u"el", u"szemben", u"ismét", u"kívül", u"vele", u"meg", u"eddig", u"egyre", u"ez", u"ilyen", u"sem", u"így", u"jobban", u"csak", u"mely", u"emilyen", u"tovább", u"legalább", u"viszont", u"ekkor", u"be", u"ahol", u"felé", u"s", u"ill.", u"maga", u"semmi", u"vagyis", u"amíg", u"milyen", u"nélkül", u"aki", u"szerint", u"amely", u"mindenki", u"sok", u"mert", u"én", u"erre", u"át", u"és", u"azért", u"akkor", u"illetve", u"szinte", u"hogy", u"hogyan", u"amolyan", u"miért", u"új", u"van", u"fel", u"mintha", u"utolsó", u"aztán", u"teljes", u"nagyon", u"vissza", u"hiszen", u"keres", u"igen", u"mivel", u"egyetlen", u"ott", u"jól", u"általában", u"cikk", u"amikor", u"egyik", u"mindig", u"mikor", u"mellett", u"alatt", u"elég", u"való", u"ugyanis", u"még", u"tehát", u"nincs", u"az", u"bár", u"ezért", u"után", u"arra", u"mint", u"pedig", u"úgy", u"ne", u"másik", u"arról", u"ellen", u"hanem", u"most", u"nem", u"között", u"ahogy", u"rá", u"a", u"egy", u"e", u"azután", u"majd", u"ki", u"benne", u"utána", u"egyéb"]),
+ 'is': set([u'að', u'aðeins', u'af', u'aftur', u'aldrei', u'allir', u'allt', u'alltaf', u'áður', u'áfram', u'átt', u'bara', u'bíða', u'dagur', u'e', u'eða', u'ef', u'eftir', u'eiga', u'einhver', u'einn', u'eins', u'eitthvað', u'ekkert', u'ekki', u'en', u'enginn', u'enn', u'ertu', u'ég', u'fara', u'fá', u'fer', u'finna', u'frá', u'fyrir', u'fyrirgefa', u'förum', u'gera', u'gert', u'geta', u'gott', u'góður', u'guð', u'hafa', u'halda', u'hana', u'hann', u'hans', u'hefurðu', u'heim', u'henni', u'herra', u'hér', u'hérna', u'hingað', u'hjá', u'honum', u'hr', u'hún', u'hvar', u'hver', u'hvernig', u'inn', u'í', u'já', u'kannski', u'koma', u'kominn', u'lag', u'lagi', u'láta', u'líka', u'líkur', u'maður', u'með', u'mega', u'mér', u'mig', u'mikið', u'minn', u'mitt', u'mín', u'mjög', u'nei', u'niður', u'nú', u'núna', u'of', u'og', u'okkar', u'okkur', u'pabbi', u'rétt', u'sama', u'saman', u'sá', u'segja', u'sem', u'sig', u'sjá', u'skulu', u'svo', u'svona', u'takk', u'tala', u'til', u'tími', u'um', u'upp', u'úr', u'út', u'vegna', u'veistu', u'vel', u'velja', u'vera', u'verða', u'verð', u'við', u'viður', u'vilja', u'viltu', u'vita', u'væri', u'yfir', u'ykkur', u'það', u'þakka', u'þar', u'þarna', u'þau', u'þá', u'þegar', u'þeim', u'þeir', u'þess', u'þessa', u'þessi', u'þessu', u'þetta', u'þér', u'þið', u'þig', u'þinn', u'þín', u'þurfa', u'þú', u'því', u'þær', u'ætla',]),
+}

0 comments on commit 705bbc3

Please sign in to comment.
Something went wrong with that request. Please try again.