In [1]:
import matplotlib.pyplot as plt
%matplotlib inline
import os
import json
import pickle
from transformers import BertTokenizer
import torch
import numpy as np
import re

import warnings
warnings.filterwarnings("ignore")

from tqdm.notebook import tqdm

In [16]:
data_path = "D:/Data/neural-punctuator/szeged/"
file_path = data_path + "szeged.txt"

In [17]:
with open(file_path, 'r', encoding='utf-8') as f:
    text = f.readlines()

In [18]:
len(text), text[1]

(82100,
 ' A szállásunk egy Balaton melletti kis üdülőfaluban, Zamárdiban volt, a Postának az üdülőházában.\n')

In [19]:
from collections import OrderedDict

text = list(OrderedDict.fromkeys(text))
len(text)

80875

In [20]:
from sklearn.utils import shuffle

text = shuffle(text, random_state=0)

text[1]

' Ez jutott az eszébe önkéntelenül.\n'

In [21]:
text = [t.strip() for t in text]
text[1]

'Ez jutott az eszébe önkéntelenül.'

In [22]:
len(' '.join([t.strip() for t in text]).split(' '))

1265372

In [23]:
# tokenizer = BertTokenizer.from_pretrained('bert-base-multilingual-cased')
tokenizer = torch.hub.load('huggingface/pytorch-transformers', 'tokenizer', 'bert-base-multilingual-uncased')

Using cache found in C:\Users\gbenc/.cache\torch\hub\huggingface_pytorch-transformers_master


In [24]:
def clean_text(text):
    text = text.replace('!', '.')
    text = text.replace(':', ',')
    text = text.replace('--', ',')
    text = text.replace('-', ',')
    text = text.replace(';', '.')
    text = text.replace(' ,', ',')
    text = text.replace('♫', '')

    text = re.sub(r'--\s?--', '', text)
    text = re.sub(r'\s+', ' ', text)

    text = text.replace(' ,', ',')
    
    text = re.sub(r',\s?,', ',', text)
    
    return text.strip().lower()

In [25]:
# cleaned_text = [clean_text(t) for t in text]

# for t, tc in zip(' '.join(text).split(' ')[:100], ' '.join(cleaned_text).split(' ')):
#     print(f"{t:20}\t{tc}")

In [26]:
text = [clean_text(t) for t in text]
text[1]

'Ez jutott az eszébe önkéntelenül.'

In [27]:
tokenizer.encode(".?,")

[101, 119, 136, 117, 102]

In [28]:
len(' '.join(text).split(' '))

1248861

In [29]:
tokenized = tokenizer.tokenize(' '.join(text))

In [30]:
tokenized[:5]

['az', 'egyes', '_', 'lesz', '##allo']

In [31]:
len(tokenized)

2771074

In [32]:
text2 = tokenizer.convert_tokens_to_string(tokenized)

In [33]:
text2 = [t for t in text2.split(' ') if t not in [',', '.', '?']]
len(text2)

1332371

In [34]:
for t1, t2 in zip(' '.join(text).split(' ')[:1000], text2):
    print(f'{t1:20}{t2}')         

Az                  az
Egyes_Leszállópályánakegyes
például             _
nem                 leszallopalyanak
ez                  peldaul
volt                nem
a                   ez
neve                volt
akkoriban,          a
Angliának           neve
vagy                akkoriban
Nagy,Britanniának   anglianak
nevezték,           vagy
bár                 nagy
Londont,            britannianak
ebben               neveztek
meglehetősen        bar
bizonyos            londont
volt                ebben
Winston,            meglehetosen
mindig              bizonyos
Londonnak           volt
hívták.             winston
Ez                  mindig
jutott              londonnak
az                  hivtak
eszébe              ez
önkéntelenül.       jutott
Könyvtár            az
megosztása          eszebe
közben              onkentelenul
(                   konyvtar
a                   megosztasa
tulajdonságlap      kozben
Sharing,            (
Megosztás           a
fülén               tulajdonsa

haza,               es
hogy                novekedeshordozo
gyorsabban          szegmenserol
haladjanak,         a
vagy                neuer
akik                _
rendszergazdaként   marktrol
az                  jelentette
otthoni             be
gépről              penteken
távfelügyeleti      a
pillantást          tozsdet
szeretnének         mukodteto
vetni               deutsche
rendszerük          _
valamely            borse
elemére.            _
A                   ag
napokban            az
utaznak.            uj
Az                  szabalyozas
AOL                 2001
az                  oktober
elmúlt              1
év                  jen
karácsonyát         lep
megelőző            eletbe
időszakban          hiszen
2,5_milliárd        ma
dolláros            az
forgalmat           otthonukban
bonyolított.        szamitogepet
Hasonló             mukodtetok
mértékben           nagy
1,25                resze
százalékra          mar
csökkent            nem
a                   azoknak

In [59]:
id2target = {-1: 0,
              119: 1, # .
              136: 2, # ?
              117: 3,  # ,
              -2: -1, # will be masked
             }
target2id = {value: key for key, value in id2target.items()}
    
    
def create_target(encoded):
    targets = []
    text = []

    target = -2 # Always mask after [CLS] token

    text.append(encoded[0])
    idx = 1
    while idx < len(encoded):
        word = encoded[idx]
        if word in id2target.keys():
            if word in (119,117) and \
            tokenizer._convert_id_to_token(encoded[idx-1]).lstrip('▁').isnumeric() and \
            tokenizer._convert_id_to_token(encoded[idx+1]).startswith('##') and \
            tokenizer._convert_id_to_token(encoded[idx+1]).strip('#').isnumeric():
                targets.append(-2) # prev number
#                 print(-2)
#                 print(f"{tokenizer._convert_id_to_token(word):15}\t", end="")
                text.append(word)                
                target = -2 # '. or ,'
            else:
                target = word
        else:
            if tokenizer._convert_id_to_token(word).startswith('##'):
                target = -2
            targets.append(target)
#             print(target)
#             print(tokenizer._convert_id_to_token(word), '\t', end="")
            
            target = -1
            text.append(word)
            
        idx += 1

    targets.append(target)

    targets = [id2target[t] for t in targets]

    return text, targets

In [60]:
train_n = 70_000
valid_n = 8_000

train_text = ' '.join(text[:train_n])
valid_text = ' '.join(text[train_n:train_n+valid_n])
test_text = ' '.join(text[train_n+valid_n:])

len(train_text.split(' ')), len(valid_text.split(' ')), len(test_text.split(' '))

(1080644, 123975, 44242)

In [61]:
len(text) - train_n - valid_n

2875

In [62]:
train_tokens = tokenizer.encode(train_text)
valid_tokens = tokenizer.encode(valid_text)
test_tokens = tokenizer.encode(test_text)

Token indices sequence length is longer than the specified maximum sequence length for this model (2398794 > 512). Running this sequence through the model will result in indexing errors
Token indices sequence length is longer than the specified maximum sequence length for this model (274493 > 512). Running this sequence through the model will result in indexing errors
Token indices sequence length is longer than the specified maximum sequence length for this model (97793 > 512). Running this sequence through the model will result in indexing errors


In [63]:
train_tokens, train_targets = create_target(train_tokens)
valid_tokens, valid_targets = create_target(valid_tokens)
test_tokens, test_targets = create_target(test_tokens)

In [64]:
# For backward campatibility
train_tokens, train_targets = [train_tokens], [train_targets]
valid_tokens, valid_targets = [valid_tokens], [valid_targets]
test_tokens, test_targets = [test_tokens], [test_targets]

In [65]:
with open(data_path + 'train_data.pkl', 'wb') as f:
    pickle.dump((train_tokens, train_targets), f)
with open(data_path + 'valid_data.pkl', 'wb') as f:
    pickle.dump((valid_tokens, valid_targets), f)
with open(data_path + 'test_data.pkl', 'wb') as f:
    pickle.dump((test_tokens, test_targets), f)

In [66]:
(np.array(train_targets) >= 0).sum()

1153158

In [67]:
(np.array(train_targets) >= 0).sum(), (np.array(valid_targets) >= 0).sum(), (np.array(test_targets) >= 0).sum()

(1153158, 132224, 46992)

In [68]:
sum(((np.array(train_targets) >= 0).sum(), (np.array(valid_targets) >= 0).sum(), (np.array(test_targets) >= 0).sum()))

1332374

In [69]:
from collections import Counter

for tr in (train_targets, valid_targets, test_targets):
    c = Counter((t for targets in tr for t in targets))
    print('\t'.join([str(c[i]) for i in (1,2,3,0,-1)]))

81135	1681	126929	943413	1027975
9207	178	14505	108334	117453
3369	70	5141	38412	41890


In [70]:
sum((np.array(vt) != -1).sum() for vt in train_targets), \
sum((np.array(vt) != -1).sum() for vt in valid_targets), \
sum((np.array(vt) != -1).sum() for vt in test_targets)

(1153158, 132224, 46992)

In [71]:
sum((np.array(vt) == 2).sum() for vt in test_targets)

70

In [72]:
sum(len(vt) for vt in train_targets), \
sum(len(vt) for vt in valid_targets), \
sum(len(vt) for vt in test_targets)

(2181133, 249677, 88882)

In [73]:
word_idx = 0
s = []
for te, ta in zip(test_tokens[0][:], test_targets[0]):
#     print(tokenizer._convert_id_to_token(te), ta)
    if ta != -1:
        s.append(te)
        decoded = tokenizer.decode(s)
        print(f"{word_idx:3}. {decoded:20}\t{ta}\t{[tokenizer._convert_id_to_token(ss) for ss in s]}")
        word_idx += 1
        s = []
    else:
        s.append(te)

  0. [CLS] hala          	0	['[CLS]', 'hala']
  1. az                  	0	['az']
  2. urnak               	3	['ur', '##nak']
  3. nagyon              	0	['nagyon']
  4. jo                  	0	['jo']
  5. kepessegeim         	0	['kepes', '##sege', '##im']
  6. vannak              	3	['vannak']
  7. es                  	0	['es']
  8. nagyon              	0	['nagyon']
  9. szivesen            	0	['sz', '##ives', '##en']
 10. tanitanek           	0	['tani', '##tane', '##k']
 11. egyetemeken         	3	['egyetem', '##eken']
 12. foiskolakon         	0	['fois', '##kola', '##kon']
 13. is                  	0	['is']
 14. teologusokat        	3	['teolog', '##usok', '##at']
 15. filozofusokat       	1	['filozof', '##usok', '##at']
 16. ha                  	0	['ha']
 17. az                  	0	['az']
 18. ember               	0	['ember']
 19. mindig              	0	['mindig']
 20. ugy                 	0	['ugy']
 21. gondolkozna         	3	['gon', '##dol', '##ko', '##zna']
 22. mint               

1040. a                   	0	['a']
1041. hagyomanyos         	0	['hagyomanyos']
1042. (                   	0	['(']
1043. "                   	0	['"']
1044. hallhato            	0	['hall', '##hato']
1045. "                   	0	['"']
1046. )                   	0	[')']
1047. eloadasok           	0	['elo', '##adas', '##ok']
1048. eloadomuveszeit     	0	['elo', '##ado', '##mu', '##vesz', '##eit']
1049. es                  	0	['es']
1050. az                  	0	['az']
1051. audiovizualis       	0	['audio', '##vi', '##zu', '##alis']
1052. muvek               	0	['mu', '##vek']
1053. eloadomuveszeit     	0	['elo', '##ado', '##mu', '##vesz', '##eit']
1054. megilleto           	0	['meg', '##ille', '##to']
1055. jogok               	0	['jogo', '##k']
1056. kozott              	1	['kozott']
1057. az                  	0	['az']
1058. alapito             	0	['ala', '##pito']
1059. (                   	0	['(']
1060. k                   	0	['k']
1061. )                   	0	[')']
1062. feladata       

1882. terjesztes          	0	['ter', '##jes', '##zte', '##s']
1883. magaban             	0	['maga', '##ban']
1884. foglalja            	0	['fog', '##lal', '##ja']
1885. kulonosen           	0	['kulonosen']
1886. a                   	0	['a']
1887. mupeldany           	0	['mu', '##pel', '##dany']
1888. tulajdonjoganak     	0	['tul', '##aj', '##don', '##jo', '##ganak']
1889. atruhazasat         	0	['at', '##ruh', '##aza', '##sat']
1890. es                  	0	['es']
1891. a                   	0	['a']
1892. mupeldany           	0	['mu', '##pel', '##dany']
1893. berbeadasat         	3	['ber', '##bea', '##dasa', '##t']
1894. valamint            	0	['valamint']
1895. a                   	0	['a']
1896. mupeldanynak        	0	['mu', '##pel', '##dany', '##nak']
1897. az                  	0	['az']
1898. orszagba            	0	['orszag', '##ba']
1899. forgalomba          	0	['for', '##galom', '##ba']
1900. hozatali            	0	['hoz', '##atal', '##i']
1901. cellal              	0	['cell', '##al'

2755. kiadott             	0	['kiado', '##tt']
2756. altalanos           	0	['altalanos']
2757. utasitasoktol       	0	['uta', '##sita', '##sok', '##tol']
2758. kezdve              	0	['kezdve']
2759. az                  	0	['az']
2760. ujrairo             	0	['ujra', '##iro']
2761. csoport             	0	['csoport']
2762. altal               	0	['altal']
2763. vegrehajtott        	0	['veg', '##re', '##ha', '##jtott']
2764. utolso              	0	['utolso']
2765. simitasokig         	1	['sim', '##itas', '##oki', '##g']
2766. a                   	0	['a']
2767. baj                 	0	['ba', '##j']
2768. megis               	0	['megis']
2769. nagy                	3	['nagy']
2770. egy                 	0	['egy']
2771. belso               	0	['belso']
2772. vizsgalat           	3	['viz', '##s', '##gala', '##t']
2773. amelyet             	0	['amelyet']
2774. az                  	0	['az']
2775. ozvegy              	3	['oz', '##veg', '##y']
2776. gergely             	0	['ger', '##gely']
2777. _

3633. es                  	0	['es']
3634. teljesiteni         	1	['teljes', '##iten', '##i']
3635. a                   	0	['a']
3636. hirkozlesi          	0	['hir', '##ko', '##zle', '##si']
3637. _                   	0	['_']
3638. dontobizottsag      	0	['dont', '##obi', '##zott', '##sag']
3639. elfogadta           	0	['elf', '##oga', '##dta']
3640. a                   	0	['a']
3641. jelentos            	0	['jelentos']
3642. piaci               	0	['pia', '##ci']
3643. erovel              	0	['ero', '##vel']
3644. rendelkezo          	0	['rende', '##lke', '##zo']
3645. szolgaltatok        	0	['szo', '##lga', '##lta', '##tok']
3646. azonositasanak      	0	['azonos', '##itasa', '##nak']
3647. alapelveit          	1	['ala', '##pel', '##vei', '##t']
3648. ha                  	0	['ha']
3649. egyszer             	0	['egy', '##szer']
3650. arra                	0	['arra']
3651. setal               	0	['seta', '##l']
3652. es                  	0	['es']
3653. nincs               	0	['nincs']
365

4502. a                   	0	['a']
4503. tavkozles           	3	['ta', '##vko', '##zle', '##s']
4504. illetve             	0	['illetve']
4505. azon                	0	['azon']
4506. belul               	0	['belul']
4507. az                  	0	['az']
4508. uj                  	0	['uj']
4509. technologiak        	0	['techno', '##logia', '##k']
4510. uzleti              	0	['uz', '##leti']
4511. oldalara            	0	['oldal', '##ara']
4512. szakosodott         	0	['sz', '##ako', '##so', '##dott']
4513. reszleg             	0	['resz', '##leg']
4514. fel                 	0	['fel']
4515. eve                 	0	['eve']
4516. alakult             	3	['alakult']
4517. letszama            	0	['let', '##sza', '##ma']
4518. jelenleg            	0	['jelenleg']
4519. 10                  	0	['10']
4520. fo                  	1	['fo']
4521. a                   	0	['a']
4522. tuzijatek           	0	['tuz', '##ija', '##tek']
4523. pontban             	0	['pont', '##ban']
4524. 24                  	3	['2

5617. kizart              	0	['ki', '##zar', '##t']
5618. viszont             	0	['viszont']
5619. az                  	0	['az']
5620. ilyen               	0	['ilyen']
5621. termek              	0	['terme', '##k']
5622. ptk                 	1	['pt', '##k']
5623. 86                  	1	['86']
5624. par                 	3	['par']
5625. a                   	0	['a']
5626. alapjan             	0	['alapjan']
5627. torteno             	0	['torteno']
5628. jogvedelme          	1	['jog', '##vede', '##lme']
5629. azert               	0	['azert']
5630. szeretnek           	0	['sz', '##eret', '##nek']
5631. rendes              	0	['rende', '##s']
5632. fizetest            	3	['fi', '##zetes', '##t']
5633. mert                	0	['mert']
5634. a                   	0	['a']
5635. mai                 	0	['mai']
5636. vilagban            	0	['vilag', '##ban']
5637. keves               	0	['ke', '##ves']
5638. fizetesbol          	0	['fi', '##zetes', '##bol']
5639. nem                 	0	['nem']
5640. n

6432. vegyuk              	0	['veg', '##yu', '##k']
6433. eszre               	3	['es', '##z', '##re']
6434. hogy                	0	['hogy']
6435. a                   	0	['a']
6436. listan              	0	['listan']
6437. ugyanazok           	0	['ugy', '##ana', '##zok']
6438. a                   	0	['a']
6439. muveletek           	0	['mu', '##vel', '##etek']
6440. szerepelnek         	3	['szerepel', '##nek']
6441. mint                	0	['mint']
6442. a                   	0	['a']
6443. hozzaferest         	0	['hozzaferes', '##t']
6444. szabalyozo          	0	['sz', '##aba', '##ly', '##ozo']
6445. acl                 	3	['ac', '##l']
6446. ek                  	0	['ek']
6447. bejegyzeseiben      	1	['be', '##jeg', '##y', '##zese', '##iben']
6448. a                   	0	['a']
6449. homentesitesre      	0	['home', '##ntes', '##ites', '##re']
6450. a                   	0	['a']
6451. magyar              	0	['magyar']
6452. _                   	0	['_']
6453. honvedseg           	0	['hon', '##

7386. es                  	0	['es']
7387. fel                 	0	['fel']
7388. dollart             	1	['dollar', '##t']
7389. mi                  	0	['mi']
7390. is                  	0	['is']
7391. hozzafogtunk        	0	['hozza', '##fo', '##gt', '##unk']
7392. enni                	3	['enn', '##i']
7393. a                   	0	['a']
7394. kicsik              	0	['ki', '##csi', '##k']
7395. is                  	0	['is']
7396. felkeltek           	1	['fel', '##kel', '##tek']
7397. mikor               	0	['mikor']
7398. kezdtunk            	0	['kez', '##dt', '##unk']
7399. fazni               	3	['faz', '##ni']
7400. a                   	0	['a']
7401. szobaban            	0	['szo', '##bab', '##an']
7402. folytattuk          	0	['fol', '##yta', '##ttu', '##k']
7403. a                   	0	['a']
7404. beszelgetest        	1	['bes', '##zel', '##get', '##est']
7405. az                  	0	['az']
7406. iskolaban           	0	['iskola', '##ban']
7407. nagyon              	0	['nagyon']
7408. las

8359. felseg              	3	['fel', '##seg']
8360. amit                	0	['amit']
8361. mond                	3	['mond']
8362. hogy                	0	['hogy']
8363. on                  	0	['on']
8364. nem                 	0	['nem']
8365. az                  	0	['az']
8366. igazi               	0	['iga', '##zi']
8367. uralkodo            	1	['ural', '##kodo']
8368. de                  	0	['de']
8369. aztan               	0	['azt', '##an']
8370. csak                	0	['csak']
8371. elindultunk         	1	['eli', '##ndu', '##ltu', '##nk']
8372. ekkor               	0	['ekkor']
8373. a                   	0	['a']
8374. kedves              	0	['ked', '##ves']
8375. csalad              	0	['csalad']
8376. felkert             	0	['fel', '##kert']
8377. arra                	0	['arra']
8378. a                   	0	['a']
8379. megtisztelteto      	0	['meg', '##tis', '##zte', '##lte', '##to']
8380. szerepre            	3	['sz', '##ere', '##pre']
8381. hogy                	0	['hogy']
8382. ebben 

9382. hat                 	0	['hat']
9383. ilyen               	0	['ilyen']
9384. ravasz              	0	['ra', '##vas', '##z']
9385. ez                  	0	['ez']
9386. asz                 	0	['as', '##z']
9387. egmondt             	1	['eg', '##mond', '##t']
9388. a                   	0	['a']
9389. szerzo              	0	['sz', '##erzo']
9390. szemelyhez          	0	['sz', '##eme', '##ly', '##hez']
9391. fuzodo              	0	['fu', '##zo', '##do']
9392. jogai               	0	['joga', '##i']
9393. nehany              	0	['nehany']
9394. torvenyi            	0	['tor', '##veny', '##i']
9395. korlatozastol       	0	['kor', '##lato', '##zas', '##tol']
9396. eltekintve          	0	['elt', '##ekin', '##tve']
9397. [                   	0	['[']
9398. nev                 	0	['nev']
9399. feltuntetesenek     	0	['felt', '##unte', '##tese', '##nek']
9400. mellozese           	0	['mello', '##zese']
9401. pl                  	1	['pl']
9402. szjt                	1	['sz', '##jt']
9403. (          

10152. bakteriumok         	0	['bak', '##terium', '##ok']
10153. es                  	0	['es']
10154. a                   	0	['a']
10155. meg                 	0	['meg']
10156. naluk               	0	['nal', '##uk']
10157. is                  	0	['is']
10158. veszelyesebb        	0	['ves', '##zel', '##yes', '##ebb']
10159. virusok             	0	['virus', '##ok']
10160. elleni              	0	['elleni']
10161. szuntelen           	0	['sz', '##unte', '##len']
10162. harc                	0	['har', '##c']
10163. valik               	0	['vali', '##k']
10164. az                  	0	['az']
10165. orvostudomany       	0	['or', '##vost', '##udo', '##many']
10166. kotelezoen          	0	['kot', '##ele', '##zo', '##en']
10167. megoldando          	0	['meg', '##old', '##ando']
10168. leckejeve           	3	['lec', '##kej', '##eve']
10169. elvegre             	0	['elv', '##eg', '##re']
10170. az                  	0	['az']
10171. eloszor             	0	['eloszor']
10172. 1981                	3	['198

11165. minositette         	1	['mino', '##site', '##tte']
11166. a                   	0	['a']
11167. konyv               	0	['konyv']
11168. is                  	0	['is']
11169. csak                	0	['csak']
11170. szuksegleti         	0	['sz', '##uks', '##eg', '##leti']
11171. cikk                	3	['cikk']
11172. amelyet             	0	['amelyet']
11173. elo                 	0	['elo']
11174. kell                	0	['kell']
11175. allitani            	3	['alli', '##tani']
11176. mint                	0	['mint']
11177. a                   	0	['a']
11178. lekvart             	0	['lek', '##vart']
11179. vagy                	0	['vagy']
11180. a                   	0	['a']
11181. cipofuzot           	1	['ci', '##po', '##fu', '##zot']
11182. hasonlo             	0	['hasonlo']
11183. trukkel             	0	['tru', '##kkel']
11184. jatsszak            	0	['ja', '##ts', '##sza', '##k']
11185. ki                  	0	['ki']
11186. a                   	0	['a']
11187. szuloi              	0	['sz'

12132. 100                 	0	['100']
12133. kilometeren         	1	['kilometer', '##en']
12134. egy                 	0	['egy']
12135. biztos              	3	['biz', '##tos']
12136. a                   	0	['a']
12137. tavaly              	0	['ta', '##valy']
12138. augusztusi          	0	['augusztus', '##i']
12139. penzugyi            	0	['pen', '##zug', '##yi']
12140. valsag              	0	['val', '##sag']
12141. sulyos              	0	['sul', '##yos']
12142. kovetkezmenyeit     	3	['ko', '##vet', '##ke', '##zm', '##enye', '##it']
12143. a                   	0	['a']
12144. befektetok          	0	['be', '##fekt', '##eto', '##k']
12145. bizalomveszteset    	0	['biz', '##alom', '##vesz', '##tese', '##t']
12146. csak                	0	['csak']
12147. lassan              	0	['las', '##san']
12148. kihevero            	0	['ki', '##he', '##vero']
12149. oroszorszag         	0	['orosz', '##orszag']
12150. imazsanak           	0	['ima', '##zsa', '##nak']
12151. ez                  	0	['ez']
12

13117. hibajavito          	0	['hi', '##ba', '##javi', '##to']
13118. kodolas             	0	['kod', '##olas']
13119. szamelmeleti        	0	['szam', '##el', '##mel', '##eti']
13120. muveleteit          	1	['mu', '##vel', '##ete', '##it']
13121. most                	0	['most']
13122. mindjart            	0	['mind', '##jar', '##t']
13123. irj                 	0	['ir', '##j']
13124. neki                	3	['neki']
13125. es                  	0	['es']
13126. pakolj              	0	['pak', '##ol', '##j']
13127. es                  	0	['es']
13128. utazz               	1	['uta', '##zz']
13129. eber                	0	['eb', '##er']
13130. es                  	0	['es']
13131. gyakorlatias        	0	['g', '##yak', '##or', '##lati', '##as']
13132. lett                	3	['lett']
13133. felvette            	0	['fel', '##vette']
13134. a                   	0	['a']
13135. ruhajat             	3	['ru', '##ha', '##jat']
13136. dereka              	0	['derek', '##a']
13137. kore                	0	['k

14492. hideghaboru         	0	['hide', '##gh', '##ab', '##oru']
14493. utani               	0	['utan', '##i']
14494. korban              	0	['korban']
14495. nehez               	0	['ne', '##hez']
14496. megfogalmazni       	3	['meg', '##fo', '##gal', '##maz', '##ni']
14497. mifele              	3	['mi', '##fele']
14498. kifele              	0	['ki', '##fele']
14499. is                  	0	['is']
14500. az                  	0	['az']
14501. a                   	0	['a']
14502. bizonyos            	0	['bizonyos']
14503. ellenero            	3	['ellen', '##ero']
14504. amelyet             	0	['amelyet']
14505. nem                 	0	['nem']
14506. mondanak            	0	['mond', '##anak']
14507. ellensegnek         	2	['ellen', '##seg', '##nek']
14508. a                   	0	['a']
14509. fontosabb           	0	['fontos', '##abb']
14510. internetes          	0	['internet', '##es']
14511. reszvenyek          	0	['resz', '##veny', '##ek']
14512. 1                   	0	['1']
14513. szazalekot 

15245. ha                  	0	['ha']
15246. olyan               	0	['olyan']
15247. helyen              	0	['helyen']
15248. vagy                	0	['vagy']
15249. orszagba            	0	['orszag', '##ba']
15250. van                 	3	['van']
15251. amit                	0	['amit']
15252. meg                 	0	['meg']
15253. nem                 	0	['nem']
15254. ismer               	3	['is', '##mer']
15255. igy                 	0	['igy']
15256. en                  	0	['en']
15257. a                   	0	['a']
15258. csaladi             	0	['csalad', '##i']
15259. nyaralasom          	0	['nya', '##rala', '##som']
15260. egy                 	0	['egy']
15261. erdekesnek          	0	['erde', '##kes', '##nek']
15262. mondhato            	0	['mond', '##hato']
15263. napot               	0	['nap', '##ot']
15264. irok                	0	['iro', '##k']
15265. le                  	1	['le']
15266. a                   	0	['a']
15267. gepet               	0	['ge', '##pet']
15268. kikapcsoltuk      

16485. volt                	1	['volt']
16486. az                  	0	['az']
16487. szjt                	1	['sz', '##jt']
16488. (                   	0	['(']
16489. uj                  	0	['uj']
16490. )                   	0	[')']
16491. kivetelt            	0	['ki', '##vete', '##lt']
16492. engedo              	3	['enge', '##do']
16493. szabad              	0	['szabad']
16494. felhasznalast       	0	['fel', '##has', '##znal', '##ast']
16495. biztosito           	0	['biz', '##tos', '##ito']
16496. szabaly             	0	['sz', '##aba', '##ly']
16497. a                   	0	['a']
16498. tervezet            	0	['ter', '##vezet']
16499. jelenlegi           	0	['jelenleg', '##i']
16500. verziojanal         	0	['verzi', '##oja', '##nal']
16501. szukebben           	0	['sz', '##uke', '##bben']
16502. engedi              	0	['enge', '##di']
16503. meg                 	0	['meg']
16504. a                   	0	['a']
16505. kivetelt            	3	['ki', '##vete', '##lt']
16506. jol                

17578. valamint            	0	['valamint']
17579. meg                 	0	['meg']
17580. 2000                	3	['2000']
17581. ben                 	0	['ben']
17582. a                   	0	['a']
17583. nagy                	0	['nagy']
17584. ellenfel            	3	['ellen', '##fel']
17585. hamed               	0	['ham', '##ed']
17586. ellen               	1	['ellen']
17587. a                   	0	['a']
17588. gyenge              	0	['g', '##yen', '##ge']
17589. jen                 	0	['jen']
17590. es                  	0	['es']
17591. a                   	0	['a']
17592. jatekkonzolok       	0	['jatek', '##kon', '##zo', '##lok']
17593. iranti              	0	['iran', '##ti']
17594. kereslet            	0	['ker', '##es', '##let']
17595. novekedese          	0	['nove', '##kede', '##se']
17596. jot                 	0	['jo', '##t']
17597. tett                	0	['tett']
17598. a                   	0	['a']
17599. nintendo            	0	['nintendo']
17600. forgalmanak         	0	['for', '##gal'

18330. _                   	0	['_']
18331. tartomanybol        	0	['tart', '##oman', '##y', '##bol']
18332. beerkezett          	0	['beer', '##kezett']
18333. elso                	0	['elso']
18334. elozetes            	0	['elo', '##zetes']
18335. adat                	3	['adat']
18336. ott                 	0	['ott']
18337. a                   	0	['a']
18338. dragulas            	0	['drag', '##ulas']
18339. 1                   	3	['1']
18340. 4                   	0	['4']
18341. szazalekosnak       	0	['sz', '##azal', '##eko', '##sna', '##k']
18342. tunik               	0	['tun', '##ik']
18343. jelenleg            	0	['jelenleg']
18344. ebben               	0	['ebben']
18345. a                   	0	['a']
18346. honapban            	0	['hon', '##ap', '##ban']
18347. tavaly              	0	['ta', '##valy']
18348. novemberhez         	0	['november', '##hez']
18349. kepest              	3	['kepes', '##t']
18350. es                  	0	['es']
18351. 0                   	3	['0']
18352. 1       

19255. privatizalt         	0	['privat', '##iza', '##lt']
19256. allami              	0	['allami']
19257. gazdasagok          	0	['gaz', '##dasa', '##gok']
19258. cegeinek            	0	['ceg', '##einek']
19259. konzorciuma         	0	['kon', '##zor', '##cium', '##a']
19260. szeretne            	0	['sz', '##eret', '##ne']
19261. felvasarolni        	0	['fel', '##vas', '##aro', '##lni']
19262. a                   	0	['a']
19263. mizot               	0	['miz', '##ot']
19264. a                   	0	['a']
19265. parmalat            	0	['parma', '##lat']
19266. es                  	0	['es']
19267. a                   	0	['a']
19268. sole                	0	['sole']
19269. elol                	3	['elo', '##l']
19270. hacsak              	0	['hac', '##sak']
19271. a                   	0	['a']
19272. szinten             	0	['szinten']
19273. konkurens           	0	['kon', '##kur', '##ens']
19274. friesland           	0	['friesland']
19275. kozben              	0	['kozben']
19276. nem           

20134. legelokelobb        	0	['lege', '##lok', '##elo', '##bb']
20135. "                   	0	['"']
20136. klub                	0	['klub']
20137. "                   	2	['"']
20138. bar                 	0	['bar']
20139. a                   	0	['a']
20140. webkiszolgalok      	0	['web', '##kis', '##zo', '##lga', '##lok']
20141. kicsit              	0	['ki', '##csi', '##t']
20142. maskepp             	3	['maske', '##pp']
20143. minden              	0	['minden']
20144. webkiszolgalo       	0	['web', '##kis', '##zo', '##lga', '##lo']
20145. egyetlen            	0	['egyetlen']
20146. konyvtarstrukturat  	0	['konyvtar', '##stru', '##ktur', '##at']
20147. szolgaltat          	3	['szo', '##lga', '##lta', '##t']
20148. amely               	0	['amely']
20149. viszont             	0	['viszont']
20150. nem                 	0	['nem']
20151. felel               	0	['fele', '##l']
20152. meg                 	0	['meg']
20153. feltetlenul         	0	['felt', '##et', '##len', '##ul']
20154. a          

21095. epit                	0	['epi', '##t']
21096. fel                 	3	['fel']
21097. s                   	0	['s']
21098. ebbe                	0	['ebbe']
21099. olyan               	0	['olyan']
21100. kartyafelugyeleti   	0	['kart', '##yaf', '##elu', '##gy', '##elet', '##i']
21101. eszkozoket          	0	['es', '##zko', '##zok', '##et']
21102. is                  	0	['is']
21103. belefoglal          	3	['bele', '##fo', '##gla', '##l']
21104. amelyek             	0	['amelyek']
21105. reven               	0	['reven']
21106. a                   	0	['a']
21107. visa                	0	['visa']
21108. tagbankjai          	0	['tag', '##bank', '##jai']
21109. hozzaferhetnek      	0	['hozza', '##fer', '##het', '##nek']
21110. a                   	0	['a']
21111. megszemelyesito     	0	['meg', '##sze', '##mel', '##yes', '##ito']
21112. kozpontok           	0	['ko', '##zpont', '##ok']
21113. vilaghalozatahoz    	1	['vilag', '##hal', '##ozata', '##hoz']
21114. egy                 	0	['egy']
211

21949. ha                  	0	['ha']
21950. tehetem             	0	['teh', '##ete', '##m']
21951. nem                 	0	['nem']
21952. szeretnem           	0	['sz', '##eret', '##nem']
21953. megismerni          	1	['megis', '##mer', '##ni']
21954. en                  	0	['en']
21955. ha                  	0	['ha']
21956. felnott             	0	['fel', '##nott']
21957. leszek              	0	['lesz', '##ek']
21958. szeretnek           	0	['sz', '##eret', '##nek']
21959. csaladot            	0	['csalad', '##ot']
21960. alapitani           	0	['ala', '##pita', '##ni']
21961. es                  	0	['es']
21962. gyerekeket          	1	['g', '##yer', '##eke', '##ket']
21963. a                   	0	['a']
21964. varakozasokat       	0	['vara', '##ko', '##zas', '##okat']
21965. is                  	0	['is']
21966. alulmulo            	0	['al', '##ul', '##mul', '##o']
21967. eredmeny            	0	['ere', '##d', '##meny']
21968. a                   	0	['a']
21969. jelentesek          	0	['jelen

22831. egy                 	0	['egy']
22832. not                 	3	['not']
22833. akit                	0	['akit']
22834. halottak            	0	['halo', '##ttak']
22835. latogattak          	3	['lato', '##gatta', '##k']
22836. itt                 	3	['itt']
22837. a                   	0	['a']
22838. via                 	0	['via']
22839. _                   	0	['_']
22840. dei                 	0	['dei']
22841. _                   	0	['_']
22842. consoli             	0	['con', '##sol', '##i']
22843. egyik               	0	['egyik']
22844. palotajaban         	1	['palo', '##taja', '##ban']
22845. szerdan             	0	['sz', '##erda', '##n']
22846. is                  	0	['is']
22847. lejtmenet           	0	['le', '##jt', '##mene', '##t']
22848. volt                	0	['volt']
22849. a                   	0	['a']
22850. tokioi              	0	['tokio', '##i']
22851. ertektozsden        	3	['erte', '##kt', '##oz', '##sd', '##en']
22852. bar                 	0	['bar']
22853. a             

23837. keresztreszesedesek 	0	['ker', '##esz', '##tres', '##zese', '##dese', '##k']
23838. kialakulasat        	1	['kia', '##lak', '##ulas', '##at']
23839. amikor              	0	['amikor']
23840. odaertem            	3	['oda', '##erte', '##m']
23841. meg                 	0	['meg']
23842. nem                 	0	['nem']
23843. volt                	0	['volt']
23844. ott                 	3	['ott']
23845. ugyanis             	0	['ugyanis']
23846. akkor               	0	['akkor']
23847. kezdett             	0	['kezdett']
23848. pirkadni            	1	['pir', '##kad', '##ni']
23849. a                   	0	['a']
23850. profitkivonas       	0	['profit', '##ki', '##von', '##as']
23851. fo                  	0	['fo']
23852. szenvedo            	0	['sz', '##en', '##vedo']
23853. alanyai             	0	['alan', '##yai']
23854. a                   	0	['a']
23855. technologiai        	0	['techno', '##logia', '##i']
23856. es                  	0	['es']
23857. az                  	0	['az']
23858. autoi

24785. profilt             	1	['profil', '##t']
24786. utobbi              	0	['utobbi']
24787. szabaly             	0	['sz', '##aba', '##ly']
24788. csak                	0	['csak']
24789. megfelelo           	0	['megfelelo']
24790. garanciak           	0	['gara', '##ncia', '##k']
24791. mellett             	0	['mellett']
24792. biztositja          	0	['biz', '##tos', '##itja']
24793. a                   	0	['a']
24794. rendeltetesszeru    	0	['rende', '##lte', '##tes', '##szeru']
24795. joggyakorlast       	1	['jog', '##gy', '##ako', '##rla', '##st']
24796. a                   	0	['a']
24797. hegelianizmustol    	0	['hegel', '##iani', '##zmus', '##tol']
24798. a                   	0	['a']
24799. darwinizmuson       	0	['darwin', '##izmus', '##on']
24800. at                  	0	['at']
24801. a                   	0	['a']
24802. marxizmusig         	3	['marx', '##izmus', '##ig']
24803. illetve             	0	['illetve']
24804. kommunizmusig       	3	['kommun', '##izmus', '##ig']
24805. a

25561. kedvelem            	1	['ked', '##vel', '##em']
25562. jo                  	0	['jo']
25563. ev                  	0	['ev']
25564. volt                	0	['volt']
25565. a                   	0	['a']
25566. tavalyi             	0	['ta', '##valy', '##i']
25567. a                   	0	['a']
25568. svajci              	0	['sva', '##jci']
25569. bankok              	0	['bank', '##ok']
25570. szamara             	3	['szamara']
25571. a                   	0	['a']
25572. penzintezetek       	0	['pen', '##zin', '##teze', '##tek']
25573. profitja            	0	['profit', '##ja']
25574. 12                  	3	['12']
25575. 7                   	0	['7']
25576. szazalekkal         	0	['sz', '##azal', '##ek', '##kal']
25577. 19                  	3	['19']
25578. 5                   	0	['5']
25579. _                   	0	['_']
25580. milliard            	0	['milliard']
25581. frankra             	0	['frank', '##ra']
25582. emelkedett          	1	['eme', '##lke', '##dett']
25583. ne                

26254. tortenik            	3	['tort', '##enik']
26255. de                  	0	['de']
26256. azt                 	0	['azt']
26257. hittem              	3	['hit', '##tem']
26258. a                   	0	['a']
26259. te                  	0	['te']
26260. ostobasagodnak      	0	['ost', '##oba', '##sag', '##odna', '##k']
26261. is                  	0	['is']
26262. van                 	0	['van']
26263. hatara              	1	['hata', '##ra']
26264. eppugy              	0	['ep', '##pu', '##gy']
26265. kihat               	0	['ki', '##hat']
26266. a                   	0	['a']
26267. szerzok             	0	['sz', '##erzo', '##k']
26268. es                  	0	['es']
26269. az                  	0	['az']
26270. eloadomuveszek      	0	['elo', '##ado', '##mu', '##vesz', '##ek']
26271. vonatkozo           	0	['von', '##at', '##kozo']
26272. jogaira             	0	['joga', '##ira']
26273. az                  	0	['az']
26274. az                  	0	['az']
26275. eset                	3	['ese', '##t']
26

27152. megkerdezett        	0	['meg', '##ker', '##dez', '##ett']
27153. szakertok           	1	['sz', '##aker', '##tok']
27154. az                  	0	['az']
27155. akkor               	0	['akkor']
27156. feltart             	0	['felt', '##art']
27157. hianyossagokat      	0	['hi', '##any', '##ossa', '##gok', '##at']
27158. a                   	0	['a']
27159. terminal            	0	['terminal']
27160. uzemeltetese        	0	['uzeme', '##lte', '##tese']
27161. soran               	0	['soran']
27162. felszamoltak        	1	['fel', '##sza', '##mol', '##tak']
27163. a                   	0	['a']
27164. nevfeloldashoz      	0	['nev', '##fel', '##old', '##ash', '##oz']
27165. hasznalt            	0	['hasznalt']
27166. szort               	0	['szo', '##rt']
27167. uzenet              	0	['uz', '##enet']
27168. lenyege             	3	['len', '##ye', '##ge']
27169. jelentkezzen        	0	['jelent', '##ke', '##zze', '##n']
27170. az                  	0	['az']
27171. a                   	0	['a']
2

28243. a                   	0	['a']
28244. dijazas             	0	['dij', '##aza', '##s']
28245. mertekerol          	0	['mert', '##eke', '##rol']
28246. szolo               	0	['szolo']
28247. megallapodas        	1	['mega', '##lla', '##poda', '##s']
28248. termeszetesen       	0	['termeszetes', '##en']
28249. a                   	0	['a']
28250. 10                  	1	['10']
28251. 0                   	3	['0']
28252. s                   	0	['s']
28253. akarmi              	0	['akar', '##mi']
28254. nem                 	0	['nem']
28255. feltetlenul         	0	['felt', '##et', '##len', '##ul']
28256. jobb                	3	['jobb']
28257. mint                	0	['mint']
28258. az                  	0	['az']
28259. 5                   	1	['5']
28260. 0                   	3	['0']
28261. s                   	0	['s']
28262. volt                	3	['volt']
28263. sot                 	0	['sot']
28264. neha                	0	['ne', '##ha']
28265. rosszabb            	3	['ross', '##za', '##bb']


28982. kap                 	0	['kap']
28983. a                   	0	['a']
28984. futo                	1	['fut', '##o']
28985. estenkent           	0	['esten', '##kent']
28986. rendszerint         	0	['rendszer', '##int']
28987. otthon              	0	['ott', '##hon']
28988. szoktam             	0	['szo', '##kta', '##m']
28989. lenni               	0	['len', '##ni']
28990. tette               	0	['tette']
28991. hozza               	1	['hozza']
28992. okleveleket         	0	['ok', '##level', '##eket']
28993. osztottak           	0	['os', '##zto', '##ttak']
28994. ki                  	3	['ki']
28995. amelyben            	0	['amelyben']
28996. megkaptak           	0	['meg', '##kap', '##tak']
28997. a                   	0	['a']
28998. szereplesukert      	0	['sz', '##ere', '##ples', '##uke', '##rt']
28999. jaro                	0	['jaro']
29000. minositest          	0	['mino', '##site', '##st']
29001. es                  	0	['es']
29002. a                   	0	['a']
29003. tanfolyam        

29948. a                   	0	['a']
29949. nap                 	0	['nap']
29950. erdekes             	0	['erde', '##kes']
29951. egy                 	0	['egy']
29952. nap                 	0	['nap']
29953. volt                	0	['volt']
29954. a                   	0	['a']
29955. szamomra            	1	['szam', '##om', '##ra']
29956. azelott             	0	['az', '##elo', '##tt']
29957. meg                 	1	['meg']
29958. az                  	0	['az']
29959. idomero             	0	['ido', '##mero']
29960. edzes               	0	['ed', '##zes']
29961. ket                 	0	['ket']
29962. orakor              	0	['ora', '##kor']
29963. elkezdodott         	1	['elke', '##zdo', '##dott']
29964. a                   	0	['a']
29965. regi                	0	['regi']
29966. szjt                	1	['sz', '##jt']
29967. (                   	0	['(']
29968. 1969                	1	['1969']
29969. evi                 	0	['evi']
29970. iii                 	1	['iii']
29971. tv                  	1	['tv'

30836. torzsreszvenyet     	0	['tor', '##zs', '##res', '##z', '##veny', '##et']
30837. csutortokon         	0	['csu', '##tor', '##tok', '##on']
30838. a                   	0	['a']
30839. ce                  	0	['ce']
30840. _                   	0	['_']
30841. oil                 	0	['oil']
30842. _                   	0	['_']
30843. and                 	0	['and']
30844. _                   	0	['_']
30845. gasnak              	3	['gas', '##nak']
30846. adta                	0	['adta']
30847. hirul               	0	['hiru', '##l']
30848. a                   	0	['a']
30849. borsodchem          	0	['bor', '##so', '##dc', '##hem']
30850. a                   	0	['a']
30851. magyar              	0	['magyar']
30852. _                   	0	['_']
30853. tokepiacban         	0	['tok', '##ep', '##iac', '##ban']
30854. penteken            	3	['pen', '##tek', '##en']
30855. foleveltaroskent    	0	['fol', '##evel', '##taro', '##ske', '##nt']
30856. fogok               	0	['fogo', '##k']
30857. dolgozni

31713. a                   	0	['a']
31714. vallalkozoi         	0	['valla', '##lk', '##ozo', '##i']
31715. szektorban          	0	['sz', '##ekt', '##or', '##ban']
31716. csak                	0	['csak']
31717. az                  	0	['az']
31718. even                	0	['even']
31719. tuli                	0	['tuli']
31720. betetek             	0	['bete', '##tek']
31721. kamata              	0	['kama', '##ta']
31722. merseklodott        	3	['mers', '##ek', '##lod', '##ott']
31723. a                   	0	['a']
31724. hitelek             	0	['hit', '##ele', '##k']
31725. atlagkamata         	0	['at', '##lag', '##kama', '##ta']
31726. pedig               	0	['pedig']
31727. az                  	0	['az']
31728. elozo               	0	['elo', '##zo']
31729. honapok             	0	['hon', '##apo', '##k']
31730. szintjen            	0	['sz', '##int', '##jen']
31731. maradt              	3	['maradt']
31732. derul               	0	['der', '##ul']
31733. ki                  	0	['ki']
31734. a     

32539. a                   	0	['a']
32540. meccsen             	3	['mec', '##cs', '##en']
32541. kerem               	1	['ker', '##em']
32542. ha                  	0	['ha']
32543. nem                 	0	['nem']
32544. tudnak              	3	['tud', '##nak']
32545. hogy                	0	['hogy']
32546. ki                  	0	['ki']
32547. vagyok              	1	['vagy', '##ok']
32548. a                   	0	['a']
32549. videokonferenciahoz 	0	['video', '##kon', '##ferencia', '##hoz']
32550. kozpontilag         	0	['kozponti', '##lag']
32551. foglalja            	0	['fog', '##lal', '##ja']
32552. le                  	0	['le']
32553. az                  	0	['az']
32554. eroforrasokat       	3	['ero', '##for', '##ras', '##okat']
32555. ez                  	0	['ez']
32556. a                   	0	['a']
32557. gyakorlatban        	0	['g', '##yak', '##or', '##lat', '##ban']
32558. a                   	0	['a']
32559. szukseges           	0	['szukseges']
32560. savszelesseget      	0	['sav', '#

33310. illetve             	0	['illetve']
33311. rajuk               	0	['raj', '##uk']
33312. mutatva             	0	['mutat', '##va']
33313. definialhatok       	3	['defini', '##al', '##hato', '##k']
33314. es                  	0	['es']
33315. csak                	0	['csak']
33316. az                  	0	['az']
33317. a                   	0	['a']
33318. kijelentes          	0	['ki', '##jele', '##ntes']
33319. tudomanyos          	3	['tudomanyos']
33320. amely               	0	['amely']
33321. a                   	0	['a']
33322. vilagban            	0	['vilag', '##ban']
33323. megfigyelt          	0	['meg', '##fi', '##gy', '##elt']
33324. tenyek              	0	['ten', '##yek']
33325. altal               	0	['altal']
33326. bizonyithato        	0	['biz', '##ony', '##ith', '##ato']
33327. (                   	0	['(']
33328. verifikalhato       	0	['veri', '##fik', '##al', '##hato']
33329. )                   	1	[')']
33330. a                   	0	['a']
33331. raiffeisen          	0	['r

34111. ellen               	0	['ellen']
34112. a                   	0	['a']
34113. reszvenyertek       	0	['resz', '##veny', '##erte', '##k']
34114. hatralek            	0	['hat', '##rale', '##k']
34115. befizetese          	0	['be', '##fi', '##zetes', '##e']
34116. vegett              	1	['veget', '##t']
34117. szeretek            	0	['sz', '##eret', '##ek']
34118. iskolaba            	0	['iskola', '##ba']
34119. jarni               	3	['jar', '##ni']
34120. mert                	0	['mert']
34121. jo                  	0	['jo']
34122. az                  	0	['az']
34123. osztalyom           	0	['os', '##zta', '##ly', '##om']
34124. es                  	0	['es']
34125. jol                 	0	['jol']
34126. erzem               	0	['er', '##zem']
34127. veluk               	0	['vel', '##uk']
34128. magam               	1	['maga', '##m']
34129. kozottuk            	0	['kozott', '##uk']
34130. is                  	0	['is']
34131. nagy                	0	['nagy']
34132. a                   	0	

34960. tizenhat            	0	['tiz', '##en', '##hat']
34961. eves                	0	['eves']
34962. koromban            	0	['kor', '##omb', '##an']
34963. jarok               	0	['jaro', '##k']
34964. itt                 	3	['itt']
34965. es                  	0	['es']
34966. ez                  	0	['ez']
34967. a                   	0	['a']
34968. visszahelyezes      	0	['vissza', '##hely', '##ezes']
34969. a                   	0	['a']
34970. jelen               	0	['jelen']
34971. pillanatnak         	0	['pil', '##lana', '##tna', '##k']
34972. mindig              	0	['mindig']
34973. gazdagabb           	0	['gaz', '##dag', '##abb']
34974. erzelmi             	0	['er', '##zel', '##mi']
34975. tartalmat           	0	['tart', '##al', '##mat']
34976. adott               	1	['adott']
34977. ismet               	0	['ismet']
34978. a                   	0	['a']
34979. varosban            	0	['varosban']
34980. jartak              	3	['jart', '##ak']
34981. es                  	0	['es']
34982.

36290. fegyvert            	0	['fe', '##gy', '##vert']
36291. is                  	1	['is']
36292. obuda               	0	['obu', '##da']
36293. polgarmestere       	0	['pol', '##gar', '##mester', '##e']
36294. kifogasolja         	3	['ki', '##fo', '##gas', '##ol', '##ja']
36295. hogy                	0	['hogy']
36296. a                   	0	['a']
36297. kerulet             	0	['kerul', '##et']
36298. kimaradt            	0	['kim', '##ara', '##dt']
36299. a                   	0	['a']
36300. volt                	0	['volt']
36301. kiralyi             	0	['kiralyi']
36302. szekhelyek          	0	['szekhelye', '##k']
36303. muemleki            	0	['mu', '##em', '##lek', '##i']
36304. felujitasanak       	0	['fel', '##uji', '##tasa', '##nak']
36305. programjabol        	1	['program', '##ja', '##bol']
36306. ez                  	0	['ez']
36307. harom               	0	['harom']
36308. osszetevobol        	0	['ossze', '##tev', '##obo', '##l']
36309. all                 	3	['all']
36310. a      

36907. johessen            	0	['jo', '##hes', '##sen']
36908. vissza              	1	['vissza']
36909. ez                  	0	['ez']
36910. hatarozott          	0	['hata', '##roz', '##ott']
36911. es                  	0	['es']
36912. mindenkeppen        	0	['minden', '##keppen']
36913. tartos              	0	['tart', '##os']
36914. nemet               	0	['nemet']
36915. allaspont           	3	['alla', '##sp', '##ont']
36916. amelyhez            	0	['amely', '##hez']
36917. orommel             	0	['oro', '##mme', '##l']
36918. csatlakoztak        	0	['cs', '##at', '##lak', '##oztak']
36919. a                   	0	['a']
36920. kiterjesztessel     	0	['kit', '##er', '##jes', '##zte', '##ssel']
36921. szembeni            	0	['szemben', '##i']
36922. szkeptikusok        	1	['sz', '##kep', '##tikus', '##ok']
36923. mire                	0	['mire']
36924. leertunk            	3	['leer', '##tun', '##k']
36925. apa                 	0	['apa']
36926. teljesen            	0	['teljesen']
36927. lei

37708. csak                	0	['csak']
37709. nagyon              	0	['nagyon']
37710. korultekintoen      	0	['korul', '##tek', '##into', '##en']
37711. lehet               	0	['lehet']
37712. es                  	0	['es']
37713. kell                	0	['kell']
37714. rendelkezni         	0	['rende', '##lke', '##zni']
37715. a                   	0	['a']
37716. szerzodeseknek      	1	['sz', '##erzo', '##dese', '##kne', '##k']
37717. a                   	0	['a']
37718. reszveny            	0	['resz', '##veny']
37719. mind                	0	['mind']
37720. az                  	0	['az']
37721. 1988                	1	['1988']
37722. evi                 	0	['evi']
37723. vi                  	1	['vi']
37724. tv                  	3	['tv']
37725. mind                	0	['mind']
37726. pedig               	0	['pedig']
37727. az                  	0	['az']
37728. ezt                 	0	['ezt']
37729. megelozo            	0	['meg', '##elo', '##zo']
37730. (                   	0	['(']
37731. a     

38512. cegbirosag          	0	['ceg', '##bir', '##osa', '##g']
38513. elrendeli           	0	['el', '##rende', '##li']
38514. hivatalboli         	0	['hiv', '##atal', '##bol', '##i']
38515. torleset            	1	['tor', '##lese', '##t']
38516. eszt                	0	['es', '##zt']
38517. a                   	0	['a']
38518. warinst             	0	['war', '##ins', '##t']
38519. most                	0	['most']
38520. mekkeresem          	3	['me', '##kker', '##ese', '##m']
38521. es                  	0	['es']
38522. a                   	0	['a']
38523. vasbottal           	0	['vas', '##bot', '##tal']
38524. kipuhatolom         	0	['kip', '##uh', '##ato', '##lom']
38525. a                   	0	['a']
38526. fejit               	3	['fe', '##jit']
38527. hogy                	0	['hogy']
38528. legures             	0	['leg', '##ures']
38529. ter                 	0	['ter']
38530. van                 	3	['van']
38531. e                   	0	['e']
38532. ott                 	2	['ott']
38533. ahogy 

39568. megpillantottunk    	0	['meg', '##pil', '##lant', '##ott', '##unk']
39569. egy                 	0	['egy']
39570. kis                 	0	['kis']
39571. tavat               	0	['ta', '##vat']
39572. es                  	0	['es']
39573. a                   	0	['a']
39574. kozelebe            	0	['kozel', '##ebe']
39575. mentunk             	1	['ment', '##unk']
39576. a                   	0	['a']
39577. keddi               	0	['ked', '##di']
39578. amerikai            	0	['amerikai']
39579. kamatdontes         	0	['kama', '##t', '##don', '##tes']
39580. bizonytalansagban   	0	['biz', '##ony', '##talan', '##sagban']
39581. tartotta            	0	['tartott', '##a']
39582. hetfon              	0	['het', '##fon']
39583. a                   	0	['a']
39584. frankfurti          	0	['frankfurt', '##i']
39585. tozsde              	0	['to', '##zs', '##de']
39586. befektetoit         	1	['be', '##fekt', '##eto', '##it']
39587. almom               	0	['al', '##mom']
39588. az                  	

40342. odajott             	0	['oda', '##jot', '##t']
40343. nehany              	0	['nehany']
40344. csaj                	0	['cs', '##aj']
40345. hozzam              	0	['hozza', '##m']
40346. es                  	0	['es']
40347. elkezdtek           	0	['elke', '##zd', '##tek']
40348. velem               	0	['vele', '##m']
40349. beszelgetni         	1	['bes', '##zel', '##get', '##ni']
40350. az                  	0	['az']
40351. europai             	0	['europai']
40352. _                   	0	['_']
40353. unio                	0	['unio']
40354. soron               	0	['sor', '##on']
40355. kovetkezo           	0	['kovetkezo']
40356. bovitesenek         	0	['bo', '##vite', '##senek']
40357. nagyobbak           	0	['nagyobb', '##ak']
40358. lesznek             	0	['lesz', '##nek']
40359. az                  	0	['az']
40360. elonyei             	0	['elo', '##ny', '##ei']
40361. az                  	0	['az']
40362. unio                	0	['unio']
40363. szamara             	3	['szamara']
4

41258. a                   	0	['a']
41259. versenyt            	0	['verse', '##nyt']
41260. nagymama            	0	['nagy', '##ma', '##ma']
41261. nyerte              	0	['nyerte']
41262. egy                 	0	['egy']
41263. kis                 	0	['kis']
41264. hallal              	0	['halla', '##l']
41265. meg                 	0	['meg']
41266. 6                   	0	['6']
41267. gallyal             	1	['gall', '##yal']
41268. ha                  	0	['ha']
41269. a                   	0	['a']
41270. megmaradt           	0	['meg', '##maradt']
41271. bel                 	3	['bel']
41272. vagy                	0	['vagy']
41273. kultagokbol         	0	['kult', '##ago', '##kbol']
41274. legalabb            	0	['legal', '##abb']
41275. ketten              	0	['ket', '##ten']
41276. a                   	0	['a']
41277. gt                  	1	['gt']
41278. (                   	0	['(']
41279. uj                  	0	['uj']
41280. )                   	0	[')']
41281. 104                 	1	['104']


42502. _                   	0	['_']
42503. honlapja            	0	['honlapja']
42504. "                   	0	['"']
42505. dijat               	0	['dijat']
42506. az                  	0	['az']
42507. otven               	0	['ot', '##ven']
42508. fonel               	0	['fon', '##el']
42509. nagyobb             	0	['nagyobb']
42510. vallalati           	0	['valla', '##lati']
42511. kategoriaban        	0	['kategoria', '##ban']
42512. az                  	0	['az']
42513. otp                 	0	['ot', '##p']
42514. _                   	0	['_']
42515. bank                	3	['bank']
42516. az                  	0	['az']
42517. ennel               	0	['enne', '##l']
42518. kisebb              	0	['kisebb']
42519. letszamu            	0	['let', '##sza', '##mu']
42520. cegek               	0	['ceg', '##ek']
42521. kozul               	0	['kozul']
42522. pedig               	0	['pedig']
42523. a                   	0	['a']
42524. webtime             	0	['web', '##time']
42525. _                  

43336. millio              	0	['millio']
43337. euro                	0	['euro']
43338. osszegu             	0	['ossze', '##gu']
43339. kotvenyt            	0	['kot', '##veny', '##t']
43340. bocsatott           	0	['boc', '##sato', '##tt']
43341. ki                  	1	['ki']
43342. mukodesukhoz        	0	['mu', '##kod', '##esu', '##kh', '##oz']
43343. tobb                	0	['tobb']
43344. tamogatast          	3	['tamo', '##gatas', '##t']
43345. a                   	0	['a']
43346. befektetok          	0	['be', '##fekt', '##eto', '##k']
43347. szamara             	0	['szamara']
43348. pedig               	0	['pedig']
43349. vonzobb             	0	['von', '##zo', '##bb']
43350. kedvezmenyeket      	0	['ked', '##vez', '##menyek', '##et']
43351. igenyelnek          	0	['igen', '##yel', '##nek']
43352. a                   	0	['a']
43353. vallalkozoi         	0	['valla', '##lk', '##ozo', '##i']
43354. ovezetek            	3	['ove', '##zete', '##k']
43355. ajanlasaikkal       	0	['ajan', '##l

44251. celkonyvtar         	0	['cel', '##kon', '##yv', '##tar']
44252. titkositva          	0	['tit', '##kos', '##it', '##va']
44253. volt                	3	['volt']
44254. e                   	1	['e']
44255. az                  	0	['az']
44256. unokatestverem      	0	['uno', '##kate', '##stve', '##rem']
44257. es                  	0	['es']
44258. en                  	0	['en']
44259. sokat               	0	['sok', '##at']
44260. jatszottunk         	1	['jatszott', '##unk']
44261. osszetalalkoztunk   	0	['ossze', '##tala', '##lk', '##oz', '##tun', '##k']
44262. az                  	0	['az']
44263. osztalyfonokunkkel  	0	['os', '##zta', '##ly', '##fono', '##kun', '##kkel']
44264. es                  	0	['es']
44265. egy                 	0	['egy']
44266. masik               	0	['masik']
44267. csapattal           	1	['csapat', '##tal']
44268. voltak              	0	['voltak']
44269. percek              	3	['per', '##cek']
44270. amikor              	0	['amikor']
44271. a                  

45002. nem                 	0	['nem']
45003. volt                	0	['volt']
45004. erre                	0	['erre']
45005. kepes               	1	['kepes']
45006. a                   	0	['a']
45007. haromszaz           	0	['harom', '##sza', '##z']
45008. banyasz             	0	['ban', '##yas', '##z']
45009. munkahelyenek       	0	['mun', '##kah', '##ely', '##enek']
45010. megszunesevel       	0	['meg', '##sz', '##unes', '##evel']
45011. jaro                	0	['jaro']
45012. intezkedest         	0	['inte', '##zke', '##dest']
45013. azzal               	0	['azzal']
45014. indokoljak          	3	['indo', '##kol', '##jak']
45015. hogy                	0	['hogy']
45016. nincs               	0	['nincs']
45017. piaca               	0	['pia', '##ca']
45018. a                   	0	['a']
45019. lencsehegyi         	0	['len', '##cs', '##eh', '##eg', '##yi']
45020. szennek             	1	['sz', '##enne', '##k']
45021. na                  	0	['na']
45022. tobb                	0	['tobb']
45023. se  

45916. is                  	0	['is']
45917. belole              	1	['belo', '##le']
45918. a                   	0	['a']
45919. windows             	0	['windows']
45920. _                   	0	['_']
45921. 2000                	0	['2000']
45922. kapcsolodhatunk     	0	['kap', '##cs', '##olo', '##dha', '##tun', '##k']
45923. virtualis           	0	['virtual', '##is']
45924. maganhalozathoz     	0	['maga', '##nha', '##lo', '##zat', '##hoz']
45925. ugy                 	3	['ugy']
45926. hogy                	0	['hogy']
45927. magat               	0	['magat']
45928. az                  	0	['az']
45929. internetet          	0	['internet', '##et']
45930. is                  	0	['is']
45931. modemen             	0	['mode', '##men']
45932. keresztul           	0	['keresztul']
45933. erjuk               	0	['er', '##juk']
45934. el                  	1	['el']
45935. ha                  	0	['ha']
45936. osszeadjuk          	0	['ossze', '##ad', '##juk']
45937. a                   	0	['a']
45938. fobb 

46948. hatarozatainak      	0	['hata', '##roz', '##ata', '##inak']
46949. keretei             	0	['ker', '##ete', '##i']
46950. kozott              	0	['kozott']
46951. egyeni              	0	['egyeni']
46952. felelosseggel       	0	['fele', '##los', '##seg', '##gel']
46953. vezeti              	0	['veze', '##ti']
46954. az                  	0	['az']
46955. egyesulest          	1	['egyes', '##ules', '##t']
46956. szamos              	0	['szamos']
46957. szakerto            	0	['sz', '##aker', '##to']
46958. szerint             	0	['szerint']
46959. torokorszag         	0	['torok', '##orszag']
46960. olyan               	0	['olyan']
46961. tortenelmi          	0	['tortenelmi']
46962. forduloponthoz      	0	['ford', '##ulo', '##pont', '##hoz']
46963. erkezett            	3	['erkezett']
46964. mint                	0	['mint']
46965. a                   	0	['a']
46966. huszas              	0	['hus', '##zas']
46967. evekben             	3	['evekben']
46968. amikor              	0	['amikor']
