In [1]:
import matplotlib.pyplot as plt
%matplotlib inline
import os
import json
import pickle
from transformers import BertTokenizer
import torch
import numpy as np
import re

import warnings
warnings.filterwarnings("ignore")

from tqdm.notebook import tqdm

In [2]:
data_path = "D:/Data/neural-punctuator/szeged_hubert/"
file_path = "D:/Data/neural-punctuator/szeged/szeged.txt"

In [3]:
with open(file_path, 'r', encoding='utf-8') as f:
    text = f.readlines()

In [4]:
from collections import OrderedDict

text = list(OrderedDict.fromkeys(text))
len(text)

80875

In [5]:
from sklearn.utils import shuffle

text = shuffle(text, random_state=0)

text[1]

' Ez jutott az eszébe önkéntelenül.\n'

In [6]:
def clean_text(text):
    text = text.replace('!', '.')
    text = text.replace(':', ',')
    text = text.replace('--', ',')
    text = text.replace('-', ',')
    text = text.replace(';', '.')
    text = text.replace(' ,', ',')
    text = text.replace('♫', '')

    text = re.sub(r'--\s?--', '', text)
    text = re.sub(r'\s+', ' ', text)

    text = text.replace(' ,', ',')
    
    text = re.sub(r',\s?,', ',', text)
    
    return text.strip().lower()

In [31]:
text = [clean_text(t) for t in text]
text[1]

'ez jutott az eszébe önkéntelenül.'

In [32]:
from transformers import AutoTokenizer, AutoModel

tokenizer = AutoTokenizer.from_pretrained("SZTAKI-HLT/hubert-base-cc")
model = AutoModel.from_pretrained("SZTAKI-HLT/hubert-base-cc")

In [33]:
tokenizer.encode(".?,")

[2, 4575, 8308, 3576, 3]

In [54]:
id2target = {-1: 0,
              4575: 1, # .
              8308: 2, # ?
              3576: 3,  # ,
              -2: -1, # will be masked
             }
target2id = {value: key for key, value in id2target.items()}
    
    
def create_target(encoded):
    targets = []
    text = []

    target = -2 # Always mask after [CLS] token

    text.append(encoded[0])
    idx = 1
    while idx < len(encoded):
        word = encoded[idx]
        if word in id2target.keys():
            if word in (4575, 3576) and \
            tokenizer._convert_id_to_token(encoded[idx-1]).lstrip('▁').isnumeric() and \
            tokenizer._convert_id_to_token(encoded[idx+1]).startswith('##') and \
            tokenizer._convert_id_to_token(encoded[idx+1]).strip('#').isnumeric():
                targets.append(-2) # prev number
#                 print(-2)
#                 print(f"{tokenizer._convert_id_to_token(word):15}\t", end="")
                text.append(word)                
                target = -2 # '. or ,'
            else:
                target = word
        else:
            if tokenizer._convert_id_to_token(word).startswith('##'):
                target = -2
            targets.append(target)
#             print(target)
#             print(tokenizer._convert_id_to_token(word), '\t', end="")
            
            target = -1
            text.append(word)
        idx += 1

    targets.append(target)

    targets = [id2target[t] for t in targets]

    return text, targets

In [55]:
train_n = 70_000
valid_n = 8_000

train_text = ' '.join(text[:train_n])
valid_text = ' '.join(text[train_n:train_n+valid_n])
test_text = ' '.join(text[train_n+valid_n:])

len(train_text.split(' ')), len(valid_text.split(' ')), len(test_text.split(' '))

(1080644, 123975, 44242)

In [56]:
train_tokens = tokenizer.encode(train_text)
valid_tokens = tokenizer.encode(valid_text)
test_tokens = tokenizer.encode(test_text)

In [57]:
train_tokens, train_targets = create_target(train_tokens)
valid_tokens, valid_targets = create_target(valid_tokens)
test_tokens, test_targets = create_target(test_tokens)

# For backward campatibility
train_tokens, train_targets = [train_tokens], [train_targets]
valid_tokens, valid_targets = [valid_tokens], [valid_targets]
test_tokens, test_targets = [test_tokens], [test_targets]

In [58]:
for te, ta in zip(train_tokens[0][:100], train_targets[0]):
    print(f"{tokenizer._convert_id_to_token(te):15}\t{ta}")

[CLS]          	-1
az             	0
egyes          	0
_              	0
leszáll        	-1
##ópály        	-1
##ának         	0
például        	0
nem            	0
ez             	0
volt           	0
a              	0
neve           	0
akkoriban      	3
ang            	-1
##li           	-1
##ának         	0
vagy           	0
nagy           	3
brit           	-1
##anni         	-1
##ának         	0
nevezték       	3
bár            	0
l              	-1
##ond          	-1
##ont          	3
ebben          	0
meglehetősen   	0
bizonyos       	0
volt           	0
win            	-1
##st           	-1
##on           	3
mindig         	0
l              	-1
##ond          	-1
##onna         	-1
##k            	0
hívták         	1
ez             	0
jutott         	0
az             	0
eszébe         	0
önként         	-1
##elen         	-1
##ül           	1
könyvtár       	0
megoszt        	-1
##ása          	0
közben         	0
(              	0
a              	0
tulajdonság    	-1
##lap     

In [59]:
with open(data_path + 'train_data.pkl', 'wb') as f:
    pickle.dump((train_tokens, train_targets), f)
with open(data_path + 'valid_data.pkl', 'wb') as f:
    pickle.dump((valid_tokens, valid_targets), f)
with open(data_path + 'test_data.pkl', 'wb') as f:
    pickle.dump((test_tokens, test_targets), f)

In [60]:
sum((np.array(vt) != -1).sum() for vt in train_targets), \
sum((np.array(vt) != -1).sum() for vt in valid_targets), \
sum((np.array(vt) != -1).sum() for vt in test_targets)

(1153158, 132224, 46992)

In [61]:
tokenizer.decode(train_tokens[0][:30])

'[CLS] az egyes _ leszállópályának például nem ez volt a neve akkoriban angliának vagy nagy britanniának nevezték bár londont ebben meglehetősen bizonyos'

In [62]:
word_idx = 0
s = []
for te, ta in zip(test_tokens[0][:], test_targets[0]):
#     print(tokenizer._convert_id_to_token(te), ta)
    if ta != -1:
        s.append(te)
        decoded = tokenizer.decode(s)
        print(f"{word_idx:3}. {decoded:20}\t{ta}\t{[tokenizer._convert_id_to_token(ss) for ss in s]}")
        word_idx += 1
        s = []
    else:
        s.append(te)

  0. [CLS] hála          	0	['[CLS]', 'hála']
  1. az                  	0	['az']
  2. úrnak               	3	['úrnak']
  3. nagyon              	0	['nagyon']
  4. jó                  	0	['jó']
  5. képességeim         	0	['képessége', '##im']
  6. vannak              	3	['vannak']
  7. és                  	0	['és']
  8. nagyon              	0	['nagyon']
  9. szívesen            	0	['szívesen']
 10. tanítanék           	0	['tanít', '##an', '##ék']
 11. egyetemeken         	3	['egyetemek', '##en']
 12. főiskolákon         	0	['főiskol', '##ákon']
 13. is                  	0	['is']
 14. teológusokat        	3	['te', '##ológusok', '##at']
 15. filozófusokat       	1	['filozófus', '##okat']
 16. ha                  	0	['ha']
 17. az                  	0	['az']
 18. ember               	0	['ember']
 19. mindig              	0	['mindig']
 20. úgy                 	0	['úgy']
 21. gondolkozna         	3	['gondolkoz', '##na']
 22. mint                	0	['mint']
 23. most                	0	['most'

958. szervezetben        	0	['szervezetben']
959. dolgozó             	0	['dolgozó']
960. emberek             	0	['emberek']
961. kiválasztása        	0	['kiválasztása']
962. és                  	0	['és']
963. megbízhatóságuk     	0	['megbízhatóság', '##uk']
964. ellenőrzése         	0	['ellenőrzése']
965. rendkívül           	0	['rendkívül']
966. kényes              	0	['kényes']
967. kérdés              	1	['kérdés']
968. június              	0	['június']
969. 7                   	3	['7']
970. én                  	0	['én']
971. a                   	0	['a']
972. magyar              	0	['magyar']
973. _                   	0	['_']
974. kupa                	0	['kup', '##a']
975. fináléjával         	0	['finálé', '##jával']
976. ért                 	0	['ért']
977. volna               	0	['volna']
978. véget               	0	['véget']
979. az                  	0	['az']
980. idény               	3	['idény']
981. de                  	0	['de']
982. a                   	0	['a']
983. luxemburgi

1870. életet              	0	['életet']
1871. élők                	0	['élők']
1872. sem                 	0	['sem']
1873. képesek             	0	['képesek']
1874. kisebb              	0	['kisebb']
1875. változtatásra       	0	['változtatás', '##ra']
1876. egyik               	0	['egyik']
1877. napról              	0	['napról']
1878. a                   	0	['a']
1879. másikra             	3	['másikra']
1880. egyedül             	1	['egyedül']
1881. a                   	0	['a']
1882. terjesztés          	0	['terjeszt', '##és']
1883. magában             	0	['magában']
1884. foglalja            	0	['foglalja']
1885. különösen           	0	['különösen']
1886. a                   	0	['a']
1887. műpéldány           	0	['mű', '##péld', '##ány']
1888. tulajdonjogának     	0	['tulajdonjog', '##ának']
1889. átruházását         	0	['átruház', '##ását']
1890. és                  	0	['és']
1891. a                   	0	['a']
1892. műpéldány           	0	['mű', '##péld', '##ány']
1893. bérbeadását     

2767. baj                 	0	['baj']
2768. mégis               	0	['mégis']
2769. nagy                	3	['nagy']
2770. egy                 	0	['egy']
2771. belső               	0	['belső']
2772. vizsgálat           	3	['vizsgálat']
2773. amelyet             	0	['amelyet']
2774. az                  	0	['az']
2775. özvegy              	3	['özvegy']
2776. gergely             	0	['ger', '##gel', '##y']
2777. _                   	0	['_']
2778. irén                	0	['ir', '##én']
2779. kért                	0	['kért']
2780. a                   	0	['a']
2781. p                   	1	['p']
2782. _                   	0	['_']
2783. m                   	1	['m']
2784. _                   	0	['_']
2785. s                   	1	['s']
2786. _                   	0	['_']
2787. kft                 	3	['kft']
2788. től                 	3	['től']
2789. azt                 	0	['azt']
2790. állapította         	0	['állapította']
2791. meg                 	3	['meg']
2792. hogy                	0	['hogy']
2793

3788. rozzant             	0	['roz', '##zan', '##t']
3789. kalapját            	3	['kalap', '##ját']
3790. és                  	0	['és']
3791. belépett            	0	['belép', '##ett']
3792. a                   	0	['a']
3793. füstös              	0	['füst', '##ös']
3794. helyiségbe          	1	['helyiség', '##be']
3795. mi                  	0	['mi']
3796. az                  	0	['az']
3797. ott                 	0	['ott']
3798. előtted             	3	['előtte', '##d']
3799. öregfiú             	3	['öreg', '##fiú']
3800. de                  	0	['de']
3801. jó                  	0	['jó']
3802. lehetett            	1	['lehetett']
3803. miután              	0	['miután']
3804. mindenki            	0	['mindenki']
3805. jóllakott           	3	['jól', '##lak', '##ott']
3806. megkérdeztük        	0	['megkérd', '##eztük']
3807. mikor               	0	['mikor']
3808. kell                	0	['kell']
3809. visszajönni         	0	['visszaj', '##ön', '##ni']
3810. és                  	0	['és']
3811. me

4605. a                   	0	['a']
4606. betonút             	0	['beton', '##út']
4607. megvásárolta        	0	['megvásárolt', '##a']
4608. a                   	0	['a']
4609. pénzügyi            	0	['pénzügyi']
4610. befektetőnek        	0	['befektető', '##nek']
4611. számító             	3	['számító']
4612. elsősorban          	0	['elsősorban']
4613. vidéki              	0	['vidéki']
4614. agrokeres           	0	['agr', '##oke', '##res']
4615. cégek               	0	['cégek']
4616. felvásárlásával     	0	['felvásár', '##lásával']
4617. ismertté            	0	['ismertté']
4618. vált                	0	['vált']
4619. murányi             	0	['m', '##ur', '##ányi']
4620. _                   	0	['_']
4621. ferenc              	0	['ferenc']
4622. érdekeltségébe      	0	['érdekelt', '##ség', '##ébe']
4623. tartozó             	0	['tartozó']
4624. terra               	0	['terr', '##a']
4625. _                   	0	['_']
4626. danubia             	0	['da', '##n', '##ub', '##ia']
4627. _        

5345. kártalanítási       	0	['kárt', '##alan', '##ítási']
5346. kötelessége         	0	['kötelessége']
5347. van                 	0	['van']
5348. tehát               	0	['tehát']
5349. a                   	0	['a']
5350. szerzőnek           	1	['szerzőnek']
5351. a                   	0	['a']
5352. magyar              	0	['magyar']
5353. _                   	0	['_']
5354. köztársaság         	0	['köztársaság']
5355. tizenegy            	0	['tizenegy']
5356. minisztériuma       	3	['minisztérium', '##a']
5357. túl                 	0	['túl']
5358. azon                	3	['azon']
5359. hogy                	0	['hogy']
5360. milyen              	0	['milyen']
5361. mérvű               	0	['mér', '##v', '##ű']
5362. tiszteletlenség     	0	['tisztelet', '##len', '##ség']
5363. udvarias            	0	['udvarias']
5364. és                  	0	['és']
5365. írásban             	0	['írásban']
5366. feltett             	0	['feltett']
5367. kérdésre            	0	['kérdésre']
5368. sehogy             

6129. tervezze            	0	['tervez', '##ze']
6130. meg                 	0	['meg']
6131. franjo              	0	['fran', '##j', '##o']
6132. _                   	0	['_']
6133. tudjman             	0	['tudj', '##man']
6134. sírhelyét           	1	['sír', '##hely', '##ét']
6135. a                   	0	['a']
6136. kőolaj              	0	['kő', '##olaj']
6137. világpiaci          	0	['világ', '##piaci']
6138. árának              	0	['árán', '##ak']
6139. a                   	0	['a']
6140. csökkenése          	0	['csökkenése']
6141. ellenére            	0	['ellenére']
6142. oroszország         	0	['orosz', '##ország']
6143. nem                 	0	['nem']
6144. szorul              	0	['szorul']
6145. rá                  	0	['rá']
6146. arra                	3	['arra']
6147. hogy                	0	['hogy']
6148. kölcsönt            	0	['kölcsönt']
6149. vegyen              	0	['vegyen']
6150. fel                 	0	['fel']
6151. a                   	0	['a']
6152. nemzetközi          	0	['nem

6990. órát                	0	['órát']
6991. dolgozik            	3	['dolgozik']
6992. neveli              	0	['nevel', '##i']
6993. másik               	0	['másik']
6994. 2                   	0	['2']
6995. gyermekét           	0	['gyermekét']
6996. (                   	0	['(']
6997. újra                	0	['újra']
6998. összeházasodott     	0	['összeh', '##áza', '##so', '##do', '##tt']
6999. )                   	3	[')']
7000. főz                 	3	['főz']
7001. és                  	0	['és']
7002. mind                	0	['mind']
7003. emellett            	0	['emellett']
7004. egyetemre           	0	['egyetem', '##re']
7005. jár                 	0	['jár']
7006. egy                 	0	['egy']
7007. hónapban            	0	['hónapban']
7008. 3                   	0	['3']
7009. napot               	1	['napot']
7010. mindig              	0	['mindig']
7011. öltek               	0	['ölt', '##ek']
7012. meg                 	0	['meg']
7013. embereket           	3	['embereket']
7014. vagy         

7822. van                 	0	['van']
7823. a                   	0	['a']
7824. szaktanár           	0	['szak', '##tanár']
7825. irányítására        	3	['irányítás', '##ára']
7826. hogy                	0	['hogy']
7827. az                  	0	['az']
7828. én                  	0	['én']
7829. avatatlan           	0	['av', '##ata', '##t', '##lan']
7830. nememet             	0	['nem', '##emet']
7831. ráirányítsa         	0	['rá', '##irány', '##ítsa']
7832. olyan               	0	['olyan']
7833. dolgokra            	3	['dolgokra']
7834. melyeket            	0	['melyeket']
7835. egyébként           	0	['egyébként']
7836. nem                 	0	['nem']
7837. vennék              	0	['venn', '##ék']
7838. észre               	1	['észre']
7839. másnap              	0	['másnap']
7840. reggel              	0	['reggel']
7841. vidáman             	0	['vidám', '##an']
7842. gondoltam           	0	['gondoltam']
7843. vissza              	0	['vissza']
7844. a                   	0	['a']
7845. történtekre  

8552. a                   	0	['a']
8553. m                   	1	['m']
8554. egyszerű            	0	['egyszerű']
8555. levéltovábbítási    	0	['levél', '##tovább', '##ítási']
8556. protokoll           	0	['protokoll']
8557. )                   	0	[')']
8558. nevű                	0	['nevű']
8559. alkalmazási         	0	['alkalmazási']
8560. szintű              	0	['szintű']
8561. protokollal         	0	['protokoll', '##al']
8562. érhető              	0	['érhető']
8563. el                  	1	['el']
8564. innét               	0	['inn', '##ét']
8565. egyenesen           	0	['egyenesen']
8566. zalalövőre          	0	['z', '##ala', '##löv', '##őre']
8567. utaztunk            	3	['utaz', '##tunk']
8568. egy                 	0	['egy']
8569. kempingbe           	1	['kemping', '##be']
8570. az                  	0	['az']
8571. általános           	0	['általános']
8572. iskolában           	0	['iskolában']
8573. szokás              	0	['szokás']
8574. volt                	3	['volt']
8575. hogy    

9526. alapítását          	0	['alap', '##ítását']
9527. a                   	0	['a']
9528. privatizáció        	0	['privat', '##izáció']
9529. meghiúsulására      	0	['meghiús', '##ulás', '##ára']
9530. hivatkozva          	0	['hivatkozva']
9531. szintén             	0	['szintén']
9532. visszavonták        	3	['visszavon', '##ták']
9533. ó                   	3	['ó']
9534. cambridge           	3	['c', '##amb', '##rid', '##ge']
9535. ben                 	3	['ben']
9536. kiáltott            	0	['kiált', '##ott']
9537. fel                 	0	['fel']
9538. ellesley            	0	['elle', '##sl', '##ey']
9539. boldogan            	1	['boldogan']
9540. a                   	0	['a']
9541. budapesti           	0	['budapesti']
9542. tőzsdén             	0	['tőzsd', '##én']
9543. további             	0	['további']
9544. forgalomcsökkenést  	3	['forgalom', '##csökkenés', '##t']
9545. stagnálást          	0	['stag', '##nál', '##ást']
9546. várnak              	0	['várnak']
9547. szerdán             

10365. bepikkelyezni       	1	['bep', '##ikkel', '##ye', '##z', '##ni']
10366. hogy                	0	['hogy']
10367. hol                 	3	['hol']
10368. azt                 	0	['azt']
10369. nem                 	0	['nem']
10370. tudom               	3	['tudom']
10371. akkor               	3	['akkor']
10372. mondjuk             	3	['mondjuk']
10373. ebben               	0	['ebben']
10374. a                   	0	['a']
10375. párbeszédről        	0	['párbeszéd', '##ről']
10376. szóló               	0	['szóló']
10377. könyvben            	0	['könyvben']
10378. nem                 	0	['nem']
10379. is                  	0	['is']
10380. olvashatjuk         	0	['olvashat', '##juk']
10381. majd                	0	['majd']
10382. a                   	0	['a']
10383. párbeszéd           	0	['párbeszéd']
10384. definícióját        	2	['definíció', '##ját']
10385. a                   	0	['a']
10386. budapesti           	0	['budapesti']
10387. _                   	0	['_']
10388. értéktőzsde        

11146. a                   	0	['a']
11147. médiatörvény        	0	['médiat', '##örvény']
11148. (                   	0	['(']
11149. 1996                	1	['199', '##6']
11150. évi                 	0	['évi']
11151. i                   	1	['i']
11152. törvény             	0	['törvény']
11153. )                   	0	[')']
11154. is                  	0	['is']
11155. a                   	0	['a']
11156. közvetlen           	0	['közvetlen']
11157. tulajdon            	0	['tulajdon']
11158. mellett             	0	['mellett']
11159. a                   	0	['a']
11160. közvetett           	0	['közvetett']
11161. tulajdont           	0	['tulajdon', '##t']
11162. is                  	0	['is']
11163. befolyásoló         	0	['befolyásoló']
11164. részesedésnek       	0	['részese', '##dés', '##nek']
11165. minősítette         	1	['minősített', '##e']
11166. a                   	0	['a']
11167. könyv               	0	['könyv']
11168. is                  	0	['is']
11169. csak                	0	['csak']

12018. jogok               	0	['jogok']
12019. törvényi            	0	['törvényi']
12020. korlátja            	0	['korlát', '##ja']
12021. leginkább           	0	['leginkább']
12022. a                   	0	['a']
12023. szabad              	0	['szabad']
12024. felhasználás        	0	['felhasználás']
12025. intézményében       	0	['intézmény', '##ében']
12026. él                  	0	['él']
12027. tovább              	1	['tovább']
12028. csütörtökön         	0	['csütörtökön']
12029. 45                  	3	['45']
12030. 1                   	0	['1']
12031. pontos              	3	['pontos']
12032. azaz                	0	['azaz']
12033. 0                   	3	['0']
12034. 9                   	0	['9']
12035. százalékos          	0	['százalékos']
12036. veszteség           	0	['veszteség']
12037. után                	0	['után']
12038. 5074                	3	['50', '##74']
12039. 9                   	0	['9']
12040. ponton              	0	['ponton']
12041. végzett             	0	['végzett']
12042

12851. verseny             	0	['verseny']
12852. során               	0	['során']
12853. atrocitás           	3	['at', '##roc', '##itás']
12854. testi               	0	['testi']
12855. vagy                	0	['vagy']
12856. lelki               	0	['lelki']
12857. sérülés             	0	['sérülés']
12858. nem                 	0	['nem']
12859. történt             	1	['történt']
12860. külföldön           	0	['külföldön']
12861. születtem           	3	['születtem']
12862. 10                  	0	['10']
12863. évesen              	0	['évesen']
12864. kerültem            	0	['kerültem']
12865. át                  	0	['át']
12866. magyarországra      	1	['magyar', '##ország', '##ra']
12867. részvénytársaság    	0	['részvény', '##társaság']
12868. átalakulással       	3	['átalakulás', '##sal']
12869. a                   	0	['a']
12870. részvénytársaságok  	0	['részvény', '##társaság', '##ok']
12871. egyesülését         	0	['egyes', '##ülését']
12872. kivéve              	3	['kivéve']
12873. cs

13685. ahol                	0	['ahol']
13686. a                   	0	['a']
13687. templom             	0	['templom']
13688. történetét          	0	['történetét']
13689. és                  	0	['és']
13690. érdekességeit       	0	['érdekesség', '##eit']
13691. hallhattuk          	0	['hall', '##hattuk']
13692. és                  	0	['és']
13693. nézhettük           	0	['néz', '##hettük']
13694. meg                 	1	['meg']
13695. utolsó              	0	['utolsó']
13696. estéjét             	0	['est', '##éjét']
13697. töltötte            	0	['töltötte']
13698. rómában             	1	['ró', '##mában']
13699. még                 	0	['még']
13700. sokkal              	0	['sokkal']
13701. átengedettebben     	0	['át', '##enged', '##ettebb', '##en']
13702. csavargott          	0	['csavar', '##gott']
13703. az                  	0	['az']
13704. utcák               	0	['utcák']
13705. közt                	3	['közt']
13706. mint                	0	['mint']
13707. máskor              	3	['máskor

14589. győzelmet           	0	['győzelmet']
14590. aratott             	1	['aratott']
14591. növekednek          	0	['növeked', '##nek']
14592. magyarországon      	0	['magyar', '##ország', '##on']
14593. az                  	0	['az']
14594. élelmiszerárak      	3	['élelmiszer', '##árak']
14595. a                   	0	['a']
14596. vegyipari           	3	['vegyi', '##pari']
14597. gépipari            	0	['gépi', '##pari']
14598. termékek            	0	['termékek']
14599. árai                	1	['árai']
14600. ezután              	0	['ezután']
14601. visszatértünk       	0	['visszatért', '##ünk']
14602. szállásunkhoz       	0	['szállás', '##unkhoz']
14603. és                  	0	['és']
14604. kimerítő            	0	['kimer', '##ítő']
14605. vacsorában          	0	['vacsor', '##ában']
14606. volt                	0	['volt']
14607. részünk             	1	['rész', '##ünk']
14608. néha                	0	['néha']
14609. pár                 	0	['pár']
14610. nap                 	0	['nap']
14611

15613. közötti             	0	['közötti']
15614. átmenetet           	0	['átmenet', '##et']
15615. értelmesen          	0	['értelmes', '##en']
15616. megvalósítani       	1	['megvalósítani']
15617. hogyan              	0	['hogyan']
15618. térülhetnek         	0	['tér', '##ülhet', '##nek']
15619. meg                 	0	['meg']
15620. a                   	0	['a']
15621. szolgáltatók        	0	['szolgáltatók']
15622. óriási              	0	['óriási']
15623. kiadásai            	0	['kiadása', '##i']
15624. belátható           	0	['belát', '##ható']
15625. időn                	0	['időn']
15626. belül               	1	['belül']
15627. sokat               	0	['sokat']
15628. kellett             	0	['kellett']
15629. mérni               	0	['mérni']
15630. és                  	0	['és']
15631. számolni            	1	['számolni']
15632. martin              	0	['mar', '##ti', '##n']
15633. közénk              	0	['közé', '##nk']
15634. tartozik            	0	['tartozik']
15635. mondta            

16450. tartozik            	1	['tartozik']
16451. azóta               	0	['azóta']
16452. már                 	0	['már']
16453. több                	0	['több']
16454. meccsen             	0	['meccsen']
16455. is                  	0	['is']
16456. voltam              	1	['voltam']
16457. minden              	0	['minden']
16458. klub                	0	['klub']
16459. vezetője            	3	['vezetője']
16460. ha                  	0	['ha']
16461. kell                	3	['kell']
16462. egy                 	0	['egy']
16463. csomó               	0	['csomó']
16464. embert              	0	['embert']
16465. állít               	0	['állít']
16466. a                   	0	['a']
16467. tagjai              	0	['tagjai']
16468. közül               	3	['közül']
16469. és                  	0	['és']
16470. alvarez             	0	['alv', '##are', '##z']
16471. valami              	0	['valami']
16472. alkalmat            	0	['alkalmat']
16473. vár                 	3	['vár']
16474. hogy                	0	['

17268. pl                  	1	['pl']
17269. szépirodalmi        	3	['szép', '##irodalmi']
17270. szakirodalmi        	3	['szak', '##irodalmi']
17271. tudományos          	3	['tudományos']
17272. publicisztikai      	0	['pub', '##lic', '##isztikai']
17273. )                   	0	[')']
17274. mű                  	3	['mű']
17275. b                   	0	['b']
17276. )                   	0	[')']
17277. a                   	0	['a']
17278. nyilvánosan         	0	['nyilvánosan']
17279. tartott             	0	['tartott']
17280. beszéd              	3	['beszéd']
17281. c                   	0	['c']
17282. )                   	0	[')']
17283. a                   	0	['a']
17284. számítógépi         	0	['számítógép', '##i']
17285. programalkotás      	0	['program', '##alkotás']
17286. és                  	0	['és']
17287. a                   	0	['a']
17288. hozzá               	0	['hozzá']
17289. tartozó             	0	['tartozó']
17290. dokumentáció        	0	['dokumentáció']
17291. (                

18003. koromra             	0	['korom', '##ra']
18004. szeretnék           	0	['szeretnék']
18005. olyan               	0	['olyan']
18006. "                   	0	['"']
18007. szabad              	0	['szabad']
18008. "                   	0	['"']
18009. maradni             	3	['maradni']
18010. mint                	0	['mint']
18011. most                	1	['most']
18012. az                  	0	['az']
18013. új                  	0	['új']
18014. törvény             	0	['törvény']
18015. 1998                	1	['1998']
18016. június              	0	['június']
18017. 16                  	3	['16']
18018. i                   	0	['i']
18019. életbelépése        	0	['életbe', '##lép', '##ése']
18020. után                	0	['után']
18021. alapított           	0	['alapított']
18022. társaságokra        	0	['társaságok', '##ra']
18023. természetesen       	0	['természetesen']
18024. teljes              	0	['teljes']
18025. terjedelmükben      	0	['terjedelm', '##ükben']
18026. alkalmazni          

18798. több                	0	['több']
18799. gyékény             	0	['gy', '##ék', '##ény']
18800. nem                 	0	['nem']
18801. volt                	0	['volt']
18802. a                   	0	['a']
18803. helyiségben         	1	['helyiségben']
18804. a                   	0	['a']
18805. _                   	0	['_']
18806. múlt                	0	['múlt']
18807. _                   	0	['_']
18808. emlékei             	0	['emléke', '##i']
18809. című                	0	['című']
18810. főfejezet           	0	['fő', '##fej', '##ezet']
18811. a                   	0	['a']
18812. kontinens           	0	['kontinens']
18813. geológiai           	0	['ge', '##ológiai']
18814. történetét          	0	['történetét']
18815. foglalja            	0	['foglalja']
18816. össze               	1	['össze']
18817. de                  	0	['de']
18818. maga                	0	['maga']
18819. biztos              	0	['biztos']
18820. lehet               	0	['lehet']
18821. abban               	3	['abban']
188

20129. ügyvezető           	0	['ügyvezető']
20130. látja               	0	['látja']
20131. el                  	3	['el']
20132. melyik              	0	['melyik']
20133. a                   	0	['a']
20134. legelőkelőbb        	0	['legelő', '##kelő', '##bb']
20135. "                   	0	['"']
20136. klub                	0	['klub']
20137. "                   	2	['"']
20138. bár                 	0	['bár']
20139. a                   	0	['a']
20140. webkiszolgálók      	0	['web', '##kis', '##zol', '##gá', '##lók']
20141. kicsit              	0	['kicsit']
20142. másképp             	3	['másképp']
20143. minden              	0	['minden']
20144. webkiszolgáló       	0	['web', '##kis', '##zol', '##gá', '##ló']
20145. egyetlen            	0	['egyetlen']
20146. könyvtárstruktúrát  	0	['könyvtár', '##strukt', '##úrát']
20147. szolgáltat          	3	['szolgáltat']
20148. amely               	0	['amely']
20149. viszont             	0	['viszont']
20150. nem                 	0	['nem']
20151. felel    

21348. tizenkilencedik     	0	['tizen', '##kilenc', '##edik']
21349. századi             	0	['századi']
21350. elképzelésektől     	0	['elképzelések', '##től']
21351. a                   	0	['a']
21352. természet           	0	['természet']
21353. törvényeit          	0	['törvénye', '##it']
21354. illetőleg           	1	['illetőleg']
21355. a                   	0	['a']
21356. köhögésroham        	0	['köhög', '##és', '##roham']
21357. okozta              	0	['okozta']
21358. fájdalom            	0	['fájdalom']
21359. nem                 	0	['nem']
21360. űzte                	0	['űz', '##te']
21361. ki                  	0	['ki']
21362. teljesen            	0	['teljesen']
21363. winston             	0	['win', '##st', '##on']
21364. agyából             	0	['agy', '##ából']
21365. az                  	0	['az']
21366. álom                	0	['álom']
21367. előidézte           	0	['előidéz', '##te']
21368. benyomásokat        	3	['benyom', '##ásokat']
21369. de                  	0	['de']
21370

22033. pontban             	0	['pontban']
22034. telefonos           	0	['telefonos']
22035. kapcsolatot         	0	['kapcsolatot']
22036. választottunk       	3	['választott', '##unk']
22037. a                   	0	['a']
22038. varázsló            	0	['varázs', '##ló']
22039. áttér               	0	['átt', '##ér']
22040. a                   	0	['a']
22041. hálózati            	0	['hálózati']
22042. kapcsolat           	0	['kapcsolat']
22043. létrehozására       	3	['létrehoz', '##ására']
22044. itt                 	0	['itt']
22045. tehát               	0	['tehát']
22046. nem                 	0	['nem']
22047. választhatunk       	0	['választhat', '##unk']
22048. a                   	0	['a']
22049. meglevő             	0	['megl', '##evő']
22050. telefonos           	0	['telefonos']
22051. hálózati            	0	['hálózati']
22052. kapcsolatok         	0	['kapcsolatok']
22053. közül               	3	['közül']
22054. hanem               	0	['hanem']
22055. új                  	0	['új']
22

22857. technológiai        	0	['technológiai']
22858. részvények          	0	['részvények']
22859. iránti              	0	['iránti']
22860. erős                	0	['erős']
22861. kereslet            	1	['kereslet']
22862. pataki              	0	['patak', '##i']
22863. olvasta             	0	['olvasta']
22864. egyszer             	3	['egyszer']
22865. hogy                	0	['hogy']
22866. a                   	0	['a']
22867. házasember          	0	['házas', '##ember']
22868. és                  	0	['és']
22869. a                   	0	['a']
22870. legényember         	0	['legény', '##ember']
22871. közt                	0	['közt']
22872. az                  	0	['az']
22873. a                   	0	['a']
22874. leglényegesebb      	0	['leg', '##lé', '##nye', '##ge', '##seb', '##b']
22875. különbség           	3	['különbség']
22876. hogy                	0	['hogy']
22877. a                   	0	['a']
22878. házasember          	0	['házas', '##ember']
22879. mindig              	0	['mindig']
2

23810. esetleg             	0	['esetleg']
23811. külföldre           	1	['külföldre']
23812. szerbia             	0	['szerb', '##ia']
23813. sem                 	0	['sem']
23814. mentes              	0	['mentes']
23815. az                  	0	['az']
23816. effajta             	0	['eff', '##ajt', '##a']
23817. gondoktól           	1	['gondok', '##tól']
23818. az                  	0	['az']
23819. 1988                	1	['198', '##8']
23820. évi                 	0	['évi']
23821. vi                  	1	['vi']
23822. tv                  	1	['tv']
23823. koncepciójához      	0	['koncepció', '##jához']
23824. hasonlóan           	0	['hasonlóan']
23825. az                  	0	['az']
23826. új                  	0	['új']
23827. törvény             	0	['törvény']
23828. sem                 	0	['sem']
23829. támogatja           	0	['támogatja']
23830. az                  	0	['az']
23831. uralt               	0	['ural', '##t']
23832. és                  	0	['és']
23833. az                  	0	['az'

24686. gyógyszergyártója   	0	['gyógyszer', '##gyártó', '##ja']
24687. szolid              	0	['szolid']
24688. emelkedésről        	0	['emelked', '##ésről']
24689. számolt             	0	['számolt']
24690. be                  	0	['be']
24691. második             	0	['második']
24692. negyedéves          	0	['negyedéves']
24693. profitjának         	0	['profit', '##jának']
24694. terén               	0	['terén']
24695. szerdán             	3	['szerdán']
24696. a                   	0	['a']
24697. dollár              	0	['dollár']
24698. gyengülésének       	0	['gyeng', '##ülésének']
24699. hatását             	0	['hatását']
24700. az                  	0	['az']
24701. advair              	0	['adva', '##ir']
24702. asztmagyógyszer     	0	['aszt', '##mag', '##y', '##ógy', '##szer']
24703. megnövekedett       	0	['megnövekedett']
24704. kereslete           	0	['kereslet', '##e']
24705. ellensúlyozta       	1	['ellensúly', '##ozta']
24706. copy                	3	['co', '##p', '##y']
24707. m

25549. nekem               	0	['nekem']
25550. szimpatikus         	0	['szimpatikus']
25551. felnőtt             	0	['felnőtt']
25552. szeretnék           	0	['szeretnék']
25553. lenni               	3	['lenni']
25554. mert                	0	['mert']
25555. az                  	0	['az']
25556. erőszakos           	0	['erőszakos']
25557. és                  	0	['és']
25558. durva               	0	['durva']
25559. felnőtteket         	0	['felnőttek', '##et']
25560. nem                 	0	['nem']
25561. kedvelem            	1	['kedvel', '##em']
25562. jó                  	0	['jó']
25563. év                  	0	['év']
25564. volt                	0	['volt']
25565. a                   	0	['a']
25566. tavalyi             	0	['tavalyi']
25567. a                   	0	['a']
25568. svájci              	0	['svájci']
25569. bankok              	0	['bankok']
25570. számára             	3	['számára']
25571. a                   	0	['a']
25572. pénzintézetek       	0	['pénz', '##intézetek']
25573. prof

26793. fogják              	0	['fogják']
26794. küldeni             	0	['küldeni']
26795. a                   	0	['a']
26796. borotvapengét       	3	['borot', '##va', '##pen', '##gé', '##t']
26797. mi                  	0	['mi']
26798. baj                 	2	['baj']
26799. háromezer           	0	['három', '##ezer']
26800. szólt               	0	['szólt']
26801. oda                 	0	['oda']
26802. winston             	0	['win', '##st', '##on']
26803. feje                	0	['feje']
26804. fölött              	0	['fölött']
26805. a                   	0	['a']
26806. fehér               	0	['fehér']
26807. köpenyes            	0	['köp', '##enye', '##s']
26808. embernek            	1	['embernek']
26809. a                   	0	['a']
26810. south               	0	['s', '##out', '##h']
26811. _                   	0	['_']
26812. african             	0	['afr', '##ican']
26813. _                   	0	['_']
26814. breweries           	0	['br', '##e', '##we', '##rie', '##s']
26815. _              

27674. mondta              	0	['mondta']
27675. csányi              	0	['cs', '##ányi']
27676. _                   	0	['_']
27677. sándor              	3	['s', '##ándor']
27678. az                  	0	['az']
27679. otp                 	0	['ot', '##p']
27680. _                   	0	['_']
27681. bank                	0	['bank']
27682. _                   	0	['_']
27683. rt                  	1	['rt']
27684. elnök               	3	['elnök']
27685. vezérigazgatója     	0	['vezérigazgatója']
27686. a                   	0	['a']
27687. hitelintézet        	0	['hitelintézet']
27688. dolgozóinak         	0	['dolgozói', '##nak']
27689. szervezett          	0	['szervezett']
27690. országos            	0	['országos']
27691. értekezleten        	0	['értekezlet', '##en']
27692. szombaton           	0	['szombaton']
27693. az                  	0	['az']
27694. erkel               	0	['erk', '##el']
27695. _                   	0	['_']
27696. színházban          	1	['színház', '##ban']
27697. ez           

28953. nyílik              	0	['nyílik']
28954. a                   	0	['a']
28955. pesterzsébeti       	0	['pest', '##er', '##zsébet', '##i']
28956. rendőrkapitányság   	0	['rendőr', '##kapitányság']
28957. épületében          	1	['épületében']
28958. kipakoltunk         	3	['kip', '##ak', '##oltunk']
28959. majd                	0	['majd']
28960. szabadfoglalkozás   	0	['szabad', '##foglalkoz', '##ás']
28961. volt                	0	['volt']
28962. vacsoráig           	1	['vacsor', '##áig']
28963. férjhez             	0	['férj', '##hez']
28964. menni               	0	['menni']
28965. egy                 	0	['egy']
28966. őszinte             	3	['őszinte']
28967. megértő             	3	['megért', '##ő']
28968. kedves              	0	['kedves']
28969. férfihoz            	3	['férfi', '##hoz']
28970. aki                 	0	['aki']
28971. természetesen       	0	['természetesen']
28972. szereti             	0	['szereti']
28973. a                   	0	['a']
28974. gyerekeket          	0	['gy

29850. költsége            	0	['költsége']
29851. nagyságrenddel      	0	['nagyságrend', '##del']
29852. kisebb              	3	['kisebb']
29853. mint                	0	['mint']
29854. a                   	0	['a']
29855. régié               	1	['régi', '##é']
29856. a                   	0	['a']
29857. budapesti           	0	['budapesti']
29858. kamarának           	0	['kamar', '##ának']
29859. a                   	0	['a']
29860. tagdíjon            	0	['tagdíj', '##on']
29861. kívül               	0	['kívül']
29862. is                  	0	['is']
29863. voltak              	0	['voltak']
29864. még                 	0	['még']
29865. bevételei           	3	['bevétele', '##i']
29866. igaz                	0	['igaz']
29867. ezek                	3	['ezek']
29868. az                  	0	['az']
29869. okmányhitelesítésből	0	['okmány', '##hitel', '##esítés', '##ből']
29870. és                  	0	['és']
29871. phare               	3	['ph', '##are']
29872. pályázatokból       	0	['pályázatok', '##

30738. ennek               	0	['ennek']
30739. pontos              	0	['pontos']
30740. mértékéről          	0	['mérték', '##éről']
30741. még                 	0	['még']
30742. nem                 	0	['nem']
30743. döntött             	0	['döntött']
30744. a                   	0	['a']
30745. kormány             	1	['kormány']
30746. ha                  	0	['ha']
30747. 15                  	0	['15']
30748. perc                	0	['perc']
30749. alatt               	0	['alatt']
30750. sikerülne           	0	['sikerül', '##ne']
30751. az                  	0	['az']
30752. átszállás           	3	['átsz', '##állás']
30753. a                   	0	['a']
30754. japan               	0	['ja', '##pan']
30755. _                   	0	['_']
30756. airlines            	0	['a', '##ir', '##line', '##s']
30757. járatával           	0	['járat', '##ával']
30758. japán               	0	['japán']
30759. idő                 	0	['idő']
30760. szerint             	0	['szerint']
30761. délután             	0	['d

31547. imára               	1	['im', '##ára']
31548. adrien              	0	['ad', '##rie', '##n']
31549. nem                 	0	['nem']
31550. hagyta              	0	['hagyta']
31551. ezt                 	0	['ezt']
31552. ennyiben            	3	['ennyi', '##ben']
31553. megmondta           	0	['megmond', '##ta']
31554. krisztiánnak        	1	['kr', '##iszt', '##ián', '##nak']
31555. bármely             	0	['bármely']
31556. részvényes          	0	['részvény', '##es']
31557. a                   	0	['a']
31558. közgyűlési          	0	['közgyűlés', '##i']
31559. jegyzőkönyvből      	0	['jegyzőkönyv', '##ből']
31560. kivonat             	0	['kivonat']
31561. vagy                	0	['vagy']
31562. másolat             	0	['másolat']
31563. kiadását            	0	['kiadás', '##át']
31564. kérheti             	0	['kérheti']
31565. az                  	0	['az']
31566. igazgatóságtól      	1	['igazgatóság', '##tól']
31567. ismét               	0	['ismét']
31568. forgalomba          	0	['forgalo

33075. van                 	0	['van']
33076. még                 	0	['még']
33077. a                   	0	['a']
33078. koránkelés          	1	['korán', '##kel', '##és']
33079. ezt                 	0	['ezt']
33080. a                   	0	['a']
33081. többiek             	0	['többiek']
33082. megszólják          	1	['megszól', '##ják']
33083. ez                  	0	['ez']
33084. az                  	0	['az']
33085. egy                 	0	['egy']
33086. nap                 	0	['nap']
33087. és                  	0	['és']
33088. a                   	0	['a']
33089. pár                 	0	['pár']
33090. óra                 	0	['óra']
33091. nem                 	0	['nem']
33092. csak                	0	['csak']
33093. érdekes             	3	['érdekes']
33094. de                  	0	['de']
33095. fárasztó            	3	['fárasztó']
33096. izgalmakban         	0	['izg', '##almak', '##ban']
33097. teli                	3	['teli']
33098. és                  	0	['és']
33099. tanulságos          	0	['

33580. beruházó            	0	['beruház', '##ó']
33581. cégek               	0	['cégek']
33582. azt                 	0	['azt']
33583. mondták             	3	['mondták']
33584. ha                  	0	['ha']
33585. az                  	0	['az']
33586. adót                	0	['adót']
33587. a                   	0	['a']
33588. tényleges           	0	['tényleges']
33589. forgalmi            	0	['forgalmi']
33590. érték               	3	['érték']
33591. s                   	0	['s']
33592. nem                 	0	['nem']
33593. az                  	0	['az']
33594. egységérték         	0	['egység', '##érték']
33595. alapján             	0	['alapján']
33596. szabják             	0	['szab', '##ják']
33597. meg                 	3	['meg']
33598. akkor               	0	['akkor']
33599. ausztriában         	0	['a', '##usztri', '##ában']
33600. rövidesen           	0	['rövidesen']
33601. nem                 	0	['nem']
33602. lesz                	0	['lesz']
33603. olyan               	0	['olyan']
33604

35122. hegy                	0	['hegy']
35123. lábához             	1	['láb', '##ához']
35124. a                   	0	['a']
35125. budapesti           	0	['budapesti']
35126. _                   	0	['_']
35127. értéktőzsde         	0	['érték', '##t', '##őzs', '##de']
35128. hivatalos           	0	['hivatalos']
35129. részvényindexe      	3	['részvény', '##index', '##e']
35130. a                   	0	['a']
35131. bux                 	0	['bu', '##x']
35132. 12                  	3	['12']
35133. 60                  	0	['60']
35134. pontos              	0	['pontos']
35135. csökkenéssel        	3	['csökkenés', '##sel']
35136. 6                   	1	['6']
35137. 866                 	3	['86', '##6']
35138. 41                  	0	['41']
35139. ponton              	0	['ponton']
35140. nyitott             	0	['nyitott']
35141. szerdán             	1	['szerdán']
35142. a                   	0	['a']
35143. cégbírósági         	0	['cég', '##bíróság', '##i']
35144. dokumentumok        	0	['dokumentumok

35906. mit                 	0	['mit']
35907. takar               	0	['takar']
35908. ez                  	0	['ez']
35909. a                   	0	['a']
35910. kettő               	1	['kettő']
35911. a                   	0	['a']
35912. domus               	0	['dom', '##us']
35913. _                   	0	['_']
35914. rt                  	3	['rt']
35915. ben                 	0	['ben']
35916. közvetlenül         	0	['közvetlenül']
35917. 408                 	1	['40', '##8']
35918. 133                 	0	['13', '##3']
35919. darab               	0	['darab']
35920. részvénnyel         	0	['rész', '##vénnyel']
35921. rendelkezik         	0	['rendelkezik']
35922. a                   	0	['a']
35923. discover            	0	['dis', '##co', '##ver']
35924. _                   	0	['_']
35925. europe              	0	['eur', '##op', '##e']
35926. _                   	0	['_']
35927. investments         	3	['in', '##vest', '##ment', '##s']
35928. amely               	0	['amely']
35929. 24               

37259. egyidőben           	0	['egy', '##időben']
37260. válnak              	0	['válnak']
37261. kötelezővé          	3	['kötelező', '##vé']
37262. de                  	0	['de']
37263. a                   	0	['a']
37264. társult             	0	['társul', '##t']
37265. tagságból           	0	['tagság', '##ból']
37266. következik          	0	['következik']
37267. a                   	0	['a']
37268. magyar              	0	['magyar']
37269. jog                 	0	['jog']
37270. európai             	0	['európai']
37271. joggal              	0	['joggal']
37272. való                	0	['való']
37273. fokozatos           	0	['fokozatos']
37274. harmonizációjának   	0	['harmon', '##izáció', '##jának']
37275. követelménye        	1	['követelmény', '##e']
37276. a                   	0	['a']
37277. gazdasági           	0	['gazdasági']
37278. társaság            	0	['társaság']
37279. legfőbb             	0	['legfőbb']
37280. szerve              	0	['szerve']
37281. első                	0	['első']

38121. szükségesnek        	0	['szükségesnek']
38122. tartja              	3	['tartja']
38123. hogy                	0	['hogy']
38124. most                	0	['most']
38125. azután              	0	['azután']
38126. sürgősen            	0	['sürgős', '##en']
38127. sienába             	0	['si', '##en', '##ába']
38128. utazzék             	3	['utaz', '##zék']
38129. s                   	0	['s']
38130. nézze               	0	['nézze']
38131. meg                 	0	['meg']
38132. a                   	0	['a']
38133. híres               	0	['híres']
38134. sienai              	0	['si', '##ena', '##i']
38135. primitíveket        	1	['prim', '##itív', '##eket']
38136. a                   	0	['a']
38137. budapest            	0	['bud', '##ape', '##st']
38138. _                   	0	['_']
38139. bank                	0	['bank']
38140. (                   	0	['(']
38141. bb                  	0	['bb']
38142. )                   	0	[')']
38143. áruhitelezéssel     	0	['áru', '##hitel', '##ezéssel']
381

38964. ervin               	1	['er', '##vin']
38965. már                 	0	['már']
38966. a                   	0	['a']
38967. bemelegítésnél      	0	['bem', '##eleg', '##ítés', '##nél']
38968. megkezdődött        	0	['megkezdődött']
38969. a                   	0	['a']
38970. szurkolók           	0	['szurkolók']
38971. hangpárbaja         	1	['hang', '##pár', '##baj', '##a']
38972. névre               	0	['névre']
38973. szóló               	0	['szóló']
38974. részvény            	0	['részvény']
38975. esetében            	0	['esetében']
38976. pedig               	0	['pedig']
38977. további             	0	['további']
38978. feltétel            	0	['feltétel']
38979. a                   	0	['a']
38980. részvénykönyvbe     	0	['részvény', '##könyv', '##be']
38981. (                   	0	['(']
38982. gt                  	1	['g', '##t']
38983. (                   	0	['(']
38984. új                  	0	['új']
38985. )                   	0	[')']
38986. 198                 	1	['198']
38987. 

39986. végrehajtása        	0	['végrehajtása']
39987. )                   	0	[')']
39988. kiegészítette       	0	['kiegészít', '##ette']
39989. egy                 	0	['egy']
39990. új                  	0	['új']
39991. szakasszal          	3	['szak', '##asszal']
39992. a                   	0	['a']
39993. 184                 	0	['184']
39994. /                   	0	['/']
39995. a                   	1	['a']
39996. par                 	3	['par']
39997. sal                 	1	['sal']
39998. azt                 	0	['azt']
39999. hittem              	0	['hittem']
40000. a                   	0	['a']
40001. reggel              	0	['reggel']
40002. után                	3	['után']
40003. hogy                	0	['hogy']
40004. pocsék              	0	['pocs', '##ék']
40005. napom               	0	['nap', '##om']
40006. lesz                	0	['lesz']
40007. de                  	0	['de']
40008. hála                	0	['hála']
40009. az                  	0	['az']
40010. égnek               	0	['ég',

41326. 101                 	1	['101']
41327. par                 	1	['par']
41328. (                   	0	['(']
41329. 3                   	0	['3']
41330. )                   	0	[')']
41331. bek                 	3	['bek']
41332. illetve             	0	['illetve']
41333. a                   	0	['a']
41334. 89                  	1	['89']
41335. par                 	1	['par']
41336. (                   	0	['(']
41337. 5                   	0	['5']
41338. )                   	0	[')']
41339. bek                 	1	['bek']
41340. alapján             	0	['alapján']
41341. az                  	0	['az']
41342. egyhangúságot       	0	['egyhangú', '##ságot']
41343. kívánó              	0	['kívánó']
41344. döntést             	3	['döntést']
41345. lehetőség           	0	['lehetőség']
41346. van                 	0	['van']
41347. arra                	3	['arra']
41348. hogy                	0	['hogy']
41349. ezek                	0	['ezek']
41350. a                   	0	['a']
41351. tagok               	

42342. csak                	0	['csak']
42343. vernét              	0	['ver', '##né', '##t']
42344. gúnyolta            	3	['gúny', '##olta']
42345. de                  	0	['de']
42346. a                   	0	['a']
42347. városi              	0	['városi']
42348. közlekedésről       	0	['közlekedés', '##ről']
42349. is                  	0	['is']
42350. máig                	0	['máig']
42351. érvényes            	0	['érvényes']
42352. véleményt           	0	['véleményt']
42353. mondott             	3	['mondott']
42354. amikor              	0	['amikor']
42355. 1912                	3	['191', '##2']
42356. ben                 	0	['ben']
42357. megírta             	0	['megírt', '##a']
42358. a                   	0	['a']
42359. _                   	0	['_']
42360. csömöri             	0	['cs', '##ömör', '##i']
42361. _                   	0	['_']
42362. úttól               	0	['útt', '##ól']
42363. _                   	0	['_']
42364. a                   	0	['a']
42365. _                   	0	['_'

43196. neki                	3	['neki']
43197. mert                	0	['mert']
43198. nem                 	0	['nem']
43199. sikerült            	0	['sikerült']
43200. tisztázni           	3	['tisztázni']
43201. hogy                	0	['hogy']
43202. milyen              	0	['milyen']
43203. arányban            	0	['arányban']
43204. támogatja           	0	['támogatja']
43205. a                   	0	['a']
43206. kormány             	0	['kormány']
43207. a                   	0	['a']
43208. dolgot              	1	['dolgot']
43209. először             	0	['először']
43210. kígyót              	0	['kígy', '##ót']
43211. táncoltatott        	0	['tánc', '##olta', '##to', '##tt']
43212. sípszó              	0	['síp', '##szó']
43213. mellett             	3	['mellett']
43214. azután              	0	['azután']
43215. teleszúrta          	0	['tele', '##sz', '##úrt', '##a']
43216. a                   	0	['a']
43217. testét              	0	['testét']
43218. tűkkel              	1	['tű', '##k', '##kel'

44078. mosolyog            	3	['mosolyog']
44079. és                  	0	['és']
44080. mintegy             	0	['mintegy']
44081. oda                 	0	['oda']
44082. sem                 	0	['sem']
44083. nézve               	3	['nézve']
44084. könnyedén           	0	['könnyedén']
44085. tölti               	0	['tölti']
44086. a                   	0	['a']
44087. teát                	3	['teát']
44088. de                  	0	['de']
44089. közben              	3	['közben']
44090. hogy                	3	['hogy']
44091. hogy                	0	['hogy']
44092. nem                 	3	['nem']
44093. a                   	0	['a']
44094. forró               	0	['forró']
44095. vízsugár            	0	['víz', '##sugár']
44096. egy                 	0	['egy']
44097. idős                	0	['idős']
44098. úr                  	0	['úr']
44099. kopasz              	0	['kop', '##asz']
44100. fejére              	0	['fej', '##ére']
44101. ömlik               	1	['öm', '##lik']
44102. mihály              	0	

44864. sem                 	0	['sem']
44865. lehet               	0	['lehet']
44866. eltérni             	1	['eltér', '##ni']
44867. az                  	0	['az']
44868. a                   	0	['a']
44869. gondolat            	0	['gondolat']
44870. nélküli             	0	['nélküli']
44871. gyengédség          	0	['gyengéd', '##ség']
44872. azonban             	3	['azonban']
44873. amely               	0	['amely']
44874. a                   	0	['a']
44875. mogyoróbokrok       	0	['mogyor', '##ób', '##ok', '##rok']
44876. mellett             	0	['mellett']
44877. fogta               	0	['fogta']
44878. el                  	3	['el']
44879. most                	0	['most']
44880. nem                 	0	['nem']
44881. lepte               	0	['lep', '##te']
44882. meg                 	0	['meg']
44883. újból               	1	['újból']
44884. (                   	0	['(']
44885. lásd                	0	['lásd']
44886. a                   	0	['a']
44887. 275                 	1	['27', '##5']
44888.

45761. megismerhetőségét   	0	['megismer', '##hetőség', '##ét']
45762. érintő              	0	['érintő']
45763. rendelkezést        	0	['rendelkezés', '##t']
45764. állapított          	0	['állap', '##ított']
45765. meg                 	3	['meg']
45766. amikor              	0	['amikor']
45767. a                   	0	['a']
45768. 2                   	1	['2']
45769. par                 	1	['par']
45770. (                   	0	['(']
45771. 1                   	0	['1']
45772. )                   	0	[')']
45773. bekezdésében        	0	['bekezdésében']
45774. megjelölt           	0	['megjelölt']
45775. szervek             	0	['szervek']
45776. és                  	0	['és']
45777. szervezetek         	0	['szervezetek']
45778. számára             	0	['számára']
45779. a                   	0	['a']
45780. művészeti           	0	['művészeti']
45781. alkotások           	0	['alkotások']
45782. beszerzését         	3	['beszerzés', '##ét']
45783. felhasználását      	0	['felhasználását']
45784. és  