# Generate word2vec model - include all new topic words

In [1]:
from gensim.models import Word2Vec, KeyedVectors
import gensim
import time
import numpy as np
from tqdm import tqdm
from pprint import pprint
import pickle
import spacy
import re
import operator
import spacy_udpipe

In [2]:
nlp = spacy.load('nl_core_news_sm')

In [2]:
# set variables 
LANG = 'nl'
MAX_WORDS = 500000  # maximum processed words to small model 

MODEL_DIR = '/mnt/data/data/models-fasttext/'
TOPICS_DIR = '/home/dzon/kajo/topics/topic_lists-based_on_en-US/'

model_filename = MODEL_DIR + 'cc.'+ LANG +'.300-lemma_500k_min2.vec.bin'

excluded_model_name = MODEL_DIR + 'cc.'+ LANG +'.300-lemma_500k_min2_excluded.vec.bin'

model_orig_filename = MODEL_DIR + 'cc.'+ LANG +'.300.vec.bin'
model_orig_filename_vec = MODEL_DIR + 'cc.'+ LANG +'.300.vec.gz'

pickled_words_lemmas = MODEL_DIR + LANG + '_ft_all_words_lemmas.pickle'

lemma_list_file = TOPICS_DIR + 'topics_lemma_'+ LANG +'.lst'
nolemma_list_file = TOPICS_DIR + 'topics_'+ LANG +'.lst'

excluded_filename = TOPICS_DIR + 'topics_' + LANG + '-not_in_model.lst'

lemma_list_file_excluded = TOPICS_DIR + 'topics_lemma_excluded_' + LANG + '.lst'
nolemma_list_file_excluded = TOPICS_DIR + 'topics_excluded_' + LANG + '.lst'


In [4]:
# load the big model
model_big = KeyedVectors.load_word2vec_format(model_orig_filename, binary=True)

In [5]:
# process all words in fasttext model  takes ~3h wirh spaCy model (~10min with UDPIPE model)
all_words_lemmas = []

lemmas = {}
word_lemma = {}
words = model_big.index2word
for word in tqdm(words):
    # skip "words" which are not regular words
    if not re.fullmatch("([^\d\W])+", word):
        continue
    doc = nlp(word)
    lemma = doc[0].lemma_.lower()
    all_words_lemmas.append((word, lemma))
print("Number of words in big model: ", len(all_words_lemmas))

#save pickled dump 
with open(pickled_words_lemmas, 'wb') as f:
    pickle.dump(all_words_lemmas, f)

100%|██████████| 2000000/2000000 [3:43:15<00:00, 149.31it/s]  


Number of words in big model:  1591867


In [6]:
#load pickled lemma list
with open(pickled_words_lemmas, 'rb') as f:
    all_words_lemmas = pickle.load(f)
pprint(all_words_lemmas[:50])

[('de', 'de'),
 ('van', 'van'),
 ('en', 'en'),
 ('een', 'een'),
 ('het', 'het'),
 ('in', 'in'),
 ('is', 'zijn'),
 ('op', 'op'),
 ('voor', 'voor'),
 ('met', 'met'),
 ('De', 'de'),
 ('te', 'te'),
 ('zijn', 'zijn'),
 ('dat', 'dat'),
 ('je', 'je'),
 ('die', 'die'),
 ('door', 'door'),
 ('aan', 'aan'),
 ('niet', 'niet'),
 ('of', 'of'),
 ('uit', 'uit'),
 ('om', 'om'),
 ('als', 'als'),
 ('Het', 'het'),
 ('ook', 'ook'),
 ('bij', 'bij'),
 ('naar', 'naar'),
 ('er', 'er'),
 ('was', 'zijn'),
 ('ik', 'ik'),
 ('werd', 'worden'),
 ('In', 'in'),
 ('wordt', 'worden'),
 ('maar', 'maar'),
 ('deze', 'deze'),
 ('tot', 'tot'),
 ('hij', 'hij'),
 ('worden', 'worden'),
 ('dan', 'dan'),
 ('over', 'over'),
 ('heeft', 'hebben'),
 ('nog', 'nog'),
 ('s', 's'),
 ('dit', 'dit'),
 ('kan', 'kunnen'),
 ('ze', 'ze'),
 ('meer', 'me'),
 ('u', 'u'),
 ('naam', 'naam'),
 ('wat', 'wat')]


In [7]:
# generate helpful dictionaries/lists
big_lemmas_set = set([l for (_,l) in all_words_lemmas])
print(len(big_lemmas_set))

big_words_set = set([w for (w,_) in all_words_lemmas])
print(len(big_words_set))

lemmas = {}
words_lower_orig = {}
big_lemma_word_dic = {}
big_word_lemma_dic = {}
for (w,l) in all_words_lemmas:
    big_word_lemma_dic[w] = l
    
    #dictionary of lowercase word -> all original words
    if w.lower() in words_lower_orig:
        words_lower_orig[w.lower()].append(w)
    else:
        words_lower_orig[w.lower()] = [w]
        
    if l in big_lemma_word_dic:
        big_lemma_word_dic[l].append(w)
        lemmas[l] += 1
    else:
        big_lemma_word_dic[l] = [w]
        lemmas[l] = 1
        
# load all the words from big model
words = model_big.wv.index2word
words_lower = [w.lower() for w in words]

#words_lemma = model_lemma_big.index2word       

1169653
1591867




In [8]:
# sort the lemmas from most frequent
sorted_lemmas = sorted(lemmas.items(), key=operator.itemgetter(1), reverse=True)
# trying first words
sorted_lemmas[:20]

[('zijn', 42),
 ('hebben', 37),
 ('goed', 33),
 ('gaan', 30),
 ('worden', 29),
 ('pop', 28),
 ('komen', 27),
 ('kijken', 27),
 ('doen', 26),
 ('willen', 26),
 ('leven', 26),
 ('huis', 25),
 ('man', 25),
 ('eten', 25),
 ('denken', 25),
 ('horen', 25),
 ('kunnen', 24),
 ('volgen', 24),
 ('geven', 24),
 ('snel', 24)]

In [9]:
# create vectors for the small models - average vectors for lemmas
# process only first MAX_WORDS in the big model
tmp_words = [None] * len(model_big.wv.index2word)
tmp_vecs = [None] * len(model_big.wv.index2word) 
for i,(word,lemma) in enumerate(all_words_lemmas[:MAX_WORDS]):
    lemma_words_list = big_lemma_word_dic[lemma]
    # add only lemmas made from at least 2 words
    if len(lemma_words_list)<2:
        continue
    tmp_vectors = []
    tmp_indexes = []
    error_with_word = False
    for word2 in lemma_words_list:
        try:
            tmp_vectors.append(model_big[word2])  
            tmp_indexes.append(model_big.vocab[word2].index)
        except:
            print(i, "error with ", word, " lemma ", lemma, "words", lemma_words_list)
            error_with_word = True
            continue
    if not error_with_word:
        try:
            tmp_words[min(tmp_indexes)] = lemma
            tmp_vecs[min(tmp_indexes)] = list(np.average(tmp_vectors, axis=0))
        except:
            print(i, "error with lemma ", lemma, " - words", lemma_words_list, " indexes: ", tmp_indexes)
            # note - we are processing first MAX_WORDS from the model after the filter out of the "non-words"
            # so some of the last words in that range may refer to words on bigger index than MAX_WORDS

# filter the lists (some positions remained None)
final_words = [i for i in tmp_words if i] 
final_vecs = [i for i in tmp_vecs if i != None] 

print(len(final_vecs), len(final_words))
len(final_vecs[0])  

del tmp_vecs
del tmp_words

  This is separate from the ipykernel package so we can avoid doing imports until
  after removing the cwd from sys.path.


165945 165945


In [10]:
# create new gensim word2vec model with the vectors:
new_vector_space = gensim.models.keyedvectors.Word2VecKeyedVectors(300)
new_vector_space.add(final_words,final_vecs)

In [13]:
# test the model
pprint(new_vector_space.most_similar('vader'))
pprint(new_vector_space.most_similar_cosmul(positive=['vrouw', 'koning'], negative=['man']))

[('moeder', 0.7843632698059082),
 ('zoon', 0.7707353830337524),
 ('grootvader', 0.7188552618026733),
 ('dochter', 0.7042664289474487),
 ('vaderlijk', 0.6708673238754272),
 ('kleinzoon', 0.633141279220581),
 ('broer', 0.6265909671783447),
 ('vaderschap', 0.6233826875686646),
 ('echtgenoot', 0.6167832016944885),
 ('kind', 0.6116095781326294)]
[('koningin', 0.925083577632904),
 ('koningsdochter', 0.8144248723983765),
 ('koningschap', 0.814302921295166),
 ('koningszoon', 0.8088672757148743),
 ('koningskind', 0.8056352734565735),
 ('dienaar', 0.7982543706893921),
 ('koningshuis', 0.7980857491493225),
 ('prinses', 0.7964479327201843),
 ('koninginnentitel', 0.795605480670929),
 ('echtgenoot', 0.7949511408805847)]


In [14]:
# save the model
new_vector_space.save_word2vec_format(model_filename, binary=True)

In [15]:
#model = KeyedVectors.load_word2vec_format(model_filename, binary=True)
model = new_vector_space
words_model = model.wv.index2word

  This is separate from the ipykernel package so we can avoid doing imports until


In [1]:
# load topic listst
with open(nolemma_list_file) as fp:
    topics_nolemma = fp.readlines() 
print(len(topics_nolemma))
    
# load the lemma list
# with open(lemma_list_file) as fp:
#    topics = fp.readlines()
# print(len(topics))

topics = []
# generate the lemma list
for topic in tqdm(topics_nolemma):
    topic = re.sub('\W',' ',topic)
    topic = re.sub('\ +',' ',topic)
    doc = nlp(topic.strip().lower())
    lemmas = []
        
    for token in doc:
        if token.is_stop:
            continue
        lemmas.append(token.lemma_)    
    if len(lemmas) == 0:
        print('lemmas = 0 ', topic)
    topics.append("_".join(lemmas))
    
print(len(topics))    
    
#write the lemma topic list
with open(lemma_list_file, 'wt', encoding='utf8') as f:
    for topic_lemma in topics:
        f.write(topic_lemma + "\n")    

NameError: name 'nolemma_list_file' is not defined

In [17]:
print(len(topics),len(topics_nolemma))  

5308 5308


In [18]:
#try if the topic-lemma words exist in the models  

words_to_manual_add = {}

for i, (topic, topic_nolemma) in enumerate(zip(topics, topics_nolemma)):
    # process the nolemma topic so we can see which word was lemmatized to which lemma
    topic_nolemma = re.sub('\W',' ',topic_nolemma)
    topic_nolemma = re.sub('\ +',' ',topic_nolemma)
    doc = nlp(topic_nolemma.strip().lower())
    nolemmas = []
    for token in doc:
        if token.is_stop:
            continue
        else:
            nolemmas.append(token.text)  
    
    topic = topic.strip()
    topic_words = topic.split('_')
    if len(topic_words) != len(nolemmas):
        print("!!!!! error - not equal length: ", nolemmas, topic_words)
        continue
    for word, word_nolemma in zip(topic_words, nolemmas):
        #print(word)
        found = 0
        if word in words_model:
            found = 1
            #print("l1")
        elif word in big_lemmas_set:
            found = 1
            print("l2", word)
        elif word in words_lower:
            found = 1
            print("l3", word)
        # nolemma words are in PL case probably not needed and all lemmas exist in lemma list
        elif word_nolemma in words_model:
            found = 1
            print("w1", word)
        elif word_nolemma in big_lemmas_set:
            found = 1
            print("w2", word)
        elif word_nolemma in words_lower:
            found = 1
            print("w3", word)

        if found == 0:
            print(i, 'needs to be added manually: ', word, " - ", word_nolemma, " - ", topic_nolemma.strip())
            if word not in words_to_manual_add:
                words_to_manual_add[word] = topic_nolemma.strip()
                    
print(len(words_to_manual_add))          

l2 landbouwlandschap
l2 landschapsplanning
25 needs to be added manually:  grondgebruiksplanning  -  grondgebruiksplanning  -  grondgebruiksplanning
l2 plattelandsbevolking
37 needs to be added manually:  midelbaar  -  midelbaar  -  midelbaar onderwijs
l2 bodemverdichting
l2 bodemdegradatie
l2 waterlichaam
l2 winderosie
48 needs to be added manually:  kustecosysteem  -  kustecosysteem  -  kustecosysteem
49 needs to be added manually:  zoetwaterecosysteem  -  zoetwaterecosysteem  -  zoetwaterecosysteem
52 needs to be added manually:  grondgebruiksplan  -  grondgebruiksplan  -  grondgebruiksplan
54 needs to be added manually:  binnenwatervervoer  -  binnenwatervervoer  -  binnenwatervervoer
55 needs to be added manually:  landbouwprij  -  landbouwprijs  -  landbouwprijs
l2 milieuverandering
l2 landbeheer
62 needs to be added manually:  waterbronnenbescherming  -  waterbronnenbescherming  -  waterbronnenbescherming
63 needs to be added manually:  motorvoertuigenindustrie  -  motorvoertuig

560 needs to be added manually:  zoetwatervervuiling  -  zoetwatervervuiling  -  zoetwatervervuiling
l2 pluimveefokkerij
562 needs to be added manually:  bodemcapaciteit  -  bodemcapaciteit  -  bodemcapaciteit
l2 milieumarkt
l2 landbouwgebouw
l2 milieuveiligheid
w2 bevolkingstren
l2 productiebeleid
589 needs to be added manually:  koelindustrie  -  koelindustrie  -  koelindustrie
592 needs to be added manually:  landbouwongedierte  -  landbouwongedierte  -  landbouwongedierte
l2 scheepswerktuigkunen
l2 ontwikkelingspatroon
l2 bodembiologie
606 needs to be added manually:  bodemstabiliteit  -  bodemstabiliteit  -  bodemstabiliteit
607 needs to be added manually:  bevloeiingslandbouw  -  bevloeiingslandbouw  -  bevloeiingslandbouw
l2 waterbescherming
614 needs to be added manually:  milieudoorlichting  -  milieudoorlichting  -  milieudoorlichting
l2 brakwater
l2 stadsstructuur
l2 landschapsherstel
l2 stralingseffect
628 needs to be added manually:  zoetwaterorganisme  -  zoetwaterorganis

1093 needs to be added manually:  milieugeneeskunen  -  milieugeneeskunde  -  milieugeneeskunde
1096 needs to be added manually:  verbruikersbescherming  -  verbruikersbescherming  -  verbruikersbescherming
l2 huisvestingsprogramma
l2 industriebond
l2 gezondheids
1113 needs to be added manually:  dienstverleningsgebied  -  dienstverleningsgebied  -  dienstverleningsgebied
1125 needs to be added manually:  milieupsychologie  -  milieupsychologie  -  milieupsychologie
1130 needs to be added manually:  stadsdruk  -  stadsdruk  -  stadsdruk
l2 bouwonderdeel
l2 soortbescherming
l2 milieubesef
l2 kooldioxien
1140 needs to be added manually:  zoetwatermeting  -  zoetwatermeting  -  zoetwatermeting
1148 needs to be added manually:  bosbouwwetgeving  -  bosbouwwetgeving  -  bosbouwwetgeving
1149 needs to be added manually:  bosaanplanting  -  bosaanplanting  -  plaatselijke bosaanplanting
1151 needs to be added manually:  afvalwetgeving  -  afvalwetgeving  -  afvalwetgeving
1153 needs to be add

1591 needs to be added manually:  landbouwgrondbezit  -  landbouwgrondbezit  -  landbouwgrondbezit
1597 needs to be added manually:  bedrijfsveiligheidsvoorschrift  -  bedrijfsveiligheidsvoorschrift  -  bedrijfsveiligheidsvoorschrift
l2 milieukwaliteitsnorm
1604 needs to be added manually:  afvalwaterkwaliteit  -  afvalwaterkwaliteit  -  afvalwaterkwaliteit
l2 eigendomsregister
l2 afvalwaterverwerking
l2 milieuhygiëne
1621 needs to be added manually:  internetzoekoptie  -  internetzoekoptie  -  Internetzoekoptie
1622 needs to be added manually:  aardgasexploratie  -  aardgasexploratie  -  aardgasexploratie
1623 needs to be added manually:  milieubeheerindicator  -  milieubeheerindicator  -  milieubeheerindicator
l2 landbouwwater
1626 needs to be added manually:  milieukwaliteitsdoelstelling  -  milieukwaliteitsdoelstelling  -  milieukwaliteitsdoelstelling
1627 needs to be added manually:  afvalwaterbelasting  -  afvalwaterbelasting  -  afvalwaterbelasting
l2 afvalwaterverwerking
1633 n

1862 needs to be added manually:  populatiestatistiek  -  populatiestatistieken  -  populatiestatistieken over in het wild levende planten en dieren
l2 bouwnorm
1868 needs to be added manually:  verwijzingsinformatiesysteem  -  verwijzingsinformatiesysteem  -  verwijzingsinformatiesysteem
l2 beheersprogramma
1872 needs to be added manually:  luchtverkeerswetgeving  -  luchtverkeerswetgeving  -  luchtverkeerswetgeving
l2 loodgehalte
1877 needs to be added manually:  bedrijfsorgaan  -  bedrijfsorgaan  -  publiekrechtelijk bedrijfsorgaan
l2 milieuplan
1882 needs to be added manually:  afvalverwijderingsindustrie  -  afvalverwijderingsindustrie  -  afvalverwijderingsindustrie
1883 needs to be added manually:  drinkwaterbeschermingsgebied  -  drinkwaterbeschermingsgebied  -  drinkwaterbeschermingsgebied
1886 needs to be added manually:  afvalwaterstatistieken  -  afvalwaterstatistieken  -  afvalwaterstatistieken
l2 tweedehandsgoeder
1896 needs to be added manually:  immissiebeheersingswet  

l2 plantenecologie
l2 bedrijfsgeneeskunen
2538 needs to be added manually:  grasbrand  -  grasbrand  -  grasbrand
2541 needs to be added manually:  estuariumvervuiling  -  estuariumvervuiling  -  estuariumvervuiling
2547 needs to be added manually:  toeristenvoorziening  -  toeristenvoorziening  -  toeristenvoorziening
l2 gegevenscentrum
2556 needs to be added manually:  bouwuitrusting  -  bouwuitrusting  -  bouwuitrusting
l2 verenigde
l3 naties
2567 needs to be added manually:  foktechniek  -  foktechniek  -  foktechniek
l2 controlenorm
2573 needs to be added manually:  slibstabilisatie  -  slibstabilisatie  -  slibstabilisatie
2575 needs to be added manually:  waarschuwingsplan  -  waarschuwingsplan  -  waarschuwingsplan
2576 needs to be added manually:  volgplan  -  volgplan  -  volgplan
l2 weginrichting
l2 seizoensmigratie
2595 needs to be added manually:  stranspiratie  -  stranspiratie  -  verdamping stranspiratie
2596 needs to be added manually:  zeewatercultuur  -  zeewatercult

3182 needs to be added manually:  soortverarming  -  soortverarming  -  soortverarming
3184 needs to be added manually:  landschapsherkenning  -  landschapsherkenning  -  landschapsherkenning
l3 warmt
3191 needs to be added manually:  giftigheidsboordeling  -  giftigheidsboordeling  -  giftigheidsboordeling
l2 afvalolie
l2 kristalliser
l2 woestijnsprinkhaan
3206 needs to be added manually:  verstooiing  -  verstooiing  -  verstooiing van verontreinigende stoffen
l2 afvalsortering
l2 mijnbouwproduct
3221 needs to be added manually:  cementvervaardiging  -  cementvervaardiging  -  cementvervaardiging
3223 needs to be added manually:  buikvoetig  -  buikvoetigen  -  buikvoetigen
l3 0
3232 needs to be added manually:  mededingingsregeling  -  mededingingsregeling  -  mededingingsregeling
l2 sportvoorziening
l2 metaalerts
l2 visplaats
3237 needs to be added manually:  machinetrilling  -  machinetrilling  -  machinetrilling
3241 needs to be added manually:  voedingsbalans  -  voedingsbalans 

l2 plantendeel
l2 zonnekrachtcentrale
3762 needs to be added manually:  omkeringslaag  -  omkeringslaag  -  omkeringslaag
3765 needs to be added manually:  monsternametechniek  -  monsternametechniek  -  monsternametechniek
3767 needs to be added manually:  ontchloring  -  ontchloring  -  ontchloring
3770 needs to be added manually:  dispersieberekening  -  dispersieberekening  -  dispersieberekening
l2 halfgeleid
l2 kleursamenstelling
3781 needs to be added manually:  smogwaarschuwing  -  smogwaarschuwing  -  smogwaarschuwing
3782 needs to be added manually:  immissiebeheersing  -  immissiebeheersing  -  immissiebeheersing
l2 kernbrandstof
l2 glasafval
3792 needs to be added manually:  remmingsbekken  -  remmingsbekken  -  remmingsbekken
l2 uitrustingsprogramma
l2 composteerbaar
l2 meettoestell
l2 aanpassingsperiode
3811 needs to be added manually:  loodverontreiniging  -  loodverontreiniging  -  loodverontreiniging
3814 needs to be added manually:  zoonosi  -  zoonosis  -  zoonosis
l

4318 needs to be added manually:  ammonificatie  -  ammonificatie  -  ammonificatie
l2 invoervergunning
l2 hydrobiologie
4330 needs to be added manually:  afvalinvoervergunning  -  afvalinvoervergunning  -  afvalinvoervergunning
4338 needs to be added manually:  zoutlading  -  zoutlading  -  zoutlading
l2 kanaalsluis
4355 needs to be added manually:  fosfaatvervangingsmiddel  -  fosfaatvervangingsmiddel  -  fosfaatvervangingsmiddel
4361 needs to be added manually:  beeldclassificatie  -  beeldclassificatie  -  beeldclassificatie
4362 needs to be added manually:  beeldclassificatie  -  beeldclassificatie  -  beeldclassificatie zonder toezicht
l2 oxyderenen
l2 embryogenese
4367 needs to be added manually:  elektrokinetica  -  elektrokinetica  -  elektrokinetica
4369 needs to be added manually:  afvalverwerkingsheffing  -  afvalverwerkingsheffing  -  afvalverwerkingsheffing
l2 kernongevall
4382 needs to be added manually:  droogontsmetting  -  droogontsmetting  -  droogontsmetting van zaa

l2 geluidssterken
l2 galvanisatie
l2 verzendbericht
l2 naverbranding
l2 ozonisatie
5068 needs to be added manually:  runderachtig  -  runderachtigen  -  runderachtigen
5071 needs to be added manually:  aërobiologie  -  aërobiologie  -  aërobiologie
l2 paleoklimatologie
5078 needs to be added manually:  reflectometrie  -  reflectometrie  -  reflectometrie
l2 alveole
l2 ongedieren
l2 basidiomycete
5094 needs to be added manually:  verambtelijking  -  verambtelijking  -  verambtelijking
5095 needs to be added manually:  polychloordibenzo  -  polychloordibenzo  -  polychloordibenzo p dioxine
5100 needs to be added manually:  polybroombifenyl  -  polybroombifenyl  -  polybroombifenyl
l2 polychloorbifenyl
5103 needs to be added manually:  bederfweren  -  bederfwerend  -  bederfwerend middel
5108 needs to be added manually:  algendodenen  -  algendodende  -  algendodende stof
l2 colorimetrie
l2 cyanaat
l2 vulcaniseren
5123 needs to be added manually:  olfactometrie  -  olfactometrie  -  olfac

In [19]:
# for manual correcting of words
pprint(words_to_manual_add)

{'aansprakelijkheidswetgeving': 'aansprakelijkheidswetgeving',
 'aanvangstraining': 'aanvangstraining',
 'aardgasexploratie': 'aardgasexploratie',
 'aardoliebronn': 'bescherming van de aardoliebronnen',
 'aardolieramp': 'aardolieramp',
 'abondantie': 'ecologische abondantie',
 'accumulatief': 'bio accumulatieve verontreinigende stof',
 'activiteitsrelatie': 'structuur activiteitsrelatie',
 'adsorbeerbar': 'gehalte aan adsorbeerbare organohalogenen AOX',
 'afbakeningsprocedure': 'afbakeningsprocedure',
 'afdekstro': 'afdekstro',
 'afgravingplaat': 'afgravingplaats',
 'afgravingskant': 'afgravingskant',
 'afstandsverwarming': 'afstandsverwarming',
 'afvalanalyse': 'afvalanalyse',
 'afvalbalan': 'afvalbalans',
 'afvalbeperking': 'afvalbeperking',
 'afvalcategorie': 'afvalcategorie',
 'afvalclassificatie': 'afvalclassificatie',
 'afvalgassenverspreiding': 'afvalgassenverspreiding',
 'afvalgebruik': 'afvalgebruik',
 'afvalinvoervergunning': 'afvalinvoervergunning',
 'afvalomzettingstechniek

In [20]:
# the lemmas not in model were manually checked if they exist in other models in some variation
word = "φυτοκομείο"
print(word)
try:
    model[word]
    print('model')
    pprint(model.most_similar(word))
except:
    pass

if word in big_lemmas_set:
    print('model_lemma_big', big_lemma_word_dic[word])

try:
    model_big[word]
    print('model big')
    pprint(model_big.most_similar(word))
except:
    pass

# if the original word with uppercase
if word in words_lower_orig:
    print('model big LOWER', words_lower_orig[word])
    pprint(model_big.most_similar(words_lower_orig[word]))
    

φυτοκομείο


In [21]:
# for cases the lemmas aren't correct or don't exist in the dic
# manually made dictionary of "lemma" : "word which exists in some model" or "word1;word2" for the average
# e.g. 'mikroekosystém': 'mikro;ekosystém', 'bahný': 'bahno'
new_words_manually_checked = {}
    
len(new_words_manually_checked)

0

In [22]:
# function which finds the word in all the available models and returns it's vector (average vector)
def get_vector(word):
    # word is in small model
    try:
        return model[word]
    except:
        pass
    
    # word is in lemmas from big model - return average if the lemma was result of more words
    if word in big_lemmas_set:
        lemma_words_list = big_lemma_word_dic[word]
        tmp_vectors = []
        for word2 in lemma_words_list:
            tmp_vectors.append(model_big[word2])  
        return np.average(tmp_vectors, axis=0)

    try:
        return model_big[word]
    except:
        pass
    
    # if the original word with uppercase
    if word in words_lower_orig:
        orig_words_list = words_lower_orig[word]
        tmp_vectors = []
        for word2 in orig_words_list:
            tmp_vectors.append(model_big[word2])  
        return np.average(tmp_vectors, axis=0)

        #return model_big[words_lower_orig[word]]
    
    return []

In [23]:
# check if the word vectors are the same
#get_vector('Antarktyki') == get_vector('antarktyki')
get_vector('διβενζοφουράνιο')

[]

In [24]:
# ading words from manually checked list
new_vectors = []
new_words = []
for i, word in enumerate(new_words_manually_checked.keys()):
    
    tmp_vectors = []
    print(i, word)
    for tmp_word in new_words_manually_checked[word].split(';'):
        vector = get_vector(tmp_word)
        if vector != []:
            tmp_vectors.append(vector)
        else:
            print("XXX - some ERROR, word doesn't have vector, cannot add: ", tmp_word)
    if word not in new_words:
        new_vectors.append(np.average(tmp_vectors, axis=0))
        new_words.append(word)
print(len(new_vectors),len(new_words))        

0 0


In [25]:
# add new words to the model
if len(new_words) > 0:
    model.add(new_words,new_vectors)

In [26]:
print(len(topics),len(topics_nolemma))  

5308 5308


In [27]:
# 2nd run - checking if there are still unavailable words in topics
excluded_topics = []
#try if the topic-lemma words exist in the model   

for i, (topic, topic_nolemma) in enumerate(zip(topics, topics_nolemma)):
    # process the nolemma topic so we can see which word was lemmatized to which lemma
    topic_nolemma_orig = topic_nolemma.strip()
    topic_nolemma = re.sub('\W',' ',topic_nolemma)
    topic_nolemma = re.sub('\ +',' ',topic_nolemma)
    doc = nlp(topic_nolemma.strip().lower())
    nolemmas = []
    for token in doc:
        if token.is_stop:
            continue
        else:
            nolemmas.append(token.text)  
    
    topic_words = topic.split('_')
    
    if len(topic_words) != len(nolemmas):
        print("!!!!! error - not equal length: ", nolemmas, topic_words)
        continue
        
    found = 1
    for word, word_nolemma in zip(topic_words, nolemmas):
    #for word in topic_words:
        #print(word)
       
        vector = get_vector(word)
        if vector == []:
            print('nonexistend word: ', word, " - ", topic_nolemma)
            vector2 = get_vector(word_nolemma)
            if vector2 == []:
                found = 0
                print('nonexistend word: ', word_nolemma, " - ", topic_nolemma)
            else:
                print("Exist nolemma")

    if found == 0:
        print('!!! topic needs to be excluded: ', topic_nolemma_orig)
        if topic_nolemma.strip() not in excluded_topics:
            excluded_topics.append(topic_nolemma_orig)
                    
print(len(excluded_topics)) 

nonexistend word:  grondgebruiksplanning  -  grondgebruiksplanning 
nonexistend word:  grondgebruiksplanning  -  grondgebruiksplanning 
!!! topic needs to be excluded:  grondgebruiksplanning




nonexistend word:  midelbaar  -  midelbaar onderwijs 
nonexistend word:  midelbaar  -  midelbaar onderwijs 
!!! topic needs to be excluded:  midelbaar onderwijs
nonexistend word:  kustecosysteem  -  kustecosysteem 
nonexistend word:  kustecosysteem  -  kustecosysteem 
!!! topic needs to be excluded:  kustecosysteem
nonexistend word:  zoetwaterecosysteem  -  zoetwaterecosysteem 
nonexistend word:  zoetwaterecosysteem  -  zoetwaterecosysteem 
!!! topic needs to be excluded:  zoetwaterecosysteem
nonexistend word:  grondgebruiksplan  -  grondgebruiksplan 
nonexistend word:  grondgebruiksplan  -  grondgebruiksplan 
!!! topic needs to be excluded:  grondgebruiksplan
nonexistend word:  binnenwatervervoer  -  binnenwatervervoer 
nonexistend word:  binnenwatervervoer  -  binnenwatervervoer 
!!! topic needs to be excluded:  binnenwatervervoer
nonexistend word:  landbouwprij  -  landbouwprijs 
nonexistend word:  landbouwprijs  -  landbouwprijs 
!!! topic needs to be excluded:  landbouwprijs
nonex

nonexistend word:  beleidsintegratie  -  beleidsintegratie 
nonexistend word:  beleidsintegratie  -  beleidsintegratie 
!!! topic needs to be excluded:  beleidsintegratie
nonexistend word:  voedselvervo  -  voedselvervoer 
nonexistend word:  voedselvervoer  -  voedselvervoer 
!!! topic needs to be excluded:  voedselvervoer
nonexistend word:  stadsvoorziening  -  stadsvoorziening 
nonexistend word:  stadsvoorziening  -  stadsvoorziening 
!!! topic needs to be excluded:  stadsvoorziening
nonexistend word:  stadsvervuiler  -  stadsvervuiler 
nonexistend word:  stadsvervuiler  -  stadsvervuiler 
!!! topic needs to be excluded:  stadsvervuiler
nonexistend word:  dierenfysiologie  -  dierenfysiologie 
nonexistend word:  dierenfysiologie  -  dierenfysiologie 
!!! topic needs to be excluded:  dierenfysiologie
nonexistend word:  luchtruimtelijk  -  luchtruimtelijke planning 
nonexistend word:  luchtruimtelijke  -  luchtruimtelijke planning 
!!! topic needs to be excluded:  luchtruimtelijke plan



nonexistend word:  zoetwaterorganisme  -  zoetwaterorganisme 
nonexistend word:  zoetwaterorganisme  -  zoetwaterorganisme 
!!! topic needs to be excluded:  zoetwaterorganisme
nonexistend word:  milieubewaking  -  milieubewaking 
nonexistend word:  milieubewaking  -  milieubewaking 
!!! topic needs to be excluded:  milieubewaking
nonexistend word:  landvorming  -  landvorming 
nonexistend word:  landvorming  -  landvorming 
!!! topic needs to be excluded:  landvorming
nonexistend word:  vervoersvoorschrift  -  vervoersvoorschrift 
nonexistend word:  vervoersvoorschrift  -  vervoersvoorschrift 
!!! topic needs to be excluded:  vervoersvoorschrift
nonexistend word:  mijnbouwvoorschrift  -  mijnbouwvoorschrift 
nonexistend word:  mijnbouwvoorschrift  -  mijnbouwvoorschrift 
!!! topic needs to be excluded:  mijnbouwvoorschrift
nonexistend word:  landecologie  -  landecologie 
nonexistend word:  landecologie  -  landecologie 
!!! topic needs to be excluded:  landecologie
nonexistend word:  

nonexistend word:  afvaltranvervoer  -  afvaltranvervoer 
nonexistend word:  afvaltranvervoer  -  afvaltranvervoer 
!!! topic needs to be excluded:  afvaltranvervoer
nonexistend word:  milieuberoep  -  milieuberoep 
nonexistend word:  milieuberoep  -  milieuberoep 
!!! topic needs to be excluded:  milieuberoep
nonexistend word:  percolatiewater  -  percolatiewater 
nonexistend word:  percolatiewater  -  percolatiewater 
!!! topic needs to be excluded:  percolatiewater
nonexistend word:  remot  -  remote sensing 
Exist nolemma
nonexistend word:  dierenreservaat  -  dierenreservaat 
nonexistend word:  dierenreservaat  -  dierenreservaat 
!!! topic needs to be excluded:  dierenreservaat
nonexistend word:  rubberverwerking  -  rubberverwerking 
nonexistend word:  rubberverwerking  -  rubberverwerking 
!!! topic needs to be excluded:  rubberverwerking
nonexistend word:  terraslandschap  -  terraslandschap 
nonexistend word:  terraslandschap  -  terraslandschap 
!!! topic needs to be exclude

nonexistend word:  marktpreparaat  -  marktpreparaat 
nonexistend word:  marktpreparaat  -  marktpreparaat 
!!! topic needs to be excluded:  marktpreparaat
nonexistend word:  milieubeeld  -  milieubeeld 
nonexistend word:  milieubeeld  -  milieubeeld 
!!! topic needs to be excluded:  milieubeeld
nonexistend word:  fysico  -  fysico chemische processen 
nonexistend word:  fysico  -  fysico chemische processen 
!!! topic needs to be excluded:  fysico-chemische processen
nonexistend word:  thermoselect  -  thermoselect proces 
nonexistend word:  thermoselect  -  thermoselect proces 
!!! topic needs to be excluded:  thermoselect proces
nonexistend word:  bosbouweenheid  -  bosbouweenheid 
nonexistend word:  bosbouweenheid  -  bosbouweenheid 
!!! topic needs to be excluded:  bosbouweenheid
nonexistend word:  watergegeven  -  watergegevens 
nonexistend word:  watergegevens  -  watergegevens 
!!! topic needs to be excluded:  watergegevens
nonexistend word:  milieuonderneming  -  milieuonderne

nonexistend word:  rivierbekkenontwikkeling  -  rivierbekkenontwikkeling 
nonexistend word:  rivierbekkenontwikkeling  -  rivierbekkenontwikkeling 
!!! topic needs to be excluded:  rivierbekkenontwikkeling
nonexistend word:  informatietechnologiesector  -  informatietechnologiesector 
nonexistend word:  informatietechnologiesector  -  informatietechnologiesector 
!!! topic needs to be excluded:  informatietechnologiesector
nonexistend word:  koolzuurheffing  -  koolzuurheffing 
nonexistend word:  koolzuurheffing  -  koolzuurheffing 
!!! topic needs to be excluded:  koolzuurheffing
nonexistend word:  afvalwatervermindering  -  afvalwatervermindering 
nonexistend word:  afvalwatervermindering  -  afvalwatervermindering 
!!! topic needs to be excluded:  afvalwatervermindering
nonexistend word:  afvalwaterslib  -  afvalwaterslib 
nonexistend word:  afvalwaterslib  -  afvalwaterslib 
!!! topic needs to be excluded:  afvalwaterslib
nonexistend word:  afvalwaterheffing  -  afvalwaterheffing 


nonexistend word:  luchtkwaliteitscontrole  -  luchtkwaliteitscontrole 
!!! topic needs to be excluded:  luchtkwaliteitscontrole
nonexistend word:  milieumonsterdepot  -  milieumonsterdepot 
nonexistend word:  milieumonsterdepot  -  milieumonsterdepot 
!!! topic needs to be excluded:  milieumonsterdepot
nonexistend word:  milieubeschermingsadvie  -  milieubeschermingsadvies 
nonexistend word:  milieubeschermingsadvies  -  milieubeschermingsadvies 
!!! topic needs to be excluded:  milieubeschermingsadvies
nonexistend word:  effectrelatie  -  dosis effectrelatie 
nonexistend word:  effectrelatie  -  dosis effectrelatie 
!!! topic needs to be excluded:  dosis-effectrelatie
nonexistend word:  luchtverkeersregelgeving  -  luchtverkeersregelgeving 
nonexistend word:  luchtverkeersregelgeving  -  luchtverkeersregelgeving 
!!! topic needs to be excluded:  luchtverkeersregelgeving
nonexistend word:  miliehygiëne  -  onderzoek effect op miliehygiëne 
nonexistend word:  miliehygiëne  -  onderzoek

nonexistend word:  kostentoename  -  kostentoename 
nonexistend word:  kostentoename  -  kostentoename 
!!! topic needs to be excluded:  kostentoename
nonexistend word:  marktgewas  -  marktgewas 
nonexistend word:  marktgewas  -  marktgewas 
!!! topic needs to be excluded:  marktgewas
nonexistend word:  aanvangstraining  -  aanvangstraining 
nonexistend word:  aanvangstraining  -  aanvangstraining 
!!! topic needs to be excluded:  aanvangstraining
nonexistend word:  zeenavigatie  -  zeenavigatie 
nonexistend word:  zeenavigatie  -  zeenavigatie 
!!! topic needs to be excluded:  zeenavigatie
nonexistend word:  aziê  -  Westelijk Aziê 
nonexistend word:  aziê  -  Westelijk Aziê 
!!! topic needs to be excluded:  Westelijk Aziê
nonexistend word:  bosaanplanting  -  bosaanplanting 
nonexistend word:  bosaanplanting  -  bosaanplanting 
!!! topic needs to be excluded:  bosaanplanting
nonexistend word:  afvalverwerkingkost  -  afvalverwerkingkost 
nonexistend word:  afvalverwerkingkost  -  af

nonexistend word:  toeristenopvang  -  toeristenopvang 
nonexistend word:  toeristenopvang  -  toeristenopvang 
!!! topic needs to be excluded:  toeristenopvang
nonexistend word:  insektenbestrijdingsmiddeel  -  gebruik van insektenbestrijdingsmiddelen 
nonexistend word:  insektenbestrijdingsmiddelen  -  gebruik van insektenbestrijdingsmiddelen 
!!! topic needs to be excluded:  gebruik van insektenbestrijdingsmiddelen
nonexistend word:  zuidbetrekkingen  -  Noord Zuidbetrekkingen 
nonexistend word:  zuidbetrekkingen  -  Noord Zuidbetrekkingen 
!!! topic needs to be excluded:  Noord-Zuidbetrekkingen
nonexistend word:  aggregaatonttrekking  -  aggregaatonttrekking 
nonexistend word:  aggregaatonttrekking  -  aggregaatonttrekking 
!!! topic needs to be excluded:  aggregaatonttrekking
nonexistend word:  oxydeerbar  -  oxydeerbare stof 
nonexistend word:  oxydeerbare  -  oxydeerbare stof 
!!! topic needs to be excluded:  oxydeerbare stof
nonexistend word:  herbegroeiing  -  herbegroeiing 
n

nonexistend word:  geluidsbeperking  -  geluidsbeperking 
nonexistend word:  geluidsbeperking  -  geluidsbeperking 
!!! topic needs to be excluded:  geluidsbeperking
nonexistend word:  noordatlantisch  -  Noordatlantische Oceaan 
Exist nolemma
nonexistend word:  verrottingsproduct  -  verrottingsproduct 
nonexistend word:  verrottingsproduct  -  verrottingsproduct 
!!! topic needs to be excluded:  verrottingsproduct
nonexistend word:  afdekstro  -  afdekstro 
nonexistend word:  afdekstro  -  afdekstro 
!!! topic needs to be excluded:  afdekstro
nonexistend word:  ziektenleer  -  menselijke ziektenleer 
nonexistend word:  ziektenleer  -  menselijke ziektenleer 
!!! topic needs to be excluded:  menselijke ziektenleer
nonexistend word:  schaapachtigen  -  schaapachtigen 
nonexistend word:  schaapachtigen  -  schaapachtigen 
!!! topic needs to be excluded:  schaapachtigen
nonexistend word:  productreklame  -  productreklame 
nonexistend word:  productreklame  -  productreklame 
!!! topic n

nonexistend word:  kringloopplastic  -  kringloopplastic 
nonexistend word:  kringloopplastic  -  kringloopplastic 
!!! topic needs to be excluded:  kringloopplastic
nonexistend word:  afvalanalyse  -  afvalanalyse 
nonexistend word:  afvalanalyse  -  afvalanalyse 
!!! topic needs to be excluded:  afvalanalyse
nonexistend word:  delfstofafzetting  -  delfstofafzetting 
nonexistend word:  delfstofafzetting  -  delfstofafzetting 
!!! topic needs to be excluded:  delfstofafzetting
nonexistend word:  heffingsonderscheid  -  heffingsonderscheid 
nonexistend word:  heffingsonderscheid  -  heffingsonderscheid 
!!! topic needs to be excluded:  heffingsonderscheid
nonexistend word:  productvoorlichting  -  productvoorlichting 
nonexistend word:  productvoorlichting  -  productvoorlichting 
!!! topic needs to be excluded:  productvoorlichting
nonexistend word:  noodhulpmaatregel  -  noodhulpmaatregel 
nonexistend word:  noodhulpmaatregel  -  noodhulpmaatregel 
!!! topic needs to be excluded:  no

nonexistend word:  corrosiekracht  -  chemische corrosiekracht 
nonexistend word:  corrosiekracht  -  chemische corrosiekracht 
!!! topic needs to be excluded:  chemische corrosiekracht
nonexistend word:  silicoonverbinding  -  organische silicoonverbinding 
nonexistend word:  silicoonverbinding  -  organische silicoonverbinding 
!!! topic needs to be excluded:  organische silicoonverbinding
nonexistend word:  schademinimalisering  -  schademinimalisering 
nonexistend word:  schademinimalisering  -  schademinimalisering 
!!! topic needs to be excluded:  schademinimalisering
nonexistend word:  tijdstoewijzing  -  tijdstoewijzing 
nonexistend word:  tijdstoewijzing  -  tijdstoewijzing 
!!! topic needs to be excluded:  tijdstoewijzing
nonexistend word:  informatiedistributiecentrum  -  informatiedistributiecentrum 
nonexistend word:  informatiedistributiecentrum  -  informatiedistributiecentrum 
!!! topic needs to be excluded:  informatiedistributiecentrum
nonexistend word:  accumulatief 

nonexistend word:  afvalverwerkingswet  -  afvalverwerkingswet 
nonexistend word:  afvalverwerkingswet  -  afvalverwerkingswet 
!!! topic needs to be excluded:  afvalverwerkingswet
nonexistend word:  restslib  -  restslib 
nonexistend word:  restslib  -  restslib 
!!! topic needs to be excluded:  restslib
nonexistend word:  afvalsorteringseenheid  -  afvalsorteringseenheid 
nonexistend word:  afvalsorteringseenheid  -  afvalsorteringseenheid 
!!! topic needs to be excluded:  afvalsorteringseenheid
nonexistend word:  verwijzingsinformatie  -  verwijzingsinformatie 
nonexistend word:  verwijzingsinformatie  -  verwijzingsinformatie 
!!! topic needs to be excluded:  verwijzingsinformatie
nonexistend word:  microklimatologie  -  microklimatologie 
nonexistend word:  microklimatologie  -  microklimatologie 
!!! topic needs to be excluded:  microklimatologie
nonexistend word:  farmacokinetica  -  farmacokinetica 
nonexistend word:  farmacokinetica  -  farmacokinetica 
!!! topic needs to be e

nonexistend word:  drijfnetvisserij  -  drijfnetvisserij 
nonexistend word:  drijfnetvisserij  -  drijfnetvisserij 
!!! topic needs to be excluded:  drijfnetvisserij
nonexistend word:  blootstellingsgren  -  toegestane blootstellingsgrens 
nonexistend word:  blootstellingsgrens  -  toegestane blootstellingsgrens 
!!! topic needs to be excluded:  toegestane blootstellingsgrens
nonexistend word:  oliebindenen  -  oliebindende stof 
nonexistend word:  oliebindende  -  oliebindende stof 
!!! topic needs to be excluded:  oliebindende stof
nonexistend word:  colubrid  -  Colubriden 
nonexistend word:  colubriden  -  Colubriden 
!!! topic needs to be excluded:  Colubriden
nonexistend word:  verfkamer  -  verfkamer 
nonexistend word:  verfkamer  -  verfkamer 
!!! topic needs to be excluded:  verfkamer
nonexistend word:  metingscriterium  -  metingscriterium 
nonexistend word:  metingscriterium  -  metingscriterium 
!!! topic needs to be excluded:  metingscriterium
nonexistend word:  belastings

nonexistend word:  inventarisatiegid  -  inventarisatiegids emissie van luchtverontreinigende stoffen 
nonexistend word:  inventarisatiegids  -  inventarisatiegids emissie van luchtverontreinigende stoffen 
nonexistend word:  luchtverontreinigend  -  inventarisatiegids emissie van luchtverontreinigende stoffen 
Exist nolemma
!!! topic needs to be excluded:  inventarisatiegids emissie van luchtverontreinigende stoffen
nonexistend word:  zwemwaterwetgeving  -  zwemwaterwetgeving 
nonexistend word:  zwemwaterwetgeving  -  zwemwaterwetgeving 
!!! topic needs to be excluded:  zwemwaterwetgeving
nonexistend word:  samenwerkingsconsumptie  -  samenwerkingsconsumptie 
nonexistend word:  samenwerkingsconsumptie  -  samenwerkingsconsumptie 
!!! topic needs to be excluded:  samenwerkingsconsumptie
nonexistend word:  akkerlandbeheer  -  akkerlandbeheer 
nonexistend word:  akkerlandbeheer  -  akkerlandbeheer 
!!! topic needs to be excluded:  akkerlandbeheer
nonexistend word:  rampenrisico  -  rampe

In [28]:
# save topics containing words which are not present neither model - to be excluded from the topic list
print('excluded topics: ', len(excluded_topics))
pprint(excluded_topics)
with open(excluded_filename, 'wt', encoding='utf8') as f:
    for topic in excluded_topics:
        f.write(topic + "\n")

excluded topics:  721
['grondgebruiksplanning',
 'midelbaar onderwijs',
 'kustecosysteem',
 'zoetwaterecosysteem',
 'grondgebruiksplan',
 'binnenwatervervoer',
 'landbouwprijs',
 'waterbronnenbescherming',
 'motorvoertuigenindustrie',
 'plattelandsbeheer en planning',
 'oppervlaktewaterbeheer',
 'natuurbehoudsprogramma',
 'natuurbehoudswetgeving',
 'landbouwproductiemiddelen',
 'milieubeschermingsverordening',
 'grondgebruiksregime',
 'duurzame ontwikkelingsindicator',
 'kustmilieu',
 'bodemverzilting',
 'plantegroei',
 'watertoezicht',
 'bodemuitloging',
 'landomgeving',
 'gewassenteelt',
 'kredietbijstand',
 'terreinsanering',
 'bosproductie',
 'landbouwplanning',
 'milieuonderhoud',
 'geweststructuur',
 'beveiligingsstelsel',
 'zoetwaterdegradatie',
 'landbouwopslag',
 'voedselhandel',
 'dierenhuisvesting',
 'bodembemesting',
 'landherstel',
 'landbouwuitrusting',
 'landbouwbeheer',
 'voedselbewaring',
 'bodemmineralogie',
 'zoetwaterbescherming',
 'landschapsgebruik',
 'grondverhar

In [29]:
# create new lists which don't containt topics with non-existent words

# load list with excluded topics
with open(excluded_filename, 'rt', encoding='utf8') as fp:
    tmp_topics = fp.readlines()
excluded_set = set()
for topic in tmp_topics:
    excluded_set.add(topic.strip())

with open(nolemma_list_file, 'rt', encoding='utf8') as fp:
        topics_file = fp.readlines()

topics_final = []
topics_lemma = []

excluded = 0
for topic in topics_file:
    topic_orig = topic.strip()
    if topic_orig in excluded_set:
        print("=== EXCLUDE ", topic_orig)
        excluded += 1
        continue
    topic = re.sub('\W',' ',topic)
    topic = re.sub('\ +',' ',topic)
    doc = nlp(topic.strip().lower())
    lemmas = []

    for token in doc:
        if token.is_stop:
            continue
        lemmas.append(token.lemma_)    
    topics_lemma.append("_".join(lemmas))
    topics_final.append(topic_orig)

    print(topic_orig, ' --- ', "_".join(lemmas))

print('Excluded: ', excluded)
print('Final topics: ', len(topics_lemma), len(topics_final))
    
with open(lemma_list_file_excluded, 'wt', encoding='utf8') as f:
    for topic_lemma in topics_lemma:
        f.write(topic_lemma + "\n")
with open(nolemma_list_file_excluded, 'wt', encoding='utf8') as f:
    for topic_final in topics_final:
        f.write(topic_final + "\n")  

plaatselijke ontwikkeling  ---  plaatselijk_ontwikkeling
plattelandsontwikkeling  ---  plattelandsontwikkeling
beheer van de waterbronnen  ---  beheer_waterbron
opleidingsniveau  ---  opleidingsniveau
algemeen onderwijs  ---  algemeen_onderwijs
bank  ---  bank
wet van de Europese Gemeenschap  ---  wet_europees_gemeenschap
cultureel erfgoed  ---  cultureel_erfgoed
landbouwgrond  ---  landbouwgrond
landbouwlandschap  ---  landbouwlandschap
landbouwproductie  ---  landbouwproductie
economische ontwikkeling  ---  economisch_ontwikkeling
voedselketen  ---  voedselketen
voedingsmiddelenindustrie  ---  voedingsmiddelenindustrie
voedselkwaliteit  ---  voedselkwaliteit
wereldwijde opwarming  ---  wereldwijd_opwarming
broeikaseffect  ---  broeikaseffect
industriële ontwikkeling  ---  industrieel_ontwikkeling
arbeidsmarkt  ---  arbeidsmarkt
toegang tot land  ---  toegang_land
ruilverkaveling  ---  ruilverkaveling
landinrichting  ---  landinrichting
landschapsarchitectuur  ---  landschapsarchitect

achteruitgang van het ecosysteem  ---  achteruitgang_ecosysteem
kledingindustrie  ---  kledingindustrie
aardewerkindustrie  ---  aardewerkindustrie
markteconomie  ---  markteconomie
milieubeheer  ---  milieubeheer
softwareontwikkeling  ---  softwareontwikkeling
=== EXCLUDE  landbouwopslag
akkerbouw  ---  akkerbouw
landbouwproduct  ---  landbouwproduct
klimaatschommeling  ---  klimaatschommeling
landbouweconomie  ---  landbouweconomie
landinrichting  ---  landinrichting
industriële planning  ---  industrieel_planning
economische planning  ---  economisch_planning
architectuur  ---  architectuur
=== EXCLUDE  voedselhandel
bodemtextuur  ---  bodemtextuur
voedseltechnologie  ---  voedseltechnologie
milieuplanning  ---  milieuplanning
landbouwtechniek  ---  landbouwtechniek
zuivelindustrie  ---  zuivelindustrie
regenwater  ---  regenwater
gronddruk  ---  gronddruk
farmaceutische industrie  ---  farmaceutisch_industrie
=== EXCLUDE  dierenhuisvesting
bevolkingsstructuur  ---  bevolkingsstruct

zuivering door de grond  ---  zuivering_grond
grondverbetering  ---  grondverbetering
mariene geologie  ---  marien_geologie
beschermingssysteem  ---  beschermingssysteem
industriële processen  ---  industrieel_proces
afbraak van verontreinigende stoffen  ---  afbraak_verontreinigen_stof
energie-industrie  ---  energie_industrie
milieu-industrie  ---  milieu_industrie
afwateren  ---  afwateren
inkomen  ---  inkomen
=== EXCLUDE  plaatsbescherming
rivierbeheer  ---  rivierbeheer
wind  ---  wind
vrij toegankelijke informatie  ---  toegankelijk_informatie
=== EXCLUDE  bodemproces
proceswater  ---  proceswater
watervoorziening  ---  watervoorziening
industriegebied  ---  industriegebied
opberging te land  ---  opberging_land
warmte (fysica)  ---  warmt_fysica
ecologische (levens)gemeenschap  ---  ecologisch_leven_gemeenschap
personenvervoer  ---  personenvervoer
inschatting van (natuurlijke) hulpbronnen  ---  inschatting_natuurlijk_hulpbron
het opstellen van economische prognoses  ---  opst

marketing  ---  marketing
personenwagen  ---  personenwagen
landbouwmachine  ---  landbouwmachine
gezondheidswetgeving  ---  gezondheidswetgeving
=== EXCLUDE  mijnbouwvoorschrift
afvalwater  ---  afvalwater
overheidsopdracht  ---  overheidsopdracht
goederen en diensten  ---  goed_dienst
bodemlaag  ---  bodemlaag
industriële economie  ---  industrieel_economie
=== EXCLUDE  landecologie
sociale omstandigheden  ---  sociaal_omstandigheid
waterdier  ---  waterdier
biologische (hulp)bronnen  ---  biologisch_hulp_bronnen
leefomgeving  ---  leefomgeving
sociale kosten  ---  sociaal_kost
markt  ---  markt
grondwaarde  ---  grondwaaren
werkgelegenheid  ---  werkgelegenheid
privaat domein  ---  privaat_domein
staatsdomein  ---  staatsdomein
=== EXCLUDE  vacuümindustrie
dierlijke erfelijkheidsleer  ---  dierlijk_erfelijkheidsleer
bouwtechnologie  ---  bouwtechnologie
onderwijsplanning  ---  onderwijsplanning
nieuwe gemeente  ---  nieuw_gemeente
ruimtelijke verdeling  ---  ruimtelijk_verdeling
bes

arbeidsrecht  ---  arbeidsrecht
=== EXCLUDE  milieuterminologie
nederzetting in het platteland  ---  nederzetting_platteland
Arctisch gebied  ---  arctisch_gebied
geschiedkundige evolutie  ---  geschiedkundig_evolutie
milieu-investering  ---  milieu_investering
prioriteit op milieugebied  ---  prioriteit_milieugebied
milieugegevens  ---  milieugegeven
natuurramp  ---  natuurramp
=== EXCLUDE  milieustimuleringsmaatregel
nederzetting  ---  nederzetting
planologische maatregel  ---  planologisch_maatregel
dierengedrag  ---  dierengedrag
marktonderzoek  ---  marktonderzoek
=== EXCLUDE  beroepsgroenteteelt
=== EXCLUDE  plantenstand
demineralisatie van water  ---  demineralisatie_water
wetshandhaving  ---  wetshandhaving
jeugdwerk  ---  jeugdwerk
uitvoeringswet  ---  uitvoeringswet
=== EXCLUDE  milieuangst
openbare instelling  ---  openbaar_instelling
steenkoolindustrie  ---  steenkoolindustrie
industrieel slib  ---  industrieel_slib
gemeenschap  ---  gemeenschap
sociale analyse  ---  sociaa

arbeid  ---  arbeid
=== EXCLUDE  verbruikersbescherming
warm water  ---  warm_water
boekhoudsysteem  ---  boekhoudsysteem
geluidsniveau  ---  geluidsniveau
organische stof  ---  organisch_stof
huisvestingsprogramma  ---  huisvestingsprogramma
stacaravan  ---  stacaravan
meststoffenwet  ---  meststoffenwet
kwaliteitsbewaking  ---  kwaliteitsbewaking
woestijnklimaat  ---  woestijnklimaat
industriebond  ---  industriebond
wild dier  ---  wild_dier
bodemprofiel  ---  bodemprofiel
beschermd landschap  ---  beschermen_landschap
sociale voorziening  ---  sociaal_voorziening
(gezondheids)zorginstelling  ---  gezondheids_zorginstelling
Caraïbische Zee  ---  caraïbisch_zee
=== EXCLUDE  dienstverleningsgebied
openbare hoorzitting  ---  openbaar_hoorzitting
medische wetenschappen  ---  medisch_wetenschap
sociale wetenschappen  ---  sociaal_wetenschap
inheemse technologie  ---  inheems_technologie
overheidsschuld  ---  overheidsschuld
geprefabriceerd gebouw  ---  prefabriceren_gebouw
stadsvernieuwi

familierecht  ---  familierecht
economische concentratie  ---  economisch_concentratie
afgevaardigd beheer  ---  afvaardigen_beheer
dichting  ---  dichting
chemisch beleid  ---  chemisch_beleid
=== EXCLUDE  milieuongeluk
gezondmaking van het milieu  ---  gezondmaking_milieu
=== EXCLUDE  vervoersbestemming
=== EXCLUDE  zeeschatten
natuurlijke regeneratie  ---  natuurlijk_regeneratie
belastingbeleid  ---  belastingbeleid
=== EXCLUDE  ruimwater
informatieverwerking  ---  informatieverwerking
MER-wet  ---  m_wet
distilleerderijen  ---  distilleerderij
=== EXCLUDE  pyschosomatisch effect
steriliseren  ---  steriliser
=== EXCLUDE  afwateringssyteem
=== EXCLUDE  herstellingsbedrijf
=== EXCLUDE  overmatige planktongroei (zee)
inklinking  ---  inklinking
veiligheidsnorm  ---  veiligheidsnorm
onder druk staand gebied  ---  druk_staand_gebied
=== EXCLUDE  energieprocessen
verdringing van dieren  ---  verdringing_dier
natuurlijk risico  ---  natuurlijk_risico
=== EXCLUDE  sedimentvervoer
bouwbelei

wetgeving inzake chemische stoffen die een invloed hebben op het milieu  ---  wetgeving_chemisch_stof_invloed_milieu
het oplossen van milieuproblemen  ---  oplossen_milieuprobleem
=== EXCLUDE  bescherming van de zeerijkdommen
verwerkt landbouwproduct  ---  verwerken_landbouwproduct
bedrijfsgezondheidszorg  ---  bedrijfsgezondheidszorg
milieuwetgeving met betrekking tot de landbouw  ---  milieuwetgeving_betrekking_landbouw
het regelen van hergebruik  ---  regelen_hergebruik
ecosysteem riviermonding  ---  ecosysteem_riviermonding
milieubeleid van de gemeente  ---  milieubeleid_gemeente
=== EXCLUDE  afvalwatervervuiling
=== EXCLUDE  gebruik vanplaatselijke grondstoffen
doorsijpeling van water in de bodem  ---  doorsijpeling_water_bodem
=== EXCLUDE  remote-sensingcentrum
hogesnelheids(spoor)lijn  ---  hogesnelheid_spoor_lijn
industriële milieuzorg  ---  industrieel_milieuzorg
levenscyclus van materialen  ---  levenscyclus_materiaal
het behandelen van drinkwater  ---  behandelen_drinkwater


gemeenschappelijk handelsbeleid  ---  gemeenschappelijk_handelsbeleid
voorkoming van natuurlijke risico's  ---  voorkoming_natuurlijk_risico_s
basisbehoefte aan voedsel  ---  basisbehoefte_voedsel
=== EXCLUDE  minimale kostenplanning
gewestelijk natuurpark  ---  gewestelijk_natuurpark
=== EXCLUDE  locatie dat behoort tot het wereldnatuurbezit
afvalwaterzuivering  ---  afvalwaterzuivering
milieubescherming binnen het bedrijf  ---  milieubescherming_bedrijf
primair energieverbruik  ---  primair_energieverbruik
Europees Hof van Justitie  ---  europees_hof_justitie
vervoer van gevaarlijke stoffen  ---  vervoer_gevaarlijk_stof
uitstoot van afvalwater  ---  uitstoot_afvalwater
gecombineerd afvalwater  ---  combineren_afvalwater
weersvoorspelling  ---  weersvoorspelling
aardgaswinning  ---  aardgaswinning
belangrijk bestanddeel van het ecosysteem  ---  belangrijk_bestanddeel_ecosysteem
=== EXCLUDE  milieubeschermingsinstantie
ontzouting van zeewater  ---  ontzouting_zeewater
biologisch bosres

het vervuiler-betaalt-principe  ---  vervuiler_betalen_principe
bouwnorm  ---  bouwnorm
gebergte-ecosysteem  ---  gebergte_ecosysteem
mogelijk vervuild gebied  ---  vervuilen_gebied
beschermd estuarium  ---  beschermen_estuarium
=== EXCLUDE  verwijzingsinformatiesysteem
gegevens over de toestand van het milieu  ---  gegeven_toestand_milieu
tropisch regenwoud  ---  tropisch_regenwoud
binnenlands beheersprogramma  ---  binnenland_beheersprogramma
=== EXCLUDE  luchtverkeerswetgeving
bedreigde diersoorten  ---  bedreigen_diersoort
integraal natuurreservaat  ---  integraal_natuurreservaat
internationale verdeling van werk  ---  internationaal_verdeling_werk
loodgehalte in het bloed  ---  loodgehalte_bloed
=== EXCLUDE  publiekrechtelijk bedrijfsorgaan
grenswaarde  ---  grenswaaren
elektriciteitsvoorziening  ---  elektriciteitsvoorziening
sociaal gedrag  ---  sociaal_gedrag
gemeentelijk milieuplan  ---  gemeentelijk_milieuplan
=== EXCLUDE  afvalverwijderingsindustrie
=== EXCLUDE  drinkwaterbe

weide  ---  weide
EG-verordening betreffende milieubeheer en  ---  eg_verordening_milieubeheer
wet inzake het instellen van (principeel) processen tegen of uit naam van e  ---  wet_instellen_principeel_proces_naam_e
vervoerswijze  ---  vervoerswijze
=== EXCLUDE  wortelboom
vee  ---  vee
duin  ---  duin
soort ecosysteem  ---  soort_ecosysteem
woestijnvorming  ---  woestijnvorming
overstroming  ---  overstroming
afwatering  ---  afwatering
evolutie  ---  evolutie
Westelijk Europa  ---  westelijk_europa
gasnetwerk  ---  gasnetwerk
onderwijs  ---  onderwijs
Oost-Europa  ---  oost_europa
bestuursbevoegdheid  ---  bestuursbevoegdheid
biotechnologie  ---  biotechnologie
uitloging  ---  uitloging
kostenvermindering  ---  kostenvermindering
eutrofiëring  ---  eutrofiëring
kosten-baten  ---  kost_baten
spoorverkeer  ---  spoorverkeer
kosten  ---  kost
anorganische meststof  ---  anorganisch_meststof
heide  ---  heide
woudgebied in de gematigde klimaatzone  ---  woudgebied_matigen_klimaatzone
spo

herstelling van een installatie  ---  herstelling_installatie
hydrologie  ---  hydrologie
politieke ecologie  ---  politiek_ecologie
=== EXCLUDE  floraherstel
vocht  ---  vechten
berekeningsmethode  ---  berekeningsmethode
=== EXCLUDE  visserijeconomie
huishoudelijke uitgaven  ---  huishoudelijk_uitgaaf
slachtvee  ---  slachtvee
materiaalsterkte  ---  materiaalsterken
bouwafval  ---  bouwafval
wegenbouw  ---  wegenbouw
(voet)pad  ---  voet_pad
ontwerp  ---  ontwerp
=== EXCLUDE  leefnorm
hoofdweg  ---  hoofdweg
Oost-West handel  ---  oost_west_handel
oliepijpleiding  ---  oliepijpleiding
muziek  ---  muziek
lagune  ---  lagune
karst  ---  karst
=== EXCLUDE  seizoensverschil
onderwijsmateriaal  ---  onderwijsmateriaal
waterloop  ---  waterloop
ondernemingen  ---  onderneming
minder ontwikkelde landen  ---  ontwikkelen_land
ontwikkelde landen  ---  ontwikkelde_land
moleculaire biologie  ---  moleculair_biologie
Middellandse Zee  ---  middellandse_zee
sorptie  ---  sorptie
onderzoekscentru

naaldboom  ---  naaldboom
denitrificatie  ---  denitrificatie
installatie- of apparatenbouw  ---  installatie_apparatenbouw
=== EXCLUDE  meerbekken
elektriciteit  ---  elektriciteit
politieke macht  ---  politiek_macht
troposferisch ozon  ---  troposferisch_ozon
belangengroep  ---  belangengroep
spoorvoertuig  ---  spoorvoertuig
bloembollenteelt  ---  bloembollenteelt
administratief beroep  ---  administratief_beroep
petrochemisch  ---  petrochemisch
=== EXCLUDE  rivierverontreiniging
geluidsmeting  ---  geluidsmeting
beluchting  ---  beluchting
onteigening  ---  onteigening
=== EXCLUDE  energiegebruikspatroon
biogeochemie  ---  biogeochemi
vorst  ---  vorst
plantenecologie  ---  plantenecologie
bedrijfsgeneeskunde  ---  bedrijfsgeneeskunen
(pijp)leiding  ---  pijp_leiding
internationale harmonisatie  ---  internationaal_harmonisatie
juridische stand  ---  juridisch_stand
proefproject  ---  proefproject
=== EXCLUDE  grasbrand
geluidshinder  ---  geluidshinder
energie-opslag  ---  energ

meetstation  ---  meetstation
werkingsduur van bestrijdingsmiddelen  ---  werkingsduur_bestrijdingsmiddel
tumor  ---  tumor
herstel  ---  herstel
rechtsgrond(slag)  ---  rechtsgrond_slag
beheersing van milieuverontreiniging  ---  beheersing_milieuverontreiniging
luchtvervuiling binnenshuis  ---  luchtvervuiling_binnenshuis
ultraviolette straling  ---  ultraviolet_straling
stimuleringsfonds  ---  stimuleringsfond
kunstmaan  ---  kunstmaan
hydraulica  ---  hydraulica
militair terrein  ---  militair_terrein
mijnbouw,gas- en oliewinning op zee  ---  mijnbouw_gas_oliewinning_zee
=== EXCLUDE  gemeentereinigingsdienst
door de mens veroorzaakte ramp  ---  mens_veroorzaken_ramp
busstation  ---  busstation
overeenkomst (wettige/wettelijke)  ---  overeenkomst_wettig_wettelijk
microklimaat  ---  microklimaat
grind  ---  grind
inschatting van een verontreinigende stof  ---  inschatting_verontreinigen_stof
woordenlijst  ---  woordenlijst
=== EXCLUDE  verbruikersgroep
waterbouw  ---  waterbouw
vliegv

kaart  ---  kaart
fotosynthese  ---  fotosynthese
=== EXCLUDE  kwikverontreiniging
exploitatie van de oceaan  ---  exploitatie_oceaan
chemische fabriek  ---  chemisch_fabriek
rampgebied  ---  rampgebied
huishouden  ---  huishouden
rechten van toekomstige generaties  ---  recht_toekomstig_generatie
=== EXCLUDE  mineraalvezel
het opruimen van oorlogsmaterieel  ---  opruimen_oorlogsmaterieel
plaats waar milieuverontreiniging in de bodem doordringt  ---  plaats_milieuverontreiniging_bodem_doordringen
uitstoot van (uitlaat)gassen  ---  uitstoot_uitlaat_gas
alluviale vlakte  ---  alluviaal_vlakte
ontsmetting  ---  ontsmetting
door bestrijdingsmiddelen gevolgde weg  ---  bestrijdingsmiddel_volgen
anaërobe behandeling  ---  anaëroob_behandeling
biologische brandstof  ---  biologisch_brandstof
=== EXCLUDE  cadmiumvervuiling
anorganisch afval  ---  anorganisch_afval
beveiliging van gebouwen tegen seismische activiteit  ---  beveiliging_gebouw_seismisch_activiteit
gevoeligheidsanalyse  ---  gevoe

soort geluid  ---  soort_geluid
herstellen  ---  herstell
analytische apparatuur  ---  analytisch_apparatuur
halogeenverbinding  ---  halogeenverbinding
=== EXCLUDE  zuurtegraa
algengroei  ---  algengroei
het opnieuw vrijkomen van verontreinigende stoffen  ---  vrijkom_verontreinigen_stof
elementen uit groep III  ---  element_groep_iii
alifatische verbinding  ---  alifatisch_verbinding
geluidscomfort  ---  geluidscomfort
(laten) overwinteren  ---  laten_overwinteren
gasvorm  ---  gasvorm
elektrische leiding  ---  elektrisch_leiding
administratief rechtsgebied  ---  administratief_rechtsgebied
chemicalie  ---  chemicalie
gezinstoestand  ---  gezinstoestand
=== EXCLUDE  soortverarming
verdrag  ---  verdrag
=== EXCLUDE  landschapsherkenning
ontploffing  ---  ontploffing
economie  ---  economie
chemische zuurstofverbruik  ---  chemisch_zuurstofverbruik
afvalwater  ---  afvalwater
filtratie  ---  filtratie
warmte-energie uit de zee  ---  warmt_energie_zee
=== EXCLUDE  giftigheidsboordeling


statistische analyse  ---  statistisch_analyse
statistische informatie  ---  statistisch_informatie
=== EXCLUDE  massavrijetijdsbesteding
afvalrecycling  ---  afvalrecycling
niet in mijn achtertuin-houding  ---  achtertuin_houding
rechtsmiddel  ---  rechtsmiddel
belasting  ---  belasting
oude banden  ---  oud_band
mijnbouw - geologie  ---  mijnbouw_geologie
milieuonvriendelijk bedrijf  ---  milieuonvriendelijk_bedrijf
gas  ---  gas
verwarmingsinstallatie  ---  verwarmingsinstallatie
chemisch wapen  ---  chemisch_wapen
beton  ---  beton
biologische afvalverwerking  ---  biologisch_afvalverwerking
zeebodem  ---  zeebodem
fotochemische oxidant  ---  fotochemisch_oxidant
=== EXCLUDE  runderachtigen
afvalinzameling  ---  afvalinzameling
uitlaat  ---  uitlaat
(bootje)varen  ---  boot_varen
ammoniak  ---  ammoniak
gedragswetenschappen  ---  gedragswetenschap
=== EXCLUDE  milieuverontreinigingsrisico
kalksteen  ---  kalksteen
oorlogsslachtoffer  ---  oorlogsslachtoffer
trekkende soorten  ---  

huishoudelijk lawaai  ---  huishoudelijk_lawaai
=== EXCLUDE  tijdsbudget
huishoudchemicaliën  ---  huishoudchemicali
kanaliseren  ---  kanaliser
scherm  ---  scherm
katalyse  ---  katalyse
fosfaatverwijdering  ---  fosfaatverwijdering
uitvoer van gevaarlijke chemicaliën  ---  uitvoer_gevaarlijk_chemicaliën
industrie-afval  ---  industrie_afval
storten van afval op de zeebodem  ---  storten_afval_zeebodem
motorfiets  ---  motorfiets
hoogrisico-installatie  ---  hoogrisico_installatie
bestemming  ---  bestemming
zuurstof  ---  zuurstof
olielozing  ---  olielozing
koelen  ---  koelen
overheidscontract  ---  overheidscontract
vakantie  ---  vakantie
waterleidingbedrijf  ---  waterleidingbedrijf
selectieve verspreiding van informatie  ---  selectief_verspreiding_informatie
olie in kleilagen  ---  olie_kleilaag
inspectie van de boeken  ---  inspectie_boek
chlorofyl  ---  chlorofyl
epidemieën  ---  epidemie
chemische fall-out  ---  chemisch_fall_out
=== EXCLUDE  voorgeschreven verjaring(sterm

hypertext  ---  hypertext
vergunning  ---  vergunning
organische fosforverbinding  ---  organisch_fosforverbinding
heffing op geluidsemissie  ---  heffing_geluidsemissie
in vivo proef  ---  vivo_proef
=== EXCLUDE  afvalontgassing
kunstvezel  ---  kunstvezel
akten  ---  akte
kernfysica  ---  kernfysica
chromatografische analyse  ---  chromatografisch_analyse
handhaven  ---  handhav
elektriciteitscentrale  ---  elektriciteitscentrale
stroom  ---  stroom
boren  ---  boren
de gezamenlijke genen (van een soort)  ---  gezamenlijk_gen_soort
rechten  ---  recht
besmettelijke ziekte  ---  besmettelijk_ziekte
hoeveelheid afval  ---  hoeveelheid_afval
mist  ---  missen
ontzilting  ---  ontzilting
verzekering tegen milieuverontreiniging  ---  verzekering_milieuverontreiniging
zaad  ---  zaad
informatie  ---  informatie
textiel  ---  textiel
film  ---  film
(schade)vergoeding  ---  schade_vergoeding
niet-conventionele energie  ---  conventioneel_energie
recht op informatie  ---  recht_informatie
pl

sprinkhanen  ---  sprinkhaan
baai  ---  baai
=== EXCLUDE  laboratoriumafval
verbrandingsrest  ---  verbrandingsrest
zoetstof  ---  zoetstof
bedreigde plantensoorten  ---  bedreigen_plantensoort
biochemie  ---  biochemie
=== EXCLUDE  messtof met kalium
vakantieoord in de bergen  ---  vakantieoord_berg
registratieplicht  ---  registratieplicht
nat afval  ---  nat_afval
zoutgehalte  ---  zoutgehalte
risicoanalyse  ---  risicoanalyse
etikettering  ---  etikettering
snelle reactor  ---  snel_reactor
stralingsdosis  ---  stralingsdosis
bèta-straling  ---  bèta_straling
informeel overleg  ---  informeel_overleg
inversie  ---  inversi
hergebruik van afval  ---  hergebruik_afval
parlementair verslag  ---  parlementair_verslag
parlement  ---  parlement
gaschromatografie  ---  gaschromatografie
speelplaats  ---  speelplaats
=== EXCLUDE  synecologie
warmtecentrale op basis van afval  ---  warmtecentral_basis_afval
Engelse tuin  ---  engels_tuin
socio-economie  ---  socio_economie
aanhoudend geluid

monopolie  ---  monopolie
rook  ---  rook
verlies  ---  verlies
kamperen  ---  kamperen
hydrobiologie  ---  hydrobiologie
weekdieren  ---  weekdier
octrooi  ---  octrooi
herinvoering  ---  herinvoering
=== EXCLUDE  afvalinvoervergunning
nitrieten  ---  nitriet
vergassing  ---  vergassing
draagvermogen  ---  draagvermogen
primaten  ---  primaat
het per ongeluk vrijkomen van organismen  ---  per_ongeluk_vrijkom_organisme
ongevallen  ---  ongeval
radioactieve vervuiler  ---  radioactief_vervuiler
=== EXCLUDE  zoutlading
kanaalsluis  ---  kanaalsluis
storten van afval  ---  storten_afval
bijen  ---  bij
smeermiddel  ---  smeermiddel
oorlog  ---  oorlog
iets in voorraad houden  ---  voorraad_houden
vlees  ---  vlees
ergonomie  ---  ergonomie
botanische tuin  ---  botanisch_tuin
puntbron  ---  puntbron
koper  ---  koper
sedimentologie  ---  sedimentologie
kruising  ---  kruising
toezicht  ---  toezicht
oude afzetting  ---  oud_afzetting
wintersportoord  ---  wintersportoord
=== EXCLUDE  fosf

verbrandingsrest  ---  verbrandingsrest
=== EXCLUDE  emulgatie
=== EXCLUDE  anti-vervuilingsaanmoediging
freon  ---  freon
analyseren  ---  analyser
document  ---  document
vakantiekamp  ---  vakantiekamp
kamp  ---  kamp
allergeen  ---  allergeen
mijten  ---  mijt
handelsbarrière  ---  handelsbarrière
pedosfeer  ---  pedosfeer
zoutzuur  ---  zoutzuur
afvalstortplaats  ---  afvalstortplaat
zaagsel  ---  zaagsel
krijt  ---  krijt
strontium  ---  strontium
thermodynamica  ---  thermodynamica
misdadig gedrag  ---  misdadig_gedrag
paard  ---  paard
schietbaan  ---  schietbaan
(steen)groeve  ---  ste_groeve
een steengroeve ontginnen  ---  steengroev_ontginn
viaduct  ---  viaduct
wortel  ---  wortel
opname  ---  opname
parameters  ---  parameter
chloride  ---  chloride
stemming  ---  stemming
codificatie  ---  codificatie
eiken(bomen)  ---  eik_boom
geurstof  ---  geurstof
plantenziektekunde  ---  plantenziektekunen
=== EXCLUDE  schadeloosstellingseis
voorspelling  ---  voorspelling
osmose  -

beeldpunt  ---  beeldpunt
zuiverend vermogen  ---  zuiveren_vermogen
dwangmaatregel  ---  dwangmaatregel
expediteur  ---  expediteur
elektrolyse  ---  elektrolyse
congres  ---  congres
pendelen  ---  pendel
virologie  ---  virologie
etsende stoffen  ---  etsen_stof
aanbeveling  ---  aanbeveling
=== EXCLUDE  strooiapparaat (v. stalmest of tuinafval)
=== EXCLUDE  beeldclassificatie onder toezicht
fluor  ---  fluor
klif  ---  klif
=== EXCLUDE  afvalstatistieken
rechtszaak  ---  rechtszaak
resolutie  ---  resolutie
onderhandelbare heffingen  ---  onderhandelbar_heffing
vogelkunde  ---  vogelkunen
=== EXCLUDE  chloorfluorkoolstof
marterachtigen  ---  marterachtigen
ontsmettingsmiddel  ---  ontsmettingsmiddel
gehoor (zintuig)  ---  gehoor_zintuig
bezwaar  ---  bezwaar
asbest  ---  asbest
kikkers  ---  kikker
naaktzadigen  ---  naaktzadig
verrijken  ---  verrijk
elasticiteit  ---  elasticiteit
stolling  ---  stolling
dioxine  ---  dioxine
(door)weken  ---  week
virussen  ---  virus
eigenschap

basidiomycete  ---  basidiomycete
(ruwe) aardolie  ---  ruw_aardolie
normalisatie  ---  normalisatie
hondachtige  ---  hondachtig
vergif  ---  vergif
weekmaker  ---  weekmak
=== EXCLUDE  verambtelijking
=== EXCLUDE  polychloordibenzo-p-dioxine
leer van het bloed  ---  leer_bloed
oorwurmen  ---  oorwurm
water rijk aan rottend organisch materiaal  ---  water_rijk_rotten_organisch_materiaal
herhuisvesting  ---  herhuisvesting
=== EXCLUDE  polybroombifenyl
polychloorbifenyl  ---  polychloorbifenyl
bibliografie  ---  bibliografie
=== EXCLUDE  bederfwerend middel
stranden  ---  strand
afschrijven  ---  afschrijven
reuk  ---  reuk
statistiek  ---  statistiek
=== EXCLUDE  algendodende stof
gegevens met geografische componenten  ---  gegeven_geografisch_component
DDT  ---  ddt
encyclopedie  ---  encyclopedie
dendrochronologie  ---  dendrochronologie
wantsen  ---  wants
colorimetrie  ---  colorimetrie
cyanaat  ---  cyanaat
vulcaniseren  ---  vulcaniseren
purine  ---  purine
norm  ---  norm
(ver)

Ursidae  ---  ursidae
bioreactor  ---  bioreactor
bioveiligheid  ---  bioveiligheid
bron  ---  bron
boekhouding  ---  boekhouding
Excluded:  727
Final topics:  4581 4581


In [30]:
# adding all the words and topics to model

# load the lemma list
with open(lemma_list_file_excluded) as fp:
    topics = fp.readlines()
# load the nolemma list
with open(nolemma_list_file_excluded) as fp:
    topics_nolemma = fp.readlines()    
    

#try if the topic-lemma words exist in the model     
new_vectors = []
new_words = []
for i, (topic, topic_nolemma) in enumerate(zip(topics, topics_nolemma)):
#for i,topic in enumerate(topics):
    topic_nolemma = re.sub('\W',' ',topic_nolemma)
    topic_nolemma = re.sub('\ +',' ',topic_nolemma)
    doc = nlp(topic_nolemma.strip().lower())
    nolemmas = []
    for token in doc:
        if token.is_stop:
            continue
        else:
            nolemmas.append(token.text) 
            
    topic = topic.strip()
    topic_words = topic.split('_')
    
    if len(topic_words) != len(nolemmas):
        print("!!!!! error - not equal length: ", nolemmas, topic_words)
        continue
    #if len(topic_words)<2:
    #    continue
    
    
    tmp_vectors = []
    
    for word, word_nolemma in zip(topic_words, nolemmas):
    #for word in topic_words:
        vector = get_vector(word)
        
        try:
            tmp_vectors.append(model[word])
        except: 
            print('\nNOT in vocabulary: ', word, topic)
            vector = get_vector(word)
            if vector != []:
                tmp_vectors.append(vector)
                if word not in new_words:
                    print('append ', word)
                    new_vectors.append(vector)
                    new_words.append(word)   
            else:
                vector = get_vector(word_nolemma)
                if vector != []:
                    tmp_vectors.append(vector)
                    if word not in new_words:
                        print('append ', word)
                        new_vectors.append(vector)
                        new_words.append(word)  
                else:
                    raise Warning(f"XXX {word} {topic} {topic_nolemma}")
                    print("XXX", word, topic, topic_nolemma) 
    #if word not in new_words:
    #    new_vectors.append(list(np.average(tmp_vectors, axis=0)))
    #    new_words.append(word)        
    if len(tmp_vectors) > 1:
        if topic not in new_words:
   
            print('append ', topic)
            new_vectors.append(list(np.average(tmp_vectors, axis=0)))
            new_words.append(topic)
        else:
            print('doubled TOPIC: ', topic)    
    else:
        print('--- only one word, not a new topic>', topic)

append  plaatselijk_ontwikkeling
--- only one word, not a new topic> plattelandsontwikkeling
append  beheer_waterbron
--- only one word, not a new topic> opleidingsniveau
append  algemeen_onderwijs
--- only one word, not a new topic> bank
append  wet_europees_gemeenschap
append  cultureel_erfgoed
--- only one word, not a new topic> landbouwgrond

NOT in vocabulary:  landbouwlandschap landbouwlandschap
append  landbouwlandschap
--- only one word, not a new topic> landbouwlandschap
--- only one word, not a new topic> landbouwproductie
append  economisch_ontwikkeling
--- only one word, not a new topic> voedselketen
--- only one word, not a new topic> voedingsmiddelenindustrie
--- only one word, not a new topic> voedselkwaliteit
append  wereldwijd_opwarming
--- only one word, not a new topic> broeikaseffect
append  industrieel_ontwikkeling
--- only one word, not a new topic> arbeidsmarkt
append  toegang_land
--- only one word, not a new topic> ruilverkaveling
--- only one word, not a new t




NOT in vocabulary:  bodemdegradatie bodemdegradatie
append  bodemdegradatie
--- only one word, not a new topic> bodemdegradatie
--- only one word, not a new topic> bodemerosie
append  duurzaam_ontwikkeling
append  stedelijk_planning

NOT in vocabulary:  waterlichaam waterlichaam
append  waterlichaam
--- only one word, not a new topic> waterlichaam
--- only one word, not a new topic> watererosie
--- only one word, not a new topic> waterbeheer

NOT in vocabulary:  winderosie winderosie
append  winderosie
--- only one word, not a new topic> winderosie
append  marien_ecosysteem
append  ecosysteem_water
--- only one word, not a new topic> waterweg
--- only one word, not a new topic> beroepsbevolking
--- only one word, not a new topic> klimaatverandering
append  technologisch_verandering

NOT in vocabulary:  milieuverandering milieuverandering
append  milieuverandering
--- only one word, not a new topic> milieuverandering

NOT in vocabulary:  landbeheer landbeheer_inrichting
append  landbeh

--- only one word, not a new topic> stadslandschap
append  nieuw_installatie
--- only one word, not a new topic> toerisme
append  landbouw_milieu
append  biologisch_productie
append  milieu_ontwikkeling
--- only one word, not a new topic> bodemschatten
--- only one word, not a new topic> beheer
--- only one word, not a new topic> beleid

NOT in vocabulary:  bosexploitatie bosexploitatie
append  bosexploitatie
--- only one word, not a new topic> bosexploitatie
--- only one word, not a new topic> vervoerssysteem
append  zoutgehalte_bodem
append  zoutgehalte_water

NOT in vocabulary:  ontwikkelingsplanning ontwikkelingsplanning
append  ontwikkelingsplanning
--- only one word, not a new topic> ontwikkelingsplanning

NOT in vocabulary:  vervoersplanning vervoersplanning
append  vervoersplanning
--- only one word, not a new topic> vervoersplanning
append  landbouw_huis_dier
append  industrieel_wetgeving
append  financieel_hulp
--- only one word, not a new topic> milieukwaliteit
--- only one 

append  zuivering_grond
--- only one word, not a new topic> grondverbetering
append  marien_geologie

NOT in vocabulary:  beschermingssysteem beschermingssysteem
append  beschermingssysteem
--- only one word, not a new topic> beschermingssysteem
append  industrieel_proces
append  afbraak_verontreinigen_stof
append  energie_industrie
append  milieu_industrie
--- only one word, not a new topic> afwateren
--- only one word, not a new topic> inkomen

NOT in vocabulary:  rivierbeheer rivierbeheer
append  rivierbeheer
--- only one word, not a new topic> rivierbeheer
--- only one word, not a new topic> wind
append  toegankelijk_informatie
--- only one word, not a new topic> proceswater
--- only one word, not a new topic> watervoorziening
--- only one word, not a new topic> industriegebied
append  opberging_land

NOT in vocabulary:  warmt warmt_fysica
append  warmt
append  warmt_fysica
append  ecologisch_leven_gemeenschap
--- only one word, not a new topic> personenvervoer
append  inschatting_



append  administratief_recht

NOT in vocabulary:  ontwikkelingspatroon ontwikkelingspatroon
append  ontwikkelingspatroon
--- only one word, not a new topic> ontwikkelingspatroon

NOT in vocabulary:  bodembiologie bodembiologie
append  bodembiologie
--- only one word, not a new topic> bodembiologie
--- only one word, not a new topic> bevolkingsontwikkeling
append  samenstellen_voeding
--- only one word, not a new topic> kunst
append  economisch_geografie
--- only one word, not a new topic> vernieuwing
--- only one word, not a new topic> wild
--- only one word, not a new topic> inkomstenbelasting
--- only one word, not a new topic> zeerecht
--- only one word, not a new topic> crisisbeheer

NOT in vocabulary:  waterbescherming waterbescherming
append  waterbescherming
--- only one word, not a new topic> waterbescherming
--- only one word, not a new topic> ijzerindustrie
append  bijzonder_wet
--- only one word, not a new topic> nutsfunctie
--- only one word, not a new topic> wetgeving

NOT

append  legger_kadaster

NOT in vocabulary:  geneeskund industrieel_geneeskund
append  industrieel_geneeskund
--- only one word, not a new topic> waterhardheid
append  fysisch_geografie
--- only one word, not a new topic> zeevisserij
--- only one word, not a new topic> waterkracht
--- only one word, not a new topic> bouwvergunning
--- only one word, not a new topic> stad
--- only one word, not a new topic> visserijwet
--- only one word, not a new topic> grondwater
--- only one word, not a new topic> natuurwetenschappen
--- only one word, not a new topic> wet
append  stedelijk_ecosysteem
append  beheer_aandelenkapitaal
--- only one word, not a new topic> ontwikkelingshulp
append  financieel_fonds

NOT in vocabulary:  risicobehe risicobehe
append  risicobehe
--- only one word, not a new topic> risicobehe
--- only one word, not a new topic> koolmonoxide
append  tussenkomst_land
--- only one word, not a new topic> slachtdier
append  slachten_dier

NOT in vocabulary:  bevolkingsspreiding be

--- only one word, not a new topic> grondwaterkwaliteit
append  laag_debiet

NOT in vocabulary:  energiebehoud energiebehoud
append  energiebehoud
--- only one word, not a new topic> energiebehoud

NOT in vocabulary:  kwaliteitsdoel kwaliteitsdoel_stelling
append  kwaliteitsdoel
append  kwaliteitsdoel_stelling
--- only one word, not a new topic> procestechnologie
append  buitenlands_beleid
append  europees_gemeenschap

NOT in vocabulary:  milieueconomie milieueconomie
append  milieueconomie
--- only one word, not a new topic> milieueconomie

NOT in vocabulary:  uitbreidingsbeleid uitbreidingsbeleid
append  uitbreidingsbeleid
--- only one word, not a new topic> uitbreidingsbeleid
doubled TOPIC:  alkalisch_bodem
append  trofisch_peil

NOT in vocabulary:  middellands middellands_zeegebied
append  middellands
append  middellands_zeegebied
append  geomorfologisch_proces
--- only one word, not a new topic> zeewater
--- only one word, not a new topic> rechtsgebied
--- only one word, not a new

append  betaalbaar_huisvesting
--- only one word, not a new topic> zeespiegel
--- only one word, not a new topic> bosproduct

NOT in vocabulary:  natuurwaaren natuurwaaren
append  natuurwaaren
--- only one word, not a new topic> natuurwaaren

NOT in vocabulary:  bevoegdheidsverklaring bevoegdheidsverklaring
append  bevoegdheidsverklaring
--- only one word, not a new topic> bevoegdheidsverklaring
--- only one word, not a new topic> afbraakproduct
--- only one word, not a new topic> wagen
append  effect_gezondheid

NOT in vocabulary:  grondwaterverontreiniging grondwaterverontreiniging
append  grondwaterverontreiniging
--- only one word, not a new topic> grondwaterverontreiniging

NOT in vocabulary:  groott groott_sorter
append  groott
append  groott_sorter
append  ecologisch_cultuur
append  plaatselijk_overheid
append  gemeenschappelijk_voorziening
append  verplichten_gebruik
--- only one word, not a new topic> technologie
append  industrieel_locatie
append  vervoer_rivieren
--- only on


NOT in vocabulary:  natuurgevoel natuurgevoel
append  natuurgevoel
--- only one word, not a new topic> natuurgevoel
append  bos_matigen_klimaatzone
append  biologisch_proces

NOT in vocabulary:  nestgebied nestgebied
append  nestgebied
--- only one word, not a new topic> nestgebied
append  bos_schadelijk_dier_plant
--- only one word, not a new topic> achtergrondgeluid
--- only one word, not a new topic> genenbank
append  endocri_systeem
append  ecologisch_evenwicht
append  technologie_aanvaarding
append  wijze_voortplanting
--- only one word, not a new topic> milieucriminaliteit
append  keuze_technologie
append  economisch_recht
append  dierlijk_rest
append  bebouwen_komen
--- only one word, not a new topic> vervoersbedrijf
--- only one word, not a new topic> veiligheidsonderzoek
--- only one word, not a new topic> grondstof

NOT in vocabulary:  bergklimaat bergklimaat
append  bergklimaat
--- only one word, not a new topic> bergklimaat
append  natuurlijk_meststof
append  gemeenschappe

append  invloed_bosbouw_milieu

NOT in vocabulary:  landbouwwater landbouwwater
append  landbouwwater
--- only one word, not a new topic> landbouwwater

NOT in vocabulary:  afvalwaterverwerking afvalwaterverwerking
--- only one word, not a new topic> afvalwaterverwerking
append  invloed_vervoer_milieu
append  ecosysteem_onvruchtbaar_gebied
append  europees_milieuraad
doubled TOPIC:  elektrotechnisch_industrie

NOT in vocabulary:  milieueffectenrapportage milieueffectenrapportage
append  milieueffectenrapportage
--- only one word, not a new topic> milieueffectenrapportage
append  plaatselijk_warmtevoorziening
append  verbannen_gezondheid_natuurlijk_wonen_omgeving
append  proteïnerijk_voedsel
append  tussenkomst_natuur_landschap

NOT in vocabulary:  bovenafdichting bovenafdichting
append  bovenafdichting
--- only one word, not a new topic> bovenafdichting
append  socio_cultureel_groep
append  europees_hof_justitie

NOT in vocabulary:  prijzenbeleid prijzenbeleid_grondstof
append  prijzen

--- only one word, not a new topic> bron
--- only one word, not a new topic> voedergewas
append  ecosysteem_bodem

NOT in vocabulary:  inwerkt agens_inwerkt_oppervlakte
append  inwerkt
append  agens_inwerkt_oppervlakte
append  vroegtijdig_waarschuwingssysteem
append  verordening_betrekking_elektronisch_afval
append  theorie_verzorgingsstaat
append  geografisch_informatiesysteem
append  vervuiler_betalen_principe

NOT in vocabulary:  bouwnorm bouwnorm
append  bouwnorm
--- only one word, not a new topic> bouwnorm
append  gebergte_ecosysteem
doubled TOPIC:  vervuilen_gebied
append  beschermen_estuarium
append  gegeven_toestand_milieu
append  tropisch_regenwoud

NOT in vocabulary:  beheersprogramma binnenland_beheersprogramma
append  beheersprogramma
append  binnenland_beheersprogramma
append  bedreigen_diersoort
append  integraal_natuurreservaat
append  internationaal_verdeling_werk

NOT in vocabulary:  loodgehalte loodgehalte_bloed
append  loodgehalte
append  loodgehalte_bloed
--- only o

--- only one word, not a new topic> eutrofiëring
append  kost_baten
--- only one word, not a new topic> spoorverkeer
--- only one word, not a new topic> kost
append  anorganisch_meststof
--- only one word, not a new topic> heide

NOT in vocabulary:  woudgebied woudgebied_matigen_klimaatzone
append  woudgebied
append  woudgebied_matigen_klimaatzone
--- only one word, not a new topic> spoorwegnet
--- only one word, not a new topic> leerplan
append  afval_wassen
append  natuurlijk_afbraak
--- only one word, not a new topic> energie
--- only one word, not a new topic> humus
--- only one word, not a new topic> financiën
append  ecosysteem_koud_gebied
--- only one word, not a new topic> luchtvervoer
--- only one word, not a new topic> gedrag
append  wortel_knolgewas
--- only one word, not a new topic> pedagogie
--- only one word, not a new topic> gedragspatroon
append  wiskundig_methode
--- only one word, not a new topic> multinational
append  biochemisch_methode

NOT in vocabulary:  onderwi

--- only one word, not a new topic> telecommunicatie

NOT in vocabulary:  substraatteelt substraatteelt
append  substraatteelt
--- only one word, not a new topic> substraatteelt
--- only one word, not a new topic> procestechnologie

NOT in vocabulary:  hakhoutbosje hakhoutbosje
append  hakhoutbosje
--- only one word, not a new topic> hakhoutbosje
--- only one word, not a new topic> mineralisatie
--- only one word, not a new topic> oogsten
append  biologisch_activiteit
--- only one word, not a new topic> milieu
--- only one word, not a new topic> zuivelproduct
append  biomassa_energie
--- only one word, not a new topic> hydrolyse
--- only one word, not a new topic> stroomgebied
append  chemisch_installatie
append  volledig_kostendekking
append  inheems_kennis
append  zwemwater_zout
append  hergebruiken_materiaal
--- only one word, not a new topic> radio
--- only one word, not a new topic> geluidsisolatie
append  genetisch_wijziging
append  gedraging_verontreinigen_stof

NOT in vocabular

append  antarctisch_oceaan

NOT in vocabulary:  stralingsmeting stralingsmeting
append  stralingsmeting
--- only one word, not a new topic> stralingsmeting
--- only one word, not a new topic> stikstofdioxid
--- only one word, not a new topic> folklore
--- only one word, not a new topic> emissiereductie
--- only one word, not a new topic> schip
--- only one word, not a new topic> infraroodstraling
--- only one word, not a new topic> klei
--- only one word, not a new topic> regenworm
append  continentaal_plat
append  oost_west_verhouding
append  politiek_ideologie
--- only one word, not a new topic> regen
append  milieuvriendelijk_product
append  internationaal_evenwicht
--- only one word, not a new topic> schroten
append  anorganisch_vervuiling
--- only one word, not a new topic> verwarming
--- only one word, not a new topic> stikstofmonoxide
--- only one word, not a new topic> kunststof
append  internationaal_conventie
append  institutioneel_activiteit
--- only one word, not a new topi

append  chirurgisch_operatie_afval
append  biologisch_wapen
--- only one word, not a new topic> ramp

NOT in vocabulary:  warmt warmt_apparatuur
append  warmt_apparatuur
append  inschatten_effect
append  atmosferisch_correctie

NOT in vocabulary:  ziekenhuisafval ziekenhuisafval
append  ziekenhuisafval
--- only one word, not a new topic> ziekenhuisafval

NOT in vocabulary:  afbreekbaarheid afbreekbaarheid
append  afbreekbaarheid
--- only one word, not a new topic> afbreekbaarheid

NOT in vocabulary:  slibgisting slibgisting
append  slibgisting
--- only one word, not a new topic> slibgisting
--- only one word, not a new topic> weersvoorspelling
append  gevaarlijk_installatie
--- only one word, not a new topic> verontreiniging
append  grensoverschrijdende_vervuiling
--- only one word, not a new topic> kartering

NOT in vocabulary:  geluidsemissie geluidsemissie
append  geluidsemissie
--- only one word, not a new topic> geluidsemissie
append  verliezen_gaan_biotoop
--- only one word, not 

--- only one word, not a new topic> kolonisatie
--- only one word, not a new topic> satellietbeeld
--- only one word, not a new topic> democratie

NOT in vocabulary:  afbreekbaarheid natuurlijk_afbreekbaarheid
append  natuurlijk_afbreekbaarheid
--- only one word, not a new topic> isolatiemateriaal
--- only one word, not a new topic> zuurstoftekort
append  zakelijk_verkeer
append  verontreinigen_plaats
--- only one word, not a new topic> spraak
append  soort_energie
--- only one word, not a new topic> drank
--- only one word, not a new topic> letterkunen
append  gewerveld_dier
append  centraal_regering
--- only one word, not a new topic> volkenkunen

NOT in vocabulary:  druppelsgewijs druppelsgewijs_bevloeiing
append  druppelsgewijs

NOT in vocabulary:  bevloeiing druppelsgewijs_bevloeiing
append  druppelsgewijs_bevloeiing
append  onttrekking_voedingsstof
append  schade_akker
append  wisselwerking_bestrijdingsmiddel
--- only one word, not a new topic> watervogel
append  microbiologisch_

append  abiotisch_factor
--- only one word, not a new topic> opvoeding
append  chemisch_meststof
append  wet_chemicaliën
append  internationaal_handel

NOT in vocabulary:  lawaaihinder lawaaihinder_bouwactiviteit
append  lawaaihinder_bouwactiviteit
--- only one word, not a new topic> handelsactiviteit
--- only one word, not a new topic> uitlaatgas
--- only one word, not a new topic> buitenwijk
--- only one word, not a new topic> politiemacht
append  bevordering_volk_gezondheid
--- only one word, not a new topic> voetgangerszone
append  internationaal_politiek

NOT in vocabulary:  stikstofoxien stikstofoxien
append  stikstofoxien
--- only one word, not a new topic> stikstofoxien
--- only one word, not a new topic> stikstofoxide
append  chemisch_toevoeging

NOT in vocabulary:  tinverbinding organisch_tinverbinding
append  tinverbinding
append  organisch_tinverbinding
--- only one word, not a new topic> proefinstallatie
--- only one word, not a new topic> huid
--- only one word, not a new

append  toxiciteit_vissen
--- only one word, not a new topic> zwaveloxide
--- only one word, not a new topic> flatgebouw
--- only one word, not a new topic> wervelstorm
--- only one word, not a new topic> doorlatendheid
--- only one word, not a new topic> plastic
--- only one word, not a new topic> colloïde
append  chemisch_behandeling
--- only one word, not a new topic> insect
append  ruw_aardolie
append  overeenkomst_administratief
append  soort_aanstelling
--- only one word, not a new topic> kust
append  plein_geografie
append  uitstoot_verkeer
--- only one word, not a new topic> olieraffinaderij

NOT in vocabulary:  afvalstort vast_afvalstort
append  afvalstort
append  vast_afvalstort
append  commercieel_verspreiding
append  integreren_ongediertebestrijding
append  hergebruik_afval
--- only one word, not a new topic> aardewerk
--- only one word, not a new topic> wereldstad
append  bedreigen_soort

NOT in vocabulary:  houtbescherming houtbescherming
append  houtbescherming
--- only 

--- only one word, not a new topic> beroep
--- only one word, not a new topic> stropen
append  tegenstrijdigheid_streven_doelen

NOT in vocabulary:  diepzeemijnbouw diepzeemijnbouw
append  diepzeemijnbouw
--- only one word, not a new topic> diepzeemijnbouw
--- only one word, not a new topic> diatomeeën

NOT in vocabulary:  geldtheorie geldtheorie
append  geldtheorie
--- only one word, not a new topic> geldtheorie
append  aromatisch_verbinding
--- only one word, not a new topic> landbouwkunde
append  voetpad_langs_kust
--- only one word, not a new topic> stookolie
append  omwaaien_boom
--- only one word, not a new topic> telemetrie
append  natuurlijk_afbreekbaar_verontreinigen_stof
append  atmosferisch_vochtigheid
--- only one word, not a new topic> zuiveringsinstallatie
--- only one word, not a new topic> strandwal

NOT in vocabulary:  gasuitstoot vermindering_gasuitstoot
append  gasuitstoot
append  vermindering_gasuitstoot
--- only one word, not a new topic> diffusie
append  chemisch_

--- only one word, not a new topic> gasmotor
append  toezicht_houden_installatie
append  socio_economisch_factor
append  bron_milieu_verontreiniging

NOT in vocabulary:  oceaancirculatie oceaancirculatie
append  oceaancirculatie
--- only one word, not a new topic> oceaancirculatie
--- only one word, not a new topic> oversteekplaats

NOT in vocabulary:  stikstoffixatie biologisch_stikstoffixatie
append  stikstoffixatie
append  biologisch_stikstoffixatie
--- only one word, not a new topic> instrumentatie
--- only one word, not a new topic> verglazing
--- only one word, not a new topic> hongersnood
--- only one word, not a new topic> gerechtshof
append  elektrotechnisch_apparatuur
--- only one word, not a new topic> emancipatie
append  ontwateren_slib
append  toestand_waarin_afval_verkeren
--- only one word, not a new topic> begroting
append  wettelijk_ondernemingsvorm

NOT in vocabulary:  stikstofbinding stikstofbinding
append  stikstofbinding
--- only one word, not a new topic> stikstof

--- only one word, not a new topic> missen
--- only one word, not a new topic> ontzilting
append  verzekering_milieuverontreiniging
--- only one word, not a new topic> zaad
--- only one word, not a new topic> informatie
--- only one word, not a new topic> textiel
--- only one word, not a new topic> film
append  schade_vergoeding
append  conventioneel_energie
append  recht_informatie
--- only one word, not a new topic> plantensoort
append  metallisch_mineraal
--- only one word, not a new topic> roet
append  snel_proef
--- only one word, not a new topic> enzym
append  gemeentelijk_vuil_stortplaats
--- only one word, not a new topic> fosfor
--- only one word, not a new topic> stekelhuidigen
--- only one word, not a new topic> ammonium
--- only one word, not a new topic> advies

NOT in vocabulary:  overheidsaansprakelijkheid overheidsaansprakelijkheid
append  overheidsaansprakelijkheid
--- only one word, not a new topic> overheidsaansprakelijkheid
--- only one word, not a new topic> titaan

--- only one word, not a new topic> saneren

NOT in vocabulary:  longzieken longzieken
append  longzieken
--- only one word, not a new topic> longzieken
append  zeldzaam_soort
--- only one word, not a new topic> rookgas
append  pathogeen_organisme

NOT in vocabulary:  afvalstortplaat afvalstortplaat
--- only one word, not a new topic> afvalstortplaat
--- only one word, not a new topic> volkstelling
--- only one word, not a new topic> honorarium
--- only one word, not a new topic> spuitbus
append  exploitatie_zeebodem
--- only one word, not a new topic> reizen
--- only one word, not a new topic> doorlichting
--- only one word, not a new topic> beroepsprocedure
append  meting_stroming
--- only one word, not a new topic> bekrachtiging
append  vitro_proef
--- only one word, not a new topic> microscopie
append  bijzonder_heffing
--- only one word, not a new topic> handelsrelatie
--- only one word, not a new topic> vulkaan

NOT in vocabulary:  onderwater onderwater_uitlaten
append  onderwate

--- only one word, not a new topic> farmacologie
--- only one word, not a new topic> tuinafval
append  oud_stort_gevaarlijk_afval
--- only one word, not a new topic> wrak
append  vergunning_toekennen

NOT in vocabulary:  vergunningsei vergunningsei
append  vergunningsei
--- only one word, not a new topic> vergunningsei
--- only one word, not a new topic> risicoanalyse

NOT in vocabulary:  beeldopslag beeldopslag
append  beeldopslag
--- only one word, not a new topic> beeldopslag
--- only one word, not a new topic> wol
--- only one word, not a new topic> ultrafiltratie

NOT in vocabulary:  lithosfeer lithosfeer
append  lithosfeer
--- only one word, not a new topic> lithosfeer
append  wettelijk_voorschrift

NOT in vocabulary:  warmtecentral warmtecentral
--- only one word, not a new topic> warmtecentral

NOT in vocabulary:  afvalheffing afvalheffing
append  afvalheffing
--- only one word, not a new topic> afvalheffing

NOT in vocabulary:  halfmetaal halfmetaal
append  halfmetaal
--- only

--- only one word, not a new topic> vonnis
--- only one word, not a new topic> alarm
append  lossen_hout
--- only one word, not a new topic> berekening
--- only one word, not a new topic> besluit
--- only one word, not a new topic> verbrandingsmotor

NOT in vocabulary:  metalen metalen
--- only one word, not a new topic> metalen
--- only one word, not a new topic> laboratoriumproef
--- only one word, not a new topic> tuin
--- only one word, not a new topic> verfwinkel

NOT in vocabulary:  overheidsdaad onrechtmatig_overheidsdaad
append  overheidsdaad
append  onrechtmatig_overheidsdaad
append  verbod_verspreiding_afvalwater
append  aluminium_bestaan_container_houder
--- only one word, not a new topic> soort
--- only one word, not a new topic> nomade
--- only one word, not a new topic> bruinkoolwinning
append  herintroductie_plantensoort
--- only one word, not a new topic> ivoor
--- only one word, not a new topic> smog
append  regering_kabinet
append  indexeren_informatie
append  aantal_

--- only one word, not a new topic> woordenboek

NOT in vocabulary:  ijzerschroot ijzerschroot
append  ijzerschroot
--- only one word, not a new topic> ijzerschroot
--- only one word, not a new topic> heffing
--- only one word, not a new topic> autoclaaf
--- only one word, not a new topic> salmonella
--- only one word, not a new topic> vanadium
--- only one word, not a new topic> geluid
--- only one word, not a new topic> classificatie
--- only one word, not a new topic> antibioticum

NOT in vocabulary:  flotatie flotatie
append  flotatie
--- only one word, not a new topic> flotatie
--- only one word, not a new topic> leukemie
append  uiterlijk_kenmerk
--- only one word, not a new topic> licht
--- only one word, not a new topic> hagedis
--- only one word, not a new topic> kantoor
--- only one word, not a new topic> uitspoeling
--- only one word, not a new topic> looistof
append  ver_meng
append  plaats_ophogen
--- only one word, not a new topic> kalk
append  gemakkelijk_afbreekbaar_sto

--- only one word, not a new topic> expediteur
--- only one word, not a new topic> elektrolyse
--- only one word, not a new topic> congres
--- only one word, not a new topic> pendel
--- only one word, not a new topic> virologie
append  etsen_stof
--- only one word, not a new topic> aanbeveling
--- only one word, not a new topic> fluor
--- only one word, not a new topic> klif
--- only one word, not a new topic> rechtszaak
--- only one word, not a new topic> resolutie

NOT in vocabulary:  onderhandelbar onderhandelbar_heffing
append  onderhandelbar
append  onderhandelbar_heffing

NOT in vocabulary:  vogelkunen vogelkunen
append  vogelkunen
--- only one word, not a new topic> vogelkunen
--- only one word, not a new topic> marterachtigen
--- only one word, not a new topic> ontsmettingsmiddel
append  gehoor_zintuig
--- only one word, not a new topic> bezwaar
--- only one word, not a new topic> asbest
--- only one word, not a new topic> kikker
--- only one word, not a new topic> naaktzadig
-

--- only one word, not a new topic> salamander
--- only one word, not a new topic> radon

NOT in vocabulary:  ontzwaveling ontzwaveling
--- only one word, not a new topic> ontzwaveling
--- only one word, not a new topic> buideldieren
--- only one word, not a new topic> vlo

NOT in vocabulary:  basiciteit basiciteit
append  basiciteit
--- only one word, not a new topic> basiciteit

NOT in vocabulary:  skihelling skihelling
append  skihelling
--- only one word, not a new topic> skihelling

NOT in vocabulary:  spasmodisch spasmodisch_kroep
append  spasmodisch
append  spasmodisch_kroep
--- only one word, not a new topic> silo
--- only one word, not a new topic> viscositeit
--- only one word, not a new topic> mycologie
append  zone_vallen_recht_voorkoop
--- only one word, not a new topic> steroïd
--- only one word, not a new topic> foto

NOT in vocabulary:  limnologie stratificatie_omkering_limnologie
append  stratificatie_omkering_limnologie

NOT in vocabulary:  anthropologisch anthropolog


NOT in vocabulary:  milieuactieprogramma milieuactieprogramma
append  milieuactieprogramma
--- only one word, not a new topic> milieuactieprogramma

NOT in vocabulary:  milieuvoetafdruk milieuvoetafdruk
append  milieuvoetafdruk
--- only one word, not a new topic> milieuvoetafdruk
append  ecologisch_bestuur
--- only one word, not a new topic> milieuvoorschrift

NOT in vocabulary:  milieugebruiksruimte milieugebruiksruimte
append  milieugebruiksruimte
--- only one word, not a new topic> milieugebruiksruimte
append  eu_regeling_emissiehandel
append  behoud_ex_situ
--- only one word, not a new topic> overstromingsgevaar

NOT in vocabulary:  voedselafval voedselafval
append  voedselafval
--- only one word, not a new topic> voedselafval
append  bebossen_gebied
append  verbruik_fossiel_brandstof
append  functioneel_voeding
append  groen_economie
--- only one word, not a new topic> broeikasgasemissie
doubled TOPIC:  bovengronds_biomassa
--- only one word, not a new topic> habitatrichtlijn
app

In [31]:
# add topics to model
model.add(new_words,new_vectors)

In [40]:
# save the model with new topics
model.save_word2vec_format(excluded_model_name, binary=True)
model = KeyedVectors.load_word2vec_format(excluded_model_name, binary=True)

In [43]:
# try the model
model.similar_by_vector('gemoed')

[('bemoederen', 0.5206096172332764),
 ('bedaren', 0.5075072050094604),
 ('laaien', 0.4725201725959778),
 ('oplaaien', 0.4684869349002838),
 ('verbroederen', 0.4457176625728607),
 ('beroering', 0.44479846954345703),
 ('hitsen', 0.4322381019592285),
 ('verhitten', 0.4244909882545471),
 ('sussen', 0.4167637825012207),
 ('roering', 0.4148557782173157)]

In [44]:
# find most similar to topics to terms in the new model

# load the new lemma list
with open(lemma_list_file_excluded) as fp:
    topics = fp.readlines()

for i, topic in enumerate(topics):
    topic = topic.strip()
    print('\n-----\n', topic)
    try:
        print(i, model.similar_by_vector(topic))
    except:
        print(topic, 'NOT in model')


-----
 plaatselijk_ontwikkeling
0 [('plaatselijk', 0.8662415742874146), ('plaatselijk_vrijetijdsbesteding', 0.8270551562309265), ('plaatselijk_overheid', 0.8134081959724426), ('plaatselijk_bouwmateriaal', 0.7971285581588745), ('beleid_plaatselijk_overheid', 0.7902386784553528), ('plaatselijk_warmtevoorziening', 0.7807294130325317), ('plannen_stedelijk_ontwikkeling', 0.7750746011734009), ('plaatselijk_financiën', 0.7685471177101135), ('plaatselijk_verkeer', 0.7548452615737915), ('cultureel_ontwikkeling', 0.7546594738960266)]

-----
 plattelandsontwikkeling
1 [('plattelandsbeleid', 0.7567116618156433), ('platteland', 0.6597249507904053), ('ontwikkelingssamenwerking', 0.642474889755249), ('biotechnologie_landbouw', 0.6391189098358154), ('milieuwetgeving_betrekking_landbouw', 0.6330200433731079), ('landbouw_milieu', 0.6286821365356445), ('invloed_landbouw_milieu', 0.6279362440109253), ('landmaatschappij', 0.6250737309455872), ('intensief_landbouw', 0.6238653659820557), ('landbouw', 0.6203

22 [('landschapsarchitect', 0.8181471824645996), ('tuinarchitectuur', 0.7134948968887329), ('landschapsinrichting', 0.7095366716384888), ('interieurarchitectuur', 0.688307523727417), ('landschapsontwikkeling', 0.6558452844619751), ('stedenbouw', 0.6389328837394714), ('binnenhuisarchitectuur', 0.6251627206802368), ('landschapsecologie', 0.6125889420509338), ('architectuur', 0.6074659824371338), ('tuinkunst', 0.6008426547050476)]

-----
 landschapsplanning
23 [('landschapsecologie', 0.6183904409408569), ('ontwikkelingsplanning', 0.6174561977386475), ('landschapszorg', 0.6094745397567749), ('landschapsontwikkeling', 0.6006873250007629), ('vervoersplanning', 0.5889133810997009), ('onderwijsplanning', 0.5879173278808594), ('cultuurlandschap', 0.5775154232978821), ('landbouwlandschap', 0.5752402544021606), ('planning_kustzone', 0.5722979307174683), ('rivierenlandschap', 0.5702264308929443)]

-----
 grondgebruik
24 [('landgebruik', 0.7845229506492615), ('ruimtegebruik', 0.7012342810630798), (

42 [('erosie', 0.713876485824585), ('winderosie', 0.6975604295730591), ('bodemerosie', 0.6437233686447144), ('kusterosie', 0.6255168318748474), ('grondwaterstroming', 0.6191037893295288), ('waterstroming', 0.6095383167266846), ('verwering', 0.5963258147239685), ('bodemvorming', 0.5960437655448914), ('sedimentatie', 0.5892895460128784), ('grondwaterwinning', 0.5775061249732971)]

-----
 waterbeheer
43 [('gemeentelijk_waterbeheer', 0.8819676637649536), ('grondwaterbeheer', 0.8639160394668579), ('waterbeheersing', 0.8045111894607544), ('waterbeheerder', 0.7769753336906433), ('watersysteem', 0.762550950050354), ('waterschap', 0.7395204305648804), ('waterkwaliteit', 0.7358644008636475), ('waterbeheerplan', 0.7325818538665771), ('waterbeleid', 0.7228801250457764), ('ecologie_water', 0.7206017374992371)]

-----
 winderosie
44 [('erosie', 0.7316945791244507), ('watererosie', 0.6975603699684143), ('bodemerosie', 0.6713078022003174), ('tanderosie', 0.644499659538269), ('kusterosie', 0.6160998344

62 [('landschapsbeheer', 0.8216711282730103), ('natuurbeheerder', 0.7544478178024292), ('natuurontwikkeling', 0.7361350655555725), ('organisatie_natuurbehoud', 0.7297457456588745), ('natuurbehoud', 0.7191441655158997), ('natuurbeleid', 0.7023710012435913), ('terreinbeheer', 0.69813072681427), ('weidevogelbeheer', 0.6962774395942688), ('duurzaam_bosbeheer', 0.6883149743080139), ('bosbeheer', 0.6873830556869507)]

-----
 bescherming_natuurgebied
63 [('natuurgebied', 0.7950560450553894), ('bescherming', 0.7762265801429749), ('beschermen_landschap', 0.7721781730651855), ('gevoelig_natuurgebied', 0.7631096839904785), ('bescherming_stroomgebied', 0.7552374005317688), ('beschermen_gebied', 0.7327544689178467), ('bescherming_overstroming', 0.7291991114616394), ('beschermen_stroomgebied', 0.7077969312667847), ('beschermen', 0.6843119859695435), ('beschermingsgebied', 0.6813859343528748)]

-----
 organisatie_natuurbehoud
64 [('natuurbehoud', 0.8870013952255249), ('beleid_natuurbehoud', 0.8131250

81 [('overblijven_hoeveelheid_water', 0.7848765850067139), ('water_territoriaal_eigendomsrecht_vallen', 0.7831805944442749), ('bedreiging_water', 0.7747209668159485), ('voorraad_natuurlijk_hulpbron', 0.7677240967750549), ('gebruiken_water', 0.764919102191925), ('wetgeving_vervuiling', 0.7642806768417358), ('water_industrieel_gebruik', 0.7638999223709106), ('organisme_water', 0.7625914216041565), ('wetgeving_betrekking_natuur', 0.7615518569946289), ('hergebruik_water', 0.7611236572265625)]

-----
 mens_veroorzaken_klimaatsverandering
82 [('mens_veroorzaken_ramp', 0.8644546866416931), ('mens', 0.8566707968711853), ('verhouding_mens_natuur', 0.8162909746170044), ('effect_mens', 0.8144419193267822), ('aandoening_milieu_maken', 0.7367458343505859), ('menselijk_ziekte', 0.7079221606254578), ('ecologisch_leven_gemeenschap', 0.7071527242660522), ('dier_algemeen_systematisch', 0.6966469287872314), ('bescherming_wild_leven_plant_dier', 0.6964806914329529), ('leefomgeving_wild_leven_plant_dier', 

101 [('organisatie_onderwijs', 0.8852020502090454), ('algemeen_onderwijs', 0.8643460273742676), ('primair_onderwijs', 0.8382860422134399), ('basisonderwijs', 0.814500093460083), ('beroepsonderwijs', 0.7953816056251526), ('onderwijsbeleid', 0.7912188172340393), ('kleuteronderwijs', 0.7776983976364136), ('onderwijsaanbod', 0.7731028199195862), ('rekenonderwijs', 0.764816164970398), ('onderwijsmanagement', 0.7616945505142212)]

-----
 school
102 [('basisschool', 0.7888288497924805), ('kleuterschool', 0.7526339292526245), ('middenschool', 0.7496816515922546), ('schoolgebouw', 0.7303318977355957), ('talentschool', 0.7176211476325989), ('schoolbestuur', 0.7131590843200684), ('schoolleiding', 0.7121367454528809), ('basisonderwijs', 0.706332802772522), ('schoolproject', 0.6966183185577393), ('emmaschool', 0.6947404146194458)]

-----
 schoolonderwijs
103 [('vrijeschoolonderwijs', 0.7950142621994019), ('onderwijs', 0.7308645248413086), ('godsdienstonderwijs', 0.7217475175857544), ('vormingsonder

120 [('landbouw', 0.9432802200317383), ('voedselproductie_landbouw', 0.9223563075065613), ('landbouw_veehouderij', 0.9137663841247559), ('biologisch_landbouw', 0.8900019526481628), ('intensief_landbouw', 0.8784834146499634), ('landbouw_milieu', 0.8512214422225952), ('milieuwetgeving_betrekking_landbouw', 0.8467479944229126), ('meteorologie_landbouw', 0.843787431716919), ('invloed_landbouw_milieu', 0.799708366394043), ('mengen_landbouw_bedrijf', 0.778626561164856)]

-----
 afbraak
121 [('natuurlijk_afbraak', 0.9351076483726501), ('afbraak_gebouw', 0.8572907447814941), ('afbraak_invloed_licht', 0.750771701335907), ('afbraak_verontreinigen_stof', 0.749579906463623), ('afbraak_stratosferisch_ozon', 0.6859843730926514), ('afbraakwerken', 0.6353514194488525), ('sloop', 0.6285539269447327), ('afbraakproces', 0.5832436084747314), ('ontmanteling', 0.5538225173950195), ('afbraakproduct', 0.5484023094177246)]

-----
 investering
122 [('investeringsproject', 0.7948526740074158), ('invester', 0.764

139 [('metaalverwerkend_industrie', 0.9131323099136353), ('kunststofverwerkenen_industrie', 0.9011768698692322), ('elektrotechnisch_industrie', 0.8928403854370117), ('petrochemisch_industrie', 0.8791910409927368), ('communicatie_industrie', 0.8531831502914429), ('vestiging_industrie', 0.8509985208511353), ('machine_industrie', 0.8453456163406372), ('industrie_uitstoten', 0.8405485153198242), ('chemisch_industrie', 0.8369415998458862), ('drukkerij_industrie', 0.8249549865722656)]

-----
 voedselhygiëne
140 [('voedselveiligheid', 0.7081296443939209), ('zindelijkheid_hygiën', 0.657119870185852), ('hygiën', 0.6337281465530396), ('hygiënevoorschrift', 0.6312607526779175), ('handhygiëne', 0.6117279529571533), ('hygiënemaatregeel', 0.6075435280799866), ('hygiënecode', 0.6055477261543274), ('voedselbereiding', 0.600576639175415), ('arbeidshygiëne', 0.5978783965110779), ('ziekenhuishygiëne', 0.5958868861198425)]

-----
 dierlijk_productie
141 [('dierlijk_product', 0.8858780860900879), ('dierlij

160 [('afwatering_ondergrond', 0.9078412652015686), ('afwatering_oppervlakte', 0.8777958154678345), ('afwateren', 0.7574639320373535), ('afwateringssysteem', 0.7464696764945984), ('afwateringskanaal', 0.7255221605300903), ('afwateringssloot', 0.7079566717147827), ('afwateringsgebied', 0.6813047528266907), ('afwateringsrivier', 0.6737931370735168), ('natuurlijk_afwateringssysteem', 0.6443491578102112), ('ontwatering', 0.6375027894973755)]

-----
 landbouwstructuur
161 [('landbouwpraktijk', 0.7098090052604675), ('bouwstructuur', 0.6680682301521301), ('landbouwmethode', 0.6676844954490662), ('landbouwwetgeving', 0.6452653408050537), ('landbouw_veehouderij', 0.6426479816436768), ('landbouwproductie', 0.6367312669754028), ('voedselproductie_landbouw', 0.6317741870880127), ('landbouwgebied', 0.6314460635185242), ('akkerbouwgebied', 0.6309300661087036), ('extensief_veehouderij', 0.629458487033844)]

-----
 kansarm
162 [('kansarmoede', 0.7840963006019592), ('straatkind', 0.6375434398651123), (

180 [('metaalnijverheid', 0.875846266746521), ('metaalverwerkend_industrie', 0.6784454584121704), ('kunststofverwerkenen_industrie', 0.6330870985984802), ('textielnijverheid', 0.6326231956481934), ('staalindustrie', 0.6216803789138794), ('nijverheid', 0.6200705766677856), ('cementindustrie', 0.6144170761108398), ('metaalverwerkend', 0.614028811454773), ('staalbedrijf', 0.6118613481521606), ('landbouwindustrie', 0.6080690622329712)]

-----
 elektrotechnisch_industrie
181 [('industrie', 0.8928402662277222), ('metaalverwerkend_industrie', 0.8746414184570312), ('kunststofverwerkenen_industrie', 0.859851062297821), ('chemisch_industrie', 0.8586584329605103), ('petrochemisch_industrie', 0.8550692200660706), ('elektrotechnisch', 0.840399980545044), ('communicatie_industrie', 0.8015325665473938), ('vestiging_industrie', 0.7964857816696167), ('industrieel_installatie', 0.7953611612319946), ('machine_industrie', 0.7944237589836121)]

-----
 beheer_afwateringsgebied
182 [('beheer', 0.941221356391

 milieuplanning
199 [('milieuplan', 0.8155792951583862), ('gemeentelijk_milieuplan', 0.7286332845687866), ('ontwikkelingsplanning', 0.686496376991272), ('milieutechnologie', 0.6567206382751465), ('milieuanalyse', 0.6361076831817627), ('milieueconomie', 0.62668776512146), ('milieuprestatie', 0.6248735189437866), ('milieubeleid', 0.6213629245758057), ('milieuveiligheid', 0.621200442314148), ('milieu_beschermingsbeleid', 0.616858959197998)]

-----
 landbouwtechniek
200 [('landbouwmethode', 0.7662034034729004), ('landbouwpraktijk', 0.7494357824325562), ('landbouwkunde', 0.7391149401664734), ('landbouwwetenschap', 0.730712890625), ('landbouwkundig', 0.7176533341407776), ('bouwtechnologie', 0.7035408020019531), ('landbouwsamenleving', 0.6850320100784302), ('landbouwwerktuig', 0.6826510429382324), ('voedselproductie_landbouw', 0.6804693341255188), ('landbouwbedrijf', 0.6763432621955872)]

-----
 zuivelindustrie
201 [('zuivel', 0.6923847198486328), ('zuivelbedrijf', 0.6901733875274658), ('zuiv

218 [('vervoersysteem', 0.7514902353286743), ('vervoersstroom', 0.7297267913818359), ('vervoersnetwerk', 0.6748142242431641), ('vervoersmodus', 0.6677082180976868), ('vervoersplanning', 0.6631419658660889), ('vervoersmodaliteit', 0.6561250686645508), ('transportsysteem', 0.6490039825439453), ('railvervoer', 0.6460587978363037), ('vervoerplan', 0.6366535425186157), ('vervoersbeleid', 0.6251358389854431)]

-----
 zoutgehalte_bodem
219 [('bodem', 0.8864057064056396), ('ecosysteem_bodem', 0.8517657518386841), ('alkalisch_bodem', 0.8375234007835388), ('doorsijpeling_water_bodem', 0.8191103935241699), ('zoutgehalte_water', 0.8131271004676819), ('zoutgehalte', 0.8087168335914612), ('plaats_milieuverontreiniging_bodem_doordringen', 0.7812937498092651), ('storten_afval_bodem', 0.6897650957107544), ('zout_water', 0.6824023723602295), ('bodemsoort', 0.6723750233650208)]

-----
 zoutgehalte_water
220 [('demineralisatie_water', 0.8518707752227783), ('water', 0.8492984771728516), ('zout_water', 0.83

238 [('kwelwater', 0.6406350135803223), ('kommer', 0.5420193076133728), ('verzilting_water', 0.5389406681060791), ('kwelling', 0.5386312007904053), ('kwellen', 0.5348442792892456), ('doorsijpeling_water_bodem', 0.49321699142456055), ('verzilting', 0.4921126365661621), ('bedreiging_water', 0.48365336656570435), ('laagte', 0.48126137256622314), ('diep_grondwater', 0.4809563159942627)]

-----
 kwelwater
239 [('kwel', 0.6406350135803223), ('grondwater', 0.624053955078125), ('spaarbekken_overtollig_regenwater', 0.6035959720611572), ('landbouwwater', 0.593604564666748), ('regenwater', 0.5910575985908508), ('spoelwater', 0.5866135358810425), ('hemelwater', 0.5856196284294128), ('rioolwater', 0.5815009474754333), ('grondwaterstand', 0.5813727378845215), ('afvoerstelsel_regenwater', 0.5791400671005249)]

-----
 sociaal_ongelijkheid
240 [('sociaal', 0.9124742746353149), ('sociaal_differentiatie', 0.896281898021698), ('sociaal_omstandigheid', 0.8922401666641235), ('sociaal_ontwikkeling', 0.889940

257 [('niveau', 0.8555890917778015), ('kritisch', 0.713250994682312), ('niveaubepaling', 0.6552008986473083), ('doelstelling_individueel_economisch_onderneming', 0.6183315515518188), ('kritisch_belasting', 0.617047905921936), ('organisatieniveau', 0.6017724871635437), ('wetenschappelijk_technisch_informatie', 0.6007698774337769), ('hoog_onderwijs', 0.5964493751525879), ('referentieniveau', 0.5913721919059753), ('internationaal_evenwicht', 0.5910637378692627)]

-----
 nationaal_planning
258 [('industrieel_planning', 0.840887725353241), ('economisch_planning', 0.8366310596466064), ('stedelijk_planning', 0.8268205523490906), ('planning', 0.82468581199646), ('gewestelijk_planning', 0.8238353729248047), ('wetgeving_ruimtelijk_planning', 0.8174412846565247), ('planning_begrotings_systeem', 0.7841716408729553), ('nationaal_boekhouding', 0.765583336353302), ('nationaal_wetgeving', 0.7339773774147034), ('nationaal', 0.7334363460540771)]

-----
 bodemvorming
259 [('mineralisatie', 0.677680969238

276 [('land', 0.8407772779464722), ('ontwikkelen_land', 0.8110817074775696), ('opberging_land', 0.805915355682373), ('tussenkomst_land', 0.8034164905548096), ('vervoer_land', 0.7795935869216919), ('ontwikkelde_land', 0.7658349275588989), ('toekenning_land', 0.7626471519470215), ('hoeveelheid_vervuiling_land_verdragen', 0.7614885568618774), ('land_afkomstig_vervuiling_zee', 0.745814859867096), ('ecosysteem_halfdroog_land', 0.736711323261261)]

-----
 visserijsector
277 [('visserij', 0.6682114601135254), ('visserijbeheer', 0.6680402755737305), ('kustvisserij', 0.6414835453033447), ('beroepsvisserij', 0.6413426399230957), ('garnalenvisserij', 0.62385094165802), ('zeevisserij', 0.6109886169433594), ('visserijbeleid', 0.5886889696121216), ('binnenvisserij', 0.5876859426498413), ('kokkelvisserij', 0.5837357640266418), ('visveiling', 0.5823423862457275)]

-----
 rivier_oevervegetatie
278 [('rivier', 0.860663890838623), ('oevervegetatie', 0.8263982534408569), ('rivier_hulpbron', 0.766519606113

303 [('wetenschappelijk_beleid', 0.9260534048080444), ('industrieel_beleid', 0.923506498336792), ('sociaal_beleid', 0.9189171195030212), ('beleid', 0.9153189659118652), ('buitenlands_beleid', 0.8997583389282227), ('stedelijk_beleid', 0.8974659442901611), ('tenuitvoerlegging_beleid', 0.8927779197692871), ('chemisch_beleid', 0.8845219016075134), ('beleid_plaatselijk_overheid', 0.8719618320465088), ('economisch_ontwikkeling', 0.8461966514587402)]

-----
 sociaal_systeem
304 [('sociaal_structuur', 0.8588019013404846), ('sociaal_ontwikkeling', 0.8491319417953491), ('economisch_systeem', 0.8369356989860535), ('sociaal', 0.8358595967292786), ('sociaal_voorziening', 0.8260526061058044), ('sociaal_probleem', 0.8258693218231201), ('sociaal_differentiatie', 0.8194667100906372), ('sociaal_indicator', 0.8178693056106567), ('sociaal_vertegenwoordiging', 0.817661464214325), ('sociaal_wetenschap', 0.8174591064453125)]

-----
 bodemgebruik
305 [('grondgebruik', 0.6897576451301575), ('bodemkwaliteit', 0

322 [('houtindustrie', 0.7145036458969116), ('zoutindustrie', 0.7016950845718384), ('bouwmaterialenindustrie', 0.6821796894073486), ('betonindustrie', 0.6815625429153442), ('kunststofverwerkenen_industrie', 0.6769599318504333), ('metaalverwerkend_industrie', 0.6687859892845154), ('ijzerindustrie', 0.6619208455085754), ('cementfabriek', 0.658753514289856), ('petrochemisch_industrie', 0.6527643203735352), ('cementatie', 0.648024320602417)]

-----
 waterprij
323 [('vaststellen_waterprij', 0.8319031000137329), ('poolprij', 0.7211114168167114), ('natuurprijs', 0.7127888202667236), ('kamerprij', 0.7027744054794312), ('centerprij', 0.695798397064209), ('viewprij', 0.6905354857444763), ('uurprij', 0.6600565910339355), ('woningprijs', 0.6566476821899414), ('centrumprij', 0.6524680852890015), ('beachprij', 0.645793080329895)]

-----
 internationaal_recht
324 [('recht', 0.9365819692611694), ('internationaal_economisch_recht', 0.9231921434402466), ('administratief_recht', 0.9059792160987854), ('bu

342 [('bouwstijl', 0.9316973686218262), ('architectuurstijl', 0.726341724395752), ('traditioneel', 0.7089688181877136), ('milieuvriendelijk_architectuur', 0.6553795337677002), ('traditioneel_cultuur', 0.6504883170127869), ('architectuurstroming', 0.6474258899688721), ('bouwmethode', 0.6427807807922363), ('architectuu', 0.6418874263763428), ('traditionalisme', 0.6400821805000305), ('bouwkunst', 0.6340222358703613)]

-----
 samenstelling_bevolking
343 [('bevolking', 0.9126057624816895), ('geografisch_verspreiding_bevolking', 0.8214962482452393), ('stedelijk_bevolking', 0.8162810802459717), ('bevolkingssamenstelling', 0.7088178396224976), ('samenstelling', 0.6778681874275208), ('bevolkingsopbouw', 0.6753547191619873), ('bevolkingsgroep', 0.6678723692893982), ('bevolkingsontwikkeling', 0.6639991998672485), ('gegeven_per_hoofd_bevolking', 0.6601085662841797), ('bevolkingsstatistiek', 0.6449993252754211)]

-----
 waterschade
344 [('schade', 0.7245526313781738), ('voorkoming_schade', 0.716330

361 [('geluid', 0.7281672954559326), ('aërodynamisch_geluid', 0.6938502788543701), ('afwisselen_geluid', 0.6918220520019531), ('geluid_vliegtuig', 0.6802682876586914), ('storen_geluid', 0.673851728439331), ('aanhouden_geluid', 0.6418300867080688), ('achtergrondgeluid', 0.6335803270339966), ('omgevingsgeluid', 0.6141772270202637), ('klankeffect', 0.6028822660446167), ('geluidsspoor', 0.5991790890693665)]

-----
 landbouwmethode
362 [('landbouwtechniek', 0.7662034034729004), ('landbouwpraktijk', 0.7520248889923096), ('bouwmethode', 0.7104119658470154), ('teeltmethode', 0.7020084857940674), ('landbouwsamenleving', 0.6812900304794312), ('landbouwstructuur', 0.6676844954490662), ('productiemethode', 0.6529379487037659), ('voedselproductie_landbouw', 0.6462404727935791), ('landbouwwetenschap', 0.6428873538970947), ('landbouwsysteem', 0.6421258449554443)]

-----
 bevolkingsgroei
363 [('bevolkingsontwikkeling', 0.7305676341056824), ('bevolkingsopbouw', 0.7114791870117188), ('bevolkingsexplosie

380 [('energie', 0.8905637264251709), ('conventioneel_energie', 0.8625349998474121), ('energie_herwinning', 0.8385283946990967), ('biomassa_energie', 0.827866792678833), ('industrie', 0.8166872262954712), ('geothermisch_energie', 0.7965977191925049), ('richtlijn_hernieuwbaar_energie', 0.787540078163147), ('energie_opwekking', 0.7843881249427795), ('systeem_verdeling_energie', 0.7820028066635132), ('primair_energie', 0.780393123626709)]

-----
 milieu_industrie
381 [('werkgelegenheid_milieu', 0.9306793212890625), ('milieu', 0.9263105988502502), ('milieu_ontwikkeling', 0.9204662442207336), ('chemicaliën_milieu', 0.9195448160171509), ('invloed_industrie_milieu', 0.9153339266777039), ('milieu_informatiesysteem', 0.9144629836082458), ('milieu_investering', 0.9080730676651001), ('milieu_informatienetwerk', 0.8923821449279785), ('landbouw_milieu', 0.8875493407249451), ('milieu_beschermingsbeleid', 0.8756609559059143)]

-----
 afwateren
382 [('afwateringssloot', 0.7864730358123779), ('afwateri

400 [('landbouwwetgeving', 0.6600384712219238), ('kaderwetgeving', 0.6541393995285034), ('wetgeving_kernenergie', 0.6471496224403381), ('gezondheidswetgeving', 0.6460503339767456), ('luchtvaartwetgeving', 0.6370096802711487), ('natuurwetgeving', 0.6337007284164429), ('energiewereld', 0.6308883428573608), ('regelgeving', 0.6278250217437744), ('energieprestatieregelgeving', 0.6264793872833252), ('regelgeving_milieuverontreiniging', 0.6206457614898682)]

-----
 actief_populatie
401 [('actief', 0.8207390308380127), ('populatie', 0.7903519868850708), ('populatie_ecologisch', 0.7577031254768372), ('populatie_ecologie', 0.697300910949707), ('preventief_maatregel_gebied_gezondheid', 0.6492824554443359), ('actief_kool', 0.6334095001220703), ('selectief_verspreiding_informatie', 0.6299763917922974), ('ecologisch_gevoelig_gebied', 0.6229297518730164), ('sociaal_groep', 0.6196945905685425), ('verbannen_gezondheid_natuurlijk_wonen_omgeving', 0.6102578639984131)]

-----
 textielindustrie
402 [('text

419 [('mijnbouwonderneming', 0.7976918816566467), ('landbouwbedrijf', 0.7603133916854858), ('landbouwonderwijs', 0.7468103170394897), ('landbouwproject', 0.7038542032241821), ('landbouwwetenschap', 0.6773521304130554), ('landbouwpraktijk', 0.6751658320426941), ('tuinbouwbedrijf', 0.6749687194824219), ('landbouwactiviteit', 0.673530638217926), ('landbouwontwikkeling', 0.6673201322555542), ('bouwondernemer', 0.665565013885498)]

-----
 werkgelegenheid_milieu
420 [('milieu', 0.9547237157821655), ('milieu_ontwikkeling', 0.9414584636688232), ('milieu_informatiesysteem', 0.9324802756309509), ('milieu_industrie', 0.9306793212890625), ('milieu_beschermingsbeleid', 0.9303854703903198), ('milieu_investering', 0.92478346824646), ('milieu_informatienetwerk', 0.9148740768432617), ('gezondmaking_milieu', 0.9024941921234131), ('milieu_informatie', 0.8991645574569702), ('chemicaliën_milieu', 0.8986308574676514)]

-----
 veiligheid
421 [('internationaal_veiligheid', 0.8829829096794128), ('veiligheid_in

438 [('deelname', 0.843410849571228), ('publiek', 0.7876633405685425), ('publiek_opkomst', 0.7535123825073242), ('publiek_privaat_samenwerking', 0.7510544061660767), ('publiek_actie', 0.7321205139160156), ('publiek_toegang_terrein', 0.7093870043754578), ('publiek_opinie', 0.6811776757240295), ('deelnemen', 0.65838623046875), ('deelnemer', 0.644353449344635), ('institutioneel_activiteit', 0.6344664096832275)]

-----
 overheidsuitgave
439 [('overheidsbegroting', 0.7164291143417358), ('investeringsuitgave', 0.6813708543777466), ('overheidsbesteding', 0.6732540130615234), ('staatsbegroting', 0.6611774563789368), ('overheidsschuld', 0.659450352191925), ('overheidsfinanciën', 0.6517670154571533), ('verkiezingsuitgave', 0.6465574502944946), ('rijksuitgave', 0.6453949213027954), ('overheidsfinanciering', 0.6333388686180115), ('begrotingstekort', 0.6313033103942871)]

-----
 geschiedkundig_onderzoek
440 [('wetenschappelijk_onderzoek', 0.8670945167541504), ('sociologisch_onderzoek', 0.8415898084

459 [('overheidsfinanciën', 0.7482349276542664), ('ondernemingsfinanciering', 0.7067363262176514), ('financieringsstructuur', 0.687463641166687), ('financieringssysteem', 0.6856318712234497), ('bedrijfsfinanciering', 0.6841394901275635), ('financiering', 0.6836658120155334), ('financieringsbron', 0.6755553483963013), ('financieringswijze', 0.6714165210723877), ('overheidsbegroting', 0.670577883720398), ('financieringsbeleid', 0.6638929843902588)]

-----
 verhuur_huis
460 [('verhuur', 0.8898906707763672), ('verhuur_onroerend_goed', 0.8043152689933777), ('huis', 0.7871236801147461), ('huur', 0.7349473237991333), ('verhur', 0.7136897444725037), ('verhuren', 0.7017313241958618), ('sloepverhuur', 0.6978269815444946), ('kraanverhuur', 0.674917459487915), ('tentenverhuur', 0.6697361469268799), ('verhuurder', 0.6469625234603882)]

-----
 bodembewerking
461 [('bodembeweging', 0.7608507871627808), ('grondbewerking', 0.7257412672042847), ('bodembiologie', 0.6635872721672058), ('bodemstructuur', 0

481 [('internationaal_organisatie', 0.8726621866226196), ('administratief_organisatie', 0.8436020612716675), ('gouvernementeel_organisatie', 0.8413165211677551), ('organisatie_onderwijs', 0.7975020408630371), ('organisatie_rechtsstelsel', 0.7851678133010864), ('organisatiestructuur', 0.783316433429718), ('politiek_organisatie', 0.7778977155685425), ('organisatie_natuurbehoud', 0.7209603786468506), ('organisatiebeheersing', 0.7054834365844727), ('organisatieontwikkeling', 0.6887033581733704)]

-----
 industrieel_structuur
482 [('industrieel_ontwikkeling', 0.8487645387649536), ('chemisch_structuur', 0.8452777862548828), ('industrieel', 0.830682098865509), ('economisch_structuur', 0.8201567530632019), ('institutioneel_structuur', 0.8183293342590332), ('structuur', 0.8155362606048584), ('industrieel_materiaal', 0.8124047517776489), ('industrieel_productiestatistiek', 0.8108500242233276), ('industrieel_activiteit', 0.8095316886901855), ('industrieel_samenleving', 0.8091962337493896)]

-----

502 [('communicatienetwerk', 0.7254828214645386), ('communicatietechniek', 0.7039954662322998), ('communicatiemethode', 0.6925801038742065), ('communicatieplatform', 0.6905944347381592), ('spraakcommunicatie', 0.6903226375579834), ('communicatieapparatuur', 0.6832424402236938), ('communicatie', 0.6802480816841125), ('communicatiemodule', 0.6801661849021912), ('telefoonsysteem', 0.677980899810791), ('communicatieproduct', 0.6722849011421204)]

-----
 bouwgrond
503 [('nieuwbouwwoning', 0.7734227776527405), ('bouwkavel', 0.7674657702445984), ('perceel', 0.7400095462799072), ('verkaveling', 0.7206622362136841), ('bouwverplichting', 0.701711893081665), ('gezinswoning', 0.6999364495277405), ('bouwperceel', 0.6971692442893982), ('koopwoning', 0.6880929470062256), ('rijwoning', 0.6869634389877319), ('bebouwing', 0.6836302876472473)]

-----
 financieel_markt
504 [('markt', 0.8711899518966675), ('monetair_markt', 0.8672826290130615), ('markt_productiefactor', 0.8295921087265015), ('financieel', 

522 [('bevolkingsopbouw', 0.7767531871795654), ('bevolkingsprognose', 0.7334768772125244), ('bevolkingssamenstelling', 0.7319605350494385), ('bevolkingsgroei', 0.7305676341056824), ('bevolkingsomvang', 0.6705513000488281), ('bevolking', 0.6702069044113159), ('samenstelling_bevolking', 0.6639991998672485), ('bevolkingsdaling', 0.66217041015625), ('bevolkingsstatistiek', 0.6532764434814453), ('stedelijk_bevolking', 0.6513859629631042)]

-----
 samenstellen_voeding
523 [('voeding', 0.9207764267921448), ('functioneel_voeding', 0.888862133026123), ('toegepast_voeding', 0.7361403703689575), ('voedingsmiddel', 0.7315959930419922), ('voedings', 0.6683792471885681), ('voedingskundig', 0.6639920473098755), ('verwerken_voedingsmiddel', 0.662740170955658), ('voedingsstof', 0.6559258103370667), ('voedingsproduct', 0.6543627977371216), ('voedingsrichtlijn', 0.6532164812088013)]

-----
 kunst
524 [('kunstenaar', 0.7341340780258179), ('kunstwerk', 0.7321104407310486), ('podiumkunst', 0.715009391307830

543 [('landschapsherstel_voormalig_mijnbouwgebied', 0.7146788835525513), ('natuurherstel', 0.5952576398849487), ('beekherstel', 0.5941632986068726), ('landschapsonderhoud', 0.5836878418922424), ('landschapsontwikkeling', 0.5815634727478027), ('cultuurlandschap', 0.5754883885383606), ('rivierenlandschap', 0.5706932544708252), ('natuurlandschap', 0.5675459504127502), ('natuurontwikkelingsproject', 0.5648419857025146), ('landschap', 0.5537872910499573)]

-----
 stralingseffect
544 [('stralingsschade', 0.689033031463623), ('stralingsbron', 0.6663718223571777), ('neutronenstraling', 0.6553317904472351), ('stralingsdosis', 0.6426272988319397), ('gedragseffect', 0.6372036933898926), ('stralingswarmte', 0.6368326544761658), ('ultraviolet_straling', 0.6349943280220032), ('opsporingstechniek_radioactief_straling', 0.6347354650497437), ('stralingsniveau', 0.6337739825248718), ('stralingsmeting', 0.6276721954345703)]

-----
 organisme_water
545 [('ecosysteem_water', 0.8973007202148438), ('water', 

565 [('sociaal_ontwikkeling', 0.8960676789283752), ('sociaal_structuur', 0.8874726295471191), ('sociaal_differentiatie', 0.8730407357215881), ('sociaal_ongelijkheid', 0.8663231134414673), ('sociaal_beweging', 0.8654544353485107), ('sociaal', 0.8638689517974854), ('sociaal_omstandigheid', 0.8593097925186157), ('sociaal_vertegenwoordiging', 0.8582553863525391), ('sociaal_participatie', 0.8465238213539124), ('sociaal_wetenschap', 0.8301101922988892)]

-----
 marketing
566 [('marketingcommunicatie', 0.831334114074707), ('internetmarketing', 0.7870140075683594), ('marketingplan', 0.7631824612617493), ('marketeer', 0.758425772190094), ('marketingplanning', 0.7578787803649902), ('zoekmachinemarketing', 0.7184810638427734), ('sportmarketing', 0.7148890495300293), ('telemarketing', 0.7075427770614624), ('marketingcampagne', 0.7022247314453125), ('marketingstrategie', 0.7011345624923706)]

-----
 personenwagen
567 [('personenauto', 0.7247220873832703), ('bedrijfswagen', 0.6774598360061646), ('be

587 [('onderwijsplaat', 0.7066236734390259), ('ontwikkelingsplanning', 0.6751189827919006), ('onderwijsperiode', 0.6457716822624207), ('onderwijspraktijk', 0.644836962223053), ('onderwijsproces', 0.6332141160964966), ('onderwijsproduct', 0.6326701045036316), ('onderwijsachterstandenbeleid', 0.6310078501701355), ('onderwijsbeleid', 0.6299415230751038), ('studieplanning', 0.6271482706069946), ('professionaliseringsplan', 0.623131275177002)]

-----
 nieuw_gemeente
588 [('nieuw_gemeenschap', 0.8147163391113281), ('gemeente', 0.7991069555282593), ('nieuw', 0.7638226747512817), ('aanbrengen_nieuw_onderdeel_oud_model', 0.7340919971466064), ('milieubeleid_gemeente', 0.7300929427146912), ('nieuw_voedingsmiddel', 0.7253479361534119), ('nieuw_installatie', 0.7047395706176758), ('nieuw_technologie', 0.6998285055160522), ('nieuw_materiaal', 0.6770272850990295), ('oud_installatie', 0.6598493456840515)]

-----
 ruimtelijk_verdeling
589 [('ruimtelijk_ordening', 0.8383421897888184), ('ruimtelijk', 0.83

607 [('toestand', 0.8688668608665466), ('economisch_toestand', 0.81131911277771), ('leven_toestand', 0.7977646589279175), ('lichamelijk', 0.7963285446166992), ('vloeibaar_toestand', 0.7743893265724182), ('lichamelijk_verandering', 0.7607251405715942), ('gegeven_toestand_milieu', 0.7460447549819946), ('lichamelijk_behandeling', 0.7249938249588013), ('toestand_waarin_stof_verkeren', 0.7193795442581177), ('colloïdaal_toestand', 0.6918490529060364)]

-----
 organisch_scheikunde
608 [('analytisch_scheikunde', 0.8789929151535034), ('scheikunde', 0.8745406866073608), ('algemeen_scheikunde', 0.8536251187324524), ('atmosferisch_scheikunde', 0.8243390917778015), ('organisch', 0.8038997054100037), ('anorganisch_chemie', 0.7809872627258301), ('organisch_fosforverbinding', 0.7752503752708435), ('organisch_stikstofverbinding', 0.7746286392211914), ('organisch_zuurstofverbinding', 0.7744309306144714), ('organisch_metaalverbinding', 0.7643396854400635)]

-----
 mosselteelt
609 [('aardappelteelt', 0.70

628 [('soort', 0.9064503908157349), ('soort_bedrijf', 0.8953834772109985), ('soort_aanpassingsvermogen', 0.8892626762390137), ('soort_milieuverontreiniging', 0.8833600282669067), ('soort_aanstelling', 0.8817026615142822), ('verzameling_soort', 0.8690503835678101), ('soort_ecosysteem', 0.8634204268455505), ('kwetsbaar_soort', 0.8567244410514832), ('bescherming_soort', 0.8552469611167908), ('soort_aanspraak', 0.8520907163619995)]

-----
 zwemwater_algemeen
629 [('zwemwater', 0.910159707069397), ('zwemwater_zoet', 0.7663944959640503), ('zwemwater_zout', 0.751954972743988), ('zwemwaterrichtlijn', 0.6934171319007874), ('zwemgelegenheid', 0.6646748185157776), ('zwemplas', 0.6414385437965393), ('zwembadwater', 0.6290062665939331), ('waterkwaliteit', 0.6215894818305969), ('buitenwater', 0.6106072068214417), ('overblijven_hoeveelheid_water', 0.6034045219421387)]

-----
 milieuvergunning
630 [('milieuvergunningsaanvraag', 0.8731324672698975), ('bouwvergunning', 0.7747436761856079), ('vergunning'

648 [('klimaatfactor', 0.6416791677474976), ('klimaatgebied', 0.6412614583969116), ('landschapstype', 0.6300393342971802), ('habitattype', 0.6218771934509277), ('klimaatzone', 0.6191167831420898), ('woudgebied_matigen_klimaatzone', 0.6190991401672363), ('klimaat', 0.614841639995575), ('equatoriaal_klimaat', 0.5978744626045227), ('klimaatmodel', 0.5960314273834229), ('tropisch_klimaat', 0.5940442085266113)]

-----
 belastingwet
649 [('belastingwetgeving', 0.8409326076507568), ('belastingregeling', 0.7005788087844849), ('aanpassingswet', 0.6768237352371216), ('belastingregel', 0.6557987332344055), ('loonbelasting', 0.6479495763778687), ('belastingverordening', 0.6460963487625122), ('invorderingswet', 0.6451756954193115), ('vestingwet', 0.6439720392227173), ('inkomstenbelasting', 0.6373804807662964), ('invoeringswet', 0.6370518207550049)]

-----
 subsidie
650 [('projectsubsidie', 0.8017820119857788), ('subsidieregeling', 0.7916049957275391), ('subsidiering', 0.7906848788261414), ('subsidi

668 [('bijzonder_industrieel_afval', 0.9705311059951782), ('industrie_afval', 0.9697480201721191), ('chemisch_afval', 0.9505019783973694), ('afval', 0.9503520727157593), ('huishoudelijk_afval', 0.9464989900588989), ('elektronisch_afval', 0.941279411315918), ('organisch_afval', 0.9412017464637756), ('bijzonder_afval', 0.9404289722442627), ('samenstelling_afval', 0.9397161602973938), ('plantaardig_afval', 0.9369526505470276)]

-----
 intensief_veehouderij
669 [('extensief_veehouderij', 0.8948087096214294), ('veehouderij', 0.8586486577987671), ('intensief_landbouw', 0.8320093154907227), ('intensief', 0.799737811088562), ('landbouw_veehouderij', 0.7848070859909058), ('melkveehouderij', 0.7438873648643494), ('rundveehouderij', 0.6836402416229248), ('extensief', 0.6812969446182251), ('biologisch_landbouw', 0.6791402101516724), ('voedselproductie_landbouw', 0.6640646457672119)]

-----
 stromen_water
670 [('water', 0.9083999991416931), ('gebruiken_water', 0.871259331703186), ('stromen', 0.8599

689 [('risicobeleid', 0.7244845628738403), ('risicobeheersing', 0.7150949239730835), ('risicobeheer', 0.6735104918479919), ('portefeuillebeheer', 0.64641273021698), ('risicomanagement', 0.6444447040557861), ('kasbeheer', 0.6088800430297852), ('risicobenadering', 0.6088318228721619), ('risicobewustzijn', 0.5947515964508057), ('middelenbeheer', 0.5939129590988159), ('riskmanagement', 0.5928266644477844)]

-----
 koolmonoxide
690 [('koolmonoxidevergiftiging', 0.761486291885376), ('koolmonoxidemelder', 0.7480955123901367), ('koolstofmonoxide', 0.7142473459243774), ('koolstofmonoxidevergiftiging', 0.6023712158203125), ('rookgas', 0.5875953435897827), ('rookmelder', 0.5865644216537476), ('stikstofmonoxide', 0.5735045671463013), ('verbrandingsgas', 0.5483556389808655), ('zuivering_rookgas', 0.5304177403450012), ('verbrandingsproduct', 0.5302720069885254)]

-----
 tussenkomst_land
691 [('land', 0.9247679710388184), ('toekenning_land', 0.9060583710670471), ('ontwikkelen_land', 0.890829682350158

708 [('tertiair', 0.8603078722953796), ('secundair_behandeling', 0.8267384767532349), ('primair_behandeling', 0.7756075859069824), ('tertiair_sector', 0.758086085319519), ('behandeling', 0.7566463947296143), ('lichamelijk_behandeling', 0.7354012727737427), ('chemisch_behandeling', 0.7178308963775635), ('anaëroob_behandeling', 0.6875568628311157), ('fytosanitair_behandeling', 0.6703765392303467), ('aëroob_behandeling', 0.6639763116836548)]

-----
 ontwikkeling_waterkant
709 [('waterkant', 0.861308753490448), ('ontwikkeling_waterbron', 0.6838404536247253), ('ontwikkeling', 0.6829494833946228), ('aantrekkelijk_kant_waterrecreatie', 0.6519812345504761), ('plannen_stedelijk_ontwikkeling', 0.651430070400238), ('bedreiging_water', 0.6457738280296326), ('stedelijk_stroom_hulpbron', 0.6416547894477844), ('afvalwaterzuivering_plek', 0.6402044892311096), ('industrieel_ontwikkeling', 0.6398069858551025), ('stadsplanning_ontwikkeling', 0.6265347599983215)]

-----
 technisch_voorziening_gebouw
710 [

730 [('lastdier', 0.5995039343833923), ('rijdier', 0.5708502531051636), ('slachtdier', 0.5430999398231506), ('weekdier', 0.5423654317855835), ('trekhond', 0.5379151105880737), ('slachten_dier', 0.5358666181564331), ('hondenkar', 0.535368800163269), ('paardachtig', 0.5347062349319458), ('muildier', 0.5328897833824158), ('paardentuig', 0.5264867544174194)]

-----
 procesrecht
731 [('strafprocesrecht', 0.8380597233772278), ('bestuursprocesrecht', 0.7971271872520447), ('procesrechtelijk', 0.7639138102531433), ('strafrecht', 0.7384204268455505), ('verbintenissenrecht', 0.7239516973495483), ('contractenrecht', 0.7224825024604797), ('privaatrecht', 0.7179874777793884), ('bewijsrecht', 0.705608069896698), ('goederenrecht', 0.6930733919143677), ('internationaal_privaatrecht', 0.675523042678833)]

-----
 huishoudelijk_artikel
732 [('artikel', 0.8363605737686157), ('huishoudelijk', 0.8056821227073669), ('huishoudelijk_uitgaaf', 0.7301992177963257), ('huishoudelijk_apparaat', 0.7053598165512085), 


-----
 milieustudie
750 [('milieusubsidi', 0.6618303060531616), ('veiligheidsstudie', 0.6367774605751038), ('milieusamenwerking', 0.6251714825630188), ('milieuonderzoek', 0.6118506789207458), ('evaluatiestudie', 0.61088627576828), ('milieuanalyse', 0.5995898246765137), ('ontwikkelingsstudie', 0.5978268384933472), ('milieueconomie', 0.5889511704444885), ('beleidsstudie', 0.588871955871582), ('milieuwetenschap', 0.5832157731056213)]

-----
 grensgebied
751 [('grensstreek', 0.6854438781738281), ('grens', 0.6489858627319336), ('grensregio', 0.6360452771186829), ('randgebied', 0.6062639951705933), ('bestuurlijk_grens', 0.6058185696601868), ('grensverkeer', 0.6023935079574585), ('grens_algemeen_noodtoestand', 0.5977729558944702), ('grensprovincie', 0.5953959226608276), ('gebied', 0.5916984677314758), ('waterrijk_gebied', 0.589501142501831)]

-----
 milieusubsidi
752 [('milieusamenwerking', 0.6911492943763733), ('cultuursubsidie', 0.6887627243995667), ('investeringssubsidie', 0.6803830862045

768 [('aardbeving_veroorzaken_zeegolf', 0.6736747026443481), ('natuurgeweld', 0.6715328693389893), ('mens_veroorzaken_ramp', 0.6670950651168823), ('ramp', 0.6654596924781799), ('hydrologisch_ramp', 0.6494138836860657), ('bescherming_overstroming', 0.6405733823776245), ('cultuurramp', 0.6375190019607544), ('ramp_bestrijdings_dienst', 0.6309075355529785), ('overstroming', 0.6281298398971558), ('weerkundig_ramp', 0.6278921961784363)]

-----
 nederzetting
769 [('nederzetting_platteland', 0.8422142863273621), ('concentratie_nederzetting', 0.8279588222503662), ('landbouwnederzetting', 0.7370588779449463), ('milieuaspect_menselijk_nederzetting', 0.692186176776886), ('arbeidersnederzetting', 0.6359968185424805), ('landbouwgemeenschap', 0.5966877937316895), ('bewoning', 0.5804210901260376), ('heuvelfort', 0.5768277049064636), ('ontginning_landbouwgrond', 0.5719106197357178), ('tijdelijk_bewoning', 0.5608095526695251)]

-----
 planologisch_maatregel
770 [('maatregel', 0.8352980613708496), ('plan

790 [('gezinsplan', 0.7896443605422974), ('gezinsbegeleiding', 0.6084182262420654), ('kinderzorg', 0.592831015586853), ('gezinsbeleid', 0.592316746711731), ('gezinsvorming', 0.5913539528846741), ('sociaal_hulpverlening', 0.5803893804550171), ('gezinsondersteuning', 0.5744441151618958), ('medicalisering', 0.5700788497924805), ('anticonceptie', 0.5698680877685547), ('contraceptie', 0.5663042068481445)]

-----
 middellandse_zeebos
791 [('zeebos', 0.9141613841056824), ('middellandse_zee', 0.6416091918945312), ('voetpad_langs_kust', 0.6345670819282532), ('tropisch_bos', 0.6214723587036133), ('kust_strook', 0.6122299432754517), ('kaspische_zee', 0.6098570227622986), ('middellandse', 0.6081392168998718), ('zuidelijk_atlantisch_oceaan', 0.6075972318649292), ('duinpark', 0.6048557758331299), ('badplaats_zee', 0.6026307344436646)]

-----
 schoolleven
792 [('schoolgaan', 0.5708820819854736), ('schooldag', 0.5434442758560181), ('schoolperiode', 0.5416174530982971), ('schools', 0.5404804944992065),

810 [('bodemkartering', 0.6694012880325317), ('bodemkundige', 0.6398522257804871), ('bodemkunen', 0.6390078663825989), ('bodemkundig', 0.6323087215423584), ('topografisch', 0.5839922428131104), ('hoogtekaart', 0.5826634168624878), ('bodemopbouw', 0.5794512629508972), ('reliëfkaart', 0.5720465183258057), ('bodemkwaliteit', 0.5652890205383301), ('bodemfauna', 0.5611944794654846)]

-----
 rechtsstelsel
811 [('organisatie_rechtsstelsel', 0.8408576250076294), ('rechtstelsel', 0.7620595693588257), ('rechtssysteem', 0.7421891689300537), ('rechtsregel', 0.6219144463539124), ('rechtsorde', 0.6204454302787781), ('onderwijsstelsel', 0.6158774495124817), ('bestuursstelsel', 0.6153569221496582), ('huwelijksvermogensstelsel', 0.6123685836791992), ('rechtsbeginsel', 0.6101899743080139), ('zekerheidsstelsel', 0.6095578670501709)]

-----
 menselijk_lichaam
812 [('lichaam', 0.8864927291870117), ('menselijk', 0.8655377626419067), ('menselijk_gezondheid', 0.8016954064369202), ('menselijk_ziekte', 0.724809

830 [('informatievoorzieningen', 0.6380407810211182), ('netwerkinfrastructuur', 0.6360610723495483), ('informatiestructuur', 0.6238143444061279), ('informatieplanning', 0.6225689053535461), ('infrastructuur', 0.6200111508369446), ('informatiesysteem', 0.6179033517837524), ('informatieproces', 0.6005347371101379), ('spoorweginfrastructuur', 0.5970745086669922), ('informatiedienstverlening', 0.5903576016426086), ('informatieketen', 0.5901092886924744)]

-----
 plantenleven
831 [('plantenrijk', 0.6544486880302429), ('dierenleven', 0.6466966867446899), ('plantendeel', 0.6254770755767822), ('plantengroei', 0.6207019090652466), ('plantengroep', 0.6078605055809021), ('leefomgeving_wild_leven_plant_dier', 0.6050081253051758), ('plantenliefhebber', 0.5988123416900635), ('voortplanting_plant', 0.5986154675483704), ('zichtbaar_bloeien_plant', 0.5958331823348999), ('reservaat_wild_leven_plant_dier', 0.5954294204711914)]

-----
 ruimtevaartbeleid
832 [('ruimtevaartprogramma', 0.7521659731864929), (

849 [('procestechniek', 0.8994735479354858), ('productietechnologie', 0.7162752151489258), ('procesindustrie', 0.7087578773498535), ('milieutechnologie', 0.6665077805519104), ('productietechniek', 0.6554383039474487), ('besturingstechniek', 0.6496539115905762), ('kunststofverwerkenen_industrie', 0.6411707997322083), ('energietechnologie', 0.6389607191085815), ('laboratoriumtechnologie', 0.632172703742981), ('chemisch_industrie', 0.6308612823486328)]

-----
 buitenlands_beleid
850 [('beleid', 0.912013053894043), ('wetenschappelijk_beleid', 0.9098372459411621), ('economisch_beleid', 0.8997583389282227), ('industrieel_beleid', 0.8987684845924377), ('tenuitvoerlegging_beleid', 0.8912009000778198), ('sociaal_beleid', 0.8795983791351318), ('chemisch_beleid', 0.8592402935028076), ('beleid_plaatselijk_overheid', 0.8575358390808105), ('stedelijk_beleid', 0.8565446138381958), ('beleid_natuurbehoud', 0.8297510147094727)]

-----
 europees_gemeenschap
851 [('europees', 0.9331236481666565), ('europe

871 [('arbeidsproductiviteit', 0.7315841913223267), ('efficiëntie', 0.7235192060470581), ('productivity', 0.7176614999771118), ('productief', 0.6761777400970459), ('verhoging_efficiëntie', 0.6438978910446167), ('productiviteitsverbetering', 0.6420868635177612), ('productiviteitsverlie', 0.6359188556671143), ('productiviteitswinst', 0.6285288333892822), ('winstgevendheid', 0.6145082116127014), ('efficientie', 0.6096764802932739)]

-----
 industrieel_uitrusting
872 [('uitrusting', 0.828244686126709), ('industrieel_veiligheid', 0.794914722442627), ('industrieel_installatie', 0.7904508113861084), ('industrieel', 0.790289044380188), ('militair_uitrusting', 0.7897628545761108), ('industrieel_materiaal', 0.785422682762146), ('industrieel_activiteit', 0.7731747627258301), ('industrieel_ontwikkeling', 0.7726702094078064), ('industrieel_structuur', 0.7704926133155823), ('industrieel_fabricage', 0.7628591060638428)]

-----
 vloeiveld_afvalwater_mest
873 [('mest', 0.8619542717933655), ('vloeibaar_

889 [('regering', 0.8836711049079895), ('centraal_regering', 0.8258364200592041), ('grondgebied', 0.8189682364463806), ('federaal_regering', 0.8180661201477051), ('politiek_grondgebied', 0.8065628409385681), ('regering_kabinet', 0.7885363101959229), ('natuurreservaat_staat', 0.709516167640686), ('gemeenschap_levend_grondgebied', 0.6945805549621582), ('federaal_overheid', 0.682396411895752), ('natie', 0.6711747646331787)]

-----
 public_relations
890 [('public', 0.8903162479400635), ('relations', 0.8679460883140564), ('relation', 0.8018890619277954), ('institutional', 0.628987193107605), ('publics', 0.6039785742759705), ('publicly', 0.6006692051887512), ('publicity', 0.5956449508666992), ('administration', 0.5858678221702576), ('communication', 0.5823656320571899), ('relational', 0.5797078013420105)]

-----
 prijsbeleid
891 [('grondprijsbeleid', 0.7334558367729187), ('promotiebeleid', 0.6593702435493469), ('prijszetting', 0.6413686871528625), ('tariefbeleid', 0.6399226188659668), ('prij

908 [('dierlijk', 0.9008442163467407), ('dierlijk_erfelijkheidsleer', 0.8768157362937927), ('dierlijk_uitwerpsel', 0.853999137878418), ('dierlijk_productie', 0.8269215226173401), ('voortplanting', 0.8168761730194092), ('dierlijk_uitwerpsel_brandstof', 0.813063383102417), ('kunstmatig_voortplanting', 0.7978401184082031), ('dierlijk_product', 0.791379988193512), ('textielvezel_dierlijk_oorsprong', 0.7709230780601501), ('dierlijk_rest', 0.7707182765007019)]

-----
 concurrentie_economisch
909 [('economisch', 0.8963576555252075), ('economisch_ontwikkeling', 0.8769254684448242), ('economisch_stimuleringsmaatregel', 0.8676389455795288), ('economisch_levensvatbaarheid', 0.8655925989151001), ('economisch_concentratie', 0.8461220860481262), ('economisch_structuur', 0.8395980000495911), ('internationaal_concurrentie', 0.8331955671310425), ('handel_economisch', 0.8297895193099976), ('economisch_analyse', 0.8294617533683777), ('economisch_activiteit', 0.8242537975311279)]

-----
 milieubehoud
910 

929 [('verkeersbeleid', 0.8291078209877014), ('vervoersplan', 0.6998006105422974), ('vervoerplan', 0.6891577839851379), ('mobiliteitsbeleid', 0.6879540681838989), ('mobiliteitsplan', 0.6598805785179138), ('vervoersysteem', 0.6498280763626099), ('fietsbeleid', 0.6423133611679077), ('mededingingsbeleid', 0.6420857906341553), ('locatiebeleid', 0.6382755637168884), ('vervoer', 0.6369149684906006)]

-----
 tropisch_bos
930 [('bos', 0.8922513723373413), ('natuurlijk_bos', 0.8910883069038391), ('achteruitgang_bos', 0.8702535629272461), ('bos_matigen_klimaatzone', 0.8356742858886719), ('bos_schadelijk_dier_plant', 0.8044828772544861), ('kap_bos', 0.7929824590682983), ('mengen_bos', 0.789736807346344), ('tropisch_regenwoud', 0.7761399745941162), ('tropisch', 0.7502622008323669), ('tropisch_ecosysteem', 0.734572172164917)]

-----
 vervuilen_gebied
931 [('ecologisch_gevoelig_gebied', 0.8468676209449768), ('verstedelijken_gebied', 0.8447074294090271), ('gevoelig_gebied', 0.8350149393081665), ('ind

950 [('caravan', 0.7456732988357544), ('bungalowtent', 0.7207757830619812), ('toercaravan', 0.7103878259658813), ('bungalow', 0.693822979927063), ('safaritent', 0.6905455589294434), ('kampeerplaats', 0.6875215768814087), ('camping', 0.6855379343032837), ('mobilhome', 0.6838414072990417), ('chalet', 0.6685423851013184), ('kamperen', 0.6590636968612671)]

-----
 meststoffenwet
951 [('mestwetgeving', 0.6912302374839783), ('meststof', 0.6732123494148254), ('bemestingsnorm', 0.638889491558075), ('landbouwwetgeving', 0.6355045437812805), ('mestbeleid', 0.626313328742981), ('kunstmeststof', 0.6226636171340942), ('mestbank', 0.6142157316207886), ('fosfaatrecht', 0.6111263632774353), ('natuurbeschermingswet', 0.6101926565170288), ('boswet', 0.6076242327690125)]

-----
 kwaliteitsbewaking
952 [('kwaliteitscontrole', 0.6764983534812927), ('kwaliteitsbeheersing', 0.6476517915725708), ('procesbewaking', 0.6416959762573242), ('kwaliteitsbeheer', 0.6407078504562378), ('kwaliteitsborging', 0.634820461

969 [('industrieel_gebied', 0.8887373805046082), ('toeristisch_gebied', 0.8712058067321777), ('stedelijk_gebied', 0.8666050434112549), ('verstedelijken_gebied', 0.8650557994842529), ('gebied', 0.8611158728599548), ('ecologisch_gevoelig_gebied', 0.8512172102928162), ('terrestrisch_gebied', 0.8483699560165405), ('voorstedelijk_gebied', 0.848212480545044), ('biogeografisch_gebied', 0.8356733918190002), ('economisch_ontwikkeling', 0.8249374032020569)]

-----
 wereldwijd_model
970 [('model', 0.866873025894165), ('atmosferisch_model', 0.7533862590789795), ('wereldwijd', 0.7179966568946838), ('wereldwijd_aspect', 0.697985053062439), ('aanbrengen_nieuw_onderdeel_oud_model', 0.6800340414047241), ('wereldwijd_opwarming', 0.627386748790741), ('modeller', 0.6120959520339966), ('internationaal_belangrijk_ecosysteem', 0.6080447435379028), ('modellering', 0.6053735613822937), ('modelling', 0.603457510471344)]

-----
 bedrijfsorganisatie
971 [('milieueconomie_onderneming', 0.5810518860816956), ('bedri

989 [('dierenrechtenactivist', 0.7810730338096619), ('dierenrechtenorganisatie', 0.7540557384490967), ('ongewerveld_dier', 0.6201955080032349), ('dierenactivist', 0.6093337535858154), ('dierenbeschermingsorganisatie', 0.6080912351608276), ('dierenleed', 0.6032033562660217), ('dierenwelzijn', 0.6003326773643494), ('dierenbeschermer', 0.5960168838500977), ('dierengedrag', 0.5954359769821167), ('verdringing_dier', 0.5946164131164551)]

-----
 ambachtelijk_nijverheid
990 [('nijverheid', 0.8811747431755066), ('ambachtelijk', 0.8091831207275391), ('ambacht', 0.714769721031189), ('industrieel_fabricage', 0.7107799053192139), ('ambachtelijkheid', 0.6922136545181274), ('metaalverwerkend_industrie', 0.6894441843032837), ('elektrotechnisch_industrie', 0.677613377571106), ('industrieel', 0.6773459911346436), ('industrieel_productiestatistiek', 0.6722872257232666), ('kunststofverwerkenen_industrie', 0.6705135107040405)]

-----
 economisch_theorie
991 [('economisch', 0.8282695412635803), ('economisc

1011 [('heffing_geluidsemissie', 0.692346453666687), ('milieubelasting', 0.6867287755012512), ('milieusubsidi', 0.6551318168640137), ('heffing', 0.6480594277381897), ('afvalheffing', 0.6472818851470947), ('milieukosten', 0.6280460357666016), ('milieumaatregel', 0.6254287958145142), ('milieubijdrage', 0.6246920824050903), ('waterschapsbelasting', 0.6217411160469055), ('energiebelasting', 0.6184647083282471)]

-----
 milieuvervuiling
1012 [('milieuverontreiniging', 0.767765998840332), ('watervervuiling', 0.7066051959991455), ('luchtvervuiling', 0.7056190967559814), ('milieuprobleem', 0.6872487664222717), ('bestrijding_milieu_verontreiniging', 0.6774570941925049), ('vervuiling', 0.6753002405166626), ('milieuschade', 0.6739132404327393), ('bodemvervuiling', 0.6543159484863281), ('technologie_bestrijding_milieuverontreiniging', 0.6526544690132141), ('terugdring_milieuverontreiniging', 0.6465120911598206)]

-----
 biologisch_effect
1013 [('biologisch_effect_vervuiling', 0.9427363872528076), 

1033 [('beleid_plaatselijk_overheid', 0.8762428760528564), ('overheid', 0.8548417687416077), ('federaal_overheid', 0.8138444423675537), ('plaatselijk_ontwikkeling', 0.8134081959724426), ('plaatselijk', 0.8058248162269592), ('plaatselijk_financiën', 0.7728123664855957), ('milieubeleid_overheid', 0.772506594657898), ('plaatselijk_vrijetijdsbesteding', 0.7408730983734131), ('plaatselijk_warmtevoorziening', 0.7366695404052734), ('plaatselijk_bouwmateriaal', 0.734479546546936)]

-----
 gemeenschappelijk_voorziening
1034 [('voorziening', 0.9159356355667114), ('sociaal_voorziening', 0.8084411025047302), ('cultureel_voorziening', 0.8054550886154175), ('gemeenschappelijk', 0.7903933525085449), ('technisch_voorziening_gebouw', 0.7639200091362), ('gemeenschappelijk_regeling', 0.7380586862564087), ('basisvoorziening', 0.7249144315719604), ('sociaal_dienst_verlening', 0.6847090721130371), ('gemeentelijk_watervoorziening', 0.6824924349784851), ('faciliteit', 0.659206748008728)]

-----
 verplichten_g

1051 [('zeeklimaat', 0.9089913368225098), ('middellandse', 0.7491902112960815), ('middellands_zeegebied', 0.7143426537513733), ('middellandse_zee', 0.6875429153442383), ('middellands', 0.6436017155647278), ('matigen_klimaat', 0.6407355070114136), ('tropisch_klimaat', 0.6332603693008423), ('middelands', 0.6260887980461121), ('zeegebied', 0.6239579916000366), ('landklimaat', 0.6214783787727356)]

-----
 openbaar_onderzoek
1052 [('openbaar', 0.8938097953796387), ('openbaar_hoorzitting', 0.8562730550765991), ('openbaar_discussie', 0.8562238216400146), ('openbaar_instelling', 0.8537706136703491), ('openbaar_vervoersmiddel', 0.8509135246276855), ('openbaar_ministerie', 0.8448076248168945), ('openbaar_administratief_instelling', 0.8360455632209778), ('plaatselijk_openbaar_vervoer', 0.8135645389556885), ('openbaar_vervoer', 0.8108586668968201), ('openbaar_werk', 0.806145966053009)]

-----
 bronwater
1053 [('mineraalwater', 0.7502877712249756), ('demineralisatie_water', 0.7132837772369385), ('d

1070 [('delfstoffenwinning', 0.7248132824897766), ('aardolie_exploratie', 0.6790381669998169), ('aardolie_geologie', 0.671033501625061), ('aardolie_industrie', 0.6611072421073914), ('aardolie', 0.6587744951248169), ('landschap_mijnbouw', 0.6419161558151245), ('mijnbouw_geologie', 0.6301104426383972), ('mijnbouw', 0.6262580156326294), ('mijnbouw_technologie', 0.6101100444793701), ('erts', 0.608396053314209)]

-----
 milieuhygiën
1071 [('milieuhygiëne', 0.798872709274292), ('bescherming_milieuhygiëne', 0.7323624491691589), ('milieuhygiënisch', 0.7155930995941162), ('milieuveiligheid', 0.6004918813705444), ('gevaar_milieuhygiëne', 0.5908103585243225), ('bestrijding_milieu_verontreiniging', 0.5823178291320801), ('milieu_beschermingsbeleid', 0.5818576812744141), ('arbeidshygiëne', 0.563662052154541), ('milieuwet', 0.554621696472168), ('werkgelegenheid_milieu', 0.5530709028244019)]

-----
 dierengeluid
1072 [('afwisselen_geluid', 0.6294693350791931), ('vogelgeluid', 0.6250397562980652), ('ge

1088 [('nieuw', 0.611247718334198), ('nieuw_technologie', 0.6076635122299194), ('geavanceerd', 0.5897197127342224), ('nieuwe', 0.560043215751648), ('nieuw_voedingsmiddel', 0.5578189492225647), ('nieuw_materiaal', 0.5426995754241943), ('modern', 0.5383765697479248), ('gloednieuw', 0.5382088422775269), ('aanbrengen_nieuw_onderdeel_oud_model', 0.5362955331802368), ('nieuw_installatie', 0.5331968665122986)]

-----
 prijs
1089 [('actieprijs', 0.6785684823989868), ('prijzen', 0.6650816202163696), ('hoofdprijs', 0.6529872417449951), ('verkoopprijs', 0.6444554328918457), ('winkelprijs', 0.6413126587867737), ('spotprijs', 0.6306864023208618), ('startprij', 0.6257933378219604), ('maandprij', 0.6250949501991272), ('meerprijs', 0.6193363070487976), ('hotelprijs', 0.6145232915878296)]

-----
 handel_economisch
1090 [('internationaal_handel', 0.885947585105896), ('handel', 0.8699254989624023), ('economisch', 0.8533415794372559), ('buitenlands_handel', 0.8505395650863647), ('economisch_ontwikkeling',

1110 [('industrie', 0.8405485153198242), ('uitstoten', 0.821774959564209), ('metaalverwerkend_industrie', 0.8099929690361023), ('kunststofverwerkenen_industrie', 0.8087195754051208), ('petrochemisch_industrie', 0.8041479587554932), ('chemisch_industrie', 0.7794621586799622), ('elektrotechnisch_industrie', 0.777751088142395), ('energie_industrie', 0.7688597440719604), ('aardolie_industrie', 0.7448121905326843), ('vestiging_industrie', 0.7443556785583496)]

-----
 natuurlijk_landschap
1111 [('landschap', 0.9019948840141296), ('tussenkomst_natuur_landschap', 0.8631576299667358), ('beschermen_landschap', 0.8092803955078125), ('natuurlijk', 0.8040540218353271), ('landschappelijk', 0.7534668445587158), ('natuurlijk_omgeving', 0.7478651404380798), ('natuurlijk_erfgoed', 0.7378712892532349), ('natuur', 0.7373656630516052), ('verhouding_mens_natuur', 0.7373306751251221), ('natuurlandschap', 0.7267189025878906)]

-----
 milieubewust_gedrag
1112 [('gedrag', 0.8851180076599121), ('sociaal_gedrag',

1131 [('woudgebied_matigen_klimaatzone', 0.802932620048523), ('bos_matigen_klimaatzone', 0.700141966342926), ('klimaat', 0.6515103578567505), ('equatoriaal_klimaat', 0.6500531435012817), ('tropisch_klimaat', 0.6375079154968262), ('klimaattype', 0.6191169023513794), ('matigen_klimaat', 0.6178752779960632), ('gebergte_ecosysteem', 0.596338152885437), ('klimaatgebied', 0.5940699577331543), ('vegetatiezone', 0.5921860933303833)]

-----
 fysisch_vervuiler
1132 [('anorganisch_vervuiler', 0.8506563901901245), ('radioactief_vervuiler', 0.8333467841148376), ('fysisch_verontreiniging', 0.8262416124343872), ('fysisch_milieu', 0.8215346336364746), ('vervuiler', 0.784980297088623), ('fysisch', 0.783578634262085), ('chemisch_vervuiling', 0.7529196739196777), ('fysisch_meting_milieuvervuiling', 0.7473218441009521), ('fysisch_eigenschap', 0.7456458806991577), ('vervuiler_betalen_principe', 0.7445942163467407)]

-----
 ademhalingsstelsel
1133 [('ademhalingsorgaan', 0.7884058952331543), ('spijsvertering

1153 [('psychisch_effect', 0.9178591966629028), ('effect', 0.916298508644104), ('onderzoek_effect', 0.9013359546661377), ('pathologisch_effect', 0.8998008966445923), ('minimaliseren_effect', 0.8808432817459106), ('effect_gezondheid', 0.8652730584144592), ('biologisch_effect', 0.8599611520767212), ('voorkomen_effect', 0.8557115197181702), ('genetisch_effect', 0.8543872833251953), ('fotochemisch_effect', 0.8316826820373535)]

-----
 gastarbeid
1154 [('gastarbeider', 0.8772790431976318), ('arbeidsmigrant', 0.6734305024147034), ('remigrant', 0.6210534572601318), ('remigratie', 0.6098024845123291), ('immigrant', 0.594736635684967), ('arbeidsmigratie', 0.5844873189926147), ('arbeidskracht', 0.5809932351112366), ('immigratie', 0.5604215860366821), ('migrant', 0.5600791573524475), ('slavenarbeid', 0.5529612302780151)]

-----
 gevaarlijk_goed
1155 [('goed', 0.9158403873443604), ('verordening_gevaarlijk_goed', 0.8797495365142822), ('duurzaam_goed', 0.8527135848999023), ('vervoer_zwaar_goed', 0.8

1172 [('bevloeiingskanaal', 0.7339935302734375), ('bevloeiing', 0.7144815921783447), ('druppelsgewijs_bevloeiing', 0.6838030815124512), ('irrigatiesysteem', 0.6300746202468872), ('bevloeien', 0.5971226692199707), ('irrigatiekanaal', 0.5722489356994629), ('natuurlijk_afwateringssysteem', 0.5671243667602539), ('irrigatieproject', 0.5635960698127747), ('afwateringssysteem', 0.5632548332214355), ('landbouwsysteem', 0.5514200925827026)]

-----
 grafieklijn
1173 [('trendlijn', 0.6504281163215637), ('lijndiagram', 0.6378248929977417), ('grafiek', 0.6274641752243042), ('boxplot', 0.5877295732498169), ('koersgrafiek', 0.5831316113471985), ('staafdiagram', 0.5515123605728149), ('getallenreeks', 0.5419336557388306), ('keyframe', 0.5334621071815491), ('golflijn', 0.5314469337463379), ('lijnstuk', 0.5305957198143005)]

-----
 bebouwd_omgeving
1174 [('bebouwd', 0.9294540882110596), ('bebouwen', 0.8344882726669312), ('onbebouwd', 0.7276777625083923), ('onbebouwd_gebied', 0.7260496020317078), ('bebouw

1191 [('celsiu', 0.5784430503845215), ('klas', 0.5386175513267517), ('tweedegraad', 0.5376202464103699), ('celciu', 0.5362186431884766), ('eerstegraad', 0.5361876487731934), ('algemeen_scheikunde', 0.529126763343811), ('leerjaar', 0.5261569023132324), ('kritisch_niveau', 0.5206701159477234), ('hoog_onderwijs', 0.5189547538757324), ('meestergraad', 0.5171331167221069)]

-----
 bouwplaats
1192 [('bouwplaat', 0.750299334526062), ('bouwwerf', 0.710783839225769), ('bouwterrein', 0.7066401243209839), ('bouwproject', 0.6781376600265503), ('veiligheidsnorm_bouw', 0.6736177802085876), ('bouwhekk', 0.6639890074729919), ('bouw', 0.643074631690979), ('bouw_hergebruik_materiaal', 0.6423977613449097), ('bouwproces', 0.6396639943122864), ('betonwerk', 0.6216553449630737)]

-----
 eg_milieukeur_merk
1193 [('eg_richtlijn_verpakking', 0.9150738716125488), ('eg', 0.9048686027526855), ('eg_richtlijn', 0.9026421904563904), ('eg_richtlijn_afvalverwerking', 0.9012662172317505), ('eg_verordening', 0.898384928

1212 [('vervoerbedrijf', 0.8313044309616089), ('vervoersmaatschappij', 0.7293413877487183), ('stadsvervoerder', 0.706282377243042), ('vervoerder', 0.7016268372535706), ('busbedrijf', 0.6978210806846619), ('busvervoerder', 0.688551664352417), ('vervoersautoriteit', 0.687188982963562), ('busmaatschappij', 0.6814863681793213), ('openbaarvervoerbedrijf', 0.678678035736084), ('stadsvervoerbedrijf', 0.6733154058456421)]

-----
 veiligheidsonderzoek
1213 [('gezondheidsonderzoek', 0.7216223478317261), ('persoonlijkheidsonderzoek', 0.7197798490524292), ('duurzaamheidsonderzoek', 0.7183470129966736), ('werkgelegenheidsonderzoek', 0.7021985054016113), ('veiligheidsstudie', 0.6678780913352966), ('tevredenheidsonderzoeken', 0.6629855036735535), ('veiligheidscontrole', 0.6601488590240479), ('opsporingsonderzoek', 0.6582651138305664), ('veiligheidsanalyse', 0.6581442952156067), ('antecedentenonderzoek', 0.6387239694595337)]

-----
 grondstof
1214 [('hernieuwbaar_grondstof', 0.8760212659835815), ('pri

1232 [('aannemersbedrijf', 0.7975502014160156), ('stukadoorsbedrijf', 0.7602297067642212), ('stucadoorsbedrijf', 0.7586374282836914), ('schilderwerk', 0.7472319006919861), ('loodgietersbedrijf', 0.7361082434654236), ('schilder', 0.7316108345985413), ('klussenbedrijf', 0.7291986346244812), ('afwerkingsbedrijf', 0.725472092628479), ('glaszetbedrijf', 0.72304767370224), ('bouwbedrijf', 0.7202311754226685)]

-----
 geschikt_technologie
1233 [('alternatief_technologie', 0.8047648668289185), ('geschikt', 0.7928929924964905), ('technologie', 0.7553530931472778), ('nieuw_technologie', 0.7216277718544006), ('geschikte', 0.70594722032547), ('schoon_technologie', 0.679250180721283), ('laag_technologie', 0.6786655187606812), ('chemisch_technologie', 0.673691987991333), ('multimedia_technologie', 0.6735214591026306), ('technologisch', 0.6722298264503479)]

-----
 bosbrand
1234 [('voorkoming_bosbrand', 0.8340916633605957), ('natuurbrand', 0.6938226222991943), ('natuurbranden', 0.6860285997390747), (

1254 [('bosplant', 0.6671230792999268), ('moerasplant', 0.6537481546401978), ('plantendeel', 0.6144497394561768), ('begroeiing', 0.6045444011688232), ('waterplant', 0.603459358215332), ('nevelbos', 0.5999642014503479), ('plantenwortel', 0.5978575944900513), ('struikvorm', 0.5977122187614441), ('plantenweefsel', 0.5846303701400757), ('vegetatie', 0.5809870958328247)]

-----
 gehoorbescherming
1255 [('gehoorbeschermer', 0.8548377156257629), ('gehoorbeschadiging', 0.7257919311523438), ('gehoorschade', 0.6661904454231262), ('oordop', 0.6612148284912109), ('oogbescherming', 0.6006492376327515), ('gehoorapparaat', 0.5845702886581421), ('beschermingsmiddelen', 0.580297589302063), ('oorkappen', 0.5787619352340698), ('otoplastieken', 0.573042094707489), ('adembescherming', 0.5716602802276611)]

-----
 rechterlijk_orgaan
1256 [('orgaan', 0.8953242301940918), ('toezichthoudend_orgaan', 0.87347412109375), ('rechterlijk', 0.8014799952507019), ('administratief_rechter', 0.6856015920639038), ('gerech

1275 [('arbeidstijd', 0.8051633834838867), ('arbeidsduur', 0.6892907619476318), ('rusttijd', 0.6857653856277466), ('werkuur', 0.6845211386680603), ('werkweek', 0.68135005235672), ('inwerktijd', 0.6710407137870789), ('werktijdfactor', 0.6619486808776855), ('overwerk', 0.6517481803894043), ('werkrooster', 0.6452098488807678), ('arbeidstijdenwet', 0.6397973299026489)]

-----
 psychisch_effect
1276 [('psychologisch_effect', 0.9178591966629028), ('pathologisch_effect', 0.8622068166732788), ('effect_gezondheid', 0.8595669865608215), ('effect', 0.8425112366676331), ('onderzoek_effect', 0.8252439498901367), ('voorkomen_effect', 0.8233777284622192), ('genetisch_effect', 0.822579026222229), ('minimaliseren_effect', 0.8219560980796814), ('psychisch', 0.8167681694030762), ('biologisch_effect', 0.8055347800254822)]

-----
 ecologisch_parameter
1277 [('ecologisch_aanpassing', 0.8103142976760864), ('parameter', 0.8083038926124573), ('ecologisch', 0.7943713665008545), ('ecologisch_inventarisatie', 0.7

1297 [('plasma', 0.9321312308311462), ('technologie', 0.7269992232322693), ('chemisch_technologie', 0.6750869750976562), ('multimedia_technologie', 0.671959638595581), ('alternatief_technologie', 0.6478511691093445), ('technology', 0.6355395317077637), ('nanoscience', 0.6320762038230896), ('plasmafysica', 0.6193735599517822), ('nanotech', 0.6119588017463684), ('plasmascherm', 0.6025897264480591)]

-----
 biochemisch_proces
1298 [('chemisch_proces', 0.9174932241439819), ('fysisch_proces', 0.8688308596611023), ('biologisch_proces', 0.8673650622367859), ('geomorfologisch_proces', 0.8652440309524536), ('technologisch_proces', 0.8588225841522217), ('industrieel_proces', 0.8563200235366821), ('proces', 0.8465467095375061), ('anaëroob_proces', 0.8434441685676575), ('concentratie_proces', 0.8408125638961792), ('aëroob_proces', 0.822478175163269)]

-----
 rondschrijven
1299 [('verschrijven', 0.5178395509719849), ('rondsturen', 0.5007709860801697), ('tijdschrijft', 0.4996974766254425), ('hoofdbe

1317 [('hernieuwbaar_energiebron', 0.8888270854949951), ('grondstof', 0.8760212659835815), ('hernieuwbaar', 0.8723856806755066), ('hernieuwbaar_hulpbron', 0.8517186641693115), ('hernieuwbaar_natuurlijk_hulpbron', 0.829899787902832), ('biomassa_energie', 0.7980355024337769), ('richtlijn_hernieuwbaar_energie', 0.7848198413848877), ('biomassa', 0.7575020790100098), ('prijzenbeleid_grondstof', 0.7568055391311646), ('energiebron', 0.7546025514602661)]

-----
 economisch_gegeven
1318 [('statistisch_gegeven', 0.8578755855560303), ('economisch_analyse', 0.8268966674804688), ('doelstelling_individueel_economisch_onderneming', 0.8262080550193787), ('economisch_ontwikkeling', 0.815928041934967), ('economisch_activiteit', 0.815140426158905), ('gegeven', 0.8109989762306213), ('gegeven_geografisch_component', 0.8043310642242432), ('economisch_structuur', 0.8036019206047058), ('controleren_gegeven', 0.8034665584564209), ('economisch', 0.8034423589706421)]

-----
 hernieuwbaar_hulpbron
1319 [('hernieu

1338 [('drinkwater', 0.8336611986160278), ('behandelen', 0.775715708732605), ('onbehandeld_water', 0.7485902309417725), ('water_menselijk_gebruik', 0.7381844520568848), ('gebruiken_water', 0.7209483981132507), ('chemisch_behandeling', 0.7157403230667114), ('moeilijk_behandelen_afval', 0.7066208124160767), ('chemisch_behandeling_afval', 0.705477237701416), ('water_industrieel_gebruik', 0.7047308683395386), ('bedreiging_water', 0.6970003247261047)]

-----
 arbeidsveiligheid
1339 [('bedrijfsveiligheid', 0.7909203767776489), ('arbeidshygiëne', 0.7047601342201233), ('arbeidsbescherming', 0.6664278507232666), ('veiligheidsbewustzijn', 0.6609893441200256), ('milieuveiligheid', 0.6521134376525879), ('arbeidsmiddelen', 0.6263506412506104), ('gezondheidsbescherming', 0.6242541670799255), ('basisveiligheid', 0.6219978332519531), ('explosieveiligheid', 0.6169579029083252), ('preventieadviseur', 0.6150736212730408)]

-----
 industrieel_omgeving_algemeen
1340 [('openbaar_instelling_commercieel_indus

1357 [('hernieuwbaar', 0.9324788451194763), ('energiebron', 0.9063343405723572), ('hernieuwbaar_grondstof', 0.8888271450996399), ('hernieuwbaar_hulpbron', 0.8833044767379761), ('richtlijn_hernieuwbaar_energie', 0.8632028102874756), ('biomassa_energie', 0.8431247472763062), ('hernieuwbaar_natuurlijk_hulpbron', 0.8423206806182861), ('geothermisch_energie', 0.7932450771331787), ('conventioneel_energie', 0.7834451198577881), ('vernieuwbare', 0.7612617015838623)]

-----
 spaarbekken_overtollig_regenwater
1358 [('regenwater', 0.7998559474945068), ('afvoerstelsel_regenwater', 0.7820645570755005), ('spaarbekken', 0.7591985464096069), ('afvoer_overstromen_water', 0.7540569305419922), ('hemelwater', 0.7409960627555847), ('stromen_water', 0.7176551818847656), ('overblijven_hoeveelheid_water', 0.7099628448486328), ('hergebruik_water', 0.7062602639198303), ('overtollig', 0.6989244818687439), ('afscheiding_water', 0.692084789276123)]

-----
 planning_kustzone
1359 [('kustzone', 0.8607447147369385), 

1378 [('oplossen_organisch_koolstof', 0.8792591094970703), ('organisch_binden_koolstof', 0.8290255665779114), ('koolstof', 0.801224410533905), ('organisch', 0.7503807544708252), ('organisch_stikstofverbinding', 0.7420607805252075), ('organisch_metaalverbinding', 0.73896723985672), ('organisch_fosforverbinding', 0.7323240041732788), ('gehalte_rotten_organisch_materiaal', 0.7309001684188843), ('organisch_zuurstofverbinding', 0.7302564382553101), ('organisch_oplosmiddel', 0.7269941568374634)]

-----
 traditioneel_gezondheidszorg
1379 [('gezondheidszorg', 0.7900390625), ('traditioneel', 0.7892523407936096), ('traditioneel_cultuur', 0.710739016532898), ('biotechnologie_betrekking_gezondheid', 0.681140661239624), ('menselijk_gezondheid', 0.6751722097396851), ('sociaal_geneeskund', 0.6559488773345947), ('sociaal_structuur', 0.6529024839401245), ('preventief_maatregel_gebied_gezondheid', 0.6528382301330566), ('openbaar_instelling_commercieel_industrieel_gebied', 0.6513402462005615), ('verbanne

1399 [('voedsel', 0.9096516370773315), ('voedingswaaren_voedsel', 0.8914846181869507), ('basisbehoefte_voedsel', 0.8574697375297546), ('proteïnerijk', 0.7728102207183838), ('verontreinigen_stof_voedsel', 0.74225914478302), ('voedingsmiddel', 0.6864349842071533), ('voedingsstof', 0.6851266622543335), ('basisvoedsel', 0.6800930500030518), ('voedselproduct', 0.674481213092804), ('voedzaam', 0.6723150014877319)]

-----
 tussenkomst_natuur_landschap
1400 [('natuur', 0.8803712725639343), ('natuurlijk_landschap', 0.8631576299667358), ('verhouding_mens_natuur', 0.8408990502357483), ('landschap', 0.8260481357574463), ('wetgeving_betrekking_natuur', 0.8181790709495544), ('beschermen_landschap', 0.7667758464813232), ('bos_schadelijk_dier_plant', 0.7334763407707214), ('leefomgeving_wild_leven_plant_dier', 0.7330751419067383), ('reservaat_wild_leven_plant_dier', 0.7308430075645447), ('bescherming_wild_leven_plant_dier', 0.7269271612167358)]

-----
 bovenafdichting
1401 [('afdichten', 0.694069325923

1420 [('bescherming_stroomgebied', 0.912554919719696), ('stroomgebied', 0.7831559777259827), ('beschermen_estuarium', 0.7830734252929688), ('beschermen_landschap', 0.7441097497940063), ('beschermen', 0.7421166300773621), ('beschermen_gebied', 0.7403603196144104), ('bescherming_natuurgebied', 0.7077969908714294), ('beschermen_zeegebied', 0.7043591737747192), ('bescherming_overstroming', 0.6766002774238586), ('beschermen_mari_gebied', 0.6484321355819702)]

-----
 invloed_toerisme_milieu
1421 [('invloed_recreatie_milieu', 0.9296702146530151), ('invloed_milieu', 0.8984644412994385), ('invloed_industrie_milieu', 0.8906348347663879), ('invloed_landbouw_milieu', 0.8869632482528687), ('invloed_vervoer_milieu', 0.8828370571136475), ('invloed_visserij_milieu', 0.8815453052520752), ('invloed_huishouden_milieu', 0.8766264319419861), ('invloed_aquacultuur_milieu', 0.8680230379104614), ('inschatting_invloed_milieu', 0.8659070134162903), ('invloed_energie_milieu', 0.8593145608901978)]

-----
 industr

1440 [('handelsbeleid', 0.918554425239563), ('gemeenschappelijk_landbouwbeleid', 0.812573254108429), ('gemeenschappelijk_tariefbeleid', 0.7388410568237305), ('gemeenschappelijk', 0.7123859524726868), ('economisch_beleid', 0.7033013105392456), ('handelspolitiek', 0.6976795792579651), ('handel_economisch', 0.6971095204353333), ('landbouwbeleid', 0.6945211291313171), ('monetair_economie', 0.6919425129890442), ('industrieel_beleid', 0.6901215314865112)]

-----
 voorkoming_natuurlijk_risico_s
1441 [('analyse_natuurlijk_risico_s', 0.975025475025177), ('risico_s', 0.9695479869842529), ('s', 0.9046854972839355), ('r', 0.640483558177948), ('l', 0.6349673271179199), ('element_groep_v', 0.6074414849281311), ('n', 0.606805145740509), ('t', 0.6034260392189026), ('element_groep_iv', 0.6002504825592041), ('wet_instellen_principeel_proces_naam_e', 0.5987682938575745)]

-----
 basisbehoefte_voedsel
1442 [('voedsel', 0.9228477478027344), ('voedingswaaren_voedsel', 0.8725806474685669), ('proteïnerijk_voe

1459 [('invloed_milieu', 0.9589753746986389), ('invloed_industrie_milieu', 0.9395816922187805), ('inschatting_invloed_milieu', 0.9328933954238892), ('invloed_energie_milieu', 0.9238825440406799), ('invloed_recreatie_milieu', 0.9187673330307007), ('invloed_vervoer_milieu', 0.914165735244751), ('invloed_landbouw_milieu', 0.9104531407356262), ('invloed_visserij_milieu', 0.9078903198242188), ('invloed_aquacultuur_milieu', 0.885715901851654), ('milieu_ontwikkeling', 0.8791364431381226)]

-----
 aanbod
1460 [('vraag_aanbod', 0.888159990310669), ('activiteitenaanbod', 0.6553637981414795), ('dienstenaanbod', 0.6553125977516174), ('productaanbod', 0.6197088956832886), ('studieaanbod', 0.6134306788444519), ('vormingsaanbod', 0.5928621292114258), ('zorgaanbod', 0.5919685959815979), ('sportaanbod', 0.5904563665390015), ('overaanbod', 0.589279055595398), ('onderwijsaanbod', 0.5885475277900696)]

-----
 gis_digitaal_formaat
1461 [('gis_digitaal_systeem', 0.9167156219482422), ('gis_digitaal_techniek'

1477 [('europees', 0.8906855583190918), ('europees_gemeenschap', 0.8723280429840088), ('europees_milieuagentschap', 0.8396841883659363), ('europees_parlement', 0.8281657695770264), ('europees_natuurreservaat', 0.8201026916503906), ('europees_commissie', 0.7987592816352844), ('europees_milieuraad', 0.7847709655761719), ('juridisch_systeem_europees_gemeenschap', 0.7523274421691895), ('europees_monetair_stelsel', 0.7432777881622314), ('binnenmarkt', 0.7034514546394348)]

-----
 afwatering_oppervlakte
1478 [('afwatering_ondergrond', 0.8912714123725891), ('afwatering', 0.8777958154678345), ('oppervlakte', 0.7617855072021484), ('afwateren', 0.6815063953399658), ('afwateringsgebied', 0.664980411529541), ('afwateringssysteem', 0.6567855477333069), ('oppervlak', 0.6346991062164307), ('afwateringssloot', 0.6315958499908447), ('ontwatering', 0.6284955739974976), ('natuurlijk_afwateringssysteem', 0.6198033094406128)]

-----
 fysisch_meting_milieuvervuiling
1479 [('meting_milieuverontreiniging', 0.

1495 [('handhaving', 0.8319951891899109), ('handhaving_milieurecht', 0.768904447555542), ('waterstand', 0.7571076154708862), ('regelgeving_milieuverontreiniging', 0.6702369451522827), ('grondwaterstand', 0.6588860750198364), ('handhav', 0.6497578620910645), ('maatregel_bestrijding_milieuverontreiniging', 0.6479361057281494), ('wetgeving_vervuiling', 0.6395998597145081), ('verbetering_waterkwaliteit', 0.6378926038742065), ('waterpeil', 0.6376924514770508)]

-----
 langeafstandsvervoer
1496 [('langeafstandsverkeer', 0.8318192958831787), ('langeafstandsbus', 0.7415076494216919), ('langeafstand', 0.7288119792938232), ('langeafstandstrein', 0.7064738869667053), ('treinvervoer', 0.676356315612793), ('spoorvervoer', 0.6685041189193726), ('langeafstandsvlucht', 0.6653645038604736), ('watervervoer', 0.6637479066848755), ('groepsvervoer', 0.6602169275283813), ('passagiersvervoer', 0.6589983701705933)]

-----
 arctisch_ecosysteem
1497 [('arctisch', 0.9114739894866943), ('arctisch_oceaan', 0.89212

1514 [('biologisch_hulp_bronnen', 0.9331212043762207), ('plaats_milieuverontreiniging_bodem_doordringen', 0.7500261068344116), ('bron_milieu_verontreiniging', 0.7312214970588684), ('internationaal_hulp', 0.7122830152511597), ('plantaardig_hulpbron', 0.7103882431983948), ('microbieel_bron', 0.7081843614578247), ('financieel_hulp', 0.7066968679428101), ('water_rijk_rotten_organisch_materiaal', 0.7059696912765503), ('doorsijpeling_water_bodem', 0.7026362419128418), ('inschatting_natuurlijk_hulpbron', 0.7011175155639648)]

-----
 statistisch_informatiesysteem
1515 [('statistisch', 0.9149685502052307), ('statistisch_informatie', 0.9012535810470581), ('statistisch_analyse', 0.8506031632423401), ('statistisch_gegeven', 0.8486014604568481), ('statistiek', 0.7899810671806335), ('geografisch_informatiesysteem', 0.788463830947876), ('informatiesysteem', 0.7563836574554443), ('informatie_geografisch_component', 0.7363523244857788), ('wetenschappelijk_technisch_informatie', 0.7261736989021301), ('g

1540 [('schade', 0.780385434627533), ('voorkoming_schade', 0.7766451239585876), ('milieu_overtreding', 0.772707998752594), ('schade_vergoeding', 0.772689700126648), ('aansprakelijkheid_nucleair_schade', 0.7661259174346924), ('schade_bodem', 0.7657762765884399), ('boete', 0.7594862580299377), ('raming_schade', 0.7591649293899536), ('schade_gevolg_militair_oefening', 0.7484214305877686), ('schade_dier', 0.7454238533973694)]

-----
 milieu_informatienetwerk
1541 [('milieu_informatiesysteem', 0.9598042964935303), ('milieu', 0.9422999620437622), ('milieu_beschermingsbeleid', 0.9192218780517578), ('milieu_informatie', 0.9162086248397827), ('milieu_ontwikkeling', 0.9159634709358215), ('werkgelegenheid_milieu', 0.9148740768432617), ('milieu_investering', 0.8948766589164734), ('milieu_industrie', 0.8923821449279785), ('chemicaliën_milieu', 0.882131814956665), ('milieu_evenwicht', 0.8770317435264587)]

-----
 wet_natuurlijk_onafhankelijkheid
1542 [('bijzonder_wet', 0.9571221470832825), ('reguler

1565 [('energienorm', 0.6506900787353516), ('energieprestatienorm', 0.5935724973678589), ('bouwbesluit', 0.5502025485038757), ('bouwregelgeving', 0.5436785817146301), ('bouwconstructie', 0.5388062000274658), ('bouwteam', 0.537583589553833), ('energiewoning', 0.5375670194625854), ('bouwregel', 0.5345331430435181), ('bouwvoorschrift', 0.5331649780273438), ('energieprestatieregelgeving', 0.5325772166252136)]

-----
 gebergte_ecosysteem
1566 [('gebergte', 0.8833279609680176), ('ecosysteem_hoogland', 0.7861072421073914), ('ecosysteem', 0.7456613183021545), ('ecosysteem_grasland', 0.7378637194633484), ('bergketen', 0.7296660542488098), ('ecosysteem_riviermonding', 0.7287418842315674), ('ecosysteem_onvruchtbaar_gebied', 0.7154050469398499), ('ecosysteem_waterrijk_gebied', 0.7127550840377808), ('hooggebergte', 0.7117416262626648), ('kustgebergte', 0.6947206854820251)]

-----
 vervuilen_gebied
1567 [('ecologisch_gevoelig_gebied', 0.8468676209449768), ('verstedelijken_gebied', 0.8447074294090271

1585 [('zeespiegel', 0.8283389806747437), ('stijgen', 0.8196247816085815), ('dalen', 0.7455516457557678), ('stijging', 0.650715172290802), ('zeespiegelstijging', 0.6403331160545349), ('hoog_berg', 0.6207685470581055), ('waterspiegel', 0.6150158643722534), ('laag_vlakken', 0.6024470925331116), ('uitstijgen', 0.5995030999183655), ('daling', 0.5945463180541992)]

-----
 zeespiegelstijging
1586 [('zeespiegel', 0.7261525392532349), ('temperatuurstijging', 0.6645228862762451), ('stijgen_zeespiegel', 0.6403331160545349), ('klimaatverandering', 0.624680757522583), ('bodemdaling', 0.620781660079956), ('klimaatsverandering', 0.5802966356277466), ('grondwaterstroming', 0.5682926177978516), ('temperatuurdaling', 0.5649399161338806), ('waterstroming', 0.553538978099823), ('hoogwaterstand', 0.5524706244468689)]

-----
 tweedehandsgoeder
1587 [('tweedehands', 0.7112370729446411), ('verhuisgoeder', 0.654355525970459), ('tweedehandsmarkt', 0.6490226984024048), ('tweedehandswinkel', 0.625410258769989), 

1607 [('mediarecht', 0.5758413076400757), ('bedrijfsrecht', 0.5505519509315491), ('insolventierecht', 0.5352973937988281), ('internetrecht', 0.5199002027511597), ('zakenrecht', 0.5180085897445679), ('privacyrecht', 0.5117858648300171), ('rechtssociologie', 0.5077050924301147), ('informaticacriminaliteit', 0.5048287510871887), ('beleidsinformatica', 0.49605780839920044), ('aanbestedingsrecht', 0.49556517601013184)]

-----
 zuurtegraad
1608 [('zuurgraad', 0.7575732469558716), ('hoog_zuurtegraad', 0.7187065482139587), ('zoutgehalte_bodem', 0.5963990688323975), ('fosfaatgehalte', 0.5915107131004333), ('watergehalte', 0.5807227492332458), ('zuurstofgehalte', 0.5792708992958069), ('alkalisch_bodem', 0.5725545883178711), ('zoutconcentratie', 0.5703243613243103), ('zoutgehalte_water', 0.5670404434204102), ('verdunnen_zuren', 0.5568475723266602)]

-----
 milieuvriendelijk_wagen
1609 [('wagen', 0.9365167021751404), ('verlaten_voertuig', 0.6697894334793091), ('milieuvriendelijk', 0.66172134876251

1627 [('end', 0.8564651608467102), ('pipe', 0.7451715469360352), ('chemisch_fall_out', 0.6140555739402771), ('way', 0.5963813066482544), ('connection', 0.5858795046806335), ('perform', 0.5785481929779053), ('system', 0.5760703086853027), ('head', 0.573384702205658), ('installation', 0.5727736949920654), ('wire', 0.5681532621383667)]

-----
 toestel_luchtweg_beschermen
1628 [('luchtweg', 0.7855740785598755), ('toestel', 0.7077901363372803), ('beschermen', 0.6828137636184692), ('beschermen_zeegebied', 0.6545929312705994), ('katalysator_toestel', 0.6429609060287476), ('ademhalingsapparaat', 0.6244750618934631), ('ademhalingsbescherming', 0.6180467009544373), ('beschermen_gebied', 0.6117883920669556), ('beschermen_landschap', 0.6076198816299438), ('beschermen_stroomgebied', 0.6047470569610596)]

-----
 planning_begrotings_systeem
1629 [('planning', 0.834781289100647), ('industrieel_planning', 0.7936739325523376), ('economisch_planning', 0.7863866090774536), ('nationaal_planning', 0.7841716

1654 [('wet_chemicaliën', 0.8446040153503418), ('reguleren_wet', 0.8074532747268677), ('harmonisatie_wet', 0.7973489761352539), ('wet', 0.7970543503761292), ('bijzonder_wet', 0.7902928590774536), ('wet_natuurlijk_onafhankelijkheid', 0.7896031141281128), ('wet_gevaarlijk_goed', 0.7761112451553345), ('financieel_wet', 0.7642690539360046), ('wet_europees_gemeenschap', 0.751539409160614), ('leer_wet', 0.7499021887779236)]

-----
 oorzaak_gevolg_relatie
1655 [('gevolg', 0.8581640124320984), ('oorzaak', 0.855846643447876), ('gevolg_klimaatverandering', 0.8358011841773987), ('gevolg_milieuverontreiniging', 0.8122773170471191), ('oorzaak_ongeluk', 0.7960973978042603), ('relatie', 0.7295801639556885), ('schade_gevolg_militair_oefening', 0.699786901473999), ('lichamelijk_verandering', 0.6894409656524658), ('consequentie', 0.6836919784545898), ('gevolg_lawaai_gezondheid', 0.6831574440002441)]

-----
 combineren_rioolsysteem
1656 [('rioolsysteem', 0.8638677597045898), ('combineren_afvalwater', 0.7

1672 [('verordening_betrekking_elektronisch_afval', 0.8441565036773682), ('hergebruik_afval', 0.8403390645980835), ('uitwisseling_afval', 0.8178571462631226), ('verwerking_afval', 0.8172227144241333), ('elektronisch_afval', 0.8135156631469727), ('gemeentelijk_afval', 0.8127936124801636), ('bijzonder_afval', 0.8093327283859253), ('samenstelling_afval', 0.8059051632881165), ('gebruik_afval_energie_doeleinde', 0.8054425716400146), ('industrieel_afval', 0.805352509021759)]

-----
 heest_gewas
1673 [('gewas', 0.8643392324447632), ('tropisch_gewas', 0.8283621668815613), ('heest', 0.7721149921417236), ('zichtbaar_bloeien_plant', 0.6724501848220825), ('telen', 0.6543896198272705), ('bos_schadelijk_dier_plant', 0.6498284339904785), ('wortel_knolgewas', 0.6442392468452454), ('graangewas', 0.632223904132843), ('struik', 0.628718376159668), ('heester', 0.6274505853652954)]

-----
 toegepast_voeding
1674 [('functioneel_voeding', 0.7784817218780518), ('toegepast', 0.7720997333526611), ('voeding', 0.

1697 [('eg_richtlijn_afvalverwerking', 0.9462103843688965), ('eg_richtlijn_verpakking', 0.9423309564590454), ('eg_richtlijn_biocide', 0.9393501877784729), ('eg_richtlijn', 0.9337880611419678), ('eg_verordening_bestaan_chemicaliën', 0.9224727153778076), ('eg_verordening_milieubeheer', 0.9172548651695251), ('eg_verdrag', 0.90472012758255), ('eg_verordening', 0.9042985439300537), ('eg_beleid', 0.8925300240516663), ('eg_milieukeur_merk', 0.8799464702606201)]

-----
 netting_beleid
1698 [('beleid', 0.8382254242897034), ('wetenschappelijk_beleid', 0.8258838653564453), ('tenuitvoerlegging_beleid', 0.8258213400840759), ('industrieel_beleid', 0.8160765171051025), ('economisch_beleid', 0.8012632131576538), ('buitenlands_beleid', 0.7888506054878235), ('sociaal_beleid', 0.7841054201126099), ('stedelijk_beleid', 0.7819482088088989), ('chemisch_beleid', 0.7764279842376709), ('beleid_plaatselijk_overheid', 0.7721326947212219)]

-----
 overstroming
1699 [('bescherming_overstroming', 0.8478248119354248

1726 [('organisatie_onderwijs', 0.8852020502090454), ('algemeen_onderwijs', 0.8643460273742676), ('primair_onderwijs', 0.8382860422134399), ('basisonderwijs', 0.814500093460083), ('beroepsonderwijs', 0.7953816056251526), ('onderwijsbeleid', 0.7912188172340393), ('kleuteronderwijs', 0.7776983976364136), ('onderwijsaanbod', 0.7731028199195862), ('rekenonderwijs', 0.764816164970398), ('onderwijsmanagement', 0.7616945505142212)]

-----
 oost_europa
1727 [('oost', 0.930802047252655), ('oost_azië', 0.8942596912384033), ('oost_west_handel', 0.8787360787391663), ('oost_afrika', 0.8778589963912964), ('zuid_oost_azië', 0.8756356239318848), ('oost_west_verhouding', 0.873588502407074), ('westelijk_europa', 0.8195048570632935), ('noord_amerika', 0.7791104912757874), ('noord_zuid_amerika', 0.7764008045196533), ('west_afrika', 0.7639775276184082)]

-----
 bestuursbevoegdheid
1728 [('vertegenwoordigingsbevoegdheid', 0.7449930906295776), ('beslissingsbevoegdheid', 0.7248319387435913), ('adviesbevoegdhe

1747 [('vrachtvervoer', 0.7432088255882263), ('luchtverkeer', 0.7242010831832886), ('passagiersvervoer', 0.6958045959472656), ('wegvervoer', 0.6943526864051819), ('luchttransport', 0.6901675462722778), ('vrachtvervoerder', 0.678708553314209), ('militair_luchtverkeer', 0.6740822196006775), ('postvervoer', 0.6715750098228455), ('vervoer', 0.6670377254486084), ('luchtvracht', 0.6659954786300659)]

-----
 gedrag
1748 [('milieubewust_gedrag', 0.8851180076599121), ('sociaal_gedrag', 0.874075174331665), ('gedrag_verbruiker', 0.8624131679534912), ('misdadig_gedrag', 0.8449326157569885), ('probleemgedrag', 0.6898906230926514), ('gedragspatroon', 0.6565697193145752), ('groepsgedrag', 0.6529442071914673), ('pestgedrag', 0.651488184928894), ('gedragsstoornis', 0.6373494267463684), ('omgangsvorm', 0.6294767260551453)]

-----
 wortel_knolgewas
1749 [('knolgewas', 0.8669438362121582), ('wortel', 0.8330792188644409), ('bolgewas', 0.7599315643310547), ('wortelgewas', 0.742639422416687), ('snijbiet', 0.

1768 [('screeningsinstrument', 0.7334721088409424), ('instrument', 0.7139501571655273), ('onderzoeksinstrument', 0.6874006986618042), ('instrumentarium', 0.6540185213088989), ('indicator', 0.6447125673294067), ('meetmethode', 0.638542115688324), ('meting', 0.6208945512771606), ('begeleidingsinstrument', 0.613500714302063), ('meetsystem', 0.612957775592804), ('evaluatiemethode', 0.6120913624763489)]

-----
 gras
1769 [('graszaad', 0.6571775078773499), ('droog_gazon', 0.6505023837089539), ('gazon', 0.6485280394554138), ('wild_groeien_plant', 0.6261640787124634), ('bos_schadelijk_dier_plant', 0.6139739155769348), ('groen_groente', 0.6032938957214355), ('struik', 0.6021799445152283), ('plant', 0.5997406244277954), ('siergras', 0.5967053174972534), ('harshoudend_plant', 0.593839168548584)]

-----
 wegverkeer
1770 [('verkeer', 0.757605254650116), ('uitstoot_verkeer', 0.7103740572929382), ('wegvervoer', 0.6743406653404236), ('verkeersonveiligheid', 0.6739015579223633), ('plaatselijk_verkeer',

1789 [('kern', 0.9381586313247681), ('kernen', 0.6401187181472778), ('geschiedkundig_plaats', 0.6381588578224182), ('geschiedkundig_onderzoek', 0.6269748210906982), ('geschiedkundig', 0.6119537353515625), ('internationaal_verdeling_werk', 0.5827136039733887), ('bestuurlijk_grens', 0.5800618529319763), ('openbaar_werk', 0.5666180849075317), ('sociaal_structuur', 0.5658844709396362), ('plaatselijk_ontwikkeling', 0.562592625617981)]

-----
 elektriciteitsbedrijf
1790 [('elektriciteitsproducent', 0.7591719627380371), ('elektriciteitsmaatschappij', 0.7560238838195801), ('elektriciteitscentral', 0.7363132238388062), ('elektriciteitscentrale', 0.7363132238388062), ('elektriciteitsleverancier', 0.7350865602493286), ('energiebedrijf', 0.7343323826789856), ('nutsbedrijf', 0.7191392183303833), ('gasbedrijf', 0.6992170214653015), ('telecommunicatiebedrijf', 0.662956178188324), ('elektriciteit', 0.6619381904602051)]

-----
 ecotoerisme
1791 [('agrotoerisme', 0.7528478503227234), ('plattelandstoeris

1810 [('chemisch_adsorptie', 0.8874458074569702), ('sorptie', 0.8453682661056519), ('desorptie', 0.788558840751648), ('absorptie', 0.6733572483062744), ('resorptie', 0.651431679725647), ('nitrificatie', 0.6401644349098206), ('absorptie_blootstelling', 0.6211855411529541), ('filtratie', 0.5966393947601318), ('diffusie', 0.5935285091400146), ('adsorberen', 0.5882399082183838)]

-----
 model
1811 [('wereldwijd_model', 0.866873025894165), ('atmosferisch_model', 0.801490068435669), ('modelling', 0.7322938442230225), ('modeller', 0.7032994627952576), ('modeling', 0.6834869384765625), ('modellering', 0.6825282573699951), ('modelle', 0.6455683708190918), ('modelen', 0.6434730887413025), ('topmodel', 0.6424537897109985), ('aanbrengen_nieuw_onderdeel_oud_model', 0.6380740404129028)]

-----
 modellering
1812 [('modelling', 0.7368490695953369), ('modeller', 0.7232012152671814), ('modeling', 0.707965612411499), ('model', 0.6825282573699951), ('datamodellering', 0.66829514503479), ('modelleren', 0.6

1830 [('kost_baten', 0.9270952939987183), ('baten', 0.7374833226203918), ('kost_milieuverontreiniging', 0.7290323972702026), ('kost', 0.7214455008506775), ('sociaal_kost', 0.7044408917427063), ('kost_binnenlands_economie', 0.6616959571838379), ('intern_aanrekening_extern_kost', 0.6592075228691101), ('kost_opwekken_elektriciteit', 0.6571054458618164), ('onderzoek_bereidheid_betalen', 0.6323573589324951), ('economisch_analyse', 0.6149617433547974)]

-----
 televisieprogramma
1831 [('tvprogramma', 0.7165877819061279), ('radioprogramma', 0.6805628538131714), ('praatprogramma', 0.6657377481460571), ('documentaireprogramma', 0.6645420789718628), ('amusementsprogramma', 0.6582374572753906), ('realityprogramma', 0.6527177095413208), ('muziekprogramma', 0.6512011885643005), ('kinderprogramma', 0.6487736105918884), ('actualiteitenprogramma', 0.6334261894226074), ('informatieprogramma', 0.632698118686676)]

-----
 groepsgedrag
1832 [('gedragspatroon', 0.6869808435440063), ('gezondheidsgedrag', 0.

1849 [('grond', 0.8406789898872375), ('verontreinigen_grond', 0.8329789638519287), ('afgraven_grond', 0.8108876943588257), ('stortplaats_uitgraven_grond', 0.809113621711731), ('zuivering_grond', 0.7967520356178284), ('verzakking', 0.7731660604476929), ('grondverzakking', 0.6905608177185059), ('plaats_milieuverontreiniging_bodem_doordringen', 0.6884396076202393), ('zakking', 0.6777045726776123), ('fundering', 0.6680890917778015)]

-----
 luchtverontreiniging
1850 [('luchtvervuiling', 0.7693814039230347), ('luchtkwaliteit', 0.7509341239929199), ('milieuverontreiniging', 0.7337332367897034), ('bodemverontreiniging', 0.7258572578430176), ('bestrijding_milieu_verontreiniging', 0.7222586274147034), ('technologie_bestrijding_milieuverontreiniging', 0.6972168684005737), ('maatregel_bestrijding_milieuverontreiniging', 0.6926442980766296), ('grensoverschrijdende_vervuiling', 0.6786662340164185), ('waterverontreiniging', 0.6785966157913208), ('verontreiniging', 0.673165500164032)]

-----
 opleidi

1868 [('fabriekswerk', 0.6869459748268127), ('nijverheid', 0.56685471534729), ('metaalverwerkend_industrie', 0.5593468546867371), ('rechtswezen', 0.5573117733001709), ('ambachtelijk_nijverheid', 0.5572001934051514), ('ijzerwerk', 0.5468394756317139), ('nijverheidsonderwijs', 0.5389847755432129), ('industrieel', 0.5373990535736084), ('industrieel_geneeskund', 0.5308944582939148), ('kunststofverwerkenen_industrie', 0.530880331993103)]

-----
 energieverbruik
1869 [('energiegebruik', 0.8407506346702576), ('energieverbruiker', 0.8174618482589722), ('energiekosten', 0.7745320796966553), ('elektriciteitsverbruik', 0.7598778605461121), ('energiegebruiker', 0.75503009557724), ('energiebesparing', 0.7486902475357056), ('verbruik', 0.7410626411437988), ('warmteverbruik', 0.7328927516937256), ('gasverbruik', 0.7327373027801514), ('energiebeheer', 0.7323468923568726)]

-----
 m_richtlijn
1870 [('m', 0.9870203137397766), ('m_lokaal', 0.9807064533233643), ('m_wet', 0.9652962684631348), ('h', 0.71282

1888 [('televisieprogramma', 0.6805628538131714), ('muziekprogramma', 0.6751232147216797), ('radiostation', 0.6347981691360474), ('documentaireprogramma', 0.6321631073951721), ('praatprogramma', 0.6298625469207764), ('radiozender', 0.6277471780776978), ('actualiteitenprogramma', 0.6242320537567139), ('tvprogramma', 0.6226680278778076), ('radio', 0.6130082607269287), ('verzoekplatenprogramma', 0.6097812652587891)]

-----
 bladverlie
1889 [('bladverliezend', 0.7635226249694824), ('bladverliezende', 0.728507936000824), ('bladloos', 0.593306839466095), ('bladval', 0.5798221826553345), ('groeiseizoen', 0.5498831272125244), ('groenblijvend', 0.5440818667411804), ('uitplanten', 0.5384567975997925), ('winterharen', 0.5384159088134766), ('nachtvorst', 0.5360429286956787), ('bladvering', 0.5337501764297485)]

-----
 monument
1890 [('geschiedkundig_monument', 0.8995455503463745), ('monumentaal', 0.7242410182952881), ('oorlogsmonument', 0.7215026617050171), ('herdenkingsmonument', 0.72110295295715

1917 [('inheems', 0.8843841552734375), ('inheems_technologie', 0.8841636180877686), ('inheem_bossen', 0.6927305459976196), ('kennis', 0.683404266834259), ('inheem', 0.6782605648040771), ('inheemsen', 0.637531042098999), ('ecologisch_cultuur', 0.6286841630935669), ('traditioneel_cultuur', 0.6250365376472473), ('bevordering_volk_gezondheid', 0.622833788394928), ('uitheems_soort', 0.6193872690200806)]

-----
 zwemwater_zout
1918 [('zout_water', 0.8997488021850586), ('zout', 0.8872660398483276), ('zwemwater_zoet', 0.8128994703292847), ('zwemwater', 0.7694987058639526), ('zwemwater_algemeen', 0.751954972743988), ('zoutgehalte_water', 0.7365941405296326), ('ontzouting_zeewater', 0.7293486595153809), ('zoutwater', 0.727826714515686), ('demineralisatie_water', 0.7189648151397705), ('zeewater', 0.704052209854126)]

-----
 hergebruiken_materiaal
1919 [('hergebruik_materiaal', 0.9212145209312439), ('materiaal', 0.8716201186180115), ('verontreinigen_materiaal', 0.8420677185058594), ('hergebruiken'

1938 [('materiaalsamenstelling', 0.6587229371070862), ('materiaaleigenschap', 0.6240684390068054), ('constructiemateriaal', 0.6082931756973267), ('bekledingsmateriaal', 0.603584885597229), ('materiaalsoort', 0.6016899943351746), ('materiaalfout', 0.5893313884735107), ('materiaalverbruik', 0.5836070775985718), ('constructiestaal', 0.5740643739700317), ('verenstaal', 0.5613306760787964), ('treksterkte', 0.5563070774078369)]

-----
 bouwafval
1939 [('landbouwafval', 0.7447404265403748), ('dakafval', 0.7425150871276855), ('sloopafval', 0.726462185382843), ('groenafval', 0.7102651596069336), ('houtafval', 0.7098283767700195), ('tuinafval', 0.6829915046691895), ('storten_afval', 0.6788241267204285), ('composteerbaar_afval', 0.671296238899231), ('radioactief_afval', 0.6702207326889038), ('afval', 0.6698572635650635)]

-----
 wegenbouw
1940 [('materiaal_wegenbouw', 0.8683561682701111), ('wegenbouwer', 0.6870095729827881), ('waterbouw', 0.6709620952606201), ('industriebouw', 0.6450127959251404)

1958 [('economisch_geografie', 0.86919105052948), ('geografie', 0.8546687960624695), ('politiek', 0.8469239473342896), ('politiek_ecologie', 0.8251338005065918), ('politiek_grondgebied', 0.8250653743743896), ('politiek_ideologie', 0.8168233036994934), ('politiek_organisatie', 0.7999699115753174), ('internationaal_politiek', 0.7980678677558899), ('fysisch_geografie', 0.7676889896392822), ('politiek_raadgeving', 0.7296042442321777)]

-----
 meting
1959 [('meting_milieuverontreiniging', 0.9376632571220398), ('atmosferisch_meting', 0.8753426671028137), ('meting_stroming', 0.8735660314559937), ('fysisch_meting_milieuvervuiling', 0.7928600907325745), ('eindmeting', 0.73735511302948), ('meting_verontreinigen_stof', 0.7263892889022827), ('kwaliteitsmeting', 0.676244854927063), ('prestatiemeting', 0.66541987657547), ('voormeting', 0.6633161306381226), ('meetwaarde', 0.6530311107635498)]

-----
 elektriciteitsverbruik
1960 [('elektriciteitsgebruik', 0.7879889011383057), ('gasverbruik', 0.7788789

1978 [('jeugdig', 0.7120999097824097), ('jonge', 0.6948569416999817), ('jongen', 0.6841549277305603), ('oud', 0.6767712831497192), ('leeftijd', 0.65682053565979), ('jongvolwassene', 0.6552077531814575), ('volwassen', 0.6450846195220947), ('oud_band', 0.640019416809082), ('kind', 0.6316712498664856), ('oud_papier', 0.6153156757354736)]

-----
 indirect_inductor
1979 [('inductor', 0.8660762310028076), ('inductors', 0.7588061094284058), ('indirect', 0.7290081977844238), ('inductief', 0.7269700169563293), ('inductie', 0.7056012153625488), ('agens_direct_induceren_werking', 0.6831951141357422), ('reductor', 0.6635489463806152), ('induceren', 0.6083543300628662), ('abductor', 0.597881555557251), ('inductiespoel', 0.5846114158630371)]

-----
 kap_bos
1980 [('bos', 0.8727536201477051), ('natuurlijk_bos', 0.8425992727279663), ('achteruitgang_bos', 0.8415697813034058), ('tropisch_bos', 0.7929825782775879), ('kap', 0.7706726789474487), ('mengen_bos', 0.754404604434967), ('bos_schadelijk_dier_plan

1998 [('biologisch_verontreiniging', 0.9283726215362549), ('biologisch_effect_vervuiling', 0.887065052986145), ('biologisch_afvalverwerking', 0.8634364604949951), ('biologisch_bestrijding', 0.8584906458854675), ('biologisch_verontreinig', 0.8560270071029663), ('biologisch', 0.8526071310043335), ('biologisch_afvalwaterverwerking', 0.8486605286598206), ('biologisch_waterbalans', 0.8352874517440796), ('biologisch_stikstoffixatie', 0.8346622586250305), ('organisch_vervuiling', 0.8337974548339844)]

-----
 afrika
1999 [('zuidelijk_afrika', 0.9409427642822266), ('centraal_afrika', 0.9290830492973328), ('noord_afrika', 0.8360607624053955), ('oost_afrika', 0.8339999914169312), ('west_afrika', 0.7924830913543701), ('africa', 0.7093535661697388), ('afrikaan', 0.6902292370796204), ('zuidelijk_azië', 0.6837866306304932), ('azië', 0.6808860898017883), ('zuid_oost_azië', 0.6633707284927368)]

-----
 eiland
2000 [('klein_eiland', 0.8431705236434937), ('eilandengroep', 0.759742796421051), ('eilanen', 

2027 [('morfologie_zeebodem', 0.7748838663101196), ('morfologisch', 0.7372677326202393), ('plantenmorfologie', 0.6876984238624573), ('populatie_ecologie', 0.6170631647109985), ('moleculair_biologie', 0.6144781112670898), ('geomorfologie', 0.6053154468536377), ('biologie_riviermonding', 0.6050901412963867), ('wetenschappelijk_ecologie', 0.5984676480293274), ('anatomie', 0.5910171270370483), ('histologie', 0.5897849798202515)]

-----
 stormschade
2028 [('brandschade', 0.7029448747634888), ('hagelschade', 0.6999444961547852), ('glasschade', 0.6646110415458679), ('ruitschade', 0.6618763208389282), ('schade', 0.6263656616210938), ('vorstschade', 0.6225149631500244), ('waterschade', 0.619458794593811), ('raming_schade', 0.6160168647766113), ('schade_akker', 0.6158679127693176), ('blikschade', 0.6130145788192749)]

-----
 sociologisch_onderzoek
2029 [('sociologisch', 0.8888608813285828), ('interdisciplinair_onderzoek', 0.8572946786880493), ('wetenschappelijk_onderzoek', 0.8544377088546753), (

2047 [('onderwijs', 0.8852020502090454), ('algemeen_onderwijs', 0.8273608684539795), ('organisatie', 0.7975020408630371), ('primair_onderwijs', 0.7869230508804321), ('onderwijsbeleid', 0.7656854391098022), ('onderwijsinstelling', 0.7514657974243164), ('internationaal_organisatie', 0.7405718564987183), ('onderwijsorganisatie', 0.739517092704773), ('gouvernementeel_organisatie', 0.7375361919403076), ('onderwijsvernieuwing', 0.7334571480751038)]

-----
 zwaveldioxien
2048 [('stikstofdioxid', 0.6795160174369812), ('zwavelwaterstof', 0.6239238977432251), ('zwaveligzuur', 0.614241898059845), ('chloordioxide', 0.6140025854110718), ('sulfiet', 0.6106951236724854), ('zwaveloxide', 0.6097990274429321), ('stikstofoxide', 0.5978102684020996), ('waterstofjodide', 0.5912262201309204), ('diazomethaan', 0.5892627239227295), ('stikstofoxien', 0.5848315358161926)]

-----
 bedrijfsvoertuig
2049 [('voertuig', 0.7737644910812378), ('bedrijfswagen', 0.7731624841690063), ('landbouwvoertuig', 0.75199711322784

2070 [('hergebruiken_materiaal', 0.9212145209312439), ('hergebruik', 0.877767026424408), ('materiaal', 0.8706502318382263), ('alternatief_materiaal', 0.8386205434799194), ('gebruik_afval_materiaal', 0.8290566205978394), ('natuurlijk_materiaal', 0.8236072063446045), ('verontreinigen_materiaal', 0.8222798109054565), ('elektronisch_materiaal', 0.8060747981071472), ('industrieel_materiaal', 0.801616907119751), ('levenscyclus_materiaal', 0.799621045589447)]

-----
 biologisch_verontreiniging
2071 [('biologisch_vervuiling', 0.9283726215362549), ('biologisch_verontreinig', 0.9146559238433838), ('biologisch_afvalwaterverwerking', 0.8986866474151611), ('biologisch', 0.8830716013908386), ('biologisch_stikstoffixatie', 0.8807470202445984), ('biologisch_afvalverwerking', 0.8674802184104919), ('biologisch_bestrijding', 0.8610773086547852), ('biologisch_waterbalans', 0.8608320355415344), ('biologisch_ontwikkeling', 0.8386790752410889), ('biologisch_verwerking', 0.836746096611023)]

-----
 doelgroep


2089 [('mechanisch_materiaal', 0.8838972449302673), ('materiaal', 0.858920693397522), ('alternatief_materiaal', 0.8378361463546753), ('audiovisueel_materiaal', 0.8343328833580017), ('industrieel_materiaal', 0.8201817274093628), ('natuurlijk_materiaal', 0.8135820627212524), ('hergebruik_materiaal', 0.8060747981071472), ('hergebruiken_materiaal', 0.7926104068756104), ('isoleren_materiaal', 0.7854034304618835), ('verontreinigen_materiaal', 0.7825328707695007)]

-----
 microcomputer
2090 [('microprocessor', 0.7120510935783386), ('computer', 0.6951963305473328), ('microcontroller', 0.6602082848548889), ('computertechnologie', 0.6307319402694702), ('minicomputer', 0.6274937987327576), ('microcode', 0.622017502784729), ('computersysteem', 0.6153935790061951), ('computertechniek', 0.5969244241714478), ('computerbehuizing', 0.5894908905029297), ('computerexamensysteem', 0.5815916657447815)]

-----
 uitbreidingsprogramma
2091 [('uitbreidingsproject', 0.7282711267471313), ('uitbreidingsbeleid', 0

2115 [('plaatselijk_verkeer', 0.8726071119308472), ('verkeer_kapitaal', 0.8683543801307678), ('zakelijk_verkeer', 0.8438999652862549), ('uitstoot_verkeer', 0.8241875767707825), ('wegverkeer', 0.757605254650116), ('verkeersveiligheid', 0.7344297170639038), ('verkeersonveiligheid', 0.7225973606109619), ('verkeersmanagement', 0.7165883183479309), ('verkeersregel', 0.710033118724823), ('verkeersgedrag', 0.6961996555328369)]

-----
 afvoerbuis_zee
2116 [('zee', 0.8754242062568665), ('middellandse_zee', 0.8497326374053955), ('afzetting_zee', 0.8409217000007629), ('olieboring_zee', 0.8359991312026978), ('controle_zee', 0.8250856399536133), ('badplaats_zee', 0.8158230781555176), ('open_zee', 0.8024095296859741), ('zwart_zee', 0.7969346642494202), ('toegang_zee', 0.7907207012176514), ('natuurlijk_rijkdom_zee', 0.7882933020591736)]

-----
 compostering_producent
2117 [('producent', 0.7929577231407166), ('compostering', 0.7862317562103271), ('aansprakelijkheid_producent', 0.7003713250160217), ('i

2145 [('loofboom', 0.7130349278450012), ('naaldbos', 0.7019756436347961), ('conifeer', 0.6922628879547119), ('dennenboom', 0.667738676071167), ('pijnboom', 0.660054087638855), ('dennenbos', 0.6533735990524292), ('fijnspar', 0.6409600973129272), ('eucalyptusboom', 0.6367644667625427), ('eikenboom', 0.6341241598129272), ('struikvorm', 0.6317046284675598)]

-----
 denitrificatie
2146 [('nitrificatie', 0.8854206800460815), ('denitrificatie_afvalgas', 0.7924556732177734), ('mineralisatie', 0.6644004583358765), ('stikstoffixatie', 0.6083987951278687), ('slibgisting', 0.6011056900024414), ('ozonisatie', 0.5998455286026001), ('ontzwaveling', 0.5884422063827515), ('chemisch_adsorptie', 0.5882323980331421), ('stikstofbinding', 0.5881328582763672), ('adsorptie', 0.5766168832778931)]

-----
 installatie_apparatenbouw
2147 [('installatie', 0.8654706478118896), ('industrieel_installatie', 0.8393706679344177), ('apparatenbouw', 0.8390019536018372), ('optimalisering_installatie', 0.8022927045822144), 

2164 [('harmonisatie', 0.85634845495224), ('internationaal_standaardisatie', 0.8103511333465576), ('internationaal_samenwerking', 0.7639557123184204), ('internationaal', 0.7547365427017212), ('internationaal_betrekking', 0.7400707602500916), ('internationaal_privaatrecht', 0.7389278411865234), ('harmonisering', 0.7314974069595337), ('nationaal_wetgeving', 0.7294750809669495), ('internationaal_concurrentie', 0.7226982712745667), ('internationaal_vergelijking', 0.7211102247238159)]

-----
 juridisch_stand
2165 [('stand', 0.8289441466331482), ('juridisch', 0.7377766370773315), ('juridisch_systeem_europees_gemeenschap', 0.7224466800689697), ('internationaal_economisch_recht', 0.6765118837356567), ('administratief_recht', 0.6635944843292236), ('burgerlijk_recht', 0.6583815813064575), ('economisch_recht', 0.657947301864624), ('administratief_rechtsgebied', 0.6421500444412231), ('recht_informatie', 0.635542631149292), ('internationaal_recht', 0.6334508061408997)]

-----
 proefproject
2166 [('

2185 [('radioactief_neerslag', 0.8550658226013184), ('atmosferisch_radioactief_neerslag', 0.7732290029525757), ('zuur_neerslag', 0.7254321575164795), ('neerslaghoeveelheid', 0.7209972143173218), ('neerslagtotaal', 0.656036376953125), ('regenval', 0.606712818145752), ('weerslag', 0.5876993536949158), ('neerslaan', 0.5859155058860779), ('neerslagreactie', 0.5716986656188965), ('wolkbreuk', 0.5529688596725464)]

-----
 oceaan
2186 [('noordatlantisch_oceaan', 0.9224040508270264), ('exploitatie_oceaan', 0.9106146097183228), ('antarctisch_oceaan', 0.8704233765602112), ('zuidelijk_atlantisch_oceaan', 0.8572158813476562), ('indisch_oceaan', 0.8494530916213989), ('arctisch_oceaan', 0.8283018469810486), ('zuidelijk_stil_oceaan', 0.7768620252609253), ('noordelijk_stil_oceaan', 0.7762908339500427), ('stort_oceaan', 0.7672432661056519), ('natuurlijk_rijkdom_zee', 0.7431219816207886)]

-----
 anaëroob_voorwaarde
2187 [('aëroob_voorwaarde', 0.9385602474212646), ('anaëroob', 0.812988817691803), ('anaë

 weefsel
2205 [('bindweefsel', 0.6422882676124573), ('weefselvloeistof', 0.6375719904899597), ('spierweefsel', 0.6178354620933533), ('huidweefsel', 0.6155127882957458), ('vezel', 0.604123055934906), ('lichaam', 0.60002201795578), ('lichaamsweefsel', 0.5986402034759521), ('zenuwweefsel', 0.597643256187439), ('steunweefsel', 0.5974929332733154), ('bloedvat', 0.5900730490684509)]

-----
 vastleggen_duin
2206 [('duin', 0.9129625558853149), ('zand_duin', 0.7833007574081421), ('duingebied', 0.7354834675788879), ('duinpan', 0.6889572143554688), ('duinlandschap', 0.6673851609230042), ('duinpark', 0.6660541892051697), ('zeereep', 0.6540664434432983), ('dijk', 0.6493786573410034), ('achteruitgang_bos', 0.639612078666687), ('duinenrij', 0.6337651014328003)]

-----
 weginrichting
2207 [('bebording', 0.6079440116882324), ('verkeersafwikkeling', 0.5901466012001038), ('verkeerstelling', 0.5789247155189514), ('verkeerssituatie', 0.5761741995811462), ('verkeersregeling', 0.5727300643920898), ('wegdeel'

2230 [('energieopwekking', 0.7417150735855103), ('elektriciteitsproductie', 0.7306530475616455), ('stroomopwekking', 0.7163290977478027), ('energie_opwekking', 0.7162812352180481), ('elektriciteitsvoorziening', 0.7109400033950806), ('energieproductie', 0.7098647356033325), ('elektriciteitsdistributie', 0.7057092785835266), ('elektriciteitslevering', 0.6811337471008301), ('warmtekrachtkoppeling', 0.6798000335693359), ('biomassa_energie', 0.6793142557144165)]

-----
 bouw_hergebruik_materiaal
2231 [('bouw', 0.9028803110122681), ('veiligheidsnorm_bouw', 0.901165246963501), ('hergebruik_materiaal', 0.7956802845001221), ('materiaal_wegenbouw', 0.7806488275527954), ('bouwmateriaal', 0.7577922344207764), ('industrieel_materiaal', 0.7284809350967407), ('isoleren_materiaal', 0.722923994064331), ('hergebruiken_materiaal', 0.7210680842399597), ('materiaal', 0.7100287079811096), ('alternatief_materiaal', 0.709687352180481)]

-----
 minimaliseren_effect
2232 [('effect', 0.9390336275100708), ('voork

2251 [('onderzoek_uitstoten_gas', 0.8937116861343384), ('gas', 0.8883845806121826), ('behandeling_gas', 0.8878512382507324), ('biologisch_zuivering_overtollig_gas', 0.8513666987419128), ('uitstoot_uitlaat_gas', 0.8220380544662476), ('vloeibaar_maken', 0.8144991397857666), ('mijnbouw_gas_oliewinning_zee', 0.7590006589889526), ('vloeibaar', 0.7350584268569946), ('inert_maken', 0.7316123843193054), ('maat_maken_chemisch_product', 0.7103531360626221)]

-----
 geologisch_ramp
2252 [('hydrologisch_ramp', 0.9026410579681396), ('weerkundig_ramp', 0.8691832423210144), ('ramp', 0.858589768409729), ('ramp_bestrijdings_dienst', 0.7760687470436096), ('mens_veroorzaken_ramp', 0.7694051265716553), ('geologisch', 0.7246212959289551), ('hulp_verlening_ramp', 0.7155340909957886), ('opheffing_geologisch', 0.7096067667007446), ('geologisch_proces', 0.6825565099716187), ('natuurramp', 0.6209038496017456)]

-----
 chemisch_vervuiling
2253 [('chemisch', 0.8974254727363586), ('organisch_vervuiling', 0.8882247

2272 [('hydrologisch_ramp', 0.9106658697128296), ('weerkundig_ramp', 0.8778438568115234), ('mens_veroorzaken_ramp', 0.8644595742225647), ('geologisch_ramp', 0.858589768409729), ('ramp_bestrijdings_dienst', 0.8401011228561401), ('hulp_verlening_ramp', 0.7928731441497803), ('natuurramp', 0.6654596924781799), ('overstroming', 0.5953732132911682), ('calamiteit', 0.5943857431411743), ('aardbeving_veroorzaken_zeegolf', 0.5904922485351562)]

-----
 warmt_apparatuur
2273 [('warmt', 0.943497896194458), ('warmt_isolatie', 0.9151763916015625), ('warmt_fysica', 0.8776453137397766), ('warmt_energie_zee', 0.8548201322555542), ('warmen', 0.8040909767150879), ('opwarmen', 0.6797932386398315), ('verwarmen', 0.6297210454940796), ('koelen', 0.59186851978302), ('warm', 0.5765661001205444), ('voorverwarmen', 0.5608014464378357)]

-----
 inschatten_effect
2274 [('minimaliseren_effect', 0.8620697259902954), ('effect', 0.8600287437438965), ('onderzoek_effect', 0.8424962162971497), ('voorkomen_effect', 0.83615

2294 [('menskracht', 0.6789348125457764), ('spankracht', 0.5886961221694946), ('werkkracht', 0.5783207416534424), ('slagkracht', 0.5510694980621338), ('manuur', 0.5348696708679199), ('inzetten', 0.5298570394515991), ('inhuren', 0.5291971564292908), ('personeelsinzet', 0.5190074443817139), ('slagkrachtig', 0.5138792395591736), ('productiecapaciteit', 0.5102624297142029)]

-----
 tropen
2295 [('subtropen', 0.6641734838485718), ('tropisch_regenwoud', 0.6171137094497681), ('tropenmuseum', 0.6119439005851746), ('tropisch_klimaat', 0.6080071926116943), ('tropisch', 0.5914605855941772), ('indisch_oceaan', 0.5819553136825562), ('tropeninstituut', 0.5639952421188354), ('tropisch_ecosysteem', 0.5490649342536926), ('tropisch_bos', 0.5470286011695862), ('ecosysteem_koud_gebied', 0.5307652950286865)]

-----
 menswetenschappen
2296 [('levenswetenschappen', 0.7551655769348145), ('gezinswetenschapp', 0.6958968639373779), ('moraalwetenschap', 0.6829061508178711), ('geesteswetenschap', 0.679987192153930

2315 [('psychotherapie', 0.7911025285720825), ('therapievorm', 0.7632529139518738), ('zuurstoftherapie', 0.7388982772827148), ('combinatietherapie', 0.7377204298973083), ('therapy', 0.7345778942108154), ('therapeut', 0.733551025390625), ('bewegingstherapie', 0.7295957803726196), ('gedragstherapie', 0.7290815114974976), ('chemotherapie', 0.7209810614585876), ('vaktherapie', 0.7050057649612427)]

-----
 televisie
2316 [('television', 0.7129915356636047), ('zender', 0.6186805367469788), ('televisiezender', 0.6165333390235901), ('televisiedienst', 0.6110426783561707), ('omroep', 0.588110089302063), ('satelliettelevisie', 0.5866477489471436), ('televisi', 0.5847394466400146), ('hdtv', 0.584290623664856), ('televisieprogramma', 0.5822615623474121), ('audiovisueel_media', 0.5818687677383423)]

-----
 veldproef
2317 [('proefveld', 0.6598540544509888), ('praktijkproef', 0.5935237407684326), ('laboratoriumproef', 0.5584501028060913), ('veldtest', 0.5575306415557861), ('laboratoriumexperiment', 0

2342 [('herstel_waterkwaliteit', 0.9025477170944214), ('herstellen', 0.7844828367233276), ('herstel_oud_installatie', 0.7795819044113159), ('herstell', 0.7473982572555542), ('herstelling', 0.6644161939620972), ('herstelproces', 0.60926353931427), ('herstelde', 0.608157753944397), ('structureel_herstelprogramma', 0.5565221905708313), ('rehabilitatie', 0.5526543855667114), ('herstel_wild_leven_plant_dier', 0.5469066500663757)]

-----
 rechtsgrond_slag
2343 [('slag', 0.89761883020401), ('rechtsgrond', 0.5749580264091492), ('internationaal_verdeling_werk', 0.5581395030021667), ('openbaar_werk', 0.5466441512107849), ('strijd', 0.5445570945739746), ('schade_gevolg_militair_oefening', 0.5396697521209717), ('rechtsgrondslag', 0.5338912606239319), ('aan', 0.5325420498847961), ('confrontatie', 0.5280739665031433), ('aansprakelijkheid_zee_ongeval', 0.5278908014297485)]

-----
 beheersing_milieuverontreiniging
2344 [('investering_beheersing_milieuverontreiniging', 0.9304208159446716), ('beheersing

2361 [('biologisch_ontwikkeling', 0.894517183303833), ('biologisch', 0.8809723854064941), ('biologisch_afvalwaterverwerking', 0.8413538932800293), ('biologisch_activiteit', 0.8411877751350403), ('biologisch_eigenschap', 0.837590217590332), ('biologisch_afvalverwerking', 0.8304287791252136), ('concurrentie_biologisch', 0.8299871683120728), ('biologisch_productie', 0.8272561430931091), ('biologisch_verwerking', 0.8269801139831543), ('biologisch_verontreiniging', 0.8237597346305847)]

-----
 materiaal_wegenbouw
2362 [('wegenbouw', 0.8683561086654663), ('materiaal', 0.7883918881416321), ('industrieel_materiaal', 0.7857744693756104), ('bouw_hergebruik_materiaal', 0.7806488275527954), ('alternatief_materiaal', 0.7477258443832397), ('bouwmateriaal', 0.7464996576309204), ('mechanisch_materiaal', 0.7440004944801331), ('natuurlijk_materiaal', 0.7339601516723633), ('audiovisueel_materiaal', 0.731574535369873), ('verontreinigen_materiaal', 0.7308073043823242)]

-----
 fotochemisch_reactie
2363 [('

2381 [('persoonlijkheidsleer', 0.6030266284942627), ('geluidswetgeving', 0.5938291549682617), ('gezondheidsleer', 0.575249969959259), ('geluidisolatie', 0.567406415939331), ('geluidstechniek', 0.5664302110671997), ('geluidsweergave', 0.5612154006958008), ('geluidstrilling', 0.5584473609924316), ('erfelijkheidsleer', 0.5543035268783569), ('geluidsbelasting', 0.5529965758323669), ('aërodynamisch_geluid', 0.5515388250350952)]

-----
 filosofie
2382 [('filosofi', 0.7536133527755737), ('godsdienstfilosofie', 0.6819513440132141), ('levensbeschouwing', 0.6802375912666321), ('cultuurfilosofie', 0.6799677610397339), ('filosofisch', 0.6782015562057495), ('kunstfilosofie', 0.6542565822601318), ('filosoof', 0.6523638963699341), ('levenskunst', 0.6520430445671082), ('dialectiek', 0.6436678171157837), ('ideologie', 0.6426938772201538)]

-----
 gletsjer
2383 [('gletsjermeer', 0.7539392709732056), ('gletsjertong', 0.7063267230987549), ('gletscher', 0.6977847814559937), ('glacier', 0.6945542097091675),

2402 [('gasverwarming', 0.7375582456588745), ('warmtelevering', 0.6738196611404419), ('warmtevoorziening', 0.6600702404975891), ('stadswarmte', 0.6541627645492554), ('warmtenett', 0.6523745059967041), ('verwarming', 0.6343868970870972), ('warmtenet', 0.631685733795166), ('ruimteverwarming', 0.6274511814117432), ('bijverwarming', 0.6223152279853821), ('wandverwarming', 0.6216433048248291)]

-----
 biotisch_index
2403 [('index', 0.8670483231544495), ('milieu_index', 0.8244078159332275), ('biotisch_factor', 0.7424706220626831), ('biotisch', 0.7394667863845825), ('abiotisch_factor', 0.6800116300582886), ('abiotisch', 0.6176278591156006), ('abiotisch_omgeving', 0.603127121925354), ('chemisch_analyse', 0.602948009967804), ('glycemisch', 0.5997545719146729), ('indexe', 0.597522497177124)]

-----
 exacen_wetenschap_pen
2404 [('exacen', 0.7715274095535278), ('exacte', 0.7715274095535278), ('pen', 0.6933890581130981), ('wetenschap', 0.6679502129554749), ('onderwijsexacte', 0.595953643321991), ('

2424 [('sneeuwen', 0.8001633882522583), ('sneeuwpret', 0.7092704772949219), ('sneeuwdek', 0.6836492419242859), ('sneeuwbui', 0.6698493957519531), ('dooien', 0.6658689975738525), ('kunstsneeuw', 0.6600036025047302), ('sneeuwval', 0.6382635831832886), ('sneeuwlaag', 0.6364318132400513), ('ijzel', 0.633496880531311), ('sneeuwlandschap', 0.631584882736206)]

-----
 geleedpotigen
2425 [('ongewervelden', 0.6194746494293213), ('ongewerveld', 0.5933893322944641), ('gewervelden', 0.5911855697631836), ('gewerveld', 0.5658079385757446), ('insectenlarf', 0.5487373471260071), ('insecteneter', 0.5429046154022217), ('chordadieren', 0.5425336360931396), ('gewerveld_dier', 0.5414284467697144), ('koppotigen', 0.5407278537750244), ('oorworm', 0.5397564172744751)]

-----
 vloeibaar_mest
2426 [('mest', 0.9299763441085815), ('dierlijk_mest', 0.9200822114944458), ('vloeiveld_afvalwater_mest', 0.8617469668388367), ('natuurlijk_meststof', 0.7547423839569092), ('chemisch_meststof', 0.745898425579071), ('meststo

2446 [('isolatie', 0.7649039030075073), ('isolatiewerk', 0.7451021671295166), ('isolatiesysteem', 0.7296655178070068), ('isolatiewaard', 0.719751238822937), ('glaswol', 0.7175730466842651), ('isolatielaag', 0.7074133157730103), ('isolatiewaaren', 0.7018792629241943), ('bodemisolatie', 0.6995413899421692), ('isoleren_materiaal', 0.6950435042381287), ('isolatieplaat', 0.6936072111129761)]

-----
 zuurstoftekort
2447 [('zuurstofgebrek', 0.6945676803588867), ('zuurstofgehalte', 0.6316047310829163), ('ademhalingsprobleem', 0.629362940788269), ('zuurstofverbruik', 0.6200843453407288), ('hypoxie', 0.616452693939209), ('zuurstofconcentratie', 0.6097903251647949), ('ijzertekort', 0.6075085401535034), ('energietekort', 0.5978405475616455), ('zuurstofloos', 0.5926243662834167), ('hartinfarct', 0.5893926620483398)]

-----
 zakelijk_verkeer
2448 [('verkeer', 0.8438999652862549), ('verkeer_kapitaal', 0.8204869627952576), ('plaatselijk_verkeer', 0.8154246807098389), ('zakelijk', 0.7952260971069336), 

2465 [('cel', 0.8714520931243896), ('cel_energie', 0.8267675042152405), ('biologie', 0.790844738483429), ('menselijk_biologie', 0.7810947299003601), ('moleculair_biologie', 0.775314450263977), ('marien_biologie', 0.7144838571548462), ('biologie_riviermonding', 0.7043118476867676), ('biochemie', 0.653992772102356), ('ecologie_onderdeel_sociologie', 0.6234886646270752), ('celbiologie', 0.6111284494400024)]

-----
 emissie
2466 [('emissie_vliegtuigmotor', 0.9084703922271729), ('verhandelbaar_emissie_recht', 0.7600343227386475), ('emissieregistratie', 0.7261637449264526), ('emissiefactor', 0.7237297296524048), ('emission', 0.7171018719673157), ('emissierecht', 0.6862348318099976), ('emissiehandel', 0.6826104521751404), ('uitstoot_afvalwater', 0.6722007989883423), ('emissiebron', 0.6702618598937988), ('emissiereductie', 0.6594922542572021)]

-----
 openbaar_slachthuis
2467 [('slachthuis', 0.8107512593269348), ('openbaar', 0.8069023489952087), ('openbaar_vervoersmiddel', 0.7593023180961609),

2484 [('dienstverrichting', 0.7154831886291504), ('levensverrichting', 0.7039046883583069), ('handelsverkeer', 0.6749778985977173), ('bankverrichting', 0.6432772278785706), ('handelsvennootschap', 0.6395339369773865), ('handelstransactie', 0.6373840570449829), ('handelsvereniging', 0.6314378976821899), ('handelsvergunning', 0.6185058355331421), ('handelsactiviteit', 0.6055716276168823), ('dienstverrichter', 0.59620201587677)]

-----
 aardkorst
2485 [('vorm_aardkorst', 0.809873104095459), ('lithosfeer', 0.6688885688781738), ('gesteente', 0.6480340957641602), ('aardoppervlak', 0.6020996570587158), ('subductiezone', 0.5984811782836914), ('stollingsgesteente', 0.5896425843238831), ('aardolie_geologie', 0.586671769618988), ('magmatisch', 0.5712724924087524), ('zuurstofisotoop', 0.5681885480880737), ('platentektoniek', 0.5627918839454651)]

-----
 biologisch_proef
2486 [('proef', 0.8720327615737915), ('snel_proef', 0.7764513492584229), ('biologisch', 0.7726696729660034), ('biologisch_activit

2504 [('afval', 0.9651045799255371), ('hoeveelheid_afval', 0.957666277885437), ('uitwisseling_afval', 0.9497908353805542), ('plantaardig_afval', 0.9487987756729126), ('verwerking_afval', 0.9487728476524353), ('bijzonder_afval', 0.9461799263954163), ('huishoudelijk_afval', 0.9456687569618225), ('hergebruik_afval', 0.9455267786979675), ('elektronisch_afval', 0.9409929513931274), ('organisch_afval', 0.9405182600021362)]

-----
 atmosferisch_scheikunde
2505 [('atmosferisch_natuurkunde', 0.8878757953643799), ('scheikunde', 0.8380832076072693), ('organisch_scheikunde', 0.8243391513824463), ('atmosferisch_wetenschap', 0.8214238882064819), ('analytisch_scheikunde', 0.801241934299469), ('algemeen_scheikunde', 0.7692874670028687), ('atmosferisch', 0.7611416578292847), ('atmosferisch_deel', 0.7514872550964355), ('atmosferisch_correctie', 0.717070460319519), ('atmosferisch_vochtigheid', 0.7089319229125977)]

-----
 analyse
2506 [('chromatografisch_analyse', 0.9309002757072449), ('statistisch_analy

2524 [('structureel', 0.8116349577903748), ('herstelprogramma', 0.7984356880187988), ('sociaal_structuur', 0.6389557123184204), ('economisch_structuur', 0.6292049884796143), ('institutioneel_structuur', 0.6258258819580078), ('plannen_stedelijk_ontwikkeling', 0.6178351640701294), ('sociaal_beleid', 0.6166564226150513), ('preventief_maatregel_gebied_gezondheid', 0.6165098547935486), ('economisch_beleid', 0.6132146120071411), ('sociaal_analyse', 0.6131730675697327)]

-----
 toepassen_onderzoek
2525 [('toepassen', 0.8598114252090454), ('toepassen_wetenschap', 0.8565708994865417), ('onderzoek', 0.7809146642684937), ('wetenschappelijk_onderzoek', 0.7787432670593262), ('vergelijken_onderzoek', 0.7687122821807861), ('onderzoeken', 0.756284236907959), ('interdisciplinair_onderzoek', 0.7233393788337708), ('onderzoek_effect', 0.7139758467674255), ('sociologisch_onderzoek', 0.6853867769241333), ('bestuderen', 0.6597656011581421)]

-----
 hydrologisch_stroming
2526 [('stroming', 0.8602035045623779)

2546 [('beleidsanalyse', 0.7787562608718872), ('veiligheidsanalyse', 0.7630342245101929), ('gebiedsanalyse', 0.7028098106384277), ('scenarioanalyse', 0.667443573474884), ('analyse', 0.6547120809555054), ('tijdreeksanalyse', 0.6419584155082703), ('inhoudsanalyse', 0.6394234299659729), ('procesanalyse', 0.6366130709648132), ('modelberekening', 0.6357619762420654), ('gegevensanalyse', 0.6339043378829956)]

-----
 industrieel_afvalwater
2547 [('afvalwater', 0.8939114809036255), ('huishoudelijk_afvalwater', 0.8752707242965698), ('organisch_afvalwater', 0.8702090382575989), ('gemeentelijk_afvalwater', 0.8541948199272156), ('stedelijk_afvalwater', 0.846779465675354), ('combineren_afvalwater', 0.8426172733306885), ('afvalwaterzuivering', 0.8042899370193481), ('industrieel_afval', 0.7945101857185364), ('industrieel_vervuiling', 0.7889909744262695), ('bijzonder_industrieel_afval', 0.7850564122200012)]

-----
 internationaal_standaardisatie
2548 [('standaardisatie', 0.870015025138855), ('internat

2568 [('bilateraal_overeenkomst', 0.8961889743804932), ('multilateraal', 0.8663017749786377), ('internationaal_overeenkomst', 0.8411045074462891), ('overeenkomst', 0.8146066665649414), ('overeenkomst_administratief', 0.7774010300636292), ('overeenkomst_contract', 0.7508426904678345), ('bilateraal', 0.7371970415115356), ('gewestelijk_overeenkomst', 0.6876618266105652), ('bemiddelingsovereenkomst', 0.6822971105575562), ('multilateral', 0.6784771084785461)]

-----
 zelfcontrole
2569 [('zelfregulatie', 0.6059730648994446), ('zelfcorrectie', 0.5844018459320068), ('zelfconcept', 0.577258825302124), ('impulscontrole', 0.5667184591293335), ('zelfcompassi', 0.5497646331787109), ('zelfcorrigeren', 0.5215438008308411), ('zelfbeheersing', 0.5213367342948914), ('zelfwaardering', 0.5151513814926147), ('metacognitie', 0.4934472441673279), ('zelfinzicht', 0.4903353750705719)]

-----
 agrovoeding
2570 [('agrofood', 0.6639454364776611), ('agro_industrie', 0.6637166142463684), ('biotechnologie_landbouw',

2587 [('bacteriologisch', 0.874936044216156), ('verontreiniging', 0.8246380090713501), ('biologisch_verontreiniging', 0.7670291662216187), ('chemisch_ontsmetting', 0.7435004115104675), ('microbiologisch', 0.7404327988624573), ('verontreinigen', 0.7337225079536438), ('fysisch_verontreiniging', 0.7316641807556152), ('bacteriologie', 0.7282520532608032), ('radioactief_ontsmetting', 0.7225797772407532), ('chemisch_vervuiling', 0.7217366695404053)]

-----
 chemisch_ontsmetting
2588 [('radioactief_ontsmetting', 0.8562712669372559), ('chemisch_bestrijding', 0.8541150093078613), ('chemisch', 0.8527290225028992), ('ontsmetting', 0.8382635116577148), ('chemisch_reinigen', 0.8326579928398132), ('chemisch_behandeling', 0.8318949937820435), ('chemisch_zuurstofverbruik', 0.8313379287719727), ('chemisch_vervuiling', 0.8285154104232788), ('chemisch_samenstelling', 0.8094055652618408), ('chemisch_installatie', 0.806502640247345)]

-----
 akk
2589 [('qk', 0.567215621471405), ('rz', 0.5520511865615845), 

2608 [('waterbouwkundig', 0.7790412902832031), ('waterbouw', 0.762048602104187), ('scheepsbouwkunen', 0.7187803983688354), ('mijnbouwkunde', 0.6845719814300537), ('waterbouwkundig_bouwwerk', 0.6772937774658203), ('bouwkunde', 0.6751018762588501), ('hydrologie', 0.6481471657752991), ('geotechniek', 0.6374903321266174), ('waterbeheersing', 0.6356789469718933), ('grondmechanica', 0.6328083276748657)]

-----
 vlokvorming
2609 [('mineralisatie', 0.6344484090805054), ('ozonisatie', 0.5880672931671143), ('wolkenvorming', 0.5835267901420593), ('condensatiekern', 0.5789871215820312), ('oxydatie', 0.5787689685821533), ('klontering', 0.5767309665679932), ('gasvorming', 0.5761563777923584), ('nitrificatie', 0.5702083706855774), ('droging', 0.5624602437019348), ('slibgisting', 0.5567657947540283)]

-----
 beslaglegging
2610 [('beslaglegg', 0.802462100982666), ('uitwinning', 0.6189510822296143), ('beslaglegging_winst', 0.6092263460159302), ('inbeslagname', 0.5881458520889282), ('inbeslagneming', 0.5

2628 [('handelsafdeling', 0.6424256563186646), ('handelszaak', 0.6376955509185791), ('handel', 0.6122742295265198), ('handelsverrichting', 0.6055716276168823), ('ondernemingsactiviteit', 0.5967313647270203), ('handelsvennootschap', 0.5915936231613159), ('internationaal_handel', 0.5858660340309143), ('handelsverkeer', 0.579818606376648), ('kleinhandel', 0.5759263634681702), ('handelsonderneming', 0.5729749202728271)]

-----
 uitlaatgas
2629 [('uitlaatgas_voertuig', 0.8558414578437805), ('uitstoot_uitlaat_gas', 0.6356794834136963), ('roetfilter', 0.6251252889633179), ('verbrandingsgas', 0.6026163101196289), ('vervuilen_brandstof', 0.5953871607780457), ('luchtuitlaat', 0.5894467234611511), ('verbrandingsmotor', 0.588524341583252), ('vervuiling_motorvoertuig', 0.5789846777915955), ('ontzwaveling_brandstof', 0.5773946046829224), ('benzine', 0.57466059923172)]

-----
 buitenwijk
2630 [('voorstad', 0.7583498358726501), ('buitenstad', 0.6938295364379883), ('achterbuurt', 0.6797908544540405), (

2648 [('ingeademde_lucht', 0.9073494672775269), ('lucht_water_wisselwerking', 0.8826261758804321), ('toezicht_kwaliteit_lucht', 0.8244322538375854), ('grensvlak_oceaanwater_lucht', 0.8167020082473755), ('via_lucht_overdragen_geluid', 0.710177481174469), ('buitenlucht', 0.6887788772583008), ('luchtstroom', 0.6254675984382629), ('binnenlucht', 0.619198203086853), ('open_zee', 0.6051541566848755), ('afvoerbuis_zee', 0.5989772081375122)]

-----
 vluchtig_stof
2649 [('stof', 0.915534496307373), ('gevaarlijk_stof', 0.9146800637245178), ('organisch_stof', 0.9125432968139648), ('verontreinigen_stof', 0.9030998945236206), ('brandgevaarlijk_stof', 0.9001720547676086), ('kankerverwekkend_stof', 0.8988896012306213), ('oxyderenen_stof', 0.8854115605354309), ('fijn_stof', 0.8852370381355286), ('anorganisch_stof', 0.8846343755722046), ('radioactief_stof', 0.8832225203514099)]

-----
 begrazing
2650 [('overbegrazing', 0.8158507347106934), ('beweiding', 0.6767079830169678), ('begrazen', 0.6695381999015

2670 [('tankwagen', 0.7461919784545898), ('tankautospuit', 0.6918361186981201), ('tank', 0.6262266635894775), ('olietank', 0.5977224707603455), ('dieseltank', 0.5910916328430176), ('tankinstallatie', 0.5718191862106323), ('tankschip', 0.5680382251739502), ('ketelwagen', 0.5680363774299622), ('opslagtank', 0.5665361881256104), ('vrachtwagen', 0.5550881624221802)]

-----
 overeenkomst
2671 [('overeenkomst_contract', 0.8824441432952881), ('internationaal_overeenkomst', 0.862476646900177), ('overeenkomst_administratief', 0.8547590970993042), ('bilateraal_overeenkomst', 0.8167455196380615), ('multilateraal_overeenkomst', 0.8146066665649414), ('bemiddelingsovereenkomst', 0.7543400526046753), ('gebruiksovereenkomst', 0.7257903814315796), ('samenwerkingsovereenkomst', 0.7247911691665649), ('uitvoeringsovereenkomst', 0.7231858968734741), ('cliëntenovereenkomst', 0.7199798822402954)]

-----
 vissersboot
2672 [('zeilboot', 0.6912811994552612), ('visboten', 0.6859223246574402), ('boot_varen', 0.67

2690 [('verlicht', 0.7764061689376831), ('verlichtingssystemen', 0.7734634876251221), ('ledverlichting', 0.7473697662353516), ('verlichtingsinstallatie', 0.7280404567718506), ('noodverlichting', 0.7224584817886353), ('buitenverlichting', 0.7220464944839478), ('verlichten', 0.7165353894233704), ('veiligheidsverlichting', 0.7154005765914917), ('binnenverlichting', 0.7134386301040649), ('verlichtingssysteem', 0.7024608850479126)]

-----
 delfstof
2691 [('delfstoffenwinning', 0.7248132824897766), ('aardolie_exploratie', 0.6790381669998169), ('aardolie_geologie', 0.671033501625061), ('aardolie_industrie', 0.6611072421073914), ('aardolie', 0.6587744951248169), ('landschap_mijnbouw', 0.6419161558151245), ('mijnbouw_geologie', 0.6301104426383972), ('mijnbouw', 0.6262580156326294), ('mijnbouw_technologie', 0.6101100444793701), ('erts', 0.608396053314209)]

-----
 zuigeling
2692 [('pasgeborene', 0.6838794946670532), ('zuigelingenvoeding', 0.6642322540283203), ('pasgeboren', 0.6173291206359863), 

2711 [('hulp', 0.9531145095825195), ('humanitair_hulp', 0.9270049929618835), ('financieel_hulp', 0.9033094644546509), ('hulp_verlening_ramp', 0.8162480592727661), ('biologisch_hulp_bronnen', 0.779770016670227), ('biologisch_bodem_hulp_bronnen', 0.7122831344604492), ('sociaal_hulpverlening', 0.6307488679885864), ('internationaal_verdeling_werk', 0.618483304977417), ('assistentie', 0.6175114512443542), ('helpen', 0.6085692644119263)]

-----
 aërodynamisch_geluid
2712 [('geluid', 0.907263994216919), ('geluid_vliegtuig', 0.8569986820220947), ('storen_geluid', 0.8500010967254639), ('afwisselen_geluid', 0.8410688042640686), ('aanhouden_geluid', 0.8278935551643372), ('soort_geluid', 0.7436662316322327), ('bijgeluid', 0.7173642516136169), ('geluidseffect', 0.6938502192497253), ('aërodynamisch', 0.691351056098938), ('omgevingsgeluid', 0.6800779104232788)]

-----
 chemisch_afval
2713 [('chemisch_behandeling_afval', 0.96562659740448), ('organisch_afval', 0.9564237594604492), ('industrieel_afval',

2733 [('gasvormig', 0.7374085187911987), ('gasvorming', 0.6740580797195435), ('gasvolume', 0.6497839689254761), ('waterstofgas', 0.6379189491271973), ('waterdamp', 0.6161189079284668), ('gasmengsel', 0.5997616648674011), ('stikstofgas', 0.5910509824752808), ('koolzuurgas', 0.5862507224082947), ('methaan', 0.5845259428024292), ('ethaan', 0.5833307504653931)]

-----
 elektrisch_leiding
2734 [('leiding', 0.8454104661941528), ('elektrisch', 0.7678183317184448), ('elektrisch_stroom', 0.759421706199646), ('elektrisch_batterij', 0.6879621744155884), ('pijp_leiding', 0.6816517114639282), ('gevaarlijk_installatie', 0.6751153469085693), ('chemisch_installatie', 0.6737299561500549), ('veiligheid_installatie', 0.6721792221069336), ('electrisch', 0.6639415621757507), ('elektrotechnisch_apparatuur', 0.661234974861145)]

-----
 administratief_rechtsgebied
2735 [('rechtsgebied', 0.868837833404541), ('administratief', 0.8287262320518494), ('administratief_rechter', 0.8008579015731812), ('administratief

2754 [('ontzwaveling', 0.6584932804107666), ('zwavelwaterstof', 0.6511011123657227), ('sulfide', 0.6409571170806885), ('ontzwaveling_brandstof', 0.6257189512252808), ('sulfaat', 0.61518794298172), ('fosfor', 0.610405683517456), ('zwavelverbinding', 0.609318733215332), ('zwaveligzuur', 0.6042600870132446), ('organisch_zwavelverbinding', 0.5976977348327637), ('zwavelbron', 0.5964720845222473)]

-----
 woestijnsprinkhaan
2755 [('sprinkhaan', 0.7298381328582764), ('treksprinkhaan', 0.7184220552444458), ('sprinkhaanzang', 0.6712678670883179), ('sabelsprinkhaan', 0.6491876244544983), ('bidsprinkhaan', 0.6110661029815674), ('waterschorpioen', 0.5826008915901184), ('veldkrekel', 0.5729420185089111), ('woestijnplant', 0.5663695931434631), ('bosmier', 0.5636321306228638), ('mierenkrekel', 0.5535441040992737)]

-----
 zuidelijk_atlantisch_oceaan
2756 [('noordatlantisch_oceaan', 0.9098338484764099), ('antarctisch_oceaan', 0.8591857552528381), ('oceaan', 0.8572158813476562), ('arctisch_oceaan', 0.8

2774 [('documentaireprogramma', 0.6915808916091919), ('cinematografisch_film', 0.6763379573822021), ('film', 0.6731202006340027), ('docu', 0.6607040166854858), ('filmdocumentaire', 0.6528844833374023), ('documentairefilm', 0.6509394645690918), ('documentaireserie', 0.6423976421356201), ('televisiedocumentaire', 0.6308682560920715), ('radiodocumentaire', 0.6286914944648743), ('speelfilm', 0.6251869201660156)]

-----
 provincie
2775 [('provinci', 0.8024417161941528), ('provinciale', 0.6917470693588257), ('provinciaal', 0.6638657450675964), ('gedeputeerde', 0.6585150361061096), ('milieubeleid_gemeente', 0.6399368643760681), ('provinciehoofdstad', 0.6370338201522827), ('gewest', 0.6282989978790283), ('natuurreservaat_staat', 0.6251311898231506), ('gemeente', 0.6152760982513428), ('provincieraad', 0.6145875453948975)]

-----
 element_groep_vii
2776 [('element_groep_iii', 0.8685977458953857), ('vii', 0.8574926853179932), ('element_groep_iv', 0.8328762054443359), ('element_groep_ii_aardalkali

2794 [('toxiciteit', 0.7732617855072021), ('vissen', 0.7627431750297546), ('giftigheid_bestrijdingsmiddel', 0.6483475565910339), ('giftigheid', 0.647988498210907), ('genotoxiciteit', 0.6350895166397095), ('vervuiling_giftig_stof', 0.6294831037521362), ('vis', 0.6270150542259216), ('vangst', 0.6242884993553162), ('trekken_vis', 0.6230350136756897), ('bodemvis', 0.619166910648346)]

-----
 zwaveloxide
2795 [('zwavelwaterstof', 0.7254452705383301), ('chloorkoolwaterstoff', 0.6665096879005432), ('metaaloxide', 0.6631580591201782), ('stikstofoxide', 0.6605711579322815), ('joodmethaan', 0.6548646688461304), ('ijzeroxide', 0.6510554552078247), ('stikstofdioxid', 0.6460671424865723), ('sulfide', 0.6440020799636841), ('ijzerchloride', 0.6407850384712219), ('fluorkoolwaterstof', 0.6393048763275146)]

-----
 flatgebouw
2796 [('appartementengebouw', 0.7381027936935425), ('appartementsgebouw', 0.7359116673469543), ('appartementencomplex', 0.730400800704956), ('woonflat', 0.7196559906005859), ('kant

2814 [('keramiek', 0.7269424200057983), ('glazuren', 0.6650963425636292), ('porselein', 0.6470315456390381), ('aardewerkfabriek', 0.6220593452453613), ('majolica', 0.6170622110366821), ('ceramiek', 0.6163318157196045), ('pottenbakkerij', 0.6145777702331543), ('pottenbakken', 0.6034939885139465), ('vaas', 0.6009492874145508), ('porcelein', 0.5993097424507141)]

-----
 wereldstad
2815 [('metropool', 0.7192369699478149), ('hoofdstad', 0.6334811449050903), ('kunststad', 0.6294984817504883), ('grootstad', 0.6276655197143555), ('stad', 0.6105190515518188), ('miljoenenstad', 0.5977360010147095), ('lichtstad', 0.5819495320320129), ('wereldster', 0.5817148685455322), ('havenstad', 0.5739457607269287), ('binnenstad', 0.5715197920799255)]

-----
 bedreigen_soort
2816 [('kwetsbaar_soort', 0.8959853649139404), ('verdwijnen_soort', 0.8768795132637024), ('soort', 0.8690626621246338), ('zeldzaam_soort', 0.8686816096305847), ('soort_aanpassingsvermogen', 0.8573847413063049), ('soort_milieuverontreinigi

2836 [('oxidatie', 0.8952078223228455), ('reductie', 0.8064131736755371), ('chemisch_reductie', 0.7895184755325317), ('oxidatief', 0.7737773656845093), ('oxidatieproces', 0.725266695022583), ('oxydatie', 0.678734540939331), ('oxidatiemiddel', 0.6760396957397461), ('fotochemisch_oxidant', 0.672721266746521), ('reductief', 0.6578918695449829), ('nitrering', 0.6540056467056274)]

-----
 band
2837 [('oud_band', 0.7886373996734619), ('binnenband', 0.5937779545783997), ('rockband', 0.5915549993515015), ('beatband', 0.5755645632743835), ('buitenband', 0.5736225247383118), ('bandenlichter', 0.5698873996734619), ('motorband', 0.5688069462776184), ('runflat', 0.5685453414916992), ('popband', 0.5640957951545715), ('rocker', 0.5634830594062805)]

-----
 vis_be_stand
2838 [('be', 0.9273239374160767), ('reden_be_zorg_dheid', 0.8875219821929932), ('to', 0.6928209066390991), ('ll', 0.6584347486495972), ('go', 0.6349014043807983), ('so', 0.6253920197486877), ('tweede_kamer_nl', 0.6156363487243652), ('n

2857 [('federaal_overheid', 0.8973678350448608), ('federaal', 0.8950955867767334), ('regering', 0.875378429889679), ('centraal_regering', 0.828299880027771), ('regering_kabinet', 0.8182483315467834), ('regering_grondgebied', 0.8180661201477051), ('federale', 0.7311086654663086), ('gewestregering', 0.6905166506767273), ('overheidsdienst', 0.6842063665390015), ('nationaal_wetgeving', 0.6821515560150146)]

-----
 minderheid
2858 [('minderheidsgroep', 0.7623423337936401), ('minderheidsgroepering', 0.7136769890785217), ('meerderheid', 0.6751770377159119), ('minderheidstaal', 0.6541991233825684), ('bevolkingsgroep', 0.6116925477981567), ('volksgroep', 0.5774822235107422), ('minderhedenbeleid', 0.5667810440063477), ('migrantengroep', 0.558295726776123), ('etnisch', 0.5503411293029785), ('bevordering_volk_gezondheid', 0.5409137606620789)]

-----
 element_groep_vi
2859 [('vi', 0.9389303922653198), ('element_groep_iv', 0.7391730546951294), ('element_groep_vii', 0.7308146953582764), ('element_gro

2879 [('rechtvleugelig', 0.8068673610687256), ('halfvleugeligen', 0.7620117664337158), ('kortvleugelig', 0.7043436765670776), ('halfvleugelig', 0.6320253610610962), ('grootvleugeligen', 0.6199826002120972), ('schubvleugelig', 0.6061325073242188), ('tweevleugeligen', 0.5702332258224487), ('vliesvleugelige', 0.5649616718292236), ('tweevleugeligen_insect', 0.5610658526420593), ('langvleugelig', 0.5396618247032166)]

-----
 brandstofadditief
2880 [('ontzwaveling_brandstof', 0.6751823425292969), ('voedingsadditief', 0.6646550893783569), ('additief', 0.6611677408218384), ('voedseladditief', 0.6475213170051575), ('motorbrandstof', 0.6254825592041016), ('vervuilen_brandstof', 0.6248958110809326), ('loodvrij_benzine', 0.6038520932197571), ('koolwaterstof', 0.5984386205673218), ('brandstof', 0.5920118093490601), ('denitrificatie_afvalgas', 0.5916500091552734)]

-----
 kreeftachtigen
2881 [('weekdier', 0.6456988453865051), ('neteldier', 0.5830190181732178), ('sponsdier', 0.5793018341064453), ('ma

2901 [('terrasvergunning', 0.6869556307792664), ('natuurvergunning', 0.6601287126541138), ('vestigingsvergunning', 0.656798243522644), ('winningsvergunning', 0.6495310068130493), ('watervergunning', 0.6468561291694641), ('arbeidsvergunning', 0.6395453214645386), ('exploitatievergunning', 0.6370619535446167), ('huisvestingsvergunning', 0.6369038224220276), ('leveringsvergunning', 0.6273987889289856), ('jachtvergunning', 0.6268895268440247)]

-----
 schoonmaakbedrijf
2902 [('glazenwassersbedrijf', 0.7268545627593994), ('schoonmaakdienst', 0.6881624460220337), ('glazenwasserij', 0.6823446154594421), ('schoonmaak', 0.6771342158317566), ('bedrijfsdienst', 0.6753056645393372), ('schildersbedrijf', 0.674373984336853), ('onderhoudsbedrijf', 0.670406699180603), ('aannemersbedrijf', 0.667298436164856), ('loodgietersbedrijf', 0.6616120934486389), ('schoonmaakbranch', 0.6453908085823059)]

-----
 zuurstofgehalte
2903 [('zuurstofverbruik', 0.7561945915222168), ('zuurstofconcentratie', 0.74438261985

2924 [('oud', 0.817252516746521), ('band', 0.7886373996734619), ('oud_papier', 0.7804031372070312), ('oud_afzetting', 0.7739816904067993), ('oud_installatie', 0.7736215591430664), ('aanbrengen_nieuw_onderdeel_oud_model', 0.766822338104248), ('herstel_oud_installatie', 0.689675509929657), ('nieuw_gemeenschap', 0.6587331891059875), ('jong', 0.640019416809082), ('nieuw_materiaal', 0.635179877281189)]

-----
 mijnbouw_geologie
2925 [('mijnbouw', 0.9034810662269592), ('landschap_mijnbouw', 0.8953226208686829), ('mijnbouw_technologie', 0.8763570785522461), ('geologie', 0.8513367176055908), ('aardolie_geologie', 0.809978723526001), ('mijnbouwkunde', 0.7346254587173462), ('marien_geologie', 0.7266718745231628), ('mijnbouw_gas_oliewinning_zee', 0.7154881954193115), ('mijnbouwkundig', 0.6837361454963684), ('geologisch', 0.6736272573471069)]

-----
 milieuonvriendelijk_bedrijf
2926 [('milieubescherming_bedrijf', 0.8580864667892456), ('bedrijf', 0.8554716110229492), ('milieuonvriendelijk', 0.74777

2944 [('wet_natuurlijk_onafhankelijkheid', 0.8999261856079102), ('bijzonder_wet', 0.8949635028839111), ('reguleren_wet', 0.8874571323394775), ('wet', 0.8766840696334839), ('harmonisatie_wet', 0.8722348213195801), ('financieel_wet', 0.8645983934402466), ('wet_gevaarlijk_goed', 0.8626840114593506), ('wet_chemicaliën', 0.860884964466095), ('wet_europees_gemeenschap', 0.8548057079315186), ('leer_wet', 0.8512502908706665)]

-----
 naaldbos
2945 [('loofbos', 0.7361613512039185), ('naaldboom', 0.7019757032394409), ('dennenbos', 0.6937978863716125), ('populierenbos', 0.6707288026809692), ('eikenbos', 0.6702008247375488), ('struweel', 0.6423215866088867), ('heidevegetatie', 0.6419003009796143), ('broekbos', 0.6386715173721313), ('productiebos', 0.6365455985069275), ('bosgebied', 0.6330796480178833)]

-----
 verkeersongeval
2946 [('ongeval', 0.8276969194412231), ('verkeersongeluk', 0.8074540495872498), ('arbeidsongeval', 0.7484336495399475), ('bedrijfsongeval', 0.7464434504508972), ('verkeersonv

2965 [('verwijdering_verontreinigen_stof', 0.8942292332649231), ('verontreinigen_stof', 0.8922366499900818), ('verdeling_verontreinigen_stof', 0.8857505321502686), ('vrijkom_verontreinigen_stof', 0.884966254234314), ('opstapeling_verontreinigen_stof', 0.884488582611084), ('blootstelling_verontreinigen_stof', 0.8829986453056335), ('analyse_verontreinigen_stof', 0.8796385526657104), ('inschatting_verontreinigen_stof', 0.8788155317306519), ('immissie_verontreinigen_stof', 0.8747389912605286), ('binding_verontreinigen_stof', 0.8742138147354126)]

-----
 zoutmoeras
2966 [('rietmoeras', 0.6328552961349487), ('zoetwatermoeras', 0.6312750577926636), ('moerasland', 0.6245123147964478), ('zoutmeer', 0.6137385368347168), ('zoutwatermeer', 0.5908815860748291), ('zoetwatermeer', 0.587619423866272), ('watergebied', 0.5837730169296265), ('kustvlakte', 0.560936689376831), ('moeras', 0.559745192527771), ('veenmoeras', 0.5591139793395996)]

-----
 voortplanting_plant
2967 [('plant', 0.9151591062545776),

2986 [('oud_papier', 0.7815214991569519), ('karton', 0.6975041031837463), ('pakpapier', 0.6819679737091064), ('papierbak', 0.6689648628234863), ('krantenpapier', 0.6677197217941284), ('kopieerpapier', 0.6585662961006165), ('papierblokk', 0.6560602784156799), ('printpapier', 0.6557064056396484), ('papiersoort', 0.6549029350280762), ('papierafval', 0.6452826261520386)]

-----
 beroep
2987 [('beroep_gezondheidszorg', 0.9551594257354736), ('administratief_beroep', 0.9453252553939819), ('beroepsactiviteit', 0.6873352527618408), ('beroeps', 0.684528112411499), ('beroepsuitoefening', 0.6726939678192139), ('hoofdberoep', 0.6636003255844116), ('beroepsprofiel', 0.6603670120239258), ('beroepsvorming', 0.6562830209732056), ('bijberoep', 0.6476291418075562), ('beroepenveld', 0.6441326141357422)]

-----
 stropen
2988 [('opstropen', 0.818831741809845), ('afstropen', 0.8183166980743408), ('strooptocht', 0.6096166372299194), ('steken', 0.5894619226455688), ('jagen', 0.5620566606521606), ('bejagen', 0.

3007 [('mondgezondheid', 0.5958962440490723), ('kankerpreventie', 0.5884366631507874), ('legionellapreventie', 0.5818707346916199), ('schuldpreventie', 0.5774492621421814), ('gezondheidsvoorlichting', 0.5765279531478882), ('rookwaren', 0.5758658647537231), ('rookbeleid', 0.5744516253471375), ('industrieel_rook', 0.5723704695701599), ('rook_binnenruimte', 0.570318341255188), ('meerok', 0.5688670873641968)]

-----
 nucleair_installatie
3008 [('nucleair', 0.9008734226226807), ('nucleair_veiligheid', 0.889541745185852), ('nucleair_onderzoekscentrum', 0.8741986155509949), ('conventioneel_nucleair_energie', 0.8722131252288818), ('nucleair_gevaar', 0.8087778091430664), ('chemisch_installatie', 0.7768466472625732), ('industrieel_installatie', 0.7469900250434875), ('gevaarlijk_installatie', 0.7406200170516968), ('veiligheid_installatie', 0.7367856502532959), ('installatie', 0.6994259357452393)]

-----
 elektrisch_stroom
3009 [('stroom', 0.8886124491691589), ('elektrisch', 0.791275680065155), ('

3028 [('mozaïekvloer', 0.6984217166900635), ('glasmozaïek', 0.6378488540649414), ('mozaiek', 0.5992207527160645), ('mozaik', 0.595274031162262), ('vloermozaïek', 0.5778976678848267), ('reliëf', 0.5150045156478882), ('marmer', 0.5131824016571045), ('muurschildering', 0.5127285718917847), ('keramiek', 0.5075987577438354), ('kunstwerk', 0.5056779384613037)]

-----
 radioactief_ontsmetting
3029 [('chemisch_ontsmetting', 0.8562712669372559), ('radioactief_besmetting', 0.8523780107498169), ('ontsmetting', 0.8404159545898438), ('radioactief', 0.8053552508354187), ('opsporingstechniek_radioactief_straling', 0.7695364952087402), ('ontsmettingsmiddel', 0.7464911341667175), ('radioactief_afvalstortplaat', 0.742443323135376), ('bacteriologisch_verontreiniging', 0.7225797772407532), ('ontsmetten', 0.7160269021987915), ('radioactiviteit', 0.7122654914855957)]

-----
 biofilter
3030 [('biofilm', 0.7150652408599854), ('koolfilter', 0.7003637552261353), ('waterfilter', 0.6422807574272156), ('zandfilter

3048 [('skiën', 0.8205822110176086), ('wintersport', 0.703371524810791), ('ski', 0.6942691802978516), ('skier', 0.6685654520988464), ('wintersporter', 0.662545919418335), ('skiër', 0.6582392454147339), ('skivakantie', 0.6454005241394043), ('skie', 0.6238177418708801), ('skisport', 0.6221365332603455), ('skitocht', 0.6182096004486084)]

-----
 tornado
3049 [('windhoos', 0.6340324282646179), ('cyclone', 0.5581755042076111), ('hagelstorm', 0.5377349853515625), ('onweersbui', 0.5221923589706421), ('cycloon', 0.5199009776115417), ('hurricane', 0.519454300403595), ('windstoot', 0.5161348581314087), ('thunderstorm', 0.5139421224594116), ('storm', 0.5117982625961304), ('wervelwind', 0.5107743740081787)]

-----
 uitwisseling_gegeven
3050 [('uitwisseling_elektronisch_gegeven', 0.9441479444503784), ('gegeven', 0.9115574359893799), ('controleren_gegeven', 0.8580576181411743), ('statistisch_gegeven', 0.834540605545044), ('informatie_uitwisseling', 0.8132371306419373), ('gegeven_geografisch_componen

3070 [('fiction', 0.5286128520965576), ('houtpulp', 0.4905359745025635), ('pulper', 0.48847702145576477), ('scifi', 0.46379876136779785), ('novel', 0.46254900097846985), ('comic', 0.4574715495109558), ('serial', 0.45637521147727966), ('pulpit', 0.4539870321750641), ('plastic', 0.45257169008255005), ('trash', 0.4491017162799835)]

-----
 kaart_brengen_korstmos
3071 [('kaart', 0.7480514645576477), ('wand_kaart', 0.6845412254333496), ('brengen', 0.650658130645752), ('korstmos', 0.6425708532333374), ('aandoening_milieu_maken', 0.63892662525177), ('leefomgeving_wild_leven_plant_dier', 0.6265209913253784), ('behoud_wild_leven_plant_dier', 0.6263402700424194), ('gevaar_brengen_grondwater', 0.6159131526947021), ('herstel_wild_leven_plant_dier', 0.6158494353294373), ('bos_schadelijk_dier_plant', 0.6142870187759399)]

-----
 controleren_instantie
3072 [('instantie', 0.890326738357544), ('controleren', 0.801828145980835), ('controleren_gegeven', 0.7309851050376892), ('openbaar_administratief_inst

3091 [('noodplan', 0.7185063362121582), ('noodplanning', 0.6702150702476501), ('rampbestrijdingsplan', 0.6682554483413696), ('interventieplan', 0.6520727872848511), ('evacuatieplan', 0.6337143182754517), ('rampenbestrijding', 0.6223195195198059), ('calamiteitenplan', 0.6128690242767334), ('rampenpreventie', 0.610063910484314), ('veiligheidsplan', 0.6050030589103699), ('ramp_bestrijdings_dienst', 0.5902159810066223)]

-----
 berghut
3092 [('bergtop', 0.5859549641609192), ('berghotel', 0.5809684991836548), ('rifugio', 0.5708485841751099), ('vakantieoord_berg', 0.5486236810684204), ('tirol', 0.5476517677307129), ('hut', 0.5382667779922485), ('bergpas', 0.5371002554893494), ('alpenverein', 0.537011981010437), ('kungsled', 0.5355647802352905), ('skidorp', 0.5341008305549622)]

-----
 vissterfen
3093 [('visstand', 0.6315962076187134), ('watervervuiling', 0.607399582862854), ('eutrofiëring', 0.6028363704681396), ('blauwalg', 0.5901892185211182), ('vispopulatie', 0.5853219032287598), ('waterst

3113 [('hoofdbestemming', 0.6373395919799805), ('reisbestemming', 0.6363034844398499), ('topbestemmingen', 0.6122266054153442), ('zonbestemming', 0.5989251136779785), ('herbestemming', 0.597831130027771), ('resultaatbestemming', 0.5830574035644531), ('bestemmingsomschrijving', 0.5798941850662231), ('eindbestemming', 0.5750784873962402), ('toeristisch_route', 0.5702115893363953), ('bestemm', 0.548847496509552)]

-----
 zuurstof
3114 [('oplossen_zuurstof', 0.8455855846405029), ('zuurstofgas', 0.6816086769104004), ('anaëroob_behandeling', 0.6271862387657166), ('dizuurstof', 0.6246926784515381), ('zuurstoftherapie', 0.6203042268753052), ('vloeistof', 0.614507794380188), ('aëroob_behandeling', 0.6117449402809143), ('ingeademde_lucht', 0.6088038682937622), ('stikstof', 0.6019790172576904), ('zuurstofconcentratie', 0.5973067879676819)]

-----
 olielozing
3115 [('lozing', 0.7177197337150574), ('lozing_scheepsafval', 0.7145704030990601), ('olievervuiling', 0.6538388729095459), ('ondergronds_loz

3133 [('esthetiek', 0.6836147904396057), ('esthetisch', 0.6119343042373657), ('estheticisme', 0.6030926704406738), ('aesthetic', 0.5597721338272095), ('poetica', 0.548224151134491), ('kunstfilosofie', 0.539337158203125), ('kunsttheorie', 0.5179666876792908), ('cultuurfilosofie', 0.5121797323226929), ('ecologie_onderdeel_sociologie', 0.5113028287887573), ('poëtica', 0.5106418132781982)]

-----
 uitrusting_beheersing_milieuverontreiniging
3134 [('beheersing_milieuverontreiniging', 0.907325267791748), ('investering_beheersing_milieuverontreiniging', 0.889137864112854), ('uitrusting_bestrijding_milieuverontreiniging', 0.8627009987831116), ('beheersing', 0.8441606760025024), ('beheersing_woestijnvorming', 0.8081268668174744), ('beheersing_verkeerslawaai', 0.7859758734703064), ('uitrusting', 0.750636100769043), ('technologie_bestrijding_milieuverontreiniging', 0.724927544593811), ('industrieel_uitrusting', 0.719935417175293), ('maatregel_bestrijding_milieuverontreiniging', 0.719733715057373)

3154 [('bestrijding_milieu_verontreiniging', 0.855613112449646), ('milieu_informatiesysteem', 0.8390892744064331), ('milieu_informatie', 0.8361897468566895), ('chemicaliën_milieu', 0.8342492580413818), ('werkgelegenheid_milieu', 0.8320763111114502), ('milieu_informatienetwerk', 0.8319985866546631), ('milieu', 0.8311202526092529), ('milieu_ontwikkeling', 0.8289796710014343), ('milieu_indicator', 0.8212489485740662), ('milieu_evenwicht', 0.8203380107879639)]

-----
 oceaancirculatie
3155 [('oceaanstroming', 0.6935303211212158), ('arctisch_oceaan', 0.5976106524467468), ('oceaanwater', 0.5940200090408325), ('zeestroom', 0.5907816290855408), ('antarctisch_oceaan', 0.5871506333351135), ('oceaan', 0.5856714248657227), ('noordatlantisch_oceaan', 0.5794135332107544), ('exploitatie_oceaan', 0.5776848793029785), ('grensvlak_oceaanwater_lucht', 0.5772587060928345), ('zeestroming', 0.5631190538406372)]

-----
 oversteekplaats
3156 [('voetgangersoversteekplaats', 0.7619184851646423), ('invalsweg', 0

3173 [('wijze', 0.8237875699996948), ('wijze_voortplanting', 0.7949663400650024), ('waarop', 0.7665746212005615), ('controleren_gegeven', 0.7665137052536011), ('uitwisseling_gegeven', 0.7192654609680176), ('gegeven', 0.7184110879898071), ('uitwisseling_elektronisch_gegeven', 0.7136915326118469), ('statistisch_gegeven', 0.6779595613479614), ('gebied_meerdere_doeleinde_gebruiken', 0.6599860787391663), ('selectief_verspreiding_informatie', 0.6592632532119751)]

-----
 patroonherkenning
3174 [('visualisering', 0.4855796694755554), ('gezichtsherkenning', 0.4850448668003082), ('handschriftherkenning', 0.4771476686000824), ('woordherkenning', 0.4754127860069275), ('beeldanalyse', 0.4733433723449707), ('herkenning', 0.47182607650756836), ('selectiemethode', 0.4714638888835907), ('representatie', 0.4615105390548706), ('systeembenadering', 0.46138131618499756), ('datavisualisatie', 0.460375040769577)]

-----
 beschikking
3175 [('ontwerpbeschikking', 0.6982319355010986), ('uitvoeringsbeschikking'

3199 [('proteïne', 0.8130274415016174), ('koolhydraat', 0.7210538983345032), ('voedingsstof', 0.6939682960510254), ('aminozuur', 0.6908390522003174), ('eiwitpoeder', 0.6870644092559814), ('protein', 0.6752197742462158), ('glutamine', 0.649769127368927), ('eiwitrijk', 0.6481495499610901), ('proteine', 0.644170880317688), ('peptide', 0.6424964070320129)]

-----
 gerechtelijk_vervolging
3200 [('gerechtelijk', 0.8649067878723145), ('vervolging', 0.8521528244018555), ('gerechtelijk_handeling', 0.8269674181938171), ('strafrechtelijk', 0.7504478096961975), ('rechterlijk', 0.733624279499054), ('administratief_rechter', 0.7093846201896667), ('strafrechtelijk_procedure', 0.704727828502655), ('buitengerechtelijk', 0.6894959211349487), ('strafrechtelijk_aansprakelijkheid', 0.6730936765670776), ('rechtvaardiging_administratief_handeling', 0.6675689220428467)]

-----
 cytotoxiciteit
3201 [('hepatotoxiciteit', 0.8215468525886536), ('genotoxiciteit', 0.8202567100524902), ('neurotoxiciteit', 0.80541700

3218 [('zandbank', 0.6980727910995483), ('kwelder', 0.6485581398010254), ('duinvallei', 0.6150058507919312), ('kweldergras_begroeien_kwelder', 0.6106692552566528), ('stroomgeul', 0.6096353530883789), ('getijdengeul', 0.6055278778076172), ('werkeiland', 0.6044251918792725), ('vaargeul', 0.5949854850769043), ('strekdam', 0.5835866928100586), ('veenpolder', 0.5778545141220093)]

-----
 coulisselandschap
3219 [('coulisse', 0.6306101679801941), ('beekdallandschap', 0.615230143070221), ('heuvellandschap', 0.6008734107017517), ('weidelandschap', 0.5853976011276245), ('zandlandschap', 0.5841668844223022), ('rivierenlandschap', 0.5804954767227173), ('heidelandschap', 0.5802056193351746), ('polderlandschap', 0.5681338310241699), ('natuurlandschap', 0.5679405927658081), ('boslandschap', 0.5586801767349243)]

-----
 ruimte_afval
3220 [('hoeveelheid_afval', 0.9031223058700562), ('uitwisseling_afval', 0.9028955101966858), ('samenstelling_afval', 0.9024813175201416), ('hergebruik_afval', 0.8998512029

3245 [('buitenberging', 0.7717894315719604), ('kelderberging', 0.7570415735244751), ('fietsenberging', 0.7367459535598755), ('skiberging', 0.6872127056121826), ('bergruimte', 0.684401273727417), ('tuinberging', 0.6670304536819458), ('opberging', 0.6614229679107666), ('bergzolder', 0.6287393569946289), ('opberging_land', 0.619324803352356), ('bergingsbedrijf', 0.6079151630401611)]

-----
 magnetisme
3246 [('elektromagnetisme', 0.7495142221450806), ('magnetisch', 0.6611770391464233), ('magneetveld', 0.6582900285720825), ('magnetism', 0.6455291509628296), ('paleomagnetisme', 0.6369513869285583), ('magnetiseren', 0.6159335374832153), ('magnetisering', 0.613012433052063), ('zwaartekracht', 0.5948323011398315), ('elektrodynamica', 0.5825018286705017), ('fysica', 0.5789058208465576)]

-----
 blootstelling_verontreinigen_stof
3247 [('verontreinigen_stof', 0.9604170918464661), ('verwijdering_verontreinigen_stof', 0.9451774954795837), ('inschatting_verontreinigen_stof', 0.9387137293815613), ('im

3264 [('verpakkingsafval', 0.7654460668563843), ('restafval', 0.7480502128601074), ('bedrijfsafval', 0.7447491884231567), ('ziekenhuisafval', 0.7280475497245789), ('anorganisch_afval', 0.7268792390823364), ('industrieel_afval', 0.7258223295211792), ('samenstelling_afval', 0.7240030765533447), ('afval', 0.7221247553825378), ('industrie_afval', 0.7216047048568726), ('vloeibaar_afval', 0.7211999297142029)]

-----
 storten_afval_bodem
3265 [('storten_afval', 0.930231511592865), ('storten_afval_zeebodem', 0.9268364906311035), ('organisch_afval', 0.8722504377365112), ('hoeveelheid_afval', 0.8628324866294861), ('bijzonder_afval', 0.8594508767127991), ('samenstelling_afval', 0.8573216199874878), ('vloeibaar_afval', 0.8559969663619995), ('plantaardig_afval', 0.8545757532119751), ('stortplaats_gevaarlijk_afval', 0.8527387380599976), ('afval', 0.849147617816925)]

-----
 inspraak
3266 [('inspraakreactie', 0.6154358386993408), ('insprek', 0.6059349179267883), ('inspraakorgaan', 0.5941476821899414)

3283 [('aarde', 0.8093780279159546), ('zon', 0.7955453395843506), ('natuurlijk_rijkdom_zee', 0.6827278137207031), ('verhouding_mens_natuur', 0.6711499691009521), ('planeet', 0.6598678827285767), ('land_afkomstig_vervuiling_zee', 0.654280424118042), ('maan', 0.6529116034507751), ('ecosysteem_koud_gebied', 0.6486786007881165), ('zonn_energie', 0.6456030607223511), ('warmt_energie_zee', 0.6434398293495178)]

-----
 taxonomie
3284 [('organisme_taxonomie', 0.9077293276786804), ('taxonomisch', 0.7800048589706421), ('taxonoom', 0.7487367987632751), ('taxonomy', 0.7098441123962402), ('syntaxonomie', 0.6346185207366943), ('fylogenie', 0.6083413362503052), ('taxonomic', 0.5959041118621826), ('systematiek', 0.5657116174697876), ('taxon', 0.5578020811080933), ('cladistiek', 0.5473272204399109)]

-----
 schuilplaats
3285 [('tijdelijk_schuilplaats', 0.7887433767318726), ('beschutting', 0.6107819676399231), ('groepsschuilplaats', 0.5966919660568237), ('schuilkelder', 0.5919564962387085), ('schuilkeld

3307 [('elektriciteitscentral', 1.0), ('electriciteitscentrale', 0.8645786046981812), ('elektriciteitsbedrijf', 0.7363132238388062), ('onderbelasting_elektriciteitscentral', 0.73615962266922), ('energiecentrale', 0.7028127312660217), ('steenkoolcentrale', 0.6684892177581787), ('elektriciteitsopwekking', 0.6588646173477173), ('gascentrale', 0.6579127311706543), ('elektriciteitsvoorziening', 0.6561300158500671), ('gascentral', 0.6554034948348999)]

-----
 stroom
3308 [('elektrisch_stroom', 0.8886124491691589), ('stedelijk_stroom_hulpbron', 0.7647786736488342), ('stromen_water', 0.7218868732452393), ('stromen', 0.7116028070449829), ('stroom_verontreinigen_stof', 0.7058969736099243), ('afvoer_overstromen_water', 0.6463441848754883), ('overblijven_hoeveelheid_water', 0.6195611357688904), ('waterstroom', 0.6104698181152344), ('aftapp_ondergronds_water', 0.6093267202377319), ('gebruiken_water', 0.6023144125938416)]

-----
 boren
3309 [('olie_boren', 0.7488957643508911), ('boor', 0.65388464927

3336 [('bosker', 0.6192785501480103), ('baars', 0.5953615307807922), ('beren', 0.5814744234085083), ('leij', 0.5780917406082153), ('wiert', 0.5715229511260986), ('sloot', 0.5680834054946899), ('schult', 0.5657957792282104), ('water_rijk_rotten_organisch_materiaal', 0.5653824806213379), ('bos_schadelijk_dier_plant', 0.560256838798523), ('kuinder', 0.5596691370010376)]

-----
 elders
3337 [('nergens', 0.5419546365737915), ('ergens', 0.5318670868873596), ('buiten', 0.4968785345554352), ('verderop', 0.49678564071655273), ('elder', 0.49358516931533813), ('hier', 0.4901849031448364), ('daarover', 0.4863717555999756), ('wellicht', 0.47930821776390076), ('zelfs', 0.47784629464149475), ('oud_afzetting', 0.4646334648132324)]

-----
 gerechtigheid
3338 [('rechtvaardigheid', 0.7644906640052795), ('rechtvaardiging', 0.6331056356430054), ('handhaving_vrede', 0.6305777430534363), ('rechtvaardig', 0.629615306854248), ('rechten', 0.6147030591964722), ('gerechtelijk_vervolging', 0.6088112592697144), ('v

3356 [('uitvoer_gevaarlijk_afvalstof', 0.7992638349533081), ('uitvoer_gevaarlijk_chemicaliën', 0.7909033298492432), ('invoer', 0.7775495052337646), ('uitvoer_afval', 0.7106152772903442), ('uitvoeren', 0.5917493104934692), ('wederuitvoer', 0.5820438861846924), ('uitvoerder', 0.5819404721260071), ('importer', 0.5701634883880615), ('doorvoer', 0.5699777007102966), ('uitvoering', 0.5669535398483276)]

-----
 seleen
3357 [('jodium', 0.5659887790679932), ('bismut', 0.5596351623535156), ('mangaan', 0.5560073852539062), ('selenium', 0.5558618307113647), ('borium', 0.5391354560852051), ('telluur', 0.5374655723571777), ('magnesium', 0.5353060960769653), ('indium', 0.5326361060142517), ('rodium', 0.5312685370445251), ('jodide', 0.5309914350509644)]

-----
 kennis_hart_vaatziekte
3358 [('hart_vaatziekte', 0.9333676695823669), ('hart', 0.8316582441329956), ('hart_bloedvat', 0.7968254685401917), ('vaatziekte', 0.7408258318901062), ('kennis', 0.6967890858650208), ('harten', 0.6967883110046387), ('ver

3378 [('beeldwoordenboek', 0.7910447120666504), ('zakwoordenboek', 0.7832039594650269), ('woordenlijst', 0.7770475149154663), ('handwoordenboek', 0.774302065372467), ('rijmwoordenboek', 0.7430520057678223), ('vertaalwoordenboek', 0.7097526788711548), ('lexicon', 0.6919568777084351), ('antwoordenboek', 0.6713077425956726), ('puzzelwoordenboek', 0.645146906375885), ('woord', 0.6403735280036926)]

-----
 vertegenwoordiging
3379 [('vertegenwoordiger', 0.7703374624252319), ('vertegenwoordig', 0.7122362852096558), ('vertegenwoordigen', 0.6904004812240601), ('afvaardiging', 0.6574827432632446), ('delegatie', 0.6492824554443359), ('vertegenwoordigingsbevoegdheid', 0.644818902015686), ('personeelsvertegenwoordiging', 0.6437978148460388), ('sociaal_vertegenwoordiging', 0.622176468372345), ('procesvertegenwoordiging', 0.615212082862854), ('volksvertegenwoordiging', 0.6118621826171875)]

-----
 euratom
3380 [('ecofin', 0.5226969718933105), ('eurocontrol', 0.4745917320251465), ('lidstaat', 0.469165

3400 [('rijsnelheid', 0.7139676809310913), ('snelheidslimiet', 0.6908117532730103), ('snelheidsregeling', 0.6679700016975403), ('doorvoersnelheid', 0.6577049493789673), ('snelheidsverschil', 0.6548421382904053), ('snijsnelheid', 0.6524984836578369), ('maximumsnelheid', 0.648474931716919), ('snelheidscontrole', 0.6467752456665039), ('snelheidsverhoging', 0.6451879739761353), ('vaarsnelheid', 0.6385346055030823)]

-----
 varkenshouderij
3401 [('varkenshouder', 0.8534342050552368), ('pluimveehouderij', 0.8064398765563965), ('rundveehouderij', 0.7926069498062134), ('melkveehouderij', 0.7861994504928589), ('veehouderij', 0.7800025343894958), ('varkensbedrijf', 0.7772704362869263), ('vleesvarkenshouder', 0.7552363276481628), ('geitenhouderij', 0.7398935556411743), ('pluimveesector', 0.7184053659439087), ('varkensboer', 0.7022445201873779)]

-----
 standaardisering
3402 [('standaardisatie', 0.6943373680114746), ('standaardiseren', 0.68115234375), ('internationaal_standaardisatie', 0.647264659

3421 [('overbevolkt', 0.6223775744438171), ('bevolkingsgroei', 0.5978097319602966), ('bevolkingsexplosie', 0.5860949754714966), ('wereldbevolking', 0.5757900476455688), ('mens_veroorzaken_klimaatsverandering', 0.5702781081199646), ('geboortebeperking', 0.5514752864837646), ('voedseltekort', 0.5472927689552307), ('hongersnood', 0.5470517873764038), ('ontvolking', 0.5444293022155762), ('armoede', 0.5434918999671936)]

-----
 kampeerterrein
3422 [('natuurkampeerterrein', 0.796483039855957), ('natuurkampeerterreinen', 0.7676429748535156), ('kamperen', 0.7198195457458496), ('kampeerplaats', 0.7033300995826721), ('kampeerboerderij', 0.7001347541809082), ('recreatieterrein', 0.689258873462677), ('kampeerder', 0.6885531544685364), ('kampeerplek', 0.6793118119239807), ('caravanpark', 0.6533966064453125), ('evenemententerrein', 0.6431335806846619)]

-----
 herbruikbaarheid
3423 [('bruikbaarheid', 0.69049072265625), ('vervangbaarheid', 0.6640806198120117), ('verwerkbaarheid', 0.6610472202301025),

3442 [('molen', 0.7641062140464783), ('windturbine', 0.7572153210639954), ('windmolenpark', 0.7465917468070984), ('windpark', 0.6943659782409668), ('watermolen', 0.6850693821907043), ('poldermolen', 0.6681878566741943), ('weidemolen', 0.65007084608078), ('windenergi', 0.6497458219528198), ('windturbinepark', 0.6479511857032776), ('windenergie', 0.6462975740432739)]

-----
 kastanj
3443 [('kastanje', 0.722785234451294), ('kastanjeboom', 0.6416524648666382), ('kastanjehout', 0.6283633708953857), ('paardenkastanje', 0.6171501874923706), ('eik_boom', 0.5754740834236145), ('kastanjekleurig', 0.545615017414093), ('kastanjechampignon', 0.5454304218292236), ('eikenboom', 0.5400707721710205), ('populier', 0.5353984832763672), ('pijnboom', 0.5280844569206238)]

-----
 oplosbaarheid
3444 [('oplosbaar', 0.6861008405685425), ('mengbaarheid', 0.6130483746528625), ('viscositeit', 0.5970988273620605), ('dampdruk', 0.5913130044937134), ('onoplosbaar', 0.5876028537750244), ('smeltpunt', 0.54511845111846

3470 [('metaal', 0.8512933850288391), ('walsen', 0.8492989540100098), ('metaal_smelten', 0.8176387548446655), ('zwaar_metaal', 0.7987117171287537), ('gehalte_zwaar_metaal', 0.7623943090438843), ('giftig_metaal', 0.7620832324028015), ('staal', 0.7299279570579529), ('ijzer_staalindustrie', 0.7248145937919617), ('warmgewalste', 0.7037261724472046), ('metaal_slak_kennen', 0.6987001299858093)]

-----
 productidentificatie
3471 [('productidee', 0.6239845752716064), ('identificatie', 0.5800346732139587), ('produktnaam', 0.5047908425331116), ('authentificatie', 0.4892681837081909), ('preparaat', 0.4839633107185364), ('chemisch_technologie', 0.47385701537132263), ('chemisch_product', 0.47275692224502563), ('identification', 0.4702291488647461), ('chemisch_eigenschap', 0.458259642124176), ('base_chemisch_stof', 0.4572468101978302)]

-----
 vloeibaar_maken_gas
3472 [('onderzoek_uitstoten_gas', 0.8937116861343384), ('gas', 0.8883845806121826), ('behandeling_gas', 0.8878512382507324), ('biologisch_

3499 [('handelscontact', 0.676254391670227), ('handelspositie', 0.6242964863777161), ('concurrentiepositie', 0.6143871545791626), ('handelsovereenkomst', 0.6139734387397766), ('handelspartner', 0.6109133362770081), ('handelsgebied', 0.6078205108642578), ('handelsbetrekkingen', 0.5997819304466248), ('handelsreis', 0.5917414426803589), ('handelsverdrag', 0.5863858461380005), ('handelsbelang', 0.5789477825164795)]

-----
 vulkaan
3500 [('vulkanisch', 0.7014552354812622), ('vulkaanuitbarsting', 0.6922510266304016), ('vulkanisme', 0.6891149282455444), ('vulkaankrater', 0.6742131114006042), ('stratovulkaan', 0.671680212020874), ('schildvulkaan', 0.6709334850311279), ('uitbarsting', 0.6688487529754639), ('eruptie', 0.6530076265335083), ('vulkaaneiland', 0.6522390246391296), ('supervulkaan', 0.6491202116012573)]

-----
 onderwater_uitlaten
3501 [('uitlaten', 0.8231503963470459), ('onderwater', 0.6748732328414917), ('onderwat', 0.5676697492599487), ('rondzwemmen', 0.5360060930252075), ('duiken'

3519 [('inversie', 0.6834205389022827), ('atmosferisch_inversie', 0.6193770170211792), ('invers', 0.5347872972488403), ('omkering', 0.5047264099121094), ('draaiing', 0.4732292890548706), ('stratificatie_omkering_limnologie', 0.47252780199050903), ('optakeling', 0.45331013202667236), ('inversion', 0.4484696388244629), ('rotatie', 0.4418683648109436), ('hoofdzin', 0.4375849664211273)]

-----
 hergebruik_afval
3520 [('afval', 0.9602664709091187), ('uitwisseling_afval', 0.9530212879180908), ('samenstelling_afval', 0.9455267786979675), ('verwerking_afval', 0.9420474767684937), ('composteerbaar_afval', 0.9377061128616333), ('elektronisch_afval', 0.9375345706939697), ('hoeveelheid_afval', 0.9372692704200745), ('plantaardig_afval', 0.9345738291740417), ('industrieel_afval', 0.9331068396568298), ('bijzonder_afval', 0.9317367076873779)]

-----
 parlementair_verslag
3521 [('verslag', 0.9313468337059021), ('verslag_uitbrengen_minister', 0.8550893068313599), ('parlementair', 0.7373136878013611), ('

3539 [('infectie_parasitair_zuigworm', 0.7379693984985352), ('darmparasiet', 0.715842604637146), ('ectoparasiet', 0.6821264028549194), ('parasitair', 0.6651942729949951), ('broedparasiet', 0.6410716772079468), ('pathogeen_organisme', 0.6216082572937012), ('bacterie', 0.6159266233444214), ('malariaparasiet', 0.6114345788955688), ('parasitisme', 0.598498523235321), ('parasiteren', 0.596449613571167)]

-----
 controleren_gegeven
3540 [('gegeven', 0.9193198680877686), ('statistisch_gegeven', 0.861748993396759), ('uitwisseling_gegeven', 0.8580575585365295), ('uitwisseling_elektronisch_gegeven', 0.8346468210220337), ('economisch_gegeven', 0.8034665584564209), ('gegeven_geografisch_component', 0.7870188355445862), ('wijze_waarop_gegeven_vastleggen', 0.7665135860443115), ('controleren', 0.754633903503418), ('controleren_instantie', 0.7309851050376892), ('gegegeven', 0.7278367280960083)]

-----
 behoefte
3541 [('informatiebehoefte', 0.7090167999267578), ('basisbehoefte', 0.6872549057006836), ('

3560 [('luchtlaag', 0.5388514995574951), ('massabalans_ijslaag', 0.49963146448135376), ('luchtstroming', 0.49236926436424255), ('grenslijn', 0.48838260769844055), ('moslaag', 0.4746740758419037), ('laminair', 0.4741584062576294), ('korrelgrens', 0.4663923382759094), ('gelaagdheid_dampkring', 0.46422797441482544), ('stoflaag', 0.45754003524780273), ('radieel', 0.45273706316947937)]

-----
 afvalvoorkoming
3561 [('voorkoming', 0.6268365383148193), ('afvalvermindering', 0.5467178225517273), ('afvalpreventie', 0.5429227948188782), ('afvalverbranding', 0.5394697189331055), ('beheer_dierlijk_afval', 0.5378910899162292), ('afvalverwijdering', 0.5323777198791504), ('milieuverantwooren', 0.5302063226699829), ('afvalverwerking', 0.5289980173110962), ('afvalbeheer', 0.5260998010635376), ('stortplaats_gevaarlijk_afval', 0.5239720344543457)]

-----
 orde
3562 [('orde_chiroptera_vliegen_zoogdier', 0.7133697271347046), ('ridderoren', 0.6525737047195435), ('ridderorde', 0.6155765652656555), ('huisorde

3581 [('invoervergunning', 0.9010142087936401), ('uitvoerverbod', 0.702267050743103), ('exportvergunning', 0.6991265416145325), ('natuurvergunning', 0.6809902191162109), ('handelsvergunning', 0.6704479455947876), ('eurovergunning', 0.6484005451202393), ('watervergunning', 0.6359738111495972), ('vestigingsvergunning', 0.6285396814346313), ('transportvergunning', 0.6254621744155884), ('bedrijfsvergunning', 0.61961829662323)]

-----
 elektriciteitscentrale
3582 [('elektriciteitscentral', 1.0), ('electriciteitscentrale', 0.8645786046981812), ('elektriciteitsbedrijf', 0.7363132238388062), ('onderbelasting_elektriciteitscentral', 0.73615962266922), ('energiecentrale', 0.7028127312660217), ('steenkoolcentrale', 0.6684892177581787), ('elektriciteitsopwekking', 0.6588646173477173), ('gascentrale', 0.6579127311706543), ('elektriciteitsvoorziening', 0.6561300158500671), ('gascentral', 0.6554034948348999)]

-----
 protocol
3583 [('internetprotocol', 0.7166564464569092), ('communicatieprotocol', 0.

3602 [('tarieflijst', 0.7862671613693237), ('tarievenlijst', 0.777312695980072), ('tarievenblad', 0.7756895422935486), ('tarievenoverzicht', 0.7715477347373962), ('tariefkaart', 0.7714576125144958), ('dagtarief', 0.7161733508110046), ('tariefvoorwaard', 0.6714949607849121), ('standaardtarief', 0.6621140837669373), ('tarievencode', 0.6551088094711304), ('tarievenkaart', 0.6485474109649658)]

-----
 radioactief_neerslag
3603 [('atmosferisch_radioactief_neerslag', 0.9198323488235474), ('neerslag', 0.8550658226013184), ('radioactief', 0.8047868013381958), ('radioactief_besmetting', 0.735568106174469), ('radioactief_afvalstortplaat', 0.7246200442314148), ('radioactief_element', 0.7111362218856812), ('zuur_neerslag', 0.7108554244041443), ('opsporingstechniek_radioactief_straling', 0.710658073425293), ('radioactiviteit', 0.7033932209014893), ('radioactief_ontsmetting', 0.6906808018684387)]

-----
 protozoön
3604 [('protist', 0.6108062267303467), ('eencellig', 0.5811460614204407), ('amoebe', 0

3623 [('stellen', 0.8952864408493042), ('doelen', 0.8443082571029663), ('tegenstrijdigheid_streven_doelen', 0.7823325991630554), ('vragen', 0.6898789405822754), ('denken', 0.6628574728965759), ('bedoelen', 0.6590492129325867), ('vooropstellen', 0.6552754640579224), ('voornemen', 0.6492813229560852), ('formuleren', 0.6473459005355835), ('voorstellen', 0.639975905418396)]

-----
 raster
3624 [('raster_vectorformaat', 0.8793554902076721), ('rasterwerk', 0.6883712410926819), ('rasteren', 0.655138373374939), ('vector_rasterformaat', 0.615662157535553), ('rasterafbeelding', 0.6024744510650635), ('rasterformaat', 0.5881091952323914), ('vierkant', 0.5850707292556763), ('rechthoek', 0.5724560022354126), ('diagonaal', 0.5529284477233887), ('lineaal', 0.5410252213478088)]

-----
 burgerrecht
3625 [('burgerrechtenorganisatie', 0.7171081900596619), ('burgerrechtenbeweging', 0.6928787231445312), ('grondrecht', 0.6730491518974304), ('burgerrechtelijk', 0.6384011507034302), ('vrijheidsrecht', 0.614006

3644 [('deelonderwerp', 0.6698261499404907), ('hoofdonderwerp', 0.5927474498748779), ('voorstel', 0.5718303918838501), ('artikel', 0.5708987712860107), ('vraagstuk', 0.5689421892166138), ('inleiding', 0.5644454956054688), ('agendapunt', 0.5425763130187988), ('onderzoeksonderwerp', 0.5401424169540405), ('actualiteit', 0.5377659797668457), ('openbaar_discussie', 0.5351384878158569)]

-----
 steenkool
3645 [('steenkolen', 0.7110878229141235), ('bruinkool', 0.6814786195755005), ('kolen', 0.673410177230835), ('raffineren_kolen', 0.671694815158844), ('mijnbouw_gas_oliewinning_zee', 0.6186045408248901), ('aardolie_industrie', 0.6181982755661011), ('ijzererts', 0.6162562370300293), ('aardolie_exploratie', 0.6154621839523315), ('erts', 0.6143296957015991), ('aardolie_geologie', 0.6139686107635498)]

-----
 risico_kanker
3646 [('blootstelling_risico', 0.8177587985992432), ('natuurlijk_risico', 0.8077283501625061), ('risico', 0.8076983690261841), ('kanker', 0.8058924674987793), ('risico_kernongev

3665 [('aardkorst', 0.6688885688781738), ('subductiezone', 0.6283454895019531), ('vorm_aardkorst', 0.5732321739196777), ('subductie', 0.5674221515655518), ('platentektoniek', 0.5657767057418823), ('gesteente', 0.5639421939849854), ('hydrosfeer', 0.5612093210220337), ('subduceren', 0.5606868863105774), ('stollingsgesteente', 0.5569504499435425), ('gebergtevorming', 0.5495606064796448)]

-----
 wettelijk_voorschrift
3666 [('wettelijk', 0.895272970199585), ('wettelijk_ondernemingsvorm', 0.8592755794525146), ('overeenkomst_wettig_wettelijk', 0.8152409195899963), ('voorschrift', 0.802238941192627), ('voorschrift_landbouwproductie', 0.7175471186637878), ('gewestelijk_voorschrift', 0.7006696462631226), ('wet_beschermen_recht', 0.69072026014328), ('verordening_toestaan_maximum', 0.689195990562439), ('gebruiksvoorschrift', 0.6880718469619751), ('wet_gevaarlijk_goed', 0.6819390058517456)]

-----
 warmtecentral
3667 [('warmtekrachtcentral', 0.6901024580001831), ('zonnecentral', 0.6576187610626221

3685 [('brand', 0.9505726099014282), ('blus', 0.7223663330078125), ('blussen', 0.6793559789657593), ('brandklass', 0.6666944026947021), ('binnenbrand', 0.6634883284568787), ('voorkoming_bosbrand', 0.6564388275146484), ('brandgevaar', 0.6543315649032593), ('branden', 0.6436046361923218), ('brander', 0.6417028903961182), ('brandpreventie', 0.6391028165817261)]

-----
 wetgevende_macht
3686 [('macht', 0.9171175360679626), ('politiek_macht', 0.8937484622001648), ('wetgevende_bevoegdheid', 0.8252537250518799), ('wetgevende', 0.817634105682373), ('rechterlijk', 0.6413490772247314), ('machtig', 0.6356583833694458), ('bevoegdheid', 0.6303287148475647), ('politiek_grondgebied', 0.6281617879867554), ('politiek_organisatie', 0.6256290674209595), ('rechterlijk_orgaan', 0.6118529438972473)]

-----
 milieubeweging
3687 [('milieugroep', 0.7301124334335327), ('milieuorganisatie', 0.7153944969177246), ('greenpeace', 0.6630944013595581), ('milieu_industrie', 0.6571609973907471), ('invloed_industrie_mili

3715 [('energiebelasting', 0.6867305040359497), ('waterschapsbelasting', 0.6449983716011047), ('heffing_geluidsemissie', 0.6398402452468872), ('parkeerbelasting', 0.6398367881774902), ('rijksbelasting', 0.6337916851043701), ('milieubelasting', 0.6192641854286194), ('milieuheffing', 0.6184166669845581), ('verpakkingenbelasting', 0.6153005957603455), ('verontreinigingsheffing', 0.6112974882125854), ('verkeersbelasting', 0.6085752248764038)]

-----
 evaluatiecriterium
3716 [('prestatiecriteria', 0.7867079377174377), ('toetsingscriterium', 0.746756911277771), ('evaluatiemethode', 0.7246809005737305), ('selectiecriterium', 0.7176264524459839), ('evaluatievorm', 0.7151665687561035), ('uitsluitingscriteria', 0.6962431073188782), ('beoordelingscriterium', 0.6950401067733765), ('acceptatiecriteria', 0.6874825954437256), ('basiscriteria', 0.6811543703079224), ('indelingscriterium', 0.678810179233551)]

-----
 invoeren_plantensoort
3717 [('invoeren_diersoort', 0.8167095184326172), ('invoeren', 0.

3743 [('schutsluis', 0.7067598700523376), ('inundatiesluis', 0.6861980557441711), ('spuisluis', 0.6849418878555298), ('damsluis', 0.682389497756958), ('buitenslui', 0.6814598441123962), ('uitwateringssluis', 0.6628495454788208), ('keersluis', 0.6599059104919434), ('zeesluis', 0.6595776081085205), ('waaiersluis', 0.6582021713256836), ('kanaalbrug', 0.6512138843536377)]

-----
 storten_afval
3744 [('storten_afval_zeebodem', 0.9307900667190552), ('storten_afval_bodem', 0.930231511592865), ('afval', 0.9116847515106201), ('bijzonder_afval', 0.9091486930847168), ('hoeveelheid_afval', 0.9060555696487427), ('gevaarlijk_afval', 0.9059653282165527), ('radioactief_afval', 0.8983863592147827), ('samenstelling_afval', 0.8968765735626221), ('elektronisch_afval', 0.8956711292266846), ('stortplaats_gevaarlijk_afval', 0.8951246738433838)]

-----
 bij
3745 [('voor', 0.6044982671737671), ('het', 0.5766843557357788), ('bos_schadelijk_dier_plant', 0.5718262195587158), ('wijze_voortplanting', 0.558002591133

3764 [('opstopping', 0.7851160764694214), ('verkeerschaos', 0.7063083648681641), ('verkeersinfarct', 0.6606160998344421), ('verkeersprobleem', 0.6328037977218628), ('verkeershinder', 0.5990329384803772), ('filevorming', 0.5953471660614014), ('verkeersonveilig', 0.5952161550521851), ('autoverkeer', 0.571813702583313), ('verkeersonveiligheid', 0.5636930465698242), ('fileleed', 0.5602139234542847)]

-----
 machine
3765 [('machine_industrie', 0.8940960764884949), ('machinery', 0.6710239052772522), ('naaimachine', 0.6700105667114258), ('productiemachine', 0.6532695889472961), ('werktuigmachine', 0.6499539017677307), ('machinerie', 0.645246684551239), ('machinaal', 0.6326775550842285), ('snijmachine', 0.631701648235321), ('maalmachine', 0.6199202537536621), ('reinigingsmachine', 0.6190529465675354)]

-----
 oxyderenen_stof
3766 [('kankerverwekkend_stof', 0.9272880554199219), ('organisch_stof', 0.9190016984939575), ('anorganisch_stof', 0.9159444570541382), ('stof', 0.9123318791389465), ('vero

3793 [('wegzinken', 0.6366046667098999), ('wrak', 0.6110742092132568), ('kapseizen', 0.6073938012123108), ('wegvaren', 0.5982803106307983), ('drijven_olielaag', 0.596793532371521), ('ankeren', 0.5963904857635498), ('opvaren', 0.5928778052330017), ('afzinken', 0.5919723510742188), ('bezinken', 0.5848886966705322), ('verdrinken', 0.5783369541168213)]

-----
 
 NOT in model

-----
 zwevend_stof
3795 [('zwevend', 0.8203092813491821), ('organisch_vervuilen_stof', 0.7488532662391663), ('verontreinigen_stof', 0.7472082376480103), ('anorganisch_stof', 0.7440671920776367), ('organisch_stof', 0.7426384091377258), ('vluchtig_stof', 0.7406667470932007), ('natuurlijk_afbreekbaar_verontreinigen_stof', 0.7358320951461792), ('radioactief_stof', 0.733494758605957), ('gemakkelijk_afbreekbaar_stof', 0.7330282926559448), ('vrijkomen_verontreinigen_stof', 0.729051411151886)]

-----
 microbiologie
3796 [('microbiologisch', 0.7971510291099548), ('microbiology', 0.7634214162826538), ('microbioloog', 0.7355246

3813 [('productversie', 0.6538516283035278), ('productverbetering', 0.6190391778945923), ('productvernieuwing', 0.618865966796875), ('productveiligheid', 0.5020747780799866), ('vergelijking', 0.49316269159317017), ('kostenvergelijking', 0.47646504640579224), ('vergelijkingstabel', 0.4698239266872406), ('productselectie', 0.45601651072502136), ('levenscyclus_product', 0.4540445804595947), ('product', 0.45163536071777344)]

-----
 bepaling_vervuilen_stof
3814 [('langetermijneffect_vervuilen_stof', 0.928671658039093), ('organisch_vervuilen_stof', 0.9193201065063477), ('verwijdering_verontreinigen_stof', 0.914478063583374), ('menselijk_blootstelling_vervuilen_stof', 0.9110451936721802), ('vrijkom_verontreinigen_stof', 0.9055949449539185), ('verdeling_verontreinigen_stof', 0.9020031690597534), ('inschatting_verontreinigen_stof', 0.9004604816436768), ('verontreinigen_stof', 0.8968584537506104), ('blootstelling_verontreinigen_stof', 0.8951479196548462), ('chemisch_verontreinigen_stof', 0.8916

3834 [('houder', 0.7690370082855225), ('aluminium', 0.7638018131256104), ('houder_statiegeld', 0.6882010698318481), ('container', 0.6799166798591614), ('metaal', 0.6538472771644592), ('maat_maken_chemisch_product', 0.6531069278717041), ('isoleren_materiaal', 0.6470662355422974), ('alternatief_materiaal', 0.6431243419647217), ('giftig_metaal', 0.6389932036399841), ('plastic', 0.632309079170227)]

-----
 soort
3835 [('soort_aanpassingsvermogen', 0.9400877952575684), ('verzameling_soort', 0.9310985803604126), ('soort_milieuverontreiniging', 0.9220602512359619), ('soort_aanstelling', 0.919012725353241), ('kwetsbaar_soort', 0.912747323513031), ('zeldzaam_soort', 0.911040723323822), ('soort_bedrijfsvoering', 0.9064503908157349), ('soort_bedrijf', 0.9007987976074219), ('bescherming_soort', 0.8962985277175903), ('soort_aanspraak', 0.8950021266937256)]

-----
 nomade
3836 [('nomadenstam', 0.6506332159042358), ('nomadenvolk', 0.6378120183944702), ('nomadisch', 0.6333659887313843), ('nomad', 0.60

3857 [('schadeloosstelling', 0.8136599063873291), ('schade_vergoeding', 0.7596575021743774), ('schadevergoedingsrecht', 0.7391146421432495), ('schadeclaim', 0.7352627515792847), ('recht_schadevergoeding', 0.7324473857879639), ('raming_schade', 0.6769571304321289), ('vergoeding', 0.6757695078849792), ('boete_schade_milieu', 0.6666510105133057), ('schaderegeling', 0.6653122305870056), ('schade', 0.6636279821395874)]

-----
 overloop
3858 [('overlopen', 0.5421276688575745), ('voorzolder', 0.5180943012237549), ('trapopgang', 0.5176302790641785), ('bergzolder', 0.5071431398391724), ('nachthal', 0.5057966709136963), ('trapkast', 0.5052541494369507), ('doorloop', 0.4805877208709717), ('bijkeuken', 0.4743596613407135), ('afvoer_overstromen_water', 0.4705823063850403), ('tussenhal', 0.46848607063293457)]

-----
 jaargetijde
3859 [('jaargetijd', 0.8085397481918335), ('nazomer', 0.5664795637130737), ('herfst', 0.5584638118743896), ('wintertijd', 0.5548787713050842), ('herfstmaand', 0.542896628379

3879 [('vervuilen_energiebron', 0.9059375524520874), ('vervuilen', 0.8711283206939697), ('brandstof', 0.8233702182769775), ('ontzwaveling_brandstof', 0.8182339668273926), ('verbruik_fossiel_brandstof', 0.7819172143936157), ('brandstof_verwerken_afval', 0.7724758386611938), ('dierlijk_uitwerpsel_brandstof', 0.7490636110305786), ('gevaar_vervuilen_stof', 0.7484690546989441), ('vervuiling_motorvoertuig', 0.7458935379981995), ('fossiel_brandstof', 0.7432320713996887)]

-----
 vrijheid
3880 [('onvrijheid', 0.6905917525291443), ('meningsuiting', 0.6786342859268188), ('vrijheidsrecht', 0.6668537855148315), ('grondrecht', 0.6660128235816956), ('blijheid', 0.6436101198196411), ('zelfbeschikking', 0.6359320282936096), ('democratie', 0.635411262512207), ('rechtsstaat', 0.6241868734359741), ('keuzevrijheid', 0.623445987701416), ('vrijheidsbeweging', 0.6193348169326782)]

-----
 voorkomen_gevaar
3881 [('gevaar', 0.9395428895950317), ('natuurlijk_gevaar', 0.9315560460090637), ('technologisch_gevaar'

3902 [('furaan', 0.6081749200820923), ('dioxine', 0.5870435237884521), ('amide', 0.5397242307662964), ('xyleen', 0.5352537631988525), ('benzopyreen', 0.5218297243118286), ('nitraat', 0.5183085203170776), ('fluorkoolwaterstof', 0.5143927335739136), ('koolwaterstof', 0.5137453675270081), ('nitriet', 0.5127312541007996), ('amine', 0.5079234838485718)]

-----
 blootstelling
3903 [('absorptie_blootstelling', 0.8549649119377136), ('blootstelling_straling', 0.8474145531654358), ('blootstelling_risico', 0.749172568321228), ('blootstelling_verontreinigen_stof', 0.7098658084869385), ('blootstellen', 0.7022255659103394), ('menselijk_blootstelling_vervuilen_stof', 0.6768850088119507), ('plan_betrekking_blootstelling_lawaai', 0.6423900127410889), ('straling', 0.6125890016555786), ('ultraviolet_straling', 0.5944902300834656), ('opsporingstechniek_radioactief_straling', 0.5943825244903564)]

-----
 radar
3904 [('radarstation', 0.5932558178901672), ('weerradar', 0.5889560580253601), ('radarscherm', 0.

3923 [('gezamenlijk_verbranding', 0.8730117678642273), ('beheersen_verbranding', 0.8227830529212952), ('verbranden', 0.7222805023193359), ('verbrandingsproces', 0.6751437783241272), ('verbrandingsproduct', 0.6703913807868958), ('ontzwaveling_brandstof', 0.6456766128540039), ('verbrandingswarmte', 0.6328397989273071), ('verbrandingsrest', 0.62336266040802), ('verbrandingsreactie', 0.6193658113479614), ('zuivering_rookgas', 0.6179090738296509)]

-----
 test
3924 [('test_kankerverwekken', 0.9282475709915161), ('test_materiaal', 0.9203028678894043), ('test_mutageniteit', 0.9078152179718018), ('test_scheikundig_stof', 0.776029109954834), ('ame_test', 0.7735486030578613), ('tester', 0.7663813233375549), ('testen', 0.734373927116394), ('testing', 0.7086358666419983), ('pretest', 0.6588782072067261), ('zelftest', 0.6512312889099121)]

-----
 vijver
3925 [('siervijver', 0.7411838173866272), ('koivijver', 0.7273436784744263), ('vijve', 0.7217602133750916), ('visvijver', 0.7121115922927856), ('bo

3946 [('thermodynamisch', 0.7457257509231567), ('dynamica', 0.6777667999267578), ('elektrodynamica', 0.6594711542129517), ('kwantumchromodynamica', 0.6427621841430664), ('elektromagnetisme', 0.6419574022293091), ('hydrodynamica', 0.6348507404327393), ('kwantumelektrodynamica', 0.6292037963867188), ('vloeistofdynamica', 0.6282160878181458), ('hoofdwet', 0.6146777868270874), ('atmosferisch_natuurkunde', 0.6037981510162354)]

-----
 misdadig_gedrag
3947 [('gedrag', 0.8449326157569885), ('sociaal_gedrag', 0.8160243034362793), ('milieubewust_gedrag', 0.8009999394416809), ('misdadig', 0.7820812463760376), ('gedrag_verbruiker', 0.7492928504943848), ('misdaad', 0.6414929032325745), ('asociaal', 0.6365591287612915), ('probleemgedrag', 0.6307964324951172), ('crimineel', 0.6304688453674316), ('gedraging', 0.6272515058517456)]

-----
 paard
3948 [('pony', 0.7819026112556458), ('merrie', 0.7552458643913269), ('bokken', 0.7500518560409546), ('veulen', 0.7467740774154663), ('shetje', 0.74121558666229

3968 [('bacteriologisch', 0.8362581729888916), ('bacterioloog', 0.7606414556503296), ('bacteriologisch_verontreiniging', 0.7282520532608032), ('microbiologie', 0.673478364944458), ('virologie', 0.6650412678718567), ('bacteriofaag', 0.6181702613830566), ('microbiologisch', 0.6180435419082642), ('immunologie', 0.6160538196563721), ('microbioloog', 0.6031081676483154), ('bacterie', 0.592068612575531)]

-----
 uitwisseling_elektronisch_gegeven
3969 [('uitwisseling_gegeven', 0.9441478252410889), ('gegeven', 0.8517334461212158), ('controleren_gegeven', 0.8346468210220337), ('statistisch_gegeven', 0.8213096857070923), ('gegeven_geografisch_component', 0.8085869550704956), ('economisch_gegeven', 0.801071286201477), ('informatie_uitwisseling', 0.790195643901825), ('uitwisseling', 0.7440728545188904), ('gegevensuitwisseling', 0.7210162281990051), ('wijze_waarop_gegeven_vastleggen', 0.7136914730072021)]

-----
 raffinaderij
3970 [('olieraffinaderij', 0.8182053565979004), ('aardolie_industrie', 0.

3996 [('zout_water', 0.9256813526153564), ('zwemwater_zout', 0.8872660398483276), ('zoutarm', 0.6836368441581726), ('zouten', 0.6829363107681274), ('zoutig', 0.6760971546173096), ('zeezout', 0.6747640371322632), ('keukenzout', 0.6691886186599731), ('verdunnen_zuren', 0.6592980027198792), ('zoutgehalte_water', 0.6586574912071228), ('zoutkristal', 0.6546977758407593)]

-----
 woordenboek
3997 [('beeldwoordenboek', 0.7910447120666504), ('zakwoordenboek', 0.7832039594650269), ('woordenlijst', 0.7770475149154663), ('handwoordenboek', 0.774302065372467), ('rijmwoordenboek', 0.7430520057678223), ('vertaalwoordenboek', 0.7097526788711548), ('lexicon', 0.6919568777084351), ('antwoordenboek', 0.6713077425956726), ('puzzelwoordenboek', 0.645146906375885), ('woord', 0.6403735280036926)]

-----
 ijzerschroot
3998 [('schroten', 0.7487143278121948), ('metaalafval', 0.6094828248023987), ('roesten', 0.5686788558959961), ('ruimteschroot', 0.5666345357894897), ('metaalpoeder', 0.5653361082077026), ('meta

4016 [('kalkwater', 0.6083774566650391), ('kalklaag', 0.568638265132904), ('kalkmortel', 0.5604499578475952), ('leem', 0.5503055453300476), ('kalkgehalte', 0.5496358275413513), ('kleisteen', 0.5464717149734497), ('kalkafzetting', 0.5460505485534668), ('zout_water', 0.5428352355957031), ('steen', 0.5396225452423096), ('doorsijpeling_water_bodem', 0.5355345010757446)]

-----
 gemakkelijk_afbreekbaar_stof
4017 [('natuurlijk_afbreekbaar_verontreinigen_stof', 0.9570056200027466), ('biologisch_afbreekbaar_verontreinigen_stof', 0.9228532910346985), ('goed_afbreekbaar_organisch_verontreinigen_stof', 0.9148818850517273), ('organisch_stof', 0.8799217939376831), ('gevaarlijk_stof', 0.8731344938278198), ('verontreinigen_stof', 0.8720863461494446), ('organisch_vervuilen_stof', 0.8675631880760193), ('giftig_stof', 0.8643684983253479), ('chemisch_verontreinigen_stof', 0.8634926080703735), ('brandgevaarlijk_stof', 0.8631159067153931)]

-----
 aansprakelijkheid
4018 [('aansprakelijk', 0.865795731544494

4045 [('oceani', 0.6343408823013306), ('azië', 0.564165472984314), ('centraal_azië', 0.553266167640686), ('zuidelijk_azië', 0.5460959672927856), ('caraïb', 0.5309772491455078), ('werelddeel', 0.5128287672996521), ('australië', 0.5082453489303589), ('oost_azië', 0.4937308430671692), ('australie', 0.47049081325531006), ('cookeiland', 0.464644193649292)]

-----
 bioconcentratie_factor
4046 [('factor', 0.9157353639602661), ('ecologisch_factor', 0.8636569380760193), ('biotisch_factor', 0.8557306528091431), ('abiotisch_factor', 0.8515164852142334), ('antropogeen_factor', 0.8482768535614014), ('omgevingsfactor', 0.6719566583633423), ('effect_gezondheid', 0.6424281597137451), ('genetisch_effect', 0.631916880607605), ('socio_economisch_factor', 0.6248428821563721), ('agens_direct_induceren_werking', 0.6225032806396484)]

-----
 libel
4047 [('libelle', 0.7131202220916748), ('heidelibel', 0.6648432016372681), ('bronlibel', 0.6622309684753418), ('platbuik', 0.6606173515319824), ('keizerlibel', 0.6

4076 [('vergiftigingsverschijnsel', 0.8163424730300903), ('bloedvergiftiging', 0.7040368318557739), ('vergiftig', 0.6999662518501282), ('kwikvergiftiging', 0.6811600923538208), ('voedselvergiftiging', 0.6757315397262573), ('vergiftigen', 0.666443943977356), ('koolmonoxidevergiftiging', 0.6488164663314819), ('zwangerschapsvergiftiging', 0.6486679315567017), ('vergift', 0.6397765874862671), ('koolstofmonoxidevergiftiging', 0.6380195617675781)]

-----
 assimilatie
4077 [('dissimilatie', 0.7639920115470886), ('assimilation', 0.7005386352539062), ('assimileren', 0.5816202759742737), ('acculturatie', 0.568522036075592), ('vermenging', 0.5391342639923096), ('desintegratie', 0.527013897895813), ('autolyse', 0.5123438835144043), ('diffusie', 0.5101863145828247), ('arabisering', 0.5058712959289551), ('involutie', 0.5035288333892822)]

-----
 verven
4078 [('geverfd', 0.7193222045898438), ('schilderen', 0.7066168785095215), ('verf', 0.6983574032783508), ('beschilderen', 0.6962774991989136), ('kleu

4098 [('roos', 0.7572838068008423), ('bloemen', 0.7527479529380798), ('boeket', 0.7423144578933716), ('bloemblaadjes', 0.6947132349014282), ('blom', 0.6899961829185486), ('bloemblad', 0.6776485443115234), ('stokroos', 0.6763322949409485), ('veldbloem', 0.669062077999115), ('krans', 0.6666367053985596), ('madeliefje', 0.6634646058082581)]

-----
 geofysica
4099 [('geofysisch', 0.8007062673568726), ('astrofysica', 0.7531163692474365), ('geofysicus', 0.7310789823532104), ('biofysica', 0.7017282843589783), ('stralingsfysica', 0.6734289526939392), ('plasmafysica', 0.6703007221221924), ('astrofysisch', 0.6621463298797607), ('seismologie', 0.6559173464775085), ('geofysisch_milieu', 0.6523550748825073), ('atoomfysica', 0.6461244821548462)]

-----
 teratogeen_stof
4100 [('kankerverwekkend_stof', 0.9193717241287231), ('mutageen_stof', 0.9045715928077698), ('stof', 0.8964872360229492), ('gevaarlijk_stof', 0.8953590393066406), ('xenobiotisch_stof', 0.8922456502914429), ('brandgevaarlijk_stof', 0.8

4120 [('mutatieoverzicht', 0.6718924045562744), ('genetisch_wijziging', 0.5864477157592773), ('afschrijving', 0.5859401226043701), ('saldo', 0.5778671503067017), ('genmutatie', 0.5723224878311157), ('mutation', 0.5699275732040405), ('mutatiegraad', 0.5655746459960938), ('genetisch_wijzigen_organisme', 0.5569100975990295), ('puntmutatie', 0.5529059171676636), ('wijziging', 0.5489599704742432)]

-----
 zwerflandbouw
4121 [('irrigatielandbouw', 0.6408731341362), ('productiebossen', 0.6104912757873535), ('ontginning_landbouwgrond', 0.5963237881660461), ('kringlooplandbouw', 0.5822310447692871), ('landbouwmethode', 0.5819218754768372), ('bosaanplant', 0.5783328413963318), ('houtproductie', 0.5755997896194458), ('landbouwlandschap', 0.5679956078529358), ('houtkap', 0.5661773085594177), ('biomassaproductie', 0.5638256669044495)]

-----
 enquête
4122 [('enquete', 0.8402234315872192), ('webenquête', 0.7063969373703003), ('vragenlijst', 0.6983175277709961), ('enquêteformulier', 0.688478112220764

4143 [('lederen', 0.7132537364959717), ('lederlook', 0.6877177953720093), ('kunstleder', 0.6788194179534912), ('bekleding', 0.6464024186134338), ('volnerf', 0.6403501033782959), ('kunstleer', 0.6328843235969543), ('imitatieleder', 0.6227430105209351), ('nubuck', 0.6060881614685059), ('nappa', 0.6028425693511963), ('leather', 0.6000146865844727)]

-----
 ambtsbezigheid
4144 [('beroepsbezigheid', 0.6803256273269653), ('ambtsvoorganger', 0.5714097023010254), ('bezigheid', 0.5627309083938599), ('dienstreis', 0.5611953735351562), ('ambtsperiode', 0.5503613352775574), ('burgemeesterschap', 0.5455586910247803), ('ambtsbericht', 0.5414170026779175), ('dienstverrichting', 0.5356959104537964), ('beleidsdaad', 0.5257554054260254), ('ambtsgebied', 0.5241958498954773)]

-----
 vandalisme
4145 [('vandaliser', 0.6595953702926636), ('vandalist', 0.6481363773345947), ('vandalistisch', 0.638114333152771), ('vandaal', 0.6312626600265503), ('vernieling', 0.6309763193130493), ('vandalism', 0.58911526203155

4167 [('beeldlijn', 0.6231256723403931), ('subpixel', 0.6132271885871887), ('beeldsignaal', 0.5792075395584106), ('beeldveld', 0.570260226726532), ('kleurruimte', 0.5603137016296387), ('beeldelement', 0.5552289485931396), ('pixel', 0.5550816655158997), ('projectievlak', 0.5514190196990967), ('lensje', 0.5506144762039185), ('kleurenbeeld', 0.5431889295578003)]

-----
 zuiveren_vermogen
4168 [('zuiveren', 0.8363937735557556), ('vermogen', 0.8158224821090698), ('geleiden_vermogen', 0.7770577669143677), ('zuiver', 0.7087467908859253), ('vermogen_afval_nemen', 0.6447169780731201), ('water_rijk_rotten_organisch_materiaal', 0.637447714805603), ('chemisch_reinigen', 0.6365220546722412), ('natuurlijk_regeneratie', 0.6300874352455139), ('olie_baseren_energie', 0.6292902827262878), ('verval_natuurlijk_rijkdom', 0.6177886724472046)]

-----
 dwangmaatregel
4169 [('dwangmiddel', 0.6454874873161316), ('maatregeling', 0.6312652826309204), ('belastingmaatregel', 0.616967499256134), ('tuchtmaatregel', 0

4191 [('rekbaarheid', 0.6825440526008606), ('prijselasticiteit', 0.6767699718475342), ('inkomenselasticiteit', 0.6672452688217163), ('plasticiteit', 0.6435679793357849), ('elasticiteitsmodulus', 0.620543897151947), ('elastisch', 0.6141137480735779), ('stijfheid', 0.59590083360672), ('stevigheid', 0.562223494052887), ('gelijkmatigheid', 0.5594468116760254), ('vormvastheid', 0.5576496124267578)]

-----
 stolling
4192 [('stollingsfactor', 0.7141664028167725), ('bloedstolling', 0.6774325966835022), ('antistolling', 0.6188620328903198), ('stollingsstoornis', 0.6117216348648071), ('stollen', 0.5996727347373962), ('coagulatie', 0.5889700055122375), ('ablatie', 0.5852855443954468), ('trombose', 0.566313624382019), ('stolsel', 0.5653665065765381), ('vaatwand', 0.5560238361358643)]

-----
 dioxine
4193 [('aflatoxine', 0.6404910087585449), ('dioxinecrisis', 0.6349557638168335), ('vervuiling_giftig_stof', 0.6273092031478882), ('nitriet', 0.6207759380340576), ('toxine', 0.6170458793640137), ('chloo

4214 [('fluoride', 0.8021767735481262), ('chloride', 0.5635063052177429), ('ozonisatie', 0.5443047285079956), ('zoutzuur', 0.5430149435997009), ('chloordioxide', 0.5375487804412842), ('carbonaat', 0.5374157428741455), ('boorzuur', 0.527458667755127), ('hydroxide', 0.5258545875549316), ('giftigheid_bestrijdingsmiddel', 0.523716151714325), ('ontzwaveling', 0.521446943283081)]

-----
 monstername
4215 [('monsterneming', 0.837038516998291), ('bemonstering', 0.6869368553161621), ('bemonstering_milieuverontreiniging', 0.6729142665863037), ('staalname', 0.6125881671905518), ('microbiologisch_analyse', 0.6035836935043335), ('wateranalyse', 0.5648989677429199), ('watermonster', 0.5591573715209961), ('analyseresultaat', 0.5476469993591309), ('bacteriologisch_verontreiniging', 0.5459076166152954), ('normoverschrijding', 0.5427521467208862)]

-----
 benzine
4216 [('loodvrij_benzine', 0.8532130718231201), ('diesel', 0.7271921634674072), ('brandstof', 0.712165117263794), ('benzinemotor', 0.698234558

4239 [('indicator_milieuverontreiniging', 0.890094518661499), ('sociaal_indicator', 0.7581061124801636), ('kwaliteitsindicator', 0.7312098741531372), ('milieu_indicator', 0.7130979895591736), ('kernindicator', 0.6895320415496826), ('indicatorenset', 0.6782987117767334), ('indicatie', 0.6508967280387878), ('meetinstrument', 0.6447125673294067), ('prestatieindicator', 0.6322854161262512), ('monitor', 0.628654420375824)]

-----
 barium
4240 [('samarium', 0.715949296951294), ('yttrium', 0.6837525367736816), ('chloride', 0.6700583696365356), ('bariumsulfaat', 0.657837450504303), ('erbium', 0.64964759349823), ('bismut', 0.6435760855674744), ('scandium', 0.6389813423156738), ('cerium', 0.6383715867996216), ('hafnium', 0.6368116140365601), ('carbonaat', 0.6363131403923035)]

-----
 katalysator_toestel
4241 [('toestel', 0.786622166633606), ('katalysator', 0.7665294408798218), ('toestel_luchtweg_beschermen', 0.6429610252380371), ('katalysator_stof', 0.6405348777770996), ('verwarmingstoestel', 0.

4269 [('vogelkunen', 0.5216057896614075), ('wildvang', 0.49975907802581787), ('leefgewoonte', 0.4964754581451416), ('kooivogel', 0.4919472932815552), ('leefwijze', 0.4901237487792969), ('exoot', 0.4896610975265503), ('hoenderachtigen', 0.4869362413883209), ('hoendervogel', 0.4809003174304962), ('vogelsoort', 0.48000356554985046), ('vleermuisparkiet', 0.4793422818183899)]

-----
 nomenclatuur
4270 [('nomenclature', 0.734706699848175), ('classificatie', 0.6003698110580444), ('organisme_taxonomie', 0.599297285079956), ('terminologie', 0.593665599822998), ('systematiek', 0.5801190137863159), ('biotechnologie_betrekking_gezondheid', 0.5722732543945312), ('classificatiesysteem', 0.5647191405296326), ('fytosanitair_behandeling', 0.5537552833557129), ('classificatie_basis_grondgebruik', 0.5509223341941833), ('wetgeving_genetisch_manipulatie', 0.5437815189361572)]

-----
 sporenelement
4271 [('spoorelement', 0.6983674764633179), ('voedingsbestanddeel', 0.6017411351203918), ('voedingsstof', 0.58

4291 [('hexachloorbenzeen', 0.7030317783355713), ('nonylfenol', 0.700865626335144), ('fenol', 0.6633983850479126), ('polychloorbifenyl', 0.6630569696426392), ('chloorbenzeen', 0.6595801115036011), ('tetrachloormethaan', 0.6562245488166809), ('vinylchlorien', 0.6309822797775269), ('dimethylamine', 0.6260424852371216), ('acetonitril', 0.6215269565582275), ('tetrachlooretheen', 0.6208193898200989)]

-----
 scheiden_ophaling_bron
4292 [('afvalinzameling_bron', 0.8393208980560303), ('scheiding_bron', 0.8172018527984619), ('scheiden_inzameling', 0.765723466873169), ('bron', 0.7544183731079102), ('scheiden_afvalverwerking', 0.7500708103179932), ('microbieel_bron', 0.742180585861206), ('bron_milieu_verontreiniging', 0.7381808757781982), ('inkomst_afval_herwerking', 0.7292001843452454), ('fossiel_bron', 0.7102478742599487), ('vermogen_afval_nemen', 0.695702314376831)]

-----
 schoolwerk
4293 [('schoolwerkplan', 0.6623902320861816), ('schoolopdracht', 0.6005678176879883), ('huiswerk', 0.58851003

4315 [('explosief', 0.6169861555099487), ('dynamiet', 0.5964423418045044), ('granaat', 0.5467835068702698), ('munitie', 0.5443874597549438), ('springlading', 0.535104513168335), ('voedingstof', 0.5261156558990479), ('gifgas', 0.5147637724876404), ('handgranaat', 0.5146142840385437), ('splijtstof', 0.5136837363243103), ('bommen', 0.5133562088012695)]

-----
 beglazen
4316 [('hardglaz', 0.6929928064346313), ('beglazing', 0.6719191074371338), ('dubbelglas', 0.6404989957809448), ('glaslatt', 0.6396710276603699), ('kunststofkozijn', 0.6291224956512451), ('glasvlak', 0.628552258014679), ('glasdeur', 0.626786470413208), ('buitenkozijn', 0.6245714426040649), ('melkglas', 0.600084662437439), ('raamkozijn', 0.5977246761322021)]

-----
 verrijken_uranium
4317 [('uranium', 0.9206542372703552), ('uraan', 0.6343568563461304), ('uraniummijn', 0.6085132360458374), ('verrijken', 0.6000721454620361), ('plutonium', 0.574291467666626), ('kernsplijting', 0.572825014591217), ('radioactief_element', 0.558248

4345 [('houder', 0.8370270729064941), ('statiegeld', 0.786008358001709), ('aluminium_bestaan_container_houder', 0.6882010698318481), ('statiegeldregeling_verpakking', 0.6798602938652039), ('flessenhouder', 0.5976533889770508), ('wegwerp', 0.5761377811431885), ('pennenhouder', 0.5746116638183594), ('verpakking', 0.5685744285583496), ('zak', 0.5644752383232117), ('fles', 0.562694787979126)]

-----
 marmer
4346 [('natuursteen', 0.6891223788261414), ('graniet', 0.6882832050323486), ('albast', 0.6744400262832642), ('granieten', 0.6623679995536804), ('kalksteen', 0.6326704025268555), ('travertin', 0.6298350095748901), ('hardsteen', 0.6250423789024353), ('travertijn', 0.6200896501541138), ('marmergroev', 0.6195824146270752), ('zandsteen', 0.6083998680114746)]

-----
 onderdrukking
4347 [('onderdrukken', 0.767757773399353), ('repressie', 0.6745994091033936), ('overheersing', 0.6665962338447571), ('onvrijheid', 0.6577081680297852), ('uitbuiting', 0.6347806453704834), ('opstand', 0.6262247562408

4367 [('aantoonbaar', 0.6860572099685669), ('meetbaarheid', 0.655597984790802), ('kenbaarheid', 0.6272999048233032), ('berekenbaarheid', 0.6150461435317993), ('controleerbaarheid', 0.6076382398605347), ('deugdelijkheid', 0.6059615612030029), ('adequaatheid', 0.5954834222793579), ('passendheid', 0.5917036533355713), ('toerekenbaarheid', 0.5882740616798401), ('proceskwaliteit', 0.5868058204650879)]

-----
 benzopyreen
4368 [('benzoëzuur', 0.6650074124336243), ('benzo', 0.6515693068504333), ('styreen', 0.6445176601409912), ('benzoate', 0.6419727206230164), ('polychloorbifenyl', 0.6402533054351807), ('benzoë', 0.6396098732948303), ('xyleen', 0.638094425201416), ('polycyclisch_koolwaterstof', 0.6250259876251221), ('benzeen', 0.6189642548561096), ('bifenyl', 0.6188232898712158)]

-----
 gehoorschade
4369 [('gehoorbeschadiging', 0.7503980398178101), ('gehoorprobleem', 0.683868408203125), ('gehoorverlies', 0.6745274066925049), ('gehoorbescherming', 0.6661904454231262), ('gehoorstoornis', 0.646

4388 [('grazen_weide', 0.6927645206451416), ('weide', 0.6664183139801025), ('weiland', 0.6371181011199951), ('koe', 0.6262000203132629), ('stal', 0.617345929145813), ('weien', 0.6074578166007996), ('kap_bos', 0.5991852283477783), ('heg', 0.5876504778862), ('landbouw_huis_dier', 0.5874310731887817), ('grazen', 0.5849562883377075)]

-----
 brandbaarheid
4389 [('brandbaar', 0.7540084719657898), ('ontvlambaarheid', 0.734249472618103), ('onbrandbaar', 0.6853629350662231), ('brandbaar_stof', 0.6700229644775391), ('brandgevaarlijk', 0.6463043689727783), ('brandweerstand', 0.6421602368354797), ('brandbescherming', 0.6419972777366638), ('verbrandingswarmte', 0.6358881592750549), ('dampspanning', 0.6234105229377747), ('brandwerendheid', 0.6206125617027283)]

-----
 drijfgas
4390 [('schuimmiddel', 0.6003545522689819), ('spuitbus', 0.5767602920532227), ('verbrandingsproduct', 0.5649127960205078), ('koudemiddel', 0.5588342547416687), ('fotochemisch_oxidant', 0.5557060241699219), ('oxidatiemiddel', 

4416 [('ascomyceten', 0.7285928726196289), ('steeltjeszwam', 0.6127306222915649), ('cercospora', 0.5866110324859619), ('zakjeszwam', 0.552200436592102), ('fungus', 0.5520840883255005), ('isopoda', 0.5509343147277832), ('waterschimmel', 0.5482993125915527), ('ascomycota', 0.5452340841293335), ('fungicola', 0.5438477993011475), ('chordata', 0.5437959432601929)]

-----
 ruw_aardolie
4417 [('ruw', 0.8603395223617554), ('verontreiniging_ruw_varen', 0.8083111047744751), ('aardolie', 0.7876524925231934), ('aardolie_industrie', 0.7570409178733826), ('aardolie_exploratie', 0.7456276416778564), ('aardolie_geologie', 0.7133389115333557), ('ruw_timmer_hout', 0.7091305255889893), ('ruwe', 0.6744494438171387), ('olie_boren', 0.6522881984710693), ('gehalte_rotten_organisch_materiaal', 0.6454715728759766)]

-----
 normalisatie
4418 [('normalisering', 0.738365113735199), ('normaliseren', 0.6572747230529785), ('standaardisatie', 0.6448996663093567), ('normaliser', 0.6403626203536987), ('formalisatie', 0

4437 [('spectrometrie', 0.6393910646438599), ('spectroscopie', 0.6282692551612854), ('spectrograaf', 0.5586229562759399), ('infraroodspectroscopie', 0.5568827390670776), ('interferometrie', 0.5532916188240051), ('calorimeter', 0.5531976222991943), ('chemometrie', 0.5509554147720337), ('massaspectrometrie', 0.5449886322021484), ('spectrometer', 0.5400978922843933), ('spectroscopisch', 0.5390438437461853)]

-----
 cyanaat
4438 [('thiocyanaat', 0.7911440134048462), ('isocyanaat', 0.7538721561431885), ('cyanogeenchloride', 0.6698314547538757), ('jodide', 0.6409755945205688), ('zuurchloride', 0.6377922296524048), ('chloriet', 0.6376967430114746), ('ammoniumzout', 0.6326160430908203), ('zwaveligzuur', 0.627055287361145), ('diazoniumzout', 0.6248354315757751), ('fosforigzuur', 0.6195298433303833)]

-----
 vulcaniseren
4439 [('vulcani', 0.6043436527252197), ('cementer', 0.576567530632019), ('vulkaniseren', 0.5764762163162231), ('dieptrekken', 0.5439987182617188), ('passiver', 0.534180223941803

4467 [('opwerking', 0.5594972372055054), ('balkanisering', 0.5421934723854065), ('nationalisering', 0.5411331057548523), ('europeanisering', 0.5361396074295044), ('schematisering', 0.5316380858421326), ('operationalisering', 0.5316053628921509), ('complexering', 0.5281688570976257), ('rationalisering', 0.5242363214492798), ('decentralisering', 0.5210439562797546), ('neutralisatie', 0.5160549283027649)]

-----
 milieuramp
4468 [('milieuramp_bestrijdings_plan', 0.7068701386451721), ('olievervuiling', 0.7008098363876343), ('olieramp', 0.6970375180244446), ('milieuverontreiniging', 0.6446161866188049), ('vermindering_olievervuiling', 0.6340569257736206), ('milieuschade', 0.633036196231842), ('milieuvervuiling', 0.6289592981338501), ('milieuprobleem', 0.6240460872650146), ('watervervuiling', 0.613294243812561), ('bodemvervuiling', 0.6121982932090759)]

-----
 chelicerata
4469 [('chelifera', 0.6572232842445374), ('chelifer', 0.6368882656097412), ('cheliceren', 0.6359848976135254), ('furcula'

4486 [('gevolg', 0.9262756705284119), ('gevolg_milieuverontreiniging', 0.9202184677124023), ('oorzaak_gevolg_relatie', 0.8358011245727539), ('aanpassing_klimaatverandering', 0.7587807178497314), ('klimaatverandering', 0.7524397969245911), ('oorzaak', 0.7338491678237915), ('schade_gevolg_militair_oefening', 0.7333633303642273), ('invloed_verandering_klimaat', 0.7308892011642456), ('gevolg_lawaai_gezondheid', 0.7215567231178284), ('oorzaak_ongeluk', 0.718878984451294)]

-----
 klimaatbeleid
4487 [('energiebeleid', 0.7124946713447571), ('klimaatplan', 0.6959789991378784), ('klimaatprogramma', 0.6916925311088562), ('klimaatdoelstelling', 0.6808154582977295), ('klimaatactieplan', 0.6800957322120667), ('klimaatdoel', 0.6680597066879272), ('klimaatactie', 0.6622835397720337), ('klimaatverdrag', 0.6548985242843628), ('klimaatambitie', 0.6497784852981567), ('natuurbeleid', 0.6441910266876221)]

-----
 klimaatzone
4488 [('woudgebied_matigen_klimaatzone', 0.802932620048523), ('bos_matigen_klimaat

4506 [('eu', 0.9723073244094849), ('eg_verdrag', 0.6247749924659729), ('eg_beleid', 0.6173425912857056), ('eg_verordening', 0.6021721959114075), ('eg_richtlijn_afvalverwerking', 0.5964792370796204), ('eg_richtlijn', 0.5964369773864746), ('nl', 0.5951776504516602), ('eg_richtlijn_verpakking', 0.593039333820343), ('eg_richtlijn_biocide', 0.5926189422607422), ('ec', 0.5925281643867493)]

-----
 behoud_ex_situ
4507 [('ex', 0.8665891885757446), ('situ', 0.7021540403366089), ('aequo', 0.5753904581069946), ('cur', 0.5701894164085388), ('opl', 0.5427542328834534), ('nihilo', 0.5375293493270874), ('voto', 0.5370307564735413), ('ea', 0.533001184463501), ('re', 0.5328917503356934), ('element_groep_iv', 0.5231747627258301)]

-----
 overstromingsgevaar
4508 [('overstromingsrisico', 0.7405620813369751), ('overstroming', 0.7401817440986633), ('overstromingsgebied', 0.7129985690116882), ('overstromingsgevoelig', 0.6947077512741089), ('wateroverla', 0.6894090175628662), ('bescherming_overstroming', 0.6

4526 [('stedelijk_afvalwater', 0.900304913520813), ('huishoudelijk_afvalwater', 0.8864898085594177), ('afvalwater', 0.8827752470970154), ('industrieel_afvalwater', 0.8541948199272156), ('gemeentelijk_watervoorziening', 0.8428689241409302), ('organisch_afvalwater', 0.8280431032180786), ('gemeentelijk_waterbeheer', 0.8252485990524292), ('combineren_afvalwater', 0.8154471516609192), ('gemeentelijk_afval', 0.806013822555542), ('afvalwaterzuivering', 0.7958106994628906)]

-----
 nitraatrichtlijn
4527 [('nitraat', 0.6457894444465637), ('habitatrichtlijn', 0.6078662872314453), ('kaderrichtlijn', 0.6056349277496338), ('meststoffenwet', 0.6003507971763611), ('mestwetgeving', 0.5753827691078186), ('bemestingsnorm', 0.5719590187072754), ('habitatrichtlijngebied', 0.5604986548423767), ('mestbeleid', 0.5539541840553284), ('landbouwwetgeving', 0.5451147556304932), ('richtlijn_waterkwaliteit', 0.5450989007949829)]

-----
 organisch_bodemverbeteraar
4528 [('organisch', 0.8985841870307922), ('organisch

4548 [('landbouw', 0.8544491529464722), ('biotechnologie_landbouw', 0.843787431716919), ('voedselproductie_landbouw', 0.8289111256599426), ('landbouw_veehouderij', 0.8283773064613342), ('milieuwetgeving_betrekking_landbouw', 0.8084189295768738), ('intensief_landbouw', 0.8083142042160034), ('landbouw_milieu', 0.786211371421814), ('biologisch_landbouw', 0.7714463472366333), ('meteorologie', 0.7666175961494446), ('invloed_landbouw_milieu', 0.7595441341400146)]

-----
 ecologisch_ontwikkeling
4549 [('ecologisch', 0.905320405960083), ('ecologisch_inventarisatie', 0.8833140134811401), ('ecologisch_aanpassing', 0.8635703921318054), ('economisch_ecologisch_efficiëntie', 0.8633954524993896), ('ecologisch_ongelijkheid', 0.8610144257545471), ('ecologisch_voetafdruk', 0.8510012626647949), ('biologisch_ontwikkeling', 0.8491066694259644), ('ecologisch_evenwicht', 0.8466533422470093), ('technologisch_ontwikkeling', 0.8350939154624939), ('ecologisch_beschaving', 0.8246484398841858)]

-----
 toekennen_

4571 [('spons', 0.6765835285186768), ('sponsen', 0.6182262897491455), ('glasspons', 0.5874707102775574), ('schuurspons', 0.5554639101028442), ('beinkt', 0.5512620210647583), ('distressinkt', 0.5478513240814209), ('brusho', 0.5460612773895264), ('panpastel', 0.5429327487945557), ('versafine', 0.5426872968673706), ('stempelen', 0.5308207273483276)]

-----
 inventarisatie
4572 [('inventarisering', 0.7862417697906494), ('inventariseren', 0.7689880132675171), ('ecologisch_inventarisatie', 0.7563105225563049), ('inventarisatielijst', 0.7522665858268738), ('inventariser', 0.7337489128112793), ('asbestinventarisatie', 0.7237100005149841), ('inventarisatiefase', 0.6930948495864868), ('risicoinventarisatie', 0.6848450899124146), ('quickscan', 0.6574012637138367), ('inventarisatieformulier', 0.6566029787063599)]

-----
 bio_ethiek
4573 [('bio', 0.9457381963729858), ('bio_indicator', 0.942329466342926), ('bio_monitoring', 0.939181923866272), ('bio_accumulatie', 0.9346104264259338), ('productie_bio