# Generate word2vec model - include all new topic words

In [1]:
from gensim.models import Word2Vec, KeyedVectors
import gensim
import time
import numpy as np
from tqdm import tqdm
from pprint import pprint
import pickle
import spacy
import re
import operator
import spacy_udpipe

In [2]:
nlp = spacy.load('fi_experimental_web_md')

In [3]:
# set variables 
LANG = 'fi'
MAX_WORDS = 500000  # maximum processed words to small model 

MODEL_DIR = '/mnt/data/data/models-fasttext/'
TOPICS_DIR = '/home/dzon/kajo/topics/topic_lists-based_on_en-US/'

model_filename = MODEL_DIR + 'cc.'+ LANG +'.300-lemma_500k_min2.vec.bin'

excluded_model_name = MODEL_DIR + 'cc.'+ LANG +'.300-lemma_500k_min2_excluded.vec.bin'

model_orig_filename = MODEL_DIR + 'cc.'+ LANG +'.300.vec.bin'
model_orig_filename_vec = MODEL_DIR + 'cc.'+ LANG +'.300.vec.gz'

pickled_words_lemmas = MODEL_DIR + LANG + '_ft_all_words_lemmas.pickle'

lemma_list_file = TOPICS_DIR + 'topics_lemma_'+ LANG +'.lst'
nolemma_list_file = TOPICS_DIR + 'topics_'+ LANG +'.lst'

excluded_filename = TOPICS_DIR + 'topics_' + LANG + '-not_in_model.lst'

lemma_list_file_excluded = TOPICS_DIR + 'topics_lemma_excluded_' + LANG + '.lst'
nolemma_list_file_excluded = TOPICS_DIR + 'topics_excluded_' + LANG + '.lst'


In [4]:
# load the big model
model_big = KeyedVectors.load_word2vec_format(model_orig_filename, binary=True)

In [5]:
# process all words in fasttext model  takes ~1.5h for FI
all_words_lemmas = []

lemmas = {}
word_lemma = {}
words = model_big.index2word
for word in tqdm(words):
    # skip "words" which are not regular words
    if not re.fullmatch("([^\d\W])+", word):
        continue
    doc = nlp(word)
    lemma = doc[0].lemma_.lower()
    all_words_lemmas.append((word, lemma))
print("Number of words in big model: ", len(all_words_lemmas))

#save pickled dump 
with open(pickled_words_lemmas, 'wb') as f:
    pickle.dump(all_words_lemmas, f)

100%|██████████| 2000000/2000000 [2:42:02<00:00, 205.71it/s]  


Number of words in big model:  1746550


In [6]:
#load pickled lemma list
with open(pickled_words_lemmas, 'rb') as f:
    all_words_lemmas = pickle.load(f)
pprint(all_words_lemmas[:50])

[('ja', 'ja'),
 ('on', 'olla'),
 ('oli', 'olla'),
 ('ei', 'ei'),
 ('että', 'että'),
 ('myös', 'myös'),
 ('tai', 'tai'),
 ('Lisätiedot', 'lisätieto'),
 ('ovat', 'olla'),
 ('mutta', 'mutta'),
 ('joka', 'joka'),
 ('se', 'se'),
 ('sekä', 'sekä'),
 ('n', 'n'),
 ('vuonna', 'vuosi'),
 ('kun', 'kun'),
 ('hän', 'hän'),
 ('sen', 'se'),
 ('ole', 'olla'),
 ('kuin', 'kuin'),
 ('niin', 'niin'),
 ('kanssa', 'kanssa'),
 ('voi', 'voi'),
 ('kello', 'kello'),
 ('Hän', 'hän'),
 ('mukaan', 'mukaan'),
 ('jälkeen', 'jälkeen'),
 ('klo', 'klo'),
 ('jo', 'jo'),
 ('Suomen', 'suomi'),
 ('vain', 'vain'),
 ('s', 's'),
 ('ollut', 'olla'),
 ('olla', 'olla'),
 ('p', 'p'),
 ('vuoden', 'vuosi'),
 ('jossa', 'joka'),
 ('sitä', 'se'),
 ('jonka', 'joka'),
 ('_', '_'),
 ('jotka', 'joka'),
 ('kuitenkin', 'kuitenkin'),
 ('vielä', 'vielä'),
 ('jos', 'jos'),
 ('nyt', 'nyt'),
 ('eli', 'eli'),
 ('of', 'of'),
 ('sitten', 'sitten'),
 ('noin', 'noin'),
 ('Se', 'se')]


In [7]:
# generate helpful dictionaries/lists
big_lemmas_set = set([l for (_,l) in all_words_lemmas])
print(len(big_lemmas_set))

big_words_set = set([w for (w,_) in all_words_lemmas])
print(len(big_words_set))

lemmas = {}
words_lower_orig = {}
big_lemma_word_dic = {}
big_word_lemma_dic = {}
for (w,l) in all_words_lemmas:
    big_word_lemma_dic[w] = l
    
    #dictionary of lowercase word -> all original words
    if w.lower() in words_lower_orig:
        words_lower_orig[w.lower()].append(w)
    else:
        words_lower_orig[w.lower()] = [w]
        
    if l in big_lemma_word_dic:
        big_lemma_word_dic[l].append(w)
        lemmas[l] += 1
    else:
        big_lemma_word_dic[l] = [w]
        lemmas[l] = 1
        
# load all the words from big model
words = model_big.wv.index2word
words_lower = [w.lower() for w in words]

#words_lemma = model_lemma_big.index2word       

746051
1746550




In [8]:
# sort the lemmas from most frequent
sorted_lemmas = sorted(lemmas.items(), key=operator.itemgetter(1), reverse=True)
# trying first words
sorted_lemmas[:20]

[('olla', 624),
 ('saada', 473),
 ('tehdä', 439),
 ('käyttää', 377),
 ('antaa', 336),
 ('esittää', 327),
 ('tulla', 311),
 ('hyvä', 310),
 ('pitää', 309),
 ('valmistaa', 304),
 ('ottaa', 299),
 ('valita', 286),
 ('tietää', 284),
 ('nähdä', 283),
 ('haluta', 280),
 ('lukea', 273),
 ('mennä', 269),
 ('ostaa', 268),
 ('kirjoittaa', 264),
 ('katsoa', 261)]

In [9]:
# create vectors for the small models - average vectors for lemmas
# process only first MAX_WORDS in the big model
tmp_words = [None] * len(model_big.wv.index2word)
tmp_vecs = [None] * len(model_big.wv.index2word) 
for i,(word,lemma) in enumerate(all_words_lemmas[:MAX_WORDS]):
    lemma_words_list = big_lemma_word_dic[lemma]
    # add only lemmas made from at least 2 words
    if len(lemma_words_list)<2:
        continue
    tmp_vectors = []
    tmp_indexes = []
    error_with_word = False
    for word2 in lemma_words_list:
        try:
            tmp_vectors.append(model_big[word2])  
            tmp_indexes.append(model_big.vocab[word2].index)
        except:
            print(i, "error with ", word, " lemma ", lemma, "words", lemma_words_list)
            error_with_word = True
            continue
    if not error_with_word:
        try:
            tmp_words[min(tmp_indexes)] = lemma
            tmp_vecs[min(tmp_indexes)] = list(np.average(tmp_vectors, axis=0))
        except:
            print(i, "error with lemma ", lemma, " - words", lemma_words_list, " indexes: ", tmp_indexes)
            # note - we are processing first MAX_WORDS from the model after the filter out of the "non-words"
            # so some of the last words in that range may refer to words on bigger index than MAX_WORDS

# filter the lists (some positions remained None)
final_words = [i for i in tmp_words if i] 
final_vecs = [i for i in tmp_vecs if i != None] 

print(len(final_vecs), len(final_words))
len(final_vecs[0])  

del tmp_vecs
del tmp_words

  This is separate from the ipykernel package so we can avoid doing imports until
  after removing the cwd from sys.path.


108350 108350


In [10]:
# create new gensim word2vec model with the vectors:
new_vector_space = gensim.models.keyedvectors.Word2VecKeyedVectors(300)
new_vector_space.add(final_words,final_vecs)

In [14]:
# test the model
pprint(new_vector_space.most_similar('isä'))
pprint(new_vector_space.most_similar_cosmul(positive=['nainen', 'kuningas'], negative=['mies']))

[('äiti', 0.8811246752738953),
 ('poika', 0.852703332901001),
 ('veli', 0.8099314570426941),
 ('tytär', 0.8042938709259033),
 ('lapsi', 0.7681261897087097),
 ('ukki', 0.7546637654304504),
 ('vanhempi', 0.7475104331970215),
 ('isoisä', 0.7442623376846313),
 ('sisko', 0.7412679195404053),
 ('iskä', 0.7375667095184326)]
[('kuningatar', 0.8673739433288574),
 ('kuninkaallinen', 0.8453649878501892),
 ('kuningataräiti', 0.843066930770874),
 ('hallitsija', 0.8396105170249939),
 ('kuninkuus', 0.8304585814476013),
 ('kuninkaanvalta', 0.825010359287262),
 ('ruhtinas', 0.8243961930274963),
 ('kuninkaanlinna', 0.8229613304138184),
 ('kuningaspari', 0.8216860890388489),
 ('suurkuningas', 0.8214312195777893)]


In [15]:
# save the model
new_vector_space.save_word2vec_format(model_filename, binary=True)

In [16]:
#model = KeyedVectors.load_word2vec_format(model_filename, binary=True)
model = new_vector_space
words_model = model.wv.index2word

  This is separate from the ipykernel package so we can avoid doing imports until


In [17]:
# load topic listst
with open(nolemma_list_file) as fp:
    topics_nolemma = fp.readlines() 
print(len(topics_nolemma))
    
# load the lemma list
# with open(lemma_list_file) as fp:
#    topics = fp.readlines()
# print(len(topics))

topics = []
# generate the lemma list
for topic in tqdm(topics_nolemma):
    topic = re.sub('\W',' ',topic)
    topic = re.sub('\ +',' ',topic)
    doc = nlp(topic.strip().lower())
    lemmas = []
        
    for token in doc:
        if token.is_stop:
            continue
        lemmas.append(token.lemma_)    
    if len(lemmas) == 0:
        print('lemmas = 0 ', topics_nolemma)
    topics.append("_".join(lemmas))
    
print(len(topics))    
    
#write the lemma topic list
with open(lemma_list_file, 'wt', encoding='utf8') as f:
    for topic_lemma in topics:
        f.write(topic_lemma + "\n")    

  0%|          | 1/5305 [00:00<12:20,  7.17it/s]

5305


 78%|███████▊  | 4163/5305 [00:16<00:03, 288.24it/s]

lemmas = 0  ['paikallinen kehitys\n', 'maaseuturakentaminen\n', 'vesitalous\n', 'koulutustaso\n', 'yleissivistävä koulutus\n', 'rantapenger\n', 'yhteisöoikeus\n', 'kulttuuriperintö\n', 'viljelysmaa, maatalousmaa\n', 'maatalousmaisema\n', 'maataloustuotanto\n', 'taloudellinen kehitys\n', 'ravintoketju\n', 'elintarviketeollisuus\n', 'ruuan laatu\n', 'globaali lämpeneminen\n', 'kasvihuoneilmiö\n', 'elinkeinoelämän kehitys\n', 'työmarkkinat\n', 'pääsy maa-alueelle\n', 'uusjako, tilusten sijoitus\n', 'maankäytön suunnittelu\n', 'maisema-arkkitehtuuri\n', 'maisemansuunnittelu\n', 'maankäyttö\n', 'kaavoitus, maankäytön suunnittelu\n', 'meriympäristö\n', 'luonnonsuojelu\n', 'luonnonsuojelu\n', 'biodynaaminen viljely\n', 'fyysinen suunnittelu\n', 'alkeisopetus, perusasteen koulutus\n', 'autoteollisuus\n', 'elämänlaatu\n', 'aluekehitys\n', 'resurssijohtaminen\n', 'maaseutuväestö\n', 'keskiasteen koulutus\n', 'maan tiivistys\n', 'maan kasvukunnon heikkeneminen\n', 'maaeroosio\n', 'kestävä kehitys

 81%|████████  | 4305/5305 [00:16<00:03, 267.77it/s]

lemmas = 0  ['paikallinen kehitys\n', 'maaseuturakentaminen\n', 'vesitalous\n', 'koulutustaso\n', 'yleissivistävä koulutus\n', 'rantapenger\n', 'yhteisöoikeus\n', 'kulttuuriperintö\n', 'viljelysmaa, maatalousmaa\n', 'maatalousmaisema\n', 'maataloustuotanto\n', 'taloudellinen kehitys\n', 'ravintoketju\n', 'elintarviketeollisuus\n', 'ruuan laatu\n', 'globaali lämpeneminen\n', 'kasvihuoneilmiö\n', 'elinkeinoelämän kehitys\n', 'työmarkkinat\n', 'pääsy maa-alueelle\n', 'uusjako, tilusten sijoitus\n', 'maankäytön suunnittelu\n', 'maisema-arkkitehtuuri\n', 'maisemansuunnittelu\n', 'maankäyttö\n', 'kaavoitus, maankäytön suunnittelu\n', 'meriympäristö\n', 'luonnonsuojelu\n', 'luonnonsuojelu\n', 'biodynaaminen viljely\n', 'fyysinen suunnittelu\n', 'alkeisopetus, perusasteen koulutus\n', 'autoteollisuus\n', 'elämänlaatu\n', 'aluekehitys\n', 'resurssijohtaminen\n', 'maaseutuväestö\n', 'keskiasteen koulutus\n', 'maan tiivistys\n', 'maan kasvukunnon heikkeneminen\n', 'maaeroosio\n', 'kestävä kehitys

 87%|████████▋ | 4624/5305 [00:17<00:02, 285.62it/s]

lemmas = 0  ['paikallinen kehitys\n', 'maaseuturakentaminen\n', 'vesitalous\n', 'koulutustaso\n', 'yleissivistävä koulutus\n', 'rantapenger\n', 'yhteisöoikeus\n', 'kulttuuriperintö\n', 'viljelysmaa, maatalousmaa\n', 'maatalousmaisema\n', 'maataloustuotanto\n', 'taloudellinen kehitys\n', 'ravintoketju\n', 'elintarviketeollisuus\n', 'ruuan laatu\n', 'globaali lämpeneminen\n', 'kasvihuoneilmiö\n', 'elinkeinoelämän kehitys\n', 'työmarkkinat\n', 'pääsy maa-alueelle\n', 'uusjako, tilusten sijoitus\n', 'maankäytön suunnittelu\n', 'maisema-arkkitehtuuri\n', 'maisemansuunnittelu\n', 'maankäyttö\n', 'kaavoitus, maankäytön suunnittelu\n', 'meriympäristö\n', 'luonnonsuojelu\n', 'luonnonsuojelu\n', 'biodynaaminen viljely\n', 'fyysinen suunnittelu\n', 'alkeisopetus, perusasteen koulutus\n', 'autoteollisuus\n', 'elämänlaatu\n', 'aluekehitys\n', 'resurssijohtaminen\n', 'maaseutuväestö\n', 'keskiasteen koulutus\n', 'maan tiivistys\n', 'maan kasvukunnon heikkeneminen\n', 'maaeroosio\n', 'kestävä kehitys

100%|██████████| 5305/5305 [00:20<00:00, 261.38it/s]

5305





In [18]:
print(len(topics),len(topics_nolemma))  

5305 5305


In [19]:
#try if the topic-lemma words exist in the models  

words_to_manual_add = {}

for i, (topic, topic_nolemma) in enumerate(zip(topics, topics_nolemma)):
    # process the nolemma topic so we can see which word was lemmatized to which lemma
    topic_nolemma = re.sub('\W',' ',topic_nolemma)
    topic_nolemma = re.sub('\ +',' ',topic_nolemma)
    doc = nlp(topic_nolemma.strip().lower())
    nolemmas = []
    for token in doc:
        if token.is_stop:
            continue
        else:
            nolemmas.append(token.text)  
    
    topic = topic.strip()
    topic_words = topic.split('_')
    if len(topic_words) != len(nolemmas):
        print("!!!!! error - not equal length: ", nolemmas, topic_words)
        continue
    for word, word_nolemma in zip(topic_words, nolemmas):
        #print(word)
        found = 0
        if word in words_model:
            found = 1
            #print("l1")
        elif word in big_lemmas_set:
            found = 1
            print("l2", word)
        elif word in words_lower:
            found = 1
            print("l3", word)
        # nolemma words are in PL case probably not needed and all lemmas exist in lemma list
        elif word_nolemma in words_model:
            found = 1
            print("w1", word)
        elif word_nolemma in big_lemmas_set:
            found = 1
            print("w2", word)
        elif word_nolemma in words_lower:
            found = 1
            print("w3", word)

        if found == 0:
            print(i, 'needs to be added manually: ', word, " - ", word_nolemma, " - ", topic_nolemma.strip())
            if word not in words_to_manual_add:
                words_to_manual_add[word] = topic_nolemma.strip()
                    
print(len(words_to_manual_add))          

l2 rantapenger
l2 yhteisöoikeus
l2 maatalousmaisema
23 needs to be added manually:  maisemansuunnittelu  -  maisemansuunnittelu  -  maisemansuunnittelu
35 needs to be added manually:  resurssijohtaminen  -  resurssijohtaminen  -  resurssijohtaminen
40 needs to be added manually:  maaeroosio  -  maaeroosio  -  maaeroosio
l2 vesieroosio
l2 tuulieroosio
l2 ympäristömuutos
63 needs to be added manually:  moottoriajoneuvoteollisuus  -  moottoriajoneuvoteollisuus  -  moottoriajoneuvoteollisuus
64 needs to be added manually:  maaseutusuunnittelu  -  maaseutusuunnittelu  -  maaseutusuunnittelu
l2 luonnonsuojelujärjestö
76 needs to be added manually:  ruuanjalostusteollisuus  -  ruuanjalostusteollisuus  -  ruuanjalostusteollisuus
83 needs to be added manually:  luonnonsuojelupolitiikka  -  luonnonsuojelupolitiikka  -  luonnonsuojelupolitiikka
w2 Eurooppa
l2 luonnonsuojeluohjelma
l2 luonnonsuojelulainsäädäntö
96 needs to be added manually:  tuotantokeino  -  tuotantokeinot  -  maatalouden tuotan

630 needs to be added manually:  ympäristönseuranta  -  ympäristönseuranta  -  ympäristönseuranta
635 needs to be added manually:  johtamissuunnitelma  -  johtamissuunnitelma  -  hallintasuunnitelma johtamissuunnitelma
l2 selluloosateollisuus
l2 finanssioppi
654 needs to be added manually:  maanviljelyskoneisto  -  maanviljelyskoneisto  -  maanviljelyskoneisto
l2 terveydenhuoltolainsäädäntö
661 needs to be added manually:  teollisuustaloustiede  -  teollisuustaloustiede  -  teollisuustaloustiede toimialatutkimus
661 needs to be added manually:  toimialatutkimus  -  toimialatutkimus  -  teollisuustaloustiede toimialatutkimus
673 needs to be added manually:  tyhjiöteollisuus  -  tyhjiöteollisuus  -  tyhjiöteollisuus
674 needs to be added manually:  eläingenetiikka  -  eläingenetiikka  -  eläingenetiikka
680 needs to be added manually:  yhteistyöpolitiikka  -  yhteistyöpolitiikka  -  yhteistyöpolitiikka
l2 metsätaloustiede
685 needs to be added manually:  kaksoistalous  -  kaksoistalous  

1034 needs to be added manually:  ympäristörikkomus  -  ympäristörikkomus  -  ympäristörikkomus
1038 needs to be added manually:  kaukoanalyysi  -  kaukoanalyysi  -  kaukokartoitus kaukoanalyysi
l2 eläinvahinko
1042 needs to be added manually:  metsävaurio  -  metsävaurio  -  metsävaurio
1044 needs to be added manually:  teollisuuspäästö  -  teollisuuspäästö  -  teollisuuden jätevesi teollisuuspäästö
l2 kasviyhdyskunta
1050 needs to be added manually:  kuminjalostus  -  kuminjalostus  -  kuminjalostus
1056 needs to be added manually:  vedensaaste  -  vedensaaste  -  vedensaaste
l2 oikeusvertailu
1070 needs to be added manually:  dokumentointijärjestelmä  -  dokumentointijärjestelmä  -  dokumentointijärjestelmä
l2 yrityspolitiikka
l2 ympäristöetiikka
1088 needs to be added manually:  hätäoikeus  -  hätäoikeus  -  hätäoikeus pakkotilaoikeus poikkeuslaki
1088 needs to be added manually:  pakkotilaoikeus  -  pakkotilaoikeus  -  hätäoikeus pakkotilaoikeus poikkeuslaki
l2 rannikkokalastus
l2

1528 needs to be added manually:  työonnettomuus  -  työonnettomuus  -  työonnettomuus
l2 talonvaltaaja
l2 kartografinen
1545 needs to be added manually:  ympäristökemikaali  -  ympäristökemikaaleja  -  ympäristökemikaaleja koskeva lainsäädäntö
1547 needs to be added manually:  meriluonnonvara  -  meriluonnonvarojen  -  meriluonnonvarojen suojelu
1552 needs to be added manually:  estuaariekosysteemi  -  estuaariekosysteemi  -  estuaariekosysteemi
1557 needs to be added manually:  kaukokartoituskeskus  -  kaukokartoituskeskus  -  kaukokartoituskeskus
1567 needs to be added manually:  juomavesivarasto  -  juomavesivarasto  -  juomavesivarasto
1570 needs to be added manually:  ympäristövalmiussuunnitelma  -  ympäristövalmiussuunnitelma  -  ympäristövalmiussuunnitelma
1571 needs to be added manually:  meriluonnonsuojelualiue  -  meriluonnonsuojelualiue  -  meriluonnonsuojelualiue
1574 needs to be added manually:  teollisuuskasvi  -  teollisuuskasvi  -  teollisuuskasvi
1579 needs to be adde

1835 needs to be added manually:  saastumaton  -  saastumattoman  -  saastumattoman ilman alue
1837 needs to be added manually:  ympäristönäytepankki  -  ympäristönäytepankki  -  ympäristönäytepankki
1838 needs to be added manually:  valintajalostus  -  valintajalostus  -  eläinten valintajalostus
1840 needs to be added manually:  ympäristönsuojeluneuvonta  -  ympäristönsuojeluneuvonta  -  ympäristönsuojeluneuvonta
l2 kuivatusjärjestelmä
1856 needs to be added manually:  jätekaasu  -  jätekaasu  -  jätekaasu
1860 needs to be added manually:  muuntamistekniikka  -  muuntamistekniikka  -  jätteen muuntamistekniikka
1862 needs to be added manually:  populaatiostatistikka  -  populaatiostatistikka  -  luonnonvaraisen eliöstön populaatiostatistikka
1866 needs to be added manually:  saastumisalue  -  saastumisalue  -  mahdollinen saastumisalue
1867 needs to be added manually:  joensuualue  -  joensuualue  -  suojeltava joensuualue
1868 needs to be added manually:  viitetietojärjestelmä  -  v

2205 needs to be added manually:  liikalaiduntaminen  -  liikalaiduntaminen  -  liikalaiduntaminen
2206 needs to be added manually:  koralliriuttalaguuni  -  koralliriuttalaguuni  -  koralliriuttalaguuni
l2 hätämajoitus
l2 sedimenttikivilaji
2216 needs to be added manually:  lentohiekkasärkkä  -  lentohiekkasärkkä  -  dyyni lentohiekkasärkkä
l2 höyrynkehitin
l2 höyrygeneraattori
2224 needs to be added manually:  vattialue  -  vattialue  -  vattialue Waddenzee
2224 needs to be added manually:  waddenzee  -  waddenzee  -  vattialue Waddenzee
l2 aluskerros
l2 peruspohja
2228 needs to be added manually:  ravintoekologia  -  ravintoekologia  -  ravintoekologia
l2 lehtikato
2242 needs to be added manually:  suurkasvi  -  suurkasvi  -  suurkasvi makrofyytti
2242 needs to be added manually:  makrofyytti  -  makrofyytti  -  suurkasvi makrofyytti
2246 needs to be added manually:  analyysiohjelma  -  analyysiohjelma  -  analyysiohjelma
2248 needs to be added manually:  substraattiviljely  -  subs

l2 päästönormi
2692 needs to be added manually:  saasteenesto  -  saasteenesto  -  saasteenesto
2702 needs to be added manually:  proteiinituote  -  proteiinituote  -  proteiinituote
l2 kenttäkoe
2712 needs to be added manually:  kivennäistiede  -  kivennäistiede  -  mineralogia kivennäistiede
l2 reaktiokinetiikka
2716 needs to be added manually:  kaivauskasa  -  kaivauskasa  -  kaivauskasa
l2 hedelmäkasvi
2727 needs to be added manually:  biogeokemiallinen  -  biogeokemiallinen  -  biogeokemiallinen kierto
w1 Afrikka
l2 happosade
l2 hydrogeologi
l2 kuunteluasema
2742 needs to be added manually:  kannustinrahasto  -  kannustinrahasto  -  kannustinrahasto
l2 tekokuu
2744 needs to be added manually:  nestemekaniikka  -  nestemekaniikka  -  hydrauliikka nestemekaniikka
2748 needs to be added manually:  suurvahinko  -  suurvahinko  -  ihmisen aiheuttama suurvahinko
l2 autoasema
2753 needs to be added manually:  saastearviointi  -  saastearviointi  -  saastearviointi
l2 vesirakennustekniikk

l2 kolloidi
3261 needs to be added manually:  onsilo  -  onsilo  -  onsilo
l2 liikennepäästö
3263 needs to be added manually:  päällyskasvusto  -  päällyskasvusto  -  päällyskasvusto perifyton
3263 needs to be added manually:  perifyton  -  perifyton  -  päällyskasvusto perifyton
3272 needs to be added manually:  lahontorjunta  -  lahontorjunta  -  lahontorjunta puun kyllästys lahonsuoja aineella
3272 needs to be added manually:  lahonsuoja  -  lahonsuoja  -  lahontorjunta puun kyllästys lahonsuoja aineella
3274 needs to be added manually:  työntövoimatekniikka  -  työntövoimatekniikka  -  työntövoimatekniikka
3276 needs to be added manually:  vaatimuslaji  -  vaatimuslaji  -  vaatimuslaji
l2 metallijäte
3281 needs to be added manually:  seurantatekniikka  -  seurantatekniikka  -  seurantatekniikka
l2 liikakalastus
l2 ekotyyppi
3290 needs to be added manually:  paikallistyyppi  -  paikallistyyppi  -  ekotyyppi paikallistyyppi
3293 needs to be added manually:  ilmamelu  -  ilmamelu  -  

3686 needs to be added manually:  valuuttasuhde  -  valuuttasuhteet  -  valuuttasuhteet rahasuhteet
3686 needs to be added manually:  rahasuhde  -  rahasuhteet  -  valuuttasuhteet rahasuhteet
3687 needs to be added manually:  pakkotoimenpide  -  pakkotoimenpiteet  -  pakkotoimenpiteet
l2 halogenoida
3694 needs to be added manually:  valintajalostus  -  valintajalostus  -  kasvien valintajalostus
l2 bensiiniasema
l2 muistilaite
l2 liikennemelu
3709 needs to be added manually:  sytotoksisuus  -  sytotoksisuus  -  sytotoksisuus
3712 needs to be added manually:  asumisjäte  -  asumisjäte  -  talousjätteet asumisjäte
3715 needs to be added manually:  vesistötiede  -  vesistötiede  -  vesistötiede limnologia
l2 linkoaminen
3724 needs to be added manually:  minimointimahdollisuus  -  minimointimahdollisuudet  -  jätteen minimointimahdollisuudet
3725 needs to be added manually:  saasteanalyysi  -  saasteanalyysi  -  saasteanalyysi
l2 avolouhinta
l2 ylikansoitus
l2 hiekkatasanko
3732 needs to b

4095 needs to be added manually:  liuonnut  -  liuonnut  -  liuonnut happi
l2 pölynpoisto
4103 needs to be added manually:  jäännösanalyysi  -  jäännösanalyysi  -  jäännösanalyysi
l2 tavaraluettelo
l2 parasiitti
l2 polysyklinen
l2 saniteettilaite
l2 etologia
l2 säteilysairaus
l2 ioninvaihto
!!!!! error - not equal length:  [] ['']
4122 needs to be added manually:  sopetuvat  -  sopetuvat  -  sopetuvat lajit
l2 hajoamaton
l2 rasvahakuinen
w1 DNA
l2 biotekninen
l2 saastuttamaton
l2 saastepäästö
4136 needs to be added manually:  tulvasuojeluallas  -  tulvasuojeluallas  -  tulvasuojeluallas
4138 needs to be added manually:  valkaisusavi  -  valkaisusavi  -  valkaisusavi valkaisumaa
4138 needs to be added manually:  valkaisumaa  -  valkaisumaa  -  valkaisusavi valkaisumaa
4139 needs to be added manually:  säilytystankki  -  säilytystankki  -  hiilivedyn säilytystankki
l2 yliäänipamaus
4141 needs to be added manually:  äänivallipamaus  -  äänivallipamaus  -  yliäänipamaus äänivallipamaus
l2 

l2 saastuttamaton
4493 needs to be added manually:  kierrätyssuhde  -  kierrätyssuhde  -  kierrätyssuhde
l2 alkeistumallinen
l2 kaukolaina
4503 needs to be added manually:  todistelumenettely  -  todistelumenettely  -  todistelumenettely todisteiden talteenotto
4506 needs to be added manually:  öljynporausgeologi  -  öljynporausgeologia  -  öljynporausgeologia
4508 needs to be added manually:  suodatuspuristuskakku  -  suodatuspuristuskakku  -  suodatuspuristuskakku
4509 needs to be added manually:  pölyimmissio  -  pölyimmissio  -  pölyimmissio
l2 destruktio
4513 needs to be added manually:  ilmavoimajohto  -  ilmavoimajohto  -  ilmavoimajohto
l2 furaani
4518 needs to be added manually:  alisyklinen  -  alisyklinen  -  alisyklinen hiilivety
w1 Amerikka
4523 needs to be added manually:  saastenormi  -  saastenormi  -  saastenormi
l2 avustusmääräraha
4529 needs to be added manually:  halkeamisreaktio  -  halkeamisreaktio  -  atomiytimen halkeamisreaktio
4530 needs to be added manually: 

4956 needs to be added manually:  ontogenia  -  ontogenia  -  yksilönkehitys ontogenia
l2 patikkapolku
l2 kyllästysaine
l2 järjellisyys
4972 needs to be added manually:  sisäeritysoppi  -  sisäeritysoppi  -  sisäeritysoppi
l2 suolasuo
4975 needs to be added manually:  suolakenttä  -  suolakenttä  -  suolajärvi suolasuo suolakenttä
4977 needs to be added manually:  impaktori  -  impaktori  -  impaktori
4980 needs to be added manually:  karsinogeenisyys  -  karsinogeenisyys  -  karsinogeenisyys
4985 needs to be added manually:  tulivuoritiede  -  tulivuoritiede  -  tulivuoritiede vulkanologia
l2 vulkanologi
l2 lasivilla
l2 syövytys
l2 geotekniikka
4998 needs to be added manually:  jäätiköntutkimus  -  jäätiköntutkimus  -  jäätiköntutkimus jäätikkötiede
l2 jäätikkötiede
5002 needs to be added manually:  karsinogeenisyyskoe  -  karsinogeenisyyskoe  -  karsinogeenisyyskoe
5003 needs to be added manually:  jätteenpolttouuni  -  jätteenpolttouuni  -  jätteenpolttouuni
5008 needs to be added m

l2 astunta
5289 needs to be added manually:  polyklooribentsofuraani  -  polyklooribentsofuraani  -  polyklooribentsofuraani
l2 norsueläin
l2 bioetiikka
w1 YK
l2 kehityskonferenssi
l2 bioreaktori
l2 bioturvallisuus
872


In [20]:
# for manual correcting of words
pprint(words_to_manual_add)

{'aerosolipullo': 'aerosolipullo spraypurkki',
 'agroekosysteemi': 'agroekosysteemi',
 'agronominen': 'agronominen lisäaine',
 'aikabudjetti': 'aikabudjetti',
 'aineenkoestus': 'aineenkoestus',
 'ainejäämä': 'torjunta ainejäämä',
 'ainemenekki': 'ainemenekki',
 'ainevalvonta': 'torjunta ainevalvonnan normi',
 'aktinidi': 'aktinidi',
 'alatili': 'alatili',
 'alisyklinen': 'alisyklinen yhdiste',
 'alkalimaa': 'emäksinen maa alkalimaa',
 'aluelainsäädäntö': 'aluelainsäädäntö',
 'alumiinisäiliö': 'alumiinisäiliö',
 'amalgaama': 'amalgaama',
 'ammoniakkiutuminen': 'ammonifikaatio ammoniakkiutuminen',
 'analyysiohjelma': 'analyysiohjelma',
 'anomusoikeus': 'anomusoikeus',
 'asbestisementti': 'asbestisementti',
 'assimilaatiokyky': 'jätteen assimilaatiokyky',
 'asukasjakauma': 'asukasjakauma',
 'asumisjäte': 'talousjätteet asumisjäte',
 'asuntorahoituspalvelu': 'omaisuus ja asuntorahoituspalvelut',
 'asutusohjelma': 'asutusohjelma',
 'asutustarve': 'asutustarve',
 'atomiräjähdys': 'atomiräjäh

 'kauppajärjestely': 'kuplapolitiikka päästöjä koskeva kauppajärjestely',
 'kaupunkimelu': 'kaupunkimelu',
 'kaupunkitoimintaohjelma': 'kaupunkitoimintaohjelma',
 'kehityskaava': 'kehityskaava',
 'kehityssuunnittelu': 'kehityssuunnittelu',
 'keijusto': 'keijusto plankton',
 'keinoaine': 'keinoaine tekoaine',
 'keinoaineteollisuus': 'keinoaineteollisuus',
 'keinokasteluviljely': 'keinokasteluviljely',
 'keittolaite': 'kuumennin lämmitin keittolaite',
 'kemisorptio': 'kemisorptio kemiallinen adsorptio',
 'kertamenetelmä': 'kertamenetelmä eräprosessi',
 'kesantomaa': 'kesantomaa',
 'keskuspuistoalue': 'keskuspuistoalue',
 'kestohyödyke': 'kestokulutushyödyke kestohyödyke',
 'kidetiede': 'kidetiede',
 'kierrätyssuhde': 'kierrätyssuhde',
 'kiertoposti': 'kiertoposti',
 'kiertouuni': 'kiertouuni viertouuni',
 'kilpailukoe': 'kilpailukoe',
 'kirjaamisvelvollisuus': 'kirjaamisvelvollisuus',
 'kirjallisuustietopankki': 'kirjallisuustietopankki',
 'kirjanpitomenetelmä': 'kirjanpitomenetelmä',
 '

In [38]:
# the lemmas not in model were manually checked if they exist in other models in some variation
word = "fytomassa"
print(word)
try:
    model[word]
    print('model')
    pprint(model.most_similar(word))
except:
    pass

if word in big_lemmas_set:
    print('model_lemma_big', big_lemma_word_dic[word])

try:
    model_big[word]
    print('model big')
    pprint(model_big.most_similar(word))
except:
    pass

# if the original word with uppercase
if word in words_lower_orig:
    print('model big LOWER', words_lower_orig[word])
    pprint(model_big.most_similar(words_lower_orig[word]))
    

fytomassa


In [22]:
# for cases the lemmas aren't correct or don't exist in the dic
# manually made dictionary of "lemma" : "word which exists in some model" or "word1;word2" for the average
# e.g. 'mikroekosystém': 'mikro;ekosystém', 'bahný': 'bahno'
new_words_manually_checked = {}
    
len(new_words_manually_checked)

0

In [23]:
# function which finds the word in all the available models and returns it's vector (average vector)
def get_vector(word):
    # word is in small model
    try:
        return model[word]
    except:
        pass
    
    # word is in lemmas from big model - return average if the lemma was result of more words
    if word in big_lemmas_set:
        lemma_words_list = big_lemma_word_dic[word]
        tmp_vectors = []
        for word2 in lemma_words_list:
            tmp_vectors.append(model_big[word2])  
        return np.average(tmp_vectors, axis=0)

    try:
        return model_big[word]
    except:
        pass
    
    # if the original word with uppercase
    if word in words_lower_orig:
        orig_words_list = words_lower_orig[word]
        tmp_vectors = []
        for word2 in orig_words_list:
            tmp_vectors.append(model_big[word2])  
        return np.average(tmp_vectors, axis=0)

        #return model_big[words_lower_orig[word]]
    
    return []

In [24]:
# check if the word vectors are the same
#get_vector('Antarktyki') == get_vector('antarktyki')
get_vector('διβενζοφουράνιο')

[]

In [25]:
# ading words from manually checked list
new_vectors = []
new_words = []
for i, word in enumerate(new_words_manually_checked.keys()):
    
    tmp_vectors = []
    print(i, word)
    for tmp_word in new_words_manually_checked[word].split(';'):
        vector = get_vector(tmp_word)
        if vector != []:
            tmp_vectors.append(vector)
        else:
            print("XXX - some ERROR, word doesn't have vector, cannot add: ", tmp_word)
    if word not in new_words:
        new_vectors.append(np.average(tmp_vectors, axis=0))
        new_words.append(word)
print(len(new_vectors),len(new_words))        

0 0


In [26]:
# add new words to the model
if len(new_words) > 0:
    model.add(new_words,new_vectors)

In [27]:
print(len(topics),len(topics_nolemma))  

5305 5305


In [28]:
# 2nd run - checking if there are still unavailable words in topics
excluded_topics = []
#try if the topic-lemma words exist in the model   

for i, (topic, topic_nolemma) in enumerate(zip(topics, topics_nolemma)):
    # process the nolemma topic so we can see which word was lemmatized to which lemma
    topic_nolemma_orig = topic_nolemma.strip()
    topic_nolemma = re.sub('\W',' ',topic_nolemma)
    topic_nolemma = re.sub('\ +',' ',topic_nolemma)
    doc = nlp(topic_nolemma.strip().lower())
    nolemmas = []
    for token in doc:
        if token.is_stop:
            continue
        else:
            nolemmas.append(token.text)  
    
    topic_words = topic.split('_')
    
    if len(topic_words) != len(nolemmas):
        print("!!!!! error - not equal length: ", nolemmas, topic_words)
        continue
        
    found = 1
    for word, word_nolemma in zip(topic_words, nolemmas):
    #for word in topic_words:
        #print(word)
       
        vector = get_vector(word)
        if vector == []:
            print('nonexistend word: ', word, " - ", topic_nolemma)
            vector2 = get_vector(word_nolemma)
            if vector2 == []:
                found = 0
                print('nonexistend word: ', word_nolemma, " - ", topic_nolemma)
            else:
                print("Exist nolemma")

    if found == 0:
        print('!!! topic needs to be excluded: ', topic_nolemma_orig)
        if topic_nolemma.strip() not in excluded_topics:
            excluded_topics.append(topic_nolemma_orig)
                    
print(len(excluded_topics)) 

nonexistend word:  maisemansuunnittelu  -  maisemansuunnittelu 
nonexistend word:  maisemansuunnittelu  -  maisemansuunnittelu 
!!! topic needs to be excluded:  maisemansuunnittelu
nonexistend word:  resurssijohtaminen  -  resurssijohtaminen 
nonexistend word:  resurssijohtaminen  -  resurssijohtaminen 
!!! topic needs to be excluded:  resurssijohtaminen
nonexistend word:  maaeroosio  -  maaeroosio 
nonexistend word:  maaeroosio  -  maaeroosio 
!!! topic needs to be excluded:  maaeroosio




nonexistend word:  moottoriajoneuvoteollisuus  -  moottoriajoneuvoteollisuus 
nonexistend word:  moottoriajoneuvoteollisuus  -  moottoriajoneuvoteollisuus 
!!! topic needs to be excluded:  moottoriajoneuvoteollisuus
nonexistend word:  maaseutusuunnittelu  -  maaseutusuunnittelu 
nonexistend word:  maaseutusuunnittelu  -  maaseutusuunnittelu 
!!! topic needs to be excluded:  maaseutusuunnittelu
nonexistend word:  ruuanjalostusteollisuus  -  ruuanjalostusteollisuus 
nonexistend word:  ruuanjalostusteollisuus  -  ruuanjalostusteollisuus 
!!! topic needs to be excluded:  ruuanjalostusteollisuus
nonexistend word:  luonnonsuojelupolitiikka  -  luonnonsuojelupolitiikka 
nonexistend word:  luonnonsuojelupolitiikka  -  luonnonsuojelupolitiikka 
!!! topic needs to be excluded:  luonnonsuojelupolitiikka
nonexistend word:  tuotantokeino  -  maatalouden tuotantokeinot 
nonexistend word:  tuotantokeinot  -  maatalouden tuotantokeinot 
!!! topic needs to be excluded:  maatalouden tuotantokeinot
nonex

nonexistend word:  maanviljelystekniikka  -  maanviljelystekniikka 
nonexistend word:  maanviljelystekniikka  -  maanviljelystekniikka 
!!! topic needs to be excluded:  maanviljelystekniikka
nonexistend word:  kulttuuritavara  -  kulttuuritavarat 
nonexistend word:  kulttuuritavarat  -  kulttuuritavarat 
!!! topic needs to be excluded:  kulttuuritavarat
nonexistend word:  merigeologi  -  merigeologia 
nonexistend word:  merigeologia  -  merigeologia 
!!! topic needs to be excluded:  merigeologia
nonexistend word:  energialainsäädäntö  -  energialainsäädäntö 
nonexistend word:  energialainsäädäntö  -  energialainsäädäntö 
!!! topic needs to be excluded:  energialainsäädäntö
nonexistend word:  eläinperintö  -  eläinperintö 
nonexistend word:  eläinperintö  -  eläinperintö 
!!! topic needs to be excluded:  eläinperintö
nonexistend word:  ilmastovara  -  ilmastovarat 
nonexistend word:  ilmastovarat  -  ilmastovarat 
!!! topic needs to be excluded:  ilmastovarat
nonexistend word:  taustata

nonexistend word:  säädösperusteinen  -  säädösperusteinen valvonta 
nonexistend word:  säädösperusteinen  -  säädösperusteinen valvonta 
!!! topic needs to be excluded:  säädösperusteinen valvonta
nonexistend word:  ympäristöindeksi  -  ympäristöindeksi 
nonexistend word:  ympäristöindeksi  -  ympäristöindeksi 
!!! topic needs to be excluded:  ympäristöindeksi
nonexistend word:  liikepolitiikka  -  liikepolitiikka 
nonexistend word:  liikepolitiikka  -  liikepolitiikka 
!!! topic needs to be excluded:  liikepolitiikka
nonexistend word:  suojelupolitiikka  -  suojelupolitiikka 
nonexistend word:  suojelupolitiikka  -  suojelupolitiikka 
!!! topic needs to be excluded:  suojelupolitiikka
nonexistend word:  eläinvara  -  eläinvarat 
nonexistend word:  eläinvarat  -  eläinvarat 
!!! topic needs to be excluded:  eläinvarat
nonexistend word:  maakirjarekisteri  -  maakirjarekisteri lainhuutorekisteri 
nonexistend word:  maakirjarekisteri  -  maakirjarekisteri lainhuutorekisteri 
nonexistend

nonexistend word:  dokumentointijärjestelmä  -  dokumentointijärjestelmä 
nonexistend word:  dokumentointijärjestelmä  -  dokumentointijärjestelmä 
!!! topic needs to be excluded:  dokumentointijärjestelmä
nonexistend word:  hätäoikeus  -  hätäoikeus pakkotilaoikeus poikkeuslaki 
nonexistend word:  hätäoikeus  -  hätäoikeus pakkotilaoikeus poikkeuslaki 
nonexistend word:  pakkotilaoikeus  -  hätäoikeus pakkotilaoikeus poikkeuslaki 
nonexistend word:  pakkotilaoikeus  -  hätäoikeus pakkotilaoikeus poikkeuslaki 
!!! topic needs to be excluded:  hätäoikeus, pakkotilaoikeus, poikkeuslaki
nonexistend word:  kirjanpitomenetelmä  -  kirjanpitomenetelmä 
nonexistend word:  kirjanpitomenetelmä  -  kirjanpitomenetelmä 
!!! topic needs to be excluded:  kirjanpitomenetelmä
nonexistend word:  asutusohjelma  -  asutusohjelma 
nonexistend word:  asutusohjelma  -  asutusohjelma 
!!! topic needs to be excluded:  asutusohjelma
nonexistend word:  maannosprofiili  -  maaprofiili maannosprofiili 
nonexiste

nonexistend word:  märkämenetelmä  -  märkämenetelmä 
nonexistend word:  märkämenetelmä  -  märkämenetelmä 
!!! topic needs to be excluded:  märkämenetelmä
nonexistend word:  tehohiili  -  aktiivihiili tehohiili 
nonexistend word:  tehohiili  -  aktiivihiili tehohiili 
!!! topic needs to be excluded:  aktiivihiili, tehohiili
nonexistend word:  vesitilasto  -  vesitilastot 
nonexistend word:  vesitilastot  -  vesitilastot 
!!! topic needs to be excluded:  vesitilastot
nonexistend word:  valkaisumenetelmä  -  valkaisumenetelmä 
nonexistend word:  valkaisumenetelmä  -  valkaisumenetelmä 
!!! topic needs to be excluded:  valkaisumenetelmä
nonexistend word:  ympäristösodankäynti  -  ympäristösodankäynti 
nonexistend word:  ympäristösodankäynti  -  ympäristösodankäynti 
!!! topic needs to be excluded:  ympäristösodankäynti
nonexistend word:  maalaustoiminta  -  maalaustoiminta 
nonexistend word:  maalaustoiminta  -  maalaustoiminta 
!!! topic needs to be excluded:  maalaustoiminta
nonexisten

nonexistend word:  jokiallas  -  jokialtaan kehittäminen 
nonexistend word:  jokialtaan  -  jokialtaan kehittäminen 
!!! topic needs to be excluded:  jokialtaan kehittäminen
nonexistend word:  vedenottoalue  -  suojeltu vedenottoalue 
nonexistend word:  vedenottoalue  -  suojeltu vedenottoalue 
!!! topic needs to be excluded:  suojeltu vedenottoalue
nonexistend word:  pohjaekosysteemi  -  pohjaekosysteemi 
nonexistend word:  pohjaekosysteemi  -  pohjaekosysteemi 
!!! topic needs to be excluded:  pohjaekosysteemi
nonexistend word:  ympäristönsuojelutekniikka  -  ympäristönsuojelutekniikka 
nonexistend word:  ympäristönsuojelutekniikka  -  ympäristönsuojelutekniikka 
!!! topic needs to be excluded:  ympäristönsuojelutekniikka
nonexistend word:  maataloustuotannollinen  -  maataloustuotannollinen arvo 
nonexistend word:  maataloustuotannollinen  -  maataloustuotannollinen arvo 
!!! topic needs to be excluded:  maataloustuotannollinen arvo
nonexistend word:  kuminjalostusteollisuus  -  kum

nonexistend word:  saastumaton  -  saastumattoman ilman alue 
nonexistend word:  saastumattoman  -  saastumattoman ilman alue 
!!! topic needs to be excluded:  saastumattoman ilman alue
nonexistend word:  ympäristönäytepankki  -  ympäristönäytepankki 
nonexistend word:  ympäristönäytepankki  -  ympäristönäytepankki 
!!! topic needs to be excluded:  ympäristönäytepankki
nonexistend word:  valintajalostus  -  eläinten valintajalostus 
nonexistend word:  valintajalostus  -  eläinten valintajalostus 
!!! topic needs to be excluded:  eläinten valintajalostus
nonexistend word:  ympäristönsuojeluneuvonta  -  ympäristönsuojeluneuvonta 
nonexistend word:  ympäristönsuojeluneuvonta  -  ympäristönsuojeluneuvonta 
!!! topic needs to be excluded:  ympäristönsuojeluneuvonta
nonexistend word:  jätekaasu  -  jätekaasu 
nonexistend word:  jätekaasu  -  jätekaasu 
!!! topic needs to be excluded:  jätekaasu
nonexistend word:  muuntamistekniikka  -  jätteen muuntamistekniikka 
nonexistend word:  muuntamis

nonexistend word:  kompensaatiopolitiikka  -  kompensaatiopolitiikka 
nonexistend word:  kompensaatiopolitiikka  -  kompensaatiopolitiikka 
!!! topic needs to be excluded:  kompensaatiopolitiikka
nonexistend word:  kuplapolitiikka  -  kuplapolitiikka päästöjä koskeva kauppajärjestely 
nonexistend word:  kuplapolitiikka  -  kuplapolitiikka päästöjä koskeva kauppajärjestely 
nonexistend word:  kauppajärjestely  -  kuplapolitiikka päästöjä koskeva kauppajärjestely 
nonexistend word:  kauppajärjestely  -  kuplapolitiikka päästöjä koskeva kauppajärjestely 
!!! topic needs to be excluded:  kuplapolitiikka (päästöjä koskeva kauppajärjestely)
nonexistend word:  avaruusliikenne  -  avaruusliikenne 
nonexistend word:  avaruusliikenne  -  avaruusliikenne 
!!! topic needs to be excluded:  avaruusliikenne
nonexistend word:  saastekustannus  -  saastekustannukset 
nonexistend word:  saastekustannukset  -  saastekustannukset 
!!! topic needs to be excluded:  saastekustannukset
nonexistend word:  ympä

nonexistend word:  maanvieremä  -  maanvieremä vieremä 
nonexistend word:  maanvieremä  -  maanvieremä vieremä 
!!! topic needs to be excluded:  maanvieremä, vieremä
nonexistend word:  saastevalvonta  -  saastevalvonta 
nonexistend word:  saastevalvonta  -  saastevalvonta 
!!! topic needs to be excluded:  saastevalvonta
nonexistend word:  lainsäädäntötoimivalta  -  lainsäädäntötoimivalta 
nonexistend word:  lainsäädäntötoimivalta  -  lainsäädäntötoimivalta 
!!! topic needs to be excluded:  lainsäädäntötoimivalta
nonexistend word:  ioninvaihdin  -  ioninvaihdin 
nonexistend word:  ioninvaihdin  -  ioninvaihdin 
!!! topic needs to be excluded:  ioninvaihdin
nonexistend word:  puhtaanapitosuunnitelma  -  puhtaanapitosuunnitelma 
nonexistend word:  puhtaanapitosuunnitelma  -  puhtaanapitosuunnitelma 
!!! topic needs to be excluded:  puhtaanapitosuunnitelma
nonexistend word:  ihmisekologia  -  ihmisekologia 
nonexistend word:  ihmisekologia  -  ihmisekologia 
!!! topic needs to be excluded:



nonexistend word:  turistikäynti  -  turistikäynnit 
nonexistend word:  turistikäynnit  -  turistikäynnit 
!!! topic needs to be excluded:  turistikäynnit
nonexistend word:  lääkintäjäte  -  lääkintäjäte 
nonexistend word:  lääkintäjäte  -  lääkintäjäte 
!!! topic needs to be excluded:  lääkintäjäte
nonexistend word:  sairaalajäte  -  sairaalajäte 
nonexistend word:  sairaalajäte  -  sairaalajäte 
!!! topic needs to be excluded:  sairaalajäte
nonexistend word:  meluemissio  -  meluemissio 
nonexistend word:  meluemissio  -  meluemissio 
!!! topic needs to be excluded:  meluemissio
nonexistend word:  läikkymishukka  -  vuoto häviö valuma läikkymishukka 
nonexistend word:  läikkymishukka  -  vuoto häviö valuma läikkymishukka 
!!! topic needs to be excluded:  vuoto, häviö, valuma, läikkymishukka
nonexistend word:  varustesuunnitelma  -  varustesuunnitelma 
nonexistend word:  varustesuunnitelma  -  varustesuunnitelma 
!!! topic needs to be excluded:  varustesuunnitelma
nonexistend word:  s

nonexistend word:  kohinaspektri  -  kohinaspektri 
nonexistend word:  kohinaspektri  -  kohinaspektri 
!!! topic needs to be excluded:  kohinaspektri
nonexistend word:  lähijoukkoliikenne  -  lähijoukkoliikenne 
nonexistend word:  lähijoukkoliikenne  -  lähijoukkoliikenne 
!!! topic needs to be excluded:  lähijoukkoliikenne
nonexistend word:  höytäleinä  -  saostuminen höytäleinä 
nonexistend word:  höytäleinä  -  saostuminen höytäleinä 
!!! topic needs to be excluded:  saostuminen höytäleinä
nonexistend word:  kivennäisöljy  -  kivennäisöljy mineraaliöljy 
nonexistend word:  kivennäisöljy  -  kivennäisöljy mineraaliöljy 
!!! topic needs to be excluded:  kivennäisöljy, mineraaliöljy
nonexistend word:  rakennusmelu  -  rakennusmelu 
nonexistend word:  rakennusmelu  -  rakennusmelu 
!!! topic needs to be excluded:  rakennusmelu
nonexistend word:  jätekaasu  -  jätekaasu 
nonexistend word:  jätekaasu  -  jätekaasu 
!!! topic needs to be excluded:  jätekaasu
nonexistend word:  jäteluokka 

nonexistend word:  koeorganismi  -  koeorganismi 
nonexistend word:  koeorganismi  -  koeorganismi 
!!! topic needs to be excluded:  koeorganismi
nonexistend word:  äyriäiseläin  -  äyriäiseläimet 
nonexistend word:  äyriäiseläimet  -  äyriäiseläimet 
!!! topic needs to be excluded:  äyriäiseläimet
nonexistend word:  vakuutuskate  -  vakuutuskate vastuukate 
nonexistend word:  vakuutuskate  -  vakuutuskate vastuukate 
!!! topic needs to be excluded:  vakuutuskate, vastuukate
nonexistend word:  sopimuspuhdistaja  -  sopimuspuhdistaja 
nonexistend word:  sopimuspuhdistaja  -  sopimuspuhdistaja 
!!! topic needs to be excluded:  sopimuspuhdistaja
nonexistend word:  kulkutautioppi  -  epidemiologia kulkutautioppi 
nonexistend word:  kulkutautioppi  -  epidemiologia kulkutautioppi 
!!! topic needs to be excluded:  epidemiologia, kulkutautioppi
nonexistend word:  päästöennuste  -  päästöennuste 
nonexistend word:  päästöennuste  -  päästöennuste 
!!! topic needs to be excluded:  päästöennuste

nonexistend word:  immissioraja  -  immissioraja 
nonexistend word:  immissioraja  -  immissioraja 
!!! topic needs to be excluded:  immissioraja
nonexistend word:  ylimenopaikka  -  ylimenopaikka 
nonexistend word:  ylimenopaikka  -  ylimenopaikka 
!!! topic needs to be excluded:  ylimenopaikka
nonexistend word:  dehydratoitu  -  dehydratoitu liete 
nonexistend word:  dehydratoitu  -  dehydratoitu liete 
!!! topic needs to be excluded:  dehydratoitu liete
nonexistend word:  oikeusmuoto  -  organisaatioiden oikeusmuoto 
nonexistend word:  oikeusmuoto  -  organisaatioiden oikeusmuoto 
!!! topic needs to be excluded:  organisaatioiden oikeusmuoto
nonexistend word:  hapenpoisto  -  hapetus hapenpoisto 
nonexistend word:  hapenpoisto  -  hapetus hapenpoisto 
!!! topic needs to be excluded:  hapetus, hapenpoisto
nonexistend word:  valuuttasuhde  -  valuuttasuhteet rahasuhteet 
nonexistend word:  valuuttasuhteet  -  valuuttasuhteet rahasuhteet 
nonexistend word:  rahasuhde  -  valuuttasuhtee

nonexistend word:  metsänviljelytekniikka  -  metsänviljelytekniikka 
nonexistend word:  metsänviljelytekniikka  -  metsänviljelytekniikka 
!!! topic needs to be excluded:  metsänviljelytekniikka
nonexistend word:  impulssikuormitus  -  impulssikuormitus 
nonexistend word:  impulssikuormitus  -  impulssikuormitus 
!!! topic needs to be excluded:  impulssikuormitus
nonexistend word:  avaruusilmailu  -  avaruusilmailu 
nonexistend word:  avaruusilmailu  -  avaruusilmailu 
!!! topic needs to be excluded:  avaruusilmailu
nonexistend word:  laivajäte  -  laivajäte 
nonexistend word:  laivajäte  -  laivajäte 
!!! topic needs to be excluded:  laivajäte
nonexistend word:  puolijuosta  -  puolijuokseva lanta 
nonexistend word:  puolijuokseva  -  puolijuokseva lanta 
!!! topic needs to be excluded:  puolijuokseva lanta
nonexistend word:  jäähdytysöljy  -  jäähdytysöljy 
nonexistend word:  jäähdytysöljy  -  jäähdytysöljy 
!!! topic needs to be excluded:  jäähdytysöljy
nonexistend word:  valatmeri

nonexistend word:  paleoekologia  -  paleoekologia 
nonexistend word:  paleoekologia  -  paleoekologia 
!!! topic needs to be excluded:  paleoekologia
nonexistend word:  assimilaatiokyky  -  jätteen assimilaatiokyky 
nonexistend word:  assimilaatiokyky  -  jätteen assimilaatiokyky 
!!! topic needs to be excluded:  jätteen assimilaatiokyky
nonexistend word:  saasteindikaattori  -  saasteindikaattori 
nonexistend word:  saasteindikaattori  -  saasteindikaattori 
!!! topic needs to be excluded:  saasteindikaattori
nonexistend word:  mädätyskammio  -  mädätyskammio sakokaivo 
nonexistend word:  mädätyskammio  -  mädätyskammio sakokaivo 
!!! topic needs to be excluded:  mädätyskammio, sakokaivo
nonexistend word:  sintrautuminen  -  sintraus sintrautuminen 
nonexistend word:  sintrautuminen  -  sintraus sintrautuminen 
!!! topic needs to be excluded:  sintraus, sintrautuminen
nonexistend word:  puhdistusjäännös  -  puhdistusjäännös 
nonexistend word:  puhdistusjäännös  -  puhdistusjäännös 
!

nonexistend word:  atomiräjähdys  -  atomiräjähdys 
nonexistend word:  atomiräjähdys  -  atomiräjähdys 
!!! topic needs to be excluded:  atomiräjähdys
nonexistend word:  välikannellinen  -  välikannellinen tankkeri 
nonexistend word:  välikannellinen  -  välikannellinen tankkeri 
!!! topic needs to be excluded:  välikannellinen tankkeri
nonexistend word:  merkitsemispakko  -  merkitsemispakko 
nonexistend word:  merkitsemispakko  -  merkitsemispakko 
!!! topic needs to be excluded:  merkitsemispakko
nonexistend word:  ylivuotokanava  -  ylivuotokanava 
nonexistend word:  ylivuotokanava  -  ylivuotokanava 
!!! topic needs to be excluded:  ylivuotokanava
nonexistend word:  jätteidenkuljetusauto  -  jätteidenkuljetusauto 
nonexistend word:  jätteidenkuljetusauto  -  jätteidenkuljetusauto 
!!! topic needs to be excluded:  jätteidenkuljetusauto
nonexistend word:  riskialtistus  -  riskialtistus 
nonexistend word:  riskialtistus  -  riskialtistus 
!!! topic needs to be excluded:  riskialtist

nonexistend word:  hiutaloittamisaine  -  hiutaloittamisaine 
nonexistend word:  hiutaloittamisaine  -  hiutaloittamisaine 
!!! topic needs to be excluded:  hiutaloittamisaine
nonexistend word:  terfenyyli  -  halogenoitu terfenyyli 
nonexistend word:  terfenyyli  -  halogenoitu terfenyyli 
!!! topic needs to be excluded:  halogenoitu terfenyyli
nonexistend word:  amalgaama  -  amalgaama 
nonexistend word:  amalgaama  -  amalgaama 
!!! topic needs to be excluded:  amalgaama
nonexistend word:  saprobisuusindeksi  -  saprobisuusindeksi 
nonexistend word:  saprobisuusindeksi  -  saprobisuusindeksi 
!!! topic needs to be excluded:  saprobisuusindeksi
nonexistend word:  mutageenisyystestaus  -  mutageenisyystestaus 
nonexistend word:  mutageenisyystestaus  -  mutageenisyystestaus 
!!! topic needs to be excluded:  mutageenisyystestaus
nonexistend word:  jauhamisjäännös  -  jauhamisjäännökset 
nonexistend word:  jauhamisjäännökset  -  jauhamisjäännökset 
!!! topic needs to be excluded:  jauha

nonexistend word:  reflektometria  -  reflektometria 
nonexistend word:  reflektometria  -  reflektometria 
!!! topic needs to be excluded:  reflektometria
nonexistend word:  itiökantainen  -  itiökantaiset 
nonexistend word:  itiökantaiset  -  itiökantaiset 
!!! topic needs to be excluded:  itiökantaiset
nonexistend word:  kiviöljy  -  kiviöljy raakaöljy 
nonexistend word:  kiviöljy  -  kiviöljy raakaöljy 
!!! topic needs to be excluded:  kiviöljy, raakaöljy
nonexistend word:  pehmennysaine  -  pehmennysaine plastisoimisaine 
nonexistend word:  pehmennysaine  -  pehmennysaine plastisoimisaine 
nonexistend word:  plastisoimisaine  -  pehmennysaine plastisoimisaine 
nonexistend word:  plastisoimisaine  -  pehmennysaine plastisoimisaine 
!!! topic needs to be excluded:  pehmennysaine, plastisoimisaine
nonexistend word:  virkavaltaistuminen  -  virkavaltaistuminen 
nonexistend word:  virkavaltaistuminen  -  virkavaltaistuminen 
!!! topic needs to be excluded:  virkavaltaistuminen
nonexist

In [29]:
# save topics containing words which are not present neither model - to be excluded from the topic list
print('excluded topics: ', len(excluded_topics))
pprint(excluded_topics)
with open(excluded_filename, 'wt', encoding='utf8') as f:
    for topic in excluded_topics:
        f.write(topic + "\n")

excluded topics:  862
['maisemansuunnittelu',
 'resurssijohtaminen',
 'maaeroosio',
 'moottoriajoneuvoteollisuus',
 'maaseutusuunnittelu',
 'ruuanjalostusteollisuus',
 'luonnonsuojelupolitiikka',
 'maatalouden tuotantokeinot',
 'ympäristönsuojelusääntö',
 'kesantomaa',
 'maankäyttöjärjestelmä',
 'rannikkoympäristö',
 'maaperän suolautuminene',
 'vesiekologia',
 'meriekologia',
 'maisemanhoito, maisemansuunnittelu',
 'maisemaekologia',
 'maatalousbiotekniikka',
 'maaympäristö',
 'luottoapu',
 'metsätuotanto',
 'vihannesten vilejly',
 'maatalouslainsäädäntö',
 'maatalousvarasto',
 'maataloustiede, maanviljelystaloustiede',
 'ravintotekniikka',
 'maatalousekologia',
 'kehityssuunnittelu',
 'maatalousvälineistö',
 'teollisuuslainsäädäntö',
 'rantaeroosio',
 'lannantuotanto',
 'maaperäkivennäistiede',
 'tihkuvesi',
 'maaseutuarkkitehtuuri',
 'valtakunnansuunnittelu',
 'maannostuminen',
 'yksilöliikenne',
 'meren pohjakerrostuma, merisedimentti',
 'rannikkomeri, rantavesi',
 'vesien suojjelu

In [30]:
# create new lists which don't containt topics with non-existent words

# load list with excluded topics
with open(excluded_filename, 'rt', encoding='utf8') as fp:
    tmp_topics = fp.readlines()
excluded_set = set()
for topic in tmp_topics:
    excluded_set.add(topic.strip())

with open(nolemma_list_file, 'rt', encoding='utf8') as fp:
        topics_file = fp.readlines()

topics_final = []
topics_lemma = []

excluded = 0
for topic in topics_file:
    topic_orig = topic.strip()
    if topic_orig in excluded_set:
        print("=== EXCLUDE ", topic_orig)
        excluded += 1
        continue
    topic = re.sub('\W',' ',topic)
    topic = re.sub('\ +',' ',topic)
    doc = nlp(topic.strip().lower())
    lemmas = []

    for token in doc:
        if token.is_stop:
            continue
        lemmas.append(token.lemma_)    
    topics_lemma.append("_".join(lemmas))
    topics_final.append(topic_orig)

    print(topic_orig, ' --- ', "_".join(lemmas))

print('Excluded: ', excluded)
print('Final topics: ', len(topics_lemma), len(topics_final))
    
with open(lemma_list_file_excluded, 'wt', encoding='utf8') as f:
    for topic_lemma in topics_lemma:
        f.write(topic_lemma + "\n")
with open(nolemma_list_file_excluded, 'wt', encoding='utf8') as f:
    for topic_final in topics_final:
        f.write(topic_final + "\n")  

paikallinen kehitys  ---  paikallinen_kehitys
maaseuturakentaminen  ---  maaseuturakentaminen
vesitalous  ---  vesitalous
koulutustaso  ---  koulutustaso
yleissivistävä koulutus  ---  yleissivistää_koulutus
rantapenger  ---  rantapenger
yhteisöoikeus  ---  yhteisöoikeus
kulttuuriperintö  ---  kulttuuriperintö
viljelysmaa, maatalousmaa  ---  viljelysmaa_maatalousmaa
maatalousmaisema  ---  maatalousmaisema
maataloustuotanto  ---  maataloustuotanto
taloudellinen kehitys  ---  taloudellinen_kehitys
ravintoketju  ---  ravintoketju
elintarviketeollisuus  ---  elintarviketeollisuus
ruuan laatu  ---  ruoka_laatu
globaali lämpeneminen  ---  globaali_lämpeneminen
kasvihuoneilmiö  ---  kasvihuoneilmiö
elinkeinoelämän kehitys  ---  elinkeinoelämä_kehitys
työmarkkinat  ---  työmarkkina
pääsy maa-alueelle  ---  pääsy_maa_alue
uusjako, tilusten sijoitus  ---  uusjako_tilus_sijoitus
maankäytön suunnittelu  ---  maankäyttö_suunnittelu
maisema-arkkitehtuuri  ---  maisema_arkkitehtuuri
=== EXCLUDE  maise

yhteisön säädös  ---  yhteisö_säädös
maatalousrakennus  ---  maatalousrakennus
teollisuusrakennus  ---  teollisuusrakennus
ilmasto  ---  ilmasto
kosmeettinen teollisuus  ---  kosmeettinen_teollisuus
karjanhoito  ---  karjanhoito
voimavarojen käyttö  ---  voimavara_käyttö
veden käyttö  ---  vesi_käyttö
nurmi  ---  nurmi
terästeollisuus  ---  terästeollisuus
sähköteollisuus  ---  sähköteollisuus
vesistöalueen suunnitelmallinen käyttö  ---  vesistöalue_suunnitelmallinen_käyttö
ekosysteemin rappeutuminen  ---  ekosysteemi_rappeutuminen
vaatetusteollisuus  ---  vaatetusteollisuus
keramiikkateollisuus  ---  keramiikkateollisuus
markkinatalous  ---  markkinatalous
ympäristön hoito  ---  ympäristö_hoito
ohjelmiston kehitys  ---  ohjelmisto_kehitys
=== EXCLUDE  maatalousvarasto
maanviljelys  ---  maanviljelys
maataloustuote  ---  maataloustuote
ilmaston muutos  ---  ilmasto_muutos
=== EXCLUDE  maataloustiede, maanviljelystaloustiede
maankäyttö  ---  maankäyttö
teollinen suunnittelu  ---  teolli

maisemansuojelu  ---  maisemansuojelu
maisemansuojelu  ---  maisemansuojelu
merikuljetus  ---  merikuljetus
kaivosteollisuus  ---  kaivosteollisuus
eläinfysiologia  ---  eläinfysiologi
käsiteollisuus  ---  käsiteollisuus
maavero, kiinteistövero  ---  maavero_kiinteistövero
ilmatilan suunnittelu  ---  ilmatila_suunnittelu
maa-alue  ---  maa_alue
meluvaikutus  ---  meluvaikutus
=== EXCLUDE  maanviljelystekniikka
väestönkasvu  ---  väestönkasvu
viljavuus  ---  viljavuus
tiedepolitiikka  ---  tiedepolitiikka
maanviljelys ilman kastelulaitteita  ---  maanviljelys_kastelulaite
kannanvaihtelu  ---  kannanvaihtelu
EY:n direktiivi  ---  ey_n_direktiivi
=== EXCLUDE  kulttuuritavarat
ympäristön kemikaalit  ---  ympäristö_kemikaali
oikeudellinen sääntely  ---  oikeudellinen_sääntely
alueellinen sääntely  ---  alueellinen_sääntely
ympäristöpolitiikka  ---  ympäristöpolitiikka
luonnonmetsä  ---  luonnonmetsä
nahkateollisuus  ---  nahkateollisuus
puhdistus maan läpi  ---  puhdistus_maa
maan parannus,

maakerros  ---  maakerros
=== EXCLUDE  teollisuustaloustiede, toimialatutkimus
maan ekologia  ---  maa_ekologia
sosiaaliset puitteet  ---  sosiaalinen_puite
vesieläin  ---  vesieläin
biologiset resurssit  ---  biologinen_resurssi
elinympäristö  ---  elinympäristö
sosiaaliset menot  ---  sosiaalinen_meno
markkinat  ---  markkina
maan arvo  ---  maa_arvo
työllisyys  ---  työllisyys
yksityinen hallinta-alue  ---  yksityinen_hallinta_alue
valtion maa  ---  valtio_maa
=== EXCLUDE  tyhjiöteollisuus
=== EXCLUDE  eläingenetiikka
rakennustekniikka  ---  rakennustekniikka
koulutuksen suunnittelu  ---  koulutus_suunnittelu
uusi kaupunki  ---  kaupunki
maantieteellinen jakauma  ---  maantieteellinen_jakauma
kulttuuri, sivistys  ---  kulttuuri_sivistys
=== EXCLUDE  yhteistyöpolitiikka
metsätalous  ---  metsätalous
metsätaloustiede  ---  metsätaloustiede
maaperän saaste  ---  maaperä_saaste
kunnossapito  ---  kunnossapito
=== EXCLUDE  kaksoistalous
kansanperinne  ---  kansanperinne
väestö  ---  väes

sisäympäristö  ---  sisäympäristö
työoikeus  ---  työoikeus
=== EXCLUDE  ympäristöterminologia
maaseutuasutus  ---  maaseutuasutus
arktinen alue  ---  arktinen_alue
historiallinen kehitys  ---  historiallinen_kehitys
ympäristöinvestointi  ---  ympäristöinvestointi
=== EXCLUDE  ensisijaistaminen ympäristön näkökulmasta
ympäristöä koskevat tiedot  ---  ympäristö_koskea_tieto
luonnononnettomuus  ---  luonnononnettomuus
=== EXCLUDE  ympäristökannustin
asutus(taajama)  ---  asutus_taajama
=== EXCLUDE  kaavoitustoimenpide, suunnittelutoimenpide
eläinten käyttäytyminen  ---  eläin_käyttäytyminen
markkinatutkimus  ---  markkinatutkimus
kauppapuutarhan pito  ---  kauppapuutarha_pito
kasvisto  ---  kasvisto
=== EXCLUDE  täyssuolanpoisto
lain täytäntöönpano  ---  laki_täytäntöönpano
nuorisotyö  ---  nuorisotyö
voimaanpanolaki  ---  voimaanpanolaki
huoli ympäristöstä  ---  huoli_ympäristö
julkinen laitos  ---  julkinen_laitos
hiiliteollisuus  ---  hiiliteollisuus
=== EXCLUDE  teollisuusliete
yhtei

kuuma vesi  ---  kuuma_vesi
=== EXCLUDE  kirjanpitomenetelmä
äänitaso  ---  äänitaso
orgaaninen aine  ---  orgaaninen_aine
=== EXCLUDE  asutusohjelma
asuntovaunu, matkailuperävaunu  ---  asuntovaunu_matkailuperävaunu
lannoitteita koskeva laki  ---  lannoite_koskea_laki
laadunvalvonta  ---  laadunvalvonta
aavikkoilmasto  ---  aavikkoilmasto
teollisuusliitto  ---  teollisuusliitto
luonnonvarainen eläin  ---  luonnonvarainen_eläin
=== EXCLUDE  maaprofiili, maannosprofiili
suojeltu maisema  ---  suojella_maisema
sosiaalipalvelu  ---  sosiaalipalvelu
terveyspalvelu  ---  terveyspalvelu
Karibian meri  ---  Karibia_meri
palvelualue  ---  palvelualue
julkinen kuuleminen  ---  julkinen_kuuleminen
lääketiede  ---  lääketiede
sosiaalitieteet  ---  sosiaalitiede
kotimainen teknologia  ---  kotimainen_teknologia
valtion velka  ---  valtio_velka
valmistalo, elementtirakennus  ---  valmistalo_elementtirakennus
kaupunkiuudistus  ---  kaupunkiuudistus
sosiaalinen indikaattori  ---  sosiaalinen_indikaat

ympäristörikos  ---  ympäristörikos
työolosuhteet  ---  työolosuhde
lajien suojelu  ---  laji_suojelu
suojelualue, rauhoitettu alue  ---  suojelualue_rauhoittaa_alue
ilmastovyöhyke  ---  ilmastovyöhyke
fysikaalinen saaste  ---  fysikaalinen_saaste
hengityselimet  ---  hengityselin
perheoikeus  ---  perheoikeus
taloudellinen keskittyminen  ---  taloudellinen_keskittyminen
delegoitu johtaminen  ---  delegoida_johtaminen
tiivistää  ---  tiivistää
kemikaaleja koskeva politiikka  ---  kemikaali_koskea_politiikka
ympäristöonnettomuus  ---  ympäristöonnettomuus
ympäristön puhdistus  ---  ympäristö_puhdistus
määräpaikka  ---  määräpaikka
=== EXCLUDE  merivarat
luontainen uudistuminen, metsittyminen  ---  luontainen_uudistuminen_metsittyminen
veropolitiikka  ---  veropolitiikka
=== EXCLUDE  kölivesi, pilssivesi
tietojenkäsittely  ---  tietojenkäsittely
laki ympäristövaikutusten arvioinnista  ---  laki_ympäristövaikutus_arviointi
=== EXCLUDE  tislaamoteollisuus
psykosomaattinen vaikutus  ---  ps

kaupunkirakentamista koskeva laki  ---  kaupunkirakentaminen_koskea_laki
hallinnollinen elin  ---  hallinnollinen_elin
myöhemmäksi siirtynyt vaikutus  ---  myöhemmäksi_siirtyä_vaikutus
=== EXCLUDE  ainemenekki
havumetsä  ---  havumetsä
pohjaveden vaarantuminen  ---  pohjavesi_vaarantuminen
metsänhakkuu  ---  metsänhakkuu
tiivistys  ---  tiivistys
korkea vuori  ---  korkea_vuori
=== EXCLUDE  työonnettomuus
asiakirja kaupunkirakentamisesta  ---  asiakirja_kaupunkirakentaminen
metsävarojen arviointi  ---  metsävara_arviointi
talonvaltaajien asuinalue  ---  talonvaltaaja_asuinalue
luonnonvarojen laadun heikkeneminen  ---  luonnonvara_laatu_heikkeneminen
suojelu naapureilta  ---  suojelu_naapuri
uusiutuva raaka-aine  ---  uusiutua_raaka_aine
taloutta koskevat tiedot  ---  talous_koskea_tieto
uusiutumattomat luonnonvarat  ---  uusiutumaton_luonnonvara
kasvillisuustyyppi  ---  kasvillisuustyyppi
ilman laadun hallinta  ---  laatu_hallinta
ajoneuvoteollisuus  ---  ajoneuvoteollisuus
sää  ---  s

maahan perustuva toiminta  ---  maa_perustaa_toiminta
ympäristövaikutusten arviointiselostus  ---  ympäristövaikutus_arviointiselostus
vesitasapaino  ---  vesitasapaino
maatalouden kehyssuunnitelma  ---  maatalous_kehyssuunnitelma
väestön maantieteellinen jakautuminen  ---  väestö_maantieteellinen_jakautuminen
luotijuna  ---  luotijuna
alhainen teknologia  ---  alhainen_teknologia
=== EXCLUDE  ympäristölainsäädäntöprosessi
maan kantavuus  ---  maa_kantavuus
teollisuuden käyttövesi  ---  teollisuus_käyttövesi
ympäristön laadun osoitin  ---  ympäristö_laatu_osoittaa
=== EXCLUDE  kaupungin resurssivirrat
=== EXCLUDE  saastumisen valnonnan säädös
virkistystoiminnan vaikutus ympäristöön  ---  virkistystoiminta_vaikutus_ympäristö
pien- ja keskisuuri teollisuus  ---  piki_keskisuuri_teollisuus
vaarallista tavaraa koskeva määräys  ---  vaarallinen_tavara_koskea_määräys
yhteinen kauppapolitiikka  ---  yhteinen_kauppapolitiikka
luonnollisten vaarojen ehkäisy  ---  luonnollinen_vaara_ehkäisy
ravi

saostus  ---  saostus
raja-arvo  ---  raja_arvo
tietojenkäsittelyjärjestelmä  ---  tietojenkäsittelyjärjestelmä
=== EXCLUDE  jätelämpövaraus
vähäisemmän riskin lajit  ---  vähäinen_riski_laji
=== EXCLUDE  eläinlajien takaisinistutus
rakennus, jossa ei asuta  ---  rakennus_asuttaa
=== EXCLUDE  numeerinen kuvankäsittelyjärjestelmä
pinta-aktiivinen yhdiste  ---  pinta_aktiivinen_yhdiste
lauhkean vyöhykkeen ekosysteemi  ---  lauhkea_vyöhyke_ekosysteemi
eläinlajin tuominen uuteen ympäristöön  ---  eläinlaji_tuominen_ympäristö
=== EXCLUDE  metsäpeitteen tuhoutuminen
lannan käyttö polttoaineena  ---  lanta_käyttö_polttoaine
=== EXCLUDE  tietojenkäsittelylaki
sähköinen ilmoitustaulu  ---  sähköinen_ilmoitustaulu
pH-arvo  ---  pH_arvo
saastuttamaton auto  ---  saastuttamaton_auto
lämpö- ja voimalaitos  ---  lämpö_voimalaitos
virkavapaus sosiaalisista syistä  ---  virkavapaus_sosiaalinen_syy
rakennuspaikan valmistelutyöt  ---  rakennuspaikka_valmistelutyö
hedelmänviljely  ---  hedelmänviljely
lo

kustannusten lisäys  ---  kustannus_lisäys
biologinen hajo(tta)minen  ---  biologinen_hajo_tta_minen
energia  ---  energia
myytävä sato  ---  myydä_sato
=== EXCLUDE  kasvumaa
raha-asiat  ---  raha
alkukoulutus  ---  alkukoulutus
kylmän vyöhykkeen ekosysteemi  ---  kylmä_vyöhyke_ekosysteemi
ilmakuljetus  ---  ilmakuljetus
käyttäytyminen  ---  käyttäytyminen
juurikasvit  ---  juurikasvi
kasvatustiede, pedagogiikka  ---  kasvatustiede_pedagogiikka
käyttäytymismalli  ---  käyttäytymismalli
matemaattinen menetelmä  ---  matemaattinen_menetelmä
monikansallinen yritys  ---  monikansallinen_yritys
biokemiallinen menetelmä  ---  biokemiallinen_menetelmä
opetusmenetelmä  ---  opetusmenetelmä
=== EXCLUDE  estuaaribiologia
sähkön tuottamisen kustannukset  ---  sähkö_tuottaminen_kustannus
merenkulku  ---  merenkulku
lieju, loka, muta  ---  lieju_loka_muta
arkeologia  ---  arkeologia
sairaala  ---  sairaala
maaomaisuuden vuokraaminen  ---  maaomaisuus_vuokraaminen
viljelykasvien käsittely  ---  vilj

rakennusjäte  ---  rakennusjäte
=== EXCLUDE  tienrakennus, tienteko
polku  ---  polku
=== EXCLUDE  mallisuunnittelu
elintaso  ---  elintaso
runkotie, valtatie, päätie  ---  runkotie_valtatie_päätie
idän ja lännen välinen kauppa  ---  itä_länsi_välinen_kauppa
öljyputki  ---  öljyputki
musiikki  ---  musiikki
laguuni  ---  laguuni
karstimaa  ---  karstimaa
kausivaihtelu  ---  kausivaihtelu
opetusmateriaali  ---  opetusmateriaali
vesistö, vesitie, väylä  ---  vesistö_vesitie_väylä
yritykset  ---  yritys
kehitysmaat  ---  kehitysmaa
kehittyneet maat  ---  kehittyä_maa
molekyylibiologia  ---  molekyylibiologi
Välimeri  ---  välimeri
=== EXCLUDE  sorptio
tutkimuskeskus  ---  tutkimuskeskus
poliittinen maantiede  ---  poliittinen_maantiede
mittaus  ---  mittaus
sähkönkulutus  ---  sähkönkulutus
=== EXCLUDE  tulkintamenetelmä
kasviplankton  ---  kasviplankton
=== EXCLUDE  öljysaaste
kosminen säteily  ---  kosminen_säteily
vaelluskala  ---  vaelluskala
makrotaloustiede  ---  makrotaloustiede
==

hydrografia  ---  hydrografia
saastuminen  ---  saastuminen
kaskiviljelys  ---  kaskiviljelys
väliaikainen muisti (atk)  ---  väliaikainen_muisti_atk
säteily  ---  säteily
kansainvälinen kilpailukyky  ---  kansainvälinen_kilpailukyky
suunnitelma  ---  suunnitelma
nitrifikaatio  ---  nitrifikaatio
eturyhmä  ---  eturyhmä
havupuu  ---  havupuu
typen t. nitraattien poistaminen t. poistuminen  ---  typpi_t_nitraatti_poistaminen_t_poistuminen
laitosten rakentaminen  ---  laitos_rakentaminen
järviallas  ---  järviallas
sähkö  ---  sähkö
poliittinen valta  ---  poliittinen_valta
troposfäärin otsoni  ---  troposfääri_otso
painostusryhmä  ---  painostusryhmä
=== EXCLUDE  rautatieajoneuvo
sipulikasvien viljely  ---  sipulikasvi_viljely
hallinnollinen työ  ---  hallinnollinen_työ
öljyyn pohjautuva kemikaali, petrokemikaali  ---  öljy_pohjautua_kemikaali_petrokemikaali
jokien saastuminen  ---  joki_saastuminen
=== EXCLUDE  melunseuranta
ilmastus  ---  ilmastus
pakkolunastus  ---  pakkolunastus
===

maanjäristys  ---  maanjäristys
meteorologinen parametri  ---  meteorologinen_parametri
vuoto  ---  vuoto
=== EXCLUDE  saastekuorma
pesuaine  ---  pesuaine
kaivostekniikka  ---  kaivostekniikka
yhteinen jäteveden käsittely  ---  yhteinen_jätevesi_käsittely
kylä  ---  kylä
hydrografinen allas  ---  hydrografinen_allas
raskasmetalli  ---  raskasmetalli
kulutus  ---  kulutus
=== EXCLUDE  sekalannoite, komposti
=== EXCLUDE  kompostointi, mullastus
hajoaminen, maatuminen  ---  hajoaminen_maatuminen
akustiikka  ---  akustiikka
filosofia  ---  filosofi
jäätikkö  ---  jäätikkö
jäteveden puhdistus  ---  jätevesi_puhdistus
luonnonpuisto  ---  luonnonpuisto
hydrologinen suuronnettomuus  ---  hydrologinen_suuronnettomuus
tulenarka tuote, helposti syttyvä tuote  ---  tulenarka_tuote_syttyä_tuote
siipikarja  ---  siipikarja
hallinnollinen organisaatio  ---  hallinnollinen_organisaatio
yksilöllinen jätehuolto  ---  yksilöllinen_jätehuolto
otsoni  ---  otso
=== EXCLUDE  vesikehä, hydrosfääri
kaasusäil

monenvälinen sopimus  ---  monenvälinen_sopimus
=== EXCLUDE  itsetarkkaileva
maataloudesta saatavat elintarvikkeet  ---  maatalous_saada_elintarvike
ruoka-aine, elintarvike  ---  ruoka_aine_elintarvike
metsänviljely, metsänhoito  ---  metsänviljely_metsänhoito
lakiteksti  ---  lakiteksti
kreivikunta, piirikunta, lääni  ---  kreivikunta_piirikunta_lääni
puhtaus (hygienia)  ---  puhtaus_hygienia
vuori  ---  vuori
perinnöllisyystiede  ---  perinnöllisyystiede
=== EXCLUDE  matkailuyksikkö
=== EXCLUDE  impulssikohina, impulssimelu
=== EXCLUDE  hallintosanktio
saastepäästö  ---  saastepäästö
vaikutuksen lähteet  ---  vaikutus_lähde
ammatillinen asema  ---  ammatillinen_asema
hevoset  ---  hevonen
=== EXCLUDE  öljysaasteen torjunta
=== EXCLUDE  hedelmättömyys, steriliteetti
=== EXCLUDE  kannustusvero
kiinteä jäte, kiinteät jätteet  ---  kiinteä_jäte_kiinteä_jäte
lumivyöry, maavyöry, kivivyöry  ---  lumivyöry_maavyöry_kivivyöry
bakteriologinen pilaantuminen  ---  bakteriologinen_pilaantuminen


fysikaaliskemiallinen puhdistus  ---  fysikaaliskemiallinen_puhdistus
lääketeollisuuden jäte  ---  lääketeollisuus_jäte
liikennevalvonta, liikenteen ohjaus  ---  liikennevalvonta_liikenne_ohjaus
voiton takavarikointi  ---  voitto_takavarikointi
kaasunpoisto kaatopaikasta  ---  kaasunpoisto_kaatopaikka
=== EXCLUDE  yhteisvelallinen, velalliskumppani
biotekniikan sosioekonominen vaikutus  ---  biotekniikka_sosioekonominen_vaikutus
kalojen myrkyllisyys  ---  kala_myrkyllisyys
=== EXCLUDE  rikkioksidi
kerrostalo  ---  kerrostalo
pyörremyrsky  ---  pyörremyrsky
läpäisevyys  ---  läpäisevyys
muovi  ---  muovi
kolloidi, kolloidinen  ---  kolloidi_kolloidinen
kemiallinen käsittely  ---  kemiallinen_käsittely
hyönteiset  ---  hyönteinen
raakaöljy  ---  raakaöljy
sopimus  ---  sopimus
hallintaoikeuden laji  ---  hallintaoikeus_laji
rannikko, ranta  ---  rannikko_ranta
=== EXCLUDE  onsilo
liikennepäästö  ---  liikennepäästö
=== EXCLUDE  päällyskasvusto, perifyton
öljynjalostamo  ---  öljynjalosta

psykologia  ---  psykologi
=== EXCLUDE  kaivausjätteen kaatopaikka
puujäte  ---  puujäte
öljylautta  ---  öljylautta
metallin sulatus  ---  metalli_sulatus
fotokemiallinen savusumu  ---  fotokemiallinen_savusumu
ultraääni  ---  ultraääni
kierrätettävä muovi  ---  kierrätettävä_muovi
sosiologia  ---  sosiologia
hiilihydraatti  ---  hiilihydraatti
paperi  ---  paperi
muutoksenhaku  ---  muutoksenhaku
=== EXCLUDE  uppokypsennyskattilat
päämäärien ristiriita  ---  päämäärä_ristiriita
avomeren miinoitus  ---  avomeri_miinoitus
=== EXCLUDE  diatomi, yksisoluinen levä, piilevä
=== EXCLUDE  jäteanalyysi
rahateoria  ---  rahateoria
aromaattinen yhdiste  ---  aromaattinen_yhdiste
=== EXCLUDE  malmiesiintymä, mineraalilöydös
agronomia  ---  agronomi
=== EXCLUDE  veroporrastus
tuotteita koskevat tiedot  ---  tuote_koskea_tieto
merenrannan polku  ---  merenranta_polku
=== EXCLUDE  polttoöljy, raskas maaöljytuote
tuulenkaato  ---  tuulenkaato
ensiaputoimenpide  ---  ensiaputoimenpide
=== EXCLUDE  ka

tekijänpalkkio, käyttömaksu  ---  tekijänpalkkio_käyttömaksu
vatti, vuorovesivyöhyke  ---  vatti_vuorovesivyöhyke
alfasäteily  ---  alfasäteily
tietojen tallennustekniikka  ---  tieto_tallennustekniikka
hahmon tunnistus  ---  hahmo_tunnistus
määräys, asetus, päätös  ---  määräys_asetus_päätös
ryhmän V alkuaineet  ---  ryhmä_v_alkuaine
öljypuomi  ---  öljypuomi
sotilaalliset varusteet  ---  sotilaallinen_varuste
=== EXCLUDE  hapetus, hapenpoisto
=== EXCLUDE  valuuttasuhteet, rahasuhteet
=== EXCLUDE  pakkotoimenpiteet
jäähdytys  ---  jäähdytys
asetus  ---  asetus
pyörremyrsky  ---  pyörremyrsky
yleinen sääntö, yhteinen sääntö  ---  yleinen_sääntö_yhteinen_sääntö
troposfääri  ---  troposfääri
halogenoitujen yhdisteiden korvaaminen  ---  halogenoida_yhdiste_korvaaminen
=== EXCLUDE  kasvien valintajalostus
niemi  ---  niemi
hylätty ajoneuvo  ---  hylätä_ajoneuvo
valokuvaus  ---  valokuvaus
bensiiniasema  ---  bensiiniasema
ilmastotiede  ---  ilmastotiede
lisääntymisen manipulointi  ---  lis

kirjanpito  ---  kirjanpito
geneettisesti muutettu organismi  ---  geneettisesti_muuttaa_organismi
kiinteä hiukkanen  ---  kiinteä_hiukkanen
inertti jäte  ---  inertti_jäte
kerrostuminen  ---  kerrostuminen
kansalainen  ---  kansalainen
=== EXCLUDE  paksuntaminen, sakeutus
saasteen kulkeutuminen  ---  saaste_kulkeutuminen
saastuttavat aineet, saasteet  ---  saastua_aine_saaste
ympäristöön kertyvä epäpuhtaus  ---  ympäristö_kertyä_epäpuhtaus
avaruus  ---  avaruus
laajuuden määrääminen  ---  laajuus_määrääminen
=== EXCLUDE  melunmittaus
jätteen vähentäminen  ---  jäte_vähentäminen
kevyiden nesteiden erotin  ---  kevyt_neste_erottaa
sanakirja  ---  sanakirja
jatkuvakäyttöinen säiliö  ---  jatkuvakäyttöinen_säiliö
edustus  ---  edustus
Euratom  ---  euratom
kiinteä aine  ---  kiinteä_aine
=== EXCLUDE  saastepitoisuus
=== EXCLUDE  yhteistyöperiaate
siitepöly  ---  siitepöly
=== EXCLUDE  kalisuolan ja vuorisuolan louhinta
metallioksidi  ---  metallioksidi
kaivoksen täytös  ---  kaivos_täytös

osakepääoma  ---  osakepääoma
tiheys  ---  tiheys
desinfiointi  ---  desinfiointi
maiseman tuhoutuminen  ---  maisema_tuhoutuminen
tietopaketti  ---  tietopaketti
polysyklinen aromaattinen hiilivety  ---  polysyklinen_aromaattinen_hiilivety
kivihiilen louhiminen  ---  kivihiili_louhiminen
käytöstä poistettu sotilasalue  ---  käyttö_poistaa_sotilasalue
ristiriita  ---  ristiriita
jäännösten kierrätys  ---  jäännös_kierrätys
vetysulfidi, rikkivety  ---  vetysulfidi_rikkivety
sorsalinnut  ---  sorsalintu
=== EXCLUDE  tullitariffi, tullitaksa
=== EXCLUDE  vaahdotusaine
=== EXCLUDE  kasvisosiologia
=== EXCLUDE  kartanpiirustus
saasteen poisto  ---  saaste_poisto
tavoitteiden asettaminen  ---  tavoite_asettaminen
vaarasta ilmoittaminen  ---  vaara_ilmoittaminen
rasteri  ---  rasteri
kansalaisoikeudet  ---  kansalaisoikeus
aids  ---  AIDS
=== EXCLUDE  paleoekologia
tupakka  ---  tupakka
hätämajoitus  ---  hätämajoitus
=== EXCLUDE  jätteen assimilaatiokyky
=== EXCLUDE  saasteindikaattori
=== E

vulkanismi, vulkaaniset ilmiöt  ---  vulkanismi_vulkaaninen_ilmiö
valvomaton kaatopaikka  ---  valvomaton_kaatopaikka
inertiksi muunto  ---  inertti_muunto
laimennettu happo, laimea happo  ---  laimeta_happo_laimea_happo
kuulemismenettely  ---  kuulemismenettely
suurin sallittu pitoisuus  ---  sallittu_pitoisuus
puro  ---  puro
laitos, johon tarvitaan hyväksyntä  ---  laitos_tarvita_hyväksyntä
ydinvoimala  ---  ydinvoimala
tuotevertailu  ---  tuotevertailu
saastuttajien toteaminen  ---  saastuttaja_toteaminen
tahnamainen jäte  ---  tahnamainen_jäte
tiedonlähde  ---  tiedonlähde
myrkky, toksiini  ---  myrkky_toksiini
mylly  ---  mylly
=== EXCLUDE  monispektriskanneri
imeytyminen  ---  imeytyminen
=== EXCLUDE  öljynjäännösten talteenotto
hallitseva  ---  hallitseva
hälytys  ---  hälytys
=== EXCLUDE  puukuorman purkaminen
laskenta  ---  laskenta
päätöslauselma  ---  päätöslauselma
polttomoottori  ---  polttomoottori
epämetallit  ---  epämetalli
laboratoriokoe  ---  laboratoriokoe
puutarha

lisäaineen päivittäinen saanti ilman terveydellistä vaaraa  ---  lisäaine_päivittäinen_saanti_terveydellinen_vaara
ilmoitus, tiedotus  ---  ilmoitus_tiedotus
liikennevälineet, kulkuyhteys  ---  liikenneväline_kulkuyhteys
värjätä, väriaine  ---  värjätä_väriaine
vaikeasti käsiteltävä jäte  ---  vaikeasti_käsitellä_jäte
=== EXCLUDE  märkäerotin
=== EXCLUDE  dekantointi, kuortaminen
=== EXCLUDE  huvilaivamatkailu
=== EXCLUDE  eliöntorjunta-aine
=== EXCLUDE  valutusjärjestelmä
liukenematon aine  ---  liukenematon_aine
säteily  ---  säteily
ministeriö  ---  ministeriö
veden virtausta koskeva tutkimus ja mittaus  ---  vesi_virtaus_koskea_tutkimus_mittaus
Oseania  ---  Oseania
ympäristöön rikastuva tekijä  ---  ympäristö_rikastaa_tekijä
sudenkorennot  ---  sudenkorento
=== EXCLUDE  tietoväline, tiedonsiirtoväline
suljettu alue  ---  sulkea_alue
hieno  ---  hieno
riita-asia, käräjöinti  ---  riita_käräjöinti
hajanainen lähde  ---  hajanainen_lähde
tuhka  ---  tuhka
kromi  ---  kromi
tina  --- 

suisto  ---  suisto
annos, annostus  ---  annos_annostus
pentakloorifenoli  ---  pentakloorifenoli
lajittelu syntypaikalla (jäte)  ---  lajittelu_syntypaikka_jäte
koulutyö  ---  koulutyö
poisto  ---  poisto
jokisokeus  ---  jokisokeus
emulsio  ---  emulsio
savupiippujen liiallinen korkeus  ---  savupiippu_liiallinen_korkeus
=== EXCLUDE  yksilönkehitys, ontogenia
osoitin  ---  osoittaa
kuulon tarkkuus  ---  kuulo_tarkkuus
patikkapolku  ---  patikkapolku
itu, itiö, alkio, mikrobi  ---  itu_itiö_alkio_mikrobi
torakat  ---  torakka
jätteiden kaato  ---  jäte_kaato
pato, sulku  ---  pato_sulku
kyllästysaine  ---  kyllästysaine
hopea  ---  hopea
röntgensäde  ---  röntgensäde
saniaiset  ---  saniainen
Ames-testi  ---  ames_testi
savu, höyry, savustaa, savuta  ---  savu_höyry_savustaa_savuta
lyijytön bensiini  ---  lyijytön_bensiini
järjellisyys  ---  järjellisyys
=== EXCLUDE  sisäeritysoppi
uraani  ---  ura
satama  ---  satama
=== EXCLUDE  suolajärvi, suolasuo, suolakenttä
räjähtävä  ---  räj

jäätikön massatase  ---  jäätikkö_massatase
maaperän huonontuminen  ---  maaperä_huonontuminen
kaatopaikkadirektiivi  ---  kaatopaikkadirektiivi
meriliikenteen polttoaine  ---  meriliikenne_polttoaine
=== EXCLUDE  meristrategiapuitedirektiivi
yhdyskuntajätteen synty  ---  yhdyskuntajäte_synty
yhdyskuntajätevesi  ---  yhdyskuntajätevesi
nitraattidirektiivi  ---  nitraattidirektiivi
eloperäinen maanparannusaine  ---  eloperäinen_maanparannusaine
organisaation ympäristöjalanjälkeä koskeva menetelmä  ---  organisaatio_ympäristöjalanjälki_koskea_menetelmä
otsonikato  ---  otsonikato
=== EXCLUDE  puistojäte
=== EXCLUDE  kasvibiostimulantti
poliittinen kehys  ---  poliittinen_kehys
politiikan täytäntöönpano  ---  politiikka_täytäntöönpano
primäärienergia  ---  primäärienergia
tuotteen ympäristöjalanjälkeä koskeva menetelmä  ---  tuote_ympäristöjalanjälki_koskea_menetelmä
käyttäjä-tuottajuus  ---  käyttäjä_tuottajuus
uusiutuvia energialähteitä koskeva direktiivi  ---  uusiutuva_energialähde_ko

In [31]:
# adding all the words and topics to model

# load the lemma list
with open(lemma_list_file_excluded) as fp:
    topics = fp.readlines()
# load the nolemma list
with open(nolemma_list_file_excluded) as fp:
    topics_nolemma = fp.readlines()    
    

#try if the topic-lemma words exist in the model     
new_vectors = []
new_words = []
for i, (topic, topic_nolemma) in enumerate(zip(topics, topics_nolemma)):
#for i,topic in enumerate(topics):
    topic_nolemma = re.sub('\W',' ',topic_nolemma)
    topic_nolemma = re.sub('\ +',' ',topic_nolemma)
    doc = nlp(topic_nolemma.strip().lower())
    nolemmas = []
    for token in doc:
        if token.is_stop:
            continue
        else:
            nolemmas.append(token.text) 
            
    topic = topic.strip()
    topic_words = topic.split('_')
    
    if len(topic_words) != len(nolemmas):
        print("!!!!! error - not equal length: ", nolemmas, topic_words)
        continue
    #if len(topic_words)<2:
    #    continue
    
    
    tmp_vectors = []
    
    for word, word_nolemma in zip(topic_words, nolemmas):
    #for word in topic_words:
        vector = get_vector(word)
        
        try:
            tmp_vectors.append(model[word])
        except: 
            print('\nNOT in vocabulary: ', word, topic)
            vector = get_vector(word)
            if vector != []:
                tmp_vectors.append(vector)
                if word not in new_words:
                    print('append ', word)
                    new_vectors.append(vector)
                    new_words.append(word)   
            else:
                vector = get_vector(word_nolemma)
                if vector != []:
                    tmp_vectors.append(vector)
                    if word not in new_words:
                        print('append ', word)
                        new_vectors.append(vector)
                        new_words.append(word)  
                else:
                    raise Warning(f"XXX {word} {topic} {topic_nolemma}")
                    print("XXX", word, topic, topic_nolemma) 
    #if word not in new_words:
    #    new_vectors.append(list(np.average(tmp_vectors, axis=0)))
    #    new_words.append(word)        
    if len(tmp_vectors) > 1:
        if topic not in new_words:
   
            print('append ', topic)
            new_vectors.append(list(np.average(tmp_vectors, axis=0)))
            new_words.append(topic)
        else:
            print('doubled TOPIC: ', topic)    
    else:
        print('--- only one word, not a new topic>', topic)

append  paikallinen_kehitys
--- only one word, not a new topic> maaseuturakentaminen
--- only one word, not a new topic> vesitalous
--- only one word, not a new topic> koulutustaso
append  yleissivistää_koulutus

NOT in vocabulary:  rantapenger rantapenger
append  rantapenger
--- only one word, not a new topic> rantapenger

NOT in vocabulary:  yhteisöoikeus yhteisöoikeus
append  yhteisöoikeus
--- only one word, not a new topic> yhteisöoikeus
--- only one word, not a new topic> kulttuuriperintö
append  viljelysmaa_maatalousmaa

NOT in vocabulary:  maatalousmaisema maatalousmaisema
append  maatalousmaisema
--- only one word, not a new topic> maatalousmaisema
--- only one word, not a new topic> maataloustuotanto
append  taloudellinen_kehitys
--- only one word, not a new topic> ravintoketju
--- only one word, not a new topic> elintarviketeollisuus
append  ruoka_laatu
append  globaali_lämpeneminen
--- only one word, not a new topic> kasvihuoneilmiö
append  elinkeinoelämä_kehitys
--- only on



append  vesivara_kehittäminen
append  teknillinen_viljelyskasvi
append  vesivara_suojelu
append  vesi_laatu_hallinta
append  pelto_viljely
--- only one word, not a new topic> maatalouspolitiikka
--- only one word, not a new topic> elintarviketuotanto
append  rahoitusinstrumentti_väline
--- only one word, not a new topic> kaupunkisuunnittelu
append  pintavesi_hallinta
--- only one word, not a new topic> vesivara
append  luonnonvara_hallinta
append  luonnonvarainen_alue_suojelu

NOT in vocabulary:  luonnonsuojelujärjestö luonnonsuojelujärjestö
append  luonnonsuojelujärjestö
--- only one word, not a new topic> luonnonsuojelujärjestö
--- only one word, not a new topic> kaupunkialue
append  maaseutu_haja_asutusalue
append  kunnallinen_vesihuolto
--- only one word, not a new topic> pintavesi
append  maankäyttö_luokitus
append  vesi_määrä_hallinta

NOT in vocabulary:  Eurooppa Eurooppa_unioni
append  Eurooppa
append  Eurooppa_unioni
append  julkinen_palvelu
--- only one word, not a new topic>

--- only one word, not a new topic> kulttuuripolitiikka
--- only one word, not a new topic> hotelliala
append  vesi_tarve
append  talous_alkaa
append  kriittinen_taso
append  metsä_ekosysteemi
--- only one word, not a new topic> rannikkoalue
--- only one word, not a new topic> maatalous
append  vesi_hinnoittelu

NOT in vocabulary:  maakuljetus maakuljetus
append  maakuljetus
--- only one word, not a new topic> maakuljetus
append  julkinen_liikenne
append  kuiva_maa
append  luonnonvara_hyväksikäyttö
append  vesi_laatu
--- only one word, not a new topic> aikuiskoulutus
append  vara_suojelu
append  vesi_laatu_ennallaan_palauttaminen
--- only one word, not a new topic> ympäristövaikutus
append  puu_poisto_maapaikka
append  kaupunki_saastuminen
append  kalatalous_kalastuselinkeino
append  jokiranta_kasvillisuus
--- only one word, not a new topic> ympäristötekniikka
append  liittohallitus_laki
append  taloudellinen_elinkelpoisuus

NOT in vocabulary:  sosiaalilääketiede sosiaalilääketiede
app

append  osallistuminen_yhteiskunta_toiminta
append  kauppaoikeus_talousoikeus
--- only one word, not a new topic> ravinnontarve
append  yksityinen_sektori
append  julkinen_sektori
append  julkinen_osallistuminen
append  julkinen_meno_valtio_meno
append  historia_tutkimus
--- only one word, not a new topic> ympäristöarviointi
--- only one word, not a new topic> elinkaari
--- only one word, not a new topic> metsäteollisuus
--- only one word, not a new topic> metsäpolitiikka
append  vaikutus_ympäristö
append  sosiaalinen_edustus
append  tekninen_ohje
append  orgaaninen_jäte
append  biologinen_tiede
append  tehokkuus_parantaminen
--- only one word, not a new topic> sosiaaliturva
--- only one word, not a new topic> terveydensuojelu
append  eläin_ruokinta
--- only one word, not a new topic> kalanviljely
--- only one word, not a new topic> ympäristökasvatus
--- only one word, not a new topic> vuorovesi

NOT in vocabulary:  eläinekologia eläinekologia
append  eläinekologia
--- only one word, n

--- only one word, not a new topic> petolintu
append  meriympäristö_seuranta
--- only one word, not a new topic> jatkokoulutus
--- only one word, not a new topic> kaupunkiyhdyskunta
append  yhteiskunta_päätös

NOT in vocabulary:  teollisuusjäte teollisuusjäte
append  teollisuusjäte
--- only one word, not a new topic> teollisuusjäte

NOT in vocabulary:  maatalousteollisuus maatalousteollisuus
append  maatalousteollisuus
--- only one word, not a new topic> maatalousteollisuus
append  virtaava_vesi
append  maatalous_jätevesi

NOT in vocabulary:  metsäekologia metsäekologia
append  metsäekologia
--- only one word, not a new topic> metsäekologia
--- only one word, not a new topic> kilpailuoikeus
--- only one word, not a new topic> työlääketiede
append  vesi_kovuus

NOT in vocabulary:  luonnonmaantiede fyysinen_maantiede_luonnonmaantiede
append  luonnonmaantiede
append  fyysinen_maantiede_luonnonmaantiede

NOT in vocabulary:  merikalastus merikalastus
append  merikalastus
--- only one word, 

--- only one word, not a new topic> suhdannekehitys
--- only one word, not a new topic> vesimylly
--- only one word, not a new topic> aluevesi
--- only one word, not a new topic> jätevesi
--- only one word, not a new topic> pohjasakka

NOT in vocabulary:  vesikaivo vesikaivo
append  vesikaivo
--- only one word, not a new topic> vesikaivo
append  vesi_vaarantaminen
--- only one word, not a new topic> ympäristönsuojelu

NOT in vocabulary:  pakkausteollisuus pakkausteollisuus
append  pakkausteollisuus
--- only one word, not a new topic> pakkausteollisuus
append  pohjavesi_laatu

NOT in vocabulary:  alivirtaama alivirtaama
append  alivirtaama
--- only one word, not a new topic> alivirtaama
--- only one word, not a new topic> energiansäästö
--- only one word, not a new topic> laatutavoite
--- only one word, not a new topic> ulkopolitiikka

NOT in vocabulary:  Eurooppa Eurooppa_yhteisö
append  Eurooppa_yhteisö

NOT in vocabulary:  ympäristötalous ympäristötalous
append  ympäristötalous
--- o

append  makea_vesi_seuranta
append  fysikaalinen_kemia
append  kuivatus_pato
--- only one word, not a new topic> viheralue
append  ympäristö_ystävällinen
append  eläin_oikeus

NOT in vocabulary:  käsityöteollisuus käsityöteollisuus
append  käsityöteollisuus
--- only one word, not a new topic> käsityöteollisuus
append  kansa_talousteoria
append  paikallistaso_metsä_istuttaminen
append  kansainvälinen_turvallisuus
--- only one word, not a new topic> jätelainsäädäntö

NOT in vocabulary:  tullimääräys tullimääräys
append  tullimääräys
--- only one word, not a new topic> tullimääräys
append  maailmanlaajuinen_yleissopimus
append  välituote_puolivalmiste
--- only one word, not a new topic> meluntorjunta
append  asunto_olo_koskea_lainsäädäntö
--- only one word, not a new topic> työturvallisuus
--- only one word, not a new topic> asuinrakennus

NOT in vocabulary:  vesihyasintti vesihyasintti
append  vesihyasintti
--- only one word, not a new topic> vesihyasintti
append  säännös_maanjäristys_va

--- only one word, not a new topic> materiaalitekniikka
--- only one word, not a new topic> asetus
append  ympäristövaikutus_arviointi
append  ekologinen_tasa_arvo_puute

NOT in vocabulary:  systeemiteoria systeemiteoria
append  systeemiteoria
--- only one word, not a new topic> systeemiteoria
append  käyttö_rajoittaminen
--- only one word, not a new topic> suurriista
append  valtameri_ilmasto

NOT in vocabulary:  eläinjäte eläinjäte
append  eläinjäte
--- only one word, not a new topic> eläinjäte
append  joki_ranta_t_matalikko_suojelu
append  ekologinen_käydä
--- only one word, not a new topic> joukkotiedotusväline
--- only one word, not a new topic> turvallisuusanalyysi
--- only one word, not a new topic> moottoriajoneuvo
--- only one word, not a new topic> kastelujärjestelmä
--- only one word, not a new topic> kehityslinja
append  käsittely_markkina
append  rakentaa_ympäristö
append  kaupunki_rappeutuminen
--- only one word, not a new topic> työterveys
--- only one word, not a new to

append  jätevesi_aiheuttaa_saastuminen
append  paikallinen_resurssi_hyödyntäminen
append  vesi_imeytyminen_maa
append  nopea_juna_rautatie
append  teollisuus_ympäristöpolitiikka
append  materiaali_elinaika
append  juomavesi_puhdistus
append  kasvi_terveydenhoito
--- only one word, not a new topic> teollisuusympäristö
append  global_environment_facility_ohjelma
append  uusiutua_energianlähde
append  ruoka_ravintoarvo
append  puutavara_tuotantoketju
append  kansainvälinen_talousoikeus
append  julkinen_yksityinen_sektori_yhteistyöhanke
append  yhteisö_oikeusjärjestelmä
append  tehdas_tuotantolaitos
append  maatalous_karjankasvatus
append  kysyntä_tarjonta
append  kansainvälinen_julkisoikeus

NOT in vocabulary:  metsäekosysteemi trooppinen_metsäekosysteemi
append  metsäekosysteemi
append  trooppinen_metsäekosysteemi
append  tuote_elinkaari
doubled TOPIC:  ympäristövaikutus_arviointi
append  uusiutumaton_energiavara

NOT in vocabulary:  rannikkovyöhyke rannikkovyöhyke_suunnittelu
append  ra

append  vedenkorkeus_vesiraja_suojelu
--- only one word, not a new topic> kaukoliikenne
append  arktinen_ekosysteemi
append  ey_n_ministerineuvosto
append  saastuminen_biologinen_vaikutus
append  energia_jakelujärjestelmä
--- only one word, not a new topic> bruttokansantuote
append  asuminen_laatu_koskea_normi
append  päätöksenteko_tuki
append  vapaa_käyttö
append  kauppa_teollisuus_edistäminen
append  suojella_rannikkoalue
--- only one word, not a new topic> ympäristönsuojeluvirasto
append  kansantalous_kustannus
append  liueta_orgaaninen_hiili
--- only one word, not a new topic> pintajännitys

NOT in vocabulary:  tullipolitiikka yhteinen_tullipolitiikka
append  tullipolitiikka
append  yhteinen_tullipolitiikka
append  vapaaehtoinen_luonnonsuojelualue
append  yleinen_hyödyllisyys_koskea_tutkimus
append  kertyminen_kudos

NOT in vocabulary:  säänmuutos säänmuutos
append  säänmuutos
--- only one word, not a new topic> säänmuutos
append  yleishyödyllisyys_julistus
append  matala_korkeus_l

append  ekosysteemi_tutkimus
--- only one word, not a new topic> liikenne
append  etelä_aasi
append  s_ihmisasutus_sosioekonominen_näkökohta
append  small_islands

NOT in vocabulary:  synerginen myrkyllinen_aine_synerginen_vaikutus
append  synerginen
append  myrkyllinen_aine_synerginen_vaikutus

NOT in vocabulary:  jälleenhankintakustannus jälleenhankintakustannus
append  jälleenhankintakustannus
--- only one word, not a new topic> jälleenhankintakustannus

NOT in vocabulary:  vuoroviljely vuoroviljely
append  vuoroviljely
--- only one word, not a new topic> vuoroviljely

NOT in vocabulary:  antagonistinen myrkyllinen_aine_antagonistinen_toinen_kumota_vaikutus
append  antagonistinen
append  myrkyllinen_aine_antagonistinen_toinen_kumota_vaikutus

NOT in vocabulary:  vesiensuojelus ey_n_direktiivi_vesiensuojelus
append  vesiensuojelus
append  ey_n_direktiivi_vesiensuojelus

NOT in vocabulary:  nettovähennys nettovähennys_ottaminen_huomio_päästötaso_arvioida

NOT in vocabulary:  päästötas

append  makrotalous_tavoite

NOT in vocabulary:  mittausohjelma mittausohjelma
append  mittausohjelma
--- only one word, not a new topic> mittausohjelma
--- only one word, not a new topic> aurinkolämmitys
--- only one word, not a new topic> energianlähde
append  painuma_maa_vajoaminen
--- only one word, not a new topic> saastuminen
--- only one word, not a new topic> koulutuskeskus
append  kuivuus_valvonta
--- only one word, not a new topic> liikenneväline
--- only one word, not a new topic> menetelmä
append  biologinen_analyysi
--- only one word, not a new topic> tundra
append  ilmakehä_seuranta
--- only one word, not a new topic> vedenjakaja
append  energia_tarve
--- only one word, not a new topic> turbiini

NOT in vocabulary:  Amerikka etelä_Amerikka
append  etelä_Amerikka
append  tulvasuojelu_tulva_torjunta
append  mekaaninen_varuste
--- only one word, not a new topic> materiaali

NOT in vocabulary:  hätämajoitus hätämajoitus
append  hätämajoitus
--- only one word, not a new topic>

--- only one word, not a new topic> aavikko

NOT in vocabulary:  seurantaverkko seurantaverkko
append  seurantaverkko
--- only one word, not a new topic> seurantaverkko
--- only one word, not a new topic> riutta
append  rikkaruoho_torjunta
append  ilmakehä_otso
append  mineraali_louhinta
--- only one word, not a new topic> tietoverkko
append  ennallistaminen_kunnostus_palautus
--- only one word, not a new topic> istutus
append  kunnallinen_kaukolämpöverkko
append  luonto_villieläin_luonnonkasvi
append  opetus_järjestäminen
--- only one word, not a new topic> rikkidioksidi
--- only one word, not a new topic> hyötyajoneuvo
append  seisminen_valvonta
append  moottoritie_pikatie
append  allas_täyttäminen

NOT in vocabulary:  pohjalieju siltti_muta_pohjalieju
append  pohjalieju
append  siltti_muta_pohjalieju

NOT in vocabulary:  vuorovesialue vuorovesialue_rantavyöhyke
append  vuorovesialue
append  vuorovesialue_rantavyöhyke
append  kemiallinen_ominaisuus
append  sokeri_tuote
--- only one w

append  vuodenaika_liittyä_muutto
--- only one word, not a new topic> geotiede
--- only one word, not a new topic> biomassa
append  saaste_kerrostuminen
--- only one word, not a new topic> merenranta

NOT in vocabulary:  fotokemiallinen fotokemiallinen_saaste
append  fotokemiallinen_saaste
append  biologinen_ominaisuus

NOT in vocabulary:  evapotranspiraatio evapotranspiraatio_kokonaishaihdunta
append  evapotranspiraatio

NOT in vocabulary:  kokonaishaihdunta evapotranspiraatio_kokonaishaihdunta
append  kokonaishaihdunta
append  evapotranspiraatio_kokonaishaihdunta
--- only one word, not a new topic> palveluammatti
--- only one word, not a new topic> havupuu

NOT in vocabulary:  kasvifysiologi kasvifysiologi
append  kasvifysiologi
--- only one word, not a new topic> kasvifysiologi

NOT in vocabulary:  kuitukasvi kuitukasvi
append  kuitukasvi
--- only one word, not a new topic> kuitukasvi

NOT in vocabulary:  konekaivu konekaivu_ruoppaus
append  konekaivu
append  konekaivu_ruoppaus
appe



append  meteorologinen_ennustus
append  vaarallinen_laitos
append  saastuminen_saaste
append  raja_levitä_saaste
--- only one word, not a new topic> kartoitus
append  pohjoinen_etelä_suhde

NOT in vocabulary:  biotooppi biotooppi_t_elinalue_menetys
append  biotooppi_t_elinalue_menetys
--- only one word, not a new topic> tutkimushanke
--- only one word, not a new topic> pilvi
--- only one word, not a new topic> täyteaine
--- only one word, not a new topic> tiheikkö

NOT in vocabulary:  tiesuunnittelu tiesuunnittelu
append  tiesuunnittelu
--- only one word, not a new topic> tiesuunnittelu
--- only one word, not a new topic> tutkimus
--- only one word, not a new topic> veri
--- only one word, not a new topic> työvoima
--- only one word, not a new topic> tropiikki
append  kiviaines_louhinta
append  humanistinen_tiede

NOT in vocabulary:  hapettuva hapettuva_aine
append  hapettuva
append  hapettuva_aine
--- only one word, not a new topic> rikos
append  kaasu_käsittely
--- only one word, not

--- only one word, not a new topic> satelliittikuva
--- only one word, not a new topic> demokratia
append  luonto_hajoavuus

NOT in vocabulary:  eristysaine eriste_eristysaine
append  eristysaine
append  eriste_eristysaine
--- only one word, not a new topic> hapenpuute
append  kaupallinen_liikenne
doubled TOPIC:  saastua_alue
--- only one word, not a new topic> puhe
--- only one word, not a new topic> juoma
--- only one word, not a new topic> kirjallisuus
--- only one word, not a new topic> selkärankainen
--- only one word, not a new topic> keskushallinto
--- only one word, not a new topic> etnologi

NOT in vocabulary:  kyllästäminen kyllästäminen
append  kyllästäminen
--- only one word, not a new topic> kyllästäminen
append  ravintie_poisto
append  liete_poltto
append  tuholaismyrkky_vuorovaikutus
append  vesilintu_vesilintu
append  mikrobiologinen_analyysi

NOT in vocabulary:  puutavaralaji puutavaralaji
append  puutavaralaji
--- only one word, not a new topic> puutavaralaji
append  

--- only one word, not a new topic> kauppamerenkulku
--- only one word, not a new topic> laskeuma
append  pato_t_penger_vahvistus
--- only one word, not a new topic> jäljennös
append  ydinvoima_tutkimuskeskus

NOT in vocabulary:  oseanografia kemiallinen_oseanografia_meritiede
append  oseanografia

NOT in vocabulary:  meritiede kemiallinen_oseanografia_meritiede
append  kemiallinen_oseanografia_meritiede

NOT in vocabulary:  päällä kohde_paikka_päällä_tapahtua
append  päällä
append  kohde_paikka_päällä_tapahtua
append  sydän_verisuonitauti
append  hätäapu_suuronnettomuus
append  moraalinen_vakaumus
append  jäte_vienti

NOT in vocabulary:  eristemateriaali eristemateriaali
append  eristemateriaali
--- only one word, not a new topic> eristemateriaali
--- only one word, not a new topic> meluntorjunta
--- only one word, not a new topic> neuvonta
--- only one word, not a new topic> teräs

NOT in vocabulary:  Atlantti pohjois_Atlantti
append  Atlantti
append  pohjois_Atlantti
append  sosiaal

append  jatkuvuus_pysyvyys
append  hapettuminen_vähentäminen
append  rengas_liikenne
--- only one word, not a new topic> kalakanta
--- only one word, not a new topic> asetus
--- only one word, not a new topic> varuste
append  maa_alue_kunnostus
append  suurehko_onnettomuus
--- only one word, not a new topic> omistusoikeus
append  kotitalous_tuottaa_saaste

NOT in vocabulary:  patoaminen patoaminen
append  patoaminen
--- only one word, not a new topic> patoaminen
--- only one word, not a new topic> katsastus
--- only one word, not a new topic> yksityistäminen
--- only one word, not a new topic> kilpailunrajoitus
append  kansainvälinen_vertailu
--- only one word, not a new topic> rikkipitoisuus
append  suuronnettomuus_ehkäisy
append  ihminen_sairaus
--- only one word, not a new topic> liittohallitus
--- only one word, not a new topic> vähemmistö
append  ryhmä_vi_alkuaine
append  tieto_analysointi

NOT in vocabulary:  relaatiotietokanta relaatiotietokanta
append  relaatiotietokanta
--- on


NOT in vocabulary:  hapentarve biokemiallinen_hapentarve
append  biokemiallinen_hapentarve
--- only one word, not a new topic> kansalaisaloite
--- only one word, not a new topic> mosaiikki
append  puhdistus_radioaktiivinen_saaste
append  biologinen_suodatin
append  kaupunki_laitama_tila
append  aine_tasapaino
append  aisti_havaita_ominaisuus
append  laji_kokonaisuus
--- only one word, not a new topic> kuona
append  eteläinen_tyyni_valtameri
--- only one word, not a new topic> lisäaine
--- only one word, not a new topic> paikoitusalue
--- only one word, not a new topic> fysiikka
--- only one word, not a new topic> muovijäte

NOT in vocabulary:  vajaaravitsemus aliravitsemus_vajaaravitsemus
append  vajaaravitsemus
append  aliravitsemus_vajaaravitsemus

NOT in vocabulary:  kivivilla kivivilla_vuorivilla
append  kivivilla

NOT in vocabulary:  vuorivilla kivivilla_vuorivilla
append  vuorivilla
append  kivivilla_vuorivilla
--- only one word, not a new topic> uni

NOT in vocabulary:  mehiläi


NOT in vocabulary:  hiekkatasanko hiekkatasanko
append  hiekkatasanko
--- only one word, not a new topic> hiekkatasanko

NOT in vocabulary:  hiilipohjainen hiilipohjainen_energia
append  hiilipohjainen
append  hiilipohjainen_energia

NOT in vocabulary:  kuivapesu kemiallinen_pesu_kuivapesu
append  kuivapesu
append  kemiallinen_pesu_kuivapesu
append  ionisoida_säteily
--- only one word, not a new topic> cesium
append  asentaa_järjestelmä_hyväksyminen

NOT in vocabulary:  kirjallisuustutkimus kirjallisuustutkimus
append  kirjallisuustutkimus
--- only one word, not a new topic> kirjallisuustutkimus

NOT in vocabulary:  kuivatislaus kuivatislaus_pyrolyysi
append  kuivatislaus
append  kuivatislaus_pyrolyysi
append  alifaattinen_hiilivety
append  geneettinen_tieto
--- only one word, not a new topic> perhonen
append  saaste_imeytyminen
append  käyttäjä_etu
append  kansainvälinen_tuomioistuin
append  meri_pato_suojata_alamaa
append  vuorovesi_virta
--- only one word, not a new topic> ylijäämä

append  johtavuus_sähkö_lämpö
--- only one word, not a new topic> oksidi
--- only one word, not a new topic> nopeus
--- only one word, not a new topic> sikala
append  jäte_minimointi

NOT in vocabulary:  vakioiminen standardointi_vakioiminen
append  vakioiminen
append  standardointi_vakioiminen
append  merenpohja_kaivostoiminta
append  maksu_saastuttaminen_ehkäiseminen
--- only one word, not a new topic> bruttokansantuote
append  metalli_viimeistely
--- only one word, not a new topic> metalli
--- only one word, not a new topic> lievennys

NOT in vocabulary:  jäähdytystorni jäähdytystorni
append  jäähdytystorni
--- only one word, not a new topic> jäähdytystorni
--- only one word, not a new topic> saippua
--- only one word, not a new topic> kasvisto
--- only one word, not a new topic> pakokaasu
append  epämääräinen_oikeudellinen_käsite
--- only one word, not a new topic> kalsium
--- only one word, not a new topic> metrojuna
append  hiljainen_matkustaminen
append  rikki_poisto_polttoaine


--- only one word, not a new topic> kokoomateos
--- only one word, not a new topic> metrojuna

NOT in vocabulary:  valaehtoinen valaehtoinen_ilmoitus
append  valaehtoinen
append  valaehtoinen_ilmoitus
append  hallintotuomioistuin_hallinto

NOT in vocabulary:  magneettinauha magneettinauha
append  magneettinauha
--- only one word, not a new topic> magneettinauha
--- only one word, not a new topic> olomuoto
append  lupa_valtuutus
append  cd_rom_hakupalvelu
--- only one word, not a new topic> ionosfääri
append  kaatopaikka_peittäminen
--- only one word, not a new topic> alumiinioksidi
append  hinta_asteikko
append  radioaktiivinen_laskeuma
--- only one word, not a new topic> alkueläin
--- only one word, not a new topic> ilmakuvaus
--- only one word, not a new topic> osakepääoma
--- only one word, not a new topic> tiheys
--- only one word, not a new topic> desinfiointi
append  maisema_tuhoutuminen
--- only one word, not a new topic> tietopaketti

NOT in vocabulary:  polysyklinen polysyklin

--- only one word, not a new topic> liuotin
append  ajoittainen_melu
append  ydinonnettomuus_vaara

NOT in vocabulary:  tuotevastuu tuotevastuu
append  tuotevastuu
--- only one word, not a new topic> tuotevastuu
append  onnettomuus_aiheuttaja
--- only one word, not a new topic> katamaraani
--- only one word, not a new topic> aminohappo
--- only one word, not a new topic> ydinase
--- only one word, not a new topic> karbonaatti
--- only one word, not a new topic> kotisivu

NOT in vocabulary:  merikortti karsi_merikortti
append  merikortti
append  karsi_merikortti
append  bibliografinen_tieto
append  auer_sumentaa
append  toimia_aine
--- only one word, not a new topic> hyönteissyöjä

NOT in vocabulary:  kartografinen kartografinen_tietojärjestelmä_laboratorio
append  kartografinen_tietojärjestelmä_laboratorio
--- only one word, not a new topic> sinkki
append  tie_tielinja
--- only one word, not a new topic> mikrobiologi
append  mainos_ilmoitus
append  kaatopaikka_pohja_eristäminen

NOT in

--- only one word, not a new topic> tammi
append  aromaattinen_aine
--- only one word, not a new topic> ennuste

NOT in vocabulary:  osmoosi osmoosi
append  osmoosi
--- only one word, not a new topic> osmoosi
--- only one word, not a new topic> kartasto
append  dokumentointi_asiakirja_aineisto
--- only one word, not a new topic> jyrsijä
--- only one word, not a new topic> bakteriologia
append  elektroninen_tieto_vaihto
--- only one word, not a new topic> jalostamo
append  hyväksyminen_hyväksyntä
--- only one word, not a new topic> allergia
append  lakka_vernissa
append  toimeksianto_tehtävä
append  katu_puhtaanapito
--- only one word, not a new topic> kartoittaa
--- only one word, not a new topic> syanidi
--- only one word, not a new topic> lyijy
--- only one word, not a new topic> kipsi
--- only one word, not a new topic> puhdistus

NOT in vocabulary:  sulkuportti sulkuportti
append  sulkuportti
--- only one word, not a new topic> sulkuportti
append  ympäristötietoisuus_ympäristöliike

append  virkatehtävä_virkavelvollisuus
--- only one word, not a new topic> vandalismi
append  hermosto_myrkyllisyys
--- only one word, not a new topic> lakka
--- only one word, not a new topic> kumi
append  radioaktiivinen_alkuaine

NOT in vocabulary:  liuotus liuotus_liukeneminen
append  liuotus
append  liuotus_liukeneminen
append  mutageeninen_aine
--- only one word, not a new topic> vertailu

NOT in vocabulary:  sekoittuvuus sekoittuvuus
append  sekoittuvuus
--- only one word, not a new topic> sekoittuvuus
append  palautuminen_siirtyminen
--- only one word, not a new topic> putous
append  maankuori_hidas_liike
append  maanmittaus_geodesia
--- only one word, not a new topic> tiili
--- only one word, not a new topic> bensiinimoottori
append  mikro_organismi_mikrobi
--- only one word, not a new topic> hitsaus
append  hiljainen_työmatkaliikenne
--- only one word, not a new topic> onkiminen
--- only one word, not a new topic> heijastuma
--- only one word, not a new topic> piiru
--- only 

--- only one word, not a new topic> satama
--- only one word, not a new topic> räjähtävä
--- only one word, not a new topic> lasite
append  rikastaa_ura
--- only one word, not a new topic> termiitti
append  cfc_yhdiste
--- only one word, not a new topic> mutantti
--- only one word, not a new topic> tislaus
--- only one word, not a new topic> lamppu

NOT in vocabulary:  lasivilla lasivilla
append  lasivilla
--- only one word, not a new topic> lasivilla
--- only one word, not a new topic> beryllium

NOT in vocabulary:  syövytys etsaus_syövytys
append  syövytys
append  etsaus_syövytys
--- only one word, not a new topic> desibeli
--- only one word, not a new topic> uuni
--- only one word, not a new topic> amiini

NOT in vocabulary:  geotekniikka geotekniikka
append  geotekniikka
--- only one word, not a new topic> geotekniikka
--- only one word, not a new topic> feromoni
--- only one word, not a new topic> isotooppi
append  hävitä_laji
--- only one word, not a new topic> muste
--- only one

append  ekologinen_sivilisaatio
append  ekologinen_jalanjälki

NOT in vocabulary:  häiriönsietokyky ympäristö_häiriönsietokyky
append  häiriönsietokyky
append  ympäristö_häiriönsietokyky

NOT in vocabulary:  vaihettumisvyöhyke vaihettumisvyöhyke
append  vaihettumisvyöhyke
--- only one word, not a new topic> vaihettumisvyöhyke
append  ekosysteemi_vuorovaikutus
--- only one word, not a new topic> ekosysteemipalvelu
append  ekosysteemipalvelu_haavoittuvuus
append  tehokkuus_arviointi
--- only one word, not a new topic> päästöoikeus

NOT in vocabulary:  päästötaso päästötaso
--- only one word, not a new topic> päästötaso
append  päästökauppa_järjestelmä
append  ympäristöala_toimintaohjelma
--- only one word, not a new topic> ympäristöjalanjälki
--- only one word, not a new topic> ympäristöhallinto
--- only one word, not a new topic> ympäristölainsäädäntö

NOT in vocabulary:  EU EU_n_päästökauppajärjestelmä
append  EU_n_päästökauppajärjestelmä

NOT in vocabulary:  Eurooppa Eurooppa_ympärist

In [33]:
# add topics to model
model.add(new_words,new_vectors)

In [34]:
# save the model with new topics
model.save_word2vec_format(excluded_model_name, binary=True)
#reload the model  otherwise cannot find similarities fo newly added words
model = KeyedVectors.load_word2vec_format(excluded_model_name, binary=True)

In [35]:
len(model.index2word)

111253

In [39]:
# try the model
model.similar_by_vector('liiallinen_lannoittaminen')

[('liiallinen', 0.8417060971260071),
 ('liiallinen_hyväksikäyttö', 0.840916633605957),
 ('lannoittaminen', 0.8333126306533813),
 ('luonnollinen_lannoite', 0.7493617534637451),
 ('kemiallinen_lannoite', 0.7150038480758667),
 ('tuholainen_aiheuttaa_ruoka_pilaantuminen', 0.7139127850532532),
 ('kemiallinen_tuholainen_torjunta', 0.703312337398529),
 ('lisäaine_päivittäinen_saanti_terveydellinen_vaara', 0.6989914178848267),
 ('liika', 0.6983906626701355),
 ('maatalous_aiheuttaa_saastuminen', 0.6918289065361023)]

In [40]:
# find most similar to topics to terms in the new model

# load the new lemma list
with open(lemma_list_file_excluded) as fp:
    topics = fp.readlines()

for i, topic in enumerate(topics):
    topic = topic.strip()
    print('\n-----\n', topic)
    try:
        print(i, model.similar_by_vector(topic))
    except:
        print(topic, 'NOT in model')


-----
 paikallinen_kehitys
0 [('taloudellinen_kehitys', 0.884630560874939), ('sosiaalinen_kehitys', 0.8804570436477661), ('historiallinen_kehitys', 0.8774236440658569), ('kehitys', 0.8648649454116821), ('ympäristö_kehitys', 0.860937237739563), ('kulttuuri_kehitys', 0.8561224341392517), ('ala_viimeinen_kehitys_vallita_tekninen_kehitystaso', 0.8536185026168823), ('elinkeinoelämä_kehitys', 0.8521822690963745), ('ekologinen_kehitys', 0.8490339517593384), ('paikallinen_resurssi_hyödyntäminen', 0.8305875658988953)]

-----
 maaseuturakentaminen
1 [('maaseuturahoitus', 0.6721558570861816), ('hajarakentaminen', 0.6211841106414795), ('puurakentaminen', 0.6003641486167908), ('aluerakentaminen', 0.5936902761459351), ('tuulivoimarakentaminen', 0.5828033685684204), ('pientalorakentaminen', 0.5743743181228638), ('palvelurakentaminen', 0.5575456023216248), ('rakentaminen', 0.5520482063293457), ('kalliorakentaminen', 0.5473611354827881), ('kaupunkirakentaminen', 0.5452227592468262)]

-----
 vesitalous

35 [('keskiaste', 0.9225724935531616), ('koulutus', 0.7950879335403442), ('peruskoulutus', 0.7877575159072876), ('alkeisopetus_perusaste_koulutus', 0.7764261960983276), ('yleissivistää_koulutus', 0.7761905789375305), ('yliopistotaso_koulutus', 0.7541100978851318), ('ammattikoulutus', 0.7490333914756775), ('koulutusaste', 0.737169623374939), ('koulutusala', 0.7299893498420715), ('koulutustaso', 0.7191504240036011)]

-----
 maa_tiivistys
36 [('puhdistus_maa', 0.8800258636474609), ('maa', 0.8796316385269165), ('maa_kosteus', 0.8652142286300659), ('kuiva_maa', 0.8620829582214355), ('maa_puhdistaminen', 0.8617476224899292), ('maa_lujitus_maa_stabilointi', 0.8588136434555054), ('maa_alue_kunnostus', 0.8583489060401917), ('maa_alue', 0.8517445921897888), ('maa_kuormitus', 0.8477222919464111), ('maa_saneeraus', 0.8467265367507935)]

-----
 maa_kasvukunto_heikkeneminen
37 [('kasvukunto', 0.8205385804176331), ('luonnonvara_laatu_heikkeneminen', 0.807164192199707), ('maa_puhdistaminen', 0.7979235

70 [('ympäristönsuojelujärjestö', 0.768477201461792), ('luonnonsuojelu', 0.7486464977264404), ('lastensuojelujärjestö', 0.7465183734893799), ('luonnonsuojeluyhdistys', 0.7283951044082642), ('ympäristöjärjestö', 0.7239370942115784), ('luonnonsuojeluliitto', 0.7062997817993164), ('luonnonsuojeluohjelma', 0.691562294960022), ('luonnonsuojelualue', 0.6791955232620239), ('vapaaehtoinen_luonnonsuojelualue', 0.6709541082382202), ('luonnonsuojelija', 0.663583517074585)]

-----
 kaupunkialue
71 [('suurkaupunkialue', 0.8887217044830322), ('esikaupunkialue', 0.8630576729774475), ('pääkaupunkialue', 0.8457313179969788), ('kaupunki_viheralue', 0.7992988228797913), ('kaupunki', 0.7902138829231262), ('maaseutu_asuinalue', 0.772165060043335), ('elinympäristö_kaupunki', 0.771778404712677), ('kantakaupunki', 0.7639115452766418), ('kaupunki_keskus', 0.7524353265762329), ('kaupunki_kaatopaikka', 0.7500454187393188)]

-----
 maaseutu_haja_asutusalue
72 [('haja_asutusalue', 0.9508363008499146), ('haja', 0.8

88 [('vaikutus_ihminen', 0.859384298324585), ('moni_tekijä_aiheuttaa_saastuminen', 0.857061505317688), ('ihminen_aiheutua_tekijä', 0.8562391996383667), ('ihminen', 0.8349111676216125), ('ihminen_sairaus', 0.8319447040557861), ('ihminen_terveys', 0.8308453559875488), ('ihminen_altistuminen_saaste', 0.8267288208007812), ('ihminen_toiminta', 0.8265066742897034), ('ihminen_luonto_suhde', 0.8232206106185913), ('tauti_aiheuttaa_organismi', 0.8085373044013977)]

-----
 maataloustuotanto_säännöstely
89 [('säännöstely', 0.9002548456192017), ('maataloustuotanto', 0.7741248607635498), ('syntyvyys_säännöstely', 0.7687649130821228), ('säännöstellä', 0.7155200242996216), ('tuotanto_rajoittaminen', 0.7128808498382568), ('maatalous_suunnittelu', 0.7123914957046509), ('maatalous', 0.7100019454956055), ('maatalous_aiheuttaa_saastuminen', 0.6996424198150635), ('maatalous_vaikutus_ympäristö', 0.6984410881996155), ('maatalous_karjankasvatus', 0.6971657276153564)]

-----
 kaupunkirakentaminen
90 [('kaupunki

122 [('petrokemia', 0.9560694694519043), ('metallurginen_teollisuus', 0.8354130387306213), ('teollisuus', 0.8344964385032654), ('kemia_teollisuus', 0.794980525970459), ('petrokemikaali', 0.7943952083587646), ('sähkötekninen_teollisuus', 0.7819585800170898), ('kemianteollisuus', 0.781690239906311), ('teollinen', 0.7687314748764038), ('metalliteollisuus', 0.758101224899292), ('koneteollisuus_koneenrakennusteollisuus', 0.7547487616539001)]

-----
 eroosio
123 [('eroosio_valvonta', 0.8556067943572998), ('vesieroosio', 0.6879310607910156), ('tuulieroosio', 0.6800178289413452), ('maaperä_saastuminen', 0.6655179262161255), ('maaperä_vaurioituminen', 0.6631751656532288), ('maaperä_tiivistyminen', 0.6410550475120544), ('maaperä_saaste', 0.6315357089042664), ('pohjavesi_saastuminen', 0.6302781105041504), ('painuma_maa_vajoaminen', 0.6209445595741272), ('saastua_maaperä', 0.6167285442352295)]

-----
 maavesi
124 [('onkivesi', 0.7495019435882568), ('niinivesi', 0.705618679523468), ('haukivesi', 0.

152 [('uudisraivaaja', 0.7151393890380859), ('raivaus', 0.6805616021156311), ('raivaustyö', 0.6563585996627808), ('metsitys_metsä_istutus', 0.5495837926864624), ('metsitys_metsä_istuttaminen', 0.5479788184165955), ('metsitys', 0.5354289412498474), ('asutustoiminta', 0.5327606201171875), ('asutus', 0.524304986000061), ('asuttaminen', 0.5185425281524658), ('arkeologinen_kaivauspaikka', 0.515736997127533)]

-----
 ruoka_varastointi
153 [('ruoka_säilytys', 0.9214990735054016), ('ruoka', 0.8987678289413452), ('ruoka_ravintoarvo', 0.8669732213020325), ('ruoka_aine_elintarvike', 0.8660032153129578), ('ruoka_laatu', 0.8648861646652222), ('ruoka_säteilytys', 0.8466371297836304), ('ruoka_saastuminen', 0.8429814577102661), ('runsasproteiininen_ruoka', 0.8105336427688599), ('tuholainen_aiheuttaa_ruoka_pilaantuminen', 0.8010111451148987), ('energia_varastointi', 0.7812290787696838)]

-----
 eläin_ravitsemus
154 [('eläin_terveys', 0.9298592805862427), ('eläin_ruokinta', 0.905591607093811), ('eläin',

180 [('säädös', 0.8945406675338745), ('yhteisö', 0.828147828578949), ('yhteisö_oikeusjärjestelmä', 0.8243848085403442), ('yhdyskunta_koskea_laki', 0.803857684135437), ('lainsäädäntö', 0.7972190380096436), ('direktiivi_saattaminen_osa_kansallinen_lainsäädäntö', 0.7915365695953369), ('laki_täytäntöönpano', 0.7860641479492188), ('alueellinen_yhteisö', 0.7848408818244934), ('vastuu_koskea_lainsäädäntö', 0.7830331325531006), ('yhteisö_talousarvio', 0.7826323509216309)]

-----
 maatalousrakennus
181 [('talousrakennus', 0.9005221128463745), ('tuotantorakennus', 0.7511857151985168), ('piharakennus', 0.7485967874526978), ('maatalous_vesirakennus', 0.7441388964653015), ('asuinrakennus', 0.7301387786865234), ('maatalo', 0.7161815166473389), ('hirsirakennus', 0.7149479389190674), ('teollisuusrakennus', 0.7113954424858093), ('saunarakennus', 0.702141284942627), ('ulkorakennus', 0.6910417079925537)]

-----
 teollisuusrakennus
182 [('teollisuustila', 0.7816053032875061), ('tehdasrakennus', 0.74734598

213 [('eläinsuojelu', 0.7903391718864441), ('eläinsuojelulaki', 0.741192102432251), ('eläin_lanta', 0.7331109642982483), ('eläinsuojelutarkastus', 0.7315330505371094), ('eläinsuojelulainsäädäntö', 0.7266566753387451), ('eläin_ruokinta', 0.7172572612762451), ('eläinsuojeluyhdistys', 0.6898821592330933), ('eläin_teurastus', 0.6890020370483398), ('tuotantoeläin', 0.6886136531829834), ('eläin', 0.6884366273880005)]

-----
 väestörakenne
214 [('väestörakenne_kehitys', 0.8654441833496094), ('väkiluku_väestörakenne_kehitys', 0.8300653696060181), ('väestö', 0.784305214881897), ('ikärakenne', 0.7689238786697388), ('väestökehitys', 0.7342729568481445), ('väestö_koostumus', 0.7162572145462036), ('väestö_maantieteellinen_jakautuminen', 0.7110949754714966), ('väestömäärä', 0.7096716165542603), ('väestönkehitys', 0.6944271326065063), ('elinkeinorakenne', 0.6842550039291382)]

-----
 meri_pääsy
215 [('yleinen_pääsy_maa', 0.850541889667511), ('pääsy_maa_alue', 0.841395378112793), ('pääsy', 0.824284374

248 [('rahoituspolitiikka', 0.6951860189437866), ('luotto', 0.6623332500457764), ('valuuttapolitiikka', 0.6515287756919861), ('luottoriski', 0.6509410738945007), ('luottokanta', 0.6464626789093018), ('luottopäätös', 0.6446772217750549), ('luottokelpoisuus', 0.6420751810073853), ('luottosopimus', 0.6303213238716125), ('veropolitiikka', 0.6102625131607056), ('luottohakemus', 0.6082671880722046)]

-----
 rannikkoalue_hoito
249 [('ympäristö_hoito', 0.8918665647506714), ('hoito', 0.8859432935714722), ('matkailutoiminta_hoito', 0.8743662238121033), ('viljelymaa_hoito', 0.8645542860031128), ('maatila_hoito', 0.848758339881897), ('hoito_terapia', 0.8375610113143921), ('metsä_kestävä_hoito_käyttö', 0.7848870754241943), ('hoito_hallinto_johtaminen_käsittely', 0.770669162273407), ('hoitotoimi', 0.7447296380996704), ('hoitomuoto', 0.7407414317131042)]

-----
 ympäristölainsäädäntö
250 [('ympäristölainsäädäntö_täytäntöönpano', 0.7983924746513367), ('yhteisölainsäädäntö', 0.7734747529029846), ('lain

284 [('jokiranta', 0.908945620059967), ('kasvillisuus', 0.8165294528007507), ('kallio_rantatörmä', 0.7399394512176514), ('jokivarsi', 0.7319556474685669), ('rantakallio', 0.7316914796829224), ('kasvillisuus_eläimistö_muodostuminen_laiva_pohja', 0.7302075624465942), ('vesikasvillisuus', 0.7272624969482422), ('kasvitieteellinen_puisto', 0.7228488326072693), ('kivikko', 0.7209060788154602), ('kaupunki_viheralue', 0.7195450067520142)]

-----
 ympäristötekniikka
285 [('ympäristöteknologia', 0.9128796458244324), ('kiinteistötekniikka', 0.788917064666748), ('energiatekniikka', 0.7868173122406006), ('ympäristötekninen', 0.7857751846313477), ('ympäristöala', 0.7617181539535522), ('kemiantekniikka', 0.7539222240447998), ('ympäristötiede', 0.7533032298088074), ('konetekniikka', 0.742639422416687), ('geotekniikka', 0.742419421672821), ('biotekniikka', 0.7334772348403931)]

-----
 liittohallitus_laki
286 [('laki', 0.9108363389968872), ('laki_täytäntöönpano', 0.8526296615600586), ('yhdyskunta_koskea

302 [('muoviteollisuus', 0.7021137475967407), ('mineraaliteollisuus', 0.6738004684448242), ('hiiliteollisuus', 0.6706805229187012), ('koneteollisuus_koneenrakennusteollisuus', 0.6602151989936829), ('metalliteollisuus', 0.6592202186584473), ('terästeollisuus', 0.6591119766235352), ('koneenrakennusteollisuus', 0.6561223268508911), ('sementtiteollisuus', 0.6559720039367676), ('kaasuteollisuus', 0.6485815048217773), ('elektroniikkateollisuus', 0.6482624411582947)]

-----
 ilmastovaikutus
303 [('ilmastonmuutos_vaikutus', 0.747477114200592), ('ympäristövaikutus', 0.7323476076126099), ('ilmastopäästö', 0.719977855682373), ('päästövaikutus', 0.6835917234420776), ('ympäristöhyöty', 0.6761640310287476), ('hiilidioksidipäästö', 0.6758856773376465), ('energia_vaikutus_ympäristö', 0.6744660139083862), ('ilmastonmuutos', 0.6643983125686646), ('vaikutus_ympäristö', 0.6599963903427124), ('päästö', 0.6588782668113708)]

-----
 elintarvike
304 [('terveysvaikutteinen_elintarvike', 0.904453694820404), ('r

320 [('koneteollisuus', 0.9340518712997437), ('koneenrakennusteollisuus', 0.9177110195159912), ('lentokoneteollisuus', 0.8164482116699219), ('teollisuus', 0.797798752784729), ('koneenrakennus', 0.7961143255233765), ('puunjalostusteollisuus', 0.7951969504356384), ('metalliteollisuus', 0.7934821844100952), ('rakennusteollisuus', 0.7907541990280151), ('metallituoteteollisuus', 0.7866562604904175), ('konepajateollisuus', 0.7791951894760132)]

-----
 puuteollisuus
321 [('puunjalostusteollisuus', 0.7369925379753113), ('metalliteollisuus', 0.7354022264480591), ('teollisuus', 0.7303979992866516), ('koneteollisuus_koneenrakennusteollisuus', 0.7290717363357544), ('huonekaluteollisuus', 0.727215588092804), ('muoviteollisuus', 0.7236466407775879), ('sahateollisuus', 0.7175126075744629), ('selluteollisuus', 0.7112985253334045), ('teollisuusala', 0.705460250377655), ('paperiteollisuus', 0.701341450214386)]

-----
 politiikka_yhtenäistäminen
322 [('lainsäädäntö_yhtenäistäminen', 0.8743067383766174), 

354 [('biologinen', 0.8971554636955261), ('biologinen_ominaisuus', 0.8879282474517822), ('biologinen_prosessi', 0.8836624622344971), ('ekologinen_kehitys', 0.8831533193588257), ('biologinen_tuotanto', 0.8810242414474487), ('biologinen_käsittely_biologinen_puhdistus', 0.8793854117393494), ('biologinen_resurssi', 0.8772433996200562), ('biologinen_aktiviteetti', 0.8720057010650635), ('sosiaalinen_kehitys', 0.8664406538009644), ('biologinen_analyysi', 0.8652099370956421)]

-----
 ympäristövahinko
355 [('rangaistus_ympäristövahinko', 0.8411657810211182), ('öljyvahinko_öljypäästö', 0.7697139978408813), ('öljyvahinko', 0.7694498896598816), ('henkilövahinko', 0.7497056126594543), ('omaisuusvahinko', 0.7334630489349365), ('ympäristöonnettomuus', 0.7179969549179077), ('ympäristövahinkovakuutus', 0.7172291278839111), ('ympäristöriski', 0.7084990739822388), ('vahinko', 0.7072896957397461), ('esinevahinko', 0.7060936093330383)]

-----
 kaupunki_vesi
356 [('vesi', 0.925460696220398), ('vesi_vuorovai

388 [('teknologiateollisuus', 0.8014910817146301), ('energiatekniikka', 0.7599434852600098), ('sähköteollisuus', 0.7333368062973022), ('energiantuotanto', 0.7224389910697937), ('bioenergia', 0.7127933502197266), ('metsäteollisuus', 0.7086717486381531), ('rakennusteollisuus', 0.7084479928016663), ('kemianteollisuus', 0.7052866220474243), ('energiatilasto', 0.704348087310791), ('energiamarkkina', 0.7038763165473938)]

-----
 ympäristöteollisuus
389 [('teollisuus_ympäristöpolitiikka', 0.6996980905532837), ('ympäristöala', 0.686348557472229), ('ympäristötekniikka', 0.6782352924346924), ('ympäristöteknologia', 0.6765110492706299), ('ympäristöyritys', 0.6686654686927795), ('teollisuusteknologia', 0.6541308164596558), ('kierrätysteollisuus', 0.6484678983688354), ('ympäristönsuojelu_yritys', 0.6429153680801392), ('ympäristöala_toimintaohjelma', 0.642670750617981), ('rakennustuoteteollisuus', 0.6419152617454529)]

-----
 kuivatus_salaojitus
390 [('kuivatus_ojitus_salaojitus', 0.9648674726486206

422 [('vihreä', 0.9083756804466248), ('vihreä_talous', 0.8368660807609558), ('vihreä_rahoitusväline', 0.8196002244949341), ('vihreä_vyöhyke', 0.805936336517334), ('vihreä_liike_ekologinen_liike', 0.777531623840332), ('vallankumous', 0.7449387311935425), ('vihreä_käydä', 0.7440851926803589), ('sininen_kasvu', 0.7225072383880615), ('punainen', 0.7180905938148499), ('vallankumouksellinen', 0.7099405527114868)]

-----
 kuljetus_hinta
423 [('hinta', 0.8856635093688965), ('kuljetus', 0.8001267910003662), ('tuote_hinta_maatila', 0.7879157662391663), ('raskas_tavara_kuljetus', 0.7791929841041565), ('hankinta_toimitus_tarjonta', 0.7705504894256592), ('kuljetuskustannus', 0.7509280443191528), ('hinnoittelu', 0.7349385023117065), ('rahti', 0.7264655828475952), ('hinta_asteikko', 0.7182052731513977), ('yhdistää_kuljetus', 0.7121457457542419)]

-----
 sosiaalinen_erilaistuminen
424 [('sosiaalinen', 0.8838152289390564), ('sosiaalinen_käyttäytyminen', 0.8696095943450928), ('sosiaalinen_kehitys', 0.86

440 [('metsätalous_metsänhoito', 0.9502759575843811), ('yksityismetsätalous', 0.8187738656997681), ('metsänhoito', 0.8169830441474915), ('metsätaloudellinen', 0.8169254064559937), ('metsänviljely_metsänhoito', 0.8168917298316956), ('metsätalous_vaikutus_ympäristö', 0.7920781373977661), ('metsätalousala', 0.7732281684875488), ('metsätalousvaltainen', 0.7697684168815613), ('metsätalousalue', 0.7689576148986816), ('metsätalouskäyttö', 0.76483154296875)]

-----
 osallistuminen_yhteiskunta_toiminta
441 [('yhteisö_osallistuminen', 0.8934782147407532), ('toiminta', 0.8563755750656128), ('taloudellinen_toiminta', 0.8520617485046387), ('institutionaalinen_toiminta', 0.8486669063568115), ('ihminen_toiminta', 0.8244993686676025), ('aktiivinen_osallistuminen', 0.824398398399353), ('maa_perustaa_toiminta', 0.8199001550674438), ('yhteiskunta_päätös', 0.8150390982627869), ('yhteiskunta', 0.8002090454101562), ('sosiaalinen_kehitys', 0.7993718385696411)]

-----
 kauppaoikeus_talousoikeus
442 [('kauppao

458 [('parantaminen', 0.9114089012145996), ('tehokkuus', 0.8884371519088745), ('tehokkuus_arviointi', 0.8454965353012085), ('vesi_laatu_parantaminen', 0.802118718624115), ('tehostaminen', 0.8010958433151245), ('laatu_hallinta', 0.79885333776474), ('ympäristö_laatu_heikkeneminen', 0.7986124753952026), ('politiikka_tehokkuus', 0.7845100164413452), ('luonnonvara_laatu_heikkeneminen', 0.7829147577285767), ('tuottavuus_kehityssuunta', 0.7811852693557739)]

-----
 sosiaaliturva
459 [('sosiaaliturpa', 0.9048821926116943), ('sosiaaliturvaetuus', 0.7919092178344727), ('toimeentuloturva', 0.7864106297492981), ('työttömyysturva', 0.7763900756835938), ('työttömyysturpa', 0.7455624341964722), ('sosiaaliturvajärjestelmä', 0.7382365465164185), ('eläketurva', 0.736607551574707), ('sosiaalietuus', 0.7309221029281616), ('työeläkejärjestelmä', 0.7115782499313354), ('etuus', 0.7024117708206177)]

-----
 terveydensuojelu
460 [('terveydensuojelulaki', 0.8799822330474854), ('terveydensuojeluviranomainen', 0.

487 [('kehitysyhteistyöhanke', 0.8225681185722351), ('yritysyhteistyö', 0.8012329339981079), ('kehitysyhteistyöjärjestö', 0.7538690567016602), ('kehityspolitiikka', 0.7243366241455078), ('kansainvälinen_yhteistyö', 0.7191689014434814), ('yhteistyö', 0.6839005947113037), ('kehitystoiminta', 0.6766011714935303), ('järjestöyhteistyö', 0.674673855304718), ('kansainvälinen_järjestö', 0.6745932698249817), ('yhteistyöhanke', 0.6724894642829895)]

-----
 järjestö
488 [('kansainvälinen_järjestö', 0.9064275026321411), ('poliittinen_järjestö', 0.863521933555603), ('kansalaisjärjestö', 0.8278168439865112), ('järjestötoiminta', 0.7850371599197388), ('yhdistys', 0.7755856513977051), ('keskusjärjestö', 0.761512815952301), ('paikallisjärjestö', 0.7483439445495605), ('naisjärjestö', 0.7468866109848022), ('vapaaehtoisjärjestö', 0.7396429777145386), ('jäsenjärjestö', 0.734626054763794)]

-----
 tuotantorakenne
489 [('tuotantorakennus', 0.8478056788444519), ('tuotantojärjestelmä', 0.7337855100631714), ('t

522 [('alue', 0.9229722619056702), ('luonnonvarainen_alue_suojelu', 0.9126837253570557), ('maa_alue', 0.901634693145752), ('maa_alue_ekosysteemi', 0.9000847935676575), ('eliömaantieteellinen_alue', 0.8895070552825928), ('suojelualue_rauhoittaa_alue', 0.888271689414978), ('viljelemätön_maa_alue', 0.8854360580444336), ('vaarallinen_alue', 0.8852921724319458), ('rekisteröidä_maa_alue', 0.8845610618591309), ('maa_alue_suojelu', 0.8830792307853699)]

-----
 liiketoiminta
523 [('liiketoiminto', 0.8564252853393555), ('liiketoimintamalli', 0.8436145782470703), ('palveluliiketoiminta', 0.8324177861213684), ('liiketoimi', 0.8265525102615356), ('liiketoimintaympäristö', 0.820965051651001), ('projektiliiketoiminta', 0.8166458010673523), ('ydinliiketoiminta', 0.8058439493179321), ('liiketoiminnallinen', 0.8014322519302368), ('liiketoimintaprosessi', 0.7995163202285767), ('liiketoiminnallisesti', 0.7995056509971619)]

-----
 yhteiskunnallinen_tila
524 [('tila', 0.9242096543312073), ('taloudellinen_t

556 [('energia', 0.8329340219497681), ('energia_käyttö', 0.8323385715484619), ('energia_jakelujärjestelmä', 0.8298175930976868), ('konventionaalinen_energia', 0.8243110179901123), ('käyttö_energia_tuottaminen', 0.8232542872428894), ('energia_varastointi', 0.821890652179718), ('muuntaminen', 0.8215550780296326), ('tavanomainen_energia', 0.8167108297348022), ('energia_vaikutus_ympäristö', 0.794059157371521), ('energia_tarve', 0.7936520576477051)]

-----
 kivennäisvesi
557 [('kivennäinen', 0.7053609490394592), ('lähdevesi', 0.6814796924591064), ('kivennäisaine', 0.6434651613235474), ('makea_suolaton_vesi', 0.6403623819351196), ('juoma', 0.6285535097122192), ('hanavesi', 0.6250373125076294), ('makea_vesi_pilaantuminen', 0.6225841045379639), ('mehu', 0.6208814382553101), ('suolainen_vesi', 0.6206517219543457), ('virvoitusjuoma', 0.6205812692642212)]

-----
 selluloosateollisuus
558 [('selluloosatehdas', 0.8472541570663452), ('selluloosa', 0.7921557426452637), ('sulfiittiselluloosatehdas', 0

589 [('työllisyys_ympäristö', 0.8741941452026367), ('työllisyys_rakenne', 0.8322025537490845), ('työllistyminen', 0.8236871957778931), ('työllinen', 0.8160719871520996), ('työllistäminen', 0.811866044998169), ('työttömyys', 0.797762393951416), ('työllisyydenhoito', 0.7735424041748047), ('työllisyysaste', 0.7667262554168701), ('työllisyystilanne', 0.763237714767456), ('työllisyyskehitys', 0.7592180371284485)]

-----
 yksityinen_hallinta_alue
590 [('monikäyttöinen_alue_hallinta', 0.9281644821166992), ('kaupunki_hallinta', 0.8812414407730103), ('maa_hallinta_suunnittelu', 0.8781578540802002), ('maa_alue_kunnostus', 0.8622403740882874), ('alue', 0.8508689403533936), ('kehitysalue_rakenne_alue', 0.847267746925354), ('maa_alue_suojelu', 0.8448276519775391), ('rekisteröidä_maa_alue', 0.8439263105392456), ('vaarallinen_alue', 0.8419622778892517), ('ranta_alue_kehitys', 0.8384091854095459)]

-----
 valtio_maa
591 [('maa', 0.9423155784606934), ('valtio', 0.9267842173576355), ('maa_alue', 0.88375

622 [('orgaaninen_hiili_kokonaispitoisuus', 0.9714627265930176), ('liueta_orgaaninen_hiili', 0.9460103511810303), ('hiili', 0.9123461246490479), ('hiili_muuttaminen_kaasu_hiili_kaasuttaminen', 0.8708218336105347), ('orgaaninen', 0.8615514039993286), ('orgaaninen_typpi', 0.8608525991439819), ('hiili_kiertokulku', 0.8531850576400757), ('orgaaninen_fosforiyhdiste', 0.8530835509300232), ('hiili_nesteytys', 0.8461962938308716), ('orgaaninen_tinayhdiste', 0.8412743806838989)]

-----
 kasvijäte
623 [('puutarhajäte', 0.7857235074043274), ('muovijäte', 0.7469335198402405), ('puujäte', 0.7452173233032227), ('kasviaines', 0.7349759340286255), ('luonnonvarainen_kasvi', 0.7231053709983826), ('kasvi', 0.7213034629821777), ('kasviyhdyskunta', 0.7177077531814575), ('kompostoida_jäte', 0.7125968933105469), ('biojäte', 0.7089318037033081), ('kukkakasvi', 0.7088872194290161)]

-----
 ympäristö_tasapaino
624 [('tasapaino', 0.8845123052597046), ('ekologinen_tasapaino', 0.8818634748458862), ('kansainvälinen

651 [('hallinnollinen_raja', 0.9154494404792786), ('valtio_raja', 0.8916773796081543), ('raja_ylitys', 0.8791517019271851), ('raja_arvo', 0.8651993274688721), ('sallia_altistus_raja', 0.8018821477890015), ('raja_levitä_saaste', 0.7572506666183472), ('köysi_viiva_linja_rivi_raja_reitti_alkaa', 0.7532774209976196), ('rajamaa', 0.7432425022125244), ('rajata', 0.7244600653648376), ('ääriraja', 0.7051187753677368)]

-----
 maamekaniikka
652 [('mekaniikka', 0.6248550415039062), ('virtausmekaniikka', 0.5291508436203003), ('säätötekniikka', 0.5112981200218201), ('systeemibiologi', 0.5054243803024292), ('aerobiologi', 0.5031000375747681), ('hienomekaniikka', 0.4996162950992584), ('sähköoppi', 0.4990662932395935), ('materiaalifysiikka', 0.49030524492263794), ('sähkötekniikka', 0.4894372224807739), ('statiikka', 0.4885609447956085)]

-----
 maanisäkäs
653 [('nisäkäs', 0.7181574702262878), ('pikkunisäkäs', 0.6742432117462158), ('merinisäkäs', 0.6713879704475403), ('luonnonvarainen_eläimistö', 0.66

686 [('typpimonoksidi', 0.7869818210601807), ('typpioksidi', 0.6988496780395508), ('typpidioksidi', 0.6866616010665894), ('hiilidioksidi', 0.6703661680221558), ('rikkidioksidi', 0.6527613401412964), ('vetysulfidi_rikkivety', 0.6514291763305664), ('hydroksidi', 0.64547199010849), ('halogenoida_hiilivety', 0.6416686773300171), ('polttokaasu_savukaasu', 0.640211284160614), ('hiilivety', 0.6349875926971436)]

-----
 maa_tapahtua_interventio
687 [('maa_perustaa_toiminta', 0.8649537563323975), ('kehittyä_maa', 0.8439843654632568), ('maa_analyysi', 0.8349520564079285), ('maa', 0.8259443640708923), ('ihminen_muokata_maa', 0.8129733204841614), ('rekisteröidä_maa_alue', 0.810955286026001), ('hylätä_maa_alue', 0.8093461990356445), ('valtio_maa', 0.8068914413452148), ('maa_kuormitus', 0.8057364225387573), ('maa_hallinta_suunnittelu', 0.8055636882781982)]

-----
 teuraseläin
688 [('eläin_teurastus', 0.7608060836791992), ('teurastaa', 0.7563478350639343), ('teurastamo', 0.7216782569885254), ('teuras

705 [('raha', 0.925613284111023), ('yhteisö_raha', 0.9103497862815857), ('yhteiskunta_maksaa_periaate', 0.7947930693626404), ('rahallinen', 0.7685133218765259), ('vara', 0.7655982971191406), ('rahallinen_avustus', 0.7630434632301331), ('julkinen_meno_valtio_meno', 0.7557483911514282), ('maa_perustaa_toiminta', 0.7521615624427795), ('rahallinen_korvaus', 0.7491140365600586), ('paikallinen', 0.7407470941543579)]

-----
 jälkikäsittely
706 [('esikäsittely', 0.7821276187896729), ('käsittely', 0.6795761585235596), ('prosessointi', 0.6767439246177673), ('jatkokäsittely', 0.6761963963508606), ('lämpökäsittely', 0.6604936718940735), ('pintakäsittely_pinta_viimeistely', 0.6551841497421265), ('hionta', 0.6546553373336792), ('työstö', 0.6450319290161133), ('käsittelyprosessi', 0.638522207736969), ('kemiallinen_käsittely', 0.6362358331680298)]

-----
 jälkikäsittely
707 [('esikäsittely', 0.7821276187896729), ('käsittely', 0.6795761585235596), ('prosessointi', 0.6767439246177673), ('jatkokäsittely'

736 [('kuljetusjärjestelmä', 0.6490196585655212), ('kuljetustoiminta', 0.6466671228408813), ('kuljetussopimus', 0.6426578760147095), ('kuljetus', 0.6406219005584717), ('tavarakuljetus', 0.6312757134437561), ('kuljetustarve', 0.6252222657203674), ('kuljetusmuoto', 0.6232200860977173), ('tarkastusoikeus', 0.6143571734428406), ('kuljetustekniikka', 0.6138733625411987), ('valmistusoikeus', 0.6103922128677368)]

-----
 tuotto
737 [('kokonaistuotto', 0.7847541570663452), ('myyntituotto', 0.7669064998626709), ('vuosituotto', 0.7425962686538696), ('nettotuotto', 0.7381107807159424), ('tuotos', 0.7227261066436768), ('sijoitustuotto', 0.7207751274108887), ('rahoitustuotto', 0.7137160301208496), ('reaalituotto', 0.710763692855835), ('tuottoprosentti', 0.7065627574920654), ('korkotuotto', 0.7019143104553223)]

-----
 yhteisö_raha
738 [('raha', 0.9109805822372437), ('paikallinen_raha', 0.9103497862815857), ('yhteiskunta_maksaa_periaate', 0.8257301449775696), ('yhteisö', 0.794400691986084), ('valtio

766 [('investointi_ympäristönsuojelu', 0.7694767713546753), ('investointi', 0.7664598226547241), ('rakennusinvestointi', 0.7365779280662537), ('investointitarve', 0.7345231175422668), ('korvausinvestointi', 0.7245126366615295), ('uusinvestointi', 0.7242021560668945), ('ympäristöhyöty', 0.7133949398994446), ('ympäristöpäämäärä_ympäristötavoite', 0.7062205672264099), ('talous_vaikutus_ympäristö', 0.7047908902168274), ('investointihanke', 0.7006256580352783)]

-----
 ympäristö_koskea_tieto
767 [('lainsäädäntö_koskea_tieto', 0.9445797801017761), ('maaperä_koskea_tieto', 0.9348087906837463), ('tuote_koskea_tieto', 0.9342936277389526), ('talous_koskea_tieto', 0.9339708685874939), ('ympäristö_tila_koskea_kertomus', 0.9145575761795044), ('päästö_koskea_tieto', 0.9020946025848389), ('kaupunki_ekologia_koskea_asiakirja', 0.884955644607544), ('ympäristö_laatu_koskea_tavoite', 0.8820468187332153), ('luonto_koskea_laki', 0.8711203932762146), ('organisaatio_ympäristöjalanjälki_koskea_menetelmä', 0.8

798 [('vuoroviljely', 0.6639942526817322), ('viljely', 0.6603646278381348), ('pelto_viljely', 0.652346134185791), ('biodynaaminen_viljely', 0.6330424547195435), ('sipulikasvi_viljely', 0.609076976776123), ('peltoviljely', 0.607369601726532), ('kasvinviljely', 0.6063223481178284), ('äyriäinen_viljely', 0.5971387624740601), ('puutarhaviljely', 0.5909960269927979), ('viljelytapa', 0.5879840850830078)]

-----
 lakiluonnos
799 [('lakiesitys', 0.7398946285247803), ('kuntarakennelakiluonnos', 0.7398940324783325), ('esitysluonnos', 0.7321359515190125), ('lakiehdotus', 0.7223969101905823), ('luonnos', 0.6778631210327148), ('asetusluonnos', 0.6699827909469604), ('ohjeluonnos', 0.6661701798439026), ('lausunto', 0.6504169702529907), ('lausuntokierros', 0.6252150535583496), ('lakimuutos', 0.6225286722183228)]

-----
 autonrengas
800 [('rengas', 0.705240786075592), ('rengas_liikenne', 0.6588108539581299), ('romuauto', 0.6409358978271484), ('kumi', 0.6285197734832764), ('talvirengas', 0.6184500455856

816 [('alueellinen', 0.8675614595413208), ('alueellinen_lainsäädäntö', 0.8630596399307251), ('yhteisö', 0.8596363067626953), ('alueellinen_viranomainen', 0.8578017950057983), ('ekologinen_yhteisö', 0.8333622813224792), ('yhteisö_osallistuminen', 0.8160998821258545), ('alueellinen_sopimus', 0.8145228624343872), ('yhteisö_oikeusjärjestelmä', 0.8128331899642944), ('yhteisö_talousarvio', 0.8049127459526062), ('maa_perustaa_toiminta', 0.800765872001648)]

-----
 julkinen_keskustelu
817 [('julkinen', 0.9102349281311035), ('julkinen_tutkimus', 0.9041742086410522), ('julkinen_tieto', 0.8940742015838623), ('julkinen_toimenpide', 0.8929411172866821), ('julkinen_osallistuminen', 0.8843755722045898), ('julkinen_kuuleminen', 0.8741774559020996), ('julkinen_palvelu', 0.8636064529418945), ('julkinen_tehtävä', 0.8607157468795776), ('julkinen_rahoitus', 0.851997971534729), ('julkinen_yksityinen_sektori_yhteistyöhanke', 0.8511433601379395)]

-----
 ympäristöpäämäärä_ympäristötavoite
818 [('ympäristöpääm

848 [('ulkopoliittinen', 0.8351925611495972), ('ulkopoliittisesti', 0.8106694221496582), ('sisäpolitiikka', 0.797774076461792), ('puolustuspolitiikka', 0.7711865901947021), ('politiikka', 0.7512897849082947), ('talouspolitiikka', 0.726535439491272), ('turvallisuuspolitiikka', 0.7173275351524353), ('hallitus_politiikka', 0.71601402759552), ('maailmanpolitiikka', 0.7054225206375122), ('puolueettomuuspolitiikka', 0.6899713277816772)]

-----
 Eurooppa_yhteisö
849 [('Eurooppa_yhteisö_tuomioistuin', 0.9583039283752441), ('Eurooppa_unioni', 0.9283628463745117), ('Eurooppa', 0.926302433013916), ('Eurooppa_unioni_paikkatietoinfrastruktuuri', 0.9212368726730347), ('Eurooppa_parlamentti', 0.920304536819458), ('Eurooppa_ympäristökeskus', 0.9176720380783081), ('Eurooppa_sisämarkkina', 0.9168826937675476), ('Eurooppa_valuuttarahasto', 0.9066104888916016), ('Eurooppa_valuuttajärjestelmä', 0.905212938785553), ('Eurooppa_komissio', 0.9013559818267822)]

-----
 ympäristötalous
850 [('kiinteistötalous', 

878 [('luonnonvarainen_eläin', 0.7008427381515503), ('eläinkauppa', 0.6978590488433838), ('eläin_elinpaikka', 0.6799057722091675), ('eläinkunta', 0.6785370111465454), ('eläin', 0.6670863628387451), ('luonnonvarainen_eläimistö', 0.6643574237823486), ('villieläin_elinympäristö', 0.6615133881568909), ('eläin_ruokinta', 0.6532713174819946), ('eläin_teurastus', 0.6508052945137024), ('eläin_suojelu', 0.6478243470191956)]

-----
 ristiriitainen_käyttö
879 [('käyttö', 0.8778892755508423), ('vapaa_käyttö', 0.8419862985610962), ('voimavara_käyttö', 0.8410100936889648), ('käyttö_rajoittaminen', 0.8347742557525635), ('materiaali_käyttö', 0.8276387453079224), ('jatkuva_käyttö', 0.8227741718292236), ('vesistöalue_suunnitelmallinen_käyttö', 0.7900879383087158), ('käyttö_energia_tuottaminen', 0.7841783761978149), ('käyttö_raaka_aine', 0.7666528820991516), ('energia_käyttö', 0.7663240432739258)]

-----
 trooppinen_ilmasto
880 [('trooppinen', 0.8933128118515015), ('lauhkea_ilmasto', 0.8909506797790527),

906 [('ympäristömeluselvitys', 0.7597558498382568), ('lähiympäristö_melu', 0.6872503757476807), ('tieliikenne_melu', 0.6844593286514282), ('kotitalous_melu', 0.6810926795005798), ('ympäristövaikutus', 0.6741476058959961), ('melu_vaikutus_terveys', 0.6729751825332642), ('ympäristökuormitus', 0.6694419980049133), ('kaupallinen_toiminta_aiheuttaa_melu', 0.6604716777801514), ('liikennemelu_valvonta', 0.6586103439331055), ('melu', 0.6563911437988281)]

-----
 vihannes
907 [('tuore_vihannes', 0.8732188940048218), ('kasvis', 0.8256714940071106), ('peruna', 0.7710895538330078), ('hedelmä', 0.7661079168319702), ('tomaatti', 0.7499890327453613), ('papu', 0.7342790365219116), ('kaali', 0.732529878616333), ('salaatti', 0.7316485643386841), ('yrtti', 0.7289785146713257), ('liha', 0.7242720127105713)]

-----
 oikeusvertailu
908 [('oikeuskirjallisuus', 0.653712272644043), ('yhteisöoikeus', 0.6490534543991089), ('oikeusperiaate', 0.6279931664466858), ('siviilioikeus_yksityisoikeus', 0.6241649389266968

937 [('sademäärä', 0.8947263360023499), ('lisäys', 0.7030938863754272), ('keskilämpötila', 0.6871984004974365), ('lämpötila_muutos', 0.6811316013336182), ('kustannus_lisäys', 0.67244553565979), ('sateisuus', 0.6363436579704285), ('lämpötilanvaihtelu', 0.6334503889083862), ('ilmasto_muutos', 0.6276365518569946), ('pilvisyys', 0.6104992032051086), ('vesi_suolapitoisuus_kasvu', 0.6037604212760925)]

-----
 koordinaatisto
938 [('koordinaatti', 0.8078194856643677), ('koordinaatio', 0.694108247756958), ('koordinaattijärjestelmä', 0.6640163660049438), ('maantieteellinen_projektio', 0.645916223526001), ('kartografinen_tietojärjestelmä_numeerinen_muoto', 0.6416240334510803), ('projektio', 0.6147820949554443), ('vektori_rasteri', 0.6080304980278015), ('kartografinen_numeerinen_tietojärjestelmä', 0.606982409954071), ('kartografinen_tietojärjestelmä_numeerinen_tekniikka', 0.5983682870864868), ('koordinaattori', 0.5943471193313599)]

-----
 rannikkokalastus
939 [('verkkokalastus', 0.807056605815887

970 [('kansallispuisto', 0.8147484064102173), ('valtio_luonnonpuisto', 0.8051806688308716), ('luonnonsuojelualue', 0.7263632416725159), ('suojelualue', 0.7093077301979065), ('suojelualue_rauhoittaa_alue', 0.6674121618270874), ('antropologinen_suojelualue', 0.6531295776367188), ('kartanonpuisto', 0.64968341588974), ('luontopolku', 0.6483109593391418), ('luontokeskus', 0.6428250670433044), ('retkeilyalue', 0.6393497586250305)]

-----
 paikallisviranomainen
971 [('viranomainen', 0.7622103095054626), ('pelastusviranomainen', 0.7295156121253967), ('turvallisuusviranomainen', 0.7232717871665955), ('sosiaaliviranomainen', 0.7207310795783997), ('poliisiviranomainen', 0.7094569802284241), ('oikeusviranomainen', 0.7054648995399475), ('hallintoviranomainen', 0.696736752986908), ('ympäristöviranomainen', 0.6889464855194092), ('alueellinen_viranomainen', 0.6884660720825195), ('terveysviranomainen', 0.6801081895828247)]

-----
 sosiaalinen_arvo
972 [('luonnollinen_arvo', 0.9225707054138184), ('arvo'

999 [('työturvallisuus_työsuojelu', 0.9113548994064331), ('työturvallisuuslaki', 0.7901093363761902), ('työsuojelu', 0.7602924704551697), ('työturvallisuuskeskus', 0.749051570892334), ('työturvallisuustoiminta', 0.7467765212059021), ('työturvallisuusmääräys', 0.746589183807373), ('työturvallisuusasiakirja', 0.7399982213973999), ('työturvallisuusohje', 0.7304431200027466), ('sähköturvallisuus', 0.7129842042922974), ('työtapaturma', 0.709064245223999)]

-----
 asuinrakennus
1000 [('rakennus', 0.8389925360679626), ('uudisrakennus', 0.7976503968238831), ('asuintalo', 0.7964891195297241), ('talousrakennus', 0.7832111120223999), ('pientalo_omakotitalo', 0.7785152792930603), ('asuinkerrostalo', 0.7742995619773865), ('piharakennus', 0.7736692428588867), ('liikerakennus', 0.7727032899856567), ('pientalo', 0.7639502286911011), ('saunarakennus', 0.7536349296569824)]

-----
 vesihyasintti
1001 [('hyasintti', 0.7256127595901489), ('vesikasvi', 0.6692185401916504), ('kukkia_kasvi', 0.652220726013183

1029 [('maataloustuote', 0.7919036746025085), ('metsätaloustuottaja', 0.749606192111969), ('metsätalousalue', 0.7289717793464661), ('metsätalousala', 0.7224550247192383), ('metsätalous', 0.7148032188415527), ('metsätaloustiede', 0.7008355855941772), ('maitotaloustuote', 0.6996158957481384), ('metsäteollisuustuote', 0.6916970014572144), ('maataloustarvike', 0.6903020143508911), ('metsätalous_metsänhoito', 0.6867634057998657)]

-----
 luonnollinen_arvo
1030 [('arvo', 0.9419357180595398), ('sosiaalinen_arvo', 0.9225707054138184), ('arvo_muutos', 0.8911844491958618), ('ekologinen_tasa_arvo_puute', 0.882430911064148), ('maa_arvo', 0.8764446377754211), ('raja_arvo', 0.869834303855896), ('yhteiskunnallinen_tasa_arvo_puute', 0.8676766753196716), ('ympäristö_laatu_koskea_tavoite', 0.7575746774673462), ('ympäristö_laatu_koskea_normi', 0.7545181512832642), ('luonnollinen', 0.7489432096481323)]

-----
 ympäristökoulutus
1031 [('henkilöstökoulutus', 0.7427583932876587), ('järjestökoulutus', 0.73341

1061 [('uimavesi', 0.9063206911087036), ('meri_uimavesi', 0.8808819055557251), ('sisävesi', 0.874655544757843), ('järvivesi', 0.7649686336517334), ('vesistö', 0.7647380828857422), ('vesi', 0.7610164284706116), ('pintavesi', 0.7580074071884155), ('virtavesi', 0.7385520935058594), ('luonnonvesi', 0.7375574111938477), ('vedenlaatu', 0.737389087677002)]

-----
 ekologinen_lokero
1062 [('lokero', 0.8727300763130188), ('ekologinen', 0.7947075963020325), ('ekologinen_jalanjälki', 0.7646053433418274), ('ekologinen_tasapaino', 0.7404540777206421), ('ekologinen_kirjanpito', 0.7395727634429932), ('ekologinen_rakennus', 0.7361355423927307), ('ekologinen_yhteisö', 0.7361130714416504), ('ekologinen_kehitys', 0.7292994856834412), ('ekologinen_kokonaisuus_tutkimus', 0.7266188859939575), ('ekologinen_sivilisaatio', 0.722623348236084)]

-----
 luonnonvara_suojelu
1063 [('suojelu', 0.9277877807617188), ('vesivara_suojelu', 0.9200520515441895), ('luonnonvarainen_alue_suojelu', 0.9179467558860779), ('teoll

1092 [('työ', 0.8834712505340576), ('hallinnollinen_työ', 0.8805144429206848), ('työ_ympäristönsuojelu', 0.8511051535606384), ('julkinen_työ', 0.8365776538848877), ('opetus_järjestäminen', 0.8042730093002319), ('koulutus_suunnittelu', 0.7936400175094604), ('järjestäminen', 0.7774156928062439), ('kenttäkoe_koe_työ_suorituspaikka', 0.7678830623626709), ('osallistuminen_yhteiskunta_toiminta', 0.7625861167907715), ('toimi', 0.7516946792602539)]

-----
 taloudellinen_kannustin
1093 [('kannustin', 0.896582841873169), ('taloudellinen', 0.8680019378662109), ('taloudellinen_toiminta', 0.818020224571228), ('taloudellinen_tuki', 0.8167707920074463), ('taloudellinen_kehitys', 0.7885457277297974), ('taloudellinen_oikeus', 0.7869095802307129), ('taloudellinen_väline', 0.7831180691719055), ('taloudellisuus', 0.7798657417297363), ('taloudellinen_elinkelpoisuus', 0.7780697345733643), ('taloudellinen_keskittyminen', 0.7689078450202942)]

-----
 vakuutustoiminta
1094 [('vahinkovakuutustoiminta', 0.874872

1125 [('työolo', 0.88802170753479), ('työskentelyolosuhde', 0.717697262763977), ('työympäristö', 0.6898673176765442), ('työehto', 0.685572624206543), ('työturvallisuus_työsuojelu', 0.672709047794342), ('olosuhde', 0.6584888696670532), ('työtilanne', 0.6405133605003357), ('työsuojelu', 0.6393215656280518), ('työsuoritus', 0.6346064805984497), ('ympäristöolosuhde', 0.6262215375900269)]

-----
 laji_suojelu
1126 [('suojella_laji', 0.9020564556121826), ('uhanalainen_laji', 0.8816652894020081), ('hallintaoikeus_laji', 0.8626483678817749), ('luontotyyppi_suojelu', 0.855821967124939), ('laji_kokonaisuus', 0.853238582611084), ('luonnonvarainen_alue_suojelu', 0.85042804479599), ('laji_ekologia', 0.8496426939964294), ('lintu_suojelu', 0.8487428426742554), ('laji', 0.8476810455322266), ('paikallinen_laji', 0.8453689813613892)]

-----
 suojelualue_rauhoittaa_alue
1127 [('luonnonvarainen_alue_suojelu', 0.9017442464828491), ('luonnonvarainen_alue', 0.888271689414978), ('maa_alue_suojelu', 0.88125932

1159 [('asetus_enimmäisraja', 0.8569623231887817), ('määräys_asetus_päätös', 0.8362319469451904), ('lisäasetus', 0.77934730052948), ('perusasetus', 0.7741081118583679), ('oletusasetus', 0.7542239427566528), ('asetusarvo', 0.752917468547821), ('asetusvalikko', 0.7504240274429321), ('täytäntöönpanoasetus', 0.7165008783340454), ('asetustiedosto', 0.7052961587905884), ('asetuskokoelma', 0.7020096182823181)]

-----
 ympäristövaikutus_arviointi
1160 [('ympäristöriski_arviointi', 0.9199804067611694), ('arviointi', 0.9152560234069824), ('ympäristö_terveysvaikutus_arviointi', 0.908141016960144), ('vaikutus_arviointi', 0.8972122669219971), ('tehokkuus_arviointi', 0.8842655420303345), ('ympäristö_taloudellinen_arviointi', 0.8839888572692871), ('ympäristövaikutus_arviointiselostus', 0.8808797001838684), ('laki_ympäristövaikutus_arviointi', 0.8764355182647705), ('ympäristövaikutus_arviointiohje', 0.8739425539970398), ('kirjallisuus_arviointi', 0.859054684638977)]

-----
 ekologinen_tasa_arvo_puute


1177 [('työterveydenhuolto', 0.8237218856811523), ('työterveyshuolto', 0.8223569393157959), ('työterveyspalvelu', 0.7686295509338379), ('työterveyslaitos', 0.7420507073402405), ('työterveyslääkäri', 0.7400196194648743), ('työhyvinvointi', 0.7314835786819458), ('työturvallisuus_työsuojelu', 0.7262656688690186), ('työterveyshoitaja', 0.7231808304786682), ('työterveysneuvottelu', 0.7174800634384155), ('työsuojelu', 0.7091151475906372)]

-----
 hermojärjestelmä
1178 [('hermosto', 0.7237562537193298), ('hermo', 0.6763885021209717), ('lymfaattinen_elimistö', 0.6706869006156921), ('hermostollinen', 0.6633507013320923), ('hermorata', 0.6548351049423218), ('hermosyy', 0.6501505374908447), ('hermosto_myrkyllisyys', 0.644623339176178), ('aivo', 0.6387869119644165), ('elinjärjestelmä', 0.6098275780677795), ('aivohermo', 0.6060868501663208)]

-----
 ulkomaankauppa
1179 [('ulkomaankauppatilasto', 0.8071609139442444), ('kotimaankauppa', 0.7558883428573608), ('vienti', 0.7227058410644531), ('kauppa_ka

1211 [('yksityismetsätalous', 0.8381789326667786), ('yhteismetsä', 0.7887599468231201), ('talousmetsä', 0.7423839569091797), ('suomalaismetsä', 0.7321183085441589), ('metsä', 0.7300460338592529), ('metsänomistaja', 0.7260280847549438), ('metsätalous_metsänhoito', 0.723486065864563), ('metsätila', 0.716098964214325), ('metsänviljely_metsänhoito', 0.7037692070007324), ('metsitys_metsä_istutus', 0.6995652914047241)]

-----
 vuoristoilmasto
1212 [('ilmasto', 0.7156869769096375), ('mikroilmasto', 0.6964747309684753), ('vuoristoalue', 0.6651759147644043), ('vuoristo', 0.6623146533966064), ('mannerilmasto', 0.6610989570617676), ('mikroilmasto_pienilmasto', 0.6605304479598999), ('päiväntasaaja_ilmasto', 0.6601019501686096), ('valtameri_ilmasto', 0.6577197313308716), ('vuoristoinen', 0.6561577320098877), ('vuoristometsä', 0.6555842161178589)]

-----
 luonnollinen_lannoite
1213 [('lannoite', 0.9037256240844727), ('kemiallinen_lannoite', 0.8872998952865601), ('epäorgaaninen_lannoite', 0.885130167

1245 [('anaerobinen_prosessi', 0.915594756603241), ('aerobinen_käsittely', 0.9109774827957153), ('aerobinen', 0.908793032169342), ('aerobinen_olosuhde', 0.9017359018325806), ('anaerobinen_olosuhde', 0.8256146907806396), ('anaerobinen', 0.822952389717102), ('anaerobinen_käsittely', 0.8229340314865112), ('fysikaalinen_prosessi', 0.8008270263671875), ('biokemiallinen_prosessi', 0.7870631217956543), ('kemiallinen_prosessi', 0.7825435996055603)]

-----
 luonto_radioaktiivisuus
1246 [('luonto', 0.8946166634559631), ('elollinen_luonto_monimuotoisuus', 0.8708076477050781), ('vesi_kiertokulku_luonto', 0.8466107249259949), ('metsä_luonto_monimuotoisuus', 0.8429585099220276), ('luonto_kiertokulku', 0.8292874693870544), ('luonto_hajoamaton_saaste', 0.8110870122909546), ('luonto_maisema_puuttuminen', 0.809435248374939), ('luonto_hajota_saaste', 0.8063834309577942), ('luonto_villieläin_luonnonkasvi', 0.8002306222915649), ('ihminen_luonto_suhde', 0.7956367135047913)]

-----
 asuminen_asuntoasia
1247 

1263 [('liittovaltio_viranomainen', 0.8536874055862427), ('alueellinen_viranomainen', 0.8527670502662659), ('valvoa_viranomainen', 0.8059502243995667), ('valvontaviranomainen', 0.7920475602149963), ('hallintoviranomainen', 0.7897780537605286), ('viranomaisvalvonta', 0.7893918752670288), ('lupaviranomainen', 0.7891933917999268), ('viranomaistaho', 0.787354588508606), ('viranomaistoiminta', 0.7723101377487183), ('poliisiviranomainen', 0.7657027244567871)]

-----
 raaka_aine_varmistaminen
1264 [('raaka_aine', 0.9525479078292847), ('käyttö_raaka_aine', 0.94559645652771), ('uusiutua_raaka_aine', 0.9206350445747375), ('vaarallinen_aine', 0.877219021320343), ('ympäristö_vaarallinen_aine', 0.8706676363945007), ('aine_ominaisuus', 0.8570504784584045), ('pinta_aktiivinen_aine', 0.8552802801132202), ('aine_käyttäytyminen', 0.8536632061004639), ('vaarallinen_aine_kuljetus', 0.8527011871337891), ('orgaaninen_aine', 0.8518652319908142)]

-----
 anaerobinen_prosessi
1265 [('aerobinen_prosessi', 0.915

1294 [('tietosuojapolitiikka', 0.7365208268165588), ('tietoturva', 0.725820779800415), ('tietosuojakäytäntö', 0.7183154225349426), ('henkilötieto', 0.7167919874191284), ('henkilötietosuojata', 0.7162246704101562), ('tietoturpa', 0.7109606266021729), ('tietosuojalaki', 0.7103002071380615), ('tietosuojavaltuutettu', 0.7065969705581665), ('yksityisyys', 0.6953724026679993), ('tietosuojakysymys', 0.6863007545471191)]

-----
 vuoristometsä
1295 [('vuoristoalue', 0.7497774362564087), ('vuoristo', 0.7165569067001343), ('vuoristoseutu', 0.70950847864151), ('vuoristo_ekosysteemi', 0.7051891088485718), ('vuoristoinen', 0.6837655901908875), ('lehtometsä', 0.6835535764694214), ('suometsä', 0.6695711016654968), ('sademetsä', 0.6681678295135498), ('ylänkö', 0.6584691405296326), ('mäntymetsä', 0.6557655334472656)]

-----
 metalli_työstö
1296 [('työstö', 0.9221016764640808), ('metalli_viimeistely', 0.8586834669113159), ('metalli', 0.8171435594558716), ('metalli_sulatus', 0.7953481078147888), ('puuntyö

1328 [('öljyntuottaja', 0.8273031115531921), ('öljynjalostus', 0.6812818646430969), ('öljyvara', 0.6720432043075562), ('öljynjalostamo', 0.652445912361145), ('öljynkulutus', 0.645060658454895), ('öljynetsin', 0.6444503664970398), ('öljykenttä', 0.640641450881958), ('sähköntuotanto', 0.63865065574646), ('öljyteollisuus', 0.6381525993347168), ('raakaöljy', 0.633710503578186)]

-----
 ympäristöongelma_ratkaiseminen
1329 [('ratkaiseminen', 0.874582052230835), ('ympäristöongelma', 0.8233883380889893), ('ratkaisu', 0.757667064666748), ('yhteiskunnallinen_ongelma', 0.7088379859924316), ('ongelma', 0.7031964063644409), ('saastuminen_vähentäminen_tarkoittaa_väline', 0.6939059495925903), ('yhteinen_saastuminen_torjunta', 0.6845934391021729), ('ratkaista', 0.6783641576766968), ('säännös_maanjäristys_vaikutus_vähentäminen', 0.6762206554412842), ('kannustaa_saastuttaminen_ehkäiseminen', 0.6646724343299866)]

-----
 jalostaa_maataloustuote
1330 [('jalostaa', 0.9216352701187134), ('jalostamaton', 0.8

1347 [('puutavara', 0.8824491500854492), ('puutavara_sahatavara', 0.871368944644928), ('tuotantoketju', 0.8031659722328186), ('sahatavara', 0.7730779647827148), ('puutavaralaji', 0.7649002075195312), ('kuitupuu', 0.7240091562271118), ('puutuote', 0.7084051966667175), ('toimitusketju', 0.6945513486862183), ('raakapuu', 0.6876753568649292), ('tehdastuotanto_teollinen_valmistus', 0.6730434894561768)]

-----
 kansainvälinen_talousoikeus
1348 [('talousoikeus', 0.9050873517990112), ('kansainvälinen_yksityisoikeus', 0.8781483173370361), ('kansainvälinen_julkisoikeus', 0.8537234663963318), ('kauppaoikeus_talousoikeus', 0.8529667854309082), ('kansainvälinen', 0.8052768707275391), ('kansainvälinen_politiikka', 0.7971546649932861), ('kansainvälinen_tuomioistuin', 0.791722297668457), ('kansainvälinen_oikeus', 0.7906266450881958), ('oikeustieteellinen', 0.7875934839248657), ('kauppatieteellinen', 0.7689817547798157)]

-----
 julkinen_yksityinen_sektori_yhteistyöhanke
1349 [('julkinen_sektori', 0.96

1364 [('vaikutus_ympäristö', 0.9119749069213867), ('teollisuus_vaikutus_ympäristö', 0.9053552746772766), ('talous_vaikutus_ympäristö', 0.8883771896362305), ('maatalous_vaikutus_ympäristö', 0.877918541431427), ('virkistystoiminta_vaikutus_ympäristö', 0.8769106268882751), ('liikenne_vaikutus_ympäristö', 0.8722331523895264), ('energia_tarve', 0.8665040135383606), ('energia_käyttö', 0.8631872534751892), ('metsätalous_vaikutus_ympäristö', 0.8585312366485596), ('kauppa_vaikutus_ympäristö', 0.8565331101417542)]

-----
 työturvallisuusmääräys
1365 [('turvallisuusmääräys', 0.8213446140289307), ('työturvallisuusohje', 0.7904679775238037), ('työturvallisuus', 0.7465893030166626), ('työturvallisuuslaki', 0.7236055135726929), ('työturvallisuustoiminta', 0.7216881513595581), ('turvamääräys', 0.7151318788528442), ('työturvallisuus_työsuojelu', 0.6984555721282959), ('työturvallisuusasiakirja', 0.6984190940856934), ('työehtosopimusmääräys', 0.6975411176681519), ('työturvallisuuskortti', 0.6813513040542

1381 [('levä', 0.7017301917076111), ('meri_uimavesi', 0.697056770324707), ('sisävesi_uimavesi', 0.6807984113693237), ('makea_vesi_saastuminen', 0.6762276291847229), ('järvivesi', 0.6737399697303772), ('makea_vesi_biologi', 0.6700153350830078), ('makea_vesi_pilaantuminen', 0.6657627820968628), ('makea_vesi_ekosysteemi', 0.6616596579551697), ('järvi_saastuminen', 0.6597519516944885), ('vesi_suolapitoisuus_kasvu', 0.6597213745117188)]

-----
 ympäristölainsäädäntö_täytäntöönpano
1382 [('täytäntöönpano', 0.8806542158126831), ('laki_täytäntöönpano', 0.8475648760795593), ('politiikka_täytäntöönpano', 0.8471371531486511), ('ympäristölainsäädäntö', 0.7983924150466919), ('täytäntöönpanoasetus', 0.7747160792350769), ('täytäntöönpanopäätös', 0.7638963460922241), ('direktiivi_saattaminen_osa_kansallinen_lainsäädäntö', 0.7568727731704712), ('lainsäädäntö', 0.752627968788147), ('lainsäädäntö_yhtenäistäminen', 0.7514464259147644), ('laki_ympäristövaikutus_arviointi', 0.7499542832374573)]

-----
 kart

1398 [('ihminen_luonto_suhde', 0.8749921321868896), ('vaikutus_terveys', 0.8731295466423035), ('ihminen_terveys', 0.8540467023849487), ('talous_vaikutus_ympäristö', 0.849311351776123), ('ympäristö_liittyä_sairaus', 0.8298225402832031), ('terveys', 0.8278372883796692), ('virkistystoiminta_vaikutus_ympäristö', 0.8274580836296082), ('vaikutus_ympäristö', 0.8133370280265808), ('maatalous_vaikutus_ympäristö', 0.8120396733283997), ('ympäristö_suhteen_vastuullinen_käyttäytyminen', 0.8115055561065674)]

-----
 runsasproteiininen_ruoka
1399 [('ruoka', 0.9065731763839722), ('ruoka_ravintoarvo', 0.8867566585540771), ('ruoka_laatu', 0.8201687932014465), ('ruoka_varastointi', 0.8105337619781494), ('ruoka_aine_elintarvike', 0.8098969459533691), ('ruoka_saastuminen', 0.8027275800704956), ('ruoka_säteilytys', 0.7874295711517334), ('ruoka_säilytys', 0.7835041284561157), ('kotiruoka', 0.7795504331588745), ('kasvisruoka', 0.771190345287323)]

-----
 luonto_maisema_puuttuminen
1400 [('maisema', 0.87069427

1430 [('tehokkuus_taso', 0.8745682835578918), ('ympäristönsuojelu_taso', 0.8457001447677612), ('kriittinen_taso', 0.8345850706100464), ('taso', 0.8304966688156128), ('laatutaso_laadullinen_taso', 0.8155784010887146), ('talous_vaikutus_ympäristö', 0.7947314977645874), ('työllisyys_rakenne', 0.7925975322723389), ('sallittu_riski_taso', 0.784325361251831), ('vaikutus_ympäristö', 0.7787826061248779), ('teollisuus_vaikutus_ympäristö', 0.7739589810371399)]

-----
 jätevesimaksu
1431 [('vesimaksu', 0.870717465877533), ('jätevesi', 0.7346694469451904), ('viemärivesi_jätevesi', 0.7319530844688416), ('jätevesiviemäri', 0.7057724595069885), ('jätevesi_käsittelyjärjestelmä', 0.6981912851333618), ('jätevesiliete', 0.6904689073562622), ('talousjätevesi', 0.6884402632713318), ('jätehuolto_jätevesi', 0.6860631704330444), ('jätevesi_käsittelylaitos', 0.6788487434387207), ('jätevesihuolto', 0.6786140203475952)]

-----
 maaseutu_vesihuolto
1432 [('taajama_vesihuolto', 0.8636143207550049), ('vesihuolto', 

1465 [('suola_poisto_vesi', 0.9617172479629517), ('suola', 0.8682264089584351), ('suolainen_vesi', 0.8269517421722412), ('vesi_syövyttävyys', 0.8251716494560242), ('makea_vesi_pilaantuminen', 0.8251124620437622), ('vesi_suolaisuus', 0.8210482597351074), ('makea_vesi_saastuminen', 0.8110132217407227), ('makea_suolaton_vesi', 0.8084794282913208), ('merivesi', 0.8044222593307495), ('vesi_imeytyminen_maa', 0.8031817674636841)]

-----
 laatu_seuranta
1466 [('laatu_valvonta', 0.9104686975479126), ('laatu_hallinta', 0.8878148794174194), ('laatu', 0.88376384973526), ('ympäristö_laatu_arviointiperuste', 0.8771044015884399), ('ympäristö_laatu', 0.8667789101600647), ('seuranta_kriteeri', 0.8559706211090088), ('vesi_laatu_parantaminen', 0.8531675338745117), ('ympäristö_laatu_heikkeneminen', 0.8494775891304016), ('seuranta', 0.8464698791503906), ('vesi_laatu_hallinta', 0.8425514101982117)]

-----
 vesikasvi_poistaminen
1467 [('vesikasvi', 0.8740696907043457), ('tuholainen_hävittäminen_kasvi', 0.765

1482 [('Eurooppa_valuuttajärjestelmä', 0.9468399286270142), ('Eurooppa', 0.923263430595398), ('Eurooppa_parlamentti', 0.9182815551757812), ('Eurooppa_sisämarkkina', 0.9097331762313843), ('Eurooppa_ympäristökeskus', 0.9090057015419006), ('Eurooppa_komissio', 0.9090010523796082), ('Eurooppa_unioni', 0.9074135422706604), ('Eurooppa_yhteisö', 0.9066104888916016), ('Eurooppa_unioni_paikkatietoinfrastruktuuri', 0.895383358001709), ('Eurooppa_yhteisö_tuomioistuin', 0.8739302754402161)]

-----
 Eurooppa_sisämarkkina
1483 [('Eurooppa', 0.9417448043823242), ('Eurooppa_unioni', 0.9341377019882202), ('Eurooppa_parlamentti', 0.9338836073875427), ('Eurooppa_komissio', 0.9333904981613159), ('Eurooppa_valuuttajärjestelmä', 0.9285503625869751), ('Eurooppa_unioni_paikkatietoinfrastruktuuri', 0.9209039211273193), ('Eurooppa_yhteisö', 0.9168826341629028), ('Eurooppa_ympäristökeskus', 0.9150472283363342), ('Eurooppa_valuuttarahasto', 0.9097331762313843), ('Eurooppa_yhteisö_tuomioistuin', 0.8765345215797424

1500 [('energia_käyttö', 0.8365262746810913), ('ydinenergia', 0.83614182472229), ('käyttö_energia_tuottaminen', 0.817725658416748), ('käyttö', 0.7844342589378357), ('voimavara_käyttö', 0.771930456161499), ('materiaali_käyttö', 0.7635082006454468), ('maaperä_käyttö', 0.7518652677536011), ('jäte_käyttö', 0.751158595085144), ('pohjavesi_käyttö', 0.7501058578491211), ('ristiriitainen_käyttö', 0.7486581206321716)]

-----
 vedenkorkeus_vesiraja_suojelu
1501 [('merivesi_suojelu', 0.8485425710678101), ('ranta_suojelu', 0.8332766890525818), ('pohjavesi_suojelu', 0.8149221539497375), ('vedenottamo_suojelu', 0.8008731603622437), ('vesiraja', 0.7963176369667053), ('vedenpinta_vedenkorkeus', 0.7923096418380737), ('makea_vesi_suojelu', 0.7777834534645081), ('vesivara_suojelu', 0.7762196063995361), ('vedenkorkeus', 0.771694540977478), ('luontotyyppi_suojelu', 0.7576932311058044)]

-----
 kaukoliikenne
1502 [('lähiliikenne', 0.8015378713607788), ('junaliikenne', 0.7779057621955872), ('bussiliikenne', 

1535 [('jätteenpolttolaitos', 0.8412110805511475), ('polttoaine', 0.7430652379989624), ('liete_poltto', 0.7352771759033203), ('kaasukäyttöinen_laitos', 0.7351846694946289), ('tuhka_polttaminen_jäte_poltto', 0.7342751622200012), ('lämpölaitos', 0.7290436625480652), ('kaatopaikka_kaasu', 0.725470781326294), ('biokaasulaitos', 0.7184922695159912), ('energiakäyttö_jäte_energiakäyttö', 0.7171081304550171), ('poltto', 0.7065932750701904)]

-----
 yleinen_syyttäjä_virasto
1536 [('virasto', 0.8157281875610352), ('syyttäjä', 0.7937220335006714), ('hallinnollinen_julkinen_laitos', 0.7820033431053162), ('yleinen_hallinto_ohje', 0.7733938694000244), ('alueellinen_viranomainen', 0.7638376951217651), ('hallinnollinen_menettely', 0.7606183290481567), ('syyttäjänvirasto', 0.750981330871582), ('julkinen_tehtävä', 0.7491965293884277), ('kansainvälinen_tuomioistuin', 0.7477600574493408), ('julkinen_laitos', 0.7423843145370483)]

-----
 käyttö_raaka_aine
1537 [('raaka_aine', 0.9535328149795532), ('raaka_a

1552 [('vaarallinen_tavara_koskea_määräys', 0.9574894309043884), ('luonto_koskea_laki', 0.9097808599472046), ('kaupunkirakentaminen_koskea_laki', 0.9044179916381836), ('vankila_koskea_laki', 0.9013980627059937), ('vaarallinen_aine_koskea_lainsäädäntö', 0.9006836414337158), ('yhdyskunta_koskea_laki', 0.8967920541763306), ('lannoite_koskea_laki', 0.8933107852935791), ('kierrätys_hallinta_jäte_koskea_laki', 0.8793386220932007), ('vastuu_koskea_lainsäädäntö', 0.8720362186431885), ('lainsäädäntö_koskea_tieto', 0.8718577027320862)]

-----
 eurooppalainen_luonnonsuojelualue
1553 [('kansallinen_suojelualue', 0.8553867340087891), ('luonnonsuojelualue', 0.8020747900009155), ('eurooppalainen', 0.7929831743240356), ('yhtenäinen_luonnonsuojelualue', 0.7916263937950134), ('vapaaehtoinen_luonnonsuojelualue', 0.7913156151771545), ('luonnonvarainen_alue_suojelu', 0.7807701826095581), ('maa_alue_suojelu', 0.7775007486343384), ('antropologinen_suojelualue', 0.777497410774231), ('luonnonvarainen_alue', 0.

1583 [('valveutua', 0.8398072123527527), ('sosiaalinen_käyttäytyminen', 0.7805589437484741), ('kuluttaja_käyttäytyminen', 0.7376214265823364), ('käyttäytyminen', 0.7366710901260376), ('osallistuminen_yhteiskunta_toiminta', 0.7284253835678101), ('sosiaalinen_kehitys', 0.7240967154502869), ('valveutuneisuus', 0.7109794616699219), ('ihminen_toiminta', 0.7102451324462891), ('yhteiskunnallisesti', 0.7027044892311096), ('ympäristö_suhteen_vastuullinen_käyttäytyminen', 0.7010358572006226)]

-----
 kunnallinen_ympäristösuunnitelma
1584 [('kunnallinen_ympäristöpolitiikka', 0.8986515998840332), ('kunnallinen', 0.8947098255157471), ('kunnallinen_vesihuolto', 0.861278235912323), ('kunnallinen_kaukolämpöverkko', 0.8165779113769531), ('kunnallinen_puhtaanapito', 0.8124496936798096), ('ympäristösuunnitelma', 0.7717045545578003), ('alueellinen_lainsäädäntö', 0.7625963687896729), ('alueellinen_sopimus', 0.7583144903182983), ('kaupunki_kunta', 0.7551382780075073), ('seutukaava_alueellinen_suunnitelma', 

1616 [('turvallisuusvaatimus', 0.7908353209495544), ('paloturvallisuus', 0.7549242973327637), ('paloturvallinen', 0.7200742363929749), ('energiatehokkuusvaatimus', 0.6919207572937012), ('hygieniavaatimus', 0.6556727886199951), ('työturvallisuusmääräys', 0.640733003616333), ('turvallisuusmääräys', 0.6365491151809692), ('turvallisuusvaruste', 0.626740574836731), ('viranomaisvaatimus', 0.6219907402992249), ('energiatehokkuusmääräys', 0.619179368019104)]

-----
 hallinnollinen_asiakirja_saatavuus
1617 [('hallinnollinen_asiakirja', 0.8853092789649963), ('hallinnollinen_menettely', 0.8027962446212769), ('kulttuuripalvelu_saatavuus', 0.7825250625610352), ('dokumentointi_asiakirja_aineisto', 0.7775423526763916), ('asiakirja', 0.773882269859314), ('asiakirja_kaupunkirakentaminen', 0.7678740620613098), ('asiakirja_tarkastus', 0.7669399976730347), ('hallinnollinen_määräys', 0.7617268562316895), ('hallinnollinen_toimenpide_perustelu', 0.761563777923584), ('saatavuus', 0.7567629218101501)]

-----
 

1649 [('pääasiallinen_ravinto_tärkeä_ravinto', 0.9005603790283203), ('ravinto_perusvaatimus', 0.8888157606124878), ('ravinto_kiertokulku', 0.8293702006340027), ('ravintoaine', 0.8014843463897705), ('ruoka_ravintoarvo', 0.7864879369735718), ('kasviravinto', 0.7749254703521729), ('eläin_ravitsemus', 0.7609169483184814), ('pääravinto', 0.7457051277160645), ('ruoka', 0.7437708377838135), ('ravinnonlähde', 0.740033745765686)]

-----
 alueellinen_lainsäädäntö
1650 [('alueellinen_viranomainen', 0.913736879825592), ('alueellinen_sääntely', 0.8974494934082031), ('kansallinen_lainsäädäntö', 0.8898515701293945), ('alueellinen', 0.8884286880493164), ('alueellinen_sopimus', 0.868692934513092), ('alueellinen_yhteisö', 0.8630596399307251), ('lainsäädännöllinen', 0.8379911184310913), ('lainsäädäntö', 0.82506263256073), ('direktiivi_saattaminen_osa_kansallinen_lainsäädäntö', 0.8226914405822754), ('maaseutu_koskea_lainsäädäntö', 0.822368860244751)]

-----
 vankila_koskea_laki
1651 [('yhdyskunta_koskea_l

1683 [('ekologinen_sopeutuminen', 0.7574279308319092), ('joustava', 0.7521954774856567), ('joustaa', 0.750140905380249), ('ympäristö_liittyä_vastuu', 0.7432906627655029), ('ympäristö_suhteen_vastuullinen_käyttäytyminen', 0.7376757860183716), ('ympäristö_ystävällinen_johtaminen', 0.7348780632019043), ('osallistuminen_yhteiskunta_toiminta', 0.7290078401565552), ('suhtautuminen', 0.7272138595581055), ('talous_vaikutus_ympäristö', 0.7257370948791504), ('terveys_ympäristö_suhde', 0.7247341871261597)]

-----
 hallinnollinen_julkinen_laitos
1684 [('julkinen_laitos', 0.9745126962661743), ('julkinen_yksityinen_sektori_yhteistyöhanke', 0.87898850440979), ('julkinen', 0.8684728145599365), ('julkinen_toimenpide', 0.8680374026298523), ('julkinen_rakennus', 0.860440731048584), ('julkinen_tutkimus', 0.8579645752906799), ('julkinen_sektori', 0.8569852709770203), ('lakisääteinen_julkinen_elin', 0.8549426794052124), ('julkinen_rahoitus', 0.8424855470657349), ('julkinen_palvelu', 0.8386111259460449)]

--

1714 [('sisäänvirtaus_tulva', 0.893579363822937), ('tulvasuojelu_tulva_torjunta', 0.8844993114471436), ('tulva_ehkäisy', 0.8438389897346497), ('tulvavesi', 0.7905880808830261), ('tulviminen', 0.7793667316436768), ('tulvia', 0.7671937942504883), ('joki_saastuminen', 0.7247859239578247), ('tulvavaara', 0.719637393951416), ('kevättulva', 0.7017431855201721), ('tulvasuojelu', 0.6873916387557983)]

-----
 valunta_valuma
1715 [('valunta', 0.9419971704483032), ('valuma', 0.9258981347084045), ('valuma_alue', 0.8330518007278442), ('valumavesi', 0.8042073845863342), ('valuma_allas_sadealue_vesialue', 0.794105589389801), ('pintavalunta', 0.7730118036270142), ('valua', 0.7700397968292236), ('valu', 0.7561630606651306), ('valuminen', 0.7222855687141418), ('vesi_virtaus', 0.7121269702911377)]

-----
 asteittainen_kehitys_kehityskulku
1716 [('kehitys', 0.8847317695617676), ('kehityskulku', 0.8805652260780334), ('taloudellinen_kehitys', 0.8514505624771118), ('historiallinen_kehitys', 0.838634729385376

1747 [('biokemiallinen_prosessi', 0.9135262370109558), ('biokemiallinen', 0.8835158348083496), ('kemiallinen_prosessi', 0.8584686517715454), ('biokemiallinen_aine', 0.8509458303451538), ('matemaattinen_menetelmä', 0.8467637300491333), ('kemiallinen_analyysi', 0.8467521667480469), ('biologinen_prosessi', 0.8453198671340942), ('kemiallinen_ominaisuus', 0.8247475624084473), ('menetelmä_käyttää_radioaktiivinen_merkkiaine', 0.8199869990348816), ('biologinen_analyysi', 0.8195514678955078)]

-----
 opetusmenetelmä
1748 [('oppimismenetelmä', 0.7913522720336914), ('opetusmateriaali', 0.7531096935272217), ('opetus', 0.7498636245727539), ('oppimisympäristö', 0.7225824594497681), ('opetusteknologia', 0.7195447683334351), ('työtapa', 0.7161908745765686), ('opetusjärjestely', 0.7151886224746704), ('opetus_harjoitus', 0.7118453979492188), ('oppimistyyli', 0.7075214385986328), ('opetusohjelma', 0.6936414241790771)]

-----
 sähkö_tuottaminen_kustannus
1749 [('sähkö_tuottaminen', 0.9696484804153442), ('

1781 [('metsitys_metsä_istutus', 0.9743537902832031), ('metsitys', 0.8831186294555664), ('paikallistaso_metsä_istuttaminen', 0.8800703287124634), ('metsä', 0.8705694675445557), ('metsä_hyväksikäyttö', 0.8635087013244629), ('metsä_luonto_monimuotoisuus', 0.846736490726471), ('metsä_ekosysteemi', 0.8458977937698364), ('metsä_pilaantuminen', 0.8417572975158691), ('metsä_tuholainen', 0.83597731590271), ('metsä_kaataminen', 0.817258358001709)]

-----
 ekoturismi
1782 [('turismi', 0.7652626037597656), ('luontomatkailu', 0.6817115545272827), ('massaturismi', 0.6715680956840515), ('matkailu', 0.652556300163269), ('maaseutumatkailu', 0.6252986788749695), ('matkailuelinkeino', 0.6208809614181519), ('matkailukohde', 0.6119344234466553), ('matkailija', 0.6090004444122314), ('matkailutuote', 0.5986939668655396), ('matkailu_vaikutus_ympäristö', 0.5970723032951355)]

-----
 valuma_alue
1783 [('valuma', 0.8728929758071899), ('valuma_allas_sadealue_vesialue', 0.8613870143890381), ('valunta_valuma', 0.8

1815 [('kuluttaja', 0.8884185552597046), ('käyttäytyminen', 0.7911643981933594), ('sosiaalinen_käyttäytyminen', 0.7629470825195312), ('kulutuskäyttäytyminen', 0.7516313195228577), ('yhteisöllinen_kuluttaminen', 0.749293863773346), ('kauppa_vaikutus_ympäristö', 0.7425796985626221), ('kauppa_kulutus', 0.7381953001022339), ('yhteiskunnallisesti_valveutua_käyttäytyminen', 0.7376213073730469), ('ostookäyttäytyminen', 0.7280440926551819), ('kuluttaminen', 0.7267826199531555)]

-----
 merenkulku
1816 [('merenkulkuala', 0.7892930507659912), ('merenkulkija', 0.7834745645523071), ('kauppamerenkulku', 0.7563397884368896), ('kaivostoiminta_meri', 0.7227368950843811), ('merenkulku_liittyä_vaara', 0.7206724286079407), ('talvimerenkulku', 0.7194445133209229), ('merenkulkuhallitus', 0.7174392342567444), ('meriliikenne', 0.7150274515151978), ('merenkulkujärjestö', 0.7084459662437439), ('satama', 0.700814962387085)]

-----
 tietopalvelu
1817 [('paikkatietopalvelu', 0.8298265933990479), ('tietopalvelukes

1848 [('ilmakehä', 0.8615583181381226), ('ilmakehä_tapahtua_prosessi', 0.8585231900215149), ('ilmakehä_rakenne', 0.8546971082687378), ('ilmakehä_koostumus', 0.8300329446792603), ('päästö_ilmakehä', 0.8248934745788574), ('ilmakehä_fysikaalinen_ilmiö', 0.8180446624755859), ('ilmakehä_hiukkanen', 0.8139480948448181), ('ilmakehä_tutkia_tiede', 0.8080527782440186), ('meriympäristö_seuranta', 0.8038073778152466), ('ilmakehä_palauttaminen_ennallaan', 0.7907129526138306)]

-----
 vedenjakaja
1849 [('vedenjakelu', 0.6003040671348572), ('joki_uoma', 0.5760440826416016), ('ylänkö', 0.5657630562782288), ('valuma_allas_sadealue_vesialue', 0.5620208978652954), ('tasanko', 0.5558693408966064), ('vaihettumisvyöhykkeen_vesi', 0.5553091168403625), ('vesistö', 0.5443363189697266), ('uoma', 0.5431499481201172), ('jokiuoma', 0.5340263843536377), ('alava', 0.5284413695335388)]

-----
 energia_tarve
1850 [('energia_käyttö', 0.891005277633667), ('energia', 0.8831830620765686), ('tavanomainen_energia', 0.86740

1866 [('komitea', 0.8922890424728394), ('tieteellinen', 0.8161661028862), ('tieteellinen_tutkimus', 0.7829495668411255), ('tieteellinen_yhteistyö', 0.7443529367446899), ('neuvosto', 0.7344144582748413), ('tieteellinen_tekninen_tieto', 0.7152056097984314), ('poliittinen_järjestö', 0.7047119140625), ('lakisääteinen_julkinen_elin', 0.7045995593070984), ('toimikunta', 0.7035048604011536), ('biologinen_tiede', 0.7022970914840698)]

-----
 poliittinen_neuvonta
1867 [('neuvonta', 0.870976984500885), ('poliittinen_järjestö', 0.7746889591217041), ('julkinen_sektori_tuki', 0.7588503956794739), ('poliittinen', 0.7579452991485596), ('taloudellinen_tuki', 0.7545461654663086), ('taloudellinen_toiminta', 0.7529146671295166), ('neuvontatyö', 0.7527226209640503), ('neuvontapalvelu', 0.7393211126327515), ('hallinnollinen_julkinen_laitos', 0.7339180707931519), ('julkinen_keskustelu', 0.7332431077957153)]

-----
 meri
1868 [('kaivostoiminta_meri', 0.9285519123077393), ('meri_ekosysteemi', 0.91828465461730

1899 [('sisävesi_uimavesi', 0.8808819055557251), ('uimavesi', 0.8690124154090881), ('meri', 0.8671467900276184), ('meri_lämpötila', 0.8555023670196533), ('kaivostoiminta_meri', 0.8475455045700073), ('meri_eläimistö', 0.8438229560852051), ('meri_saastuminen', 0.8407107591629028), ('vesi', 0.8288848400115967), ('merivesi', 0.8211380243301392), ('meri_lahti', 0.8205866813659668)]

-----
 kierrättää_materiaali_uusiomateriaali
1900 [('uusiomateriaali', 0.8627893924713135), ('kierrättää', 0.862554132938385), ('materiaali', 0.8586519360542297), ('vaihtoehtoinen_materiaali', 0.8273687362670898), ('kierrätettävä_muovi', 0.8256394267082214), ('teollinen_materiaali', 0.813488245010376), ('kierrätetty_materiaalistaa_rakentaminen', 0.8033696413040161), ('tiiviste_materiaali', 0.7967838048934937), ('elektroninen_materiaali', 0.7932717204093933), ('kierrätysmateriaali', 0.786558985710144)]

-----
 radio
1901 [('radio_ohjelma', 0.9232010841369629), ('radiokanava', 0.7812893986701965), ('radioasema', 0

1929 [('vesitie', 0.8751257658004761), ('vesistö', 0.8387866616249084), ('väylä', 0.8251935243606567), ('vesireitti', 0.7868789434432983), ('vesiväylä', 0.7694451808929443), ('valuma_allas_sadealue_vesialue', 0.7672631144523621), ('joki_uoma', 0.7651523351669312), ('vesistöalue', 0.761937141418457), ('kansainvälinen_vesiväylä', 0.7594602108001709), ('vesialue', 0.7527022957801819)]

-----
 yritys
1930 [('monikansallinen_yritys', 0.8642269372940063), ('ympäristönsuojelu_yritys', 0.849074125289917), ('kauppaliike_kaupallinen_yritys', 0.8320068120956421), ('yritystoiminta', 0.8115043640136719), ('pienyritys', 0.7986454963684082), ('yrittäjä', 0.7971045970916748), ('yritys_ympäristötalous', 0.7922199964523315), ('asiakasyritys', 0.7648159265518188), ('liiketoiminta', 0.7426859140396118), ('toimiala', 0.7365175485610962)]

-----
 kehitysmaa
1931 [('kehitysmaa_velka', 0.766754150390625), ('teollisuusmaa', 0.7527336478233337), ('länsimaa', 0.7340392470359802), ('valtio_maa', 0.713256478309631

1963 [('eläinlääketieteellinen', 0.8166015148162842), ('eläinlääkäri', 0.7814973592758179), ('lääketiede', 0.7550762295722961), ('hammaslääketiede', 0.7369064688682556), ('biolääketiede', 0.7233079075813293), ('eläintiede', 0.7228553295135498), ('eläinlääke', 0.7153385877609253), ('erikoiseläinlääkäri', 0.7130004167556763), ('eläinoppi_eläintiede', 0.710358738899231), ('eläinfysiologi', 0.7044870853424072)]

-----
 lehtipuu
1964 [('havupuu', 0.7697266936302185), ('mänty', 0.7260825634002686), ('koivu', 0.7126262187957764), ('puu', 0.7125763893127441), ('puusto', 0.7051995992660522), ('metsälehmus', 0.7031403183937073), ('lahopuu', 0.6963943839073181), ('pensas', 0.6962751746177673), ('lehmus', 0.6955679655075073), ('korkea_puu_kasvaa_vesakko', 0.6834771633148193)]

-----
 haihtuminen
1965 [('haihtua', 0.7643980979919434), ('haihtua_aine', 0.6929885149002075), ('saaste_imeytyminen', 0.6811180114746094), ('tiivistyminen', 0.6786638498306274), ('sulaminen', 0.6732198596000671), ('haihtuvu

1997 [('niitty', 0.7130250334739685), ('pelto_viljely', 0.7074915170669556), ('metsitys_metsä_istutus', 0.6991874575614929), ('niittokone', 0.6967140436172485), ('nurmi', 0.6892340183258057), ('nuori_metsä_vesakko', 0.6802021861076355), ('niittää', 0.6798142194747925), ('pelto_piennar', 0.6779423952102661), ('taimikko', 0.6727313995361328), ('taimi', 0.6695694327354431)]

-----
 laitos_optimointi
1998 [('optimointi', 0.8355172276496887), ('laitos', 0.8253549337387085), ('laitos_rakentaminen', 0.8243553638458252), ('laitos_kunnostus', 0.7960770130157471), ('laitos_turvallisuus', 0.7873258590698242), ('kaasukäyttöinen_laitos', 0.7746122479438782), ('kemiallinen_laitos', 0.7709511518478394), ('riski_sisältää_laitos', 0.7488778829574585), ('vaarallinen_laitos', 0.7455971240997314), ('julkinen_laitos', 0.7417936325073242)]

-----
 joki
1999 [('joki_uoma', 0.9200632572174072), ('joki_saastuminen', 0.8869308233261108), ('joki_hallinta', 0.8791114091873169), ('joki_kanavointi', 0.8461685180664

2016 [('kunnallinen_vesihuolto', 0.8628273606300354), ('kunnallinen', 0.8474971055984497), ('kaukolämpöverkko', 0.8387600183486938), ('kunnallinen_ympäristösuunnitelma', 0.8165779113769531), ('kunnallinen_ympäristöpolitiikka', 0.8003532886505127), ('kaukolämpölaitos', 0.7970626354217529), ('kaukolämpö', 0.7864044904708862), ('kaukolämpöjärjestelmä', 0.7695824503898621), ('taajama_vesihuolto', 0.768937349319458), ('lämpölaitos', 0.7560593485832214)]

-----
 luonto_villieläin_luonnonkasvi
2017 [('luonto', 0.8773502111434937), ('villieläin_elinympäristö', 0.8747568130493164), ('luonnonkasvi', 0.8671221137046814), ('villieläin', 0.8628202676773071), ('luonnonvarainen_eläin', 0.8536966443061829), ('metsä_luonto_monimuotoisuus', 0.8522698283195496), ('luonnonvarainen_eläimistö', 0.8432056307792664), ('luonnonvarainen_kasvi', 0.8160151243209839), ('elollinen_luonto_monimuotoisuus', 0.8076323866844177), ('luonto_radioaktiivisuus', 0.8002306222915649)]

-----
 opetus_järjestäminen
2018 [('opetu

2051 [('pohjavesi_käyttö', 0.7817163467407227), ('pohjavesi', 0.7669487595558167), ('pohjavesi_laatu', 0.7659025192260742), ('maaperä_koskea_tieto', 0.7610700130462646), ('vesi_virtaus_koskea_tutkimus_mittaus', 0.7596427202224731), ('yhdistää_jätevesi', 0.7579361200332642), ('pohjavesi_otto', 0.7570024728775024), ('kerros', 0.756006121635437), ('paikka_tapahtua_jätevesi_puhdistus', 0.7548944354057312), ('vesi_imeytyminen_maa', 0.7503698468208313)]

-----
 hiekka
2052 [('muta_lieju_liete', 0.8004249930381775), ('lieju_loka_muta', 0.7804203033447266), ('muta', 0.7568529844284058), ('siltti_muta_pohjalieju', 0.7551760673522949), ('sora', 0.7513927817344666), ('hiekkamaa', 0.7438898086547852), ('pikkukivi', 0.7435398101806641), ('asfaltti', 0.7281303405761719), ('kivi', 0.7277572154998779), ('kivikko', 0.7227731943130493)]

-----
 väline_instrumentti_valmistus
2053 [('väline', 0.8698201775550842), ('rahoitusinstrumentti_väline', 0.8691457509994507), ('taloudellinen_väline', 0.8266081809997

2086 [('keinokasteluu', 0.7940330505371094), ('maanviljely', 0.5810196995735168), ('viljely', 0.5543770790100098), ('kastelu', 0.5539158582687378), ('pelto_viljely', 0.5500149130821228), ('koneellistaminen', 0.5343492031097412), ('maanviljelys_kastelulaite', 0.5319688320159912), ('saastuminen_vähentäminen_tarkoittaa_väline', 0.529525876045227), ('viljelys', 0.523674726486206), ('kalanviljely_vaikutus_ympäristö', 0.5219608545303345)]

-----
 nainen_asema
2087 [('nainen', 0.8387783765792847), ('asema', 0.830357551574707), ('ammatillinen_asema', 0.786467432975769), ('mies', 0.7862157821655273), ('taloudellinen_tila_taloudellinen_asema', 0.7466853857040405), ('ihminen_toiminta', 0.6897919178009033), ('asemaa', 0.689075767993927), ('maa_aurinko_suhde', 0.6871333122253418), ('ihminen_muokata_maa', 0.6848526000976562), ('miehinen', 0.6832231283187866)]

-----
 kasvinjalostus
2088 [('eläinjalostus', 0.763012170791626), ('kasvintuotanto', 0.7184846997261047), ('kasvinviljely', 0.715523719787597

2120 [('öljy_sitoa_aine', 0.8721034526824951), ('öljy', 0.8476690053939819), ('öljy_uuttaminen', 0.8326106667518616), ('kemikaali', 0.8310220241546631), ('kemiallinen_kemikaali', 0.8295258283615112), ('petrokemikaali', 0.8133789300918579), ('ympäristö_kemikaali', 0.811369776725769), ('öljy_pohjasakka', 0.8045169115066528), ('polttoaine_lisäaine', 0.7981534004211426), ('vaarallinen_kemikaali_vienti', 0.7902383804321289)]

-----
 joki_saastuminen
2121 [('järvi_saastuminen', 0.8874495029449463), ('joki', 0.8869308233261108), ('vesi_saastuminen', 0.88435298204422), ('ranta_saastuminen', 0.8523595929145813), ('joki_hallinta', 0.8512622117996216), ('joki_uoma', 0.8384413123130798), ('makea_vesi_saastuminen', 0.8334753513336182), ('meri_saastuminen', 0.8311656713485718), ('maa_saastuminen', 0.8273067474365234), ('kaupunki_saastuminen', 0.8262186050415039)]

-----
 ilmastus
2122 [('päästö_vesi', 0.538061261177063), ('vesi_talteenotto', 0.5363056659698486), ('huoneilma_sisäilma_saastuminen', 0.

2151 [('suojelutoimi', 0.8979583382606506), ('suojelutavoite', 0.7669819593429565), ('luontotyyppi_suojelu', 0.7328680753707886), ('kunnostustoimenpide', 0.7252166271209717), ('luonnonvara_suojelu', 0.7196862697601318), ('suojelu', 0.7106912136077881), ('kehitystoimenpide', 0.7055585384368896), ('vesivara_suojelu', 0.702492356300354), ('torjuntatoimenpide', 0.701131284236908), ('suojelutaso', 0.6945788264274597)]

-----
 yhdistää_kansakunta
2152 [('kansakunta', 0.8481550812721252), ('yhdistää', 0.7919913530349731), ('ihminen_muokata_maa', 0.7651476860046387), ('maa_perustaa_toiminta', 0.7554143667221069), ('valtio_maa', 0.7479833364486694), ('kehittyä_maa', 0.7372405529022217), ('biologisesti_tuottava_maa_alkaa', 0.7247195243835449), ('kansa', 0.7211464047431946), ('rekisteröidä_maa_alue', 0.7165741920471191), ('valtio', 0.7027087211608887)]

-----
 video
2153 [('videoklippi', 0.8364843130111694), ('videopätkä', 0.8288102746009827), ('videoida', 0.8146743774414062), ('videomuoto', 0.79

2185 [('luonto_kiertokulku', 0.8464077115058899), ('ravinto', 0.8293702006340027), ('vesi_kiertokulku_luonto', 0.8156365156173706), ('kiertokulku', 0.8065089583396912), ('ravinto_perusvaatimus', 0.7938916087150574), ('pääasiallinen_ravinto_tärkeä_ravinto', 0.7850321531295776), ('typpi_kiertokulku', 0.7694220542907715), ('hiili_kiertokulku', 0.7667926549911499), ('kasvi_lisääntyminen', 0.7315623760223389), ('ravintoaine', 0.7270714640617371)]

-----
 liike
2186 [('yhteiskunnallinen_liike', 0.8956156969070435), ('vihreä_liike_ekologinen_liike', 0.8256217837333679), ('liike_laatu', 0.7655313611030579), ('maankuori_hidas_liike', 0.745170533657074), ('perusliike', 0.7065922021865845), ('merivesi_liike', 0.6928991079330444), ('liikesuunta', 0.689559280872345), ('liikkua', 0.6840443015098572), ('liikerata', 0.6820070147514343), ('urheiluliike', 0.6649857759475708)]

-----
 happamoituminen
2187 [('maa_happamoituminen', 0.7873321771621704), ('rehevöityminen', 0.7006609439849854), ('hapan_laskeu

2219 [('avaruustiede', 0.7699885964393616), ('avaruustoiminta', 0.7629178762435913), ('avaruusteknologia', 0.750564455986023), ('avaruustekniikka', 0.7348747253417969), ('avaruusjärjestö', 0.7015281915664673), ('avaruusfysiikka', 0.6966426372528076), ('avaruusteollisuus', 0.6930569410324097), ('avaruuslento', 0.6847220659255981), ('avaruusturisti', 0.679701566696167), ('avaruusohjelma', 0.6756266355514526)]

-----
 stratosfääri_otsonikato
2220 [('otsonikato', 0.8969188928604126), ('stratosfääri', 0.8493785858154297), ('otsoni', 0.7616132497787476), ('troposfääri_otso', 0.7470659017562866), ('otsonikerros', 0.7469302415847778), ('troposfääri', 0.7440012693405151), ('ilmakehä', 0.7342017889022827), ('ilmakehä_otso', 0.7289230823516846), ('ilmakehä_vaikuttaa_aerosoli', 0.7203871011734009), ('ilmakehä_hiukkanen', 0.7167322635650635)]

-----
 matkailureitti
2221 [('matkailutie', 0.8113870024681091), ('matkailualue', 0.7652066946029663), ('retkeilyreitti', 0.7367583513259888), ('matkailukohd

 työvoima
2254 [('työvoimaa', 0.8435925245285034), ('vuokratyövoima', 0.7455600500106812), ('työvoimapula', 0.7307339906692505), ('työmarkkina', 0.7293527126312256), ('työllinen', 0.727474570274353), ('työvoimatarve', 0.719251275062561), ('työllisyys', 0.7045150995254517), ('työtön', 0.7009533643722534), ('työttömyys', 0.6878457069396973), ('halpatyövoima', 0.6867530345916748)]

-----
 tropiikki
2255 [('subtropiikki', 0.791593611240387), ('trooppinen_ilmasto', 0.728425145149231), ('trooppinen_sademetsä', 0.706205427646637), ('trooppinen', 0.7005645036697388), ('lauhkea_ilmasto', 0.6855849027633667), ('trooppinen_kasvi', 0.6596733331680298), ('trooppinen_metsäekosysteemi', 0.6595590710639954), ('trooppinen_ekosysteemi', 0.6490634679794312), ('valtameri_ilmasto', 0.6482023000717163), ('trooppinen_metsä', 0.6387729048728943)]

-----
 kiviaines_louhinta
2256 [('louhinta', 0.9337323904037476), ('mineraali_louhinta', 0.9075430631637573), ('kiviaines', 0.884901225566864), ('ruskohiili_louhint

2286 [('liete_mädätys', 0.8985365629196167), ('mädätysjäännös', 0.7740607261657715), ('mädättää', 0.7093998789787292), ('kompostointi', 0.695623517036438), ('liete_poltto', 0.6789151430130005), ('lanta_käyttö_polttoaine', 0.6624893546104431), ('energiakäyttö_jäte_energiakäyttö', 0.6551251411437988), ('liete_käsittely', 0.6523597240447998), ('lanta_lannoite', 0.6460903882980347), ('jätevesiliete_puhdistamoliete', 0.6447828412055969)]

-----
 koppisiemeninen_l_hedelmäkasvi
2287 [('l', 0.972287118434906), ('k', 0.7844003438949585), ('e', 0.7801734209060669), ('r', 0.7722204923629761), ('m', 0.7570074796676636), ('s_ihmisasutus_sosioekonominen_näkökohta', 0.7548620700836182), ('s', 0.7536501884460449), ('u', 0.753119707107544), ('h', 0.7465755939483643), ('typpi_t_nitraatti_poistaminen_t_poistuminen', 0.7439249157905579)]

-----
 kuorma_auto
2288 [('auto', 0.871652364730835), ('kuorma', 0.8592476844787598), ('ajoneuvo', 0.8148588538169861), ('linja_auto', 0.8017215132713318), ('saastuttama

2321 [('lentoasema', 0.8824107646942139), ('lentokenttäalue', 0.8179291486740112), ('lentokenttäbussi', 0.8002088665962219), ('lentokenttähotelli', 0.7822543382644653), ('sotilaslentokenttä', 0.7799721956253052), ('lentoasemaa', 0.7772225141525269), ('lentokentt', 0.7479671835899353), ('lentopaikka', 0.7403649091720581), ('lentokone', 0.729911208152771), ('lento', 0.7280060052871704)]

-----
 erikoistuminen
2322 [('erikoistaa', 0.7719780206680298), ('taloudellinen_keskittyminen', 0.7067102193832397), ('erikoistunut', 0.7015705704689026), ('erikoistupa', 0.6937273740768433), ('suuntautuminen', 0.6869929432868958), ('erikoistua', 0.6770446300506592), ('palautuminen_siirtyminen', 0.6715025901794434), ('keskittyminen', 0.6675019264221191), ('ala_viimeinen_kehitys_vallita_tekninen_kehitystaso', 0.662847638130188), ('profiloituminen', 0.6590688824653625)]

-----
 valokemiallinen_reaktio
2323 [('kemiallinen_reaktio', 0.9323499798774719), ('reaktio', 0.8845889568328857), ('valokemiallinen', 0.

2356 [('välimeri_metsä', 0.8177086114883423), ('Välimeri_ilmasto', 0.7862789630889893), ('puu', 0.7247723340988159), ('Välimeri', 0.7163636088371277), ('trooppinen_metsä', 0.7056255340576172), ('korkea_puu_kasvaa_vesakko', 0.7048920392990112), ('metsikkö', 0.7046313881874084), ('metsä_luonto_monimuotoisuus', 0.701433539390564), ('metsitys_metsä_istutus', 0.7011970281600952), ('aavikko_heinä_sirkka', 0.6995608806610107)]

-----
 lannoite
2357 [('luonnollinen_lannoite', 0.9037255048751831), ('lanta_lannoite', 0.8987699747085571), ('lannoitus', 0.8961428999900818), ('maaperä_lannoitus', 0.8557687997817993), ('epäorgaaninen_lannoite', 0.853760302066803), ('kemiallinen_lannoite', 0.8442570567131042), ('lannoite_kulutus', 0.8433796167373657), ('lannoittaa', 0.8419210910797119), ('lannoitevalmiste', 0.806177020072937), ('typpilannoite', 0.7802356481552124)]

-----
 kaivauspaikka
2358 [('arkeologinen_kaivauspaikka', 0.8602902293205261), ('kaivaus', 0.7179214954376221), ('raivaustyö', 0.5967683

2392 [('jätevesi_käsittely', 0.9374706745147705), ('yhteinen_jätevesi_käsittely', 0.9228411912918091), ('biologinen_käsittely_biologinen_puhdistus', 0.908883273601532), ('jätevesi_käsittelyjärjestelmä', 0.8933887481689453), ('biologinen_jätteidenkäsittely', 0.8842384815216064), ('kemiallinen_jäte_käsittely', 0.881076455116272), ('jätevesi_käsittelylaitos', 0.8690844774246216), ('jätevesi_puhdistus', 0.865058183670044), ('vesi_käsittely', 0.8598708510398865), ('jätevesi_vähentäminen', 0.8587267994880676)]

-----
 lehti_lehvistö
2393 [('lehvistö', 0.8681733012199402), ('lehti', 0.8449206352233887), ('oksa', 0.7332552075386047), ('lehvä', 0.723783016204834), ('lehtikato_lehti_tuhoutuminen', 0.7136889100074768), ('lehvästö', 0.7126493453979492), ('silmu', 0.701540470123291), ('kukka', 0.6959322690963745), ('lehdetön', 0.6902687549591064), ('koivu', 0.6826054453849792)]

-----
 eliömaantiede
2394 [('eliömaantieteellinen', 0.8575378656387329), ('kulttuurimaantiede', 0.7478930354118347), ('ta

2428 [('direktiiviehdotus', 0.8189265131950378), ('konedirektiivi', 0.7908818125724792), ('direktiivi_saattaminen_osa_kansallinen_lainsäädäntö', 0.7833141088485718), ('arvonlisäverodirektiivi', 0.7623676657676697), ('uusiutuva_energialähde_koskea_direktiivi', 0.7582453489303589), ('puitedirektiivi', 0.7406414151191711), ('päästökauppadirektiivi', 0.7332743406295776), ('energiatehokkuusdirektiivi', 0.7078756093978882), ('vesi_laatu_koskea_direktiivi', 0.6960448026657104), ('säädös', 0.6895953416824341)]

-----
 vapaa
2429 [('vapaa_toiminta', 0.9182564616203308), ('vapaa_keskus', 0.8866757750511169), ('vapaa_käyttö', 0.8723170757293701), ('pääoma_vapaa_liikkuvuus', 0.7943958640098572), ('vapaus', 0.7052860856056213), ('itsenäinen', 0.6847637891769409), ('vapauttaa', 0.6769882440567017), ('avoin', 0.6660840511322021), ('vapautua', 0.6603589057922363), ('yleinen_pääsy_maa', 0.6544716358184814)]

-----
 elvytyssuunnitelma
2430 [('elvytystoimi', 0.6467480659484863), ('elvytys', 0.64629477262

2463 [('kemia', 0.8951205611228943), ('fysikaalinen_kemia', 0.8940597772598267), ('epäorgaaninen_kemia', 0.8870166540145874), ('orgaaninen_kemia', 0.8859308362007141), ('kemia_teollisuus', 0.8837302923202515), ('kemia_tekniikka', 0.8783546686172485), ('analyyttinen_kemia', 0.8657475709915161), ('yleinen_kemia', 0.8519340753555298), ('ilmakehä_fysikaalinen_ilmiö', 0.843646228313446), ('ilmakehä_hiukkanen', 0.8373090028762817)]

-----
 analyysi
2464 [('taloudellinen_analyysi', 0.8905676007270813), ('matemaattinen_analyysi', 0.8777488470077515), ('sosiaalinen_analyysi', 0.8451269865036011), ('mikrobiologinen_analyysi', 0.8285708427429199), ('ekosysteemi_analyysi', 0.8283507823944092), ('biologinen_analyysi', 0.8222527503967285), ('analyysi_määritys_koe', 0.8135863542556763), ('kemiallinen_analyysi', 0.8093876242637634), ('fysikaaliskemiallinen_analyysi', 0.80250084400177), ('kromatografinen_analyysi', 0.7838969826698303)]

-----
 kansainvälinen_yhteistyö
2465 [('yhteistyö', 0.895583868026

2497 [('tasanko', 0.5338545441627502), ('mutkitteleva', 0.5139626860618591), ('kameja', 0.48051485419273376), ('drumliineja', 0.47658461332321167), ('tasankoalue', 0.4751170575618744), ('kivettymä', 0.47423282265663147), ('tulvatasanko', 0.46437346935272217), ('kiemurteleva', 0.4597492516040802), ('olemassaolevia', 0.4592386484146118), ('gneissi', 0.45574694871902466)]

-----
 sterilointi_kaasu_poisto_puhdistus
2498 [('kaasu_poisto_jäte', 0.8660864233970642), ('kaasu_käsittely', 0.8434600830078125), ('rikki_poisto_polttoaine', 0.8318617343902588), ('puhdistus', 0.8219029903411865), ('kemiallinen_puhdistus', 0.8206895589828491), ('myrkytön_tekeminen_myrkky_poisto', 0.7975040078163147), ('suola_poisto_vesi', 0.7913064956665039), ('jätevesi_poisto_viemäri', 0.7835999727249146), ('suola_poisto_merivesi', 0.7774938344955444), ('kaasunpoisto_kaatopaikka', 0.7757675051689148)]

-----
 anaerobinen_käsittely
2499 [('aerobinen_käsittely', 0.9053493738174438), ('anaerobinen_prosessi', 0.903158307

2515 [('fysiologia', 0.7675750255584717), ('fysiologinen', 0.7351120710372925), ('kasvibiologi', 0.7215719819068909), ('neurofysiologia', 0.7211687564849854), ('liikuntabiologia', 0.6902886629104614), ('onkologia', 0.6832258701324463), ('fysiologi', 0.6751301884651184), ('biofysiikka', 0.6647990345954895), ('kehitysbiologia', 0.6453951001167297), ('työpsykologia', 0.640747606754303)]

-----
 joki_uoma
2516 [('uoma', 0.9300336837768555), ('joki', 0.920063316822052), ('joki_hallinta', 0.8472067713737488), ('joki_saastuminen', 0.8384413123130798), ('joki_kanavointi', 0.8340295553207397), ('jokiuoma', 0.8084021806716919), ('puro', 0.79217529296875), ('vesistö_vesitie_väylä', 0.7651523351669312), ('oja', 0.763232946395874), ('meri_pato_suojata_alamaa', 0.7535062432289124)]

-----
 sähkötekniikka
2517 [('sähkötekninen', 0.8216854929924011), ('sähkötekninen_teollisuus', 0.8056542873382568), ('sähköenergiatekniikka', 0.7973744869232178), ('automaatiotekniikka', 0.7888680696487427), ('konetekni

2547 [('valmiussuunnittelu', 0.8764893412590027), ('valmiustoiminta', 0.6918055415153503), ('pelastussuunnitelma', 0.6797186732292175), ('turvallisuussuunnitelma', 0.6765810251235962), ('valmiuslaki', 0.6689552068710327), ('koulutussuunnitelma', 0.6575921177864075), ('varautumissuunnitelma', 0.6503169536590576), ('valmiusohje', 0.6422749757766724), ('toimintaohje', 0.6295632719993591), ('valmiusyksikkö', 0.6256141662597656)]

-----
 kaukoliikenne
2548 [('lähiliikenne', 0.8015378713607788), ('junaliikenne', 0.7779057621955872), ('bussiliikenne', 0.769822895526886), ('seutuliikenne', 0.7679321765899658), ('lähijunaliikenne', 0.766785740852356), ('matkustajaliikenne', 0.758733868598938), ('paikallisliikenne', 0.7575163841247559), ('liikenne', 0.7454758882522583), ('joukkoliikenne', 0.7381013631820679), ('henkilöliikenne', 0.7374764680862427)]

-----
 rapsi
2549 [('rypsi', 0.824376106262207), ('sipulikasvi_viljely', 0.6842829585075378), ('öljykasvi', 0.6760166883468628), ('ohra', 0.6760109

2582 [('kävelyalue', 0.9283097982406616), ('jalankulkualue', 0.902302622795105), ('jalankulku', 0.7623652219772339), ('pysäköintialue', 0.7416226267814636), ('kävelyreitti', 0.7385767698287964), ('kävelytie', 0.7294372916221619), ('parkkialue', 0.7293369174003601), ('pyörätie', 0.7275689840316772), ('kävelypolku', 0.7266865968704224), ('keskusta_sijaita_paikoitusalue', 0.7224003076553345)]

-----
 kansainvälinen_politiikka
2583 [('politiikka', 0.8883635997772217), ('hallitus_politiikka', 0.8496283292770386), ('paikallishallinto_politiikka', 0.8493326902389526), ('kansainvälinen', 0.8399084806442261), ('poliittinen', 0.8318408727645874), ('politiikka_menettelytapa_ohjelma', 0.8307435512542725), ('poliittinen_järjestö', 0.827978253364563), ('kansainvälinen_konflikti', 0.8261157870292664), ('poliittinen_maantiede', 0.8164471387863159), ('politiikka_suunnittelu', 0.8159098625183105)]

-----
 typpioksidi
2584 [('typpimonoksidi', 0.8026240468025208), ('typpidioksidi', 0.785545289516449), ('h

2616 [('ongelmajäte_vienti', 0.934714138507843), ('jäte_kierrätys', 0.8691769242286682), ('jäte_varastointi', 0.8682963252067566), ('lääketeollisuus_jäte', 0.8606083393096924), ('jäte_jäte', 0.858349621295929), ('jäte', 0.858349621295929), ('jäte_hyötykäyttö', 0.8565344214439392), ('terveydenhoitoala_jäte', 0.8470377922058105), ('jäte_sijoitus_maa', 0.8467814922332764), ('jäte_käsittely_jätehuolto', 0.8439165353775024)]

-----
 eristemateriaali
2617 [('eriste', 0.7704858183860779), ('eriste_eristysaine', 0.7617253065109253), ('katemateriaali', 0.6982690691947937), ('lämpöeriste', 0.6892542243003845), ('eristekerros', 0.6684065461158752), ('eristys', 0.6675886511802673), ('pintamateriaali', 0.6655327677726746), ('höyrynsulku', 0.6625850200653076), ('eristelevy', 0.657023549079895), ('seinärakenne', 0.6556471586227417)]

-----
 meluntorjunta
2618 [('äänenvaimennus_meluntorjunta', 0.8859081268310547), ('tieliikenne_melu', 0.7465372681617737), ('lähiympäristö_melu', 0.7339379191398621), ('

2649 [('huuhteluvesi', 0.8471994400024414), ('huuhteluaine', 0.829567551612854), ('huuhdella', 0.7667384147644043), ('kemiallinen_pesu_kuivapesu', 0.7239751815795898), ('pesu', 0.7039293646812439), ('puhdistus', 0.687423586845398), ('puhdistaminen', 0.6807000041007996), ('peseminen', 0.6670753955841064), ('liotus', 0.6629213094711304), ('kuivaus', 0.6588503122329712)]

-----
 lammas
2650 [('vuohi', 0.7839268445968628), ('eläin_teurastus', 0.7678393125534058), ('lehmä', 0.7544645071029663), ('nauta', 0.7520069479942322), ('kana', 0.7479242086410522), ('eläin_lanta', 0.7426906824111938), ('karitsa', 0.7426327466964722), ('sika', 0.7377233505249023), ('karja', 0.7360265254974365), ('luonnonvarainen_eläin', 0.7332050800323486)]

-----
 liikenneyhteys_tietoliikenneyhteys
2651 [('liikenneyhteys', 0.9516176581382751), ('tietoliikenneyhteys', 0.9428286552429199), ('joukkoliikenneyhteys', 0.8629382252693176), ('liikenneväline_kulkuyhteys', 0.7811876535415649), ('kulkuyhteys', 0.7669155597686768

2683 [('alifaattinen', 0.841712474822998), ('heterosyklinen_yhdiste', 0.8368417024612427), ('alifaattinen_hiilivety', 0.8326289057731628), ('aromaattinen_yhdiste', 0.8260122537612915), ('yhdiste', 0.8178285956382751), ('haihtua_orgaaninen_yhdiste', 0.8101851940155029), ('halogenoida_yhdiste', 0.8030253648757935), ('orgaaninen_klooriyhdiste', 0.7730210423469543), ('orgaaninen_happiyhdiste', 0.7706400752067566), ('orgaaninen_typpiyhdiste', 0.7667835354804993)]

-----
 äänieristys
2684 [('äänieriste', 0.862602710723877), ('äänieristää', 0.818447470664978), ('ääni_eristys_ääneneristys', 0.7636620998382568), ('ääneneristys', 0.7097705006599426), ('akustiikka', 0.6538111567497253), ('lämpöeristys', 0.6446719765663147), ('eristys', 0.6243436336517334), ('äänentoisto', 0.6147909760475159), ('vesieristys', 0.6120314598083496), ('ääni_taso_äänitaso', 0.6077040433883667)]

-----
 talvehtiminen
2685 [('talvehtia', 0.8360908031463623), ('talvehtimisalue', 0.7952609062194824), ('pesiminen', 0.651735

2714 [('ilmatiede', 0.8899972438812256), ('säätiede', 0.8711628317832947), ('ilmatieteenlaitos', 0.7895327210426331), ('ilmastotiede', 0.7298183441162109), ('meteorologia', 0.7289509773254395), ('säätieto', 0.7060878276824951), ('meteorologinen_suuronnettomuus', 0.6980580687522888), ('meteorologinen', 0.6901991367340088), ('meteorologi', 0.6864874362945557), ('kemiallinen_oseanografia_meritiede', 0.672340452671051)]

-----
 riisi
2715 [('ruoka', 0.755615770816803), ('papu', 0.7507655620574951), ('wokki', 0.7466046810150146), ('nuudeli', 0.7357140779495239), ('soija', 0.7264972925186157), ('keitto', 0.7235026359558105), ('runsasproteiininen_ruoka', 0.7233368158340454), ('ruoka_laatu', 0.7222849130630493), ('ruoka_ravintoarvo', 0.7154490947723389), ('soosi', 0.710631251335144)]

-----
 lähiympäristö_melu
2716 [('melu', 0.9745290279388428), ('kotitalous_melu', 0.9442029595375061), ('tieliikenne_melu', 0.9428050518035889), ('ajoittainen_melu', 0.9393641948699951), ('aerodynaaminen_melu', 0

2748 [('kaasunpoisto', 0.8746302723884583), ('kaatopaikka_kaasu', 0.8312311768531799), ('kaasu_poisto_jäte', 0.7917584180831909), ('kaatopaikkakaasu', 0.7831364870071411), ('sterilointi_kaasu_poisto_puhdistus', 0.77576744556427), ('kaatopaikka', 0.7583727836608887), ('radioaktiivinen_jäte_kaatopaikka', 0.7552448511123657), ('jäte_kaatopaikka', 0.7345544695854187), ('jätevesiliete_puhdistamoliete', 0.7321392297744751), ('kotitalousjäte_kaatopaikka', 0.7300742864608765)]

-----
 biotekniikka_sosioekonominen_vaikutus
2749 [('biologinen_vaikutus', 0.8542129993438721), ('perinnöllinen_vaikutus_geneettinen_vaikutus', 0.840111255645752), ('saastuminen_biologinen_vaikutus', 0.823372483253479), ('psykologinen_vaikutus', 0.8045864701271057), ('vaikutus_tutkimus', 0.8023881316184998), ('maatalous_vaikutus_ympäristö', 0.8002800345420837), ('teollisuus_vaikutus_ympäristö', 0.7959966063499451), ('patologinen_vaikutus', 0.7956445813179016), ('ilmastonmuutos_vaikutus', 0.7955195307731628), ('vaikutus_

2780 [('saastua_aine', 0.8002014756202698), ('ruopata', 0.7853007316589355), ('vaarallinen_aine_koskea_lainsäädäntö', 0.7663714289665222), ('ympäristö_vaarallinen_aine', 0.7651878595352173), ('pinta_aktiivinen_aine', 0.7642892599105835), ('haihtua_aine', 0.7635819315910339), ('toimia_aine', 0.7580114603042603), ('öljy_sitoa_aine', 0.7567881345748901), ('käyttö_raaka_aine', 0.7558174729347229), ('kiinteä_aine', 0.755171537399292)]

-----
 keski_aasi
2781 [('keski', 0.8975040912628174), ('keski_Afrikka', 0.8143820762634277), ('keski_Amerikka', 0.8139553070068359), ('kaakkois_aasi', 0.7114309668540955), ('etelä_aasi', 0.6975662112236023), ('itä_aasi', 0.6418378353118896), ('länsi_aasi', 0.6296672224998474), ('aasi', 0.6087812185287476), ('pohjois_etelä_Amerikka', 0.608098030090332), ('pohjoinen_etelä_suhde', 0.5955873131752014)]

-----
 liikakalastus
2782 [('verkkokalastus', 0.6908267736434937), ('kalastus', 0.6826518774032593), ('ruokakala', 0.6730555295944214), ('merikalastus', 0.655260

2808 [('relaatio', 0.7284376621246338), ('tietokanta', 0.7194218039512634), ('viitetietokanta', 0.6321312189102173), ('tietokannoki', 0.620608389377594), ('tietokanto', 0.6163319945335388), ('tietorakenne', 0.6158003807067871), ('metatieto', 0.6075094938278198), ('kokoelmatietokanta', 0.6030035614967346), ('lääketietokanta', 0.5928788185119629), ('tietue', 0.5924781560897827)]

-----
 kulutusvero
2809 [('kulutusverotus', 0.8959734439849854), ('vero', 0.7519084215164185), ('verotus', 0.7277808785438538), ('varallisuusvero', 0.7268627285957336), ('verotuki', 0.7243018746376038), ('tulovero', 0.718302845954895), ('omaisuusvero', 0.7144973278045654), ('verolaki_vero_oikeus', 0.7103691101074219), ('energiavero', 0.7084635496139526), ('maavero_kiinteistövero', 0.7033693790435791)]

-----
 ilmakehä_fysikaalinen_ilmiö
2810 [('ilmakehä_tutkia_tiede', 0.8735349774360657), ('ilmakehä_rakenne', 0.872403621673584), ('ilmakehä_tapahtua_prosessi', 0.8691152334213257), ('ilmakehä_hiukkanen', 0.8631256

2841 [('vahingonkorvausvastuu', 0.8555170297622681), ('vahingonkorvausvelvollisuus', 0.8255385160446167), ('vahingonkorvauslaki', 0.7675847411155701), ('korvaus', 0.7535809278488159), ('korvaus_hyvitys', 0.7522635459899902), ('oikeus_korvaus', 0.743927001953125), ('korvausvaatimus', 0.7009947299957275), ('korvausvastuu', 0.6978116631507874), ('korvausvelvollisuus', 0.6943539977073669), ('vahinko', 0.6919158697128296)]

-----
 jätehuolto_jätevesi
2842 [('jätevesi', 0.9336785674095154), ('jätevesi_käsittelyjärjestelmä', 0.9087088108062744), ('jätehuolto', 0.9077726602554321), ('jätevesi_käsittelylaitos', 0.9073678255081177), ('teollisuus_jätevesi', 0.9068824052810669), ('jäte_käsittely_jätehuolto', 0.8946386575698853), ('kaupunki_jätevesi', 0.8920475840568542), ('jätevesi_puhdistus', 0.8838114738464355), ('maatalous_jätevesi', 0.8805945515632629), ('jätevesi_käsittely', 0.8726400136947632)]

-----
 kemiallinen_vaara
2843 [('luonnollinen_vaara', 0.9166145324707031), ('vaara', 0.8875817656

2874 [('betonilattia', 0.8447670340538025), ('betonilaatta', 0.8391286134719849), ('betoninen', 0.8302838802337646), ('betonielementti', 0.8232846260070801), ('betonikivi', 0.7940577864646912), ('betonirakenne', 0.7891802787780762), ('sementti', 0.7614157795906067), ('sementti_valmistus', 0.7522927522659302), ('betoniteollisuus', 0.744342029094696), ('tiili', 0.7201529741287231)]

-----
 biologinen_jätteidenkäsittely
2875 [('biologinen_käsittely_biologinen_puhdistus', 0.9066305160522461), ('biologinen', 0.9017906188964844), ('biologinen_jätevesi_käsittely', 0.8842384815216064), ('biologinen_prosessi', 0.8565108180046082), ('biologinen_ominaisuus', 0.8471804857254028), ('biologinen_tuotanto', 0.8444278836250305), ('biologinen_typensidonta', 0.8416444063186646), ('biologinen_saastuminen', 0.8391662836074829), ('biologinen_valvonta', 0.8376177549362183), ('biologinen_torjunta', 0.8338484168052673)]

-----
 merenpohja
2876 [('merenpohja_kaivostoiminta', 0.891387403011322), ('merenpohja_hyv

2907 [('radioaktiivinen_jäte_käsittely', 0.8341324329376221), ('vaarallinen_jäte', 0.8282333612442017), ('kemiallinen_jäte_käsittely', 0.8257226943969727), ('kierrätys_hallinta_jäte_koskea_laki', 0.8173662424087524), ('jäte_käsittely_jätehuolto', 0.816423773765564), ('jäte_käyttö', 0.8116244077682495), ('kauppa_aiheuttaa_jäte', 0.8101242780685425), ('kiinteä_jäte_kiinteä_jäte', 0.8055945634841919), ('jäte_tila', 0.8047276735305786), ('vaarallinen_jäte_ennakkoilmoitus', 0.8038238883018494)]

-----
 kala_suojelualue
2908 [('kala', 0.9133265018463135), ('kala_myrkyllisyys', 0.8706933259963989), ('makea_vesi_suojelu', 0.7992489337921143), ('kalastaa', 0.7897307872772217), ('kalastus', 0.7892343997955322), ('kalastaja', 0.7889131903648376), ('lohi', 0.7869722843170166), ('kalakanto', 0.779992938041687), ('kalavesi', 0.7734205722808838), ('kalastusalue', 0.7688872218132019)]

-----
 saaste_muodostus
2909 [('saaste_kulkeutuminen', 0.8908945918083191), ('saaste_kasautuminen', 0.884513199329376

2935 [('talousteoria', 0.7222890853881836), ('valintateoria', 0.6717758178710938), ('rahoitusteoria', 0.670952558517456), ('yhteiskuntateoria', 0.6572043895721436), ('hyvinvointivaltio_teoria', 0.6522703766822815), ('kaasuteoria', 0.6326587200164795), ('systeemiteoria', 0.6318506002426147), ('rahatalous', 0.6290405988693237), ('kasvuteoria', 0.626307487487793), ('taloustiede', 0.6142623424530029)]

-----
 aromaattinen_yhdiste
2936 [('heterosyklinen_yhdiste', 0.8565032482147217), ('aromaattinen', 0.8539154529571533), ('yhdiste', 0.8481016159057617), ('aromaattinen_aine', 0.8399006128311157), ('haihtua_orgaaninen_yhdiste', 0.8353532552719116), ('aromaattinen_hiilivety', 0.8350992798805237), ('polysyklinen_aromaattinen_hiilivety', 0.8311444520950317), ('halogenoida_yhdiste', 0.8289260864257812), ('alifaattinen_yhdiste', 0.8260122537612915), ('halogenoida_yhdiste_korvaaminen', 0.7851266860961914)]

-----
 agronomi
2937 [('agrologi', 0.701959490776062), ('agronomiliitto', 0.6293647289276123

2966 [('erottelu_paikka_päällä', 0.8584067821502686), ('kohde_paikka_päällä_tapahtua', 0.844438374042511), ('jäte_keruu', 0.7970064878463745), ('jäte_kaivaminen_maa', 0.7547655701637268), ('kaatopaikka_pohja_eristäminen', 0.7534085512161255), ('päällä', 0.7495372891426086), ('vesi_määrä_hallinta', 0.7430062294006348), ('kierrätys_hallinta_jäte_koskea_laki', 0.735353946685791), ('maaperä_käyttö', 0.7252600193023682), ('jäte_käyttö', 0.724780261516571)]

-----
 biokemiallinen_hapentarve
2967 [('kemiallinen_hapentarve', 0.9537767171859741), ('hapentarve', 0.8796097040176392), ('biokemiallinen', 0.783103883266449), ('orgaaninen_happiyhdiste', 0.7443852424621582), ('biokemiallinen_aine', 0.7407325506210327), ('biokemiallinen_menetelmä', 0.7236665487289429), ('kemiallinen', 0.7224531173706055), ('kemiallinen_syövyttävyys', 0.7223256826400757), ('kemiallinen_reaktio', 0.7208151817321777), ('biologinen_typensidonta', 0.717088520526886)]

-----
 kansalaisaloite
2968 [('kuntalaisaloite', 0.82022

2999 [('talousohjesääntö', 0.8429809808731079), ('määräys_johtosääntö', 0.7726311683654785), ('jalostusohjesääntö', 0.7556300163269043), ('matkustusohjesääntö', 0.7422498464584351), ('johtosääntö', 0.7251825332641602), ('toimintasääntö', 0.7197177410125732), ('sääntö', 0.7188634872436523), ('taloussääntö', 0.6936455965042114), ('järjestyssääntö', 0.6818689703941345), ('yleinen_sääntö_yhteinen_sääntö', 0.6768175363540649)]

-----
 hengitystie
3000 [('hengitystieoire', 0.8013250231742859), ('ylähengitystie', 0.7996929883956909), ('hengitys', 0.793992280960083), ('hengitystiesairaus', 0.7914519906044006), ('hengitysteitse', 0.7813706398010254), ('hengityselin', 0.7719550132751465), ('hengitystieinfektio', 0.7613542675971985), ('hengityselimistö', 0.7596152424812317), ('hengityselin_sairaus', 0.7464917302131653), ('hengityslihas', 0.7169185876846313)]

-----
 audiovisuaalinen_esitys
3001 [('esitys', 0.8625309467315674), ('audiovisuaalinen', 0.8246206641197205), ('audiovisuaalinen_viestintä

3032 [('raskas_polttoöljy', 0.9548676013946533), ('polttoöljy', 0.8679487705230713), ('kevyt', 0.8201780915260315), ('kevyt_neste_erottaa', 0.7902331352233887), ('raskas', 0.7635287046432495), ('polttoaine_koostumus', 0.7148293852806091), ('raskas_tavara_kuljetus', 0.7145748138427734), ('keveä', 0.7140587568283081), ('polttoaine', 0.7096704840660095), ('öljypohjainen_energia', 0.6904301643371582)]

-----
 valtio_valvonta
3033 [('valvonta', 0.8423293828964233), ('valtio', 0.840912938117981), ('rakennustoiminta_valvonta', 0.819839596748352), ('valtio_maa', 0.8138325214385986), ('valtio_raja', 0.808971107006073), ('liittovaltio_viranomainen', 0.7919086217880249), ('biologinen_valvonta', 0.7767101526260376), ('valvoa_viranomainen', 0.7716308832168579), ('aavikoituminen_valvonta', 0.7691943645477295), ('maa_hallinta_suunnittelu', 0.7689327597618103)]

-----
 jäte_kaato_joki
3034 [('jäte_kaato_valtameri', 0.9314307570457458), ('jäte_kaato_meri', 0.9296172261238098), ('jäte_kaato', 0.92473894

3066 [('esteettinen', 0.7334888577461243), ('poetiikka', 0.6959670782089233), ('esteettisyys', 0.6894677877426147), ('visuaalisuus', 0.6693161725997925), ('taiteellisuus', 0.6561240553855896), ('filosofia', 0.6490769982337952), ('taide', 0.6483585834503174), ('kokeellisuus', 0.6445396542549133), ('aistillisuus', 0.6414738893508911), ('muotoilu_suunnittelu', 0.6378161311149597)]

-----
 ympäristönsuojelu_tarvita_laite
3067 [('laite', 0.8446775674819946), ('laitos_tarvita_hyväksyntä', 0.8196247816085815), ('tarvita', 0.7927793264389038), ('ympäristö_koskea_tieto', 0.7606197595596313), ('tieto_ympäristö_tila', 0.7590675354003906), ('ympäristö_tila_koskea_kertomus', 0.757026195526123), ('laitteisto', 0.7557551860809326), ('laitos_turvallisuus', 0.754262387752533), ('ympäristö_säästävä_tuote', 0.7517046928405762), ('tuote_ympäristöjalanjälki_koskea_menetelmä', 0.7463315725326538)]

-----
 arviointi
3068 [('ympäristövaikutus_arviointi', 0.9152559638023376), ('kirjallisuus_arviointi', 0.91239

3085 [('asennus', 0.8604750037193298), ('valvonta', 0.8413453102111816), ('rakennustoiminta_valvonta', 0.8365929126739502), ('polttoainetankki_asennus', 0.8208729028701782), ('laatu_valvonta', 0.7942166924476624), ('asentaa_järjestelmä_hyväksyminen', 0.784640908241272), ('puhtaanapito_puhtaus_valvonta', 0.7837945222854614), ('liikennemelu_valvonta', 0.7584415078163147), ('asentaminen', 0.7555826902389526), ('ympäristövaikutus_tarkastus', 0.7523318529129028)]

-----
 sosioekonominen_tekijä
3086 [('tekijä', 0.834947943687439), ('sosioekonominen', 0.8214970827102661), ('ekologinen_tekijä', 0.8050253391265869), ('abioottinen_tekijä', 0.7852435111999512), ('biotekniikka_sosioekonominen_vaikutus', 0.7700813412666321), ('bioottinen_tekijä', 0.7688573002815247), ('ympäristö_rikastaa_tekijä', 0.7657864689826965), ('asia_vaikuttaa_tekijä_kokonaisuus', 0.7574551105499268), ('moni_tekijä_aiheuttaa_saastuminen', 0.7538655996322632), ('ihminen_aiheutua_tekijä', 0.7522315979003906)]

-----
 fosfaatti

3116 [('halogenoida_yhdiste', 0.9194218516349792), ('halogenoida', 0.8040794134140015), ('halogenoida_hiilivety', 0.7947468161582947), ('aromaattinen_yhdiste', 0.7851267457008362), ('halogenoida_fenoli', 0.7840608954429626), ('haihtua_orgaaninen_yhdiste', 0.7787231802940369), ('yhdiste', 0.7756295800209045), ('orgaaninen_halogeeniyhdiste', 0.7586692571640015), ('fosfaatti_korvaaminen', 0.7542676329612732), ('alifaattinen_yhdiste', 0.7428635358810425)]

-----
 niemi
3117 [('niemeke', 0.7848773002624512), ('salmi', 0.752449095249176), ('lahti', 0.7391690611839294), ('rannikko_ranta', 0.732009768486023), ('lahdelma', 0.7281793355941772), ('ranta', 0.7243363261222839), ('meri_lahti', 0.7221930027008057), ('ranta_suuntainen_hiekkasärkkä', 0.7200289964675903), ('saari', 0.7179133892059326), ('lahdelma_avoin_satama', 0.7004531621932983)]

-----
 hylätä_ajoneuvo
3118 [('ajoneuvo', 0.8212791681289673), ('hylätä', 0.8187601566314697), ('joukkoliikenne_ajoneuvo', 0.7792402505874634), ('hylätä_maa

3150 [('pesu', 0.9074212312698364), ('kuivapesu', 0.8510309457778931), ('kemiallinen_puhdistus', 0.8093514442443848), ('vesipesu', 0.8059202432632446), ('raha_pesu', 0.7996132373809814), ('pesuaine', 0.7706332206726074), ('peseminen', 0.7679824233055115), ('astianpesu', 0.7663043737411499), ('käsinpesu', 0.761223316192627), ('puhdistusaine', 0.7553693652153015)]

-----
 ionisoida_säteily
3151 [('ionisoimaton_säteily', 0.9552431106567383), ('säteily', 0.9041818380355835), ('ionisoida', 0.8568141460418701), ('aurinko_säteily', 0.8448631167411804), ('kosminen_säteily', 0.8236865997314453), ('säteilyttää', 0.7686179876327515), ('hiukkassäteily', 0.7410005331039429), ('gammasäteily', 0.7366424202919006), ('säteillä', 0.7264804840087891), ('säteilyteho', 0.7207640409469604)]

-----
 cesium
3152 [('radioaktiivinen_alkuaine', 0.6862331628799438), ('magnesium', 0.6714441776275635), ('jodi', 0.6500847339630127), ('radioaktiivisuus', 0.6459025144577026), ('radioaktiivinen_laskeuma', 0.64362686872

3184 [('laitos', 0.8615694046020508), ('vaarallinen_laitos', 0.8486034870147705), ('vanha', 0.8408101797103882), ('julkinen_laitos', 0.8387923836708069), ('laitos_kunnostus', 0.837207555770874), ('hallinnollinen_julkinen_laitos', 0.8278228044509888), ('laitos_rakentaminen', 0.8250399827957153), ('kemiallinen_laitos', 0.8193792104721069), ('laitos_turvallisuus', 0.8080589175224304), ('vanha_saastua_alue', 0.7890792489051819)]

-----
 ydinpolttoaine
3185 [('ydinpolttoaine_elementti', 0.844857931137085), ('polttoaine', 0.7401924729347229), ('ydinenergia', 0.7395980358123779), ('ydinvoimalaitos', 0.7209498286247253), ('reaktori_turvallisuus', 0.705562949180603), ('reaktori', 0.7045305967330933), ('jätteenpolttolaitos', 0.7029368877410889), ('ydinjäte', 0.6958212852478027), ('ydinenergia_käyttö', 0.6874569654464722), ('ydinreaktori', 0.6847424507141113)]

-----
 jätelasi
3186 [('jätelaji', 0.713046669960022), ('jätelaitos', 0.6437190771102905), ('jätelaki', 0.6401152610778809), ('jätelainsä


-----
 ihmisoikeus
3218 [('perusoikeus', 0.7748816013336182), ('ihmisoikeussopimus', 0.7698039412498474), ('kansainvälinen_oikeus', 0.7595958709716797), ('ihmisoikeusloukkaus', 0.7533267140388489), ('oikeus', 0.7497720718383789), ('ihmisoikeusjärjestö', 0.7389398813247681), ('uskonnonvapaus', 0.7264221906661987), ('ihmisoikeuskasvatus', 0.7243677377700806), ('ihmisarvo', 0.7216795086860657), ('ihmisoikeuspolitiikka', 0.7175050973892212)]

-----
 valvoa_metsästys_vyöhyke
3219 [('valvoa', 0.7625385522842407), ('valvoa_viranomainen', 0.7562150955200195), ('suojelualue_rauhoittaa_alue', 0.7350444793701172), ('valvottu_kuva_luokittelu', 0.7304888963699341), ('maa_ääriviiva_noutaa_viljely', 0.7299104928970337), ('luonnonvarainen_alue_suojelu', 0.7298080921173096), ('lauhkea_vyöhyke_metsä', 0.7251803874969482), ('vaarallinen_alue', 0.7244649529457092), ('kylmä_vyöhyke_ekosysteemi', 0.7241711616516113), ('biologinen_valvonta', 0.7213262915611267)]

-----
 sähköposti
3220 [('sähköpostiviesti',

3251 [('kaatopaikka', 0.8797140121459961), ('maanalainen_kaatopaikka', 0.852240800857544), ('kaupunki', 0.8453977108001709), ('kaupunki_jätevesi', 0.8417524099349976), ('kaupunki_viheralue', 0.8254799842834473), ('vaarallinen_kaatopaikka', 0.8243849277496338), ('elinympäristö_kaupunki', 0.8082900047302246), ('kaupunki_vesi', 0.8075170516967773), ('kaupunki_saaste', 0.7988123893737793), ('kotitalousjäte_kaatopaikka', 0.7942176461219788)]

-----
 fosfori
3252 [('fosforiyhdiste', 0.7974722981452942), ('fosforihappo', 0.7841567993164062), ('fosforipitoisuus', 0.779086172580719), ('kokonaisfosfori', 0.7781437635421753), ('orgaaninen_typpi', 0.7648226022720337), ('typpi', 0.7614425420761108), ('orgaaninen_fosforiyhdiste', 0.7587642073631287), ('epäorgaaninen_lannoite', 0.7144584059715271), ('typpi_kiertokulku', 0.7114013433456421), ('kemiallinen_lannoite', 0.7091373205184937)]

-----
 piikkinahkainen
3253 [('nahkainen', 0.699297308921814), ('piikkinen', 0.6505365967750549), ('piikki', 0.6065

3286 [('kaivosala', 0.774848222732544), ('kaivostoiminta', 0.7707383632659912), ('kaivannaisteollisuus', 0.7291363477706909), ('terästeollisuus', 0.7280393838882446), ('kaivostekniikka', 0.7202526330947876), ('metalliteollisuus', 0.7201968431472778), ('teollisuus', 0.7154021859169006), ('kaivos', 0.7149094343185425), ('metallurginen_teollisuus', 0.7124801278114319), ('puunjalostusteollisuus', 0.7110489010810852)]

-----
 tietokeskus
3287 [('paikkatietokeskus', 0.7831788063049316), ('lääketietokeskus', 0.7300383448600769), ('myrkytystietokeskus', 0.7212235927581787), ('hallintokeskus', 0.6490695476531982), ('tietohallintokeskus', 0.6454330682754517), ('tilastokeskus', 0.6319423317909241), ('sosiaalivirasto', 0.6301720142364502), ('tietotekniikkakeskus', 0.6285995841026306), ('nuorisoasiainkeskus', 0.6282995343208313), ('informaatiokeskus', 0.6269476413726807)]

-----
 organismi
3288 [('maaperä_organismi', 0.8601573705673218), ('organismi_satunnainen_leviäminen', 0.7987968921661377), ('m

3304 [('kertakäyttöinen_säiliö', 0.8962193727493286), ('säiliö', 0.8718553185462952), ('säiliö_allas', 0.78177410364151), ('varastosäiliö', 0.7682437896728516), ('jatkuvakäyttöinen', 0.7420159578323364), ('vesisäiliö', 0.7352267503738403), ('kaasusäiliö', 0.7035233378410339), ('polttoainesäiliö', 0.6780023574829102), ('öljysäiliö', 0.6770334243774414), ('säiliöauto', 0.6716060042381287)]

-----
 edustus
3305 [('sosiaalinen_edustus', 0.851759135723114), ('edustuksellinen', 0.7826180458068848), ('edustusto', 0.7532183527946472), ('edustustehtävä', 0.7282657623291016), ('edustusoikeus', 0.7256590127944946), ('edustaminen', 0.7074137926101685), ('edustaja', 0.706787109375), ('edustustila', 0.6785225868225098), ('edustajisto', 0.6553354263305664), ('henkilöstöedustus', 0.640022873878479)]

-----
 euratom
3306 [('commission', 0.5122596025466919), ('eurocontrol', 0.49230527877807617), ('komissio', 0.48733001947402954), ('cenelec', 0.4821682572364807), ('jäsenvaltio', 0.4821065664291382), ('et

3338 [('kasvisto_palauttaminen', 0.8613568544387817), ('kasvisto_turmeltuminen', 0.8280500173568726), ('luonnonvarainen_eläimistö', 0.7140933871269226), ('eläimistö', 0.6937543153762817), ('kasvilajisto', 0.6806848645210266), ('luonnonvarainen_kasvi', 0.6767295598983765), ('lajisto', 0.674196720123291), ('linnusto', 0.6600664258003235), ('kasvillisuus', 0.6560983657836914), ('kasvi_perinnöllisyystiede', 0.655220627784729)]

-----
 pakokaasu
3339 [('moottoriajoneuvo_pakokaasu', 0.9280778169631958), ('poistokaasu_pakokaasu', 0.9029000997543335), ('pakokaasu_kierrätys', 0.8804296851158142), ('pakokaasupäästö', 0.8009256720542908), ('kaasu_bensiinimoottori', 0.7773247361183167), ('savukaasu_palokaasu_poistokaasu', 0.7533992528915405), ('kaasu', 0.7488436698913574), ('kaatopaikka_kaasu', 0.7328957915306091), ('polttokaasu_savukaasu', 0.7184524536132812), ('kaasu_käsittely', 0.7033370137214661)]

-----
 epämääräinen_oikeudellinen_käsite
3340 [('käsite', 0.8398144245147705), ('käsitteellinen'

3370 [('radioaktiivinen_jäte_kaatopaikka', 0.9694641828536987), ('jäte_jäte', 0.9605028629302979), ('jäte', 0.9605028629302979), ('jäte_kierrätys', 0.93991619348526), ('kotitalousjäte_kaatopaikka', 0.9274870157241821), ('jäte_hyötykäyttö', 0.924698531627655), ('vaarallinen_jäte', 0.9232961535453796), ('jäte_varastointi', 0.9181926250457764), ('radioaktiivinen_jäte', 0.9170129299163818), ('kompostoida_jäte', 0.9090036153793335)]

-----
 peura_metsäkauris
3371 [('peura', 0.9373536109924316), ('metsäkauris', 0.8900033235549927), ('hirvi', 0.8341988325119019), ('kauris', 0.8004322052001953), ('kettu', 0.7638982534408569), ('poro', 0.7608850002288818), ('jänis', 0.7517393231391907), ('susi', 0.7512823343276978), ('hirvieläin', 0.7494802474975586), ('karhu', 0.7466330528259277)]

-----
 tilastollinen_sarja
3372 [('sarja', 0.8780977129936218), ('tilastollinen', 0.7883786559104919), ('alueellinen_tilasto', 0.741588294506073), ('matemaattinen_analyysi', 0.7113421559333801), ('biologinen_analyys

3404 [('palokaasu', 0.9157813787460327), ('savukaasu', 0.91154545545578), ('poistokaasu_pakokaasu', 0.8976318836212158), ('polttokaasu_savukaasu', 0.8931912779808044), ('poistokaasu', 0.8715829253196716), ('savukaasu_rikinpoisto', 0.856743335723877), ('jalokaasu', 0.804216742515564), ('kaasu', 0.7807551026344299), ('kaasu_bensiinimoottori', 0.7646579742431641), ('kaatopaikka_kaasu', 0.7622026205062866)]

-----
 tauti_aiheuttaa_organismi
3405 [('tauti_aiheuttaa_mikrobi', 0.9333946704864502), ('tauti_syy', 0.8676682710647583), ('tauti', 0.8676440715789795), ('tarttuva_tauti', 0.8190513253211975), ('ihminen_aiheuttaa_ilmastonmuutos', 0.8085373044013977), ('organismi_satunnainen_leviäminen', 0.800244927406311), ('immuunijärjestelmä_sairaus', 0.7932288646697998), ('allergia_aiheuttaja', 0.7840502262115479), ('tuholainen_aiheuttaa_ruoka_pilaantuminen', 0.7802649736404419), ('organismi', 0.7744747400283813)]

-----
 kaatopaikka_täyttömaa
3406 [('täyttömaa', 0.9001871347427368), ('kaatopaikka'

3438 [('parlamentti_kertomus', 0.842732310295105), ('parlamenttiryhmä', 0.773481011390686), ('parlamentaarinen', 0.7685708403587341), ('europarlamentti', 0.7677903771400452), ('parlamentaarikko', 0.7663930058479309), ('parlamenttipaikka', 0.7637735605239868), ('europarlamenttivaali', 0.7372866868972778), ('parlamenttivaali', 0.7334561347961426), ('neuvosto', 0.7260959148406982), ('parlamenttitalo', 0.7252921462059021)]

-----
 kaasukromatografia
3439 [('kromatografia', 0.8791556358337402), ('kromatografinen', 0.7749157547950745), ('kromatografinen_analyysi', 0.6822565793991089), ('katalysaattori_katalyyttinen_jälkipoltin', 0.6396472454071045), ('kaasunpoisto', 0.6045583486557007), ('reagenssi', 0.5858427286148071), ('elektrolyytti', 0.5827957391738892), ('kaasu_bensiinimoottori', 0.5822995901107788), ('elektrolyysi', 0.5778625011444092), ('kaasunpoisto_kaatopaikka', 0.5751768350601196)]

-----
 leikkikenttä
3440 [('leikkipaikka', 0.8056719303131104), ('leikkipuisto', 0.7863686084747314

3473 [('teratogeeninen_aine', 0.8468725085258484), ('biokemiallinen_aine', 0.8443002700805664), ('orgaaninen_aine', 0.8389430046081543), ('aine', 0.8372266888618469), ('myrkyllinen_aine', 0.8367615938186646), ('aromaattinen_aine', 0.8358092308044434), ('fotokemiallinen_aine', 0.8339333534240723), ('epäorgaaninen_aine', 0.8323429822921753), ('liukenematon_aine', 0.8230794668197632), ('aine_ominaisuus', 0.8202698826789856)]

-----
 etanoli_etyylialkoholi
3474 [('etanoli', 0.9138278365135193), ('etyylialkoholi', 0.8751513957977295), ('metanoli', 0.8318365812301636), ('bentsyylialkoholi', 0.7678288221359253), ('bioetanoli', 0.7289379835128784), ('alkoholi', 0.7169209122657776), ('hiilihappo', 0.7040908932685852), ('fenoli', 0.6791819334030151), ('halogenoida_fenoli', 0.6770825386047363), ('typpihappo', 0.6707178354263306)]

-----
 rintamaito
3475 [('maito', 0.7449401617050171), ('äidinmaito', 0.7408612966537476), ('kauramaito', 0.6703106164932251), ('lehmänmaito', 0.6694439053535461), ('mu

3506 [('kiinteä_olomuoto', 0.8677979707717896), ('aine_ominaisuus', 0.6414128541946411), ('aine_tasapaino', 0.6376113891601562), ('aine_käyttäytyminen', 0.6366274356842041), ('haihtua_aine', 0.6194432377815247), ('käyttö_raaka_aine', 0.6191412210464478), ('liukenematon_aine', 0.6137619018554688), ('raaka_aine', 0.610934853553772), ('kiinteä_aine', 0.6098849177360535), ('pinta_aktiivinen_aine', 0.6035869717597961)]

-----
 lupa_valtuutus
3507 [('lupa', 0.906772255897522), ('lupa_myöntäminen', 0.8555739521980286), ('valtuutus', 0.8314924240112305), ('siirtää_lupa', 0.7930504083633423), ('valtuus', 0.7670095562934875), ('oikeus_saada_tieto', 0.7393237352371216), ('määräys_asetus_päätös', 0.7150704860687256), ('oikeus_korvaus', 0.6896517276763916), ('laki_suojella_oikeus', 0.6825400590896606), ('laitos_tarvita_hyväksyntä', 0.6814448237419128)]

-----
 cd_rom_hakupalvelu
3508 [('cd_rom', 0.996821403503418), ('cd', 0.9604992866516113), ('lp', 0.7278724908828735), ('ep', 0.7061769962310791), 

3540 [('yleinen_kylpylä', 0.8809208273887634), ('kylpyläkaupunki', 0.7902927398681641), ('kylpyläloma', 0.7812196016311646), ('terveyskylpylä', 0.766158401966095), ('kylpyläosasto', 0.7612876892089844), ('kylpylähotelli', 0.7599291205406189), ('kylpylähoito', 0.7341842651367188), ('kylpyläpalvelu', 0.7331243753433228), ('uimahalli', 0.6780741214752197), ('poreallas', 0.666401207447052)]

-----
 lehtipuu
3541 [('havupuu', 0.7697266936302185), ('mänty', 0.7260825634002686), ('koivu', 0.7126262187957764), ('puu', 0.7125763893127441), ('puusto', 0.7051995992660522), ('metsälehmus', 0.7031403183937073), ('lahopuu', 0.6963943839073181), ('pensas', 0.6962751746177673), ('lehmus', 0.6955679655075073), ('korkea_puu_kasvaa_vesakko', 0.6834771633148193)]

-----
 laiva_jätehuolto
3542 [('laiva', 0.8460144996643066), ('jätehuolto', 0.806957483291626), ('jätehuolto_jätevesi', 0.7750077843666077), ('jätehuolto_kustannus', 0.7721014022827148), ('satama', 0.7675772905349731), ('jäte_upottaminen_meri', 

3576 [('poistokaasu', 0.9094873666763306), ('pakokaasu', 0.9029000997543335), ('savukaasu_palokaasu_poistokaasu', 0.8976318836212158), ('pakokaasu_kierrätys', 0.8492746353149414), ('moottoriajoneuvo_pakokaasu', 0.8300873637199402), ('polttokaasu_savukaasu', 0.8054350018501282), ('savukaasu_rikinpoisto', 0.7669711112976074), ('palokaasu', 0.7650615572929382), ('sterilointi_kaasu_poisto_puhdistus', 0.75850510597229), ('savukaasu', 0.7581601738929749)]

-----
 nitroyhdiste
3577 [('klooriyhdiste', 0.7031854391098022), ('halogeeniyhdiste', 0.6973567008972168), ('fosforiyhdiste', 0.6849339008331299), ('tinayhdiste', 0.6795223951339722), ('happiyhdiste', 0.6723353862762451), ('rikkiyhdiste', 0.6716325879096985), ('alkyyliyhdiste', 0.6673552989959717), ('amidi', 0.6636289358139038), ('orgaaninen_klooriyhdiste', 0.6557226181030273), ('nitroryhmä', 0.6555277705192566)]

-----
 juna
3578 [('nopea_juna_rautatie', 0.9140931367874146), ('yöjuna', 0.8047593832015991), ('bussi', 0.8013581037521362), (

3613 [('fotokemiallinen_aine', 0.9530456066131592), ('orgaaninen_aine', 0.9327576160430908), ('epäorgaaninen_aine', 0.927335798740387), ('radioaktiivinen_aine', 0.9243583679199219), ('aine', 0.9190220236778259), ('vaarallinen_aine', 0.9026213884353638), ('myrkyllinen_aine', 0.8977135419845581), ('aromaattinen_aine', 0.8929880857467651), ('aine_käyttäytyminen', 0.8915871977806091), ('aine_ominaisuus', 0.8897738456726074)]

-----
 tulli
3614 [('tullilaitos', 0.7299841046333313), ('tullimaksu', 0.7130057215690613), ('tullaus', 0.6944612860679626), ('tullihallitus', 0.6938185691833496), ('tulliselvitys', 0.6923685073852539), ('tullialue', 0.6785981059074402), ('tullivarasto', 0.6768671274185181), ('tullimies', 0.6759160161018372), ('tullilainsäädäntö', 0.6738846898078918), ('tullitarkastus', 0.6691421270370483)]

-----
 raffinointi
3615 [('nitraus', 0.5736444592475891), ('sintraus', 0.5701589584350586), ('saostaminen_saostuminen_sakka', 0.5624593496322632), ('pelletöinti', 0.55589973926544

3649 [('pitäminen', 0.8290495872497559), ('varasto', 0.7805585265159607), ('varastointi', 0.7174599766731262), ('varastoiminen', 0.7146885991096497), ('säilyttäminen', 0.7068350911140442), ('asetehdas_muuttaminen_muu_tuotanto', 0.70197594165802), ('käyttö_energia_tuottaminen', 0.7002612352371216), ('vesi_määrä_hallinta', 0.6929855942726135), ('kierrätys_hallinta', 0.6853477358818054), ('tuotanto_rajoittaminen', 0.6828327775001526)]

-----
 liha
3650 [('ruoka', 0.764256477355957), ('lihainen', 0.7630115747451782), ('liharuoka', 0.7614476084709167), ('jauheliha', 0.7608523368835449), ('ruoka_ravintoarvo', 0.7601408958435059), ('lihatuote', 0.7550755739212036), ('pihvi', 0.752129077911377), ('lihaisa', 0.7518302202224731), ('lihaton', 0.7507435083389282), ('sianliha', 0.7470320463180542)]

-----
 ergonomia
3651 [('ergonominen', 0.8635368347167969), ('ergonomisesti', 0.6831036806106567), ('työasento', 0.6600751876831055), ('työympäristö', 0.628754734992981), ('työturvallisuus_työsuojelu', 

3685 [('nettisivu', 0.8630543351173401), ('kotisivusto', 0.8376443982124329), ('verkkosivu', 0.819328784942627), ('kotisivuilta', 0.8160231709480286), ('internetsivu', 0.7894716262817383), ('nettisivusto', 0.7885866761207581), ('verkkosivusto', 0.7440305948257446), ('websivu', 0.7429424524307251), ('sivu', 0.7403173446655273), ('internetsivusto', 0.734028160572052)]

-----
 karsi_merikortti
3686 [('merikortti', 0.856164813041687), ('karsi', 0.827916145324707), ('kartta', 0.7627230882644653), ('merikarsi', 0.7072126865386963), ('karttaa', 0.6887120604515076), ('merikartta', 0.6824778318405151), ('kasvillisuus_eläimistö_muodostuminen_laiva_pohja', 0.6811162829399109), ('köysi_viiva_linja_rivi_raja_reitti_alkaa', 0.6607826948165894), ('karttakuva', 0.6573814749717712), ('karttasivu', 0.6535171270370483)]

-----
 bibliografinen_tieto
3687 [('bibliografinen_tieto_järjestelmä', 0.9657045006752014), ('bibliografinen', 0.8651617765426636), ('tieto', 0.8162297010421753), ('bibliografia', 0.7992

3721 [('laskento', 0.7829225659370422), ('laskentamalli', 0.7817195057868958), ('laskentakaava', 0.7558034062385559), ('laskentatapa', 0.7499703168869019), ('laskennallinen', 0.7485270500183105), ('laskentamenetelmä', 0.7454410791397095), ('laskelma', 0.7077704668045044), ('taulukkolaskenta', 0.7014495134353638), ('laskentaohje', 0.6988681554794312), ('laskentaperuste', 0.6842958927154541)]

-----
 päätöslauselma
3722 [('päätöslauselmaesitys', 0.7743631601333618), ('julkilausuma', 0.6405185461044312), ('puitepäätös', 0.6254613399505615), ('päätösasiakirja', 0.6239416003227234), ('määräys_asetus_päätös', 0.6045205593109131), ('maailmanlaajuinen_yleissopimus', 0.6038869619369507), ('yleissopimus', 0.5991105437278748), ('lisäpöytäkirja', 0.5950707197189331), ('parlamentti_kertomus', 0.5795236229896545), ('perustamissopimus', 0.5793124437332153)]

-----
 polttomoottori
3723 [('polttomoottorikäyttöinen', 0.8475841283798218), ('ottomoottori', 0.8465442657470703), ('moottori_polttoaine', 0.76

3757 [('ravintoaine', 0.79889976978302), ('maitorasva', 0.7743605971336365), ('rasva', 0.7444449663162231), ('eläinrasva', 0.7277538776397705), ('kalaöljy', 0.716598629951477), ('energiaravintoaine', 0.715065598487854), ('hiilihydraatti', 0.7069427967071533), ('ruoka_ravintoarvo', 0.7024979591369629), ('ruokavalio', 0.7004779577255249), ('ravinto', 0.6986101269721985)]

-----
 radioaktiivinen_merkkiaine
3758 [('merkkiaine', 0.8788970112800598), ('menetelmä_käyttää_radioaktiivinen_merkkiaine', 0.8660383224487305), ('radioaktiivinen_aine', 0.8282457590103149), ('radioaktiivinen', 0.7968213558197021), ('radioaktiivinen_alkuaine', 0.766141414642334), ('biokemiallinen_aine', 0.7642505168914795), ('fotokemiallinen_aine', 0.7548335790634155), ('radioaktiivisuus', 0.7500295639038086), ('teratogeeninen_aine', 0.7470318078994751), ('myrkyllinen_aine', 0.7387345433235168)]

-----
 laboratorio
3759 [('tutkimuslaboratorio', 0.8049226403236389), ('laboratoriotutkimus', 0.795515775680542), ('testausl

3776 [('voimakas_happamuus', 0.8996850848197937), ('happamuustaso', 0.8029788732528687), ('happamuusaste', 0.7798337936401367), ('hapan', 0.7586007714271545), ('hapan_laskeuma', 0.7337086796760559), ('happamuudensäätöaine', 0.7255238890647888), ('happosade_hapan_sade', 0.6838260889053345), ('happamoituminen', 0.6793434023857117), ('vesi_suolapitoisuus_kasvu', 0.6736059188842773), ('maaperä_suolaisuus', 0.6613896489143372)]

-----
 aromi_aine
3777 [('aromi', 0.8972583413124084), ('aromaattinen_aine', 0.8784143924713135), ('aine_ominaisuus', 0.8346753120422363), ('ruoka_aine_elintarvike', 0.8324694037437439), ('raaka_aine', 0.8301231861114502), ('aine', 0.8288769721984863), ('myrkyllinen_aine', 0.8229427933692932), ('haihtua_aine', 0.8218340873718262), ('käyttö_raaka_aine', 0.821382999420166), ('orgaaninen_aine', 0.8212331533432007)]

-----
 kaukolaina
3778 [('joukkolaina', 0.6505182981491089), ('lainata', 0.6499860882759094), ('lainaaja', 0.6475389003753662), ('laina', 0.62883061170578)

3811 [('kivihiilivoimala', 0.9758147597312927), ('hiilivoimalaitos', 0.9655611515045166), ('hiilivoimala', 0.935188353061676), ('biovoimalaitos', 0.7870415449142456), ('lämpövoimalaitos', 0.7819160223007202), ('tuulivoimalaitos', 0.7777883410453796), ('vesivoimalaitos', 0.7746812105178833), ('jätevoimala', 0.763218104839325), ('lämpövoimala', 0.7616522908210754), ('ydinvoimalaitos', 0.756742000579834)]

-----
 tuhka_polttaminen_jäte_poltto
3812 [('poltto', 0.8932443857192993), ('liete_poltto', 0.8909580111503601), ('tuhka', 0.8569297790527344), ('jäte_puhdistaminen', 0.8351869583129883), ('kaasu_poisto_jäte', 0.8307656049728394), ('jäte_kaato', 0.8255772590637207), ('energiakäyttö_jäte_energiakäyttö', 0.8242182731628418), ('jäte_käyttö', 0.8152931928634644), ('radioaktiivinen_jäte_käsittely', 0.8150405883789062), ('jäte_vähentäminen', 0.8106969594955444)]

-----
 koe
3813 [('biologinen_koe', 0.8893510699272156), ('verrata_koe', 0.8818259239196777), ('toksikologinen_koe', 0.874991774559

3848 [('kartta', 0.7326716184616089), ('yleiskartta', 0.6708154082298279), ('maailmankartta', 0.6695379614830017), ('peruskartta', 0.6605507731437683), ('pitäjänkartta', 0.6536365747451782), ('karttakirja', 0.6506707668304443), ('merikartta', 0.6355279088020325), ('karttalehti', 0.6187489032745361), ('karttasivu', 0.6161289215087891), ('karttakuva', 0.615156888961792)]

-----
 dokumentointi_asiakirja_aineisto
3849 [('asiakirja', 0.8775386214256287), ('asiakirja_luettelointi', 0.8738750219345093), ('aineisto', 0.8720386624336243), ('asiakirja_tarkastus', 0.8351504802703857), ('hallinnollinen_asiakirja', 0.8289775848388672), ('asiakirja_lainaus', 0.8256935477256775), ('dokumentointi', 0.8243399858474731), ('asiakirja_kaupunkirakentaminen', 0.8067151308059692), ('bibliografinen_tieto_järjestelmä', 0.8015589714050293), ('dokumentti', 0.7903292179107666)]

-----
 jyrsijä
3850 [('pikkujyrsijä', 0.796434223651886), ('tuhoeläin_syöpäläinen', 0.7167012691497803), ('tuhoeläin', 0.706245124340057

3885 [('vanadium', 0.916133463382721), ('vanadiini', 0.8730709552764893), ('indium', 0.6691541075706482), ('rodium', 0.6604540944099426), ('kloridi', 0.6433558464050293), ('boori', 0.6356289386749268), ('oksidi', 0.6327003240585327), ('hydroksidi', 0.6318219304084778), ('zirkonium', 0.6298162341117859), ('rubidium', 0.6239792108535767)]

-----
 ääni
3886 [('ääni_eteneminen_ääni_etenemisliike', 0.9107327461242676), ('ääni_mittaus', 0.8715218305587769), ('lineaarinen_ääni_lähde', 0.8281694650650024), ('ääni_taso_äänitaso', 0.8069808483123779), ('ääni_eristys_ääneneristys', 0.7778453826904297), ('ääni_immissio', 0.7185906767845154), ('äänes', 0.7077621221542358), ('puheääni', 0.701246976852417), ('äänenpaino', 0.7003940343856812), ('taustaääni', 0.6925987005233765)]

-----
 ajoverkkokalastus
3887 [('verkkokalastus', 0.8109391927719116), ('rannikkokalastus', 0.7220107316970825), ('merikalastus', 0.668286919593811), ('heittokalastus', 0.6608712673187256), ('ammattikalastus', 0.6309170722961

3923 [('värjätä', 0.9117774963378906), ('väriaine', 0.8856094479560852), ('värjäytyä', 0.8178399801254272), ('värjääminen', 0.8082401752471924), ('värjäys', 0.7948321104049683), ('värjätty', 0.7930076122283936), ('värjäillä', 0.780680775642395), ('värjäytyminen', 0.7346134781837463), ('värijauhe', 0.7298176288604736), ('väriliemi', 0.7201624512672424)]

-----
 vaikeasti_käsitellä_jäte
3924 [('radioaktiivinen_jäte_käsittely', 0.8341324329376221), ('vaarallinen_jäte', 0.8282333612442017), ('kemiallinen_jäte_käsittely', 0.8257226943969727), ('kierrätys_hallinta_jäte_koskea_laki', 0.8173662424087524), ('jäte_käsittely_jätehuolto', 0.816423773765564), ('jäte_käyttö', 0.8116244077682495), ('kauppa_aiheuttaa_jäte', 0.8101242780685425), ('kiinteä_jäte_kiinteä_jäte', 0.8055945634841919), ('jäte_tila', 0.8047276735305786), ('vaarallinen_jäte_ennakkoilmoitus', 0.8038238883018494)]

-----
 liukenematon_aine
3925 [('aine', 0.9059489369392395), ('orgaaninen_aine', 0.8934032320976257), ('epäorgaanine

3957 [('alkoholimyrkytys', 0.7777144312858582), ('myrkytystila', 0.7632474303245544), ('myrkytysoire', 0.7557476758956909), ('myrkky', 0.7474159002304077), ('verenmyrkytys', 0.7317671179771423), ('ruokamyrkytys', 0.7294987440109253), ('myrkky_toksiini', 0.7278251051902771), ('häkämyrkytys', 0.7266161441802979), ('myrkytön_tekeminen_myrkky_poisto', 0.6908828020095825), ('myrkyttäminen', 0.6855747699737549)]

-----
 maali
3958 [('maalipaikka', 0.8369124531745911), ('maaliton', 0.8179444074630737), ('pintamaali', 0.7756946682929993), ('maalinteko', 0.767956554889679), ('voittomaali', 0.7527443766593933), ('maalintekijä', 0.7498575448989868), ('tasoitusmaali', 0.7491469383239746), ('maalista', 0.7471778392791748), ('maalimäärä', 0.7455576658248901), ('maalintekopaikka', 0.738507091999054)]

-----
 polyvinyylikloridi
3959 [('alumiinikloridi', 0.7368096113204956), ('kloridi', 0.6815435886383057), ('polystyreeni', 0.6576566696166992), ('polykloorata_bifenyyli', 0.6428752541542053), ('halogeno

3993 [('ruskohiili', 0.8996655941009521), ('ligniitti', 0.8602740168571472), ('ruskohiili_louhinta', 0.8215038776397705), ('kivihiili_puuhiili', 0.7486587762832642), ('kalsiitti', 0.7007523775100708), ('ligniini', 0.6907781362533569), ('orgaaninen_hiili', 0.6890150308609009), ('puuhiili', 0.6873337030410767), ('kivihiili', 0.684363842010498), ('metallinen_mineraali', 0.6806468963623047)]

-----
 mutaatio_muutos
3994 [('mutaatio', 0.8700137734413147), ('geneettinen_muutos', 0.8507171869277954), ('muutos', 0.7972858548164368), ('demografinen_muutos_väestöllinen_muutos', 0.7617449760437012), ('fysikaalinen_muutos', 0.7595329284667969), ('mutaatio_läpikäydä_mikro_organismi_päästö', 0.7594041228294373), ('perinnöllinen_vaikutus_geneettinen_vaikutus', 0.7242659330368042), ('lämpötila_muutos', 0.7104361057281494), ('ilmasto_muutos', 0.7031723856925964), ('arvo_muutos', 0.6940572261810303)]

-----
 kaskiviljely
3995 [('kaskiviljelys', 0.8271695971488953), ('pelto_viljely', 0.7166955471038818),

4029 [('kaasu_bensiinimoottori', 0.8238484859466553), ('dieselmoottori', 0.8186471462249756), ('moottori_polttoaine', 0.8046373128890991), ('moottori', 0.792839527130127), ('diesel', 0.7723482847213745), ('turbodiesel', 0.7487282752990723), ('moottoribensiini', 0.7443292140960693), ('bensiini', 0.7402280569076538), ('polttomoottori', 0.7318047285079956), ('bensiinikäyttöinen', 0.7160505652427673)]

-----
 mikro_organismi_mikrobi
4030 [('mikrobi', 0.8667792081832886), ('vesi_elää_mikro_organismi', 0.8601946234703064), ('mutaatio_läpikäydä_mikro_organismi_päästö', 0.8361945152282715), ('bakteeri', 0.814603328704834), ('mikro', 0.7808288931846619), ('bakteeri_tappava_aine', 0.7756349444389343), ('itu_itiö_alkio_mikrobi', 0.7712162733078003), ('organismi', 0.765599250793457), ('tauti_aiheuttaa_mikrobi', 0.7605081796646118), ('maaperä_organismi', 0.7593469619750977)]

-----
 hitsaus
4031 [('hitsaustekniikka', 0.8037322163581848), ('hitsauslaite', 0.7732426524162292), ('hitsauskone', 0.74047

4062 [('antikoagulantti', 0.6155892610549927), ('duraatio', 0.5523956418037415), ('liuotus_liukeneminen', 0.5465594530105591), ('nesteytyminen', 0.5431517362594604), ('nitrifikaatio', 0.5421972274780273), ('hybridisointi_hybridisaatio', 0.5377340912818909), ('nitraus', 0.535676121711731), ('laatio', 0.5349290370941162), ('biokemiallinen_hapentarve', 0.5341872572898865), ('evapotranspiraatio', 0.5310691595077515)]

-----
 dioksiini
4063 [('toksiini', 0.8206523656845093), ('myrkky_toksiini', 0.7793036699295044), ('furaani', 0.6853538155555725), ('ympäristömyrkky', 0.6719863414764404), ('kemiallinen_saastuttaja', 0.63810133934021), ('orgaaninen_happiyhdiste', 0.6380630731582642), ('orgaaninen_tinayhdiste', 0.6364964246749878), ('kemiallinen_kemikaali', 0.6292809247970581), ('kemiallinen_saaste', 0.6290282011032104), ('orgaaninen_klooriyhdiste', 0.6285209655761719)]

-----
 liottaminen
4064 [('liotus', 0.8344161510467529), ('liottaa', 0.7579021453857422), ('keittäminen', 0.7354836463928223

4097 [('kaasukromatografia', 0.8791556358337402), ('kromatografinen', 0.8683199882507324), ('kromatografinen_analyysi', 0.7636637091636658), ('kromaus', 0.6081676483154297), ('reagenssi', 0.5843507051467896), ('kromata', 0.582422137260437), ('kromaattinen', 0.5724639296531677), ('spektroskopia', 0.5695892572402954), ('etsaus_syövytys', 0.5695027112960815), ('katalysaattori_katalyyttinen_jälkipoltin', 0.5628541707992554)]

-----
 tritium
4098 [('litium', 0.7667460441589355), ('yttrium', 0.6303215622901917), ('rubidium', 0.625652551651001), ('deuterium', 0.6188334226608276), ('hafnium', 0.6181397438049316), ('strontium', 0.6155534982681274), ('jodi', 0.6094515323638916), ('amerikium', 0.6021549701690674), ('cesium', 0.6007756590843201), ('isotooppi', 0.6003397107124329)]

-----
 sulkeminen
4099 [('yritys_sulkeminen', 0.8314146995544434), ('avaaminen', 0.753246009349823), ('sulkeutuminen', 0.7297734618186951), ('sulkea', 0.7070106267929077), ('sulkemisaika', 0.7018585205078125), ('sulkemi

4133 [('liima_liima_aine', 0.9548134803771973), ('liimaus', 0.8664723634719849), ('liimata', 0.8113918304443359), ('teippi', 0.785780131816864), ('liimaaminen', 0.7678971290588379), ('kuumaliima', 0.7591705322265625), ('liimapinta', 0.7438698410987854), ('pikaliima', 0.7313367128372192), ('pahvi', 0.7170795202255249), ('kontaktimuovi', 0.7070295810699463)]

-----
 ääni_immissio
4134 [('immissio', 0.8256493806838989), ('ääni_mittaus', 0.7210209369659424), ('lineaarinen_ääni_lähde', 0.7193504571914673), ('ääni', 0.7185906767845154), ('ääni_eteneminen_ääni_etenemisliike', 0.7179461121559143), ('ääni_taso_äänitaso', 0.677312970161438), ('ääni_eristys_ääneneristys', 0.6307592988014221), ('melu_koskea_lainsäädäntö', 0.6200184226036072), ('kaupallinen_toiminta_aiheuttaa_melu', 0.6075440645217896), ('vesi_laatu_koskea_direktiivi', 0.5958467721939087)]

-----
 tieteellinen_nimistö_sanaluettelo
4135 [('nimistö', 0.8539217710494995), ('sanaluettelo', 0.7759233713150024), ('morfologia_muoto_oppia'

4168 [('kyllästys', 0.7128356695175171), ('tiivistysaine', 0.6847926378250122), ('eristysaine', 0.6692270636558533), ('kyllästää', 0.590415894985199), ('eriste_eristysaine', 0.5863422155380249), ('kyllästyä', 0.5847681760787964), ('saumausaine', 0.5799297094345093), ('öljy_pohjautua_kemikaali_petrokemikaali', 0.5696160197257996), ('liima_liima_aine', 0.5643988847732544), ('öljy_sitoa_aine', 0.5492050051689148)]

-----
 hopea
4169 [('pronssi', 0.8100276589393616), ('kulta', 0.7622130513191223), ('kullata', 0.7390190958976746), ('hopeinen', 0.7270691394805908), ('hopeakoru', 0.7175077199935913), ('pronssinen', 0.7087004780769348), ('hopeamitali', 0.6987065076828003), ('hopeasija', 0.6948503255844116), ('hopeanvärinen', 0.6890437602996826), ('kultaus', 0.6800471544265747)]

-----
 röntgensäde
4170 [('röntgensäteily', 0.8987619876861572), ('röntgen', 0.6622766256332397), ('röntgenlaite', 0.6294038891792297), ('röntgenkuva', 0.6211780309677124), ('röntgenkuvaus', 0.6109166145324707), ('valo

4204 [('marmorinen', 0.8644134998321533), ('marmoriveistos', 0.764487624168396), ('graniitti', 0.6516500115394592), ('seinälaatta', 0.6416502594947815), ('marmorointi', 0.629777729511261), ('luonnonkivi', 0.6249971389770508), ('emali', 0.6184226274490356), ('marmoripalatsi', 0.6183801889419556), ('kaakeli', 0.6176099181175232), ('puulattia', 0.6149439215660095)]

-----
 tukahduttaminen
4205 [('kukistaminen', 0.7378562688827515), ('syrjäyttäminen', 0.7174267768859863), ('taltuttaminen', 0.710928201675415), ('kieltäminen', 0.7103036642074585), ('lieventäminen', 0.7072999477386475), ('nujertaminen', 0.7067687511444092), ('hajottaminen', 0.6998022794723511), ('tukahduttaa', 0.6988836526870728), ('tukahtua', 0.6947134137153625), ('lietsominen', 0.6927090883255005)]

-----
 salamanteri
4206 [('salamandra', 0.6490488052368164), ('merisiili', 0.5492168664932251), ('tulus', 0.5334566831588745), ('salamana', 0.5213571190834045), ('salama', 0.5139874219894409), ('sakaali', 0.5113890171051025), ('

4240 [('geofysiikka', 0.7610491514205933), ('astrofysiikka', 0.747079610824585), ('avaruusfysiikka', 0.73600172996521), ('säteilyfysiikka', 0.726132869720459), ('fysiikka', 0.714959442615509), ('biokemia', 0.7067849040031433), ('materiaalifysiikka', 0.6990581750869751), ('fysikaalinen_kemia', 0.6903839111328125), ('kemia_tekniikka', 0.6733250617980957), ('analyyttinen_kemia', 0.6729763746261597)]

-----
 karsiminen_leikkaaminen
4241 [('karsiminen', 0.9387478232383728), ('leikkaaminen', 0.8774532675743103), ('supistaminen', 0.7330151796340942), ('puolittaminen', 0.7187355756759644), ('kasvattaminen', 0.7161042094230652), ('poistaminen', 0.7092624306678772), ('pienentäminen', 0.7079436779022217), ('lyhentäminen', 0.7007522583007812), ('kertaistaminen', 0.700585126876831), ('keventäminen', 0.6940604448318481)]

-----
 maaperä_koskea_tieto
4242 [('ympäristö_koskea_tieto', 0.9348088502883911), ('lainsäädäntö_koskea_tieto', 0.9035685658454895), ('talous_koskea_tieto', 0.8940106630325317), ('

4276 [('valtio_t_julkinen_talous_finanssioppi', 0.9345124959945679), ('biotooppi_t_elinalue_menetys', 0.9324686527252197), ('typpi_t_nitraatti_poistaminen_t_poistuminen', 0.9305983185768127), ('tilasto_t_tilastotiede', 0.9272538423538208), ('jäte_uudelleenkäyttö_t_hyödyntäminen', 0.9236785769462585), ('maanlaajuinen_t_maa_välinen_verkko', 0.923369288444519), ('ääni_läpäisy_t_eteneminen', 0.9208229184150696), ('jnk_ansio_t_syy_lukeminen', 0.9192941188812256), ('pato_t_penger_vahvistus', 0.9175570607185364), ('t', 0.9007017612457275)]

-----
 haju_tuoksu
4277 [('haju', 0.9382827281951904), ('tuoksu', 0.908356785774231), ('tuoksua', 0.7864419221878052), ('hajuinen', 0.7840688228607178), ('hajuste', 0.7752837538719177), ('tuoksuinen', 0.7723191976547241), ('aromi_aine', 0.7406710982322693), ('hajuvesi', 0.7372376322746277), ('aromi', 0.7186739444732666), ('hajuton', 0.7185598611831665)]

-----
 tilasto_t_tilastotiede
4278 [('t', 0.9756133556365967), ('typpi_t_nitraatti_poistaminen_t_poistu

4310 [('ruudukko', 0.6409047842025757), ('tikkaus', 0.6209901571273804), ('ruutu', 0.6100577712059021), ('paikallispuudutus', 0.6087896823883057), ('päällyste_peite_kuori', 0.6042335629463196), ('puudutus', 0.6040548086166382), ('lasitus', 0.581290066242218), ('piirtoalue', 0.5776546597480774), ('reuna', 0.5705322027206421), ('lasite', 0.5694445371627808)]

-----
 ilmastonmuutto_sopeutuminen
4311 [('sopeutuminen', 0.8808295726776123), ('ilmastonmuutto', 0.8685775995254517), ('ekologinen_sopeutuminen', 0.8265358209609985), ('ilmastonmuutos', 0.804741621017456), ('ilmastonmuutos_vaikutus', 0.7916535139083862), ('ilmasto_muutos', 0.7639602422714233), ('talous_vaikutus_ympäristö', 0.7159774899482727), ('ihminen_aiheuttaa_ilmastonmuutos', 0.7105292081832886), ('globaali_lämpeneminen', 0.7006568908691406), ('maatalous_vaikutus_ympäristö', 0.6961495876312256)]

-----
 Maanpäällinen_biomassa
4312 [('maanalainen_biomassa', 0.8224117755889893), ('biomassa', 0.7965728640556335), ('Maanpäällinen',

4328 [('kotitalousjäte_kaatopaikka', 0.8201491832733154), ('jäte_kaatopaikka', 0.8115702271461487), ('teollisuusjäte', 0.8047448396682739), ('jäte', 0.7923968434333801), ('jäte_jäte', 0.7923968434333801), ('pakkausjäte', 0.7906913757324219), ('puutarhajäte', 0.7889371514320374), ('radioaktiivinen_jäte_kaatopaikka', 0.7864294052124023), ('puujäte', 0.7782248854637146), ('jäte_varastointi', 0.7763665318489075)]

-----
 viljelymaa_hoito
4329 [('maatila_hoito', 0.8854719400405884), ('rannikkoalue_hoito', 0.8645544052124023), ('ympäristö_hoito', 0.862350583076477), ('hoito', 0.8555054068565369), ('matkailutoiminta_hoito', 0.8291495442390442), ('hoito_terapia', 0.7989891767501831), ('metsä_kestävä_hoito_käyttö', 0.7915695309638977), ('viljelymaa', 0.7548471093177795), ('kasvi_terveydenhoito', 0.7533668279647827), ('hoito_hallinto_johtaminen_käsittely', 0.7326446771621704)]

-----
 kehityspolitiikka
4330 [('kehityspoliittinen', 0.8529765009880066), ('yrityspolitiikka', 0.7883507013320923), ('

4347 [('hiilijalanjälki', 0.6608065366744995), ('ekologinen_jalanjälki', 0.6449418067932129), ('jalanjälki', 0.6386212110519409), ('tuote_ympäristöjalanjälki_koskea_menetelmä', 0.6271490454673767), ('vesijalanjälki', 0.6204902529716492), ('organisaatio_ympäristöjalanjälki_koskea_menetelmä', 0.6099876761436462), ('ympäristöarvo', 0.5815840363502502), ('ympäristöhyöty', 0.5782803297042847), ('ympäristövaikutus', 0.5689496397972107), ('ympäristö', 0.5689140558242798)]

-----
 ympäristöhallinto
4348 [('ympäristökeskus', 0.7439578175544739), ('kunnallinen_ympäristöpolitiikka', 0.696919322013855), ('ympäristösuojelu', 0.6949918270111084), ('ympäristönsuojelu', 0.6821967363357544), ('ympäristöala_toimintaohjelma', 0.6800349950790405), ('ympäristövalvonta', 0.6721166372299194), ('vesiensuojelu', 0.6656008958816528), ('ympäristötoimi', 0.6649802327156067), ('ympäristöpalvelu', 0.663644552230835), ('ympäristöala', 0.6615504026412964)]

-----
 ympäristölainsäädäntö
4349 [('ympäristölainsäädäntö_t

4366 [('kevyt_polttoöljy', 0.9548677206039429), ('polttoöljy', 0.8933091163635254), ('raskas', 0.8195857405662537), ('raskas_tavara_kuljetus', 0.7611038684844971), ('polttoaine', 0.7481882572174072), ('kevyt_neste_erottaa', 0.7411075830459595), ('polttoaine_kulutus', 0.7105734944343567), ('polttoaine_koostumus', 0.7092623710632324), ('kevyt', 0.7088244557380676), ('hiili_muuttaminen_kaasu_hiili_kaasuttaminen', 0.707430899143219)]

-----
 lakijäätikkö
4367 [('jäätikkö', 0.6510297060012817), ('jäätikköjoki', 0.6219680905342102), ('jäätikkö_massatase', 0.5701513290405273), ('mannerjäätikkö', 0.5620290040969849), ('tasankoalue', 0.5447975397109985), ('litosfääri_kivikehä', 0.5444073677062988), ('skandi', 0.5212607383728027), ('kilpitulivuori', 0.5123791098594666), ('vuorijono', 0.5109609365463257), ('kraatteri', 0.5108669996261597)]

-----
 jää_häviäminen
4368 [('jää', 0.8472375869750977), ('häviäminen', 0.7739526033401489), ('vesi_vaarantaminen', 0.706885576248169), ('maa_sijaita_lähde_ai

4384 [('tuottajuus', 0.8442947864532471), ('käyttäjä', 0.7301133871078491), ('käyttäjä_etu', 0.6293768882751465), ('ihminen_toiminta', 0.6261741518974304), ('käyttäjähallinta', 0.6254127025604248), ('tuottaja', 0.6249582767486572), ('käyttö(', 0.622949481010437), ('tuottaja_vastuu', 0.6197419762611389), ('yhteiskunnallinen_prosessi', 0.6175514459609985), ('internet_palvelu_tarjoaja', 0.6124067306518555)]

-----
 uusiutuva_energialähde_koskea_direktiivi
4385 [('uusiutuva_luonnonvara', 0.8344025015830994), ('uusiutua_energianlähde', 0.8248893022537231), ('vesi_laatu_koskea_direktiivi', 0.823694109916687), ('maatalous_koskea_ympäristölainsäädäntö', 0.8178622722625732), ('päästö_koskea_lainsäädäntö', 0.8172499537467957), ('uusiutuva', 0.8169450163841248), ('uusiutua', 0.8119989633560181), ('geeniteknologia_koskea_lainsäädäntö', 0.8006447553634644), ('direktiivi_saattaminen_osa_kansallinen_lainsäädäntö', 0.7990390658378601), ('vesivara_koskea_lainsäädäntö', 0.7988169193267822)]

-----
 vesi

4403 [('maatalous_koskea_ympäristölainsäädäntö', 0.8272231221199036), ('maatalous', 0.8140537738800049), ('terveys_liittyä_biotekniikka', 0.8118231296539307), ('maatalous_vaikutus_ympäristö', 0.8103899955749512), ('maatalous_rakenne', 0.8062611818313599), ('maatalous_saada_elintarvike', 0.8036503195762634), ('maatalous_suunnittelu', 0.7956839203834534), ('ympäristö_liittyä_sairaus', 0.7949222326278687), ('ympäristö_liittyä_vastuu', 0.7802509069442749), ('teollisuus_vaikutus_ympäristö', 0.771837592124939)]

-----
 ekologinen_kehitys
4404 [('ekologinen', 0.8843197822570801), ('biologinen_kehitys', 0.8831534385681152), ('ekologinen_sopeutuminen', 0.881516695022583), ('ekologinen_kokonaisuus_tutkimus', 0.880134642124176), ('ympäristö_kehitys', 0.879776656627655), ('taloudellinen_kehitys', 0.8675627112388611), ('ekologinen_sivilisaatio', 0.8634112477302551), ('ekologinen_tasapaino', 0.8561384677886963), ('ekologinen_jalanjälki', 0.8552703857421875), ('ekologinen_yhteisö', 0.8545111417770386