# Topic Selection and Postprocessing

In [1]:
%matplotlib inline
import pickle
from os import listdir, makedirs
from os.path import join, isfile, exists, dirname
import gc
import re
import math

import matplotlib.pyplot as plt
import matplotlib.mlab as mlab
import seaborn as sns
%pylab inline
import numpy as np
import pandas as pd
from gensim.corpora import Dictionary, MmCorpus
from gensim.models import TfidfModel, LdaModel
from gensim.models import Word2Vec, Doc2Vec, FastText
from gensim.corpora import Dictionary
from gensim.models import CoherenceModel
from tqdm._tqdm_notebook import tqdm_notebook

from constants import *
from utils import load, init_logging, tprint, TopicsLoader
from topic_reranking import Reranker

#from eval_lda import eval_coherence

tqdm_notebook.pandas()

Populating the interactive namespace from numpy and matplotlib


In [2]:
pd.options.display.max_columns = 80
pd.options.display.max_rows = 2000
pd.options.display.precision = 3

-----

## Joining Topics / Labels / Scores

In [3]:
phra = load('phrases', 'lemmap')
wikt = load('wikt', 'lemmap')

fLoading {file}


In [4]:
args = ['e42', 100]
metrics = ['c_npmi_wikt', 'pairwise_similarity_ftx']

In [39]:
def combine(dataset, min_regular_terms=6, min_cnpmi=0, min_pairsim=0.3):
    topics = load(dataset, 'topics', *args)
    labels_w2v = load(dataset, 'labels', *args, 'w2v', 'minimal').rename(columns=lambda x: x + '_w2v').reset_index(level='label_method', drop=True)
    labels_ftx = load(dataset, 'labels', *args, 'ftx', 'minimal').rename(columns=lambda x: x + '_ftx').reset_index(level='label_method', drop=True)
    scores = load(dataset, 'scores', *args, 'ftx', 'minimal')[metrics]

    scores['rank_cnpmi'] = scores.c_npmi_wikt.rank()
    scores['rank_pairsim'] = scores.pairwise_similarity_ftx.rank()
    scores['rank_mean'] = (scores.rank_cnpmi + scores.rank_pairsim) / 2
    col_mean = scores[metrics].mean()
    col_stdv = scores[metrics].std()
    print(col_mean)
    scores_norm = (scores[metrics] - col_mean) / col_stdv
    scores_norm = scores_norm.rename(columns=lambda x: x + '_norm')
    scores_norm['avg'] = scores_norm.mean(axis=1)
    scores = scores.join(scores_norm)
    scores['avg_rank'] = scores.avg.rank()
    print('average difference per topic between the mean of the individual ranks and the rank of the normalized mean:', (scores.rank_mean - scores.avg_rank).abs().sum() / len(scores))
    # an advantage of ranking by taking the normalized mean: minimal chance of equal ranks -> disadvantage: metric is not comparable to other datasets anymore -> use metrics as a filter

    df = pd.concat([topics, labels_w2v, labels_ftx, scores], axis=1)
    df['count_regular_terms'] = df.loc[:, 'term0':'term9'].applymap(lambda x: x in wikt.index).sum(axis=1)
    df = df.query('count_regular_terms >= @min_regular_terms and c_npmi_wikt >= @min_cnpmi and pairwise_similarity_ftx >= @min_pairsim')
    print(len(df))
    df = df.sort_values('avg_rank', ascending=False)
    return df

In [44]:
combine('dewac', min_regular_terms=7, min_cnpmi=0.05, min_pairsim=0.3)

Reading ../data/preprocessed/LDAmodel/noun/bow/topics/dewac_noun_bow_topic-candidates.csv
File b'../data/preprocessed/LDAmodel/noun/bow/topics/dewac_noun_bow_topic-candidates.csv' does not exist
Loading topics via TopicsLoader
Loading dictionary from ../data/preprocessed/LDAmodel/noun/bow/dewac_noun_bow.dict
Loading model from ../data/preprocessed/LDAmodel/noun/bow/e42/dewac_LDAmodel_e42_100_ep30
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/dewac_noun_bow_label-candidates.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/dewac_noun_bow_label-candidates_ftx.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/dewac_noun_bow_topic-scores.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/dewac_noun_bow_topic-scores_germanet.csv
c_npmi_wikt                0.123
pairwise_similarity_ftx    0.457
dtype: float64
average difference per topic between the mean of the individual ranks and the rank of the normalized mean: 2.12
72


Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,term0,term1,term2,term3,term4,term5,term6,term7,term8,term9,label0_w2v,label1_w2v,label2_w2v,label3_w2v,label4_w2v,label5_w2v,label6_w2v,label7_w2v,label8_w2v,label9_w2v,label10_w2v,label11_w2v,label12_w2v,label13_w2v,label14_w2v,label15_w2v,label16_w2v,label17_w2v,label18_w2v,label19_w2v,label0_ftx,label1_ftx,label2_ftx,label3_ftx,label4_ftx,label5_ftx,label6_ftx,label7_ftx,label8_ftx,label9_ftx,label10_ftx,label11_ftx,label12_ftx,label13_ftx,label14_ftx,label15_ftx,label16_ftx,label17_ftx,label18_ftx,label19_ftx,c_npmi_wikt,pairwise_similarity_ftx,rank_cnpmi,rank_pairsim,rank_mean,c_npmi_wikt_norm,pairwise_similarity_ftx_norm,avg,avg_rank,count_regular_terms
dataset,param_id,nb_topics,topic_idx,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1,Unnamed: 51_level_1,Unnamed: 52_level_1,Unnamed: 53_level_1,Unnamed: 54_level_1,Unnamed: 55_level_1,Unnamed: 56_level_1,Unnamed: 57_level_1,Unnamed: 58_level_1,Unnamed: 59_level_1,Unnamed: 60_level_1,Unnamed: 61_level_1,Unnamed: 62_level_1,Unnamed: 63_level_1
dewac,e42,100,36,Montag,Freitag,Donnerstag,Mittwoch,Dienstag,Tag,Monat,Sonntag,Woche,Samstag,Donnerstag,Dienstag,Freitag,Samstag,Wochenende,Mittwoch,Sonntag,Sonntagabend,Feiertag,Vormittag,Werktag,Tulpensonntag,Wochentag,Woche,heute_mittag,gut_Morgen_Österreich,Nachmittag,Adventssonntag,Hallo_Niedersachse,Termin,Donnerstag,Dienstag,Freitag,Sonntagabend,Wochenende,Mittwoch,Samstag,Sonntag,Feiertag,Tulpensonntag,Vormittag,Werktag,Wochentag,heute_mittag,Termin,Woche,Adventssonntag,Nachmittag,weiß_Sonntag,Ostersonntag,0.319,0.683,100.0,98.0,99.0,2.557,2.458,2.508,99.0,10
dewac,e42,100,62,Arbeitnehmer,Arbeitgeber,Beschäftigte,Betrieb,Gewerkschaft,Kündigung,Arbeitszeit,Betriebsrat,Arbeitsverhältnis,Arbeitsplatz,Beschäftigte,Belegschaft,Arbeitnehmer,Arbeitsverhältnis,Tarifvertrag,Arbeitskampf,Beschäftigungsverhältnis,Arbeitgeber,Betriebsrat,Massenentlassung,Arbeitsrecht,Arbeitsvertrag,Tarifvertragspartei,Freizeitausgleich,Tarifbindung,Kündigungsschutz,Tarifverhandlung,Gesamtbetriebsrat,Arbeitnehmervertretung,Firmentarifvertrag,Beschäftigte,Belegschaft,Arbeitnehmer,Beschäftigungssicherung,Beschäftigungsverhältnis,Tarifvertragspartei,Arbeitsverhältnis,Arbeitnehmervertretung,Massenentlassung,Beschäftigungspflicht,Beendigung_der_Arbeitsverhältnis,Firmentarifvertrag,betriebsbedingt_Kündigung,Kündigungsschutz,Gesamtarbeitsvertrag,Gesamtsozialversicherungsbeitrag,Rentenversicherung_der_Arbeiter,Vereinigung_der_kommunal_Arbeitgeberverband,Tarifvertrag,Tarifverhandlung,0.285,0.579,99.0,94.0,96.5,2.117,1.329,1.723,98.0,9
dewac,e42,100,56,Studierender,Studium,Student,Semester,Studiengang,Seminar,Hochschule,Vorlesung,Kurs,Fach,Studiengang,Studienfach,Studium,Universität,Gasthörer,Hochschule,Semester,estnisch_Philologie,pädagogisch_Hochschule,Dozent,Master_of_Divinity,Fachbereich,Vorkurs,Fernstudium,Hochschulreif,Regelstudienzeit,Studium_general,Fachhochschulreif,integriert_Studiengang,Bachelor,Studienfach,Studiengang,integriert_Studiengang,Universität,Vorstudienlehrgang,Studium,Universitätslehrgang,Bildungswissenschaft,Hochschule,Studienkolleg,Postgraduale_Studium,Studienordnung,Semester,Bachelor_of_Theology,Gasthörer,Vertiefungsfach,pädagogisch_Hochschule,Fachbereich,theologisch_Hochschule_Friedensau,medizinisch_Universität,0.246,0.602,93.0,95.0,94.0,1.6,1.574,1.587,97.0,9
dewac,e42,100,78,Arzt,Patient,Krankenhaus,Behandlung,Therapie,Klinik,Krankheit,Dr.,Medizin,Medikament,Therapie,Neuroonkologie,inner_Medizin,Patient,klinisch_Pharmakologie,Psychiatrie,Rheumatologie,Infektiologie,Erhaltungstherapie,Physikalisch_und_Rehabilitative_Medizin,Psychiater,Chefarzt,Facharzt,Hausarzt,konservativ_Therapie,Viszeralchirurgie,Herzchirurgie,systemisch_Erkrankung,psychosomatisch_Klinik,ärztlich_Behandlung,Erhaltungstherapie,psychosomatisch_Klinik,Neuroonkologie,symptomatisch_Therapie,klinisch_Pharmakologie,physikalisch_Therapie,Physikalisch_und_Rehabilitative_Medizin,Infektiologie,Therapie,Rheumatologie,Kombinationstherapie,inner_Medizin,Kinderurologie,systemisch_Erkrankung,konservativ_Therapie,Behandlungserfolg,Neuropsychiatrie,Viszeralchirurgie,medizinisch_Physik,Patient,0.246,0.559,95.0,91.0,93.0,1.603,1.114,1.358,96.0,9
dewac,e42,100,26,Schule,Schüler,Lehrer,Unterricht,Schülerin,Klasse,Bildung,Lernen,Lehrerin,Grundschule,Schule,Sekundarstufe_I,erweitern_Realschule,Jahrgangsstufe,Vorkurs,Elementarschule,Schulklasse,Gymnasium,Schüler,Realschule,Regelschule,Hauptschule,Vorschule,Mittelschule,Oberschule,Klassenlehrer,Seminar_für_gelehrt_Schule,Realgymnasium,Schulunterricht,hoch_Mädchenschule,Schule,Elementarschule,naturwissenschaftlich_Unterricht,erweitern_Realschule,Vorschule,Berufsgrundschuljahr,Sekundarstufe_I,Regelschule,Realschule,Oberschule,Klassenlehrer,Halbtagsschule,Mittelschule,Vorkurs,Kunsterziehung,Hauptschule,Schulklasse,integriert_Sekundarschule,Jahrgangsstufe,Oberstufenschule,0.221,0.559,91.0,90.0,90.5,1.277,1.111,1.194,92.0,10
dewac,e42,100,85,Dr.,Prof.,Universität,Institut,Forschung,Professor,Hochschule,Wissenschaft,Wissenschaftler,Fakultät,medizinisch_Fakultät,Professor,Prorektor,Forschung_und_Lehre,technisch_Universität,Lehrstuhl,Universität,Universität_Innsbruck,westfälisch_Wilhelms-Universität,Hochschule,Dozent,Akademie_der_Wissenschaft,Forschungseinrichtung,Eberhard_Karl_Universität_Tübingen,technisch_Hochschule,Sozialwissenschaft,Universität_Kopenhag,Fachbereich,Humboldt-Universität_zu_Berlin,Honorarprofessor,medizinisch_Universität,Universität_Maribor,technisch_Universität_Breslau,Bildungswissenschaft,staatlich_Universität_Baku,medizinisch_Fakultät,Wissenschaftskolleg,katholisch_Universität_Lyon,wirtschaftswissenschaftlich_Institut,technisch_Universität,schwedisch_Universität_für_Agrarwissenschaft,litauisch_Akademie_der_Wissenschaft,Technisch-Naturwissenschaftliche_Universität_N...,Universität_Metz,wissenschaftlich_Sekretär,pädagogisch_Hochschule_Berlin,technisch_Universität_Magdeburg,technisch_Universität_Eindhoven,Gesundheitswissenschaft,Professor,0.197,0.576,86.0,93.0,89.5,0.9614,1.29,1.126,91.0,8
dewac,e42,100,39,Frau,Mann,Vater,Mutter,Familie,Mädchen,Tochter,Sohn,Leben,Ehe,Stiefvater,Stiefmutter,Schwester,Hedwig,Cäcilie,Witwer,Vater,Elter,Mutter,Kind,Der_Vater,Frau,Anna,Kretheu,Enkel,Großeltern,Die_Mutter,Elisabeth,Adelheid,Sophie,Stiefvater,Witwer,Stiefmutter,Schwester,Hedwig,Der_Vater,Elter,Vater,Mutter,Kind,Anna,Geschwister,Die_Mutter,Juliane,Stiefbruder,Großeltern,nach_der_Hochzeit,Frau,Nachkomme,Enkel,0.171,0.604,79.0,96.0,87.5,0.6226,1.599,1.111,90.0,10
dewac,e42,100,53,Salz,Minute,Ei,Gemüse,Zucker,Milch,Wasser,Fleisch,Butter,Rezept,Brühe,Bratensatz,Kräuterbutter,Würzmischung,Paniermehl,Sirup,Eigelb,Backware,Röstzwiebel,Crème_fraîche,Käse,Reismehl,Sahnecreme,Zuckersirup,Brät,Teig,Sahne,Blanchieren,Joghurt,Mehlschwitz,Paniermehl,Salzkartoffel,Trockenfleisch,Kräuterbutter,Bratensatz,Würzmischung,Brühe,Röstzwiebel,Zuckersirup,Buttermilch,Reismehl,Milcherzeugnis,Vanillesauce,Eigelb,Backware,Sirup,Fruchtzubereitung,Bratensauce,Süßungsmittel,Tomatenmark,0.245,0.501,92.0,74.0,83.0,1.595,0.477,1.036,88.0,10
dewac,e42,100,4,Musik,Band,Konzert,CD,Stück,Lied,Bühne,Song,Publikum,Musiker,Duett,Begleitband,Rockband,Soundtrack,Lied,Tracks,Musik_sein,Singer-Songwriter,Live-Album,Bonustrack,B-Seite,Buried_Alive,live,Auftritt,Doppelalbum,Aufführung,Coverversion,klassisch_Musik,Akustikversion,Konzert,Begleitband,Duett,Rockband,Spielemusikkonzert,deutsch_Schallplattenpreis,Soundtrack,Kaizer_Orchestra,Coverband,Musik_sein,Singer-Songwriter,Buried_Alive,Candid_Record,Lied,Akustikversion,Live-Album,Tracks,The_Entertainer,Antony_and_the_Johnson,klassisch_Musik,B-Seite,0.202,0.552,89.0,88.0,88.5,1.027,1.028,1.028,87.0,9
dewac,e42,100,47,Tier,Hund,Pferd,Katze,Wolf,Vogel,Jäger,Schwein,Kuh,Ei,Ziege,Schaf,Wildschwein,Hauskatze,Kaninchen,Haustier,Geflügel,Vieh,Reh,Katze,Wildpferd,Nutztier,Hund,Haushund,Großkatze,Rothirsch,Braunbär,Affe,Gans,Ochse,Wildschwein,Ziege,Schaf,Nabelschwein,Hauskatze,Riesenschlange,Ginsterkatze,Kaninchen,Haustier,Haushund,Hund,Geflügel,Reh,Wildpferd,Bartschwein,Hühnervogel,Meerschweinchen,Nutztier,Hausschwein,Wasserhund,0.2,0.539,88.0,85.0,86.5,1.006,0.894,0.95,85.0,10


In [41]:
combine('dewac1', min_regular_terms=7, min_cnpmi=0.05, min_pairsim=0.3)

Reading ../data/preprocessed/LDAmodel/noun/bow/topics/dewac1_noun_bow_topic-candidates.csv
File b'../data/preprocessed/LDAmodel/noun/bow/topics/dewac1_noun_bow_topic-candidates.csv' does not exist
Loading topics via TopicsLoader
Loading dictionary from ../data/preprocessed/LDAmodel/noun/bow/dewac1_noun_bow.dict
Loading model from ../data/preprocessed/LDAmodel/noun/bow/e42/dewac1_LDAmodel_e42_100_ep30
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/dewac1_noun_bow_label-candidates.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/dewac1_noun_bow_label-candidates_ftx.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/dewac1_noun_bow_topic-scores.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/dewac1_noun_bow_topic-scores_germanet.csv
c_npmi_wikt                0.079
pairwise_similarity_ftx    0.402
dtype: float64
average difference per topic between the mean of the individual ranks and the rank of the normalized mean: 1.72
57


Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,term0,term1,term2,term3,term4,term5,term6,term7,term8,term9,label0_w2v,label1_w2v,label2_w2v,label3_w2v,label4_w2v,label5_w2v,label6_w2v,label7_w2v,label8_w2v,label9_w2v,label10_w2v,label11_w2v,label12_w2v,label13_w2v,label14_w2v,label15_w2v,label16_w2v,label17_w2v,label18_w2v,label19_w2v,label0_ftx,label1_ftx,label2_ftx,label3_ftx,label4_ftx,label5_ftx,label6_ftx,label7_ftx,label8_ftx,label9_ftx,label10_ftx,label11_ftx,label12_ftx,label13_ftx,label14_ftx,label15_ftx,label16_ftx,label17_ftx,label18_ftx,label19_ftx,c_npmi_wikt,pairwise_similarity_ftx,rank_cnpmi,rank_pairsim,rank_mean,c_npmi_wikt_norm,pairwise_similarity_ftx_norm,avg,avg_rank,count_regular_terms
dataset,param_id,nb_topics,topic_idx,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1,Unnamed: 51_level_1,Unnamed: 52_level_1,Unnamed: 53_level_1,Unnamed: 54_level_1,Unnamed: 55_level_1,Unnamed: 56_level_1,Unnamed: 57_level_1,Unnamed: 58_level_1,Unnamed: 59_level_1,Unnamed: 60_level_1,Unnamed: 61_level_1,Unnamed: 62_level_1,Unnamed: 63_level_1
dewac1,e42,100,94,Schule,Schüler,Lehrer,Klasse,Schülerin,Unterricht,Wohnung,Lehrerin,Grundschule,Lehrkraft,Schule,Schüler,Sekundarstufe_I,Gymnasium,Schulklasse,Realschule,Jahrgangsstufe,Vorkurs,Hauptschule,Mittelschule,Elementarschule,Vorschule,Oberschule,Schuljahr,erweitern_Realschule,Regelschule,hoch_Mädchenschule,Klassenlehrer,Lehrer,Privatschule,Schule,Vorschule,Berufsgrundschuljahr,Elementarschule,Realschule,Oberschule,Schüler,Regelschule,Mittelschule,Schulklasse,Klassenlehrer,erweitern_Realschule,hoch_Mädchenschule,Gymnasium,Hauptschule,Sekundarstufe_I,Halbtagsschule,Schulkindergarten,Vorkurs,integriert_Sekundarschule,0.229,0.591,97.0,100.0,98.5,1.855,2.38,2.118,100.0,10
dewac1,e42,100,6,Kirche,Bischof,Papst,Rom,Priester,katholisch_Kirche,Kardinal,Pfarrer,Erzbischof,Christ,Suffraganbischof,päpstlich_Legat,Diözese,Erzbischof,Diözesanbischof,Kurienbischof,Bischof,Erzpriester,Papst,römisch-katholisch_Kirche,Metropolit,Weihbischof,Bistum_Porto,Generalvikar,Koadjutor,Suffragan,Offizial,Propst,Bischofssitz,Diözesanpriester,Kurienbischof,Suffraganbischof,Erzbistum_Turin,Patriarch_von_Jerusalem,Erzbistum_auch,Patriarch_von_Alexandrien,sizilianisch_Bischofskonferenz,päpstlich_Familie,Erzbistum_Florenz,lateinisch_Kirche,päpstlich_Legat,Bistum_Porto,Erzpriester,Diözesanbischof,Erzbistum_Bologna,römisch-katholisch_Kirche,Erzbischof,Erzbistum_Lima,Kardinalsring,Diözese,0.199,0.573,93.0,99.0,96.0,1.486,2.153,1.819,97.0,9
dewac1,e42,100,24,Tier,Hund,Jäger,Jagd,Katze,Fuchs,Vogel,Mensch,Wald,Haustier,Wildschwein,Hauskatze,Wildtier,Nutztier,Ziege,Haushund,Tayra,Kulturflüchter,Waschbär,Haustier,Beutegreifer,Kaninchen,Säugetier,Reh,Schaf,Kleinsäuger,Rothirsch,Affe,Großkatze,Dingo,Wildschwein,Riesenschlange,Hauskatze,Wildtier,Ginsterkatze,Schermaus,Ziege,Nabelschwein,Beutegreifer,Nutztier,Kulturflüchter,Haustier,Haushund,Kaninchen,Dingo,Schaf,Fischfresser,Waschbär,Buschratte,Kleinsäuger,0.208,0.532,95.0,93.0,94.0,1.594,1.637,1.615,96.0,10
dewac1,e42,100,12,Musik,Band,Lied,Bühne,Publikum,Künstler,Musiker,Konzert,CD,Song,Begleitband,Duett,Rockband,Soundtrack,Singer-Songwriter,Full_Force,Musik_sein,Tracks,Lied,klassisch_Musik,Live-Album,Konzert,Gitarrist,Coverversion,Auftritt,live,B-Seite,Headliner,Tournee,Aufführung,Begleitband,Duett,Rockband,Spielemusikkonzert,deutsch_Schallplattenpreis,Singer-Songwriter,Soundtrack,Kaizer_Orchestra,Candid_Record,Musik_sein,Coverband,Full_Force,klassisch_Musik,Antony_and_the_Johnson,Liedermacher,Tracks,Live-Album,Lied,Gitarrist,Marshall_&_Alexander,0.191,0.547,92.0,95.0,93.5,1.387,1.827,1.607,95.0,9
dewac1,e42,100,72,Patient,Arzt,Behandlung,Krankheit,Mensch,Erkrankung,Medikament,Prozent,Therapie,Krankenhaus,Therapie,systemisch_Erkrankung,Krankheitsverlauf,Erhaltungstherapie,Tnf-Blocker,Nephrokalzinose,Patient,Neuroonkologie,Immunsuppression,Monotherapie,renal_Anämie,Kombinationstherapie,Symptom,Mittelohrentzündung,Hepatitis,Pankreasenzym,Gedeihstörung,Krankheitsbild,Nephropathie,hämorrhagisch_Diathese,systemisch_Erkrankung,symptomatisch_Therapie,Erhaltungstherapie,Kombinationstherapie,interstitiell_Lungenerkrankung,Monotherapie,Neuroonkologie,Mittelohrentzündung,depressiv_Syndrom,Grundkrankheit,Therapie,Krankheitsverlauf,Substitutionstherapie,Mangelerkrankung,Konzentrationsstörung,Ernährungsstörung,Gedeihstörung,Menstruationsbeschwerde,hämorrhagisch_Diathese,Schilddrüsenoperation,0.203,0.507,94.0,89.0,91.5,1.53,1.326,1.428,94.0,10
dewac1,e42,100,69,Buch,Autor,Verlag,Text,Leser,Geschichte,Roman,Werk,Band,Literatur,Sammelband,Buchreihe,Anthologie,Erstlingswerk,Erzählung,Kurzgeschichte,Geschichtswerk,Roman,Prosa,Sachbuch,Herausgeber,Belletristik,Weltliteratur,Lyrik,Neuausgabe,Nachwort,Sekundärliteratur,Monografie,Kinderbuch,Dichter,Literaturlexikon,Sammelband,Sachliteratur,Buchreihe,erotisch_Literatur,Anthologie,dramatisch_Gedicht,Erzählung,Geschichtszeitschrift,Kurzgeschichte,jiddisch_Literatur,Kindergeschichte,Redaktionsgeschichte,Literaturbetrieb,Nachwort,romanisch_Literaturwissenschaft,Kalendergeschichte,Nacherzählung,Herausgeber,Sittengeschichte,0.165,0.541,85.0,94.0,89.5,1.057,1.754,1.406,93.0,10
dewac1,e42,100,9,Zivildienst,Wehrpflicht,Bundeswehr,Wehrpflichtiger,Monat,Soldat,Dienst,Zivildienstleistende,Kriegsdienstverweigerer,Einberufung,weiß_Jahrgang,Wehrpflicht,Ersatzreserve,Einberufung,freiwillig_Wehrdienst,Soldat_auf_Zeit,Berufssoldat,Zivildienst,Zivildienstgesetz,Wehrersatzdienst,Wehrsold,Soldatengesetz,Rekrut,Reserveoffizier,Reservist,Totalverweigerung,Freiwilliger,Gestellungsbefehl,Dreijährig-Freiwilliger,Präsenzdienst,freiwillig_Wehrdienst,Zivildienstgesetz,Wehrpflicht,weiß_Jahrgang,Wehrersatzdienst,Einberufung,Dreijährig-Freiwilliger,Soldatengesetz,Wehrpflicht_in_Deutschland,Gestellungsbefehl,Soldat_auf_Zeit,Zivildienst,Berufssoldat,Kriegsdienstverweigerung,Ersatzreserve,Zivildienstschule,Bundeswehrfachschule,Soldatenversorgungsgesetz,Reserveoffizieranwärter,Dienstverpflichtung,0.233,0.472,98.0,83.0,90.5,1.898,0.887,1.393,92.0,8
dewac1,e42,100,22,Frau,Vater,Leben,Mann,Mutter,Sohn,Tod,Tochter,Seite,Freund,Stiefvater,Vater,Hedwig,Schwester,Kretheu,Bruder,Der_Vater,Enkel,Stiefmutter,Witwer,Anna,Großvater,Elisabeth,Mutter,Stiefbruder,Elter,Ihr_Sohn,nach_der_Hochzeit,Frau,Die_Mutter,Stiefvater,Der_Vater,Witwer,Vater,Hedwig,Schwester,Stiefmutter,Bruder,Stiefbruder,Enkel,Großvater,Anna,Ihr_Sohn,nach_der_Hochzeit,Die_Tochter,Heinrich,Die_Mutter,Geschwister,Elter,Mutter,0.124,0.57,69.0,98.0,83.5,0.547,2.112,1.33,91.0,10
dewac1,e42,100,66,Mitglied,Verein,Vorstand,Vorsitzende,Stiftung,Satzung,Mitgliederversammlung,Sitzung,Verband,Archiv,Vorsitzende,Ehrenvorsitzende,Generalversammlung,Vertreterversammlung,Stiftungsrat,Landesvorstand,Präsidium,Fachverband,Landessportbund_Sachs,Ehrenmitglied,Schriftführer,Zentralrat,historisch_Kommission_für_Sachsen-Anhalt,Gesellschaft_katholisch_Publizist_Deutschland,Oberpfälzer_Kulturbund,Verband_deutsch_Rentenversicherungsträger,Dachverband,deutsch_Arbeitsgemeinschaft_genealogischer_Ver...,Vorstand,Berufsverband_der_Frauenarzt,Vorsitzende,Ehrenvorsitzende,Generalversammlung,deutsch_Arbeitsgemeinschaft_genealogischer_Ver...,deutsch_Volkshochschul-Verband,Vertreterversammlung,Arbeitsgemeinschaft_deutsch_Waldbesitzerverband,sozialdemokratisch_Gemeinschaft_für_Kommunalpo...,Berufsverband_der_Frauenarzt,Bundesverband_deutsch_Unternehmensberater,deutsch_Hochschulverband,deutsch_numismatisch_Gesellschaft,Arbeitsgemeinschaft_der_Ressortforschungseinri...,Verein_katholisch_deutsch_Lehrerin,Landessportbund_Sachs,Gesellschaft_katholisch_Publizist_Deutschland,Bundesarbeitsgemeinschaft_der_frei_Wohlfahrtsp...,Fachverband,Wirtschaftsvereinigung_Stahl,Stiftungsrat,0.167,0.525,87.0,91.0,89.0,1.079,1.544,1.311,90.0,9
dewac1,e42,100,45,Uhr,Quell,Freitag,Dienstag,Spiegel,Montag,Schröder,Mittwoch,Donnerstag,Samstag,Sonntagabend,Donnerstag,Freitag,Dienstag,Sonntag,Mittwoch,Samstag,Wochenende,Feiertag,Vormittag,Tulpensonntag,Hallo_Niedersachse,heute_mittag,Wochentag,Sat.1_Nachricht,Servicezeit,Ard-Infonacht,Zdf-Mittagsmagazin,heute_–_in_Deutschland,Werktag,Sonntagabend,Donnerstag,Dienstag,Freitag,Mittwoch,Sonntag,Samstag,Tulpensonntag,Wochenende,heute_mittag,Feiertag,Vormittag,Hallo_Niedersachse,Wochentag,heute_–_in_Deutschland,Sat.1_Nachricht,Servicezeit,Zdf-Mittagsmagazin,Frühschoppen,Sport_am_Sonntag,0.189,0.49,91.0,87.0,89.0,1.35,1.109,1.23,89.0,9


In [42]:
combine('n', min_regular_terms=7, min_cnpmi=0.05, min_pairsim=0.3)

Reading ../data/preprocessed/LDAmodel/noun/bow/topics/news_noun_bow_topic-candidates.csv
File b'../data/preprocessed/LDAmodel/noun/bow/topics/news_noun_bow_topic-candidates.csv' does not exist
Loading topics via TopicsLoader
Loading dictionary from ../data/preprocessed/LDAmodel/noun/bow/news_noun_bow.dict
Loading model from ../data/preprocessed/LDAmodel/noun/bow/e42/news_LDAmodel_e42_100_ep30
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/news_noun_bow_label-candidates.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/news_noun_bow_label-candidates_ftx.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/news_noun_bow_topic-scores.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/news_noun_bow_topic-scores_germanet.csv
c_npmi_wikt                0.095
pairwise_similarity_ftx    0.416
dtype: float64
average difference per topic between the mean of the individual ranks and the rank of the normalized mean: 1.92
60


Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,term0,term1,term2,term3,term4,term5,term6,term7,term8,term9,label0_w2v,label1_w2v,label2_w2v,label3_w2v,label4_w2v,label5_w2v,label6_w2v,label7_w2v,label8_w2v,label9_w2v,label10_w2v,label11_w2v,label12_w2v,label13_w2v,label14_w2v,label15_w2v,label16_w2v,label17_w2v,label18_w2v,label19_w2v,label0_ftx,label1_ftx,label2_ftx,label3_ftx,label4_ftx,label5_ftx,label6_ftx,label7_ftx,label8_ftx,label9_ftx,label10_ftx,label11_ftx,label12_ftx,label13_ftx,label14_ftx,label15_ftx,label16_ftx,label17_ftx,label18_ftx,label19_ftx,c_npmi_wikt,pairwise_similarity_ftx,rank_cnpmi,rank_pairsim,rank_mean,c_npmi_wikt_norm,pairwise_similarity_ftx_norm,avg,avg_rank,count_regular_terms
dataset,param_id,nb_topics,topic_idx,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1,Unnamed: 51_level_1,Unnamed: 52_level_1,Unnamed: 53_level_1,Unnamed: 54_level_1,Unnamed: 55_level_1,Unnamed: 56_level_1,Unnamed: 57_level_1,Unnamed: 58_level_1,Unnamed: 59_level_1,Unnamed: 60_level_1,Unnamed: 61_level_1,Unnamed: 62_level_1,Unnamed: 63_level_1
news,e42,100,19,Smartphone,Google,App,Nutzer,Amazon,Gerät,Microsoft,Handy,Tablet,Anbieter,Endgerät,ActiveSync,Smartphone,Blackberry_Os,Android,Hdmi-Stick,Onlinedienst,Google_Play,Umts-Modem,Imessage,Windows_Media,Android_TV,CarPlay,Mobile_App,Mobilgerät,Smart-TV,Amazon_Appstore,App_Store,Google-Konto,Google_Talk,Endgerät,Onlinedienst,Blackberry_Os,Windows_Media,Smartphone,Streaming-Client,ActiveSync,Android,Android_TV,Google_Play,Mobilfunkstandard,Google_Talk,Anwendungssoftware,Google-Konto,Microsoft_Windows_Phone,Bluetooth-Profil,Mobile_App,Hdmi-Stick,Amazon_Appstore,Mobilgerät,0.295,0.584,100.0,96.0,98.0,1.978,1.967,1.972,100.0,9
news,e42,100,67,Song,Band,Musik,Album,Sänger,Konzert,Musiker,Lied,Sängerin,Fan,Rockband,Begleitband,Duett,Singer-Songwriter,Leadgitarrist,Lied,You’ve_Got_A_Friend,Like_A_Hurricane,Gitarrist,Soundtrack,Tracks,Wind-Up_Record,Full_Force,Kill_Rock_Star,Live-Album,Coverversion,Vocals,Bonustrack,live,Metallica,Begleitband,Rockband,Singer-Songwriter,Duett,Leadgitarrist,Rhythmusgitarrist,Cover-Album,You’ve_Got_A_Friend,Like_A_Hurricane,Wind-Up_Record,Grateful_Dead_Record,Kill_Rock_Star,Gitarrist,Buried_Alive,Antony_and_the_Johnson,Soundtrack,Full_Force,Candid_Record,Lied,Coverband,0.245,0.617,96.0,99.0,97.5,1.487,2.356,1.921,99.0,10
news,e42,100,12,Prozess,Haft,Angeklagte,Staatsanwaltschaft,Gefängnis,Gericht,vor_Gericht,Anklage,Anwalt,Richter,Angeklagte,Gerichtsverfahren,Freispruch,Strafkammer,Militärgericht,Untersuchungshaft,Gerichtsverhandlung,Hauptverfahren,Strafsache,Beschuldigter,Kläger,Verdächtige,Staatsanwalt,Anschuldigung,Anklage,Hauptverhandlung,Haft,Staatsanwaltschaft,Generalstaatsanwaltschaft,Sondergericht,Angeklagte,Gerichtsverfahren,Hauptverfahren,Freispruch,Militärgericht,Gerichtsverhandlung,Strafkammer,Untersuchungshaft,Generalstaatsanwaltschaft,Anschuldigung,Strafsache,Beschuldigter,Kläger,Verdächtige,Rechtsverweigerung,Anklage,Hauptverhandlung,Strafvollstreckungskammer,Haft,Generalstaatsanwalt,0.259,0.596,97.0,98.0,97.5,1.623,2.111,1.867,98.0,8
news,e42,100,20,Wahl,Partei,Stimme,Kandidat,Amt,Mehrheit,Wähler,Parlament,Abstimmung,Wahlkampf,Urwahl,Direktwahl,Abgeordnete,Wahl_2011,demokratisch_Partei,Vorwahl,Kandidat,Mandatsträger,Amtsinhaber,Wahl_1993,Minderheitsregierung,Wahlliste,Parteivorsitzender,Wahlmann,Zweidrittelmehrheit,Wahlbündnis,still_Wahl,Wahl_2012,Nachwahl,Wahl_2002,Listenkandidat,Urwahl,Wahlkomitee,Wahl_1993,Wahl_2011,Stimmenthaltung,Mandatsträger,Direktwahl,Wahlkreiskandidat,demokratisch_Partei,Wahl_2010,Abgeordnete,Kandidat,Wahl_2003,Amtsinhaber,Wahlliste,Minderheitsregierung,Nominierungsparteitag,Wahl_2002,Listenwahl,0.267,0.587,99.0,97.0,98.0,1.701,2.004,1.853,97.0,10
news,e42,100,7,Kind,Familie,Vater,Mutter,Elter,Tochter,Sohn,Junge,Mädchen,Jugendliche,Stiefvater,Elter,Großeltern,Kind,Mutter,Stiefmutter,Vater,Schwester,Geschwister,Kindheit,Waise,Der_Vater,Die_Mutter,Frau,Enkel,Pflegeeltern,Stiefbruder,Witwer,Nachkomme,Bruder,Stiefvater,Elter,Großeltern,Geschwister,Kind,Stiefmutter,Mutter,Vater,Schwester,Der_Vater,Kindheit,Waise,Witwer,Die_Mutter,Stiefbruder,Schwiegerkind,Pflegeeltern,Einzelkind,Enkel,Die_Tochter,0.195,0.647,83.0,100.0,91.5,0.99,2.704,1.847,96.0,9
news,e42,100,15,Preis,Kategorie,Auszeichnung,Jury,Wettbewerb,Gewinner,Verleihung,Berlinale,Award,Preisträger,Sonderpreis,Satellite_Award_2017,Publikumspreis,Schnitt-Preis,Dadasaheb_Phalk_Award,Ophir_Award,silbern_Bär,Asian_Film_Award,Filmpreis,Grimme-Preis_2012,hessisch_Filmpreis,Marcello-Mastroianni-Preis,Gilde-Filmpreis,Caméra_d’Or,Preis_der_deutsch_Filmkritik,Musikpreis,Auszeichnung,Fotogramas_de_Plata,Young_Artist_Award_2011,Prix_Jutrum,Sonderpreis,Preis_der_deutsch_Filmkritik,Publikumspreis,Ophir_Award,silbern_Bär,Schnitt-Preis,Dadasaheb_Phalk_Award,deutsch_Theaterpreis_Der_Faust,Student_Academy_Award,wiener_Filmpreis,Satellite_Award_2017,Filmpreis,österreichisch_Filmpreis,deutsch_Kurzfilmpreis,Gilde-Filmpreis,Marcello-Mastroianni-Preis,National_Magazin_Award,International_Press_Academy,hessisch_Filmpreis,Romy-Schneider-Preis,0.263,0.536,98.0,93.0,95.5,1.665,1.404,1.534,94.0,9
news,e42,100,27,Facebook,Internet,Nutzer,Twitter,Video,Media,Netz,sozial_Netzwerk,Inhalt,Nachricht,Youtube,Facebook,Twitter,Instagram,Social_Bookmark,Blog,Onlinemedium,Benutzername,Website,sozial_Netzwerk,Webinhalt,Google_Talk,Onlinedienst,Internet,elektronisch_Media,Google+,Homepage,Vevo,Videoportal,Instant_Messaging,Twitter,Youtube,Facebook,Webinhalt,Onlinemedium,elektronisch_Media,Onlinedienst,Google_Talk,Benutzername,Instagram,Blog,Website,Internet,Homepage,dezentral_Netzwerk,Instant_Messaging,Social_Bookmark,Videoportal,sozial_Netzwerk,Webseite,0.23,0.529,92.0,90.0,91.0,1.334,1.321,1.328,92.0,9
news,e42,100,72,Polizei,Mann,Täter,Ermittler,Opfer,Tat,Fall,Ermittlung,Staatsanwaltschaft,Verdächtige,Verdächtige,Angeklagte,Tathergang,Tatverdacht,Strafverfolgungsbehörde,Polizeibeamter,Täter,Mord,Täterwissen,Ermittlungsakt,Beschuldigter,Festnahme,Vernehmung,Mitwisser,Verhaftung,Delikt,vorsätzlich_Tötung,Fahndungsliste,operativ_Fallanalyse,aus_Mangel_an_Beweis,Verdächtige,Angeklagte,Ermittlungsakt,Tathergang,Fahndungsliste,Strafverfolgungsbehörde,Täterwissen,Tatverdacht,Polizeibeamter,Mitwisser,Täter,vorsätzlich_Tötung,Festnahme,Beschuldigter,Verhaftung,Entschuldigungsgrund,Mord,Strafvereitelung,Ermittlungsverfahren,Vernehmung,0.222,0.531,89.0,91.0,90.0,1.254,1.35,1.302,91.0,9
news,e42,100,74,ZDF,Sender,Sendung,Zuschauer,ARD,Fernsehen,Moderator,Woche,Erste,WDR,Fernsehsendung,Fernsehshow,Disney_Club,ZDF,Prosieb,heute_mittag,Sat.1,Hörfunksendung,NDR_Fernsehen,Hallo_Niedersachse,ARD,schweizer_Fernsehen,Das_Erste,Echo_der_Tag,Europamagazin,Weck_UP,Ard-Mittagsmagazin,W_wie_Wissen,Sportreporter,Tigerente_Club,Fernsehsendung,Hörfunksendung,Fernsehshow,Hr-Fernsehen,Frühstücksfernsehen,dritte_Fernsehprogramm,Sportreporter,Sr_Fernsehen,Sat.1_Nachricht,schweizer_Fernsehen,NDR_Fernsehen,Echo_der_Tag,heute_mittag,Sonntagabend,Disney_Club,Ard-Mittagsmagazin,Franke_Fernsehen,Ard-Alpha,Unterhaltungsshow,ZDF,0.225,0.515,90.0,87.0,88.5,1.291,1.166,1.229,90.0,8
news,e42,100,2,Werk,Künstler,Bild,Kunst,Ausstellung,Museum,Sammlung,Arbeit,Gemälde,Schau,Kunstwerk,Kupferstichkabinett,Galerist,modern_Kunst,Privatsammlung,Kunstmuseum,Werkschau,Kunstausstellung,Ausstellung,zeitgenössisch_Kunst,Kunstbibliothek,staatlich_graphisch_Sammlung_München,Saint_Louis_Art_Museum,Sammlung_Würth,Pissarro,Retrospektive,Gemälde,Cleveland_Museum_of_Art,Wechselausstellung,Metropolitan_Museum_of_Art,Kupferstichkabinett,Jahrhundertausstellung_deutsch_Kunst,Privatsammlung,Kunstwerk,kulturgeschichtlich_Museum_Osnabrück,modern_Kunst,Werkschau,Kunstausstellung,Galerist,zeitgenössisch_Kunst,staatlich_graphisch_Sammlung_München,Cleveland_Museum_of_Art,Kunstbibliothek,Saint_Louis_Art_Museum,Kupferstichkabinett_Dresden,Kunstmuseum,Ausstellung,städtisch_Galerie_Dresden,Berlinisch_Galerie,komisch_Kunst,0.197,0.532,84.0,92.0,88.0,1.01,1.365,1.188,89.0,10


In [43]:
combine('s', min_regular_terms=7, min_cnpmi=0.05, min_pairsim=0.3)

Reading ../data/preprocessed/LDAmodel/noun/bow/topics/speeches_noun_bow_topic-candidates.csv
File b'../data/preprocessed/LDAmodel/noun/bow/topics/speeches_noun_bow_topic-candidates.csv' does not exist
Loading topics via TopicsLoader
Loading dictionary from ../data/preprocessed/LDAmodel/noun/bow/speeches_noun_bow.dict
Loading model from ../data/preprocessed/LDAmodel/noun/bow/e42/speeches_LDAmodel_e42_100_ep30
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/speeches_noun_bow_label-candidates.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/speeches_noun_bow_label-candidates_ftx.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/speeches_noun_bow_topic-scores.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/speeches_noun_bow_topic-scores_germanet.csv
c_npmi_wikt                0.069
pairwise_similarity_ftx    0.387
dtype: float64
average difference per topic between the mean of the individual ranks and the rank of the normalized mean: 2.14
54


Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,term0,term1,term2,term3,term4,term5,term6,term7,term8,term9,label0_w2v,label1_w2v,label2_w2v,label3_w2v,label4_w2v,label5_w2v,label6_w2v,label7_w2v,label8_w2v,label9_w2v,label10_w2v,label11_w2v,label12_w2v,label13_w2v,label14_w2v,label15_w2v,label16_w2v,label17_w2v,label18_w2v,label19_w2v,label0_ftx,label1_ftx,label2_ftx,label3_ftx,label4_ftx,label5_ftx,label6_ftx,label7_ftx,label8_ftx,label9_ftx,label10_ftx,label11_ftx,label12_ftx,label13_ftx,label14_ftx,label15_ftx,label16_ftx,label17_ftx,label18_ftx,label19_ftx,c_npmi_wikt,pairwise_similarity_ftx,rank_cnpmi,rank_pairsim,rank_mean,c_npmi_wikt_norm,pairwise_similarity_ftx_norm,avg,avg_rank,count_regular_terms
dataset,param_id,nb_topics,topic_idx,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1,Unnamed: 51_level_1,Unnamed: 52_level_1,Unnamed: 53_level_1,Unnamed: 54_level_1,Unnamed: 55_level_1,Unnamed: 56_level_1,Unnamed: 57_level_1,Unnamed: 58_level_1,Unnamed: 59_level_1,Unnamed: 60_level_1,Unnamed: 61_level_1,Unnamed: 62_level_1,Unnamed: 63_level_1
speeches,e42,100,54,Film,Kino,deutsch_Film,Berlinale,Filmförderung,Regisseur,Kinofilm,Filmemacher,Produktion,Erfolg,Spielfilm,deutsch_Film,Filmkritiker,Film,Peter_Chelsom,Darsteller,Andrew_Birkin,Michael_Schaack,Independent-Film,Alan_Rudolph,Heinz_Willeg,Kinderfilm,Filmpreis,Drehbuchautor,Filmgeschichte,Kurzfilm,Musikfilm,Fernsehspiel,Filmfestival,Filmproduktion,Spielfilm,Preis_der_deutsch_Filmkritik,neu_deutsch_Filmgesellschaft,österreichisch_Filmgeschichte,Göteborg_International_Film_Festival,deutsch_Film,jiddisch_Film,Independent-Film,Torsten_C._Fischer,Andrew_Birkin,Filmkritiker,international_Filmfest_Emden-Norderney,Kompilationsfilm,international_Filmfestival_Shanghai,Darsteller,international_Filmfestival_Moskau,Wiedemann_&_Berg_Filmproduktion,Film,Kinderfilm,österreichisch_Filmpreis,0.215,0.529,100.0,99.0,99.5,2.739,3.042,2.891,99.0,8
speeches,e42,100,97,Wissenschaft,Universität,Forschung,Hochschule,Wissenschaftler,Student,Bildung,Professor,Wissen,Forscher,Naturwissenschaftler,Humanwissenschaft,Forschung_und_Lehre,Wissenschaftler,Grundlagenforschung,Wissenschaft,estnisch_Philologie,medizinisch_Fakultät,Forschungseinrichtung,Fachgebiet,Sozialwissenschaft,Universität,wissenschaftlich_Gesellschaft,Studienfach,Akademie_der_Wissenschaft,technisch_Universität,Philologie,medizinisch_Universität,chinesisch_Akademie_der_Sozialwissenschaft,Studiengang,medizinisch_Universität,Bildungswissenschaft,Wissenschaftskolleg,Naturwissenschaftler,Humanwissenschaft,chinesisch_Akademie_der_Sozialwissenschaft,wissenschaftlich_Gesellschaft,Ostasienwissenschaft,Wissenschaftsforschung,Wissenschaftler,Grundlagenforschung,Entwicklungsforschung,Wissenschaft,wissenschaftlich_Sekretär,Universität_Maribor,Forschung_und_Lehre,theoretisch_Wissenschaft,staatlich_Universität_Baku,Geschichte_der_Universität,Einheitswissenschaft,0.154,0.522,96.0,98.0,97.0,1.597,2.899,2.248,98.0,10
speeches,e42,100,36,Bürger,Recht,Bericht,Kommission,Mitgliedstaat,europäisch_Union,Bürgerbeauftragter,Charta,Grundrecht,Institution,Mitgliedstaat,Prinzip_der_begrenzt_Einzelermächtigung,amerikanisch_Menschenrechtskonvention,frei_Personenverkehr,Grundrecht,ausschließlich_Zuständigkeit,Venedig-Kommission,Europarat,Verfassungsrecht,europäisch_Menschenrechtskonvention,kopenhagener_Kriterium,Un-Menschenrechtsausschuss,parlamentarisch_Versammlung,Menschenrecht,Rechtsgrundlage,Mitentscheidung,Gesetzgebung,Drittstaat,Individualbeschwerde,Agentur_der_europäisch_Union,amerikanisch_Menschenrechtskonvention,europäisch_Bürgerbeauftragter,Un-Menschenrechtsausschuss,Organisationsrecht,Mitgliedstaat,Menschenrechtsbeauftragte,Verfassungsvertrag,ausschließlich_Zuständigkeit,Verwaltungsvereinbarung,parlamentarisch_Versammlung,europäisch_Kommission_für_Menschenrecht,Mitgliedstaat_der_Vereinte_Nation,Menschenrechtskommissar,europäisch_Menschenrechtskonvention,Dienstleistungsfreiheit,Prinzip_der_begrenzt_Einzelermächtigung,Rechtsausschuss_der_deutsch_Bundestag,Verfassungsrecht,Agentur_der_europäisch_Union,polizeilich_Zusammenarbeit,0.152,0.467,95.0,95.0,95.0,1.566,1.714,1.64,96.0,8
speeches,e42,100,64,Änderungsantrag,Kommission,Vorschlag,Rat,Richtlinie,Präsident,Verordnung,Parlament,Änderung,Bericht,Gesetzentwurf,Vorsitzende,Entschließung,Gesetzgebungsverfahren,Ministerrat,Beschlussempfehlung,Beschluss,Parlamentsausschuss,gemeinsam_Ausschuss,Geschäftsordnung,Stellungnahme,föderal_Gesetz,parlamentarisch_Anfrage,Gesetzgebung,Dekret,Rechtsausschuss_der_deutsch_Bundestag,Rechtsausschuss,Ausschuss,Regierungschef,Gesetzeskraft,Entschließung,Beschlussempfehlung,Rechtsausschuss_der_deutsch_Bundestag,Gesetzentwurf,Gesetzgebungsverfahren,Vorsitzende,Rahmenbeschluss,gemeinsam_Ausschuss,Beschluss,Zwischenausschuss,Entschließungsantrag,Finanzverwaltungsgesetz,parlamentarisch_Untersuchungskommission,parlamentarisch_Anfrage,Parlamentsausschuss,Rat_für_allgemein_Angelegenheit,Ministerrat,Stellungnahme,Rechtsausschuss,Gesetzgebung,0.128,0.473,89.0,96.0,92.5,1.098,1.853,1.476,95.0,9
speeches,e42,100,90,Abfall,Lebensmittel,Verbraucher,Produkt,Umwelt,Verwertung,Recycling,Frau,Entsorgung,Stoff,Endverbraucher,Nahrungsmittel,Erzeugnis,Wertstoff,Sekundärrohstoff,Bedarfsgegenstand,Lebensmittel,tierisch_Produkt,Industriechemikalie,Entsorgungswirtschaft,Transportverpackung,Hausmüll,Kaskadennutzung,Schmelzsalz,Prozesswasser,Chemikalie,Abfallentsorgung,Futtermittel,Milcherzeugnis,Verpackung,Bedarfsgegenstand,Entsorgungswirtschaft,Industriechemikalie,Transportverpackung,Nahrungsmittel,tierisch_Produkt,Wertstoff,Endverbraucher,Futtermittelzusatzstoff,biologisch_Abbaubarkeit,Abfallentsorgung,Prozesswasser,Erzeugnis,Lebensmittelverpackung,Sekundärrohstoff,Abfallvermeidung,Reinigungsmittel,Feinchemikalie,Lebensmittel,Milcherzeugnis,0.159,0.437,97.0,91.0,94.0,1.696,1.076,1.386,94.0,10
speeches,e42,100,32,Bericht,EU,Mitgliedstaat,europäisch_Union,Entschließung,europäisch_Parlament,Maßnahme,Ziel,Europa,Vorschlag,Mitgliedstaat,europäisch_Union,Rat_der_europäisch_Union,europäisch_Kommission,europäisch_Semester,europäisch_Gemeinschaft,Mitgliedstaat_der_europäisch_Union,Ratsarbeitsgruppe,Kohäsionsfond,Prinzip_der_begrenzt_Einzelermächtigung,Ausschuss_für_konstitutionell_Frage,Europarat,gemeinsam_Außen-_und_Sicherheitspolitik,Rat_für_Auswärtige_Angelegenheit,gemeinsam_Strategie,frei_Personenverkehr,Ausschuss_für_international_Handel,europäisch_Rat,Agentur_der_europäisch_Union,Außengrenze_der_europäisch_Union,Mitgliedstaat,europäisch_Union,europäisch_Semester,europäisch_Wirtschaftsregierung,Außengrenze_der_europäisch_Union,Agentur_der_europäisch_Union,Delegation_der_europäisch_Union,Rat_der_europäisch_Union,eurasisch_Wirtschaftsgemeinschaft,Erweiterung_der_europäisch_Union,europäisch_Wirtschaftsgemeinschaft,Mitgliedstaat_der_europäisch_Union,gemeinsam_Strategie,Mitgliedstaat_der_Vereinte_Nation,parlamentarisch_Versammlung,Rahmenbeschluss,europäisch_Rechnungshof,europäisch_Kommission,Zollgebiet_der_europäisch_Union,europäisch_Hochschulraum,0.152,0.44,94.0,92.0,93.0,1.563,1.143,1.353,93.0,7
speeches,e42,100,71,Kind,Internet,Kinderpornographie,Ausbeutung,Elter,Sextourismus,Missbrauch,Minderjähriger,Pädophiler,Familie,Kinderpornografie,Pädophilie,Vergewaltigung,Misshandlung,häuslich_Gewalt,sexueller_Missbrauch_von_Kind,Kindesmisshandlung,sexuell_Handlung,Pornografie,Kinderhandel,Inzest,sexuell_Handlung_mit_Kind,jung_Mensch,sexuell_Selbstbestimmung,Sexualkontakt,Prostitution,Cyber-Mobbing,Menschenhandel,Sexting,Schwangerschaftsabbruch,Kinderpornografie,Kinderhandel,Pädophilie,sexueller_Missbrauch_von_Kind,häuslich_Gewalt,Vergewaltigung,Kindesmisshandlung,Misshandlung,sexueller_Missbrauch,sexuell_Selbstbestimmung,Menschenhandel,Frühsexualisierung,Prostitution,sexuell_Freiheit,Sexualkontakt,Entkriminalisierung,Jugendpornografie,Gewalt_gegen_Mann,sexuell_Aufklärung,Pornografie,0.142,0.42,93.0,81.0,87.0,1.366,0.7,1.033,91.0,7
speeches,e42,100,44,Opfer,Frau,Gewalt,Menschenhandel,Kind,Verbrechen,Maßnahme,Bekämpfung,Kommission,Gewalt_gegen_Frau,Vergewaltigung,Misshandlung,häuslich_Gewalt,Menschenhandel,Menschenrechtsorganisation,Selbstjustiz,Folter,Gewalt_gegen_Frau,extralegal_Hinrichtung,Verbrechen_gegen_der_Menschlichkeit,Zwangsprostitution,politisch_Verfolgung,Zwangsabtreibung,militärisch_Gewalt,Ächtung,Missbrauch,Strafverfolgung,Delikt,vorsätzlich_Tötung,Terrorismus,Vergewaltigung,Regierungskriminalität,Misshandlung,Menschenhandel,Kinderhandel,häuslich_Gewalt,Menschenrechtsorganisation,extralegal_Hinrichtung,politisch_Verfolgung,militärisch_Gewalt,Rechtsverweigerung,Friedenssicherung,Kriminalisierung,Gewalt_gegen_Mann,Menschenrechtsbeauftragte,Frauenhandel,Zwangsprostitution,Folter,Verbrechen_gegen_der_Menschlichkeit,weiblich_Genitalverstümmelung,0.124,0.433,88.0,89.0,88.5,1.03,0.985,1.008,90.0,9
speeches,e42,100,69,Verfassung,Gericht,Grundgesetz,Hongkong,Bundesverfassungsgericht,Partei,Entscheidung,Recht,Amt,Gesetz,Grundrecht,Judikative,Staatsgerichtshof,Vorrang_der_Gesetz,Gesetzgebung,Rechtsgrundlage,Verfassungswidrigkeit,ober-_Gerichtshof,Fachgerichtsbarkeit,Verfassungsrecht,Legislative,ober-_Bundesgericht,Verfassung,Volksvertretung,Verfassungsänderung,ausschließlich_Zuständigkeit,Rechtmäßigkeit,bayerisch_Verfassungsgerichtshof,Abgeordnetengesetz,Finanzverwaltungsgesetz,Verfassungswidrigkeit,bayerisch_Verfassungsgerichtshof,Finanzverwaltungsgesetz,Verfassungsgerichtsbarkeit,spanisch_Verfassungsgericht,Organisationsrecht,ober-_Bundesgericht,Rechtsmittelgericht,Verfassungsgerichtshof_der_Freistaat_Sachs,italienisch_Verfassungsgericht,Verfassungsgrundsatz,Verfassungsvertrag,Abgeordnetengesetz,Bundesverfassungsgerichtsgesetz,Staatsgerichtshof,Verfassungsklage,Verfassungsrecht,Straffreiheitsgesetz,Verfassungsgebung,Gerichtsverfassungsrecht,0.122,0.43,85.0,88.0,86.5,0.991,0.933,0.962,89.0,8
speeches,e42,100,68,Parlament,Rat,Präsident,europäisch_Parlament,Vertrag,Frage,Mitgliedstaat,Vorschlag,Kommission,Konvent,Vorsitzende,Regierungschef,Ausschuss_für_konstitutionell_Frage,parlamentarisch_Versammlung,Rat_für_Auswärtige_Angelegenheit,gemeinsam_Ausschuss,Ausschuss_für_international_Handel,Parlamentsausschuss,Rechtsausschuss,Rat_der_europäisch_Union,Ratsarbeitsgruppe,Ministerrat,Legislative,Ausschuss_für_Entwicklung,Staatsrat,Unterausschuss,Ausschuss,Präsident_der_europäisch_Rat,Abgeordnete,Vizepräsident_der_europäisch_Kommission,Vizepräsident_der_europäisch_Kommission,parlamentarisch_Versammlung,Rat_für_allgemein_Angelegenheit,Präsident_der_europäisch_Parlament,Vorsitzende,gemeinsam_Ausschuss,Ausschuss_für_konstitutionell_Frage,Rechtsausschuss_der_deutsch_Bundestag,Rechtsausschuss,Rat_für_Auswärtige_Angelegenheit,Regierungschef,Verfassungsvertrag,Ausschuss_für_international_Handel,interparlamentarisch_Union,Parlamentsausschuss,Zwischenausschuss,französisch_Parlament,parlamentarisch_Versammlung_der_Europarat,Präsident_der_europäisch_Kommission,europäisch_Rechnungshof,0.115,0.436,83.0,90.0,86.5,0.867,1.048,0.958,88.0,8


In [47]:
combine('o', min_regular_terms=6, min_cnpmi=-0.1, min_pairsim=0.3)

Reading ../data/preprocessed/LDAmodel/noun/bow/topics/OnlineParticipation_noun_bow_topic-candidates.csv
File b'../data/preprocessed/LDAmodel/noun/bow/topics/OnlineParticipation_noun_bow_topic-candidates.csv' does not exist
Loading topics via TopicsLoader
Loading dictionary from ../data/preprocessed/LDAmodel/noun/bow/OnlineParticipation_noun_bow.dict
Loading model from ../data/preprocessed/LDAmodel/noun/bow/e42/OnlineParticipation_LDAmodel_e42_100_ep30
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/OnlineParticipation_noun_bow_label-candidates.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/OnlineParticipation_noun_bow_label-candidates_ftx.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/OnlineParticipation_noun_bow_topic-scores.csv
Reading ../data/preprocessed/LDAmodel/noun/bow/topics/OnlineParticipation_noun_bow_topic-scores_germanet.csv
c_npmi_wikt               -0.021
pairwise_similarity_ftx    0.318
dtype: float64
average difference per topic between the m

Unnamed: 0_level_0,Unnamed: 1_level_0,Unnamed: 2_level_0,Unnamed: 3_level_0,term0,term1,term2,term3,term4,term5,term6,term7,term8,term9,label0_w2v,label1_w2v,label2_w2v,label3_w2v,label4_w2v,label5_w2v,label6_w2v,label7_w2v,label8_w2v,label9_w2v,label10_w2v,label11_w2v,label12_w2v,label13_w2v,label14_w2v,label15_w2v,label16_w2v,label17_w2v,label18_w2v,label19_w2v,label0_ftx,label1_ftx,label2_ftx,label3_ftx,label4_ftx,label5_ftx,label6_ftx,label7_ftx,label8_ftx,label9_ftx,label10_ftx,label11_ftx,label12_ftx,label13_ftx,label14_ftx,label15_ftx,label16_ftx,label17_ftx,label18_ftx,label19_ftx,c_npmi_wikt,pairwise_similarity_ftx,rank_cnpmi,rank_pairsim,rank_mean,c_npmi_wikt_norm,pairwise_similarity_ftx_norm,avg,avg_rank,count_regular_terms
dataset,param_id,nb_topics,topic_idx,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1,Unnamed: 22_level_1,Unnamed: 23_level_1,Unnamed: 24_level_1,Unnamed: 25_level_1,Unnamed: 26_level_1,Unnamed: 27_level_1,Unnamed: 28_level_1,Unnamed: 29_level_1,Unnamed: 30_level_1,Unnamed: 31_level_1,Unnamed: 32_level_1,Unnamed: 33_level_1,Unnamed: 34_level_1,Unnamed: 35_level_1,Unnamed: 36_level_1,Unnamed: 37_level_1,Unnamed: 38_level_1,Unnamed: 39_level_1,Unnamed: 40_level_1,Unnamed: 41_level_1,Unnamed: 42_level_1,Unnamed: 43_level_1,Unnamed: 44_level_1,Unnamed: 45_level_1,Unnamed: 46_level_1,Unnamed: 47_level_1,Unnamed: 48_level_1,Unnamed: 49_level_1,Unnamed: 50_level_1,Unnamed: 51_level_1,Unnamed: 52_level_1,Unnamed: 53_level_1,Unnamed: 54_level_1,Unnamed: 55_level_1,Unnamed: 56_level_1,Unnamed: 57_level_1,Unnamed: 58_level_1,Unnamed: 59_level_1,Unnamed: 60_level_1,Unnamed: 61_level_1,Unnamed: 62_level_1,Unnamed: 63_level_1
OnlineParticipation,e42,100,94,Autofahrer,Radfahrer,Straße,Auto,Bürgersteig,Fahrradweg,Richtung,Fußgänger,Radweg,Spur,Kraftfahrstraße,zweispurig,Bahnkörper,Unterführung,Beschleunigungsstreife,Gehweg,Verkehrsteilnehmer,Gegenverkehr,Fußgängerbrücke,Straßenverkehr,Einbahnstraße,Bundesstraße_482,Stadtautobahn,Autobahn,Nothaltebucht,Parkstand,Fahrradstraße,Straßenkreuzung,Autostraße,einspurig,Kraftfahrstraße,zweispurig,Radfahrstreifen,Unterführung,Gegenverkehr,Fußgängerbrücke,Bahnkörper,Einbahnstraße,Straßenkreuzung,Bundesstraße_482,Fußgängerfurt,Beschleunigungsstreife,Autostraße,Straßenverkehr,Haltestellenkap,Fahrradstraße,Nothaltebucht,Stadtautobahn,Radverkehrsanlage,Verkehrsteilnehmer,0.198,0.512,100.0,100.0,100.0,3.067,3.557,3.312,100.0,10
OnlineParticipation,e42,100,90,Radfahrer,Fußgänger,Ampel,Richtung,Ampelschaltung,Grün,Autofahrer,Fußgängerampel,Radler,Fahrtrichtung,Ampel,Gegenverkehr,Verkehrsteilnehmer,Busschleuse,Beschleunigungsstreife,Bahnübergang,Fahrradstraße,Abbiegen,Radverkehr,Kreisverkehr,Haltestellenkap,Fußgängerfurt,Einbahnstraße,Straßenkreuzung,Kraftfahrstraße,Fußgängerüberweg,Verkehrsstrom,zweispurig,Straßenverkehr,Fussgängerstreife,Gegenverkehr,Haltestellenkap,Fußgängerfurt,Abbiegen,Kraftfahrstraße,Ampel,Beschleunigungsstreife,Verkehrsteilnehmer,Radfahrstreifen,Einbahnstraße,Straßenkreuzung,Verkehrsstrom,Blockumfahrung,Fußgängerüberweg,Bahnübergang,Radverkehrsanlage,Wechselverkehrszeichen,Kreisverkehr,Fahrradstraße,Verkehrsführung,0.194,0.476,99.0,97.0,98.0,3.01,2.902,2.956,99.0,8
OnlineParticipation,e42,100,42,Kind,Schule,Jugendliche,Elter,Kita,Kindergarten,Grundschule,Familie,Zukunft,Erwachsene,Vorschule,Schulklasse,jung_Mensch,Haus_für_Kind,Kindergarten,Kindertagesstätte,Regelschule,Förderschule,sozial_Einrichtung,Schule,Sekundarstufe_I,Kinderkrippe,Grundschule,Krabbelgruppe,Kind,Ganztagsschule,Frühförderstelle,Privatschule,Sekundarschule,Primarschule,Vorschule,Schulkindergarten,jung_Mensch,Regelschule,sozial_Einrichtung,Schulklasse,Grundschulförderklasse,Kindergarten,Familienzentrum,Elternverein,Förderschule,Berufsbildungswerk,Berufsgrundschuljahr,Kindertagesstätte,Vollzeitschulpflicht,Sonderschule,Schule,Mehrfachbehinderung,Mittelpunktschule,Schulstation,0.164,0.484,96.0,99.0,97.5,2.59,3.052,2.821,98.0,8
OnlineParticipation,e42,100,19,Radweg,Weg,Radfahrer,Straße,Fußgänger,Fahrbahn,Stelle,Zustand,Fahrradweg,Richtung,Fußgängerbrücke,Bahnkörper,Kraftfahrstraße,Fahrweg,Straßenbrücke,zweispurig,Unterführung,Sauerlandradring,klein_Straße,Radfernweg_thüringer_Städtekette,Einbahnstraße,Milseburgradweg,Autostraße,einspurig,Beschleunigungsstreife,Gegenverkehr,Staatsstraße_2308,Straßenkreuzung,Stadtautobahn,Fahrradstraße,Fußgängerbrücke,Kraftfahrstraße,Unterführung,Bahnkörper,zweispurig,Radfahrstreifen,klein_Straße,Straßenbrücke,Bundesstraße_482,Straßenkreuzung,Gegenverkehr,Fahrweg,Bundesstraße_53,Bundesstraße_484,Fußgängerfurt,Umfahrungsstraße,Einbahnstraße,Autostraße,Staatsstraße_2308,Sauerlandradring,0.165,0.482,97.0,98.0,97.5,2.602,3.009,2.805,97.0,10
OnlineParticipation,e42,100,68,Fahrradfahrer,Einbahnstraße,Radfahrer,Radverkehr,Straße,Radstreife,Abschnitt,Richtung,Gegenrichtung,Vorrang,Einbahnstraße,Kraftfahrstraße,Beschleunigungsstreife,Fahrradstraße,zweispurig,Fahrtrichtung,Gegenverkehr,Radfahrstreifen,Bahnkörper,Radverkehr,Veloroute,Abbiegen,Verkehrsführung,Straßenkreuzung,einspurig,Wohnstraße,Blockumfahrung,Kreisverkehr,Radfernweg_thüringer_Städtekette,frei_Strecke,Radfahrstreifen,Kraftfahrstraße,Einbahnstraße,Gegenverkehr,Beschleunigungsstreife,Blockumfahrung,Fahrtrichtung,Radverkehrsanlage,Fahrradstraße,zweispurig,Bahnkörper,Fußgängerfurt,Zusatzfahrstreifen,Haltestellenkap,Straßenkreuzung,Verkehrsführung,Zubringerstraße,Abbiegen,Verkehrsstrom,Entlastungsstraße,0.168,0.457,98.0,96.0,97.0,2.651,2.55,2.601,96.0,7
OnlineParticipation,e42,100,96,Richtung,Radweg,Einmündung,Einfahrt,Radfahrer,Süden,Norden,Fahrbahn,Bordstein,Moers,Radfernweg_thüringer_Städtekette,Fußgängerbrücke,Beschleunigungsstreife,Straßenkreuzung,Bahnkörper,Bundesstraße_482,Staatsstraße_2308,U.S._Highway_150,Fahrweg,Bundesstraße_277,Kraftfahrstraße,Straßenbrücke,Autoroute_15,Kreisverkehr,zweispurig,Bundesstraße_195,State_Highway_29,Effnerstraße,Endbahnhof,Route_23,Bundesstraße_228,Bundesstraße_482,Bundesstraße_53,Bundesstraße_484,Bundesstraße_442,Straßenkreuzung,Bundesstraße_427,Staatsstraße_2309,Kraftfahrstraße,Bundesstraße_426,Bundesstraße_99,Fußgängerbrücke,Bundesstraße_16,Bundesstraße_478,Staatsstraße_2308,Bundesstraße_35,Radfernweg_thüringer_Städtekette,Wasserstraßenkreuz,Bundesstraße_98,hinter_der_Bahnhof,0.103,0.419,94.0,94.0,94.0,1.741,1.847,1.794,95.0,8
OnlineParticipation,e42,100,11,Gebäude,Miete,Luft,Stadt,Investor,Kosten,Eigentümer,Mieter,Vermieter,Objekt,Immobilie,Wohneigentum,Baugrundstück,Immobilienfond,Kaltmiete,Mietminderung,Mietgarantie,Bewirtschaftungskosten,Mietausfall,Immobiliengesellschaft,Notargebühr,Mietvertrag,Raumkosten,Vergleichsmiete,Nebenkosten,Miete,Betriebskosten,Wohnungsunternehmen,Grundstück,Leerstand,Wohneigentum,Bewirtschaftungskosten,Immobiliengesellschaft,Immobilie,Immobilienfond,Wohnungsunternehmen,Baugrundstück,Liegenschaftsamt,Mietminderung,Mieterschutz,Raumkosten,kommunal_Wohnungsverwaltung,Teileigentum,Gemeinschaftseigentum,Mietgarantie,Nebenkosten,Vergleichsmiete,Kaltmiete,Sondereigentum,Finanzierungskosten,0.104,0.398,95.0,93.0,94.0,1.749,1.473,1.611,94.0,10
OnlineParticipation,e42,100,79,Auto,Rad,Innenstadt,Straße,Radfahrer,Autoverkehr,Deutz,Freigabe,Auffahrt,Platz,Stadtautobahn,Fußgängerbrücke,zweispurig,Beschleunigungsstreife,Kraftfahrstraße,magdeburger_Ring,Straßenverkehr,Parkstand,Einbahnstraße,Haltestellenkap,Parkplatz,Bahnkörper,Nothaltebucht,Blockumfahrung,Ostwestfalendamm,Fußgängerzone,Unterführung,Individualverkehr,Autostraße,Kreisverkehr,Kraftfahrstraße,Blockumfahrung,Fußgängerbrücke,zweispurig,Haltestellenkap,Zubringerstraße,Stadtautobahn,Bundesstraße_228,Einbahnstraße,Schilderbrücke,Bundesstraße_53,Bundesstraße_484,Freilandstraße,Straßenverkehr,Straßenfahrzeug,Autostraße,Umfahrungsstraße,Industriestraße_Mitte,Straßenkreuzung,Bundesstraße_426,0.072,0.387,92.0,92.0,92.0,1.297,1.261,1.279,92.0,8
OnlineParticipation,e42,100,82,ÖPNV,Stunde,Ausbau,Fahrt,Innenstadt,Parkgebühr,Stadt,KVB,Verkehr,Bahn,Nahverkehr,öffentlich_Personennahverkehr,Verkehrsmittel,Straßenbahn,Stadtbahn,Endbahnhof,Linienverkehr,Schienennetz,öffentlich_Verkehr,Fahrzeit,Berufsverkehr,Stadtbus,Schienenersatzverkehr,Durchmesserlinie,Schienenpersonenverkehr,Schienenpersonennahverkehr,Umsteig,Nachtverkehr,Busbetrieb_Olten_Gösgen_Gäu,Busbahnhof,Nahverkehr,personenverkehr,öffentlich_Personennahverkehr,Gelegenheitsverkehr,Regionalbusverkehr,Verkehrsträgerwechsel,Verkehrsmittel,Betriebsstrecke,Schienenersatzverkehr,Verkehrszeit,Straßenbahn,Stadtbahn,Linienverkehr,Nachtverkehr,Berufsverkehr,öffentlich_Verkehr,Fahrzeit,Verkehrsverbindung,Bedarfsverkehr,Schienennetz,0.086,0.372,93.0,89.0,91.0,1.494,0.993,1.243,91.0,7
OnlineParticipation,e42,100,59,Beschilderung,Recht,Kurve,Reduzierung,Anlieger,Durchgangsverkehr,Sperrung,Durchfahrt,Absenkung,Fahrbahnmarkierung,Verkehrsführung,Straßenausstattung,Gegenverkehr,Kurvenradius,Schwerlastverkehr,Blockstrecke,Verkehrsdichte,Beschleunigungsstreife,Haltestellenkap,Ausbauzustand,Busschleuse,zweispurig,Bahnkörper,Bahnübergang,Zusatzfahrstreifen,Stadtautobahn,Rückstau,frei_Strecke,Kraftfahrstraße,Nebenstrass,Verkehrsführung,Beschleunigungsstreife,Straßenausstattung,Blockumfahrung,Gegenverkehr,Zusatzfahrstreifen,mäßig_Geschwindigkeit,Verkehrsgeschwindigkeit,Verkehrsregelung,Langsamfahrstreifen,Verkehrslenkung,Schutzstreifen,Lieferverkehr,Verkehrsbeeinflussungsanlage,Blockstrecke,Überwerfungsbauwerk,Straßenquerschnitt,Schilderbrücke,Linienverbesserung,Ausbauzustand,0.021,0.386,81.0,91.0,86.0,0.595,1.255,0.925,90.0,6
