Feedback 04052017 #29

Bomberus · 2017-05-04T13:31:49Z

Eigene Anmerkungen

Mitnahme aus vorherigem Feedback

S.8 : Kap. 2.3.3, Stand der Technik sollte mindestens ein paar Seiten umfassen und darstellen, was nicht gelöst ist bzw. warum Ihr dieses Problem angeht.
S.32 : Dimensionsreduktion ist eigentlich bei Euch eine Aggregation, weil Ihr alle Merkmale behalten wollt – tendenziell ist eine Merkmalsauswahl ja auch eine Reduktion…
S.37 : Die Konfusionsmatrix ist keine Methode sondern eine Darstellung des Ergebnisses. Sie kann ja für CV, Lerndaten, Testdaten etc. dargestellt werden.
Ich hätte dann eigentlich auch ganz gerne eine Bewertung von MANOVA o.ä., welche Merkmale tatsächlich für welche Probleme gut geeignet / nicht geeignet sind.
S.59 : Bitte das Ergebniskapitel möglichst schnell schreiben mit klar verständlichen und ausgewerteten Datensätzen, Klassifikationsfehlern, Empfehlungen etc. Hier kommt noch einiges an Arbeit auf Euch zu.

S82

Abschnitt 3.9 keine Vorwärtsverweise (vorher beschreiben)
Was ist in Datenmengen die Anzahl an Wörtern? An Texten ?
"ungefähr gleichverteilt" - in Zahlen
alles was mit Ergebnis zu tun hat in exta Kapitel
"durch eine logarithmische Kurve annähern, ..." Logarithmus steigt ins Unendliche?
Schrift im Bild zu klein

S83

Bild nicht lesbar
Abb 3.3 keine Ahnung was ihr hiermit sagen wollt, sind das Güten der besten Merkmale, nach welchen Kriterium ? Müssen Kriterien nicht an Suchalgorithmus angepasst werden ? oder Klassifikationsfehler basiert?

S84

„Dabei fällt auf, dass die BOW-Merkmale die Rangliste aufgrund ihrer schieren Anzahl dominieren.“ - wo fällt das im Bild auf??
Tabelle ist schwer verständlich!
Welche zusätzliche Information bringt Abb. 3.4? Habt Ihr dem Leser erklärt, was ein Violin-Plot ist?

S85

Kap. 3.7.1 ist nicht geschrieben, oder?
Kap. 3.7.2.: Den Verlauf kann der Leser selbst ablesen, Ihr solltet interpretieren, warum das so ist, und wie es sich verbessern ließe. Denn eigentlich sollten die Verfahren ja in etwa diegleichen Merkmale auswählen!?

S86

2x „welche“
Die Aussage von 3.7.3 würde ich in eine Tabelle einfügen.

S87

Ein paar charakteristische Beispiele aus der Abbildung würde ich im Text disktuieren, z.B. Text aus eindeutigen Clustern oder Texte, die aus dem Durcheinander in der Mitte stammen. Warum ist das so? - [ ] Was ist schief gelaufen?

S88

In Abbildung 3.6 ist im Vergleich die Dimensionsreduktion mit der Hauptkomponentenanalyse auf zwei Komponenten zu sehen“ – nein, hier ist nur die Hauptkomponentenanalyse zu sehen. Warum überhaupt – ist das Bild notwendig?

S89

Prozesspipeline müsst Ihr am Anfang des Ergebniskapitels darstellen und erklären.
Bitte genau erklären, welche Verfahren Ihr mit welchen Parametern benutzt. Das Kapitel ist gut, wenn sich die Pipeline nachbauen lässt.

S90

3.10.1: Tabelle in Abh. v. Parametern (3.7) weiter nach vorne.
Warum sind manche Verfahren so schlecht?

S91

Bitte genau die Effekte erklären, hiervon lebt Eure Arbeit. Beispiel: „Bedenklicher sind hingegen die Unterschiede zwischen den Klassen. Mit 0, 98 hat „Sports“ ein nahezu perfektes F1-Maß. Auch die Klassen „Arts“ und „Style“ haben mit je 0, 88 und 0, 89 einen sehr guten Wert. Mit etwas Abstand am niedrigsten ist das F1-Maß der Klasse „Science“ (0, 75). Auch die Klassen „Technology“ (0, 80), „Health“ (0, 82) und „Opinion“ (0, 81) verdienen ein Augenmerk.“ - die Werte kann ich der Tabelle entnehmen, aber woher stammen die Werte – sind es die Merkmale? Oder schlechte Lerndatensätze? Oder oder?

S92

„dass „Science“-Artikel in 19 Prozent aller Fälle in die Klassen der „Technology“- (12 %) oder „Health“-Artikel (7 %) eingeordnet werden.“ – bitte alle Aussagen werten und interpretieren. Es ist ja durchaus sinnvoll, was der Klassifikator macht, da Science einfach kein abgeschlossenes Gebiet ist.

S93

Interessant wäre u.U. noch, welche Klassen bei Fehlklassifkationen auf dem „zweiten“ Platz gelandet sind. Das macht aber Arbeit…

S94

Bitte nicht nur die Beispiele nennen und beschreiben, sondern auch deuten. Warum ist das so, und was müsste geändert werden. Das folgt zwar in Teilen auf S.95 kann aber noch viel ausführlicher sein. U.U. würde ich das sogar in eine neues Kapitel „Diskussion“ einfügen

S95

„Mögliche Maßnahmen bestehen aus folgenden Punkten:“ – das müsste eigentlich alles schon zu Beginn stehen. So präsentiert Ihr jetzt Ergebnisse, und nachdem man sich durch 10 Seiten gelesen habt, sagt Ihr, dass das nicht das finale Ergebnis ist!?

S96

Bitte klar motivieren, welchen Benefit Ihr Euch versprecht.

S97

Tabellen im Text beschreiben und interpretieren.

S98

Wenn Ihr hier Eure Ergebnisse durch weitere Klassifkationsmodelle verbessern wollt, müsst Ihr das im Vorfeld zumindest ankündigen.
„Die Kombination der Klassifikatoren konnte die Korrektklassifikationsrate
auf 88,80 Prozent steigern“ – Interpretation: Warum kumulieren die richtigen Ergebnisse und nicht die falschen?

S99

Braucht man Tabelle 3.13?
„Allerdings muss berücksichtigt werden, dass sich die Daten wesentlich von den Trainingsdaten unterscheiden.“ - das gehört beispielsweise in die Interpretation des Ergebnisses.
Diskutiert u.U. später das Einführen einer Rückweisungsklasse (=„weiß nicht“)

S100

Tabelle 3.14 nach vorne.
Kapitel 3.15 u.U. in Implementierung umbenennen und so ausführlich wie möglich. An dieser Stelle müsst Ihr den Leser beeindrucken, wie viel in wie kurzer Zeit entstanden ist, wie einfach es anzuwenden ist, wie gut es weiterzugeben ist etc.

Sonstiges

Das Ergebniskapitel ist schwer verständlich, unstrukturiert und Interpretationen fehlen – das könnt Ihr so keinem Leser zumuten. Bitte grundlegend überarbeiten. Ich würde Top-Down beschreiben. Zuerst, wie gut die Klassifikation (in %) ist, danach die einzelnen Teile wie Merkmalsselektion etc.
Rechenzeiten und Möglichkeiten, sie zu optimieren, wären interessant
Wie sieht die Implementierung aus – ist das eine GUI oder Kommandozeilen-Code? Wieviel Quelltext ist entstanden? Kann man den in den Anhang packen?
Am Ende muss eine Empfehlung an den Leser stehen, wie er ein solches System aufzubauen hat.
Überlegt Euch, ein Diskussionskapitel einzuführen, in dem Ihr die Ergebnisse diskutiert, offene Fragen formuliert und dem Leser sagt, was er nun alles kann, was er vorher nicht konnte.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Feedback 04052017 #29

Feedback 04052017 #29

Bomberus commented May 4, 2017 •

edited

Loading

Feedback 04052017 #29

Feedback 04052017 #29

Comments

Bomberus commented May 4, 2017 • edited Loading

Eigene Anmerkungen

Mitnahme aus vorherigem Feedback

S82

S83

S84

S85

S86

S87

S88

S89

S90

S91

S92

S93

S94

S95

S96

S97

S98

S99

S100

Sonstiges

Bomberus commented May 4, 2017 •

edited

Loading