Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Feedback 04052017 #29

Open
21 of 56 tasks
Bomberus opened this issue May 4, 2017 · 0 comments
Open
21 of 56 tasks

Feedback 04052017 #29

Bomberus opened this issue May 4, 2017 · 0 comments

Comments

@Bomberus
Copy link

Bomberus commented May 4, 2017

Eigene Anmerkungen

  • Designfehler bei backslashbox-en
  • New Page bei Merkmalstabelle!
  • Designfehler bei Benchmark-Testdatensätze ( nur Punkt und Verweis in einer Zeile )
  • Tabellenheader fett (konsistent)
  • Datenqualität im Eigenkapitel beschreiben, Theorie ins Grundlagenkapitel
  • Quellen für Metaalgorithmen, BOW (insb. Bewertungsfunktionen und N-Gramme) Rauschen und Ausreißer
  • Abschnitt "Betrachtung einiger Beispiele" – Die Links ragen über den Textrand hinaus
  • TDM-Matrix: Schräge Punkte
  • Testdatensatz C in Merkmalsvektor einfügen
  • Kapitel 2.6.3 zu kurz! (Fehlende Daten) sowie Skip-Gram-Model (Zusammenlegen oder mehr schreiben)
  • Abbildung 3.3 sehr niedrig auflösend

Mitnahme aus vorherigem Feedback

  • S.8 : Kap. 2.3.3, Stand der Technik sollte mindestens ein paar Seiten umfassen und darstellen, was nicht gelöst ist bzw. warum Ihr dieses Problem angeht.
  • S.32 : Dimensionsreduktion ist eigentlich bei Euch eine Aggregation, weil Ihr alle Merkmale behalten wollt – tendenziell ist eine Merkmalsauswahl ja auch eine Reduktion…
  • S.37 : Die Konfusionsmatrix ist keine Methode sondern eine Darstellung des Ergebnisses. Sie kann ja für CV, Lerndaten, Testdaten etc. dargestellt werden.
  • Ich hätte dann eigentlich auch ganz gerne eine Bewertung von MANOVA o.ä., welche Merkmale tatsächlich für welche Probleme gut geeignet / nicht geeignet sind.
  • S.59 : Bitte das Ergebniskapitel möglichst schnell schreiben mit klar verständlichen und ausgewerteten Datensätzen, Klassifikationsfehlern, Empfehlungen etc. Hier kommt noch einiges an Arbeit auf Euch zu.

S82

  • Abschnitt 3.9 keine Vorwärtsverweise (vorher beschreiben)
  • Was ist in Datenmengen die Anzahl an Wörtern? An Texten ?
  • "ungefähr gleichverteilt" - in Zahlen
  • alles was mit Ergebnis zu tun hat in exta Kapitel
  • "durch eine logarithmische Kurve annähern, ..." Logarithmus steigt ins Unendliche?
  • Schrift im Bild zu klein

S83

  • Bild nicht lesbar
  • Abb 3.3 keine Ahnung was ihr hiermit sagen wollt, sind das Güten der besten Merkmale, nach welchen Kriterium ? Müssen Kriterien nicht an Suchalgorithmus angepasst werden ? oder Klassifikationsfehler basiert?

S84

  • „Dabei fällt auf, dass die BOW-Merkmale die Rangliste aufgrund ihrer schieren Anzahl dominieren.“ - wo fällt das im Bild auf??
  • Tabelle ist schwer verständlich!
  • Welche zusätzliche Information bringt Abb. 3.4? Habt Ihr dem Leser erklärt, was ein Violin-Plot ist?

S85

  • Kap. 3.7.1 ist nicht geschrieben, oder?
  • Kap. 3.7.2.: Den Verlauf kann der Leser selbst ablesen, Ihr solltet interpretieren, warum das so ist, und wie es sich verbessern ließe. Denn eigentlich sollten die Verfahren ja in etwa diegleichen Merkmale auswählen!?

S86

  • 2x „welche“
  • Die Aussage von 3.7.3 würde ich in eine Tabelle einfügen.

S87

  • Ein paar charakteristische Beispiele aus der Abbildung würde ich im Text disktuieren, z.B. Text aus eindeutigen Clustern oder Texte, die aus dem Durcheinander in der Mitte stammen. Warum ist das so? - [ ] Was ist schief gelaufen?

S88

  • In Abbildung 3.6 ist im Vergleich die Dimensionsreduktion mit der Hauptkomponentenanalyse auf zwei Komponenten zu sehen“ – nein, hier ist nur die Hauptkomponentenanalyse zu sehen. Warum überhaupt – ist das Bild notwendig?

S89

  • Prozesspipeline müsst Ihr am Anfang des Ergebniskapitels darstellen und erklären.
  • Bitte genau erklären, welche Verfahren Ihr mit welchen Parametern benutzt. Das Kapitel ist gut, wenn sich die Pipeline nachbauen lässt.

S90

  • 3.10.1: Tabelle in Abh. v. Parametern (3.7) weiter nach vorne.
    Warum sind manche Verfahren so schlecht?

S91

  • Bitte genau die Effekte erklären, hiervon lebt Eure Arbeit. Beispiel: „Bedenklicher sind hingegen die Unterschiede zwischen den Klassen. Mit 0, 98 hat „Sports“ ein nahezu perfektes F1-Maß. Auch die Klassen „Arts“ und „Style“ haben mit je 0, 88 und 0, 89 einen sehr guten Wert. Mit etwas Abstand am niedrigsten ist das F1-Maß der Klasse „Science“ (0, 75). Auch die Klassen „Technology“ (0, 80), „Health“ (0, 82) und „Opinion“ (0, 81) verdienen ein Augenmerk.“ - die Werte kann ich der Tabelle entnehmen, aber woher stammen die Werte – sind es die Merkmale? Oder schlechte Lerndatensätze? Oder oder?

S92

  • „dass „Science“-Artikel in 19 Prozent aller Fälle in die Klassen der „Technology“- (12 %) oder „Health“-Artikel (7 %) eingeordnet werden.“ – bitte alle Aussagen werten und interpretieren. Es ist ja durchaus sinnvoll, was der Klassifikator macht, da Science einfach kein abgeschlossenes Gebiet ist.

S93

  • Interessant wäre u.U. noch, welche Klassen bei Fehlklassifkationen auf dem „zweiten“ Platz gelandet sind. Das macht aber Arbeit…

S94

  • Bitte nicht nur die Beispiele nennen und beschreiben, sondern auch deuten. Warum ist das so, und was müsste geändert werden. Das folgt zwar in Teilen auf S.95 kann aber noch viel ausführlicher sein. U.U. würde ich das sogar in eine neues Kapitel „Diskussion“ einfügen

S95

  • „Mögliche Maßnahmen bestehen aus folgenden Punkten:“ – das müsste eigentlich alles schon zu Beginn stehen. So präsentiert Ihr jetzt Ergebnisse, und nachdem man sich durch 10 Seiten gelesen habt, sagt Ihr, dass das nicht das finale Ergebnis ist!?

S96

  • Bitte klar motivieren, welchen Benefit Ihr Euch versprecht.

S97

  • Tabellen im Text beschreiben und interpretieren.

S98

  • Wenn Ihr hier Eure Ergebnisse durch weitere Klassifkationsmodelle verbessern wollt, müsst Ihr das im Vorfeld zumindest ankündigen.
  • „Die Kombination der Klassifikatoren konnte die Korrektklassifikationsrate
  • auf 88,80 Prozent steigern“ – Interpretation: Warum kumulieren die richtigen Ergebnisse und nicht die falschen?

S99

  • Braucht man Tabelle 3.13?
  • „Allerdings muss berücksichtigt werden, dass sich die Daten wesentlich von den Trainingsdaten unterscheiden.“ - das gehört beispielsweise in die Interpretation des Ergebnisses.
  • Diskutiert u.U. später das Einführen einer Rückweisungsklasse (=„weiß nicht“)

S100

  • Tabelle 3.14 nach vorne.
  • Kapitel 3.15 u.U. in Implementierung umbenennen und so ausführlich wie möglich. An dieser Stelle müsst Ihr den Leser beeindrucken, wie viel in wie kurzer Zeit entstanden ist, wie einfach es anzuwenden ist, wie gut es weiterzugeben ist etc.

Sonstiges

  • Das Ergebniskapitel ist schwer verständlich, unstrukturiert und Interpretationen fehlen – das könnt Ihr so keinem Leser zumuten. Bitte grundlegend überarbeiten. Ich würde Top-Down beschreiben. Zuerst, wie gut die Klassifikation (in %) ist, danach die einzelnen Teile wie Merkmalsselektion etc.
  • Rechenzeiten und Möglichkeiten, sie zu optimieren, wären interessant
  • Wie sieht die Implementierung aus – ist das eine GUI oder Kommandozeilen-Code? Wieviel Quelltext ist entstanden? Kann man den in den Anhang packen?
  • Am Ende muss eine Empfehlung an den Leser stehen, wie er ein solches System aufzubauen hat.
  • Überlegt Euch, ein Diskussionskapitel einzuführen, in dem Ihr die Ergebnisse diskutiert, offene Fragen formuliert und dem Leser sagt, was er nun alles kann, was er vorher nicht konnte.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

1 participant