You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Designfehler bei Benchmark-Testdatensätze ( nur Punkt und Verweis in einer Zeile )
Tabellenheader fett (konsistent)
Datenqualität im Eigenkapitel beschreiben, Theorie ins Grundlagenkapitel
Quellen für Metaalgorithmen, BOW (insb. Bewertungsfunktionen und N-Gramme) Rauschen und Ausreißer
Abschnitt "Betrachtung einiger Beispiele" – Die Links ragen über den Textrand hinaus
TDM-Matrix: Schräge Punkte
Testdatensatz C in Merkmalsvektor einfügen
Kapitel 2.6.3 zu kurz! (Fehlende Daten) sowie Skip-Gram-Model (Zusammenlegen oder mehr schreiben)
Abbildung 3.3 sehr niedrig auflösend
Mitnahme aus vorherigem Feedback
S.8 : Kap. 2.3.3, Stand der Technik sollte mindestens ein paar Seiten umfassen und darstellen, was nicht gelöst ist bzw. warum Ihr dieses Problem angeht.
S.32 : Dimensionsreduktion ist eigentlich bei Euch eine Aggregation, weil Ihr alle Merkmale behalten wollt – tendenziell ist eine Merkmalsauswahl ja auch eine Reduktion…
S.37 : Die Konfusionsmatrix ist keine Methode sondern eine Darstellung des Ergebnisses. Sie kann ja für CV, Lerndaten, Testdaten etc. dargestellt werden.
Ich hätte dann eigentlich auch ganz gerne eine Bewertung von MANOVA o.ä., welche Merkmale tatsächlich für welche Probleme gut geeignet / nicht geeignet sind.
S.59 : Bitte das Ergebniskapitel möglichst schnell schreiben mit klar verständlichen und ausgewerteten Datensätzen, Klassifikationsfehlern, Empfehlungen etc. Hier kommt noch einiges an Arbeit auf Euch zu.
S82
Abschnitt 3.9 keine Vorwärtsverweise (vorher beschreiben)
Was ist in Datenmengen die Anzahl an Wörtern? An Texten ?
"ungefähr gleichverteilt" - in Zahlen
alles was mit Ergebnis zu tun hat in exta Kapitel
"durch eine logarithmische Kurve annähern, ..." Logarithmus steigt ins Unendliche?
Schrift im Bild zu klein
S83
Bild nicht lesbar
Abb 3.3 keine Ahnung was ihr hiermit sagen wollt, sind das Güten der besten Merkmale, nach welchen Kriterium ? Müssen Kriterien nicht an Suchalgorithmus angepasst werden ? oder Klassifikationsfehler basiert?
S84
„Dabei fällt auf, dass die BOW-Merkmale die Rangliste aufgrund ihrer schieren Anzahl dominieren.“ - wo fällt das im Bild auf??
Tabelle ist schwer verständlich!
Welche zusätzliche Information bringt Abb. 3.4? Habt Ihr dem Leser erklärt, was ein Violin-Plot ist?
S85
Kap. 3.7.1 ist nicht geschrieben, oder?
Kap. 3.7.2.: Den Verlauf kann der Leser selbst ablesen, Ihr solltet interpretieren, warum das so ist, und wie es sich verbessern ließe. Denn eigentlich sollten die Verfahren ja in etwa diegleichen Merkmale auswählen!?
S86
2x „welche“
Die Aussage von 3.7.3 würde ich in eine Tabelle einfügen.
S87
Ein paar charakteristische Beispiele aus der Abbildung würde ich im Text disktuieren, z.B. Text aus eindeutigen Clustern oder Texte, die aus dem Durcheinander in der Mitte stammen. Warum ist das so? - [ ] Was ist schief gelaufen?
S88
In Abbildung 3.6 ist im Vergleich die Dimensionsreduktion mit der Hauptkomponentenanalyse auf zwei Komponenten zu sehen“ – nein, hier ist nur die Hauptkomponentenanalyse zu sehen. Warum überhaupt – ist das Bild notwendig?
S89
Prozesspipeline müsst Ihr am Anfang des Ergebniskapitels darstellen und erklären.
Bitte genau erklären, welche Verfahren Ihr mit welchen Parametern benutzt. Das Kapitel ist gut, wenn sich die Pipeline nachbauen lässt.
S90
3.10.1: Tabelle in Abh. v. Parametern (3.7) weiter nach vorne.
Warum sind manche Verfahren so schlecht?
S91
Bitte genau die Effekte erklären, hiervon lebt Eure Arbeit. Beispiel: „Bedenklicher sind hingegen die Unterschiede zwischen den Klassen. Mit 0, 98 hat „Sports“ ein nahezu perfektes F1-Maß. Auch die Klassen „Arts“ und „Style“ haben mit je 0, 88 und 0, 89 einen sehr guten Wert. Mit etwas Abstand am niedrigsten ist das F1-Maß der Klasse „Science“ (0, 75). Auch die Klassen „Technology“ (0, 80), „Health“ (0, 82) und „Opinion“ (0, 81) verdienen ein Augenmerk.“ - die Werte kann ich der Tabelle entnehmen, aber woher stammen die Werte – sind es die Merkmale? Oder schlechte Lerndatensätze? Oder oder?
S92
„dass „Science“-Artikel in 19 Prozent aller Fälle in die Klassen der „Technology“- (12 %) oder „Health“-Artikel (7 %) eingeordnet werden.“ – bitte alle Aussagen werten und interpretieren. Es ist ja durchaus sinnvoll, was der Klassifikator macht, da Science einfach kein abgeschlossenes Gebiet ist.
S93
Interessant wäre u.U. noch, welche Klassen bei Fehlklassifkationen auf dem „zweiten“ Platz gelandet sind. Das macht aber Arbeit…
S94
Bitte nicht nur die Beispiele nennen und beschreiben, sondern auch deuten. Warum ist das so, und was müsste geändert werden. Das folgt zwar in Teilen auf S.95 kann aber noch viel ausführlicher sein. U.U. würde ich das sogar in eine neues Kapitel „Diskussion“ einfügen
S95
„Mögliche Maßnahmen bestehen aus folgenden Punkten:“ – das müsste eigentlich alles schon zu Beginn stehen. So präsentiert Ihr jetzt Ergebnisse, und nachdem man sich durch 10 Seiten gelesen habt, sagt Ihr, dass das nicht das finale Ergebnis ist!?
S96
Bitte klar motivieren, welchen Benefit Ihr Euch versprecht.
S97
Tabellen im Text beschreiben und interpretieren.
S98
Wenn Ihr hier Eure Ergebnisse durch weitere Klassifkationsmodelle verbessern wollt, müsst Ihr das im Vorfeld zumindest ankündigen.
„Die Kombination der Klassifikatoren konnte die Korrektklassifikationsrate
auf 88,80 Prozent steigern“ – Interpretation: Warum kumulieren die richtigen Ergebnisse und nicht die falschen?
S99
Braucht man Tabelle 3.13?
„Allerdings muss berücksichtigt werden, dass sich die Daten wesentlich von den Trainingsdaten unterscheiden.“ - das gehört beispielsweise in die Interpretation des Ergebnisses.
Diskutiert u.U. später das Einführen einer Rückweisungsklasse (=„weiß nicht“)
S100
Tabelle 3.14 nach vorne.
Kapitel 3.15 u.U. in Implementierung umbenennen und so ausführlich wie möglich. An dieser Stelle müsst Ihr den Leser beeindrucken, wie viel in wie kurzer Zeit entstanden ist, wie einfach es anzuwenden ist, wie gut es weiterzugeben ist etc.
Sonstiges
Das Ergebniskapitel ist schwer verständlich, unstrukturiert und Interpretationen fehlen – das könnt Ihr so keinem Leser zumuten. Bitte grundlegend überarbeiten. Ich würde Top-Down beschreiben. Zuerst, wie gut die Klassifikation (in %) ist, danach die einzelnen Teile wie Merkmalsselektion etc.
Rechenzeiten und Möglichkeiten, sie zu optimieren, wären interessant
Wie sieht die Implementierung aus – ist das eine GUI oder Kommandozeilen-Code? Wieviel Quelltext ist entstanden? Kann man den in den Anhang packen?
Am Ende muss eine Empfehlung an den Leser stehen, wie er ein solches System aufzubauen hat.
Überlegt Euch, ein Diskussionskapitel einzuführen, in dem Ihr die Ergebnisse diskutiert, offene Fragen formuliert und dem Leser sagt, was er nun alles kann, was er vorher nicht konnte.
The text was updated successfully, but these errors were encountered:
Eigene Anmerkungen
Mitnahme aus vorherigem Feedback
S82
S83
S84
S85
S86
S87
S88
S89
S90
Warum sind manche Verfahren so schlecht?
S91
S92
S93
S94
S95
S96
S97
S98
S99
S100
Sonstiges
The text was updated successfully, but these errors were encountered: