Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Feedback #27

Open
31 of 50 tasks
ScientiaEtVeritas opened this issue Apr 26, 2017 · 0 comments
Open
31 of 50 tasks

Feedback #27

ScientiaEtVeritas opened this issue Apr 26, 2017 · 0 comments
Assignees

Comments

@ScientiaEtVeritas
Copy link
Contributor

ScientiaEtVeritas commented Apr 26, 2017

Eigene Anmerkungen

  • 2 Tabellen ragen über den Rand hinaus
  • Designfehler bei backslashbox-en
  • Designfehler bei Benchmark-Testdatensätze ( nur Punkt und Verweis in einer Zeile )
  • Tabellenheader fett (konsistent)
  • Fehlerhafte durchschnittliche Wortlänge in BOW-Tabelle
  • 4. Ebene bei Auswahl der Methoden
  • Chi-Quadrat-Kontigenztabelle : Pünktchen einfügen -> ...
  • Datenqualität im Eigenkapitel beschreiben, Theorie ins Grundlagenkapitel
  • Quellen für Metaalgorithmen, BOW (insb. Bewertungsfunktionen und N-Gramme) Rauschen und Ausreißer
  • Abschnitt "Betrachtung einiger Beispiele" – Die Links ragen über den Textrand hinaus
  • TDM-Matrix: Schräge Punkte
  • Testdatensatz C in Merkmalsvektor einfügen
  • Kapitel 2.6.3 zu kurz! (Fehlende Daten) sowie Skip-Gram-Model (Zusammenlegen oder mehr schreiben)
  • Abbildung 3.3 sehr niedrig auflösend

Grundsätzliches – hier habe ich in Großteilen die Elemente meiner letzten Mail anzumerken:

  • Ihr fallt gleich mit der Tür ins Haus, beschreibt doch in Kapitel 2 []auf ca. 5 Seiten den Stand der Technik, welche Gruppen und Arbeiten es gibt, wo die Probleme bestehen und warum Eure Arbeit wichtig ist.
  • Eure theoretische Herleitung wäre anhand eines Benchmark-Datensatzes o.ä. wesentlich einfacher zu erklären. Ihr greift oft auf nicht defnierte Begriffe, z.B. Merkmale zu.
  • Mir fehlen grundsätzlich Verweise auf andere Arbeiten. Alle Abschnitte klingen so, als wärt Ihr die einzigen, die sich mit der entsprechenden Problematik beschäftigen. Gebt dem Leser die Möglichkeit, sich an allen Stellen selbst fortzubilden.

Konkretes:

  • S.2 + 3 : Ich würde die Anzahl an „ „-Begriffen minimieren.
  • S.4:
    : Mehrklassenklassifikation nicht verstanden: Gleiche Merkmale können in div. Ausgabeklassen unterteilt werden, z.B. Hund und Säugetier!!!
  • S.5 : Im Bild „Klassifikation“ erwähnen
  • S.6 : Die zitierten Abschnitte sollten in der richtigen Reihenfolge genannt werden.
  • S.8 : Kap. 2.3.3, Stand der Technik sollte mindestens ein paar Seiten umfassen und darstellen, was nicht gelöst ist bzw. warum Ihr dieses Problem angeht.
  • S.9 : Kap. 2.4.4, etwas auf den Begriff Dilemma eingehen.
  • Eure Unterkapitel sind grundsätzlich sehr kurz, ich würde mir überlegen mehr zu schreiben, oder mehrere Kapitel zusammenzufassen.
  • S.10 : weißt  weist
  • Rauschen ist meist eine Störung, die Merkmale im möglichen Bereich liefert und anhand von vielen (!) Daten gesehene werden kann, hier habt Ihr eher einen Ausreißer.
  • S.11 : Managergehalt ist kein Ausreißer, nur wenn Ihr Manager eigentlich nicht messen wolltet.
  • S.12 : Ich würde Kap. 2.7 mit einer Übersicht beginnen, was nun alles kommt.
  • S.17 : Warum steht Rauschen in „“? Ist das Rauschen? Wenn ja, warum?
  • S.19 : Tabelle im Fließtext.
  • Wann betont Ihr durch fett, wann durch kursiv? Bitte einheitlich.
  • S.20 : Kapitel 2.9 beginnt ohne Unterkapitel.
  • Bitte 2.9.1 schreiben.
  • S.21 : Überschrift „Chi-Quadrat“ nicht aussagekräfig.
  • Tabelle im Fließtext.
  • Wenn Ihr in Kapitel 2.9 verschiedene Methoden beschreibt, solltet Ihr sie auch in Eurem Kontext vergleichen, denn sonst ist das ja reines Lehrbuchwissen, das in den Anhang gehört. (SKALIERUNG)
  • S.23 : Das Gleiche gilt in Kap. 2.10 – setzt es in Euren Kontext. (MERKMALSSELEKTION)
  • S.25 : Anhand dieser Erklärung versteht niemand, wie Bag-of-Words funktioniert. Verwendet ein Beispiel zur Einführung.
  • Warum wird das gemacht, was ist das Ziel, warum macht man es nicht anders?
  • S.27 : Tabelle 2.5 – schwer nachzuvollziehen, wo die Wörter herkommen. Nochmal erwähnen.
  • S.28ff : Klassifizierungs-Verfahren nicht nur beschreiben, sondern in Euren Kontext setzen.
  • S.32 : Dimensionsreduktion ist eigentlich bei Euch eine Aggregation, weil Ihr alle Merkmale behalten wollt – tendenziell ist eine Merkmalsauswahl ja auch eine Reduktion…
  • S.36 : Wie findet Ihr denn nun optimale Hyperparameter – Bewertung von Crossvaldierungen?
  • S.37 : Die Konfusionsmatrix ist keine Methode sondern eine Darstellung des Ergebnisses. Sie kann ja für CV, Lerndaten, Testdaten etc. dargestellt werden.
  • U.U. noch Bootstrap erwähnen.
  • S.44 : Tabelle sehr schön – das sieht nach Konzeption aus.
  • S.51 : Ebenso. Achtung in der Tabelle steht Crawler, der Abschnitt hieß Crawling.
  • S.54 : Bei allen Merkmalen erwähnen, warum Ihr sie einführt bzw. für wichtig haltet.
  • Ich hätte dann eigentlich auch ganz gerne eine Bewertung von MANOVA o.ä., welche Merkmale tatsächlich für welche Probleme gut geeignet / nicht geeignet sind.
  • S.59 : Bitte das Ergebniskapitel möglichst schnell schreiben mit klar verständlichen und ausgewerteten Datensätzen, Klassifikationsfehlern, Empfehlungen etc. Hier kommt noch einiges an Arbeit auf Euch zu.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants