Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Feedback #22

Open
50 of 60 tasks
ScientiaEtVeritas opened this issue Mar 7, 2017 · 0 comments
Open
50 of 60 tasks

Feedback #22

ScientiaEtVeritas opened this issue Mar 7, 2017 · 0 comments
Assignees

Comments

@ScientiaEtVeritas
Copy link
Contributor

ScientiaEtVeritas commented Mar 7, 2017

S.2

S.3

  • Klassifizierung und Klassifikation scheint mir unlogisch zu sein, insbesondere, da die zitierte Literatur englisch ist!?
  • Mehrklassenklassifikation nicht verstanden: Gleiche Merkmale können in div. Ausgabeklassen unterteilt werden, z.B. Hund und Säugetier!!!

S.4

  • Warum ist die Abbildung englisch??
  • „In Abbildung 2.4 wird dargestellt“ .  Abb. 2.1??
  • Die Beschreibung der Abbildung ist deutlich detaillierter, als die Abbildung selbst. Anpassen!
  • „Definition“ heißt im Kapitel obendran „Textdefinition“

S.5

  • Bild im Textabschnitt.
  • Multilabelklassifikation klar gegen Mehrklassenklassifikation abgrenzen. U.U. auf Denglisch verzichten.
  • „Tokenization“ etc. werden dem Leser hier „um die Ohren gehauen“, zumindest kurz erklären.
  • dessen  deren.

S.6

  • Zwei Sätze beginnen mit „So“
  • S.6: weißt  weist
  • S.6: Beispiel 2.1, meint Ihr Tabelle 2.1?
  • Beispiel schlecht/falsch: Unter Rauschen werden landläufig ein Fehler desgleichen Typs verstanden, Eurem Fall also Alter.
  • Viele Zeichensetzungsfehler

S.7

  • „Es mussberücksichtigt werden, dass Datensätze.“
  • Nochmal: Vermeidet „man“ und Konjunktive!!

S.8

  • Zu allen Methoden müsst Ihr Literatur angeben, welche Arbeitsgruppen mit dem Thema gearbeitet haben, mit welchen Ergebnissen etc.
  • Beispiele für Stoppwörter

S.9

  • Merkmale müssen nicht numerisch sein. Ihr könnt es so definieren.
  • Tabelle als Abbildung zitiert. Suchen und Ersetzen!
  • Punkte immer ans Ende der Formeln.
  • „wirklich zu verstehen.“ klingt nicht wissenschaftlich
  • In Merkmalsextraktion beschreibt Ihr wieder Merkmale, Kap nach oben.

S.10

  • Ist Abb.2.3 notwendig?
  • Merkmalsselektion senkt auch die Anzahl später zu schätzender Parameter  robuster
  • Das Beschreiben von ANOVA halte ich für unnötig, dafür gibt es Lehrbücher, i.d. Anhang? ANOVA ist im Übrigen für Euch nicht einsetzbar (Merkmalskombinationen werden nicht betrachtet), Ihr braucht das multivariate Äquivalent MANOVA.
  • Welche anderen Formen der Merkmalsauswahl gibt es? Support-Vektor-Maschinen, Deep-Learning etc.

S.13

  • Kap. 2.6.4: Ihr beschreibt Merkmale, ohne sie erklärt zu haben.
  • In welchen Fällen kann diese Formel nicht verwendet werden? Was macht man dann?

S.14

  • S.o.
  • Satzend-Punkte nach Formeln.
  • Vier Kapitelhierarchien sind zu viel.
  • Ziel der Matrix zumindest andeuten

S.15

  • Schwer zu verstehen. Was meint Ihr mit Dokumenthäufigkeit? Korpus?
  • Formelzeichen im Text andere als in der Formel.
  • Physische Bedeutung anhand eines Beispiels!

S.16

  • 2.8 nicht verständlich, „Bias und Varianz“ von was? Entwurf von Klass.-verfahren bislang noch nicht beschrieben.
  • 2.8.1.1 Formel!
  • 2.8.1.2 Nicht verständlich ohne Entwurf v. Klass.-verfahren.

S.17

  • „eine Dimension im Datensatz“ falsch  Merkmalsraum
  • Was ist nun der „Fluch der Dimenionalität“  Anz. Zu schätzender Parameter steigt exponentiell, daher schlechte Vorhersagequalität
  • Bei PCA muss zumindest das Wort Linearkombination fallen. Wie werden sie berechnet?
  • Wie Ihr die Singulärwertzerlegung einsetzt, ist nicht klar.

S.18

  • „gewisse“
  • Verstehe nicht, was Ihr mit Hyperparametern meint.

S.19

  • Beschreibt Ihr hier „Wrapper“-Ansätze? Bewertung von Parametern anhand von Klassifkationsgüten (z.B. über Lerndaten)?
  • Die Abschnitte wirken abgeschrieben und nicht verstanden. Braucht Ihr das wirklich?

S.20

  • Evaluation  Crossvalidierung, LOO, Bootstrap, Lern- vs. Testdaten etc., nicht sicher, ob Ihr so weit ins Detail sollt / wollt.

S.21

  • Kapitel 3 wirkt durchdachter

S.26

  • Nochmal klares Fazit: Python wird verwendet!
  • Auf wieviele Datenpunkte ist Euer Datensatz denn nun beschränkt?

S.28

  • Nicht klar, warum nun ein Kapitel „Crawling“ folgt.
  • Testdatensätze sind systematisch anders als der Lerndatensatz. Das solltet Ihr zumindest diskutieren.

S.29

  • Warum „Scrapy“? Welche Alternativen? Literatur!!

S.31

  • Text (Math. Notation) ganz schwer verständlich. Umformulieren und Beispiele

S.32

  • (3.1) ist keine ordentl. Gleichung, alle nachfolgenden ebenfalls nicht. Eine Gleichung enthält ein Gleichheitszeichen!
  • Insgesamt ist auf den folgenden Seiten sehr unklar, wie Ihr auf die Merkmale kommt. Woher wisst Ihr, was Adjektive sind? Was ein Rechtschreibfehler ist etc.
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants