Feedback #22

ScientiaEtVeritas · 2017-03-07T09:23:43Z

S.2

Machine Learning und damit AI begann viel früher, vgl. http://www.computerwoche.de/a/generationen-von-forschern-scheiterten-mit-ki-theorien,1148639
Grundsätzlich zu viel gewertet („Erfolgsgeschichte“), denn die Industrie wollte das jahrelang nicht!!

S.3

Klassifizierung und Klassifikation scheint mir unlogisch zu sein, insbesondere, da die zitierte Literatur englisch ist!?
Mehrklassenklassifikation nicht verstanden: Gleiche Merkmale können in div. Ausgabeklassen unterteilt werden, z.B. Hund und Säugetier!!!

S.4

Warum ist die Abbildung englisch??
„In Abbildung 2.4 wird dargestellt“ .  Abb. 2.1??
Die Beschreibung der Abbildung ist deutlich detaillierter, als die Abbildung selbst. Anpassen!
„Definition“ heißt im Kapitel obendran „Textdefinition“

S.5

Bild im Textabschnitt.
Multilabelklassifikation klar gegen Mehrklassenklassifikation abgrenzen. U.U. auf Denglisch verzichten.
„Tokenization“ etc. werden dem Leser hier „um die Ohren gehauen“, zumindest kurz erklären.
dessen  deren.

S.6

Zwei Sätze beginnen mit „So“
S.6: weißt  weist
S.6: Beispiel 2.1, meint Ihr Tabelle 2.1?
Beispiel schlecht/falsch: Unter Rauschen werden landläufig ein Fehler desgleichen Typs verstanden, Eurem Fall also Alter.
Viele Zeichensetzungsfehler

S.7

„Es mussberücksichtigt werden, dass Datensätze.“
Nochmal: Vermeidet „man“ und Konjunktive!!

S.8

Zu allen Methoden müsst Ihr Literatur angeben, welche Arbeitsgruppen mit dem Thema gearbeitet haben, mit welchen Ergebnissen etc.
Beispiele für Stoppwörter

S.9

Merkmale müssen nicht numerisch sein. Ihr könnt es so definieren.
Tabelle als Abbildung zitiert. Suchen und Ersetzen!
Punkte immer ans Ende der Formeln.
„wirklich zu verstehen.“ klingt nicht wissenschaftlich
In Merkmalsextraktion beschreibt Ihr wieder Merkmale, Kap nach oben.

S.10

Ist Abb.2.3 notwendig?
Merkmalsselektion senkt auch die Anzahl später zu schätzender Parameter  robuster
Das Beschreiben von ANOVA halte ich für unnötig, dafür gibt es Lehrbücher, i.d. Anhang? ANOVA ist im Übrigen für Euch nicht einsetzbar (Merkmalskombinationen werden nicht betrachtet), Ihr braucht das multivariate Äquivalent MANOVA.
Welche anderen Formen der Merkmalsauswahl gibt es? Support-Vektor-Maschinen, Deep-Learning etc.

S.13

Kap. 2.6.4: Ihr beschreibt Merkmale, ohne sie erklärt zu haben.
In welchen Fällen kann diese Formel nicht verwendet werden? Was macht man dann?

S.14

S.o.
Satzend-Punkte nach Formeln.
Vier Kapitelhierarchien sind zu viel.
Ziel der Matrix zumindest andeuten

S.15

Schwer zu verstehen. Was meint Ihr mit Dokumenthäufigkeit? Korpus?
Formelzeichen im Text andere als in der Formel.
Physische Bedeutung anhand eines Beispiels!

S.16

2.8 nicht verständlich, „Bias und Varianz“ von was? Entwurf von Klass.-verfahren bislang noch nicht beschrieben.
2.8.1.1 Formel!
2.8.1.2 Nicht verständlich ohne Entwurf v. Klass.-verfahren.

S.17

„eine Dimension im Datensatz“ falsch  Merkmalsraum
Was ist nun der „Fluch der Dimenionalität“  Anz. Zu schätzender Parameter steigt exponentiell, daher schlechte Vorhersagequalität
Bei PCA muss zumindest das Wort Linearkombination fallen. Wie werden sie berechnet?
Wie Ihr die Singulärwertzerlegung einsetzt, ist nicht klar.

S.18

„gewisse“
Verstehe nicht, was Ihr mit Hyperparametern meint.

S.19

Beschreibt Ihr hier „Wrapper“-Ansätze? Bewertung von Parametern anhand von Klassifkationsgüten (z.B. über Lerndaten)?
Die Abschnitte wirken abgeschrieben und nicht verstanden. Braucht Ihr das wirklich?

S.20

Evaluation  Crossvalidierung, LOO, Bootstrap, Lern- vs. Testdaten etc., nicht sicher, ob Ihr so weit ins Detail sollt / wollt.

S.21

Kapitel 3 wirkt durchdachter

S.26

Nochmal klares Fazit: Python wird verwendet!
Auf wieviele Datenpunkte ist Euer Datensatz denn nun beschränkt?

S.28

Nicht klar, warum nun ein Kapitel „Crawling“ folgt.
Testdatensätze sind systematisch anders als der Lerndatensatz. Das solltet Ihr zumindest diskutieren.

S.29

Warum „Scrapy“? Welche Alternativen? Literatur!!

S.31

Text (Math. Notation) ganz schwer verständlich. Umformulieren und Beispiele

S.32

(3.1) ist keine ordentl. Gleichung, alle nachfolgenden ebenfalls nicht. Eine Gleichung enthält ein Gleichheitszeichen!
Insgesamt ist auf den folgenden Seiten sehr unklar, wie Ihr auf die Merkmale kommt. Woher wisst Ihr, was Adjektive sind? Was ein Rechtschreibfehler ist etc.

ScientiaEtVeritas assigned ScientiaEtVeritas and Bomberus Mar 7, 2017

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Feedback #22

Feedback #22

ScientiaEtVeritas commented Mar 7, 2017 •

edited by Bomberus

Loading

Feedback #22

Feedback #22

Comments

ScientiaEtVeritas commented Mar 7, 2017 • edited by Bomberus Loading

ScientiaEtVeritas commented Mar 7, 2017 •

edited by Bomberus

Loading