Skip to content

2017 06 26 Fifth meeting: 1000 annotated images per class

Arthur Silber edited this page Jun 26, 2017 · 4 revisions

Torben + Arthur:

  • Added "none" class with uninteresting buildings + train on network: works well to reduce false positives, but fernsehturm stays problematic (false positives, low mAP in general) Example images
  • By now we have 1000 annotated images per class, 900 a re used for training and 100 for validation
with none class: 

INFO:root:Epoch[16] Validation-berlinerdom=0.935180
INFO:root:Epoch[16] Validation-brandenburgertor=0.926094
INFO:root:Epoch[16] Validation-fernsehturm=0.616297
INFO:root:Epoch[16] Validation-none=0.869097
INFO:root:Epoch[16] Validation-reichstag=0.949316
INFO:root:Epoch[16] Validation-rotesrathaus=0.883282
INFO:root:Epoch[16] Validation-mAP=0.863211

without none class:

INFO:root:Epoch[16] Validation-berlinerdom=0.924526
INFO:root:Epoch[16] Validation-brandenburgertor=0.921344
INFO:root:Epoch[16] Validation-fernsehturm=0.585849
INFO:root:Epoch[16] Validation-reichstag=0.923387
INFO:root:Epoch[16] Validation-rotesrathaus=0.878167
INFO:root:Epoch[16] Validation-mAP=0.846654

Ideas:

  • Visual Backprop tool to visualize what is leaned as "Fernsehturm" (mitarbeit von uns? --> Christian) Auf basis von einem Bild bekommt man zurück
  • Use MX-Net internal data augmentation? (flip, random crops, color value shifting...?)

Adrian:

  • Uses ResNet 101 for SSD
  • Network structure is built, now working on training it Ideas:
  • Eventuell eher ResNet18 benutzen - weniger layers, einfacher
  • Inception geht nicht mit binary
  • von caffee aus nachbauen, parameter vom original paper übernehmen?

Martin:

  • Ist am Bauen der Grundrahmen der App auf Basis der existierenden prototype (auswahl von Fotos)

Fabian:

  • Hat dev environment für android app installiert, merke: das installieren und bauen braucht lange
  • App scheint im Emulator nicht zu funktionieren

Next tasks:

  • Adrian: weiter arbeit am resnet+ssd trainieren richtige parameter finden, eventuell resnet 18 verwenden
  • Visual backprop: mxnet callback der jede iteration gerufen wird, der forward pass durchs netzwerk macht, dnan output rausgreifen und bild visualisieren
  • analytics: false positives vor/nach none classe -- mehr metriken (false positives false negatives true positives true negatives - siehe 8. stanford vorlesung
  • Fernsehturm mAP verbessern: mehr testdaten / varianz reinbringen: funkturm z.B.? stuttgarter fernsehturm?
  • Fabian und Martin: Android App
  • Christian: refernzpaper für uns
  • Arthur: ggf nvidia-docker