Mask R-CNN:
Mask R-CNN, bilgisayarlı görüde nesneleri bölütlemek için kullanılan bir derin sinir ağıdır. İki aşaması vardır:
- Girdi görüntüsüne göre bir nesnenin olabileceği bölgeler hakkında tahminler üretir.
- Nesnenin sınıfını öngörür, sınırlayıcı kutuyu arıtır ve ilk aşama tahminine dayanarak nesnenin piksel düzeyinde bir maske oluşturur. Mask R-CNN temel olarak Faster R-CNN’in bir uzantısıdır. Faster R-CNN, nesne tanımada yaygın olarak kullanılır. Faster R-CNN, görüntülerden özellik haritaları çıkarmak için önce bir ConvNet kullanır. Bu özellik haritaları, daha sonra aday çerçeveleri döndüren bir Region Proposal Network(RPN)’den geçirilir. Daha sonra, tüm adayları aynı boyuta getirmek için bu aday sınırlayıcı çerçevelerine bir ROI pooling katmanı uygulanır. Son olarak öneriler, nesnelerin sınırlayıcı çerçevelerini sınıflandırmak ve çıktılamak için fully connected katmandan geçirilir. Aşağıdaki görseldeki gibi nesnenin orada olabileceği düşünülen bir sürü çerçeve oluşur.
Daha sonra, aynı sınıf için üst üste gelen kutuları gruplandırır ve yalnızca en yüksek tahmini seçer. Böylece, aynı nesne için kopyaları önler. Nihai olarak aşağıdaki gibi nesnelerimiz çerçeve içerisine alınır.
Ve Mask R-CNN ile son halini almış olur
https://medium.com/@kuza55/transparent-multi-gpu-training-on-tensorflow-with-keras-8b0016fd9012
https://github.com/avolkov1/keras_experiments/blob/master/keras_exp/multigpu/
https://github.com/fchollet/keras/blob/master/keras/utils/training_utils.py
https://medium.com/@tibastar/mask-r-cnn-d69aa596761f
https://github.com/matterport/Mask_RCNN
https://medium.com/@jonathan_hui/image-segmentation-with-mask-r-cnn-ebe6d793272