GitHub - tunyu0/MaskRCNN_hillside: 對山坡影像進行Instance Segmentation

本任務希望可以對山坡圖片做Instance Segmentation，要區分的類別有「堤防」、「天空」、「土石坍塌」、「Green」、「水」等。

CV Task:Instance Segmentation

Object Detection

物件偵測:用矩行框把物件一個一個框出來，可以區分個體，但不能切割出輪廓。

Semantic Segmentation

語意分割:可以精細的切出輪廓但不能區分個體，像是這張圖片可以知道這團都是人但不知道有幾個人

Instance Segmentation

Instance Segmentation 會對圖片中的每一個像素點做分類,並且區分不同的物件。圖中的人可以區分個體又可以切割出輪廓。

pre-processing : Label, Transform

使用Labelme對圖片做標註，每張圖片都有一個對應的 json 檔，要把 json 檔轉成可以餵給模型的格式，常見的 Instance Segmentation 格式有 VOC格式和 COCO 格式，不管用哪一種格式都要檢查轉檔完的 Mask 是否符合預期，這將會影響到最終的預測結果。

這邊我是轉成 VOC 格式，使用 labelme/Scripts 資料夾底下的labelme_json_to_dataset.exe來進行轉檔。

python run_json.py

要注意的是，由於此任務是做Instance Segmentation，因此在標註、轉檔時要特別注意「希望區分個體的類別」。
以本任務為例，希望「堤防」、「Green」、「土石坍塌」可以區分個體，剩下的「天空」、「水」則不需要區分個體。

錯誤示範

從上圖錯誤示範可以觀察到，對所有類別都沒有區分個體，並沒有如預期地對「堤防」和「Green」區分個體。表示標註、轉檔出了一些問題。如果將其直接餵給Mask RCNN模型做訓練，會無法達到預期希望「堤防」、「Green」、「土石坍塌」要區分個體的效果。

順帶一提，上圖的標註、轉換會變成語意分割的效果。如果希望最後只要切割輪廓，沒有區分個體的需求，建議直接用語意分割模型。

正確示範

從上圖正確示範可以觀察到，這次有確實將「堤防」和「Green」區分個體，並且「水」這個類別不區分個體。

Deep learning framework

Tensorflow : 1.15
Keras : 2.3.1

Training

注意參數

MODEL_DIR : 權重檔生成位置 NUM_CLASSES = 1(背景) + <label總量>
TRAIN_ROIS_PER_IMAGE : 訓練時每張圖要生成多少ROIs

dataset_root_path : 訓練資料集(原圖+轉檔後的mask)路徑
init_with : 要從頭訓練或是做Transfer learning

設定epoch

layers='head' 的意思是只訓練heads層，也就是Backbone的(預訓練)權重先凍結，先訓練其他層的權重。
layers='all' 的意思是整個模型的權重都訓練，設定時數字要大於等於前者。
以上圖為例，會先在凍結Backbone權重的情況下先訓練100 epochs，再將整個模型的權重一起訓練 (200-100) epochs 。

python train.py

Inference

本任務希望在偵測時，有些類別要區分個體，但最後還是會計算這張圖中各類別的總面積，來計算占整張圖的比例。

要計算面積在這份code中可以善用 r['masks']。
以下圖為例，先是經過轉換後得知這張圖有300000個pixels，模型偵測出16個Instances。
下圖中 MASK1是一個二維矩陣，其值為 True 或 False。 True就是這個pixel屬於該個Instance，反之為False。

下圖中將 MASK1 針對第0軸做加總，就可以得到這張圖中16個Instances 各自佔的 pixels 數。
後續可以將相同類別的Instance自行加總，再除以原圖的 Pixels 總數，就可以求得本任務需要的各類別占整張圖的比例 !

注意參數

weights : 以訓練完成的權重檔
input_folder : 要做 Inference 的圖片都放到這個資料夾，並輸入其路徑
output_folder : 做完 Inference 後存結果的資料夾路徑
gpu : 設定是有使用GPU

python myInference.py \
--weights myweight.h5 \
--input_folder images \
--output_folder output_space \
--gpu True

input:

Inference:

給 Mask RCNN 做 Instance Segmentation 後，可以看到有兩個類別為「Green」的 Instances 有順利被區分出來，也有印出感興趣的類別在整張圖片中所佔的比例。
不過也發現輪廓還切割得不夠精細，是因為 Mask RCNN 的參數量較龐大，做 Instance Segmentation 的訓練時間也比較長，在 Colab 中可能時間上訓練不到10個 epochs 就會被斷線，上圖 Inference 是使用第8個 epoch 的權重。
若在計算力強大且穩定的設備上做訓練更多個 epochs，可以得到更加精緻的 Instance Segmentation 效果。

TensorBoard

%load_ext tensorboard
tensorboard --logdir [dir_name]

可以看到紀錄了 Mask RCNN 的3種 Loss(類別、bbox位置、mask)，以及只針對 RPN 的3種 Loss。

可以觀察自己感興趣的 loss 學習曲線。

Reference

[1] https://github.com/matterport/Mask_RCNN
[2] https://www.muhendisbeyinler.net/mask-r-cnn-bir-nesne-tanima-algoritmasi
[3] He, K., Gkioxari, G., Dollár, P., & Girshick, R. (2017). Mask r-cnn. In Proceedings of the IEEE international conference on computer vision (pp. 2961-2969).

Name		Name	Last commit message	Last commit date
Latest commit History 50 Commits
figure		figure
.gitignore		.gitignore
README.md		README.md
myInference.py		myInference.py
requirements.txt		requirements.txt
setup.cfg		setup.cfg
setup.py		setup.py
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

CV Task:Instance Segmentation

Object Detection

Semantic Segmentation

Instance Segmentation

pre-processing : Label, Transform

錯誤示範

正確示範

Deep learning framework

Training

注意參數

Inference

注意參數

TensorBoard

Reference

About

Releases

Packages

Languages

tunyu0/MaskRCNN_hillside

Folders and files

Latest commit

History

Repository files navigation

CV Task:Instance Segmentation

Object Detection

Semantic Segmentation

Instance Segmentation

pre-processing : Label, Transform

錯誤示範

正確示範

Deep learning framework

Training

注意參數

Inference

注意參數

TensorBoard

Reference

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages