open-mmlab · qyyyyq · Jun 29, 2022 · Jun 29, 2022 · MengzhangLI · Jun 29, 2022
diff --git a/configs/_base_/models/ddrnet.py b/configs/_base_/models/ddrnet.py
@@ -0,0 +1,50 @@
+# model settings
+# default : DDRNet23slim
+
+norm_cfg = dict(type='SyncBN', eps=1e-03, requires_grad=True)
+model = dict(
+    type='EncoderDecoder',
+    backbone=dict(
+        type='DualResNet',
+        layers=[2, 2, (2,), 2],
+        planes=32,
+        spp_planes=128,
+        norm_cfg=norm_cfg ,
+        align_corners=False,
+        init_cfg= dict(type='Pretrained', checkpoint='mmseg_ddr23s.pth'),
+         ),
+
+    decode_head=dict(
+        type='FCNHead',
+        init_cfg= dict(type='Kaiming', distribution='normal'),
+        in_index=-1,
+         concat_input=False,
+        dropout_ratio=0,
+        input_transform=None,
+        in_channels=32*4,
+        channels=64,
+        num_convs=1,
+        num_classes=19,
+        align_corners=False,
+        norm_cfg=norm_cfg ,
+        loss_decode=dict(
+            type='CrossEntropyLoss', use_sigmoid=False, loss_weight=1.0)),
+     auxiliary_head=dict(
+        type='FCNHead',
+        init_cfg= dict(type='Kaiming', distribution='normal'),
+        in_index=-2,
+        concat_input=False,
+        dropout_ratio=0,
+        input_transform=None,
+        in_channels=32*2,
+        channels=64,
+        num_convs=1,
+        num_classes=19,
+        align_corners=False,
+        norm_cfg=norm_cfg ,
+        loss_decode=dict(
+            type='CrossEntropyLoss', use_sigmoid=False, loss_weight=0.4)),
+
+    # model training and testing settings
+    train_cfg=dict(sampler=None),
+    test_cfg=dict(mode='whole'))
diff --git a/configs/ddrnet/ddrnet-23-slim_in1k-pre_2x8_1024x1024_160k_cityscapes.py b/configs/ddrnet/ddrnet-23-slim_in1k-pre_2x8_1024x1024_160k_cityscapes.py
@@ -0,0 +1,16 @@
+_base_ = [
+    '../_base_/models/ddrnet.py',
+    '../_base_/datasets/cityscapes_1024x1024.py',
+    '../_base_/default_runtime.py', '../_base_/schedules/schedule_160k.py'
+]
+
+data = dict(
+    samples_per_gpu=8,
+    workers_per_gpu=8,
-    samples_per_gpu=8,
-    workers_per_gpu=8,
+    samples_per_gpu=4,
+    workers_per_gpu=4,
-    samples_per_gpu=8,
-    workers_per_gpu=8,
+    samples_per_gpu=4,
+    workers_per_gpu=4,
+)
+log_config = dict(
+    interval=50,
+    hooks=[
+        dict(type='TextLoggerHook'),
+        dict(type='TensorboardLoggerHook')
+    ])
diff --git a/configs/ddrnet/ddrnet-23_in1k-pre_2x8_1024x1024_160k_cityscapes.py b/configs/ddrnet/ddrnet-23_in1k-pre_2x8_1024x1024_160k_cityscapes.py
@@ -0,0 +1,59 @@
+_base_ = [
+    '../_base_/models/ddrnet.py',
+    '../_base_/datasets/cityscapes_1024x1024.py',
+    '../_base_/default_runtime.py', '../_base_/schedules/schedule_160k.py'
+]
+
+data = dict(
+    samples_per_gpu=8,
+    workers_per_gpu=8,
+)
+log_config = dict(
+    interval=50,
+    hooks=[
+        dict(type='TextLoggerHook'),
+        dict(type='TensorboardLoggerHook')
+    ])
+
+# model settings
+# default : DDRNet23 
+norm_cfg = dict(type='SyncBN', eps=1e-03, requires_grad=True)
+model = dict(
+    type='EncoderDecoder',
+    backbone=dict(
+        type='DualResNet',
+        layers=[2, 2, (2,), 2],
+        planes=64,
+        spp_planes=128,
+        norm_cfg=norm_cfg ,
+        align_corners=False,
+        init_cfg= dict(type='Pretrained', checkpoint='/home/yyq/mmseg_ddr23.pth'),
+         ),
+    decode_head=dict(
+        type='FCNHead',
+        in_index=-1,
+        dropout_ratio=0,
+        input_transform=None,
+        in_channels=64*4,
+        channels=128,
+        num_convs=1,
+        num_classes=19,
+        align_corners=False,
+        loss_decode=dict(
+            type='CrossEntropyLoss', use_sigmoid=False, loss_weight=1.0)),
+     auxiliary_head=dict(
+        type='FCNHead',
+        in_index=-2,
+        dropout_ratio=0,
+        input_transform=None,
+        in_channels=64*2,
+        channels=128,
+        num_convs=1,
+        num_classes=19,
+        align_corners=False,
+        loss_decode=dict(
+            type='CrossEntropyLoss', use_sigmoid=False, loss_weight=0.4)),
+
+    # model training and testing settings
+    train_cfg=dict(sampler=None),
+    test_cfg=dict(mode='whole'))
diff --git a/configs/ddrnet/ddrnet-39_in1k-pre_2x8_1024x1024_160k_cityscapes.py b/configs/ddrnet/ddrnet-39_in1k-pre_2x8_1024x1024_160k_cityscapes.py
@@ -0,0 +1,58 @@
+_base_ = [
+    '../_base_/models/ddrnet.py',
+    '../_base_/datasets/cityscapes_1024x1024.py',
+    '../_base_/default_runtime.py', '../_base_/schedules/schedule_160k.py'
+]
+
+data = dict(
+    samples_per_gpu=8,
+    workers_per_gpu=8,
+)
+log_config = dict(
+    interval=50,
+    hooks=[
+        dict(type='TextLoggerHook'),
+        dict(type='TensorboardLoggerHook')
+    ])
+# model settings
+# default : DDRNet39
+norm_cfg = dict(type='SyncBN', eps=1e-03, requires_grad=True)
+model = dict(
+    type='EncoderDecoder',
+    backbone=dict(
+        type='DualResNet',
+        layers=(3, 4, (3,3), 3),
+        planes=64,
+        spp_planes=128,
+        norm_cfg=norm_cfg ,
+        align_corners=False,
+        init_cfg= dict(type='Pretrained', checkpoint='mmseg_ddr39.pth'),
+         ),
+    decode_head=dict(
+        type='FCNHead',
+        in_index=-1,
+        dropout_ratio=0,
+        input_transform=None,
+        in_channels=64*4,
+        channels=256,
+        num_convs=1,
+        num_classes=19,
+        align_corners=False,
+        loss_decode=dict(
+            type='CrossEntropyLoss', use_sigmoid=False, loss_weight=1.0)),
+     auxiliary_head=dict(
+        type='FCNHead',
+        in_index=-2,
+        dropout_ratio=0,
+        input_transform=None,
+        in_channels=64*2,
+        channels=256,
+        num_convs=1,
+        num_classes=19,
+        align_corners=False,
+        loss_decode=dict(
+            type='CrossEntropyLoss', use_sigmoid=False, loss_weight=0.4)),
+
+    # model training and testing settings
+    train_cfg=dict(sampler=None),
+    test_cfg=dict(mode='whole'))
diff --git a/mmseg/models/backbones/__init__.py b/mmseg/models/backbones/__init__.py
@@ -20,11 +20,11 @@
 from .twins import PCPVT, SVT
 from .unet import UNet
 from .vit import VisionTransformer
-
+from .ddrnet import DualResNet
 __all__ = [
     'ResNet', 'ResNetV1c', 'ResNetV1d', 'ResNeXt', 'HRNet', 'FastSCNN',
     'ResNeSt', 'MobileNetV2', 'UNet', 'CGNet', 'MobileNetV3',
     'VisionTransformer', 'SwinTransformer', 'MixVisionTransformer',
     'BiSeNetV1', 'BiSeNetV2', 'ICNet', 'TIMMBackbone', 'ERFNet', 'PCPVT',
-    'SVT', 'STDCNet', 'STDCContextPathNet', 'BEiT', 'MAE'
+    'SVT', 'STDCNet', 'STDCContextPathNet', 'BEiT', 'MAE','DualResNet'
 ]