本仓库提供了一种高度模块化的 RGB-D 息肉分割框架。针对医疗内窥镜场景中伪深度图(Pseudo-depth)常见的结构噪声与模态坍塌问题,本项目设计了 空域(Spatial Domain) 与 频域(Frequency Domain) 两套互补系统。
系统的宏观流向遵循 Encoder → Enhance → Edge → Fusion → Decoder 的深度解耦范式。以下为 V5 级出版标准架构图:
本项目的核心竞争力在于其模块内提供了基于不同假设的版本设计,方便通过消融实验验证频域解耦的优越性。
在浅层特征中提取高分辨率边界。由于 Depth 的高频往往被噪声污染,提纯和一致性协商是关键。
BGACE_V2(Bidirectional Gradient Alignment & Consensus Edge):CHAC(Cross-modal High-frequency Adaptive Calibration):
DCRF(Difference-aware Confidence-driven Routing Fusion):AFAF(Asymmetric Frequency-Aware Fusion):
MRGA(Multi-Receptive Gated Aggregation):LFSE(Low-Frequency Semantic Enhancement):
BDAD(Boundary-Body Decoupled Aggregation Decoder):HFSI(High-Frequency Spectrum Injection Decoder):
训练入口为 Train.py。你可以通过命令行参数 --model_name 快速切换组合:
MyNet:BGACE_V2+DCRF+MRGA+BDAD(Stable Spatial Baseline)MyNet_frequency:CHAC+AFAF+LFSE+HFSI(Advanced Frequency-Aware version)
# 示例:运行频域版 MyNet
conda run -n ubench python Train.py --model_name MyNet_frequency_decoder1 --gpu_id 0本项目致力于推动高精细度医疗影像处理,欢迎在 Top 期刊/会议工作中使用。








