In [1]:
# google drive mounted
from google.colab import drive
drive.mount('/content/drive')


Mounted at /content/drive



### 1. Core Code

```
MedSegDiff/
├── guided_diffusion/
│   ├── bratsloader.py              #BRATS数据加载器（可以和grade一起记录）
│   ├── medical_augmentation.py     #图像数据增强（没怎么做，cursor给我什么就是什么，交给你们了）
│   ├── losses.py                   # 损失函数（Dice, Joint, Focal等）
│   ├── evaluation_metrics.py       # 评估指标系统
│   ├── unet.py                     # UNet模型（包含CLS Head）
│   ├── gaussian_diffusion.py       # 扩散过程（包含多任务损失）
│   ├── train_util.py               # 训练工具（TrainLoop）
│   └── script_util.py              # 模型创建工具
├── scripts/
│   ├── segmentation_train.py       # 主训练脚本
│   ├── segmentation_sample.py        
└── requirement.txt                 # 依赖包列表
```

### 2. Dataset Structure

```
data/
├── BraTS2020/
│   └── training/
│       ├── slice0001/
│       │   ├── brats_train_001_t1_123_w.nii.gz
│       │   ├── brats_train_001_t1ce_123_w.nii.gz
│       │   ├── brats_train_001_t2_123_w.nii.gz
│       │   ├── brats_train_001_flair_123_w.nii.gz
│       │   └── brats_train_001_seg_123_w.nii.gz
│       └── slice0002/
│           └── ...
└── name_mapping.csv               # 病理分级标签文件
```


In [None]:
# 解压
# 从https://www.kaggle.com/datasets/awsaf49/brats20-dataset-training-validation下载training_data数据集及其附件（csv）
import zipfile, os

zip_path = '/content/drive/MyDrive/Colab Notebooks/6204-2/Data/BraTS/MICCAI_BraTS2020.zip'

assert os.path.exists(zip_path), 'Please update zip_path to your data location!'
with zipfile.ZipFile(zip_path, 'r') as zf:
    zf.extractall('/content/drive/MyDrive/Colab Notebooks/6204-2/Data/BraTS/')
print('✅ Data extracted to /6204-2/Data/BraTS/')

✅ Data extracted to /6204-2/Data/BraTS/


数据集只需要训练集。一是测试集都不含mask和label，无法检验。二是我们的sample步骤，不需要很多的病例，可能四五个就够了（不同类别的比较好），然后其他全部是训练集，大小也是足够的。分集合的逻辑暂时还是用split ratio来分，其实直接抽出来作为测试集也是可以的，不用特意用代码分。

In [2]:
# 配环境
!cd "/content/drive/MyDrive/Colab Notebooks/6204-2"
!pip install -r "/content/drive/MyDrive/Colab Notebooks/6204-2/requirement.txt"



Collecting batchgenerators (from -r /content/drive/MyDrive/Colab Notebooks/6204-2/requirement.txt (line 10))
  Downloading batchgenerators-0.25.1.tar.gz (76 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m77.0/77.0 kB[0m [31m2.7 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting visdom (from -r /content/drive/MyDrive/Colab Notebooks/6204-2/requirement.txt (line 11))
  Downloading visdom-0.2.4.tar.gz (1.4 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.4/1.4 MB[0m [31m26.0 MB/s[0m eta [36m0:00:00[0m
[?25h  Preparing metadata (setup.py) ... [?25l[?25hdone
Collecting unittest2 (from batchgenerators->-r /content/drive/MyDrive/Colab Notebooks/6204-2/requirement.txt (line 10))
  Downloading unittest2-1.1.0-py2.py3-none-any.whl.metadata (15 kB)
Collecting argparse (from unittest2->batchgenerators->-r /content/drive/MyDrive/Colab Notebooks/6204-2/requirement.txt (line 10))
  Downloading argpars

In [None]:
# 检查数据路径和内容
import os

data_dir = '/content/drive/MyDrive/Colab Notebooks/6204-2/Data/BraTS/MICCAI_BraTS2020_TrainingData'
csv_path = '/content/drive/MyDrive/Colab Notebooks/6204-2/Data/BraTS/MICCAI_BraTS2020_TrainingData/name_mapping.csv'

print(f"数据目录存在: {os.path.exists(data_dir)}")
print(f"CSV文件存在: {os.path.exists(csv_path)}")

if os.path.exists(data_dir):
    subdirs = [d for d in os.listdir(data_dir) if os.path.isdir(os.path.join(data_dir, d))]
    print(f"找到 {len(subdirs)} 个子目录")
    if subdirs:
        print(f"前3个子目录: {subdirs[:3]}")
        first_dir = os.path.join(data_dir, subdirs[0])
        files = os.listdir(first_dir)
        print(f"第一个子目录的文件: {files}")

数据目录存在: True
CSV文件存在: True
找到 369 个子目录
前3个子目录: ['BraTS20_Training_001', 'BraTS20_Training_002', 'BraTS20_Training_003']
第一个子目录的文件: ['BraTS20_Training_001_flair.nii', 'BraTS20_Training_001_seg.nii', 'BraTS20_Training_001_t1.nii', 'BraTS20_Training_001_t1ce.nii', 'BraTS20_Training_001_t2.nii']


对于数据不平衡，我用了classweighting和focalloss。但是感觉还是不够，这是数据集选择的问题，实在解决不了可以不管，因为分类的验证集其实学习的非常好了，哪怕有imbalance。

In [2]:
# demo 已经可以训练，我是拿训练300步的权重测试的后面的sample任务
%cd "/content/drive/MyDrive/Colab Notebooks/6204-2"
! python scripts/segmentation_train.py \
    --data_name BRATS \
    --data_dir Data/BraTS/MICCAI_BraTS2020_TrainingData \
    --out_dir ./results \
    --image_size 128 \
    --num_channels 128 \
    --num_res_blocks 1 \
    --num_heads 1 \
    --learn_sigma True \
    --use_scale_shift_norm False \
    --attention_resolutions 16 \
    --diffusion_steps 1000 \
    --noise_schedule linear \
    --rescale_learned_sigmas False \
    --rescale_timesteps False \
    --lr 1e-5 \
    --batch_size 8 \
    --microbatch 2 \
    --schedule_sampler uniform \
    --save_interval 200 \
    --log_interval 10 \
    --use_fp16 False \
    --use_cls_head True \
    --csv_path Data/BraTS/MICCAI_BraTS2020_TrainingData/name_mapping.csv \
    --focal_gamma 2.0 \
    --seg_focal_gamma 1.5 \
    --seg_focal_lambda 0.5

/content/drive/MyDrive/Colab Notebooks/6204-2
Logging to ./results_diffmore
creating data loader...
Loaded CSV with 369 entries
Grade mapping loaded: 369 subjects
Grade distribution: LGG=76, HGG=293
Class weights: LGG=2.428, HGG=0.630
Class weights calculated: tensor([2.4276, 0.6297])
Applied train split: 294 subjects selected from 368 total
Dataset Statistics:
  Total samples: 369
  LGG samples: 76 (20.60%)
  HGG samples: 293 (79.40%)
  Alpha_LGG: 2.4276
  Alpha_HGG: 0.6297
creating model and diffusion...
Classification head enabled in model
training...
---------------------------
| cls_acc      | 0.5      |
| cls_auc      | 1        |
| cls_f1       | 0        |
| grad_norm    | 1        |
| loss         | 1        |
| loss_cal     | 0.3      |
| loss_cal_q0  | 0.3      |
| loss_cls     | 0.244    |
| loss_diff    | 0.999    |
| loss_diff_q0 | 0.999    |
| loss_q0      | 1        |
| loss_seg     | 4        |
| loss_total   | 2.12     |
| param_norm   | 188      |
| samples      | 8 

```
| loss          | 0.864 | 总损失 (不确定性加权后)
| loss_seg      | 2.14  | 分割损失 (扩散+校准)
| loss_cls      | 0.00775 | 分类损失 (Focal Loss)
| loss_total    | 1.07  | 总损失 (分割+分类)
| loss_diff     | 0.76  | 扩散损失 (MSE)
| loss_cal      | 0.0837 | 校准损失
| loss_cal_q0   | 0.0794 | 校准损失25%分位数
| loss_cal_q1   | 0.0778 | 校准损失50%分位数
| loss_cal_q3   | 0.0882 | 校准损失75%分位数
```

#### **Segmentation**:
```
| seg_dice      | 0.141 | Dice
| seg_iou       | 0.0759 | IoU
```

#### **Classification**:
```
| cls_acc       | 1     | Classification Accuracy
| cls_f1        | 1     | F1
| cls_auc       | nan   | AUC (0-1, 越高越好, nan表示只有一类)
```

#### **不确定性参数**:
```
(***这个是cursor给我加的什么七七八八的权重，暂时没明白有没有用，不然删掉也可以）
| sigma_seg     | 1.03  | 分割任务的不确定性权重
| sigma_cls     | 1.03  | 分类任务的不确定性权重
```

#### **Training**:
```
| step          | 200   | 当前训练步数
| samples       | 201   | 已处理的样本数
| grad_norm     | 44.7  | 梯度范数 (应该<10, 过高表示梯度爆炸)
| param_norm    | 187   | 参数范数
```
#### **Warning**:
- **loss**: 突然跳跃或NaN
- **grad_norm**: >50 梯度爆炸
- **cls_auc**: nan 表示只有一类样本
- **seg_dice**: <0.1 分割效果很差

```bash
--lr 1e-4              # 学习率
--batch_size 4         # 批次大小
--diffusion_steps 1000 # 扩散步数
--focal_gamma 2.0      # Focal Loss的γ
--seg_focal_gamma 1.5  # 分割Focal Loss的γ
--seg_focal_lambda 0.5 # 分割Focal Loss的权重
```

分类头的注入，我认为有一定的问题，因为模型分级，不需要很复杂的网络信息。可能直接用最初进入深层网络前的图像预测，就挺好的。或者用最后传出的前一层，可能有更多的信息（包含多模态毕竟），但是直接注入到模型融合前，和seg loss一起迭代，不太行，还没改。

1.  训练模型，输入mask和5个多模态。一个病例有5种多模态3D切片，每种155个。因此在训练的过程中，由于样本grade标签不平衡，又把切片混起来训练，会出现全是nan的情况，也就是随机抽到的绝大多数情况是一种标签。
在训练的过程当中，由于分类头的位置在早期和anchor融合前，因此分类的clsloss很容易在loss递减的过程中，占主导位置。进而我们的seg loss几乎没有办法进步，一直在强烈的震荡，而cls loss很快就收敛了。

2. 目前想到能改进的地方，分类头只利用深层网络的信息来训练，并且在训练的过程中和seg任务分开做（可以做dual-encoder，dual UNet或者其他，有很多论文都有多模态这个问题，这个是多模态的通病了）

3. 想到一个投机取巧的点子，先训练模型的分割能力，训练前500次，把分类头权重freeze，并且不参与loss的迭代，这样没有梯度的更新。之后再把分割部分freeze，单独训练分类头，仅需要一点步数。最后用很少的步数，把全部权重都结冻，微调一下权重。我还试过Dual-task UNet，效果也不太好。接下来可能会是一下我这个投机取巧的方法。

In [3]:
# validation/sample, only target on valuable mask
%cd "/content/drive/MyDrive/Colab Notebooks/6204-2"

! python scripts/segmentation_sample.py \
  --data_name BRATS \
  --data_dir Data/BraTS/MICCAI_BraTS2020_TrainingData \
  --out_dir ./results/pic \
  --image_size 128 \
  --num_channels 128 \
  --num_res_blocks 1 \
  --num_heads 1 \
  --learn_sigma True \
  --use_scale_shift_norm False \
  --attention_resolutions 32 \
  --diffusion_steps 100 \
  --noise_schedule linear \
  --rescale_learned_sigmas False \
  --rescale_timesteps False \
  --batch_size 1 \
  --use_ddim False \
  --model_path ./results/savedmodel000300.pt \
  --num_ensemble 2 \
  --debug True \
  --use_cls_head True \
  --csv_path Data/BraTS/MICCAI_BraTS2020_TrainingData/name_mapping.csv \
  --num_eval_cases 1

/content/drive/MyDrive/Colab Notebooks/6204-2
Logging to ./results/pic
Loaded CSV with 369 entries
Grade mapping loaded: 369 subjects
Grade distribution: LGG=76, HGG=293
Class weights: LGG=2.428, HGG=0.630
Class weights calculated: tensor([2.4276, 0.6297])
Applied validation split: 74 subjects selected from 368 total
creating model and diffusion...
Loading model from ./results/savedmodel000300.pt
[rank0]: Traceback (most recent call last):
[rank0]:   File "/content/drive/MyDrive/Colab Notebooks/6204-2/scripts/segmentation_sample.py", line 405, in <module>
[rank0]:     main()
[rank0]:   File "/content/drive/MyDrive/Colab Notebooks/6204-2/scripts/segmentation_sample.py", line 128, in main
[rank0]:     state_dict = dist_util.load_state_dict(args.model_path, map_location="cpu")
[rank0]:                  ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
[rank0]:   File "/content/drive/MyDrive/Colab Notebooks/6204-2/guided_diffusion/dist_util.py", line 64, in load_state_dict
[ra

训练随机抽取全部训练集切片，因为非常不平衡的数据集，其实不太好，可以考虑把空的切片过滤，然后对低类别的切片增强。测试集以病例为一个样本，检测该病例的所有有效切片，综合得到最后的诊断。这个是我自己改的。更跟我们的。Sample代码几乎没问题了，除了一些很具体的log和最后的metric。