[Feature] Add AvoidOOM to avoid OOM #7434

BIGWangYuDong · 2022-03-17T01:39:49Z

First, trying to change torch.mm to torch.einsum to avoid OOM:
before change, mAP: 0.331

inter_matrix = torch.mm(flatten_masks, flatten_masks.transpose(1, 0))

after change, mAP: 0.331

inter_matrix = torch.einsum('ik, kj -> ij', flatten_masks,  flatten_masks.transpose(1, 0))

But found it cannot save GPU memory.

	torch.mm	torch.einsum
process time (s)	4.69856	4.5713
GPU memory (MiB)	807	807

To avoid OOM, we add a class, which can try to convert inputs to FP16 and CPU if got a PyTorch's CUDA Out of Memory error.
It will do the following steps:

first retry after calling torch.cuda.empty_cache().
If that still fails, it will then retry by converting inputs to FP16.
If that still fails try to convert inputs to CPUs. In this case, it expects the function to dispatch to the CPU implementation.

TODO:

Add docs in FAQ

Close: #6908

mmdet/utils/memory.py

jbwang1997 · 2022-03-17T02:51:15Z

If we can only set keep_dtype to make users decide whether the outputs are still the same as the input data type or are converted to the avoid OOM data type (fp16, cpu).

mmdet/utils/memory.py

codecov · 2022-03-17T18:54:39Z

Codecov Report

Merging #7434 (929ea0d) into dev (151a803) will decrease coverage by 0.58%.
The diff coverage is 41.02%.

@@            Coverage Diff             @@
##              dev    #7434      +/-   ##
==========================================
- Coverage   65.09%   64.50%   -0.59%     
==========================================
  Files         357      360       +3     
  Lines       28852    29233     +381     
  Branches     4891     4954      +63     
==========================================
+ Hits        18782    18858      +76     
- Misses       9061     9370     +309     
+ Partials     1009     1005       -4

Flag	Coverage Δ
unittests	`64.49% <41.02%> (-0.61%)`	⬇️

Flags with carried forward coverage won't be shown. Click here to find out more.

Impacted Files	Coverage Δ
mmdet/utils/memory.py	`40.25% <40.25%> (ø)`
mmdet/utils/__init__.py	`100.00% <100.00%> (ø)`
mmdet/models/detectors/__init__.py	`100.00% <0.00%> (ø)`
mmdet/models/dense_heads/__init__.py	`100.00% <0.00%> (ø)`
mmdet/models/dense_heads/solo_head.py	`65.18% <0.00%> (ø)`
mmdet/models/dense_heads/solov2_head.py	`9.83% <0.00%> (ø)`
mmdet/models/detectors/solov2.py	`83.33% <0.00%> (ø)`
mmdet/core/bbox/assigners/max_iou_assigner.py	`73.68% <0.00%> (+1.31%)`	⬆️
mmdet/models/roi_heads/test_mixins.py	`52.85% <0.00%> (+2.14%)`	⬆️
mmdet/models/dense_heads/dense_test_mixins.py	`43.20% <0.00%> (+2.46%)`	⬆️
... and 1 more

Continue to review full report at Codecov.

Legend - Click here to learn more
Δ = absolute <relative> (impact), ø = not affected, ? = missing data
Powered by Codecov. Last update 151a803...929ea0d. Read the comment docs.

mmdet/utils/memory.py

docs/en/faq.md

mmdet/utils/memory.py

docs/en/faq.md

docs/zh_cn/faq.md

mmdet/utils/memory.py

docs/en/faq.md

mmdet/utils/memory.py

docs/en/faq.md

mmdet/utils/memory.py

…avoidoom

BIGWangYuDong · 2022-05-24T14:36:22Z

Update the logic in AvoidOOM, which defaults to return source type and device without any interface. This makes the codes look simpler.

docs/en/faq.md

mmdet/utils/memory.py

docs/en/faq.md

* [Feature] Add AvoidOOM to avoid OOM * support multiple outputs * add docs in faq * add docs in faq * fix logic * minor fix * minor fix * minor fix * minor fix * add the tutorials of using avoidoom as a decorator * minor fix * add convert tensor type test unit * minor fix * minor fix

[Feature] Add AvoidOOM to avoid OOM

ec3f4a0

mm-assistant bot added the size/XS label Mar 17, 2022

BIGWangYuDong requested review from jbwang1997 and ZwwWayne March 17, 2022 01:41

jbwang1997 reviewed Mar 17, 2022

View reviewed changes

mmdet/utils/memory.py Outdated Show resolved Hide resolved

jbwang1997 reviewed Mar 17, 2022

View reviewed changes

mmdet/utils/memory.py Outdated Show resolved Hide resolved

ZwwWayne reviewed Mar 17, 2022

View reviewed changes

mmdet/utils/memory.py Outdated Show resolved Hide resolved

ZwwWayne reviewed Mar 17, 2022

View reviewed changes

mmdet/utils/memory.py Outdated Show resolved Hide resolved

support multiple outputs

310de40

BIGWangYuDong requested review from jbwang1997 and ZwwWayne March 20, 2022 08:29

BIGWangYuDong added 2 commits March 20, 2022 16:37

add docs in faq

2be3dcf

add docs in faq

1a5d1d6

jbwang1997 reviewed Mar 21, 2022

View reviewed changes

mmdet/utils/memory.py Outdated Show resolved Hide resolved

jbwang1997 reviewed Mar 21, 2022

View reviewed changes

mmdet/utils/memory.py Outdated Show resolved Hide resolved

jbwang1997 reviewed Mar 21, 2022

View reviewed changes

mmdet/utils/memory.py Outdated Show resolved Hide resolved

fix conflict

8a99e2f

chhluo reviewed Apr 21, 2022

View reviewed changes

BIGWangYuDong added 3 commits April 21, 2022 13:58

fix logic

99ccb65

minor fix

6861e8d

fix conflict

2cbd044

chhluo reviewed Apr 22, 2022

View reviewed changes

BIGWangYuDong added 5 commits April 27, 2022 19:29

merge dev

765891a

minor fix

77770a4

Merge branch 'dev' into avoidoom

583bf1f

minor fix

00af1d2

minor fix

c8f5816

ZwwWayne reviewed May 3, 2022

View reviewed changes

mmdet/utils/memory.py Show resolved Hide resolved

mmdet/utils/memory.py Outdated Show resolved Hide resolved

mmdet/utils/memory.py Outdated Show resolved Hide resolved

docs/en/faq.md Outdated Show resolved Hide resolved

BIGWangYuDong added 2 commits May 11, 2022 12:45

add the tutorials of using avoidoom as a decorator

28c3f71

minor fix

4e90603

BIGWangYuDong requested review from ZwwWayne, jbwang1997 and chhluo May 11, 2022 04:50

chhluo reviewed May 11, 2022

View reviewed changes

mmdet/utils/memory.py Outdated Show resolved Hide resolved

mmdet/utils/memory.py Outdated Show resolved Hide resolved

mmdet/utils/memory.py Show resolved Hide resolved

add convert tensor type test unit

7083089

BIGWangYuDong requested a review from chhluo May 13, 2022 03:27

Merge branch 'dev' into avoidoom

8541abe

ZwwWayne reviewed May 16, 2022

View reviewed changes

BIGWangYuDong added 2 commits May 24, 2022 22:30

fix avoidoom logic

a7ba2d7

Merge branch 'avoidoom' of github.com:BIGWangYuDong/mmdetection into …

c941409

…avoidoom

ZwwWayne reviewed May 25, 2022

View reviewed changes

docs/en/faq.md Show resolved Hide resolved

ZwwWayne reviewed May 25, 2022

View reviewed changes

mmdet/utils/memory.py Outdated Show resolved Hide resolved

ZwwWayne reviewed May 25, 2022

View reviewed changes

mmdet/utils/memory.py Outdated Show resolved Hide resolved

mmdet/utils/memory.py Outdated Show resolved Hide resolved

mmdet/utils/memory.py Outdated Show resolved Hide resolved

docs/en/faq.md Show resolved Hide resolved

BIGWangYuDong added 2 commits May 25, 2022 11:20

minor fix

ea58f1a

minor fix

929ea0d

BIGWangYuDong requested a review from ZwwWayne May 25, 2022 04:12

ZwwWayne approved these changes May 25, 2022

View reviewed changes

ZwwWayne merged commit 7b03639 into open-mmlab:dev May 25, 2022

BIGWangYuDong deleted the avoidoom branch July 20, 2022 05:09

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Feature] Add AvoidOOM to avoid OOM #7434

[Feature] Add AvoidOOM to avoid OOM #7434

BIGWangYuDong commented Mar 17, 2022 •

edited

Loading

jbwang1997 commented Mar 17, 2022

codecov bot commented Mar 17, 2022 •

edited

Loading

BIGWangYuDong commented May 24, 2022

[Feature] Add AvoidOOM to avoid OOM #7434

[Feature] Add AvoidOOM to avoid OOM #7434

Conversation

BIGWangYuDong commented Mar 17, 2022 • edited Loading

jbwang1997 commented Mar 17, 2022

codecov bot commented Mar 17, 2022 • edited Loading

Codecov Report

BIGWangYuDong commented May 24, 2022

BIGWangYuDong commented Mar 17, 2022 •

edited

Loading

codecov bot commented Mar 17, 2022 •

edited

Loading