`torch.compile()` support #1960

msaroufim · 2022-11-09T06:34:50Z

Caveats

Models will take longer to initialize
Changes in batch sizes will trigger a recompilation, so batch size choice needs to be sufficiently small otherwise recompilations will outweigh any benefits
TensorRT still has better performance than Inductor for inference, it's not clear to me yet whether users should do the tensorRT conversion via pytorch/tensorrt or via dynamo

scope of this PR

Just went ahead and added torch.compile support - to make it happen I made a few changes

Added a tutorial
In the base handler check if _dynamo is present and if yes enable pt 2.0
If pt 2.0 is enabled and a user passed in a compile.json file to specify the backend then model compilation is enabled
Enabled some reasonable defaults for mode that reduces overhead - aka cuda graphs
For convenience I also changed install_dependencies.py to include a mode that installs nightly torch

Logs

2022-12-05T23:56:53,168 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - Listening on port: /tmp/.ts.sock.9000
2022-12-05T23:56:53,172 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - Successfully loaded /home/ubuntu/serve/ts/configs/metrics.yaml.
2022-12-05T23:56:53,172 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - [PID]15049
2022-12-05T23:56:53,172 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - Torch worker started.
2022-12-05T23:56:53,173 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - Python runtime: 3.8.13
2022-12-05T23:56:53,187 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - Connection accepted: /tmp/.ts.sock.9000.
2022-12-05T23:56:53,228 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - model_name: densenet161, batchSize: 1
2022-12-05T23:56:57,592 [INFO ] W-9000-densenet161_1.0-stdout MODEL_LOG - Compiled model with backend inductor

examples/pt2/README.md

ts/torch_handler/base_handler.py

codecov · 2022-12-06T00:31:08Z

Codecov Report

Merging #1960 (2e5c215) into master (c59c6ac) will decrease coverage by 0.44%.
The diff coverage is 20.96%.

@@            Coverage Diff             @@
##           master    #1960      +/-   ##
==========================================
- Coverage   53.80%   53.35%   -0.45%     
==========================================
  Files          70       70              
  Lines        3169     3220      +51     
  Branches       56       56              
==========================================
+ Hits         1705     1718      +13     
- Misses       1464     1502      +38

Impacted Files	Coverage Δ
ts/torch_handler/base_handler.py	`0.00% <0.00%> (ø)`
ts/utils/util.py	`43.66% <56.52%> (+6.16%)`	⬆️

📣 We’re building smart automated test selection to slash your CI/CD build times. Learn more

examples/pt2/README.md

ts/utils/util.py

ts_scripts/install_dependencies.py

examples/pt2/README.md

ts/torch_handler/base_handler.py

msaroufim and others added 6 commits November 9, 2022 06:34

Experimental torchdynamo support

05e38fb

utils.py

715ee12

[skip ci] push

e093401

Update base_handler.py

4496028

Update base_handler.py

06eecca

Update base_handler.py

8ea85fc

msaroufim mentioned this pull request Nov 14, 2022

AITemplate support #1972

Closed

msaroufim added 3 commits December 5, 2022 22:10

add nightly installation instructions

9d48c87

weee

3b6c123

push

d582ef9

msaroufim changed the title ~~Experimental torchdynamo support~~ torch.compile support Dec 5, 2022

msaroufim and others added 6 commits December 5, 2022 15:27

Merge branch 'master' into experimental_dynamo

6f38675

update

6301e04

update

797dc07

updates

d74162a

push

2a28a76

push

999f417

msaroufim requested review from HamidShojanazeri and lxning December 5, 2022 23:59

msaroufim and others added 3 commits December 6, 2022 00:01

fixes

e9644ea

updates

682f03e

Update README.md

299803c

HamidShojanazeri reviewed Dec 6, 2022

View reviewed changes

examples/pt2/README.md Show resolved Hide resolved

ts/torch_handler/base_handler.py Show resolved Hide resolved

ts/torch_handler/base_handler.py Outdated Show resolved Hide resolved

mreso reviewed Dec 6, 2022

View reviewed changes

examples/pt2/README.md Outdated Show resolved Hide resolved

mreso reviewed Dec 6, 2022

View reviewed changes

examples/pt2/README.md Show resolved Hide resolved

mreso reviewed Dec 6, 2022

View reviewed changes

ts/utils/util.py Outdated Show resolved Hide resolved

mreso reviewed Dec 6, 2022

View reviewed changes

ts_scripts/install_dependencies.py Show resolved Hide resolved

msaroufim added 2 commits December 5, 2022 22:21

Update install_dependencies.py

85077b6

Update util.py

31f3895

Update README.md

d7dc89b

msaroufim requested review from HamidShojanazeri and mreso December 6, 2022 06:22

Update base_handler.py

723974d

msaroufim requested a review from agunapal December 6, 2022 17:23

msaroufim added enhancement New feature or request perf Performance issue p0 high priority labels Dec 6, 2022

HamidShojanazeri approved these changes Dec 6, 2022

View reviewed changes

lxning reviewed Dec 6, 2022

View reviewed changes

ts_scripts/install_dependencies.py Outdated Show resolved Hide resolved

examples/pt2/README.md Show resolved Hide resolved

ts/torch_handler/base_handler.py Show resolved Hide resolved

msaroufim added 2 commits December 6, 2022 20:16

update

0dc2928

push

b7ef673

msaroufim requested a review from lxning December 6, 2022 20:17

msaroufim and others added 5 commits December 6, 2022 12:17

Merge branch 'master' into experimental_dynamo

e0f4f3d

Update util.py

c7bb068

lint

ab4867b

lint

a572996

lint

2e5c215

msaroufim changed the title ~~torch.compile support~~ torch.compile() support Dec 7, 2022

lxning approved these changes Dec 7, 2022

View reviewed changes

lxning merged commit e22bce0 into master Dec 7, 2022

msaroufim deleted the experimental_dynamo branch December 7, 2022 00:34

msaroufim mentioned this pull request Mar 18, 2023

feat: add PyTorch/XLA support #2182

Merged

1 task

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

`torch.compile()` support #1960

`torch.compile()` support #1960

msaroufim commented Nov 9, 2022 •

edited

Loading

codecov bot commented Dec 6, 2022 •

edited

Loading

torch.compile() support #1960

torch.compile() support #1960

Conversation

msaroufim commented Nov 9, 2022 • edited Loading

Caveats

scope of this PR

Logs

codecov bot commented Dec 6, 2022 • edited Loading

Codecov Report

`torch.compile()` support #1960

`torch.compile()` support #1960

msaroufim commented Nov 9, 2022 •

edited

Loading

codecov bot commented Dec 6, 2022 •

edited

Loading