[TF Bart] Refactor TFBart #9029

patrickvonplaten · 2020-12-10T11:08:12Z

What does this PR do?

Mirror of #8900 for TFBart.

The same improvements are done for Bart except adding torchscript functionality (as it does not exist in tf bart).

src/transformers/models/bart/modeling_bart.py

src/transformers/models/t5/modeling_tf_t5.py

patrickvonplaten · 2020-12-14T15:30:33Z

No speed regression on GPU brutasse in graph mode. PR is ready for review IMO.

sgugger

LGTM, thanks for simplifying this!

jplu

Awesome!! Thanks for taking care of this part!!

Should we merge #9063 before or after this one?

patrickvonplaten · 2020-12-14T17:15:54Z

Awesome!! Thanks for taking care of this part!!

Should we merge #9063 before or after this one?

Let's merge after your PR. I'll take the merge conflicts from you :-)
Also this way I can play around a bit with the new not-existing-cast-bool functionality, yaaay!

src/transformers/models/bart/modeling_tf_bart.py

LysandreJik

Great, LGTM! Thanks for working on this @patrickvonplaten!

src/transformers/models/bart/modeling_tf_bart.py

LysandreJik · 2020-12-15T15:29:24Z

src/transformers/models/bart/modeling_tf_bart.py

+            if inputs["training"] and (dropout_probability < self.layerdrop):  # skip the layer
+                continue


Is the continue approach better?

it partly fixes: #9048

src/transformers/models/bart/modeling_tf_bart.py

* reorder file * delete unnecesarry function * make style * save intermediate * fix attention masks * correct tf bart past key values * solve merge conflict bug * correct tensor dims * save intermediate tf * change attn layer * fix typo re-order past * inputs_embeds * make fix copies * finish tests * fix graph mode * appyl lysandres suggestions

patrickvonplaten added 16 commits December 10, 2020 10:58

reorder file

9990d16

delete unnecesarry function

9cda87e

make style

263ab8d

save intermediate

162076e

fix attention masks

112038e

correct tf bart past key values

a18844d

merge conflicts

20405e1

solve merge conflict bug

f4e11b6

correct tensor dims

abada07

save intermediate tf

eef7a38

change attn layer

450742b

fix typo re-order past

9d7df0b

inputs_embeds

69cacda

fix conflicts

0ba5ec5

make fix copies

e454104

finish tests

c722569

patrickvonplaten commented Dec 14, 2020

View reviewed changes

src/transformers/models/bart/modeling_bart.py Show resolved Hide resolved

patrickvonplaten commented Dec 14, 2020

View reviewed changes

src/transformers/models/t5/modeling_tf_t5.py Show resolved Hide resolved

patrickvonplaten requested review from sgugger, jplu and LysandreJik December 14, 2020 15:31

sgugger approved these changes Dec 14, 2020

View reviewed changes

jplu approved these changes Dec 14, 2020

View reviewed changes

patrickvonplaten added 2 commits December 14, 2020 19:42

merge conflicts

34f2a66

fix graph mode

e30a385

patrickvonplaten mentioned this pull request Dec 14, 2020

🐛 [TFBART] LayerDrop not working on TPU #9048

Closed

2 tasks

patrickvonplaten commented Dec 14, 2020

View reviewed changes

src/transformers/models/bart/modeling_tf_bart.py Show resolved Hide resolved

Merge remote-tracking branch 'main/master' into refactor_tf_bart

9edbcb3

LysandreJik approved these changes Dec 15, 2020

View reviewed changes

jplu reviewed Dec 15, 2020

View reviewed changes

src/transformers/models/bart/modeling_tf_bart.py Show resolved Hide resolved

appyl lysandres suggestions

15ae42b

patrickvonplaten merged commit abc573f into huggingface:master Dec 15, 2020

patrickvonplaten deleted the refactor_tf_bart branch December 15, 2020 17:55

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[TF Bart] Refactor TFBart #9029

[TF Bart] Refactor TFBart #9029

patrickvonplaten commented Dec 10, 2020 •

edited

patrickvonplaten commented Dec 14, 2020

sgugger left a comment

jplu left a comment

patrickvonplaten commented Dec 14, 2020 •

edited

LysandreJik left a comment

LysandreJik Dec 15, 2020

patrickvonplaten Dec 15, 2020

		if inputs["training"] and (dropout_probability < self.layerdrop): # skip the layer
		continue

[TF Bart] Refactor TFBart #9029

[TF Bart] Refactor TFBart #9029

Conversation

patrickvonplaten commented Dec 10, 2020 • edited

What does this PR do?

patrickvonplaten commented Dec 14, 2020

sgugger left a comment

Choose a reason for hiding this comment

jplu left a comment

Choose a reason for hiding this comment

patrickvonplaten commented Dec 14, 2020 • edited

LysandreJik left a comment

Choose a reason for hiding this comment

LysandreJik Dec 15, 2020

Choose a reason for hiding this comment

patrickvonplaten Dec 15, 2020

Choose a reason for hiding this comment

patrickvonplaten commented Dec 10, 2020 •

edited

patrickvonplaten commented Dec 14, 2020 •

edited