use _make_causal_mask in clip/vit models #23942

kashif · 2023-06-01T15:08:24Z

What does this PR do?

Uses the _make_causal_mask helper to build the causal attention mask which works for bfloat16 dtype.

the current _build_causal_attention_mask uses the torch.triu_ which is not supported in pytorch release fixed recently in main: pytorch/pytorch#101414

should fix huggingface/diffusers#3453

HuggingFaceDocBuilderDev · 2023-06-01T15:23:05Z

The documentation is not available anymore as the PR was closed or merged.

sgugger

Could you also have a second look @amyeroberts please?
Thanks!

amyeroberts

LGTM - thanks for fixing!

use _make_causal_mask in clip models

use _make_causal_mask in clip models

b1e6872

kashif changed the title ~~use _make_causal_mask in clip based models~~ use _make_causal_mask in clip/vit models Jun 1, 2023

kashif mentioned this pull request Jun 1, 2023

train_text_to_image.py | RuntimeError: "triu_tril_cuda_template" not implemented for 'BFloat16' huggingface/diffusers#3453

Closed

kashif requested a review from sgugger June 1, 2023 16:41

sgugger approved these changes Jun 1, 2023

View reviewed changes

amyeroberts approved these changes Jun 1, 2023

View reviewed changes

sgugger merged commit c62b01d into huggingface:main Jun 1, 2023
17 of 19 checks passed

kashif deleted the causal-mask-bfloat16 branch June 1, 2023 20:11

gojiteji pushed a commit to gojiteji/transformers that referenced this pull request Jun 5, 2023

use _make_causal_mask in clip/vit models (huggingface#23942)

ad8a583

use _make_causal_mask in clip models

novice03 pushed a commit to novice03/transformers that referenced this pull request Jun 23, 2023

use _make_causal_mask in clip/vit models (huggingface#23942)

fe79c58

use _make_causal_mask in clip models

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

use _make_causal_mask in clip/vit models #23942

use _make_causal_mask in clip/vit models #23942

kashif commented Jun 1, 2023

HuggingFaceDocBuilderDev commented Jun 1, 2023 •

edited

sgugger left a comment

amyeroberts left a comment

use _make_causal_mask in clip/vit models #23942

use _make_causal_mask in clip/vit models #23942

Conversation

kashif commented Jun 1, 2023

What does this PR do?

HuggingFaceDocBuilderDev commented Jun 1, 2023 • edited

sgugger left a comment

Choose a reason for hiding this comment

amyeroberts left a comment

Choose a reason for hiding this comment

HuggingFaceDocBuilderDev commented Jun 1, 2023 •

edited