Avoid creating tensor in CosmosAttnProcessor2_0

https://github.com/huggingface/diffusers/blob/42077e6c734df2fc7bbed373abceab99635500ad/src/diffusers/models/transformers/transformer_cosmos.py#L188-L193
```
        # 4. Prepare for GQA
        query_idx = query.size(3)
        key_idx = key.size(3)
        value_idx = value.size(3)
        key = key.repeat_interleave(query_idx // key_idx, dim=3)
        value = value.repeat_interleave(query_idx // value_idx, dim=3)
```
Speedup ~10% here in Cosmos2TextToImagePipeline and Cosmos2VideoToWorldPipeline.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Avoid creating tensor in CosmosAttnProcessor2_0 #11761

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Participants

	# 4. Prepare for GQA
	query_idx = torch.tensor(query.size(3), device=query.device)
	key_idx = torch.tensor(key.size(3), device=key.device)
	value_idx = torch.tensor(value.size(3), device=value.device)
	key = key.repeat_interleave(query_idx // key_idx, dim=3)
	value = value.repeat_interleave(query_idx // value_idx, dim=3)

Avoid creating tensor in CosmosAttnProcessor2_0 #11761

Description

Activity

yiyixuxu commented on Jun 21, 2025

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Participants

Issue actions