Is this alternative method?

pipe = StableDiffusionXLPipeline.from_pretrained(model_id, torch_dtype=torch.float16)

embeddings_dict = {}
with safe_open("unaestheticXLv31.safetensors", framework="pt") as f:
    for k in f.keys():
        embeddings_dict[k] = f.get_tensor(k)

print(embeddings_dict["clip_l"].shape,embeddings_dict["clip_g"].shape)
unaestheticXLv31=""
for i in range(len(embeddings_dict["clip_l"])):
    token = f"sksd{chr(i+65)}"
    unaestheticXLv31 += token
    pipe.tokenizer.add_tokens(token)
    token_id = pipe.tokenizer.convert_tokens_to_ids(token)
    pipe.text_encoder.resize_token_embeddings(len(pipe.tokenizer))
    pipe.text_encoder_2.resize_token_embeddings(len(pipe.tokenizer))
    pipe.text_encoder.get_input_embeddings().weight.data[token_id] = embeddings_dict["clip_l"][i]
    pipe.text_encoder_2.get_input_embeddings().weight.data[token_id] = embeddings_dict["clip_g"][i]

However, I got the warning:

You are resizing the embedding layer without providing a `pad_to_multiple_of` parameter. This means that the new embeding dimension will be 49409. This might induce some performance reduction as *Tensor Cores* will not be available. For more details  about this, or help on choosing the correct value for resizing, refer to this guide: https://docs.nvidia.com/deeplearning/performance/dl-performance-matrix-multiplication/index.html#requirements-tc

How can I fix it?

[Examples] Create textual inversion training script for SDXL #4405

Description

Metadata

Metadata

Assignees

Labels

Type

Projects

Milestone

Relationships

Development

Issue actions