Add support for LoRA adapters trained with Rank-Stabilized scaling #299

arnavgarg1 · 2024-03-04T19:56:08Z

In PEFT 0.9, support was added for adapters trained using a new flag called use_rslora.

When set to True, Rank-Stabilized LoRA sets the adapter scaling factor to lora_alpha/math.sqrt(r), since it was proven to work better. Otherwise, it will use the original default value of lora_alpha/r.

In equation form:

Normal LoRA layers: W0X + (lora_alpha/r)(BAX) where W0 is the base model, BA are the lora weight matrices and X is the input from the embedding layer/previous transformer layer.
LoRA layers with RSLoRA enabled: W0X + (lora_alpha/sqrt(r))(BAX)

In particular, this is useful when using larger ranks since it prevents the gradient from collapsing as rank increases, which may result in higher ranks actually leading to better performance (not true by default today and in the original LoRA paper). Paper: https://arxiv.org/pdf/2312.03732.pdf.

tgaddair · 2024-03-04T23:58:53Z

server/lorax_server/models/model.py

            lora_a, lora_a_name = module_map[weight_name]["lora_A"]
            lora_a = lora_a.to(base_device, self.dtype)

            lora_b, lora_b_name = module_map[weight_name]["lora_B"]
            lora_b = lora_b.to(base_device, self.dtype)

-            scale = adapter_config.lora_alpha / adapter_config.r
+            scale: float = get_scaling_factor(


can we remove : float here?

arnavgarg1 added 2 commits March 4, 2024 11:47

Add support for Rank-Stabilized LoRA adapters

d211ecb

Use utility functions

b52b2f4

arnavgarg1 requested review from tgaddair and geoffreyangus March 4, 2024 19:56

arnavgarg1 changed the title ~~Add support for Rank-Stabilized LoRA adapters~~ Add support for LoRA adapters trained with Rank-Stabilized scaling Mar 4, 2024

Fix typo

d16a7a9

tgaddair reviewed Mar 4, 2024

View reviewed changes

tgaddair approved these changes Mar 4, 2024

View reviewed changes

Remove float

059db3b

arnavgarg1 merged commit 21631fa into main Mar 5, 2024
1 check passed

arnavgarg1 deleted the rslora branch March 5, 2024 00:31

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add support for LoRA adapters trained with Rank-Stabilized scaling #299

Add support for LoRA adapters trained with Rank-Stabilized scaling #299

arnavgarg1 commented Mar 4, 2024 •

edited

tgaddair Mar 4, 2024

Add support for LoRA adapters trained with Rank-Stabilized scaling #299

Add support for LoRA adapters trained with Rank-Stabilized scaling #299

Conversation

arnavgarg1 commented Mar 4, 2024 • edited

tgaddair Mar 4, 2024

Choose a reason for hiding this comment

arnavgarg1 commented Mar 4, 2024 •

edited