关于lora_b矩阵的更新问题 #30

bw-wang19 · 2024-07-30T17:36:36Z

作者您好，我想请教一下关于工作里面lora_b矩阵更新的问题。论文里只写了它也是由lora_a张成的子空间中的向量构成，但是在训练过程中是如何保证这一点并更新加权系数的呢？我在代码中只找到了这样的片段，没看明白具体是如何完成要求的

cmnfriend · 2024-07-30T22:31:18Z

可以看看uie_trainer里的正则化项？

bw-wang19 · 2024-07-31T05:08:44Z

一共是两项，第一项是论文里面提到保持> $A_i \ i\in[1,t-1]$与> $A_t$正交的项，第二项是限制了> $A_t,B_t$大小的项，但这个只能保证不要让loranew_a/b太大吧？而且A的列向量是d维，但是B中向量是k维吧，一个K维向量是怎么由几个d维向量加权得到的，这个我也没搞懂。

cmnfriend · 2024-07-31T22:52:59Z

一个新的任务的参数变化计算方式：C=AB，C的列向量可由A的列向量线性表示，C的列向量张成的空间是A的列向量张成空间的子空间，所以我们希望在优化时能让新的lora参数A’和旧的参数A正交（内积=0->每个列向量都正交->正交），这样使得新的参数C'与旧的参数C也正交，使得两个任务的参数变化发生在不同的空间里

bw-wang19 · 2024-08-01T04:35:26Z

哦哦我明白了，我理解错了，万分感谢！

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

关于lora_b矩阵的更新问题 #30

关于lora_b矩阵的更新问题 #30

bw-wang19 commented Jul 30, 2024

cmnfriend commented Jul 30, 2024

bw-wang19 commented Jul 31, 2024 •

edited

Loading

cmnfriend commented Jul 31, 2024

bw-wang19 commented Aug 1, 2024

关于lora_b矩阵的更新问题 #30

关于lora_b矩阵的更新问题 #30

Comments

bw-wang19 commented Jul 30, 2024

cmnfriend commented Jul 30, 2024

bw-wang19 commented Jul 31, 2024 • edited Loading

cmnfriend commented Jul 31, 2024

bw-wang19 commented Aug 1, 2024

bw-wang19 commented Jul 31, 2024 •

edited

Loading