讨论一下实时微调的技术实现可能性? #21

zhaodice · 2023-03-27T17:38:41Z

有没有可能，实现可以通过和AI对话(不管是webui还是命令行)，得到一系列聊天记录。
对ai某些回答不满意，可以强制修改聊天记录，最终使得对话符合预期。
再一键将该对话喂给AI，并入微调层
微调层足够多后，再并入大模型中

zhaodice · 2023-03-27T17:43:34Z

而且随着训练…参数似乎在增加?能在不改变参数量的情况下微调模型吗#(通过逐步覆盖一些用不到的参数，通过牺牲模型的其他功能，实现总参数不变的微调)

zhaodice · 2023-04-03T04:31:19Z

我自己验证好了，可以实现，写了个webui可以实时修改对话，并把对话写入训练集，现在还差最后一个技术难题

safehumeng · 2023-04-06T06:47:20Z

而且随着训练…参数似乎在增加?能在不改变参数量的情况下微调模型吗#(通过逐步覆盖一些用不到的参数，通过牺牲模型的其他功能，实现总参数不变的微调)

为什么参数会增加呢，每次训练都用一个新的lora层么

zhaodice · 2023-04-09T05:45:57Z

而且随着训练…参数似乎在增加?能在不改变参数量的情况下微调模型吗#(通过逐步覆盖一些用不到的参数，通过牺牲模型的其他功能，实现总参数不变的微调)

为什么参数会增加呢，每次训练都用一个新的lora层么

难道不是，训练集越大，参数越多吗…

yuanzhoulvpi2017 · 2023-04-10T00:01:57Z

因为你训练后的模型，已经是被peft包裹后的模型了。peft(base_model)
然后你又训练了一次，这一次是peft(peft(base_model))
然后你又训练了一次，这一次是peft(peft(peft(base_model)))
这样下去，肯定参数越来越大。
因为peft本质上就是对：原始的模型参数全部固定（require_grad=False)，然后对每一个layer的query_key_value做loraa*lorab做旁路了；在模型结构上，又包裹了新的一层。
直接用，肯定是不行的，要能够把结构拆解开，才能做实事微调。

zhaodice · 2023-04-10T15:11:41Z

因为你训练后的模型，已经是被peft包裹后的模型了。peft(base_model)

然后你又训练了一次，这一次是peft(peft(base_model))

然后你又训练了一次，这一次是peft(peft(peft(base_model)))

这样下去，肯定参数越来越大。

因为peft本质上就是对：原始的模型参数全部固定（require_grad=False)，然后对每一个layer的query_key_value做loraa*lorab做旁路了；在模型结构上，又包裹了新的一层。

直接用，肯定是不行的，要能够把结构拆解开，才能做实事微调。

事实上我已经跑通了，hcgf这项目，多次继续微调，微调文件.pt永远是16MB，似乎没有出现嵌套情况（不过每次微调都要加上以前的老数据，否则会出现灾难性遗忘）

huangxd- · 2023-04-15T03:04:20Z

因为你训练后的模型，已经是被peft包裹后的模型了。peft(base_model)

然后你又训练了一次，这一次是peft(peft(base_model))

然后你又训练了一次，这一次是peft(peft(peft(base_model)))

这样下去，肯定参数越来越大。

因为peft本质上就是对：原始的模型参数全部固定（require_grad=False)，然后对每一个layer的query_key_value做loraa*lorab做旁路了；在模型结构上，又包裹了新的一层。

直接用，肯定是不行的，要能够把结构拆解开，才能做实事微调。

事实上我已经跑通了，hcgf这项目，多次继续微调，微调文件.pt永远是16MB，似乎没有出现嵌套情况（不过每次微调都要加上以前的老数据，否则会出现灾难性遗忘）

如果不加老数据会遗忘，必须加上的话，跟从预训练模型重新训练有什么区别？

zhaodice · 2023-04-15T08:47:36Z

因为你训练后的模型，已经是被peft包裹后的模型了。peft(base_model)

然后你又训练了一次，这一次是peft(peft(base_model))

然后你又训练了一次，这一次是peft(peft(peft(base_model)))

这样下去，肯定参数越来越大。

因为peft本质上就是对：原始的模型参数全部固定（require_grad=False)，然后对每一个layer的query_key_value做loraa*lorab做旁路了；在模型结构上，又包裹了新的一层。

直接用，肯定是不行的，要能够把结构拆解开，才能做实事微调。

事实上我已经跑通了，hcgf这项目，多次继续微调，微调文件.pt永远是16MB，似乎没有出现嵌套情况（不过每次微调都要加上以前的老数据，否则会出现灾难性遗忘）

如果不加老数据会遗忘，必须加上的话，跟从预训练模型重新训练有什么区别？

有区别啊，因为我一开始【并没有】这么多数据集，我先喂一点数据，得到微调1.0，和微调1.0交互得到新数据，人工修改后加入数据集。

重新微调得到微调2.0，继续交互得到新数据再并入以前的旧数据集。
就这样，数据良品率越来越高，随着并入数据越来越多，自然训练效果越来越好。

如果你一次性就有这么多数据，一次训练成本是最低的，但没这么多数据怎么办呀，就需要一步一步一边训练一边引导AI自己产生训练集了。

zhaodice · 2023-04-15T08:52:55Z

而且，在现有的微调基础上，用(新训练集+旧训练集)继续训练，与重新开始微调相比，loss下降的会很快，相当于loss就是从数据变化的那部分开始下降了~如果你重头微调，loss会从头下降，慢。

huangxd- · 2023-04-15T11:34:46Z

而且，在现有的微调基础上，用(新训练集+旧训练集)继续训练，与重新开始微调相比，loss下降的会很快，相当于loss就是从数据变化的那部分开始下降了~如果你重头微调，loss会从头下降，慢。

求教继续训练的示例代码有吗？我按这个代码 mymusise/ChatGLM-Tuning#14 (comment) 貌似没有在上次的checkpoint继续，貌似loss还是重头开始的，没有下降的很快

zhaodice · 2023-04-15T12:01:30Z

而且，在现有的微调基础上，用(新训练集+旧训练集)继续训练，与重新开始微调相比，loss下降的会很快，相当于loss就是从数据变化的那部分开始下降了~如果你重头微调，loss会从头下降，慢。

求教继续训练的示例代码有吗？我按这个代码 mymusise/ChatGLM-Tuning#14 (comment) 貌似没有在上次的checkpoint继续，貌似loss还是重头开始的，没有下降的很快

去找 hcgf 这个项目

yuanzhoulvpi2017 closed this as completed Apr 11, 2023

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

讨论一下实时微调的技术实现可能性? #21

讨论一下实时微调的技术实现可能性? #21

zhaodice commented Mar 27, 2023

zhaodice commented Mar 27, 2023

zhaodice commented Apr 3, 2023

safehumeng commented Apr 6, 2023

zhaodice commented Apr 9, 2023

yuanzhoulvpi2017 commented Apr 10, 2023

zhaodice commented Apr 10, 2023 •

edited

huangxd- commented Apr 15, 2023 •

edited

zhaodice commented Apr 15, 2023

zhaodice commented Apr 15, 2023

huangxd- commented Apr 15, 2023 •

edited

zhaodice commented Apr 15, 2023

讨论一下实时微调的技术实现可能性? #21

讨论一下实时微调的技术实现可能性? #21

Comments

zhaodice commented Mar 27, 2023

zhaodice commented Mar 27, 2023

zhaodice commented Apr 3, 2023

safehumeng commented Apr 6, 2023

zhaodice commented Apr 9, 2023

yuanzhoulvpi2017 commented Apr 10, 2023

zhaodice commented Apr 10, 2023 • edited

huangxd- commented Apr 15, 2023 • edited

zhaodice commented Apr 15, 2023

zhaodice commented Apr 15, 2023

huangxd- commented Apr 15, 2023 • edited

zhaodice commented Apr 15, 2023

zhaodice commented Apr 10, 2023 •

edited

huangxd- commented Apr 15, 2023 •

edited

huangxd- commented Apr 15, 2023 •

edited