后面有计划开源finetuning的代码吗，以及会尝试LoRA吗 #3

TccccD · 2023-03-20T04:43:17Z

No description provided.

Life-0-1 · 2023-03-20T06:18:03Z

我们正在整理代码，后续会开源。目前很多开源的finetune decoder-only模型的代码就可以用于finetune我们的模型，如果你急着训练，可以先用这些代码，同时把其中的checkpoint替换成我们的开源模型即可。

我们目前没有尝试LoRA的计划。

ScottishFold007 · 2023-03-20T07:48:29Z

lora的我跑过，不是很行，模型一大，loss就急剧变为0，eval loss是nan满全场

TccccD · 2023-03-20T08:10:22Z

我们正在整理代码，后续会开源。目前很多开源的finetune decoder-only模型的代码就可以用于finetune我们的模型，如果你急着训练，可以先用这些代码，同时把其中的checkpoint替换成我们的开源模型即可。

我们目前没有尝试LoRA的计划。

感谢回复！想问下训练bloom7B用了多少卡

BowieHsu · 2023-03-20T08:11:09Z

@TccccD 我自己复现了stanford的训练，4*A100 1个半小时

TccccD · 2023-03-20T08:16:46Z

@TccccD 我自己复现了stanford的训练，4*A100 1个半小时

是指用stanford的训练方式训练Bloom7B吗，还是LLaMA

ScottishFold007 · 2023-03-20T08:24:12Z

@TccccD 我自己复现了stanford的训练，4*A100 1个半小时

是指用stanford的训练方式训练Bloom7B吗，还是LLaMA

是5万条英文prompt数据那个吧？这个还是有可能的

BowieHsu · 2023-03-20T08:24:37Z

@ScottishFold007 是的

feizc · 2023-03-22T03:11:03Z

Hi, 感谢作者对于数据和模型的开源。

全模型微调和lora脚本可以参考： https://github.com/feizc/MLE-LLaMA

barius added the enhancement New feature or request label Mar 20, 2023

bestpredicts closed this as completed Mar 22, 2023

cillinzhang mentioned this issue May 20, 2023

新版训练代码，训完一个epoch必crash：Exception raised from query at ../aten/src/ATen/cuda/CUDAEvent.h:95 (most recent call first): #379

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

后面有计划开源finetuning的代码吗，以及会尝试LoRA吗 #3

后面有计划开源finetuning的代码吗，以及会尝试LoRA吗 #3

TccccD commented Mar 20, 2023

Life-0-1 commented Mar 20, 2023

ScottishFold007 commented Mar 20, 2023

TccccD commented Mar 20, 2023

BowieHsu commented Mar 20, 2023

TccccD commented Mar 20, 2023

ScottishFold007 commented Mar 20, 2023

BowieHsu commented Mar 20, 2023

feizc commented Mar 22, 2023

后面有计划开源finetuning的代码吗，以及会尝试LoRA吗 #3

后面有计划开源finetuning的代码吗，以及会尝试LoRA吗 #3

Comments

TccccD commented Mar 20, 2023

Life-0-1 commented Mar 20, 2023

ScottishFold007 commented Mar 20, 2023

TccccD commented Mar 20, 2023

BowieHsu commented Mar 20, 2023

TccccD commented Mar 20, 2023

ScottishFold007 commented Mar 20, 2023

BowieHsu commented Mar 20, 2023

feizc commented Mar 22, 2023