[Feature] Add Qwen 1.8b config #252

xiaohangguo · 2023-12-01T06:19:41Z

添加了Qwen 1.8b训练配置
测试其中Qwen1.8b Qlora code alpaca训练和合并推理
对话模板结果正常。虽然训练效果不太好。

LZHgrla · 2023-12-01T09:26:54Z

@xiaohangguo
非常感谢！
建议删掉一些不常用的数据集，仅保留 4-5 个示例 configs，以降低后期新增其它 feature 而维护 configs 的代价

xiaohangguo · 2023-12-01T09:28:29Z

@xiaohangguo 非常感谢！建议删掉一些不常用的数据集，仅保留 4-5 个示例 configs，以降低后期新增其它 feature 而维护 configs 的代价

明白，我以为要全部支持，就批量改了。我保留alpaca系列的吧。这样简洁一点。

LZHgrla · 2023-12-01T09:44:48Z

@xiaohangguo 请问是否方便测试一下 1.8b-chat 的微调、对话是否有问题？

如果没有问题可以一并提交，并以此拓展到 #254 来支持 72b-chat

xiaohangguo · 2023-12-01T09:49:45Z

@xiaohangguo 请问是否方便测试一下 1.8b-chat 的微调、对话是否有问题？

如果没有问题可以一并提交，并以此拓展到 #254 来支持 72b-chat

已经测试过了，微调和对话均没有问题。没有出现报错等异常，只是LORA微调效果比较差。

LZHgrla · 2023-12-01T09:56:20Z

@xiaohangguo 好的，非常感谢！如果是在专业领域效果较差，但在通用数据集（如alpaca）上效果没有异常的话，建议一并将 chat 的 configs commit 上来～

xiaohangguo · 2023-12-01T09:57:38Z

@xiaohangguo 好的，非常感谢！如果是在专业领域效果较差，但在通用数据集（如alpaca）上效果没有异常的话，建议一并将 chat 的 configs commit 上来～

好的，交给我

xiaohangguo · 2023-12-01T11:39:09Z

@xiaohangguo 好的，非常感谢！如果是在专业领域效果较差，但在通用数据集（如alpaca）上效果没有异常的话，建议一并将 chat 的 configs commit 上来～

好的，交给我

又测试了一遍，训练-合并-推理，没什么问题，问答均正常。

LZHgrla · 2023-12-04T09:03:07Z

@xiaohangguo
建议将文件名中，所有的1.8修改为1_8

原因

避免在文件名中使用.
与模型名对齐

其它LGTM！

xiaohangguo · 2023-12-04T09:22:59Z

@xiaohangguo 建议将文件名中，所有的1.8修改为1_8

原因

避免在文件名中使用.

与模型名对齐

其它LGTM！

搞定！

xiaohangguo and others added 3 commits December 1, 2023 13:36

add qwen_1.8b config

e2992e3

fix .gitignore

ed520ba

Merge branch 'main' into qwen_1_8b_config

6c011c7

Remove redundan config

f3fc96d

Remove qwen_1.8b arxiv config

e1b91b1

add qwen_1.8b_chat config

5e4453a

update name 'qwen1.8b'

33d6b0c

LZHgrla approved these changes Dec 4, 2023

View reviewed changes

LZHgrla merged commit ed27cc4 into InternLM:main Dec 4, 2023
1 check passed

LZHgrla mentioned this pull request Dec 11, 2023

请问支持qwen1.8B的微调吗？ #261

Closed

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Feature] Add Qwen 1.8b config #252

[Feature] Add Qwen 1.8b config #252

xiaohangguo commented Dec 1, 2023

LZHgrla commented Dec 1, 2023

xiaohangguo commented Dec 1, 2023

LZHgrla commented Dec 1, 2023

xiaohangguo commented Dec 1, 2023

LZHgrla commented Dec 1, 2023

xiaohangguo commented Dec 1, 2023

xiaohangguo commented Dec 1, 2023 •

edited

LZHgrla commented Dec 4, 2023 •

edited

xiaohangguo commented Dec 4, 2023

[Feature] Add Qwen 1.8b config #252

[Feature] Add Qwen 1.8b config #252

Conversation

xiaohangguo commented Dec 1, 2023

LZHgrla commented Dec 1, 2023

xiaohangguo commented Dec 1, 2023

LZHgrla commented Dec 1, 2023

xiaohangguo commented Dec 1, 2023

LZHgrla commented Dec 1, 2023

xiaohangguo commented Dec 1, 2023

xiaohangguo commented Dec 1, 2023 • edited

LZHgrla commented Dec 4, 2023 • edited

xiaohangguo commented Dec 4, 2023

xiaohangguo commented Dec 1, 2023 •

edited

LZHgrla commented Dec 4, 2023 •

edited