-
Notifications
You must be signed in to change notification settings - Fork 51
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
EVA2.0模型文件 #20
Comments
Readme 中的例子是28亿参数的 EVA2.0,模型文件肯定会放出,但是具体时间可能得等智源研究院完成模型的评估,大概在2月份或者三月份 |
谢谢 期待
gyxbndsthu ***@***.***>于2022年1月28日 周五19:17写道:
Readme 中的例子是28亿参数的 EVA2.0,模型文件肯定会放出,但是具体时间可能得等智源研究院完成模型的评估,大概在2月份或者三月份
—
Reply to this email directly, view it on GitHub
<#20 (comment)>, or
unsubscribe
<https://github.com/notifications/unsubscribe-auth/AAQUUTIQENLIJCPOUHSVO2TUYJ3LNANCNFSM5M74ON2Q>
.
Triage notifications on the go with GitHub Mobile for iOS
<https://apps.apple.com/app/apple-store/id1477376905?ct=notification-email&mt=8&pt=524675>
or Android
<https://play.google.com/store/apps/details?id=com.github.android&referrer=utm_campaign%3Dnotification-email%26utm_medium%3Demail%26utm_source%3Dgithub>.
You are receiving this because you authored the thread.Message ID:
***@***.***>
--
i yjqforever!
|
@t1101675 请问能在三月开放EVA2.0吗? |
您好,模型开源还在审批中,我们争取在三月下旬完成开源~ |
我们的 EVA2.0 模型已经完成开放,相关链接已经更新至 README。另外我们也放出了 EVA2.0 模型的技术报告,通过实验探索了使用大规模预训练构建对话系统的一些重要问题,欢迎关注~ |
非常感谢! |
体验下EVA2.0,测试了几个话题,感觉质量很差啊,请帮忙看看是我配置的问题吗 谢谢 @t1101675 |
您看一下模型的配置文件有没有改成 eva2.0 的? |
CONFIG_PATH有改成 eva2.0_model_config.json |
应该是什么地方配置出问题了,我们先本地 check 一下 |
好的,看上去是配置问题 |
我是修改模型并行度为1部署的,可以复现看看~ |
请问您运行的脚本是? |
change_mp修改模型并行度 python3 src/change_mp.py checkpoints/eva2.0_4 checkpoints/eva2.0 1 |
您好,我重新下载了我们上传到智源的模型,运行 |
可以把运行后的全部log发一下嘛 |
`python -m torch.distributed.launch --master_port 1256 --nproc_per_node 1 /mnt/src/eva_interactive.py --model-config /mnt/src/configs/model/eva2.0_model_config.json --model-parallel-size 1 --load /mnt/checkpoints/eva2.0 --no_load_strict --distributed-backend nccl --weight-decay 1e-2 --clip-grad 1.0 --tokenizer-path /mnt/bpe_dialog_new --temperature 0.9 --top_k 0 --top_p 0.9 --num-beams 4 --length-penalty 1.6 --repetition-penalty 1.6 --rule-path /mnt/rules --fp16 --deepspeed --deepspeed_config /mnt/src/configs/deepspeed/eva_ds_config.json
|
log看起来没问题 另外确认一下,您是使用的docker吗? |
eva2.0_model_config.json |
好的,我使用原始的模型试试,我是用的docker |
|
是修改模型并行度的问题,可以正常对话了。 |
记得好像以前默认并行度是4,就根据惯性修改了并行度。谢谢您的耐心指导~ |
|
好的,谢谢 |
请问paper中提到的模型存在几个问题:Consistency/Knowledge /Safety/Empathy,后续有优化的计划吗? |
这个我们正在尝试进行优化,但是因为属于比较前沿的研究问题,带有比较大的不确定性,所以优化后的版本什么时候放出还未确定。 |
请问,beam search、topp sampling超参组合,如果想生成效果比较稳定,降低多样性的话,该怎么调整参数呢?通过调整不同参数,发现效果在稳定和多样性之间trade-off |
可以吧 temperature 参数调小 |
请问EVA2.0的模型文件会放出么?
感觉效果挺不错的 ,是多少参数量?
The text was updated successfully, but these errors were encountered: