We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
将输入改成 input_text = "近日,北京智源人工智能研究院和清华大学研究团队发布了以中文为核心的大规模预训练语言模型 CPM-LM,参数规模达 26 亿,预训练中文数据规模 100 GB。" 会报错 "Unexpected model output: 26239" 请问fill_blank输入的文本有什么要求?或者对要填空的词有什么要求? 用的是 cpm2 = bminf.models.CPM2()
用pip 安装的,bminf-1.0.0
The text was updated successfully, but these errors were encountered:
在进行填空时,需要通过<span>来设置需要预测的位置。
<span>
Input: 近日,北京智源人工智能研究院和清华大学____以中文为核心的大规模预训练语言模型 “____”,参数规模达 26 亿,预训练中文数据规模 100 GB。
Output: 近日,北京智源人工智能研究院和清华大学共同发布以中文为核心的大规模预训练语言模型 “中文语库”,参数规模达 26 亿,预训练中文数据规模 100 GB。
在T5预训练任务,会将15%的token给mask掉,所以在最终使用的时候,合理的设置span会有更好的效果。
Sorry, something went wrong.
请问对于span的选择有什么要求吗?如果 Input: 近日,北京智源人工智能研究院和清华大学研究团队____以中文为核心的大规模预训练语言模型CPM-LM,参数规模达 26 亿,预训练中文数据规模 100 GB。 则报错 Unexpected model output: 26239 这个错误的原因是什么?
Input: 近日,北京智源人工智能研究院和清华大学研究团队____以中文为核心的大规模预训练语言模型CPM-LM,参数规模达 26 亿,预训练中文数据规模 100 GB。
Unexpected model output: 26239
这个应该是因为span数量有点少所以模型不能很好的去做填空任务,一般随便再加两个就好了。
No branches or pull requests
将输入改成
input_text = "近日,北京智源人工智能研究院和清华大学研究团队发布了以中文为核心的大规模预训练语言模型 CPM-LM,参数规模达 26 亿,预训练中文数据规模 100 GB。"
会报错
"Unexpected model output: 26239"
请问fill_blank输入的文本有什么要求?或者对要填空的词有什么要求?
用的是
cpm2 = bminf.models.CPM2()
用pip 安装的,bminf-1.0.0
The text was updated successfully, but these errors were encountered: