Skip to content

建议更新 7.4 Empirical Evaluation 的数据 #91

@twang2218

Description

@twang2218

大语言模型发展很快,7.4 Empirical Evaluation 中的模型和能力,已经难以作为今天模型的参考了,时隔一年后,无论是开源模型还是闭源模型都有了长足的进展,特别是关于开源模型的 Human AlignmentTool Manipulation

截屏2024-10-09 下午3 03 03

因此建议更新这一节所使用的模型以及对应数据。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions