Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

multilingal-e5 の "query: " prefix を追加後の評価結果 #3

Closed
hotchpotch opened this issue Jul 24, 2023 · 2 comments
Closed

Comments

@hotchpotch
Copy link
Contributor

日本語embeddingsの評価、大変参考になります。ありがとうございます。

multilingal-e5 の emb の評価なのですが、e5 ドキュメントの

Each input text should start with "query: " or "passage: ".
For tasks other than retrieval, you can simply use the "query: " prefix.

にあるように、”query: “ prefix を追加したほうが良さそうでしたので、追加して評価してみました。

結果、base の JSICK 以外では上がる結果となりました。とりわけ large ではどちらもかなり上がっているようです。

pull-request として出した方が良いのか迷ったのですが、一旦は issue にてご報告までに。

Base (JSTS) Base (add query prefix) (JSTS) Large (JSTS) Large (add query prefix) (JSTS)
JSTS 0.7839 0.7965 0.8098 0.8185
JSICK 0.8136 0.8057 0.7838 0.7939
@oshizo
Copy link
Owner

oshizo commented Jul 30, 2023

ありがとうございます!ドキュメントの記述を見落としていました。
最新のコミットでquery: を付けた評価結果に差し替えました。

@hotchpotch
Copy link
Contributor Author

@oshizo 結果の差し替え、ありがとうございました!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants