[`feat`] Add 'precision' support to the EmbeddingSimilarityEvaluator #2559

tomaarsen · 2024-03-25T13:38:24Z

Hello!

Pull Request overview

Add 'precision' support to the EmbeddingSimilarityEvaluator

Details

This PR adds simple support for evaluating quantized embeddings, by passing precision to the evaluator instance.

from sentence_transformers import SentenceTransformer
from sentence_transformers.evaluation import EmbeddingSimilarityEvaluator, SimilarityFunction
import datasets

model = SentenceTransformer("all-mpnet-base-v2")

stsb = datasets.load_dataset("mteb/stsbenchmark-sts", split="test")

for precision in ["float32", "uint8", "int8", "ubinary", "binary"]:
    evaluator = EmbeddingSimilarityEvaluator(
        stsb["sentence1"],
        stsb["sentence2"],
        [score / 5 for score in stsb["score"]],
        main_similarity=SimilarityFunction.COSINE,
        name="sts-test",
        precision=precision,
    )
    print(precision, evaluator(model))

float32 0.8342190421330611
uint8 0.8260094846238505
int8 0.8312754408857808
ubinary 0.8244338431442343
binary 0.8244338431442343

Tom Aarsen

Add 'precision' support to the EmbeddingSimilarityEvaluator

ff71342

tomaarsen merged commit 1e35d8c into UKPLab:master Mar 26, 2024
9 checks passed

tomaarsen deleted the quantization/evaluation branch March 26, 2024 07:10

tomaarsen added a commit that referenced this pull request Mar 26, 2024

Add 'precision' support to the EmbeddingSimilarityEvaluator (#2559)

add581e

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[`feat`] Add 'precision' support to the EmbeddingSimilarityEvaluator #2559

[`feat`] Add 'precision' support to the EmbeddingSimilarityEvaluator #2559

tomaarsen commented Mar 25, 2024

[feat] Add 'precision' support to the EmbeddingSimilarityEvaluator #2559

[feat] Add 'precision' support to the EmbeddingSimilarityEvaluator #2559

Conversation

tomaarsen commented Mar 25, 2024

Pull Request overview

Details

[`feat`] Add 'precision' support to the EmbeddingSimilarityEvaluator #2559

[`feat`] Add 'precision' support to the EmbeddingSimilarityEvaluator #2559