Comparação com outros modelos #1

FerroEduardo · 2023-05-16T18:45:20Z

Seria possível adicionar comparações com outros modelos, como os SentenceTransformer multilingual?
Pelos testes que realizei, os modelos apresentados aqui possuem um desempenho bem superior em STS

ruanchaves · 2023-05-17T12:33:38Z

Olá Eduardo,

Este repositório ainda está em desenvolvimento e temos previsão de lançar a versão final por volta do mês de julho. Não temos planos de realizar experimentos com modelos que estejam muito abaixo do estado da arte, como é o caso de baselines zero-shot usando SentenceTransformers.

Entretanto, caso você decida realizar esses experimentos, por favor me informe para que eu possa referenciar seus benchmarks no repositório. Você também pode submeter um pull request diretamente com suas contribuições.

thacio · 2023-06-17T00:12:20Z

Opa, se tiver interesse de conferir no STS o ult5-small conseguiu pearson=0.8174 e mse =0.419042, em todas as tentativas sempre chegou abaixo do 0.47 atual. Único porém é que eu não conferi se o dataset que está no huggingface é exatamente o mesmo do github, acredito que seja.

Os sentence-transformers sem treino realmente ficam aquém. o sentence-transformer-ult5-pt-small faz cosine person em 0.76 (não sei se é o mesmo que o personr, mas deve ser parecido) , e o paraphrase-multilingual-mpnet-base-v2 não lembro, mas é marginalmente acima.

Pros casos desses encoder-decoders, eu já fiz um dataset que facilita a vida: https://github.com/thacio/LLM-Notebooks .
Estou implementado os encoders, testando ainda.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Comparação com outros modelos #1

Comparação com outros modelos #1

FerroEduardo commented May 16, 2023

ruanchaves commented May 17, 2023

thacio commented Jun 17, 2023

Comparação com outros modelos #1

Comparação com outros modelos #1

Comments

FerroEduardo commented May 16, 2023

ruanchaves commented May 17, 2023

thacio commented Jun 17, 2023