# Packages

In [73]:
from sentence_transformers import SentenceTransformer
import numpy as np 
import itertools


# Load pre-trained sentence trasformer

In [74]:
model = SentenceTransformer('hiiamsid/sentence_similarity_spanish_es')

# Test

In [75]:
def cosine_similarity(u, v):
    return (u @ v) / (np.linalg.norm(u) * np.linalg.norm(v))

In [76]:
cosine_similarity(np.array([1, 1]), np.array([-10, -10]))

-0.9999999999999998

In [77]:
question = '' # '¿Confirma o cancela su asistencia al turno? - '
sentences = ['caliente, suave y dulce',
             'frío, suave y dulce',
             'ácido y frío pero refrescante',
             'ácido y caliente para un resfrío',
             'amargo y frío',
             'refrescante',
             'palta pisada',
             'dulce de leche']

q_sentences = [(question+s) for s in sentences]

options = ['cerveza',
           'caldo',
           'helado de frutilla',
           'aguacate',
           'vino']
q_options = [(question+o) for o in options]

In [78]:
sentences_embeddings = [(s, e) for s, e in zip(q_sentences, model.encode(q_sentences, convert_to_numpy=True))]
options_embeddings = [(s, e) for s, e in zip(q_options, model.encode(q_options, convert_to_numpy=True))]

ratio_th = 0.7

for s_e in sentences_embeddings:
    best_simil = -np.inf
    worst_simil = np.inf
    for o_e in options_embeddings:
        simil = cosine_similarity(s_e[1], o_e[1])
        if simil > best_simil:
            best_simil = simil
            best_option = o_e[0]
        if simil < worst_simil:
            worst_simil = simil
    if best_simil > worst_simil/ratio_th:
        print(s_e[0], '---', best_option)
    else:
        print(s_e[0], ' *** ')

print('***')
for sentence, option in itertools.product(sentences_embeddings, options_embeddings):
    print(cosine_similarity(sentence[1], option[1]), sentence[0], '==', option[0])


caliente, suave y dulce --- helado de frutilla
frío, suave y dulce --- helado de frutilla
ácido y frío pero refrescante  *** 
ácido y caliente para un resfrío --- caldo
amargo y frío --- helado de frutilla
refrescante --- cerveza
palta pisada --- aguacate
dulce de leche --- helado de frutilla
***
0.18998058 caliente, suave y dulce == cerveza
0.2766103 caliente, suave y dulce == caldo
0.3128675 caliente, suave y dulce == helado de frutilla
0.27344927 caliente, suave y dulce == aguacate
0.1351167 caliente, suave y dulce == vino
0.16659042 frío, suave y dulce == cerveza
0.319178 frío, suave y dulce == caldo
0.3284099 frío, suave y dulce == helado de frutilla
0.25997823 frío, suave y dulce == aguacate
0.17074615 frío, suave y dulce == vino
0.3786204 ácido y frío pero refrescante == cerveza
0.37283695 ácido y frío pero refrescante == caldo
0.3837132 ácido y frío pero refrescante == helado de frutilla
0.35160866 ácido y frío pero refrescante == aguacate
0.37666374 ácido y frío pero refrescan