# Similitud semántica con los vectores de spaCy

Vamos a ilustrar en qué consiste la similitud semántica con un pequeño ejemplo de buscador que utiliza embeddings.

Para ello, vamos a inspirarnos es este [ejemplo de buscador semántico en 3 minutos](https://github.com/hanxiao/bert-as-service#building-a-qa-semantic-search-engine-in-3-minutes), del proyecto [`bert-as-service`](https://github.com/hanxiao/bert-as-service) de [Han Xiao](https://hanxiao.io/).

In [None]:
import numpy as np
import spacy
from typing import List

nlp = spacy.load("en_core_web_md")

In [None]:
def search_similar_query(
    text: str, 
    topk: int,
    docs: List[str], 
    doc_vecs: List[np.ndarray]
):
    query = nlp(text)
    # normalized dot product as score
    score = np.sum(query.vector * doc_vecs, axis=1) / np.linalg.norm(doc_vecs, axis=1)
    topk_idx = np.argsort(score)[::-1][:3]
    for idx in topk_idx:
        print(f"[{score[idx]}]: {docs[idx]}")