GitHub - swapnilg915/cosine_similarity_using_embeddings: Code to find the distance/similarity between the 2 documents using several embeddings - 1. TF-IDF, 2. word2vec, 3. ELMO, 4. Universal Sentence Encoder, 5. Flair embeddings, 6. Spacy embeddings, 7. WMD (Word Movers Distance)

This directory contains the ready to use python scripts to find the similarity between any 2 given documents.

There are so many pre-trained word embeddings are available for representing the text data into vector form. Here I have written a code to find the distance/similarity between the 2 documents using several embeddings -

TF-IDF
word2vec
ELMO
Universal Sentence Encoder
Flair embeddings
Spacy embeddings
WMD (Word Movers Distance)
Sentence transformers

python libraries used - Tensorflow, Gensim, Sklearn, Flair, sentence_transformers, numpy

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
elmo_embeddings.py		elmo_embeddings.py
flair_embeddings.py		flair_embeddings.py
readme.md		readme.md
requirements.txt		requirements.txt
spacy_embeddings.py		spacy_embeddings.py
tfidf_similarity.py		tfidf_similarity.py
transformer_embeddings.py		transformer_embeddings.py
universal_sentence_encoder_embeddings.py		universal_sentence_encoder_embeddings.py
wmd_distance.py		wmd_distance.py
wmd_similarity.py		wmd_similarity.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

swapnilg915/cosine_similarity_using_embeddings

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages