Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
benchmarks		benchmarks
.gitignore		.gitignore
README.md		README.md

Repository files navigation

Benchmarks for word embeddings evaluation

The metadata for a dataset includes:

language (en, ja, etc)
task (analogy, similarity, etc)
description (e.g. Bigger Analogy Test Set)
version (e.g. 3.0)
cite (bibtex for the paper to cite)

Available datasets

English

Word similarity:

WordSim 353
MEN
SimLex
Rare Words
MTurk

Word analogy:

BATS

Text classification:

IMDb moview reviews sample

Japanese

Word similarity:

Japanese word similarity (https://github.com/tmu-nlp/JapaneseWordSimilarityDataset)

Japanese word similarity:

JBATS

About

No description, website, or topics provided.

Custom properties

Report repository

Releases

Packages

No packages published