A dataset for Semantic Textual Similarity (STS) in Japanese Clinical Domain Texts

This dataset contains of sentence pairs extracted from CiNii (https://ci.nii.ac.jp/).

Each sentence pair is annotated with a similarity score 0 (low semantic similarity) to 5 (high semantic similarity).

Citation

If you use this dataset please cite our paper:

@article{mutinda2021semantic,
  title={Semantic Textual Similarity in Japanese Clinical Domain Texts Using BERT},
  author={Mutinda, Faith Wavinya and Yada, Shuntaro and Wakamiya, Shoko and Aramaki, Eiji},
  journal={Methods of Information in Medicine},
  year={2021},
  publisher={Georg Thieme Verlag KG}
  }

Name		Name	Last commit message	Last commit date
Latest commit History 7 Commits
README.md		README.md
dataset_JA_Clinical_STS.xls		dataset_JA_Clinical_STS.xls

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

dataset_JA_Clinical_STS.xls

dataset_JA_Clinical_STS.xls

Repository files navigation

A dataset for Semantic Textual Similarity (STS) in Japanese Clinical Domain Texts

Citation

About

Releases

Packages

sociocom/Japanese-Clinical-STS

Folders and files

Latest commit

History

README.md

README.md

dataset_JA_Clinical_STS.xls

dataset_JA_Clinical_STS.xls

Repository files navigation

A dataset for Semantic Textual Similarity (STS) in Japanese Clinical Domain Texts

Citation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Packages