Skip to content

masayu-a/CHJ-WLSP

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 

Repository files navigation

CHJ-WLSP (Version 1.0.0)

Description

『日本語歴史コーパス』の一部に分類語彙表番号を付与したもの

Features

Excel 版の最初の行はヘッダ行(txt 版にはヘッダはありません)

  • A: meta サンプル情報
  • B: boundary 文境界情報
  • C: orthToken 表層形(外部公開版は〓文字でマスク)
  • D: lemma 語彙素(外部公開版は〓文字でマスク)
  • E: wlsp 分類語彙表番号
  • F: pSampleID 『中納言』上のサンプルID (但し、平安時代編・鎌倉時代編などで形態論情報の齟齬があり、一部復元不可)
  • G: pStart 『中納言』上の開始位置 (但し、平安時代編・鎌倉時代編などで形態論情報の齟齬があり、一部復元不可)
  • H: 類
  • I: 類ラベル
  • J: 部門
  • K: 部門ラベル
  • L: 中項目
  • M: 中項目ラベル
  • N: 分類項目
  • O: 分類項目ラベル
  • P: 古典ラベル
  • Q: 備考

Author

  • Masayuki Asahara (National Institute for Japanese Language and Linguistics, Japan)
  • Nao Ikegami (Saitama University)
  • Tai Suzuki (University of Tokyo)
  • Taro Ichimura (Kyoto Prefectural University)
  • Asuko Kondo (University of Tokyo)
  • Sachi Kato (Mejiro University)
  • Makoto Yamazaki (National Institute for Japanese Language and Linguistics, Japan)

References

  • Masayuki Asahara, Nao Ikegami, Tai Suzuki, Taro Ichimura, Asuko Kondo, Sachi Kato, and Makoto Yamazaki. 2022. CHJ-WLSP: Annotation of ‘Word List by Semantic Principles’ Labels for the Corpus of Historical Japanese. In Proceedings of the Second Workshop on Language Technologies for Historical and Ancient Languages, pages 31-37, Marseille, France. European Language Resources Association.
  • 浅原正幸・池上尚・鈴木泰・市村太郎・近藤明日子・加藤祥・山崎誠 (2023) 「『日本語歴史コーパス』に対する分類語彙表番号アノテーションとその利用」, 『日本語の研究』, Vol. 19, No. 3.

License

CC BY-NC-SA 3.0 https://creativecommons.org/licenses/by-nc-sa/3.0/deed.ja

Credit

Masayuki Asahara, Nao Ikegami, Tai Suzuki, Taro Ichimura, Asuko Kondo, Sachi Kato, and Makoto Yamazaki (2023) CHJ-WLSP (version. 1.0.0)

Contact

masayu-a@ninjal.ac.jp

Note

『中納言』のサンプルID対応版についても公開予定です。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published