『日本語歴史コーパス』の一部に分類語彙表番号を付与したもの
Excel 版の最初の行はヘッダ行(txt 版にはヘッダはありません)
- A: meta サンプル情報
- B: boundary 文境界情報
- C: orthToken 表層形(外部公開版は〓文字でマスク)
- D: lemma 語彙素(外部公開版は〓文字でマスク)
- E: wlsp 分類語彙表番号
- F: pSampleID 『中納言』上のサンプルID (但し、平安時代編・鎌倉時代編などで形態論情報の齟齬があり、一部復元不可)
- G: pStart 『中納言』上の開始位置 (但し、平安時代編・鎌倉時代編などで形態論情報の齟齬があり、一部復元不可)
- H: 類
- I: 類ラベル
- J: 部門
- K: 部門ラベル
- L: 中項目
- M: 中項目ラベル
- N: 分類項目
- O: 分類項目ラベル
- P: 古典ラベル
- Q: 備考
- Masayuki Asahara (National Institute for Japanese Language and Linguistics, Japan)
- Nao Ikegami (Saitama University)
- Tai Suzuki (University of Tokyo)
- Taro Ichimura (Kyoto Prefectural University)
- Asuko Kondo (University of Tokyo)
- Sachi Kato (Mejiro University)
- Makoto Yamazaki (National Institute for Japanese Language and Linguistics, Japan)
- Masayuki Asahara, Nao Ikegami, Tai Suzuki, Taro Ichimura, Asuko Kondo, Sachi Kato, and Makoto Yamazaki. 2022. CHJ-WLSP: Annotation of ‘Word List by Semantic Principles’ Labels for the Corpus of Historical Japanese. In Proceedings of the Second Workshop on Language Technologies for Historical and Ancient Languages, pages 31-37, Marseille, France. European Language Resources Association.
- 浅原正幸・池上尚・鈴木泰・市村太郎・近藤明日子・加藤祥・山崎誠 (2023) 「『日本語歴史コーパス』に対する分類語彙表番号アノテーションとその利用」, 『日本語の研究』, Vol. 19, No. 3.
CC BY-NC-SA 3.0 https://creativecommons.org/licenses/by-nc-sa/3.0/deed.ja
Masayuki Asahara, Nao Ikegami, Tai Suzuki, Taro Ichimura, Asuko Kondo, Sachi Kato, and Makoto Yamazaki (2023) CHJ-WLSP (version. 1.0.0)
『中納言』のサンプルID対応版についても公開予定です。