labels
に音素とその開始時刻・終了時刻を示したラベルデータ(モノフォンラベル)があります。
音素に関しては、OpenJTalkのものを使用しており、無声母音も含まれます(OpenJTalkによる機械的推定と、作成者y-chanの耳で聞いて無声だろうと判断したものを無声母音としています)
accent_and_phoneme*.csv
はアクセントと音素を記しています。アクセントに関しては、OpenJTalkによる機械的推定を作成者y-chanが手動で修正したものです。
疲れていたなどで、一部アクセント情報が誤っている可能性もありますが、最初に記録を取った時のまま公開します。
accent*.csv
はアクセントのみを記しています。
おまけとして、accent_and_phoneme*.csv
をaccent*.csv
に変換するスクリプト(extract_accent_and_phoneme.py
)と、アクセント情報をnumpyの配列ファイル(.npy
)に変換するスクリプト(convert_accent.py
)を同梱しています。
更に、ITAコーパスをこれから読むといった方向けに、アクセント情報が見やすいVOICEVOX(0.10.4)プロジェクトファイルを公開しています(vvproj
内)
アクセント確認用プロジェクトなので、再生はできません。
また、こちらもおまけとしてプロジェクト生成スクリプト(vv_create.py
)を同梱しています。
母音音素時にアクセント記号が来るようにデータを作成していますが、稀にヒューマンエラーによる例外が存在します。 もしよろしければ、修正PRを送っていただけると助かります。
アクセント記号 | アクセント記号の意味 |
---|---|
[ |
ピッチ上がり |
] |
ピッチ下がり(アクセント核) |
# |
アクセント境界 |
? |
アクセント境界(疑問形) |
_ |
アクセント情報に変化なし |
これらアクセント情報は、以下の研究報告をもとに作成した
藤井 一貴, 齋藤 佑樹, 猿渡 洋, 韻律情報で条件付けされた非自己回帰型End-to-End日本語音声合成の検討, 情報処理学会研究報告, 2021-SLP-138, No. 16, pp. 1-6, 2021.
おまけのコード・データ情報共にUnlicenseです。
煮るなり焼くなり好きにしてください。