Skip to content

y-chan/amitaro-ita-corpus

Repository files navigation

あみたろの声素材工房様によるITAコーパス読み上げ音声のアクセント情報・音素アライメントラベル置き場

配布している情報について

labelsに音素とその開始時刻・終了時刻を示したラベルデータ(モノフォンラベル)があります。
音素に関しては、OpenJTalkのものを使用しており、無声母音も含まれます(OpenJTalkによる機械的推定と、作成者y-chanの耳で聞いて無声だろうと判断したものを無声母音としています)

accent_and_phoneme*.csvはアクセントと音素を記しています。アクセントに関しては、OpenJTalkによる機械的推定を作成者y-chanが手動で修正したものです。 疲れていたなどで、一部アクセント情報が誤っている可能性もありますが、最初に記録を取った時のまま公開します。
accent*.csvはアクセントのみを記しています。
おまけとして、accent_and_phoneme*.csvaccent*.csvに変換するスクリプト(extract_accent_and_phoneme.py)と、アクセント情報をnumpyの配列ファイル(.npy)に変換するスクリプト(convert_accent.py)を同梱しています。

更に、ITAコーパスをこれから読むといった方向けに、アクセント情報が見やすいVOICEVOX(0.10.4)プロジェクトファイルを公開しています(vvproj内) アクセント確認用プロジェクトなので、再生はできません。
また、こちらもおまけとしてプロジェクト生成スクリプト(vv_create.py)を同梱しています。

アクセント記号について

母音音素時にアクセント記号が来るようにデータを作成していますが、稀にヒューマンエラーによる例外が存在します。 もしよろしければ、修正PRを送っていただけると助かります。

アクセント記号 アクセント記号の意味
[ ピッチ上がり
] ピッチ下がり(アクセント核)
# アクセント境界
? アクセント境界(疑問形)
_ アクセント情報に変化なし

これらアクセント情報は、以下の研究報告をもとに作成した
藤井 一貴, 齋藤 佑樹, 猿渡 洋, 韻律情報で条件付けされた非自己回帰型End-to-End日本語音声合成の検討, 情報処理学会研究報告, 2021-SLP-138, No. 16, pp. 1-6, 2021.

ライセンス情報

おまけのコード・データ情報共にUnlicenseです。
煮るなり焼くなり好きにしてください。

About

No description, website, or topics provided.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Languages