Skip to content

korguchi/text2phoneme

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 

Repository files navigation

text2phoneme

日本語テキストを音素列へ変換するスクリプト

形態素解析器を使って文節単位でスペースを空けて pyopenjtalk へ入力。

あらかじめ文節単位で分けておくことで pyopenjtalk 内部の形態素解析の誤りを低減する。

必要パッケージ

環境構築

pyopenjtalk のインストール

>>> git clone https://github.com/korguchi/pyopenjtalk
>>> cd pyopenjtalk
>>> pip install -e .

GiNZA のインストール

>>> pip install -U ginza https://github.com/megagonlabs/ginza/releases/download/latest/ja_ginza_electra-latest-with-model.tar.gz
>>> pip install -U "spacy[cuda<version>]"

JUMAN++ V2, PyKNP のインストール

>>> wget https://github.com/ku-nlp/jumanpp/releases/download/v2.0.0-rc3/jumanpp-2.0.0-rc3.tar.xz
>>> tar xvf jumanpp-2.0.0-rc3.tar.xz
>>> cd jumanpp-2.0.0-rc3 && mkdir bld
>>> cd jumanpp-2.0.0-rc3/bld && cmake ..  -DCMAKE_INSTALL_PREFIX=/usr/local
>>> cd jumanpp-2.0.0-rc3/bld && make install -j 4
>>> pip install pyknp

About

日本語文を音素列へ変換するスクリプト

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages