text2phoneme

日本語テキストを音素列へ変換するスクリプト

形態素解析器を使って文節単位でスペースを空けて pyopenjtalk へ入力。

あらかじめ文節単位で分けておくことで pyopenjtalk 内部の形態素解析の誤りを低減する。

必要パッケージ

PyKNP
GiNZA
Juman++ V2
pyopenjtalk (https://github.com/korguchi/pyopenjtalk)

環境構築

pyopenjtalk のインストール

>>> git clone https://github.com/korguchi/pyopenjtalk
>>> cd pyopenjtalk
>>> pip install -e .

GiNZA のインストール

>>> pip install -U ginza https://github.com/megagonlabs/ginza/releases/download/latest/ja_ginza_electra-latest-with-model.tar.gz
>>> pip install -U "spacy[cuda<version>]"

JUMAN++ V2, PyKNP のインストール

>>> wget https://github.com/ku-nlp/jumanpp/releases/download/v2.0.0-rc3/jumanpp-2.0.0-rc3.tar.xz
>>> tar xvf jumanpp-2.0.0-rc3.tar.xz
>>> cd jumanpp-2.0.0-rc3 && mkdir bld
>>> cd jumanpp-2.0.0-rc3/bld && cmake ..  -DCMAKE_INSTALL_PREFIX=/usr/local
>>> cd jumanpp-2.0.0-rc3/bld && make install -j 4
>>> pip install pyknp

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
README.md		README.md
text2phoneme.py		text2phoneme.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

text2phoneme.py

text2phoneme.py

Repository files navigation

text2phoneme

必要パッケージ

環境構築

pyopenjtalk のインストール

GiNZA のインストール

JUMAN++ V2, PyKNP のインストール

About

Releases

Packages

Languages

korguchi/text2phoneme

Folders and files

Latest commit

History

README.md

README.md

text2phoneme.py

text2phoneme.py

Repository files navigation

text2phoneme

必要パッケージ

環境構築

pyopenjtalk のインストール

GiNZA のインストール

JUMAN++ V2, PyKNP のインストール

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages