#### Python で、漢字文から音読み文に転換します。

In [None]:
# 漢字から音読みに変換する対応表
kanji_to_onyomi = {
    '神': 'シン',
    '是': 'ゼ',
    '信': 'シン',
    '実': 'ジツ',
    '的': 'テキ',
    '你': 'ジ',
    '們': 'モン',
    '乃': 'ナイ',
    '是': 'ゼ',
    '爲': 'イ',
    '他': 'タ',
    '所': 'ショ',
    '召': 'ショウ',
    '進': 'シン',
    '入': 'ニュウ',
    '了': 'リョウ',
    '儿': 'ジン',
    '子': 'ス',
    '我': 'ガ',
    '主': 'シュ',
    '耶': 'ヤ',
    '穌': 'ソ',
    '基': 'キ',
    '督': 'トク',
    '的': 'テキ',
    '交': 'コウ',
    '通': 'ツウ',
    # 他の漢字と音読みの対応を追加
}

def convert_to_onyomi_sentence(input_sentence):
    # 入力された漢字文を音読み文に変換する関数
    words = list(input_sentence)  # 文を単語に分割
    onyomi_sentence = []

    for word in words:
        onyomi = kanji_to_onyomi.get(word, word)  # 辞書から音読みを取得、なければそのまま単語を使用
        onyomi_sentence.append(onyomi)

    return ''.join(onyomi_sentence)

# 漢字文を入力
input_sentence = '神是信実的，你們乃是爲他所召，進入了他儿子我們主耶穌基督的交通。'
# 音読み文に変換
result = convert_to_onyomi_sentence(input_sentence)
print(result)  # 出力: "シンゼシンジツテキ，ジモンナイゼイタショショウ，シンニュウリョウタジンスガモンシュヤソキトクテキコウツウ。"

シンゼシンジツテキ，ジモンナイゼイタショショウ，シンニュウリョウタジンスガモンシュヤソキトクテキコウツウ。


#### Python で、Janome で、漢字文から音読み文に転換します。

Janome を使って漢字文から音読み文に変換するには、まず漢字を形態素に分割し、それぞれの形態素に対応する音読みを取得する必要があります。ただし、Janome 自体は音読みを直接提供する機能はありません。そのため、別途辞書や API などから音読みを取得する必要があります。

以下は、辞書を使用して漢字文から音読み文に変換するサンプルコードです。このコードでは、kanji_to_onyomi という辞書に漢字と対応する音読みを登録し、入力された漢字文を音読み文に変換します。

In [None]:
%%bash
pip install janome

Defaulting to user installation because normal site-packages is not writeable


In [None]:
from janome.tokenizer import Tokenizer

# 漢字から音読みに変換する対応表（例としていくつかの漢字と音読みを登録）
kanji_to_onyomi = {
    '神': 'シン',
    '是': 'ゼ',
    '信': 'シン',
    '実': 'ジツ',
    '的': 'テキ',
    '你': 'ジ',
    '們': 'モン',
    '乃': 'ナイ',
    '是': 'ゼ',
    '爲': 'イ',
    '他': 'タ',
    '所': 'ショ',
    '召': 'ショウ',
    '進': 'シン',
    '入': 'ニュウ',
    '了': 'リョウ',
    '儿': 'ジン',
    '子': 'ス',
    '我': 'ガ',
    '主': 'シュ',
    '耶': 'ヤ',
    '穌': 'ソ',
    '基': 'キ',
    '督': 'トク',
    '的': 'テキ',
    '交': 'コウ',
    '通': 'ツウ',
    '信実': 'シンジツ',
    '進入': 'シンニュウ',
    '交通': 'コウツウ',
    # 他の漢字と音読みの対応を追加
}

def get_onyomi(token):
    # 漢字を対応表から検索し、音読みを取得する関数
    return kanji_to_onyomi.get(token.surface, token.surface)

def convert_to_onyomi_sentence(input_sentence):
    # 入力された漢字文を音読み文に変換する関数
    t = Tokenizer()
    tokens = t.tokenize(input_sentence)
    # print([token.surface for token in tokens])
    onyomi_sentence = []

    for token in tokens:
        onyomi = get_onyomi(token)
        onyomi_sentence.append(onyomi)
    print(onyomi_sentence)

    return ''.join(onyomi_sentence)

# 漢字文を入力
input_sentence = '神是信実的，你們乃是爲他所召，進入了他儿子我們主耶穌基督的交通。'
# 音読み文に変換
result = convert_to_onyomi_sentence(input_sentence)
print(result)  # 出力: 'シンゼシンジツテキ，ジモンナイゼイタショショウ，シンニュウリョウタジンスガモンシュヤソキトクテキコウツウ。'

['シン', 'ゼ', 'シンジツ', 'テキ', '，', '你們乃', 'ゼ', '爲他所', 'ショウ', '，', 'シンニュウ', 'リョウ', 'タ', '儿子我', '們主耶', '穌基督', 'テキ', 'コウツウ', '。']
シンゼシンジツテキ，你們乃ゼ爲他所ショウ，シンニュウリョウタ儿子我們主耶穌基督テキコウツウ。


このコードでは、Janome の Tokenizer を使って日本語の形態素解析を行い、文を形態素に分割しています。それぞれの形態素には、表層形（原形）と品詞などの情報が含まれています。

上記のコードを実行すると、入力した日本語の文が形態素に分割されて、表層形と品詞の情報が表示されるでしょう。Janome はシンプルで使いやすいライブラリなので、日本語の形態素解析に便利です。

#### Python で、[MeCab](https://taku910.github.io/mecab/) で、UniDic で、漢字文から音読み文に転換します。

MeCab を使用して UniDic 辞書を利用し、漢字文から音読み文に変換するためには、以下の手順に従ってください。まず、Python で MeCab を使えるようにしてから、サンプルコードを提供します。

---
MeCab と UniDic のインストール：

In [None]:
%%bash
pip install unidic-lite
pip install mecab-python3

Defaulting to user installation because normal site-packages is not writeable
Collecting unidic-lite
  Downloading unidic-lite-1.0.8.tar.gz (47.4 MB)
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'done'
Building wheels for collected packages: unidic-lite
  Building wheel for unidic-lite (setup.py): started
  Building wheel for unidic-lite (setup.py): finished with status 'done'
  Created wheel for unidic-lite: filename=unidic_lite-1.0.8-py3-none-any.whl size=47658836 sha256=d354e3491cb194fab1fab224d3595dfa0419a6d75edec0bdd76fad8f60ec4d3a
  Stored in directory: /home/jupyter-saintway/.cache/pip/wheels/56/9c/4f/2c115e896b4b6c584039ca19de3581d333856782ef108cdc5c
Successfully built unidic-lite
Installing collected packages: unidic-lite
Successfully installed unidic-lite-1.0.8
Defaulting to user installation because normal site-packages is not writeable
Collecting mecab-python3
  Downloading mecab_python3-1.0.6-cp39-cp39-manylinux_2_17_x86_64

---
このコードでは、MeCab の Tagger に UniDic のパスを指定して、日本語の形態素解析を行い、漢字文を音読み文に変換しています。漢字の音読みは UniDic の「名詞固有名詞」のフィーチャー情報の7番目に格納されているため、それを取得しています。

注意：/path/to/unidic の部分は、UniDic 辞書の実際のインストールパスに置き換えてください。

また、UniDic に登録されていない単語や未知の単語に対しては、'\*'として示されることがあります。その場合は元の漢字をそのまま使用します。さらに、Juman++ などの他の形態素解析エンジンや辞書を利用することも検討してください。

In [None]:
import MeCab

# MeCab + UniDicを使って漢字文から音読みを取得する関数
def get_onyomi(text):
    try:
        mecab = MeCab.Tagger('-d /path/to/unidic')  # UniDicのパスを指定してください
        node = mecab.parse(text)
        onyomi_text = ''
        
        while node:
            features = node.feature.split(',')
            if len(features) > 7 and features[0] == '名詞' and features[1] == '固有名詞':
                onyomi_text += features[7] if features[7] != '*' else node.surface
            else:
                onyomi_text += node.surface

            node = node.next

        return onyomi_text

    except Exception as e:
        print('エラー:', e)
        return None

# 漢字文を入力
input_text = '漢字文を入力してください。'
# 音読みに変換
result = get_onyomi(input_text)
print(result)  # 出力例: '漢字文をニュウリョクシテクダサイ。'

---
[Juman++](https://github.com/ku-nlp/jumanpp)

In [None]:
sudo apt update
sudo apt install cmake

In [None]:
sudo apt update
sudo apt install protobuf-compiler libprotobuf-dev

In [None]:
%%bash
git clone https://github.com/ku-nlp/jumanpp.git ~/jumanpp

In [None]:
%%bash
mkdir -p ~/jumanpp/build
cd ~/jumanpp/build
cmake ~/jumanpp -DCMAKE_BUILD_TYPE=Release
cd ~/jumanpp
sudo make install

---
[Juman++ 2.0.0 rc4](https://github.com/ku-nlp/jumanpp/releases/download/v2.0.0-rc4/jumanpp-2.0.0-rc4.tar.xz)

[Scoop](https://scoop.sh/) on Windows 11

```powershell
Set-ExecutionPolicy -ExecutionPolicy RemoteSigned -Scope CurrentUser
Invoke-RestMethod -Uri https://get.scoop.sh | Invoke-Expression
scoop bucket add main
scoop install main/cmake
scoop install main/make
```

Ubuntu

```bash
sudo apt update
sudo apt install g++-10 clang cmake
sudo apt install libprotobuf-dev protobuf-compiler
cd ~ && tar xvf jumanpp-2.0.0-rc4.tar.xz
mkdir -p ~/jumanpp-2.0.0-rc4/build
cd ~/jumanpp-2.0.0-rc4/build && cmake .. -DCMAKE_BUILD_TYPE=Release -DCMAKE_INSTALL_PREFIX=/usr/local
cd ~/jumanpp-2.0.0-rc4/build && make install -j 4
sudo make install
```

---
[Juman++ 1.02](https://lotus.kuee.kyoto-u.ac.jp/nl-resource/jumanpp/jumanpp-1.02.tar.xz) with Model File

In [None]:
%%bash
cd ~ && wget https://lotus.kuee.kyoto-u.ac.jp/nl-resource/jumanpp/jumanpp-1.02.tar.xz

In [None]:
%%bash
cd ~ && tar xJvf ~/jumanpp-1.02.tar.xz

On Linux

In [None]:
%%bash
sudo apt update
sudo apt install libboost-all-dev

On macOS

In [None]:
%%bash
brew install boost

In [None]:
%%bash
cd ~/jumanpp-1.02
./configure
make
sudo make install

---

In [None]:
%%bash
pip install pyknp

Defaulting to user installation because normal site-packages is not writeable


In [None]:
from pyknp import Juman
juman = Juman()

def halfwidth_to_fullwidth(text):
    result = ''
    for char in text:
        code = ord(char)
        if code == ord(' '):
            result += '　'
        elif ord('!') <= code <= ord('~'):
            # Convert ASCII characters in the range 0x0021 to 0x007E
            result += chr(code + 0xFEE0)
        else:
            result += char
    return result

def render(text):
    for line in halfwidth_to_fullwidth(text).split('\n'):
        if line == '':
            yield '\n'
            continue
        mrphs = juman.analysis(line).mrph_list()
        for mrph in mrphs:
            if mrph.midasi == mrph.yomi:
                yield mrph.midasi
            else:
                yield '　{}［{}］'.format(
                    mrph.midasi,
                    mrph.yomi
                )
        yield '\n'

def render_to_latex(text):
    for line in halfwidth_to_fullwidth(text).split('\n'):
        if line == '':
            yield '\n'
            continue
        mrphs = juman.analysis(line).mrph_list()
        for mrph in mrphs:
            yield f'\\frac{{{mrph.yomi}}}{{{mrph.midasi}}}'
        yield '\n'

In [None]:
from IPython.display import Math
line = ''
for word in render_to_latex('''
朝の養い

啓21:3　……見よ、神の幕屋が人と共にある．神は彼らと共に幕屋を張り……
22　わたしはその中に宮を見なかった．主なる神、全能者と小羊が、その宮だからである。

　わたしは七十年以上を費やして聖書を学びましたが、ごく最近になって、聖書が実はただ一つの事、すなわち宇宙的な合併を明らかにしていることを見ました。目的を持つ神にはエコノミーがあり、彼は彼のエコノミーの中で、宇宙的な合併を持つことを意図されます。
　わたしたちは、新エルサレムが神のエコノミーの目標であることを見てきましたが、新エルサレムが一つの合併であることを見ませんでした。啓示録第21章2節で使徒ヨハネは、「わたしはまた聖なる都、新エルサレム……を見た」と言い、次の節では「神の幕屋」としての新エルサレムについて語っています。神の幕屋として、新エルサレムは神の住まいであり、……［また］宇宙的な合併です。（リー全集、1994年―1997年、第5巻（下）、「御父により神聖な栄光をもってキリストの栄光が現されたことの結果」、第4編）
'''):
    if word == '\n':
        display(Math(line))
        line = ''
    else:
        line += word

<IPython.core.display.Math object>

<IPython.core.display.Math object>

<IPython.core.display.Math object>

<IPython.core.display.Math object>

<IPython.core.display.Math object>

<IPython.core.display.Math object>

<IPython.core.display.Math object>

<IPython.core.display.Math object>

<IPython.core.display.Math object>

In [None]:
for word in render("""
朝の養い

啓21:9-11　……「ここに来なさい．あなたに小羊の妻である花嫁を見せよう」。そして彼はわたしを霊の中で、大きな高い山へ連れて行き、聖なる都エルサレムが、天から出て神から下って来るのをわたしに見せたが、それは神の栄光を持っていた。その光は最も尊い宝石のようであり、水晶のように透明な碧玉のようであった。

　新約の主要な内容とは、三一の神がご自身の大いなる喜びにしたがって永遠のエコノミーを持っておられ、それは彼の命と性質の中でご自身を彼の選ばれ、贖われた民の中へと分与し、それによって彼らをご自身の複製とし、彼らが彼を表現するためであるということです。この団体の表現は新エルサレムにおいて究極的に完成します（エペソ3:9．1:9-23）。聖書の究極的な完成である新エルサレムは、神が人と成ることと、人が神格においてではなく、命と性質において神となることと関係があります（啓21:2．3:12）。キリストの中で、神は人と成り、人を彼の命と性質において神とします。それによって贖う神と贖われた人は、共にミングリングされ、構成されて、一つの実体、すなわち新エルサレムとなることができます（21:3、22）。最終的に、三一の、永遠の神は新エルサレムとなってわたしたちすべてと合併し、わたしたちもまた神の有機的な救いの過程を通して（ローマ5:10）、新エルサレムとなります。（「新約の結論（25）」、メッセージ428）
"""):
    print(word, end='')


　朝［あさ］の　養い［やしない］

　啓［ひらく］２１：９－１１　……「ここに来なさい．あなたに　小［しょう］　羊［ひつじ］の　妻［つま］である　花嫁［はなよめ］を　見せよう［みせよう］」。そして　彼［かれ］はわたしを　霊［れい］の　中［なか］で、　大きな［おおきな］　高い［たかい］　山［やま］へ　連れて［つれて］　行き［いき］、　聖なる［せいなる］　都［みやこ］　エルサレム［えるされむ］が、　天から［てんから］　出て［でて］　神［かみ］から　下って［くだって］　来る［くる］のをわたしに　見せた［みせた］が、それは　神［かみ］の　栄光［えいこう］を　持って［もって］いた。その　光［ひかり］は　最も［もっとも］　尊い［とうとい］　宝石［ほうせき］のようであり、　水晶［すいしょう］のように　透明な［とうめいな］　碧玉［へきぎょく］のようであった。

　新約［しんやく］の　主要な［しゅような］　内容［ないよう］とは、三一の　神［かみ］がご　自身［じしん］の　大いなる［おおいなる］　喜び［よろこび］にしたがって　永遠の［えいえんの］エコノミーを　持って［もって］おられ、それは　彼［かれ］の　命［いのち］と　性質［せいしつ］の　中［なか］でご　自身［じしん］を　彼［かれ］の　選ば［えらば］れ、贖われた　民［みん］の　中［なか］へと　分与［ぶんよ］し、それによって　彼［かれ］らをご　自身［じしん］の　複製［ふくせい］とし、　彼［かれ］らが　彼［かれ］を　表現［ひょうげん］するためであるということです。この　団体［だんたい］の　表現［ひょうげん］は　新［しん］　エルサレム［えるされむ］において　究極［きゅうきょく］　的に［てきに］　完成［かんせい］します（エペソ３：９．１：９－２３）。　聖書［せいしょ］の　究極［きゅうきょく］　的な［てきな］　完成［かんせい］である　新［しん］　エルサレム［えるされむ］は、　神［かみ］が　人［じん］と　成る［なる］ことと、　人［じん］が　神格［しんかく］においてではなく、　命［いのち］と　性質［せいしつ］において　神［かみ］となることと　関係［かんけい］があります（　啓［ひらく］２１：２．３：１２）。キリストの　中［なか］で、　神［かみ］は　人［じん］と　成り［なり］、　人［じん］を　彼［かれ］の　命［いのち］と　性質［せいしつ］において　神［

In [None]:
for word in render("""
神是信実的，你們乃是爲他所召，進入了他儿子我們主耶穌基督的交通。
"""):
    print(word, end='')


　神［かみ］是信　実［み］　的［てき］，你們　乃［だい］　是［ぜ］爲他　所［しょ］　召［めし］，　進入［しんにゅう］　了［りょう］　他［た］儿子我們　主［しゅ］耶穌基督　的［てき］　交通［こうつう］。



In [None]:
for word in render("""
神、是、信、実、的，你、們、乃、是、爲、他、所、召，進、入、了、他、儿、子、我、們、主、耶、穌、基、督、的、交、通。
"""):
    print(word, end='')


　神［かみ］、　是［ぜ］、　信［しん］、　実［み］、　的［てき］，你、們、　乃［だい］、　是［ぜ］、爲、　他［ほか］、　所［しょ］、　召［めし］，　進［しん］、　入［はいり］、　了［りょう］、　他［ほか］、儿、　子［し］、　我［われ］、們、　主［おも］、耶、穌、　基［もと］、督、　的［てき］、交、　通［つう］。

