#### Python で、漢字文から音読み文に転換します。

In [None]:
# 漢字から音読みに変換する対応表
kanji_to_onyomi = {
    '神': 'シン',
    '是': 'ゼ',
    '信': 'シン',
    '実': 'ジツ',
    '的': 'テキ',
    '你': 'ジ',
    '們': 'モン',
    '乃': 'ナイ',
    '是': 'ゼ',
    '爲': 'イ',
    '他': 'タ',
    '所': 'ショ',
    '召': 'ショウ',
    '進': 'シン',
    '入': 'ニュウ',
    '了': 'リョウ',
    '儿': 'ジン',
    '子': 'ス',
    '我': 'ガ',
    '主': 'シュ',
    '耶': 'ヤ',
    '穌': 'ソ',
    '基': 'キ',
    '督': 'トク',
    '的': 'テキ',
    '交': 'コウ',
    '通': 'ツウ',
    # 他の漢字と音読みの対応を追加
}

def convert_to_onyomi_sentence(input_sentence):
    # 入力された漢字文を音読み文に変換する関数
    words = list(input_sentence)  # 文を単語に分割
    onyomi_sentence = []

    for word in words:
        onyomi = kanji_to_onyomi.get(word, word)  # 辞書から音読みを取得、なければそのまま単語を使用
        onyomi_sentence.append(onyomi)

    return ''.join(onyomi_sentence)

# 漢字文を入力
input_sentence = '神是信実的，你們乃是爲他所召，進入了他儿子我們主耶穌基督的交通。'
# 音読み文に変換
result = convert_to_onyomi_sentence(input_sentence)
print(result)  # 出力: "シンゼシンジツテキ，ジモンナイゼイタショショウ，シンニュウリョウタジンスガモンシュヤソキトクテキコウツウ。"

シンゼシンジツテキ，ジモンナイゼイタショショウ，シンニュウリョウタジンスガモンシュヤソキトクテキコウツウ。


#### Python で、Janome で、漢字文から音読み文に転換します。

Janome を使って漢字文から音読み文に変換するには、まず漢字を形態素に分割し、それぞれの形態素に対応する音読みを取得する必要があります。ただし、Janome 自体は音読みを直接提供する機能はありません。そのため、別途辞書や API などから音読みを取得する必要があります。

以下は、辞書を使用して漢字文から音読み文に変換するサンプルコードです。このコードでは、kanji_to_onyomi という辞書に漢字と対応する音読みを登録し、入力された漢字文を音読み文に変換します。

In [None]:
%%bash
pip install janome

Defaulting to user installation because normal site-packages is not writeable


In [None]:
from janome.tokenizer import Tokenizer

# 漢字から音読みに変換する対応表（例としていくつかの漢字と音読みを登録）
kanji_to_onyomi = {
    '神': 'シン',
    '是': 'ゼ',
    '信': 'シン',
    '実': 'ジツ',
    '的': 'テキ',
    '你': 'ジ',
    '們': 'モン',
    '乃': 'ナイ',
    '是': 'ゼ',
    '爲': 'イ',
    '他': 'タ',
    '所': 'ショ',
    '召': 'ショウ',
    '進': 'シン',
    '入': 'ニュウ',
    '了': 'リョウ',
    '儿': 'ジン',
    '子': 'ス',
    '我': 'ガ',
    '主': 'シュ',
    '耶': 'ヤ',
    '穌': 'ソ',
    '基': 'キ',
    '督': 'トク',
    '的': 'テキ',
    '交': 'コウ',
    '通': 'ツウ',
    '信実': 'シンジツ',
    '進入': 'シンニュウ',
    '交通': 'コウツウ',
    # 他の漢字と音読みの対応を追加
}

def get_onyomi(token):
    # 漢字を対応表から検索し、音読みを取得する関数
    return kanji_to_onyomi.get(token.surface, token.surface)

def convert_to_onyomi_sentence(input_sentence):
    # 入力された漢字文を音読み文に変換する関数
    t = Tokenizer()
    tokens = t.tokenize(input_sentence)
    # print([token.surface for token in tokens])
    onyomi_sentence = []

    for token in tokens:
        onyomi = get_onyomi(token)
        onyomi_sentence.append(onyomi)
    print(onyomi_sentence)

    return ''.join(onyomi_sentence)

# 漢字文を入力
input_sentence = '神是信実的，你們乃是爲他所召，進入了他儿子我們主耶穌基督的交通。'
# 音読み文に変換
result = convert_to_onyomi_sentence(input_sentence)
print(result)  # 出力: 'シンゼシンジツテキ，ジモンナイゼイタショショウ，シンニュウリョウタジンスガモンシュヤソキトクテキコウツウ。'

['シン', 'ゼ', 'シンジツ', 'テキ', '，', '你們乃', 'ゼ', '爲他所', 'ショウ', '，', 'シンニュウ', 'リョウ', 'タ', '儿子我', '們主耶', '穌基督', 'テキ', 'コウツウ', '。']
シンゼシンジツテキ，你們乃ゼ爲他所ショウ，シンニュウリョウタ儿子我們主耶穌基督テキコウツウ。


このコードでは、Janome の Tokenizer を使って日本語の形態素解析を行い、文を形態素に分割しています。それぞれの形態素には、表層形（原形）と品詞などの情報が含まれています。

上記のコードを実行すると、入力した日本語の文が形態素に分割されて、表層形と品詞の情報が表示されるでしょう。Janome はシンプルで使いやすいライブラリなので、日本語の形態素解析に便利です。

#### Python で、MeCab で、UniDic で、漢字文から音読み文に転換します。

MeCab を使用して UniDic 辞書を利用し、漢字文から音読み文に変換するためには、以下の手順に従ってください。まず、Python で MeCab を使えるようにしてから、サンプルコードを提供します。

---
MeCab と unidic のインストール：

In [None]:
%%bash
pip install unidic-lite
pip install mecab-python3

Defaulting to user installation because normal site-packages is not writeable
Collecting unidic-lite
  Downloading unidic-lite-1.0.8.tar.gz (47.4 MB)
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'done'
Building wheels for collected packages: unidic-lite
  Building wheel for unidic-lite (setup.py): started
  Building wheel for unidic-lite (setup.py): finished with status 'done'
  Created wheel for unidic-lite: filename=unidic_lite-1.0.8-py3-none-any.whl size=47658836 sha256=d354e3491cb194fab1fab224d3595dfa0419a6d75edec0bdd76fad8f60ec4d3a
  Stored in directory: /home/jupyter-saintway/.cache/pip/wheels/56/9c/4f/2c115e896b4b6c584039ca19de3581d333856782ef108cdc5c
Successfully built unidic-lite
Installing collected packages: unidic-lite
Successfully installed unidic-lite-1.0.8
Defaulting to user installation because normal site-packages is not writeable
Collecting mecab-python3
  Downloading mecab_python3-1.0.6-cp39-cp39-manylinux_2_17_x86_64



Successfully installed mecab-python3-1.0.6


---
このコードでは、MeCab の Tagger に UniDic のパスを指定して、日本語の形態素解析を行い、漢字文を音読み文に変換しています。漢字の音読みは UniDic の「名詞固有名詞」のフィーチャー情報の7番目に格納されているため、それを取得しています。

注意：/path/to/unidic の部分は、UniDic 辞書の実際のインストールパスに置き換えてください。

また、UniDic に登録されていない単語や未知の単語に対しては、'\*'として示されることがあります。その場合は元の漢字をそのまま使用します。さらに、Juman++ などの他の形態素解析エンジンや辞書を利用することも検討してください。

In [None]:
import MeCab

# MeCab + UniDicを使って漢字文から音読みを取得する関数
def get_onyomi(text):
    try:
        mecab = MeCab.Tagger('-d /path/to/unidic')  # UniDicのパスを指定してください
        node = mecab.parse(text)
        onyomi_text = ''
        
        while node:
            features = node.feature.split(',')
            if len(features) > 7 and features[0] == '名詞' and features[1] == '固有名詞':
                onyomi_text += features[7] if features[7] != '*' else node.surface
            else:
                onyomi_text += node.surface

            node = node.next

        return onyomi_text

    except Exception as e:
        print('エラー:', e)
        return None

# 漢字文を入力
input_text = '漢字文を入力してください。'
# 音読みに変換
result = get_onyomi(input_text)
print(result)  # 出力例: '漢字文をニュウリョクシテクダサイ。'