#### Python で、漢字文から音読み文に転換します。

In [None]:
# 漢字から音読みに変換する対応表
kanji_to_onyomi = {
    '神': 'シン',
    '是': 'ゼ',
    '信': 'シン',
    '実': 'ジツ',
    '的': 'テキ',
    '你': 'ジ',
    '們': 'モン',
    '乃': 'ナイ',
    '是': 'ゼ',
    '爲': 'イ',
    '他': 'タ',
    '所': 'ショ',
    '召': 'ショウ',
    '進': 'シン',
    '入': 'ニュウ',
    '了': 'リョウ',
    '儿': 'ジン',
    '子': 'ス',
    '我': 'ガ',
    '主': 'シュ',
    '耶': 'ヤ',
    '穌': 'ソ',
    '基': 'キ',
    '督': 'トク',
    '的': 'テキ',
    '交': 'コウ',
    '通': 'ツウ',
    # 他の漢字と音読みの対応を追加
}

def convert_to_onyomi_sentence(input_sentence):
    # 入力された漢字文を音読み文に変換する関数
    words = list(input_sentence)  # 文を単語に分割
    onyomi_sentence = []

    for word in words:
        onyomi = kanji_to_onyomi.get(word, word)  # 辞書から音読みを取得、なければそのまま単語を使用
        onyomi_sentence.append(onyomi)

    return ''.join(onyomi_sentence)

# 漢字文を入力
input_sentence = '神是信実的，你們乃是爲他所召，進入了他儿子我們主耶穌基督的交通。'
# 音読み文に変換
result = convert_to_onyomi_sentence(input_sentence)
print(result)  # 出力: "シンゼシンジツテキ，ジモンナイゼイタショショウ，シンニュウリョウタジンスガモンシュヤソキトクテキコウツウ。"

シンゼシンジツテキ，ジモンナイゼイタショショウ，シンニュウリョウタジンスガモンシュヤソキトクテキコウツウ。


#### Python で、Janome で、漢字文から音読み文に転換します。

Janome を使って漢字文から音読み文に変換するには、まず漢字を形態素に分割し、それぞれの形態素に対応する音読みを取得する必要があります。ただし、Janome 自体は音読みを直接提供する機能はありません。そのため、別途辞書や API などから音読みを取得する必要があります。

以下は、辞書を使用して漢字文から音読み文に変換するサンプルコードです。このコードでは、kanji_to_onyomi という辞書に漢字と対応する音読みを登録し、入力された漢字文を音読み文に変換します。

In [None]:
%%bash
pip install janome

Defaulting to user installation because normal site-packages is not writeable


In [None]:
from janome.tokenizer import Tokenizer

# 漢字から音読みに変換する対応表（例としていくつかの漢字と音読みを登録）
kanji_to_onyomi = {
    '神': 'シン',
    '是': 'ゼ',
    '信': 'シン',
    '実': 'ジツ',
    '的': 'テキ',
    '你': 'ジ',
    '們': 'モン',
    '乃': 'ナイ',
    '是': 'ゼ',
    '爲': 'イ',
    '他': 'タ',
    '所': 'ショ',
    '召': 'ショウ',
    '進': 'シン',
    '入': 'ニュウ',
    '了': 'リョウ',
    '儿': 'ジン',
    '子': 'ス',
    '我': 'ガ',
    '主': 'シュ',
    '耶': 'ヤ',
    '穌': 'ソ',
    '基': 'キ',
    '督': 'トク',
    '的': 'テキ',
    '交': 'コウ',
    '通': 'ツウ',
    '信実': 'シンジツ',
    '進入': 'シンニュウ',
    '交通': 'コウツウ',
    # 他の漢字と音読みの対応を追加
}

def get_onyomi(token):
    # 漢字を対応表から検索し、音読みを取得する関数
    return kanji_to_onyomi.get(token.surface, token.surface)

def convert_to_onyomi_sentence(input_sentence):
    # 入力された漢字文を音読み文に変換する関数
    t = Tokenizer()
    tokens = t.tokenize(input_sentence)
    # print([token.surface for token in tokens])
    onyomi_sentence = []

    for token in tokens:
        onyomi = get_onyomi(token)
        onyomi_sentence.append(onyomi)
    print(onyomi_sentence)

    return ''.join(onyomi_sentence)

# 漢字文を入力
input_sentence = '神是信実的，你們乃是爲他所召，進入了他儿子我們主耶穌基督的交通。'
# 音読み文に変換
result = convert_to_onyomi_sentence(input_sentence)
print(result)  # 出力: 'シンゼシンジツテキ，ジモンナイゼイタショショウ，シンニュウリョウタジンスガモンシュヤソキトクテキコウツウ。'

['シン', 'ゼ', 'シンジツ', 'テキ', '，', '你們乃', 'ゼ', '爲他所', 'ショウ', '，', 'シンニュウ', 'リョウ', 'タ', '儿子我', '們主耶', '穌基督', 'テキ', 'コウツウ', '。']
シンゼシンジツテキ，你們乃ゼ爲他所ショウ，シンニュウリョウタ儿子我們主耶穌基督テキコウツウ。


このコードでは、Janome の Tokenizer を使って日本語の形態素解析を行い、文を形態素に分割しています。それぞれの形態素には、表層形（原形）と品詞などの情報が含まれています。

上記のコードを実行すると、入力した日本語の文が形態素に分割されて、表層形と品詞の情報が表示されるでしょう。Janome はシンプルで使いやすいライブラリなので、日本語の形態素解析に便利です。

#### Python で、[MeCab](https://taku910.github.io/mecab/) で、UniDic で、漢字文から音読み文に転換します。

MeCab を使用して UniDic 辞書を利用し、漢字文から音読み文に変換するためには、以下の手順に従ってください。まず、Python で MeCab を使えるようにしてから、サンプルコードを提供します。

---
MeCab と UniDic のインストール：

In [None]:
%%bash
pip install unidic-lite
pip install mecab-python3

Defaulting to user installation because normal site-packages is not writeable
Collecting unidic-lite
  Downloading unidic-lite-1.0.8.tar.gz (47.4 MB)
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'done'
Building wheels for collected packages: unidic-lite
  Building wheel for unidic-lite (setup.py): started
  Building wheel for unidic-lite (setup.py): finished with status 'done'
  Created wheel for unidic-lite: filename=unidic_lite-1.0.8-py3-none-any.whl size=47658836 sha256=d354e3491cb194fab1fab224d3595dfa0419a6d75edec0bdd76fad8f60ec4d3a
  Stored in directory: /home/jupyter-saintway/.cache/pip/wheels/56/9c/4f/2c115e896b4b6c584039ca19de3581d333856782ef108cdc5c
Successfully built unidic-lite
Installing collected packages: unidic-lite
Successfully installed unidic-lite-1.0.8
Defaulting to user installation because normal site-packages is not writeable
Collecting mecab-python3
  Downloading mecab_python3-1.0.6-cp39-cp39-manylinux_2_17_x86_64

---
このコードでは、MeCab の Tagger に UniDic のパスを指定して、日本語の形態素解析を行い、漢字文を音読み文に変換しています。漢字の音読みは UniDic の「名詞固有名詞」のフィーチャー情報の7番目に格納されているため、それを取得しています。

注意：/path/to/unidic の部分は、UniDic 辞書の実際のインストールパスに置き換えてください。

また、UniDic に登録されていない単語や未知の単語に対しては、'\*'として示されることがあります。その場合は元の漢字をそのまま使用します。さらに、Juman++ などの他の形態素解析エンジンや辞書を利用することも検討してください。

In [None]:
import MeCab

# MeCab + UniDicを使って漢字文から音読みを取得する関数
def get_onyomi(text):
    try:
        mecab = MeCab.Tagger('-d /path/to/unidic')  # UniDicのパスを指定してください
        node = mecab.parse(text)
        onyomi_text = ''
        
        while node:
            features = node.feature.split(',')
            if len(features) > 7 and features[0] == '名詞' and features[1] == '固有名詞':
                onyomi_text += features[7] if features[7] != '*' else node.surface
            else:
                onyomi_text += node.surface

            node = node.next

        return onyomi_text

    except Exception as e:
        print('エラー:', e)
        return None

# 漢字文を入力
input_text = '漢字文を入力してください。'
# 音読みに変換
result = get_onyomi(input_text)
print(result)  # 出力例: '漢字文をニュウリョクシテクダサイ。'

---
[Juman++](https://github.com/ku-nlp/jumanpp)

In [None]:
sudo apt update
sudo apt install cmake

In [None]:
sudo apt update
sudo apt install protobuf-compiler libprotobuf-dev

In [None]:
%%bash
git clone https://github.com/ku-nlp/jumanpp.git ~/jumanpp

In [None]:
%%bash
mkdir -p ~/jumanpp/build
cd ~/jumanpp/build
cmake ~/jumanpp -DCMAKE_BUILD_TYPE=Release
cd ~/jumanpp
sudo make install

---
https://github.com/ku-nlp/jumanpp/releases/download/v2.0.0-rc4/jumanpp-2.0.0-rc4.tar.xz

---
https://lotus.kuee.kyoto-u.ac.jp/nl-resource/jumanpp/jumanpp-1.02.tar.xz

In [None]:
%%bash
cd ~ && wget https://lotus.kuee.kyoto-u.ac.jp/nl-resource/jumanpp/jumanpp-1.02.tar.xz

In [None]:
%%bash
cd ~ && tar xJvf ~/jumanpp-1.02.tar.xz

In [None]:
%%bash
sudo apt update
sudo apt install libboost-all-dev

In [None]:
%%bash
cd ~/jumanpp-1.02
./configure
make
sudo make install

---

In [None]:
%%bash
pip install pyknp

Defaulting to user installation because normal site-packages is not writeable


In [None]:
from pyknp import Juman

juman = Juman()

In [None]:
result = juman.analysis('''啓21:3　……見よ、神の幕屋が人と共にある．神は彼らと共に幕屋を張り……
22　わたしはその中に宮を見なかった．主なる神、全能者と小羊が、その宮だからである。

　わたしは七十年以上を費やして聖書を学びましたが、ごく最近になって、聖書が実はただ一つの事、すなわち宇宙的な合併を明らかにしていることを見ました。目的を持つ神にはエコノミーがあり、彼は彼のエコノミーの中で、宇宙的な合併を持つことを意図されます。
　わたしたちは、新エルサレムが神のエコノミーの目標であることを見てきましたが、新エルサレムが一つの合併であることを見ませんでした。啓示録第21章2節で使徒ヨハネは、「わたしはまた聖なる都、新エルサレム……を見た」と言い、次の節では「神の幕屋」としての新エルサレムについて語っています。神の幕屋として、新エルサレムは神の住まいであり、……［また］宇宙的な合併です。（リー全集、1994年―1997年、第5巻（下）、「御父により神聖な栄光をもってキリストの栄光が現されたことの結果」、第4編）''')

Analysis is done ignoring "\n".


In [None]:
'・'.join([mrph.midasi for mrph in result.mrph_list()])

'啓・21・:・3・\u3000・……・見よ・、・神・の・幕屋・が・人・と・共に・ある・．・神・は・彼・ら・と・共に・幕屋・を・張り・……・22・\u3000・わたし・は・その・中・に・宮・を・見・なかった・．・主なる・神・、・全・能・者・と・小・羊・が・、・その・宮・だ・から・である・。・\u3000・わたし・は・七十・年・以上・を・費やして・聖書・を・学び・ました・が・、・ごく・最近・に・なって・、・聖書・が・実は・ただ・一・つ・の・事・、・すなわち・宇宙・的な・合併・を・明らかに・して・いる・こと・を・見・ました・。・目的・を・持つ・神・に・は・エコノミー・が・あり・、・彼・は・彼・の・エコノミー・の・中・で・、・宇宙・的な・合併・を・持つ・こと・を・意図・さ・れ・ます・。・\u3000・わたし・たち・は・、・新・エルサレム・が・神・の・エコノミー・の・目標・である・こと・を・見て・き・ました・が・、・新・エルサレム・が・一・つ・の・合併・である・こと・を・見・ませ・ん・でした・。・啓示・録・第・21・章・2・節・で・使徒・ヨハネ・は・、・「・わたし・は・また・聖なる・都・、・新・エルサレム・……・を・見た・」・と・言い・、・次の・節・で・は・「・神・の・幕屋・」・と・して・の・新・エルサレム・に・ついて・語って・い・ます・。・神・の・幕屋・と・して・、・新・エルサレム・は・神・の・住まい・であり・、・……・［・また・］・宇宙・的な・合併・です・。・（・リー・全集・、・1994・年・―・1997・年・、・第・5・巻・（・下・）・、・「・御・父・に・より・神聖な・栄光・を・もって・キリスト・の・栄光・が・現さ・れた・こと・の・結果・」・、・第・4・編・）'

In [None]:
'・'.join([mrph.yomi for mrph in result.mrph_list()])

'ひらく・21・:・3・\u3000・……・みよ・、・かみ・の・まくや・が・じん・と・ともに・ある・．・かみ・は・かれ・ら・と・ともに・まくや・を・はり・……・22・\u3000・わたし・は・その・なか・に・みや・を・み・なかった・．・おもなる・かみ・、・ぜん・のう・しゃ・と・しょう・ひつじ・が・、・その・みや・だ・から・である・。・\u3000・わたし・は・七十・ねん・いじょう・を・ついやして・せいしょ・を・まなび・ました・が・、・ごく・さいきん・に・なって・、・せいしょ・が・じつは・ただ・一・つ・の・じ・、・すなわち・うちゅう・てきな・がっぺい・を・あきらかに・して・いる・こと・を・み・ました・。・もくてき・を・もつ・かみ・に・は・エコノミー・が・あり・、・かれ・は・かれ・の・エコノミー・の・なか・で・、・うちゅう・てきな・がっぺい・を・もつ・こと・を・いと・さ・れ・ます・。・\u3000・わたし・たち・は・、・しん・えるされむ・が・かみ・の・エコノミー・の・もくひょう・である・こと・を・みて・き・ました・が・、・しん・えるされむ・が・一・つ・の・がっぺい・である・こと・を・み・ませ・ん・でした・。・けいじ・ろく・だい・21・しょう・2・せつ・で・しと・ヨハネ・は・、・「・わたし・は・また・せいなる・と・、・しん・えるされむ・……・を・みた・」・と・いい・、・つぎの・せつ・で・は・「・かみ・の・まくや・」・と・して・の・しん・えるされむ・に・ついて・かたって・い・ます・。・かみ・の・まくや・と・して・、・しん・えるされむ・は・かみ・の・すまい・であり・、・……・［・また・］・うちゅう・てきな・がっぺい・です・。・（・りー・ぜんしゅう・、・1994・ねん・―・1997・ねん・、・だい・5・ま・（・した・）・、・「・ご・ちち・に・より・しんせいな・えいこう・を・もって・キリスト・の・えいこう・が・あらわさ・れた・こと・の・けっか・」・、・だい・4・へん・）'

In [None]:
result = juman.analysis('神是信実的，你們乃是爲他所召，進入了他儿子我們主耶穌基督的交通。')

In [None]:
'・'.join([mrph.midasi for mrph in result.mrph_list()])

'神・是信・実・的・，・你們・乃・是・爲他・所・召・，・進入・了・他・儿子・我們・主・耶穌・基督・的・交通・。'

In [None]:
'・'.join([mrph.yomi for mrph in result.mrph_list()])

'かみ・是信・み・てき・，・你們・だい・ぜ・爲他・しょ・めし・，・しんにゅう・りょう・た・儿子・我們・しゅ・耶穌・基督・てき・こうつう・。'

In [None]:
result = juman.analysis('神、是、信、実、的，你、們、乃、是、爲、他、所、召，進、入、了、他、儿、子、我、們、主、耶、穌、基、督、的、交、通。')

In [None]:
'・'.join([mrph.midasi for mrph in result.mrph_list()])

'神・、・是・、・信・、・実・、・的・，・你・、・們・、・乃・、・是・、・爲・、・他・、・所・、・召・，・進・、・入・、・了・、・他・、・儿・、・子・、・我・、・們・、・主・、・耶・、・穌・、・基・、・督・、・的・、・交・、・通・。'

In [None]:
'・'.join([mrph.yomi for mrph in result.mrph_list()])

'かみ・、・ぜ・、・しん・、・み・、・てき・，・你・、・們・、・だい・、・ぜ・、・爲・、・ほか・、・しょ・、・めし・，・しん・、・はいり・、・りょう・、・ほか・、・儿・、・し・、・われ・、・們・、・おも・、・耶・、・穌・、・もと・、・督・、・てき・、・交・、・つう・。'

---
https://codeberg.org/miurahr/pykakasi

In [None]:
%%bash
pip install pykakasi

Defaulting to user installation because normal site-packages is not writeable
Collecting pykakasi
  Downloading pykakasi-2.2.1-py3-none-any.whl (2.4 MB)
Collecting jaconv
  Downloading jaconv-0.3.4.tar.gz (16 kB)
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'done'
Collecting deprecated
  Downloading Deprecated-1.2.14-py2.py3-none-any.whl (9.6 kB)
Building wheels for collected packages: jaconv
  Building wheel for jaconv (setup.py): started
  Building wheel for jaconv (setup.py): finished with status 'done'
  Created wheel for jaconv: filename=jaconv-0.3.4-py3-none-any.whl size=16415 sha256=ee5ab10be02623d85b0962dad372b01ad36a876b0a7421e27fb0ab4c8bdcff9d
  Stored in directory: /home/jupyter-saintway/.cache/pip/wheels/49/de/f1/55f605920db3666d30215331bc85f24686dde9b95b473ae41b
Successfully built jaconv
Installing collected packages: jaconv, deprecated, pykakasi
Successfully installed deprecated-1.2.14 jaconv-0.3.4 pykakasi-2.2.1


In [None]:
from pykakasi import kakasi

kakasi = kakasi()

kanji_word = '神是信実的，你們乃是爲他所召，進入了他儿子我們主耶穌基督的交通。'
kana_reading = kakasi.convert(kanji_word)

print('・'.join([item['orig'] for item in kana_reading]))
print('・'.join([item['kana'] for item in kana_reading]))

神・是信・実・的・，・你・們・乃・是・爲・他所・召・，・進入・了・他・儿・子・我們・主・耶穌・基督・的・交通。
カミ・ゼシン・ミ・テキ・，・・ラ・ノ・コレ・タメ・タショ・ショウ・，・シンニュウ・リョウ・ホカ・ニン・コ・ワレラ・シュ・ヤソ・キリスト・テキ・コウツウ。


In [None]:
import pykakasi
kks = pykakasi.kakasi()
text = '神是信実的，你們乃是爲他所召，進入了他儿子我們主耶穌基督的交通。'
result = kks.convert(text)
print(
    ''.join(
        '{}［{}］'.format(
            item['orig'],
            item['kana']
        ) for item in result
    )
)

神［カミ］是信［ゼシン］実［ミ］的［テキ］，［，］你［］們［ラ］乃［ノ］是［コレ］爲［タメ］他所［タショ］召［ショウ］，［，］進入［シンニュウ］了［リョウ］他［ホカ］儿［ニン］子［コ］我們［ワレラ］主［シュ］耶穌［ヤソ］基督［キリスト］的［テキ］交通。［コウツウ。］


In [None]:
import pykakasi
kks = pykakasi.kakasi()
text = '神是信実的，你們乃是爲他所召，進入了他儿子我們主耶穌基督的交通。'
result = kks.convert(text)
print(
    ''.join(
        '{}［{}］'.format(
            item['orig'],
            item['hepburn']
        ) for item in result
    )
)

神［kami］是信［zeshin］実［mi］的［teki］，［,］你［］們［ra］乃［no］是［kore］爲［tame］他所［tasho］召［shou］，［,］進入［shinnyuu］了［ryou］他［hoka］儿［nin］子［ko］我們［warera］主［shu］耶穌［yaso］基督［kirisuto］的［teki］交通。［koutsuu.］


In [None]:
import pykakasi
kks = pykakasi.kakasi()
text = '抱歉，昨天太忙了。'
result = kks.convert(text)
print(
    ''.join(
        '{}［{}］'.format(
            item['orig'],
            item['kana']
        ) for item in result
    )
)

抱［ホウ］歉［ケン］，［，］昨［サク］天［テン］太［タ］忙［ボウ］了。［リョウ。］


In [None]:
import pykakasi
kks = pykakasi.kakasi()
text = '我聚會完了。我現在在超市。'
result = kks.convert(text)
print(
    ''.join(
        '{}［{}］'.format(
            item['orig'],
            item['kana']
        ) for item in result
    )
)

我［ワレ］聚會［シュウカイ］完了。［カンリョウ。］我［ワレ］現在［ゲンザイ］在［ザイ］超［チョウ］市。［シ。］


In [None]:
import pykakasi
kks = pykakasi.kakasi()
text = '用這個輸入法的日語輸入漢字比較方便。'
result = kks.convert(text)
print(
    ''.join(
        '{}［{}］'.format(
            item['orig'],
            item['kana']
        ) for item in result
    )
)

用［ヨウ］這［シャ］個［コ］輸入［ユニュウ］法的［ホウテキ］日語［ニチゴ］輸入［ユニュウ］漢字［カンジ］比較［ヒカク］方便。［ホウベン。］


In [None]:
import pykakasi
kks = pykakasi.kakasi()
text = '''
主啊，我與盛偉願意全心全意追隨你
願意讓你在我們裡面書寫神聖的歷史。
'''
result = kks.convert(text)
print(
    ''.join(
        '{}［{}］'.format(
            item['orig'],
            item['kana']
        ) for item in result
    )
)


［］主［シュ］啊［］，［，］我［ワレ］與［ヨ］盛［ジョウ］偉［イ］願意［ガンイ］全心［ゼンシン］全［ゼン］意［イ］追［ツイ］隨［ズイ］你［］
［］你［］願意［ガンイ］讓［ユズル］你［］在［ザイ］我們［ワレラ］裡面［リメン］書寫［ショシャ］神聖［シンセイ］的［テキ］歷史。［レキシ。］
［］


In [None]:
import pykakasi
kks = pykakasi.kakasi()
text = '''
我們早點學會這種偽日本語。我們可以用偽日本語交談。沒有人能夠聽懂。
'''
result = kks.convert(text)
print(
    ''.join(
        '{}［{}］'.format(
            item['orig'],
            item['kana']
        ) for item in result
    )
)


［］我們［ワレラ］早［ソウ］點［テン］學會［ガッカイ］這［シャ］種［タネ］偽［ニセ］日本語。［ニホンゴ。］我們［ワレラ］可［カ］以［イ］用［ヨウ］偽［ニセ］日本語［ニホンゴ］交［コウ］談。［ダン。］沒［ボツ］有人［ユウジン］能［ノウ］夠［］聽［チョウ］懂。［。］
［］


In [None]:
import pykakasi
kks = pykakasi.kakasi()
text = '''
### 三  憑著眾召會在基督身體里的交通，平安的神就要將撒但踐踏在我們的腳下——羅十六20。

## **陸  羅馬十六章給了我們使徒保羅絕佳的榜樣，他將眾聖徒帶到基督身體全體相調的生活中；乃是在這樣的生活中，我們才能真正地在生命中作王——五17：**

### 一  保羅對聖徒一一提名問安，至少有二十七個名字；這給我們看見，他對每一位聖徒都相當的認識、瞭解、關心——十六1～16。

### 二  保羅的推薦與問安表達眾聖徒之間相互的關切，以及眾召會之間相互的交通——參西四15～16。
'''
result = kks.convert(text)
print(
    ''.join(
        '{}［{}］'.format(
            item['orig'],
            item['kana']
        ) for item in result
    )
)


［］### ［### ］三［サン］ ［］三［サン］ ［ ］憑［ヒョウ］著［チョ］眾［］召［ショウ］會［カイ］在［ザイ］基督［キリスト］身體［シンタイ］里［サト］的［テキ］交通［コウツウ］，［，］平安［ヘイアン］的［テキ］神［カミ］就［シュウ］要［ヨウ］將［ショウ］撒［サン］但［タダ］踐［セン］踏［トウ］在［ザイ］我們［ワレラ］的［テキ］腳［］下［シタ］——［——］羅［ラ］十六［ジュウロク］20。［20。］
［］
［］## **［## **］陸［リク］ ［］陸［リク］ ［ ］羅馬［ローマ］十六［ジュウロク］章［ショウ］給［キュウ］了［リョウ］我們［ワレラ］使徒［シト］保羅［ポール］絕［］佳［カ］的［テキ］榜［ボウ］樣［サマ］，［，］他［ホカ］將［ショウ］眾［］聖徒［セイト］帶［オビ］到［トウ］基督［キリスト］身體全體［シンタイゼンタイ］相［ソウ］調［チョウ］的［テキ］生活［セイカツ］中［ナカ］；［］中［ナカ］乃［ノ］是［コレ］在［ザイ］這［シャ］樣［サマ］的［テキ］生活［セイカツ］中［ナカ］，［，］我們［ワレラ］才能［サイノウ］真正［シンセイ］地［チ］在生［ザイショウ］命中［メイチュウ］作［サク］王［オウ］——［——］五［ゴ］17［17］：［：］**［**］
［］**［**］
［］**### ［**### ］一［イチ］ ［］一［イチ］ ［ ］保羅［ポール］對［ツイ］聖徒［セイト］一一［イチイチ］提［テイ］名［メイ］問［トン］安［アン］，［，］至［イタ］少［ショウ］有二［ユウジ］十［ジュウ］七個［ナナコ］名字［ミョウジ］；［］名字［ミョウジ］這［シャ］給［キュウ］我們［ワレラ］看［カン］見［ケン］，［，］他［ホカ］對［ツイ］每［］一位［イチイ］聖徒［セイト］都［ミヤコ］相當［ソウトウ］的［テキ］認識、［ニンシキ、］瞭［リョウ］解、［カイ、］關心［カンシン］——［——］十六［ジュウロク］1［1］～［～］16。［16。］
［］
［］### ［### ］二［ニ］ ［］二［ニ］ ［ ］保羅［ポール］的［テキ］推薦［スイセン］與［ヨ］問［トン］安［アン］表［オモテ］達［トオル］眾［］聖徒［セイト］之［ユキ］間［カン］相互［ソウゴ］的［テキ］關［カン］切［セツ］，［，］以［イ］及［キュウ］眾［］召［ショウ］會［カイ］之［ユキ］間［カン］相互［ソウゴ］的［テキ］交通［コウツウ］——

---
[Unihan](https://unicode.org/charts/unihan.html)

In [None]:
%%bash
pip install unihan-etl

In [None]:
%%bash
pip install cihai

In [None]:
from cihai.core import Cihai

c = Cihai()

if not c.unihan.is_bootstrapped:  # download and install Unihan to db
    c.unihan.bootstrap()

query = c.unihan.lookup_char('好')
glyph = query.first()
print("lookup for 好: %s" % glyph.kDefinition)
# lookup for 好: good, excellent, fine; well

query = c.unihan.reverse_char('good')
print('matches for "good": %s ' % ', '.join([glph.char for glph in query]))
# matches for "good": 㑘, 㑤, 㓛, 㘬, 㙉, 㚃, 㚒, 㚥, 㛦, 㜴, 㜺, 㝖, 㤛, 㦝, ...

Exists, but is not a file: /home/jupyter-saintway/.cache/unihan_etl/downloads/Unihan.zip
Downloading Unihan.zip...
http://www.unicode.org/Public/UNIDATA/Unihan.zip to /home/jupyter-saintway/.cache/unihan_etl/downloads/Unihan.zip


Total size: 8.0Mb

extract_zip dest dir: /home/jupyter-saintway/.cache/unihan_etl/downloads






Loading data: /home/jupyter-saintway/.cache/unihan_etl/downloads/Unihan_DictionaryLikeData.txt, /home/jupyter-saintway/.cache/unihan_etl/downloads/Unihan_IRGSources.txt, /home/jupyter-saintway/.cache/unihan_etl/downloads/Unihan_NumericValues.txt, /home/jupyter-saintway/.cache/unihan_etl/downloads/Unihan_RadicalStrokeCounts.txt, /home/jupyter-saintway/.cache/unihan_etl/downloads/Unihan_Readings.txt, /home/jupyter-saintway/.cache/unihan_etl/downloads/Unihan_Variants.txt
Done loading data.
Collecting field data...


lookup for 好: good, excellent, fine; well
matches for "good": 㑘, 㑤, 㓛, 㘬, 㙉, 㚃, 㚒, 㚥, 㛦, 㜴, 㜺, 㝖, 㤛, 㦝, 㫑, 㭋, 㰬, 㱅, 㱡, 㳤, 㹏, 㹛, 㽥, 㾎, 㿲, 䃽, 䄈, 䄉, 䄐, 䄙, 䋬, 䌖, 䌝, 䌤, 䌧, 䌳, 䏂, 䐌, 䐚, 䑞, 䒁, 䒏, 䒐, 䙤, 䚱, 䚷, 䚸, 䜴, 䝕, 䝨, 䢇, 䣨, 䣩, 䤒, 䩂, 䩇, 䩊, 䫑, 䫢, 䮐, 䯭, 䱼, 䴆, 佳, 佼, 功, 吉, 咊, 善, 塡, 填, 好, 姤, 姽, 娥, 宓, 昌, 淑, 祉, 祥, 祦, 祯, 祺, 禎, 福, 禔, 禨, 羑, 羭, 腆, 臧, 良, 貨, 賍, 賢, 贒, 贓, 贜, 贤, 货, 赃, 醇, 頔, 顓, 颛, 餱, 𠿭, 𡠜, 𦈟, 𬱖, 良, 祥, 𦈜, 𫗯, 𫲗, 𬥄, 𰷭 


In [None]:
from cihai.core import Cihai

c = Cihai()

if not c.unihan.is_bootstrapped:  # download and install Unihan to db
    c.unihan.bootstrap()

query = c.unihan.lookup_char('讀')
glyph = query.first()

In [None]:
glyph.kJapaneseKun

'YOMU'

In [None]:
glyph.kJapaneseOn

'TOKU TOU DOKU'

In [None]:
glyph.kRSJapanese

In [None]:
glyph.kZVariant

In [None]:
glyph.kSemanticVariant

In [None]:
glyph.kSimplifiedVariant

'U+8BFB'

In [None]:
glyph.kTraditionalVariant

'U+8B80'

In [None]:
glyph.kCompatibilityVariant

In [None]:
glyph.kSpecializedSemanticVariant

In [None]:
dir(glyph)

['__abstract__',
 '__annotations__',
 '__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__mapper__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__table__',
 '__weakref__',
 '_sa_automapbase_bookkeeping',
 '_sa_class_manager',
 '_sa_decl_prepare',
 '_sa_instance_state',
 '_sa_raise_deferred_config',
 '_sa_registry',
 'by_module',
 'char',
 'classes',
 'kAccountingNumeric',
 'kCangjie',
 'kCantonese',
 'kCheungBauer',
 'kCihaiT',
 'kCompatibilityVariant',
 'kDefinition',
 'kFenn',
 'kFourCornerCode',
 'kFrequency',
 'kGradeLevel',
 'kHDZRadBreak',
 'kHKGlyph',
 'kHangul',
 'kHanyuPinlu',
 'kHanyuPinyin',
 'kJapaneseKun',
 'kJapaneseOn',
 'kKorean',
 'kMandarin',
 'kOtherNumeric',
 'kPhonetic',
 'kPrimaryNumeric',
 'kRSAdobe_Japa