# Google Sentence Encoder Evaluation

In [2]:
from hanziconv import HanziConv
from build_data import read_bible

unv = read_bible('../data/dnstrunv')
unv['text_s'] = unv.text.apply(HanziConv.toSimplified)

In [3]:
import tensorflow_hub as hub
import numpy as np
import tensorflow_text

embed = hub.load("https://tfhub.dev/google/universal-sentence-encoder-multilingual/3")

In [87]:
import pandas as pd
import tensorflow as tf
from tqdm import tqdm

tensors = []
start = 0
end = batch_size = 3000
while True:
    batch = unv.text_s[start:end]
    if not any(batch):
        break
    tensors.append(embed(batch))
    start = end
    end += batch_size

embeddings = tf.concat(tensors, 0)

In [109]:
def search(keyword: str, top_k: int = 10):
    searches_emb = embed([keyword])
    results = np.inner(searches_emb, embeddings)
    for i, search_results in enumerate(results):
        print(f'Searches for {keyword}:')
        top_k = search_results.argsort()[-top_k:][::-1]
        for k in top_k:
            print(f'Score: {search_results[k]:7.4f} {unv.text.iloc[k]}')
        print()

In [100]:
for kw in ['挂虑 祈祷', '喜乐 事奉', '求救', '信心 行事']:
    search(kw)

Searches for 挂虑 祈祷:
Score:  0.5392 耶和華又對我說：「不要為這百姓祈禱求好處。
Score:  0.5355 惟求耶和華─我的神垂顧僕人的禱告祈求，俯聽僕人在你面前的祈禱呼籲。
Score:  0.5031 惟求耶和華─我的神垂顧僕人的禱告祈求，俯聽僕人今日在你面前的祈禱呼籲。
Score:  0.5030 「所以，你不要為這百姓祈禱；不要為他們呼求禱告，也不要向我為他們祈求，因我不聽允你。
Score:  0.4931 我便禁食，披麻蒙灰，定意向主神祈禱懇求。
Score:  0.4917 耶西的兒子─大衛的祈禱完畢。
Score:  0.4786 應當一無掛慮，只要凡事藉著禱告、祈求，和感謝，將你們所要的告訴神。
Score:  0.4707 我聽見這話，就坐下哭泣，悲哀幾日，在天上的神面前禁食祈禱，說：
Score:  0.4702 我為他們祈求，不為世人祈求，卻為你所賜給我的人祈求，因他們本是你的。
Score:  0.4648 轉耳不聽律法的，他的祈禱也為可憎。

Searches for 喜乐 事奉:
Score:  0.4804 要常常喜樂，
Score:  0.4497 惟有義人必然歡喜，在神面前高興快樂。
Score:  0.4440 門徒滿心喜樂，又被聖靈充滿。
Score:  0.4410 你們要靠主常常喜樂。我再說，你們要喜樂。
Score:  0.4375 猶大人有光榮，歡喜快樂而得尊貴。
Score:  0.4353 你必歡喜快樂；有許多人因他出世，也必喜樂。
Score:  0.4226 你們也要照樣喜樂，並且與我一同喜樂。
Score:  0.4129 歡喜作惡，喜愛惡人的乖僻，
Score:  0.4010 義人享福，合城喜樂；惡人滅亡，人都歡呼。
Score:  0.3950 喜樂的心乃是良藥；憂傷的靈使骨枯乾。

Searches for 求救:
Score:  0.4511 拯救我的主啊，求你快快幫助我！
Score:  0.3905 我哀號求救；他使我的禱告不得上達。
Score:  0.3715 因我拯救哀求的困苦人和無人幫助的孤兒。
Score:  0.3522 求你憑你的公義搭救我，救拔我；側耳聽我，拯救我！
Score:  0.3478 我真是苦啊！誰能救我脫離這取死的身體呢？
Sc

In [118]:
search('耶和华啊，求你听闻公义，侧耳听我的呼吁！求你留心听我这不出于诡诈嘴唇的祈祷！', 20)

Searches for 耶和华啊，求你听闻公义，侧耳听我的呼吁！求你留心听我这不出于诡诈嘴唇的祈祷！:
Score:  0.9395 （大衛的祈禱。）耶和華啊，求你聽聞公義，側耳聽我的呼籲！求你留心聽我這不出於詭詐嘴唇的祈禱！
Score:  0.7556 耶和華啊，求你留心聽我的禱告，垂聽我懇求的聲音。
Score:  0.7279 耶和華啊，我用聲音呼籲的時候，求你垂聽；並求你憐恤我，應允我。
Score:  0.7218 我曾對耶和華說：你是我的神。耶和華啊，求你留心聽我懇求的聲音！
Score:  0.7178 耶和華啊，求你救我脫離說謊的嘴唇和詭詐的舌頭！
Score:  0.7134 （大衛的詩。）耶和華啊，求你聽我的禱告，留心聽我的懇求，憑你的信實和公義應允我。
Score:  0.7105 惟求耶和華─我的神垂顧僕人的禱告祈求，俯聽僕人在你面前的祈禱呼籲。
Score:  0.7092 耶和華─萬軍之神啊，求你聽我的禱告！雅各的神啊，求你留心聽！（細拉）
Score:  0.7071 惟求耶和華─我的神垂顧僕人的禱告祈求，俯聽僕人今日在你面前的祈禱呼籲。
Score:  0.7062 耶和華啊，求你側耳而聽！耶和華啊，求你睜眼而看！要聽西拿基立打發使者來辱罵永生神的話。
Score:  0.7027 求你照你的慈愛聽我的聲音；耶和華啊，求你照你的典章將我救活！
Score:  0.7022 我的王我的神啊，求你垂聽我呼求的聲音！因為我向你祈禱。
Score:  0.6928 （大衛的詩。）耶和華啊，我曾求告你，求你快快臨到我這裡！我求告你的時候，願你留心聽我的聲音！
Score:  0.6873 神啊，求你聽我的禱告，留心聽我口中的言語。
Score:  0.6851 （大衛的祈禱。）耶和華啊，求你側耳應允我，因我是困苦窮乏的。
Score:  0.6827 耶和華啊，求你應允我，憐恤我！耶和華啊，求你幫助我！
Score:  0.6780 耶和華啊，求你起來！神啊，求你舉手，不要忘記困苦人！
Score:  0.6721 耶和華啊，求你不要撇棄我！我的神啊，求你不要遠離我！
Score:  0.6709 耶和華啊，求你側耳而聽；耶和華啊，求你睜眼而看，要聽西拿基立的一切話，他是打發使者來辱罵永生神的。
Score:  0.6705 耶和華啊，謙卑

In [120]:
search('于是用比喻说：「一个人有一棵无花果树栽在葡萄园里。他来到树前找果子，却找不着。', 20)

Searches for 于是用比喻说：「一个人有一棵无花果树栽在葡萄园里。他来到树前找果子，却找不着。:
Score:  1.0000 於是用比喻說：「一個人有一棵無花果樹栽在葡萄園裡。他來到樹前找果子，卻找不著。
Score:  0.7427 看見路旁有一棵無花果樹，就走到跟前，在樹上找不著甚麼，不過有葉子，就對樹說：「從今以後，你永不結果子。」那無花果樹就立刻枯乾了。
Score:  0.7363 凡樹木看果子，就可以認出它來。人不是從荊棘上摘無花果，也不是從蒺藜裡摘葡萄。
Score:  0.6988 「因為，沒有好樹結壞果子，也沒有壞樹結好果子。
Score:  0.6975 「你們或以為樹好，果子也好；樹壞，果子也壞；因為看果子就可以知道樹。
Score:  0.6783 他必像葡萄樹的葡萄，未熟而落；又像橄欖樹的花，一開而謝。
Score:  0.6692 耶和華神使各樣的樹從地裡長出來，可以悅人的眼目，其上的果子好作食物。園子當中又有生命樹和分別善惡的樹。
Score:  0.6660 好樹不能結壞果子；壞樹不能結好果子。
Score:  0.6655 又必在撒馬利亞的山上栽種葡萄園，栽種的人要享用所結的果子。
Score:  0.6621 耶和華說：我必使他們全然滅絕；葡萄樹上必沒有葡萄，無花果樹上必沒有果子，葉子也必枯乾。我所賜給他們的，必離開他們過去。
Score:  0.6593 這樣，凡好樹都結好果子，惟獨壞樹結壞果子。
Score:  0.6550 又看那地土是肥美是瘠薄，其中有樹木沒有。你們要放開膽量，把那地的果子帶些來。」（那時正是葡萄初熟的時候。）
Score:  0.6505 不可摘盡葡萄園的果子，也不可拾取葡萄園所掉的果子；要留給窮人和寄居的。我是耶和華你─們的神。
Score:  0.6494 遠遠地看見一棵無花果樹，樹上有葉子，就往那裡去，或者在樹上可以找著甚麼。到了樹下，竟找不著甚麼，不過有葉子，因為不是收無花果的時候。
Score:  0.6484 人人都要坐在自己葡萄樹下和無花果樹下，無人驚嚇。這是萬軍之耶和華親口說的。
Score:  0.6473 誰種葡萄園，尚未用所結的果子，他可以回家去，恐怕他陣亡，別人去用。
Score:  0.6443 無花果樹回答說：『我豈肯止住所結甜美的果子，飄颻在眾樹之上呢？』
Sco

In [122]:
search('作执事的，也是如此：必须端庄，不一口两舌，不好喝酒，不贪不义之财；', 10)

Searches for 作执事的，也是如此：必须端庄，不一口两舌，不好喝酒，不贪不义之财；:
Score:  1.0000 作執事的，也是如此：必須端莊，不一口兩舌，不好喝酒，不貪不義之財；
Score:  0.6741 不因酒滋事，不打人，只要溫和，不爭競，不貪財；
Score:  0.5573 監督既是神的管家，必須無可指責，不任性，不暴躁，不因酒滋事，不打人，不貪無義之財；
Score:  0.5539 不要為作惡的心懷不平，也不要嫉妒惡人；
Score:  0.5364 你必撒種，卻不得收割；踹橄欖，卻不得油抹身；踹葡萄，卻不得酒喝。
Score:  0.5329 那暗昧無益的事，不要與人同行，倒要責備行這事的人；
Score:  0.5301 好飲酒的，好吃肉的，不要與他們來往；
Score:  0.5265 不要吃惡眼人的飯，也不要貪他的美味；
Score:  0.5251 不要仗勢欺人，也不要因搶奪而驕傲；若財寶加增，不要放在心上。
Score:  0.5210 他必以敬畏耶和華為樂；行審判不憑眼見，斷是非也不憑耳聞；

