In [12]:
from gensim.models import KeyedVectors

# Download ksucca_full_cbow vectors: https://drive.google.com/u/0/uc?id=1rZiOKy71Z_WycxnOG9bwrNoAc4ziGo_n
# Then, load the vectors directly from the file.

# NOTE: You can use only 1m out of vectors loaded to speed up the model performance
model = KeyedVectors.load_word2vec_format(
    '~/quran-semantic-search-api/data/ksucca_full_cbow.bin', binary=True, limit=1000000)


# Pickle the model
model.save("../models/model.pkl")

In [13]:
# Access vectors for specific words with a keyed lookup:
vector = model['حميد']

# see the shape of the vector (300,)
vector.shape

(300,)

In [15]:
model.similarity('شجاعة', 'خوف')

0.17093751

In [16]:
model.most_similar('ضيزى')

[('جائرة.', 0.7013014554977417),
 ('ضيزى»', 0.638590395450592),
 ('خاسرة', 0.5436197519302368),
 ('جائرة', 0.5415328145027161),
 ('قسمة', 0.527427077293396),
 ('«ألكم', 0.4947861433029175),
 ('ضيزى،', 0.46748870611190796),
 ('عوجاء.', 0.46708834171295166),
 ('العلى،', 0.4437080919742584),
 ('«والليل', 0.4276253581047058)]

In [21]:
model.most_similar(positive=['عربية', 'مرأة'], negative=['رجل'])

[('أعجمية', 0.5713305473327637),
 ('معربة.', 0.4888487160205841),
 ('فصيحة', 0.48866575956344604),
 ('سريانية.', 0.4794731140136719),
 ('معربة', 0.4788493812084198),
 ('لازمة.', 0.47607848048210144),
 ('تصغيرها', 0.47408556938171387),
 ('معروفة،', 0.4668642580509186),
 ('نادرة', 0.46038591861724854),
 ('هجنت', 0.4470795691013336)]

#### Pickle the model to use .pkl files in API

In [107]:
model.save("../models/model.pkl") # Stores *.pkl file

In [108]:
model = KeyedVectors.load("../models/model.pkl")

# or download aravec_3_twitter vectors: https://archive.org/download/full_grams_cbow_300_twitter
# and load the AraVec model directly after unziping 
# model = Word2Vec.load('models/full_grams_cbow_100_twitter.mdl')

#### Use python `request` modules to extract data

In [30]:
import requests

url = 'http://0.0.0.0:5000/similar-word/نار'

r = requests.get(url)
print(r, r.text)

<Response [200]> {
  "results": [
    [
      "نار", 
      0.6224889755249023
    ], 
    [
      "بشعله", 
      0.5385594964027405
    ], 
    [
      "جمر", 
      0.5346778631210327
    ], 
    [
      "نار", 
      0.5274872779846191
    ], 
    [
      "جهنم", 
      0.518902599811554
    ], 
    [
      "النار", 
      0.5084757804870605
    ], 
    [
      "شعله", 
      0.5068792700767517
    ], 
    [
      "توقد", 
      0.5067633390426636
    ], 
    [
      "لهبها", 
      0.5035787224769592
    ], 
    [
      "ناره", 
      0.5022990703582764
    ]
  ]
}



In [31]:
import requests

url = 'http://0.0.0.0:5000/similar-verse/حميد'

r = requests.get(url)
print(r, r.text)

<Response [200]> {
  "results": [
    "هو الذي جعلكم خلائف في الأرض فمن كفر فعليه كفره ولا يزيد الكافرين كفرهم عند ربهم إلا مقتا ولا يزيد الكافرين كفرهم إلا خسارا", 
    "وامرأته قائمة فضحكت فبشرناها بإسحاق ومن وراء إسحاق يعقوب", 
    "ثم لا يموت فيها ولا يحيى", 
    "وما نقموا منهم إلا أن يؤمنوا بالله العزيز الحميد", 
    "إن الأبرار لفي نعيم", 
    "إن الأبرار لفي نعيم", 
    "أيطمع كل امرئ منهم أن يدخل جنة نعيم", 
    "ذلك بأنه كانت تأتيهم رسلهم بالبينات فقالوا أبشر يهدوننا فكفروا وتولوا واستغنى الله والله غني حميد", 
    "لقد كان لكم فيهم أسوة حسنة لمن كان يرجو الله واليوم الآخر ومن يتول فإن الله هو الغني الحميد", 
    "الذين يبخلون ويأمرون الناس بالبخل ومن يتول فإن الله هو الغني الحميد"
  ]
}

