In [21]:
from elasticsearch import helpers, Elasticsearch

es = Elasticsearch([{'host': 'localhost', 'port': '9200'}])
es.ping()

True

In [22]:
import json
import codecs

hadith = codecs.open('data/json_hadith.json', 'r', 'utf-8-sig')

json_hadith = json.load(hadith)

json_hadith[7]

{'': '7',
 'source': 'صحيح البخاري',
 'chapter_no': '2',
 'chapter': 'Belief - كتاب الإيمان',
 'text_ar': 'حدثنا عبيد الله بن موسى، قال أخبرنا حنظلة بن أبي سفيان، عن عكرمة بن خالد، عن ابن عمر  رضى الله عنهما  قال قال رسول الله صلى الله عليه وسلم بني الإسلام على خمس شهادة أن لا إله إلا الله وأن محمدا رسول الله، وإقام الصلاة، وإيتاء الزكاة، والحج، وصوم رمضان '}

In [23]:
hadit = []

for obj in json_hadith:
      hadit.append({
        "source": obj['source'],
        "chapter_no": obj['chapter_no'],
        "chapter": obj['chapter'],
        "hadith": obj['text_ar'],
    })

print(hadit[0])

{'source': 'صحيح البخاري', 'chapter_no': '1', 'chapter': 'Revelation - كتاب بدء الوحى', 'hadith': 'حدثنا الحميدي عبد الله بن الزبير، قال حدثنا سفيان، قال حدثنا يحيى بن سعيد الأنصاري، قال أخبرني محمد بن إبراهيم التيمي، أنه سمع علقمة بن وقاص الليثي، يقول سمعت عمر بن الخطاب  رضى الله عنه  على المنبر قال سمعت رسول الله صلى الله عليه وسلم يقول إنما الأعمال بالنيات، وإنما لكل امرئ ما نوى، فمن كانت هجرته إلى دنيا يصيبها أو إلى امرأة ينكحها فهجرته إلى ما هاجر إليه '}


In [32]:
mapping ={
    "settings" : {
       "number_of_shards":1,
       "number_of_replicas":1,

    "analysis":{
   "filter":{
      "arabic_stop":{
         "type":"stop",
         "stopwords_path":"/etc/elasticsearch/merged-stopwords.txt" # change to D:/Elastic/elasticsearch/config/merged-stopwords.txt
      },
      "arabic_keywords":{
         "type":"keyword_marker",
         "keywords_path":"/etc/elasticsearch/keywordmarker-words.txt" # change to D:/Elastic/elasticsearch/config/keywordmarker-words.txt
      },
      "arabic_stemmer":{
         "type":"stemmer",
         "language":"arabic"
      },
      "arabic_shingle":{
         "type":"shingle",
         "min_shingle_size":2,
         "max_shingle_size":3
      }
   },
   "analyzer":{
      "rebuilt_arabic":{
         "tokenizer":"standard",
         "filter":[
            "arabic_stop",
            "arabic_normalization",
            "arabic_keywords",
            "arabic_shingle",
            "arabic_stemmer"
         ]
      },
       "rebuilt":{
         "tokenizer":"standard",
         "filter":[
            "arabic_stop",
            "arabic_normalization",
            "arabic_keywords",
            "arabic_stemmer" #for one word aggregations 
         ]
      },
      "simple_arabic":{
         "tokenizer":"standard",
         "filter":[
            "arabic_stop",
            "arabic_normalization",
            "arabic_shingle"
         ]
      },
      "noshingle_arabic": {
          "tokenizer":"standard",
         "filter":[
            "arabic_stop",
            "arabic_normalization"
         ]
      }
   }
}
    },
"mappings":{
   "properties":{
      "source":{
         "type":"text",
          "analyzer" : "simple_arabic",
          "fielddata" : "true",
          "fields":{
            "keyword":{
               "type":"keyword"
            }
         }
      },
      "chapter_no":{
         "type":"integer"
      },
       "chapter":{
         "type":"text",
         "analyzer":"simple_arabic" 
      },
      "hadith":{
         "type":"text",
         "analyzer":"rebuilt_arabic",
         "fielddata":"true",
         "fields" : {
            "nostem":{
               "type":"text",
               "analyzer":"simple_arabic",
               "fielddata":"true"
            },
             "noshingle":{
               "type":"text",
               "analyzer":"noshingle_arabic",
               "fielddata":"true"
             },
             "stem_noshingle":{
               "type":"text",
               "analyzer":"rebuilt",
               "fielddata":"true"
             },
            "keyword":{
               "type":"keyword"
            }
         }
      }
   }
}
}

In [28]:
es.indices.create(index="hadith1",ignore=400)

{'acknowledged': True, 'shards_acknowledged': True, 'index': 'hadith1'}

In [29]:
helpers.bulk(es,index='hadith1', actions=hadit)

(34441, [])

In [33]:
es.indices.create(index="hadith", body = mapping,ignore=400)

{'acknowledged': True, 'shards_acknowledged': True, 'index': 'hadith'}

In [36]:
#Verify creation of the Hadith indices
res= es.indices.get_alias("*")
for nomindex in res:
    print(nomindex)

quran_2
hadith
.ds-ilm-history-5-2021.06.15-000002
hadith1
quran_3
quran_1
.ds-ilm-history-5-2021.04.22-000001
quran


In [35]:
es.reindex({"source": {"index": "hadith1"},"dest": {"index": "hadith"}}, wait_for_completion=True, request_timeout=300)

{'took': 38289,
 'timed_out': False,
 'total': 34441,
 'updated': 0,
 'created': 34441,
 'deleted': 0,
 'batches': 35,
 'version_conflicts': 0,
 'noops': 0,
 'retries': {'bulk': 0, 'search': 0},
 'throttled_millis': 0,
 'requests_per_second': -1.0,
 'throttled_until_millis': 0,
 'failures': []}

# Running different types of queries to test the Hadith search engine : 

In [37]:
query_body = {
  "size":1000,
  "query": {
    "match": {
      "hadith.nostem": {
        "query":"الإيمان"
      }
    }
  }
}

In [38]:
es.search(index="hadith", body=query_body)

{'took': 2475,
 'timed_out': False,
 '_shards': {'total': 1, 'successful': 1, 'skipped': 0, 'failed': 0},
 'hits': {'total': {'value': 160, 'relation': 'eq'},
  'max_score': 9.704867,
  'hits': [{'_index': 'hadith',
    '_type': '_doc',
    '_id': 'FV1pF3oBx2h3PY0xQpC4',
    '_score': 9.704867,
    '_source': {'source': 'سنن الترمذي',
     'chapter_no': '37',
     'chapter': "Chapters on the description of the Day of Judgement, Ar-Riqaq, and Al-Wara' - كتاب صفة القيامة والرقائق والورع عن رسول الله صلى الله",
     'hadith': 'حدثنا عباس بن محمد الدوري، حدثنا عبد الله بن يزيد المقرئ، حدثنا سعيد بن أبي أيوب، عن أبي مرحوم عبد الرحيم بن ميمون، عن سهل بن معاذ بن أنس الجهني، عن أبيه، أن رسول الله صلى الله عليه وسلم قال من ترك اللباس تواضعا لله وهو يقدر عليه دعاه الله يوم القيامة على رءوس الخلائق حتى يخيره من أى حلل الإيمان شاء يلبسها  هذا حديث حسن  ومعنى قوله حلل الإيمان  يعني ما يعطى أهل الإيمان من حلل الجنة '}},
   {'_index': 'hadith',
    '_type': '_doc',
    '_id': 'Zl1pF3oBx2h3PY0xMlT0',


In [17]:
query_body = {
  "size":1000,
  "query": {
    "match": {
      "hadith.nostem": {
        "query":"الحياء"
      }
    }
  }
}

In [18]:
es.search(index="hadith", body=query_body)

{'took': 277,
 'timed_out': False,
 '_shards': {'total': 2, 'successful': 2, 'skipped': 0, 'failed': 0},
 'hits': {'total': {'value': 26, 'relation': 'eq'},
  'max_score': 13.525575,
  'hits': [{'_index': 'hadith',
    '_type': '_doc',
    '_id': 'FUigRHkB-af7drb5NIkC',
    '_score': 13.525575,
    '_source': {'source': 'صحيح البخاري',
     'chapter_no': '78',
     'chapter': 'Good Manners and Form (Al-Adab) - كتاب الأدب',
     'hadith': 'حدثنا آدم، حدثنا شعبة، عن قتادة، عن أبي السوار العدوي، قال سمعت عمران بن حصين، قال قال النبي صلى الله عليه وسلم الحياء لا يأتي إلا بخير فقال بشير بن كعب مكتوب في الحكمة إن من الحياء وقارا، وإن من الحياء سكينة فقال له عمران أحدثك عن رسول الله صلى الله عليه وسلم وتحدثني عن صحيفتك'}},
   {'_index': 'hadith',
    '_type': '_doc',
    '_id': '6EigRHkB-af7drb5fcqJ',
    '_score': 12.74717,
    '_source': {'source': 'سنن الترمذي',
     'chapter_no': '37',
     'chapter': "Chapters on the description of the Day of Judgement, Ar-Riqaq, and Al-Wara' - كتاب صفة 

In [25]:
query_body = {

 "query": {
    "bool": {
      "must": [
        {
        "match": {
                  "source": {"query": "صحيح البخاري",
                                "operator": "and"}
                  
                }
        },
          
        {
          "match": {
                  "chapter": {"query": "كتاب الإيمان",
                                "operator": "and"}
                  
                }
            },
            {
                "match": {
                  "hadith": {"query": "مسلمون",
                                "operator": "and"}
                  
                }
              },
          {
                "match": {
                  "hadith": {"query": "النبيون",
                                "operator": "and"}
                  
                }
              }


      ]
    }
  }
}

In [26]:
es.search(index="hadith", body=query_body)

{'took': 53,
 'timed_out': False,
 '_shards': {'total': 2, 'successful': 2, 'skipped': 0, 'failed': 0},
 'hits': {'total': {'value': 10, 'relation': 'eq'},
  'max_score': 14.40464,
  'hits': [{'_index': 'hadith',
    '_type': '_doc',
    '_id': '70igRHkB-af7drb5D3HP',
    '_score': 14.40464,
    '_source': {'source': 'صحيح البخاري',
     'chapter_no': '2',
     'chapter': 'Belief - كتاب الإيمان',
     'hadith': 'حدثنا آدم بن أبي إياس، قال حدثنا شعبة، عن عبد الله بن أبي السفر، وإسماعيل، عن الشعبي، عن عبد الله بن عمرو رضى الله عنهما عن النبي صلى الله عليه وسلم قال المسلم من سلم المسلمون من لسانه ويده، والمهاجر من هجر ما نهى الله عنه قال أبو عبد الله وقال أبو معاوية حدثنا داود عن عامر قال سمعت عبد الله عن النبي صلى الله عليه وسلم وقال عبد الأعلى عن داود عن عامر عن عبد الله عن النبي صلى الله عليه وسلم'}},
   {'_index': 'hadith',
    '_type': '_doc',
    '_id': 'FUigRHkB-af7drb5D3LP',
    '_score': 13.869284,
    '_source': {'source': 'صحيح البخاري',
     'chapter_no': '2',
     'chapter': 