# Quran Dataset

**This will convert ```holy_quran.json``` to a pandas ```DataFrame()``` (DF).**

In this notebook, some variable names will be in *Arabic* though written in *English*. Here's a glossary of the variable names:

- ```Surah```: Chapter (e.g. The Quran has a total of 114 surahs)
- ```Ayahs```: Verse
- ```Juz```: Part (i.e. The Quran is divided into 30 ayahs)

## Setup

In [1]:
import pandas as pd
import numpy as np
from scipy.stats import mode

import json

# notebook configurations
pd.options.display.max_colwidth = 1000

import warnings
warnings.filterwarnings('ignore')

### 1. Read in ```holy_quran.json```

In [2]:
f = open("data/holy_quran.json", "r", encoding = "utf-8")

In [3]:
data = json.load(f)

In [4]:
data;

### 2. Convert JSON string to pandas object

In [5]:
df = pd.read_json("data/holy_quran.json")

## Quran ```DataFrame()```

In [6]:
surah_lst = []
for chapter in range(0, 114):
    surah_lst.append(df["data"]["surahs"][chapter]["name"])

In [7]:
surah_english_lst = []
for chapter in range(0, 114):
    surah_english_lst.append(df["data"]["surahs"][chapter]["englishName"])

In [8]:
surah_english_translation_lst = []
for chapter in range(0, 114):
    surah_english_translation_lst.append(df["data"]["surahs"][chapter]["englishNameTranslation"])

In [9]:
revelation_type_lst = []
for chapter in range(0, 114):
    revelation_type_lst.append(df["data"]["surahs"][chapter]["revelationType"])

In [10]:
num_ayahs_lst = []
for chapter in range(0, 114):
    num_ayahs_lst.append(len(df["data"]["surahs"][chapter]["ayahs"]))

In [11]:
juz_lst = []
for chapter in range(0, 114):
    surah_juz_lst = []
    for ayah in range(0, len(df["data"]["surahs"][chapter]["ayahs"])):
        surah_juz_lst.append(df["data"]["surahs"][chapter]["ayahs"][ayah]["juz"])
    # calculate the mode (returns the smallest mode if there are multiple modes)
    juz_lst.append(mode(surah_juz_lst)[0][0])

In [12]:
ayahs_lst = []
for chapter in range(0, 114):
    surah_ayahs_lst = []
    for ayah in df["data"]["surahs"][chapter]["ayahs"]:
        surah_ayahs_lst.append(ayah["text"])
    ayahs_lst.append(surah_ayahs_lst)

In [13]:
quran_df = pd.DataFrame({ "surah_no": [i for i in range(1, 115)],
              "surah_name_arabic": surah_lst, 
              "surah_name_english": surah_english_lst,
              "surah_name_english_translation": surah_english_translation_lst,
              "revelation_type": revelation_type_lst,
              "num_ayahs": num_ayahs_lst,
              "juz": juz_lst,
              "ayahs": ayahs_lst
            })

In [14]:
quran_df

Unnamed: 0,surah_no,surah_name_arabic,surah_name_english,surah_name_english_translation,revelation_type,num_ayahs,juz,ayahs
0,1,سُورَةُ ٱلْفَاتِحَةِ,Al-Faatiha,The Opening,Meccan,7,1,"[﻿بِسْمِ ٱللَّهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ, ٱلْحَمْدُ لِلَّهِ رَبِّ ٱلْعَٰلَمِينَ, ٱلرَّحْمَٰنِ ٱلرَّحِيمِ, مَٰلِكِ يَوْمِ ٱلدِّينِ, إِيَّاكَ نَعْبُدُ وَإِيَّاكَ نَسْتَعِينُ, ٱهْدِنَا ٱلصِّرَٰطَ ٱلْمُسْتَقِيمَ, صِرَٰطَ ٱلَّذِينَ أَنْعَمْتَ عَلَيْهِمْ غَيْرِ ٱلْمَغْضُوبِ عَلَيْهِمْ وَلَا ٱلضَّآلِّينَ]"
1,2,سُورَةُ البَقَرَةِ,Al-Baqara,The Cow,Medinan,286,1,"[بِسْمِ ٱللَّهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ الٓمٓ, ذَٰلِكَ ٱلْكِتَٰبُ لَا رَيْبَ ۛ فِيهِ ۛ هُدًۭى لِّلْمُتَّقِينَ, ٱلَّذِينَ يُؤْمِنُونَ بِٱلْغَيْبِ وَيُقِيمُونَ ٱلصَّلَوٰةَ وَمِمَّا رَزَقْنَٰهُمْ يُنفِقُونَ, وَٱلَّذِينَ يُؤْمِنُونَ بِمَآ أُنزِلَ إِلَيْكَ وَمَآ أُنزِلَ مِن قَبْلِكَ وَبِٱلْءَاخِرَةِ هُمْ يُوقِنُونَ, أُو۟لَٰٓئِكَ عَلَىٰ هُدًۭى مِّن رَّبِّهِمْ ۖ وَأُو۟لَٰٓئِكَ هُمُ ٱلْمُفْلِحُونَ, إِنَّ ٱلَّذِينَ كَفَرُوا۟ سَوَآءٌ عَلَيْهِمْ ءَأَنذَرْتَهُمْ أَمْ لَمْ تُنذِرْهُمْ لَا يُؤْمِنُونَ, خَتَمَ ٱللَّهُ عَلَىٰ قُلُوبِهِمْ وَعَلَىٰ سَمْعِهِمْ ۖ وَعَلَىٰٓ أَبْصَٰرِهِمْ غِشَٰوَةٌۭ ۖ وَلَهُمْ عَذَابٌ عَظِيمٌۭ, وَمِنَ ٱلنَّاسِ مَن يَقُولُ ءَامَنَّا بِٱللَّهِ وَبِٱلْيَوْمِ ٱلْءَاخِرِ وَمَا هُم بِمُؤْمِنِينَ, يُخَٰدِعُونَ ٱللَّهَ وَٱلَّذِينَ ءَامَنُوا۟ وَمَا يَخْدَعُونَ إِلَّآ أَنفُسَهُمْ وَمَا يَشْعُرُونَ, فِى قُلُوبِهِم مَّرَضٌۭ فَزَادَهُمُ ٱللَّهُ مَرَضًۭا ۖ وَلَهُمْ عَذَابٌ أَلِيمٌۢ بِمَا كَانُوا۟ يَكْذِبُونَ, وَإِذَا قِيلَ لَهُمْ لَا تُفْسِدُوا۟ فِى ٱلْأَرْضِ قَالُوٓا۟ إِنَّمَا ن..."
2,3,سُورَةُ آلِ عِمۡرَانَ,Aal-i-Imraan,The Family of Imraan,Medinan,200,4,"[بِسْمِ ٱللَّهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ الٓمٓ, ٱللَّهُ لَآ إِلَٰهَ إِلَّا هُوَ ٱلْحَىُّ ٱلْقَيُّومُ, نَزَّلَ عَلَيْكَ ٱلْكِتَٰبَ بِٱلْحَقِّ مُصَدِّقًۭا لِّمَا بَيْنَ يَدَيْهِ وَأَنزَلَ ٱلتَّوْرَىٰةَ وَٱلْإِنجِيلَ, مِن قَبْلُ هُدًۭى لِّلنَّاسِ وَأَنزَلَ ٱلْفُرْقَانَ ۗ إِنَّ ٱلَّذِينَ كَفَرُوا۟ بِـَٔايَٰتِ ٱللَّهِ لَهُمْ عَذَابٌۭ شَدِيدٌۭ ۗ وَٱللَّهُ عَزِيزٌۭ ذُو ٱنتِقَامٍ, إِنَّ ٱللَّهَ لَا يَخْفَىٰ عَلَيْهِ شَىْءٌۭ فِى ٱلْأَرْضِ وَلَا فِى ٱلسَّمَآءِ, هُوَ ٱلَّذِى يُصَوِّرُكُمْ فِى ٱلْأَرْحَامِ كَيْفَ يَشَآءُ ۚ لَآ إِلَٰهَ إِلَّا هُوَ ٱلْعَزِيزُ ٱلْحَكِيمُ, هُوَ ٱلَّذِىٓ أَنزَلَ عَلَيْكَ ٱلْكِتَٰبَ مِنْهُ ءَايَٰتٌۭ مُّحْكَمَٰتٌ هُنَّ أُمُّ ٱلْكِتَٰبِ وَأُخَرُ مُتَشَٰبِهَٰتٌۭ ۖ فَأَمَّا ٱلَّذِينَ فِى قُلُوبِهِمْ زَيْغٌۭ فَيَتَّبِعُونَ مَا تَشَٰبَهَ مِنْهُ ٱبْتِغَآءَ ٱلْفِتْنَةِ وَٱبْتِغَآءَ تَأْوِيلِهِۦ ۗ وَمَا يَعْلَمُ تَأْوِيلَهُۥٓ إِلَّا ٱللَّهُ ۗ وَٱلرَّٰسِخُونَ فِى ٱلْعِلْمِ يَقُولُونَ ءَامَنَّا بِهِۦ كُلٌّۭ مِّنْ عِندِ رَبِّنَا ۗ وَمَا يَذَّكَّرُ إِلَّآ أُو۟لُوا۟ ٱلْأَلْ..."
3,4,سُورَةُ النِّسَاءِ,An-Nisaa,The Women,Medinan,176,5,"[بِسْمِ ٱللَّهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ يَٰٓأَيُّهَا ٱلنَّاسُ ٱتَّقُوا۟ رَبَّكُمُ ٱلَّذِى خَلَقَكُم مِّن نَّفْسٍۢ وَٰحِدَةٍۢ وَخَلَقَ مِنْهَا زَوْجَهَا وَبَثَّ مِنْهُمَا رِجَالًۭا كَثِيرًۭا وَنِسَآءًۭ ۚ وَٱتَّقُوا۟ ٱللَّهَ ٱلَّذِى تَسَآءَلُونَ بِهِۦ وَٱلْأَرْحَامَ ۚ إِنَّ ٱللَّهَ كَانَ عَلَيْكُمْ رَقِيبًۭا, وَءَاتُوا۟ ٱلْيَتَٰمَىٰٓ أَمْوَٰلَهُمْ ۖ وَلَا تَتَبَدَّلُوا۟ ٱلْخَبِيثَ بِٱلطَّيِّبِ ۖ وَلَا تَأْكُلُوٓا۟ أَمْوَٰلَهُمْ إِلَىٰٓ أَمْوَٰلِكُمْ ۚ إِنَّهُۥ كَانَ حُوبًۭا كَبِيرًۭا, وَإِنْ خِفْتُمْ أَلَّا تُقْسِطُوا۟ فِى ٱلْيَتَٰمَىٰ فَٱنكِحُوا۟ مَا طَابَ لَكُم مِّنَ ٱلنِّسَآءِ مَثْنَىٰ وَثُلَٰثَ وَرُبَٰعَ ۖ فَإِنْ خِفْتُمْ أَلَّا تَعْدِلُوا۟ فَوَٰحِدَةً أَوْ مَا مَلَكَتْ أَيْمَٰنُكُمْ ۚ ذَٰلِكَ أَدْنَىٰٓ أَلَّا تَعُولُوا۟, وَءَاتُوا۟ ٱلنِّسَآءَ صَدُقَٰتِهِنَّ نِحْلَةًۭ ۚ فَإِن طِبْنَ لَكُمْ عَن شَىْءٍۢ مِّنْهُ نَفْسًۭا فَكُلُوهُ هَنِيٓـًۭٔا مَّرِيٓـًۭٔا, وَلَا تُؤْتُوا۟ ٱلسُّفَهَآءَ أَمْوَٰلَكُمُ ٱلَّتِى جَعَلَ ٱللَّهُ لَكُمْ قِيَٰمًۭا وَٱرْزُقُوهُمْ فِيهَا وَٱكْسُوهُمْ وَقُو..."
4,5,سُورَةُ المَائـِدَةِ,Al-Maaida,The Table,Medinan,120,6,"[بِسْمِ ٱللَّهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ يَٰٓأَيُّهَا ٱلَّذِينَ ءَامَنُوٓا۟ أَوْفُوا۟ بِٱلْعُقُودِ ۚ أُحِلَّتْ لَكُم بَهِيمَةُ ٱلْأَنْعَٰمِ إِلَّا مَا يُتْلَىٰ عَلَيْكُمْ غَيْرَ مُحِلِّى ٱلصَّيْدِ وَأَنتُمْ حُرُمٌ ۗ إِنَّ ٱللَّهَ يَحْكُمُ مَا يُرِيدُ, يَٰٓأَيُّهَا ٱلَّذِينَ ءَامَنُوا۟ لَا تُحِلُّوا۟ شَعَٰٓئِرَ ٱللَّهِ وَلَا ٱلشَّهْرَ ٱلْحَرَامَ وَلَا ٱلْهَدْىَ وَلَا ٱلْقَلَٰٓئِدَ وَلَآ ءَآمِّينَ ٱلْبَيْتَ ٱلْحَرَامَ يَبْتَغُونَ فَضْلًۭا مِّن رَّبِّهِمْ وَرِضْوَٰنًۭا ۚ وَإِذَا حَلَلْتُمْ فَٱصْطَادُوا۟ ۚ وَلَا يَجْرِمَنَّكُمْ شَنَـَٔانُ قَوْمٍ أَن صَدُّوكُمْ عَنِ ٱلْمَسْجِدِ ٱلْحَرَامِ أَن تَعْتَدُوا۟ ۘ وَتَعَاوَنُوا۟ عَلَى ٱلْبِرِّ وَٱلتَّقْوَىٰ ۖ وَلَا تَعَاوَنُوا۟ عَلَى ٱلْإِثْمِ وَٱلْعُدْوَٰنِ ۚ وَٱتَّقُوا۟ ٱللَّهَ ۖ إِنَّ ٱللَّهَ شَدِيدُ ٱلْعِقَابِ, حُرِّمَتْ عَلَيْكُمُ ٱلْمَيْتَةُ وَٱلدَّمُ وَلَحْمُ ٱلْخِنزِيرِ وَمَآ أُهِلَّ لِغَيْرِ ٱللَّهِ بِهِۦ وَٱلْمُنْخَنِقَةُ وَٱلْمَوْقُوذَةُ وَٱلْمُتَرَدِّيَةُ وَٱلنَّطِيحَةُ وَمَآ أَكَلَ ٱلسَّبُعُ إِلَّا مَا ذَكَّيْتُمْ وَمَا ذُبِحَ ع..."
...,...,...,...,...,...,...,...,...
109,110,سُورَةُ النَّصۡرِ,An-Nasr,Divine Support,Medinan,3,30,"[بِسْمِ ٱللَّهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ إِذَا جَآءَ نَصْرُ ٱللَّهِ وَٱلْفَتْحُ, وَرَأَيْتَ ٱلنَّاسَ يَدْخُلُونَ فِى دِينِ ٱللَّهِ أَفْوَاجًۭا, فَسَبِّحْ بِحَمْدِ رَبِّكَ وَٱسْتَغْفِرْهُ ۚ إِنَّهُۥ كَانَ تَوَّابًۢا]"
110,111,سُورَةُ المَسَدِ,Al-Masad,The Palm Fibre,Meccan,5,30,"[بِسْمِ ٱللَّهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ تَبَّتْ يَدَآ أَبِى لَهَبٍۢ وَتَبَّ, مَآ أَغْنَىٰ عَنْهُ مَالُهُۥ وَمَا كَسَبَ, سَيَصْلَىٰ نَارًۭا ذَاتَ لَهَبٍۢ, وَٱمْرَأَتُهُۥ حَمَّالَةَ ٱلْحَطَبِ, فِى جِيدِهَا حَبْلٌۭ مِّن مَّسَدٍۭ]"
111,112,سُورَةُ الإِخۡلَاصِ,Al-Ikhlaas,Sincerity,Meccan,4,30,"[بِسْمِ ٱللَّهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ قُلْ هُوَ ٱللَّهُ أَحَدٌ, ٱللَّهُ ٱلصَّمَدُ, لَمْ يَلِدْ وَلَمْ يُولَدْ, وَلَمْ يَكُن لَّهُۥ كُفُوًا أَحَدٌۢ]"
112,113,سُورَةُ الفَلَقِ,Al-Falaq,The Dawn,Meccan,5,30,"[بِسْمِ ٱللَّهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ قُلْ أَعُوذُ بِرَبِّ ٱلْفَلَقِ, مِن شَرِّ مَا خَلَقَ, وَمِن شَرِّ غَاسِقٍ إِذَا وَقَبَ, وَمِن شَرِّ ٱلنَّفَّٰثَٰتِ فِى ٱلْعُقَدِ, وَمِن شَرِّ حَاسِدٍ إِذَا حَسَدَ]"


**Nice, the whole Quran is in a official DF.**

### ```quran_df``` Data Cleaning Quran

#### ```surah_name_arabic```

**As seen above, each row in this column starts with the same word: *سُورَةُ (Surah)* which is redundant. For clarity purposes, let's remove that word for each surah.**

In [15]:
quran_df["surah_name_arabic"] = quran_df["surah_name_arabic"].apply(lambda x: " ".join(x.split("سُورَةُ")[1:]))

#### ```ayahs```

**Before each surah, one recites the following:**

                                بِسْمِ ٱللَّهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ
                               
                                   aka Bismillah

**A few things to note about Bismillah:**

***1. An actual verse for سُورَةُ ٱلْفَاتِحَةِ (Surah Al-Faatiha) aka the first chapter in the Quran***

In [16]:
quran_df[quran_df["surah_name_english"] == "Al-Faatiha"]["ayahs"][0][0]

'\ufeffبِسْمِ ٱللَّهِ ٱلرَّحْمَٰنِ ٱلرَّحِيمِ'

***2. One surah (reflected in ```quran_df```) doesn't start with Bismillah***

In [17]:
print(quran_df.iloc[8]["surah_name_arabic"], quran_df.iloc[8]["surah_name_english"], quran_df.iloc[8]["surah_no"])
quran_df.iloc[8]["ayahs"][0]

 التَّوۡبَةِ At-Tawba 9


'بَرَآءَةٌۭ مِّنَ ٱللَّهِ وَرَسُولِهِۦٓ إِلَى ٱلَّذِينَ عَٰهَدتُّم مِّنَ ٱلْمُشْرِكِينَ'

<!--**To make this column accurate as Bismillah isn't the first verse for *113 surahs*, let's make it its own element rather than it being combined with the first verse for the remaining *112 surahs* (see stipulation above).**-->

In [18]:
# convert series object to a list
quran_df["ayahs"] = quran_df["ayahs"].apply(lambda x: [i for i in x])

In [19]:
# fix this

### Export ```quran_df``` 

In [20]:
quran_df.to_csv("data/holy_quran.csv", index = False)