In [1]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


In [3]:
import requests
import json
import pandas as pd
import csv
import re

# Membaca file madaniyah.csv untuk mendapatkan nomor surah
madaniyah_chapters = []
with open('/content/drive/MyDrive/google-quran-translate-evaluation/madaniyah.csv', 'r') as file:
    csv_reader = csv.reader(file)
    next(csv_reader)  # Melewati header
    for row in csv_reader:
        madaniyah_chapters.append(int(row[1]))

# Dictionary untuk menyimpan semua DataFrame
dfs = {}

# Melakukan request untuk setiap chapter di madaniyah.csv
for chapter in madaniyah_chapters:
    # URL untuk chapter yang sedang diproses
    url = f"https://api.qurancdn.com/api/v4/verses/by_chapter/{chapter}?language=id&translations=33,134&words=0&fields=text_uthmani&per_page=300"

    # Melakukan request ke API
    response = requests.get(url)

    # Memeriksa apakah request berhasil
    if response.status_code == 200:
        # Parse JSON response
        data = response.json()

        # Membuat list untuk menyimpan data
        arab_texts = []
        king_fahd_texts = []
        kemenag_texts = []
        verse_number = []

        # Mengekstrak data yang dibutuhkan
        for verse in data['verses']:
            # Mengambil teks Arab
            arab_texts.append(verse['text_uthmani'])

            # Mengambil verse key (nomor ayat)
            verse_number.append(verse['verse_number'])

            # Mengambil terjemahan
            for translation in verse['translations']:
                if translation['resource_id'] == 134:
                    # Membersihkan superscript footnote dari teks King Fahd
                    clean_text = re.sub(r'<sup foot_note=\d+>\d+</sup>', '', translation['text'])
                    king_fahd_texts.append(clean_text)
                elif translation['resource_id'] == 33:
                    # Membersihkan superscript footnote dari teks Kemenag
                    clean_text = re.sub(r'<sup foot_note=\d+>\d+</sup>', '', translation['text'])
                    kemenag_texts.append(clean_text)

        # Membuat DataFrame
        df_arab = pd.DataFrame({
            'verse_number': verse_number,
            'arab': arab_texts
        })

        df_kingfahd = pd.DataFrame({
            'verse_number': verse_number,
            'king_fahd': king_fahd_texts
        })

        df_kemenag = pd.DataFrame({
            'verse_number': verse_number,
            'kemenag': kemenag_texts
        })

        # Menampilkan informasi sebelum menyimpan
        print(f"Chapter {chapter}: {len(verse_number)} verses processed")

        # Menyimpan DataFrame ke file CSV
        df_arab.to_excel(f'/content/drive/MyDrive/google-quran-translate-evaluation/data/arab/chapter_{chapter}.xlsx', index=False)
        df_kingfahd.to_csv(f'/content/drive/MyDrive/google-quran-translate-evaluation/data/king_fahd/chapter_{chapter}.csv', index=False)
        df_kemenag.to_csv(f'/content/drive/MyDrive/google-quran-translate-evaluation/data/kemenag/chapter_{chapter}.csv', index=False)

        print(f"Chapter {chapter} saved successfully")


Chapter 2: 286 verses processed
Chapter 2 saved successfully
Chapter 3: 200 verses processed
Chapter 3 saved successfully
Chapter 4: 176 verses processed
Chapter 4 saved successfully
Chapter 5: 120 verses processed
Chapter 5 saved successfully
Chapter 9: 129 verses processed
Chapter 9 saved successfully
Chapter 24: 64 verses processed
Chapter 24 saved successfully
Chapter 33: 73 verses processed
Chapter 33 saved successfully
Chapter 47: 38 verses processed
Chapter 47 saved successfully
Chapter 48: 29 verses processed
Chapter 48 saved successfully
Chapter 49: 18 verses processed
Chapter 49 saved successfully
Chapter 57: 29 verses processed
Chapter 57 saved successfully
Chapter 58: 22 verses processed
Chapter 58 saved successfully
Chapter 59: 24 verses processed
Chapter 59 saved successfully
Chapter 60: 13 verses processed
Chapter 60 saved successfully
Chapter 61: 14 verses processed
Chapter 61 saved successfully
Chapter 62: 11 verses processed
Chapter 62 saved successfully
Chapter 63: 1

In [6]:
df_arab = pd.read_excel('/content/drive/MyDrive/google-quran-translate-evaluation/data/arab/chapter_2.xlsx')
df_kemenag = pd.read_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/kemenag/chapter_2.csv')
df_kingfahd = pd.read_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/king_fahd/chapter_2.csv')

df_arab.head()

Unnamed: 0,verse_number,arab
0,1,الٓمٓ
1,2,ذَٰلِكَ ٱلْكِتَـٰبُ لَا رَيْبَ ۛ فِيهِ ۛ هُدًى...
2,3,ٱلَّذِينَ يُؤْمِنُونَ بِٱلْغَيْبِ وَيُقِيمُونَ...
3,4,وَٱلَّذِينَ يُؤْمِنُونَ بِمَآ أُنزِلَ إِلَيْك...
4,5,أُو۟لَـٰٓئِكَ عَلَىٰ هُدًى مِّن رَّبِّهِمْ ۖ و...


In [7]:
df_kemenag.head()

Unnamed: 0,verse_number,kemenag
0,1,Alif Lām Mīm.
1,2,Kitab (Alquran) ini tidak ada keraguan padanya...
2,3,"(Yaitu) mereka yang beriman kepada yang gaib, ..."
3,4,dan mereka beriman kepada (Alquran) yang ditur...
4,5,Merekalah yang mendapat petunjuk dari Tuhannya...


In [8]:
df_kingfahd.head()

Unnamed: 0,verse_number,king_fahd
0,1,Alif Lām Mīm.
1,2,Kitab (Al-Qur`ān) ini tidak ada keraguan padan...
2,3,"(yaitu) mereka yang beriman kepada yang gaib, ..."
3,4,dan mereka yang beriman kepada Kitab (Al-Qur`ā...
4,5,Mereka itulah yang tetap mendapat petunjuk dar...


In [9]:
df_translated = {}

for chapter in madaniyah_chapters:
    df = pd.read_excel(f'/content/drive/MyDrive/google-quran-translate-evaluation/data/arab_translated/chapter_{chapter}.xlsx')
    df_translated[chapter] = df

In [10]:
df_translated[2]

Unnamed: 0,nomor_ayat,Arab
0,1,nyeri
1,2,Kitab ini tidak ada keraguan padanya; petunju...
2,3,"Orang-orang yang beriman kepada yang gaib, me..."
3,4,Dan orang-orang yang beriman kepada kitab yan...
4,5,Mereka itulah yang mendapat petunjuk dari Tuh...
...,...,...
281,282,"Hai orang-orang yang beriman, jika kamu beruta..."
282,283,۞ Dan jika kamu dalam perjalanan dan tidak men...
283,284,Kepunyaan Allah-lah apa yang ada di langit da...
284,285,Rasulullah telah beriman kepada apa yang ditur...


In [11]:
print(df_translated[2].columns)

Index(['nomor_ayat', ' Arab'], dtype='object')


In [12]:
for chapter in df_translated:
    df_translated[chapter] = df_translated[chapter].rename(columns={' Arab': 'google_translate'})

df_translated[2]

Unnamed: 0,nomor_ayat,google_translate
0,1,nyeri
1,2,Kitab ini tidak ada keraguan padanya; petunju...
2,3,"Orang-orang yang beriman kepada yang gaib, me..."
3,4,Dan orang-orang yang beriman kepada kitab yan...
4,5,Mereka itulah yang mendapat petunjuk dari Tuh...
...,...,...
281,282,"Hai orang-orang yang beriman, jika kamu beruta..."
282,283,۞ Dan jika kamu dalam perjalanan dan tidak men...
283,284,Kepunyaan Allah-lah apa yang ada di langit da...
284,285,Rasulullah telah beriman kepada apa yang ditur...


In [14]:
for chapter, df in df_translated.items():
    df.to_csv(f'/content/drive/MyDrive/google-quran-translate-evaluation/data/google_translate/chapter_{chapter}.csv', index=False)

In [15]:
df_google_translate = pd.read_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/google_translate/chapter_2.csv')
df_google_translate.head()

Unnamed: 0,nomor_ayat,google_translate
0,1,nyeri
1,2,Kitab ini tidak ada keraguan padanya; petunju...
2,3,"Orang-orang yang beriman kepada yang gaib, me..."
3,4,Dan orang-orang yang beriman kepada kitab yan...
4,5,Mereka itulah yang mendapat petunjuk dari Tuh...


In [16]:
google_2 = pd.read_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/google_translate/chapter_2.csv')
google_3 = pd.read_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/google_translate/chapter_3.csv')

kemenag_2 = pd.read_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/kemenag/chapter_2.csv')
kemenag_3 = pd.read_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/kemenag/chapter_3.csv')

king_fahd_2 = pd.read_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/king_fahd/chapter_2.csv')
king_fahd_3 = pd.read_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/king_fahd/chapter_3.csv')

google_2 = google_2.drop([0])
google_2 = google_2.reset_index(drop=True)

google_3 = google_3.drop([0])
google_3 = google_3.reset_index(drop=True)

kemenag_2 = kemenag_2.drop([0])
kemenag_2 = kemenag_2.reset_index(drop=True)

kemenag_3 = kemenag_3.drop([0])
kemenag_3 = kemenag_3.reset_index(drop=True)

king_fahd_2 = king_fahd_2.drop([0])
king_fahd_2 = king_fahd_2.reset_index(drop=True)

king_fahd_3 = king_fahd_3.drop([0])
king_fahd_3 = king_fahd_3.reset_index(drop=True)

In [17]:
google_2

Unnamed: 0,nomor_ayat,google_translate
0,2,Kitab ini tidak ada keraguan padanya; petunju...
1,3,"Orang-orang yang beriman kepada yang gaib, me..."
2,4,Dan orang-orang yang beriman kepada kitab yan...
3,5,Mereka itulah yang mendapat petunjuk dari Tuh...
4,6,"Sesungguhnya orang-orang kafir, sama saja bag..."
...,...,...
280,282,"Hai orang-orang yang beriman, jika kamu beruta..."
281,283,۞ Dan jika kamu dalam perjalanan dan tidak men...
282,284,Kepunyaan Allah-lah apa yang ada di langit da...
283,285,Rasulullah telah beriman kepada apa yang ditur...


In [18]:
google_3

Unnamed: 0,nomor_ayat,google_translate
0,2,"Allah, tidak ada Tuhan melainkan Dia, Yang Ma..."
1,3,"Dia telah menurunkan kepadamu, [Muhammad], Ki..."
2,4,"Sebelumnya, sebagai petunjuk bagi umat manusi..."
3,5,Tidak ada sesuatu pun yang tersembunyi bagi A...
4,6,Dialah yang membentuk kamu dalam rahim sesuai ...
...,...,...
194,196,Janganlah kamu tertipu oleh gerakan orang-ora...
195,197,"Kenikmatan yang sesaat, kemudian tempat kemba..."
196,198,Tetapi orang-orang yang bertakwa kepada Tuhan ...
197,199,Dan sesungguhnya di antara Ahli Kitab ada ora...


In [19]:
google_2.to_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/google_translate/chapter_2.csv', index=False)
google_3.to_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/google_translate/chapter_3.csv', index=False)

kemenag_2.to_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/kemenag/chapter_2.csv', index=False)
kemenag_3.to_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/kemenag/chapter_3.csv', index=False)

king_fahd_2.to_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/king_fahd/chapter_2.csv', index=False)
king_fahd_3.to_csv('/content/drive/MyDrive/google-quran-translate-evaluation/data/king_fahd/chapter_3.csv', index=False)