In [1]:
import json

data_filepath = './UQAD.json'

# Read JSON data from a file
with open(data_filepath, 'r', encoding='utf-8') as file:
    data = json.load(file)

In [2]:
def parse_data(data):
    parsed_result = {}
    
    for key in data:
        # Initialize a dictionary for each key
        parsed_result[key] = {}
        
        # Extract the context for the key (if exists)
        parsed_result[key]['context'] = data[key].get('context', 'No context provided')
        
        # Extract and structure questions and their answers
        questions = data[key].get('question', {})
        parsed_result[key]['questions'] = []
        
        for qid, qinfo in questions.items():
            # Extract the question text
            question = qinfo.get('question', 'No question provided')
            
            # Extract all possible answers for the question
            answers = qinfo.get('answer', {})
            answer_list = {ans_id: answer for ans_id, answer in answers.items()}
            
            # Add the question and its answers to the result
            parsed_result[key]['questions'].append({
                'question_id': qid,
                'question': question,
                'answers': answer_list
            })
    
    return parsed_result


In [3]:
data = parse_data(data)

In [4]:
print(f"Number of passages: {len(data)}")
print(f"Number of questions: {sum([len(data[key]['questions']) for key in data])}")

Number of passages: 27
Number of questions: 139


In [5]:
data["1"]

{'context': 'خلافت راشدہ کے چوتھے خلیفہ اور اہل تشیع کے پہلے امام علی بن ابی طالب پر خارجی ابن ملجم نے 26 جنوری 661ء بمطابق 19 رمضان، 40ھ کو کوفہ کی مسجد میں زہر آلود تلوار کے ذریعہ نماز کے دوران میں قاتلانہ حملہ کیا۔ اس حملہ کی وجہ سے علی زخمی ہوئے، اگلے دو دن تک آپ زندہ رہے لیکن زخم گہرا تھا، چنانچہ جانبر نہ ہو سکے اور 21 رمضان 40ھ کو وفات پائی۔ آپ تیسرے خلیفہ تھے جن کو خلافت کے دوران میں قتل کیا گیا، آپ سے پہلے عمر بن خطاب اور عثمان بن عفان کو قتل کیا جا چکا تھا۔',
 'questions': [{'question_id': '0',
   'question': 'خلافت راشدہ کے چوتھے خلیفہ کون تھے؟ ',
   'answers': {'0': 'امام علی بن ابی طالب',
    '1': 'حضرت علی رضي الله عنه',
    '2': 'حضرت علی'}},
  {'question_id': '1',
   'question': 'اہل تشیع کے پہلے امام کون تھے؟ ',
   'answers': {'0': 'امام علی بن ابی طالب',
    '1': 'حضرت علی رضي الله عنه',
    '2': 'حضرت علی'}},
  {'question_id': '2',
   'question': 'حضرت علی پر نماز کے دوران قاتلانہ حملہ کس نے کیا۔  ',
   'answers': {'0': 'خارجی ابن ملجم',
    '1': 'خارجی ابن ملجم',
   