In [1]:
import re

def extract_name(context):
    """Extract name from context based on 'ने' or 'का'"""
    # Look for name before 'ने'
    match = re.search(r'([\u0900-\u097F]+)\s+ने', context)
    if match:
        return match.group(1).strip()
    
    # Fallback: look for name before 'का'
    match = re.search(r'([\u0900-\u097F]+)\s+का', context)
    if match:
        return match.group(1).strip()
    
    # If no match found, try to find any sequence of Devanagari characters
    match = re.search(r'([\u0900-\u097F]+)', context)
    if match:
        return match.group(1).strip()
    
    return None

In [2]:
# print('\u0900-\u097F')
# https://www.utf8-chartable.de/unicode-utf8-table.pl?start=2304&number=128

In [3]:
def extract_location(context):
    """Extract location from context based on 'में', 'पर', or 'से'"""
    match = re.search(r'([\u0900-\u097F]+)\s+(में|पर|से)\s', context)
    if match:
        return match.group(1)
    return None

In [4]:
def extract_date(context):
    """Extract date from context"""
    # Look for four-digit year
    match = re.search(r'(\d{4})', context)
    if match:
        return match.group(1)
    # Look for Hindi month names
    months = "(जनवरी|फ़रवरी|मार्च|अप्रैल|मई|जून|जुलाई|अगस्त|सितंबर|अक्टूबर|नवंबर|दिसंबर)"
    match = re.search(r'([\u0900-\u097F\s]+)\s+' + months, context)
    if match:
        return match.group(0)
    return None

In [5]:
def answer_question(context, question):
    """Simple rule-based answer extraction for Hindi factoid questions"""
    q = question.strip()
    
    if "कौन" in q:
        return extract_name(context)
    elif "कहाँ" in q:
        return extract_location(context)
    elif "कब" in q:
        return extract_date(context)
    else:
        # Fallback: return the first sentence
        sentences = context.split('।')
        if sentences:
            return sentences[0].strip()
    return None

In [6]:
# Example usage
context = "टेस्ला के संस्थापक एलन मस्क ने स्पेसएक्स की स्थापना की।"
questions = [
    "कौन है टेस्ला के संस्थापक?",
    "एलन मस्क ने क्या किया?",
    "स्पेसएक्स की स्थापना किसने की?",
    "टेस्ला का संस्थापक कौन है?",
    "कब टेस्ला की स्थापना हुई?",  # This might not have an answer in the context
    "स्पेसएक्स के संस्थापक कौन हैं?"
]

for q in questions:
    ans = answer_question(context, q)
    print(f"Q: {q}  ->  A: {ans}")

Q: कौन है टेस्ला के संस्थापक?  ->  A: मस्क
Q: एलन मस्क ने क्या किया?  ->  A: टेस्ला के संस्थापक एलन मस्क ने स्पेसएक्स की स्थापना की
Q: स्पेसएक्स की स्थापना किसने की?  ->  A: टेस्ला के संस्थापक एलन मस्क ने स्पेसएक्स की स्थापना की
Q: टेस्ला का संस्थापक कौन है?  ->  A: मस्क
Q: कब टेस्ला की स्थापना हुई?  ->  A: None
Q: स्पेसएक्स के संस्थापक कौन हैं?  ->  A: मस्क


In [7]:
# Example usage
context = "भारत के प्रधानमंत्री नरेंद्र मोदी ने डिजिटल इंडिया कार्यक्रम शुरू किया।"
questions = [
    "कौन है भारत के प्रधानमंत्री?",
    "नरेंद्र मोदी ने क्या किया?",
    "डिजिटल इंडिया कार्यक्रम किसने शुरू किया?",
    "भारत का प्रधानमंत्री कौन है?",
    "कब डिजिटल इंडिया कार्यक्रम शुरू हुआ?"  # This might not have an answer in the context
]

for q in questions:
    ans = answer_question(context, q)
    print(f"Q: {q}  ->  A: {ans}")

Q: कौन है भारत के प्रधानमंत्री?  ->  A: मोदी
Q: नरेंद्र मोदी ने क्या किया?  ->  A: भारत के प्रधानमंत्री नरेंद्र मोदी ने डिजिटल इंडिया कार्यक्रम शुरू किया
Q: डिजिटल इंडिया कार्यक्रम किसने शुरू किया?  ->  A: भारत के प्रधानमंत्री नरेंद्र मोदी ने डिजिटल इंडिया कार्यक्रम शुरू किया
Q: भारत का प्रधानमंत्री कौन है?  ->  A: मोदी
Q: कब डिजिटल इंडिया कार्यक्रम शुरू हुआ?  ->  A: None


In [8]:
# Example usage
context = "भारतीय अंतरिक्ष अनुसंधान संगठन (इसरो) ने मंगल ग्रह की कक्षा में मंगलयान भेजा। यह मिशन 2013 में शुरू किया गया था और 2014 में मंगल की कक्षा में पहुंचा।"
questions = [
    "कौन है इसरो के अध्यक्ष?",  # This might not have an answer in the context
    "इसरो ने क्या किया?",
    "मंगल ग्रह की कक्षा में क्या भेजा गया?",
    "मंगलयान कब शुरू किया गया था?",
    "कब मंगलयान मंगल की कक्षा में पहुंचा?"
]

for q in questions:
    ans = answer_question(context, q)
    print(f"Q: {q}  ->  A: {ans}")

Q: कौन है इसरो के अध्यक्ष?  ->  A: भारतीय
Q: इसरो ने क्या किया?  ->  A: भारतीय अंतरिक्ष अनुसंधान संगठन (इसरो) ने मंगल ग्रह की कक्षा में मंगलयान भेजा
Q: मंगल ग्रह की कक्षा में क्या भेजा गया?  ->  A: भारतीय अंतरिक्ष अनुसंधान संगठन (इसरो) ने मंगल ग्रह की कक्षा में मंगलयान भेजा
Q: मंगलयान कब शुरू किया गया था?  ->  A: 2013
Q: कब मंगलयान मंगल की कक्षा में पहुंचा?  ->  A: 2013


In [9]:
# use train dataset

In [10]:
import pandas as pd

In [11]:
train_df = pd.read_csv('train.csv')
train_df.head()

Unnamed: 0,Domain,Context,Question,Answer
0,kund,भागीरथ कुंड पं. दीन दयाल उपाध्याय रेलवे स्टेशन...,भागीरथ कुंड पं. दीन दयाल उपाध्याय रेलवे स्टेशन...,भागीरथ कुंड पं. दीन दयाल उपाध्याय रेलवे स्टेशन...
1,kund,भागीरथ कुंड पं. दीन दयाल उपाध्याय रेलवे स्टेशन...,भागीरथ कुंड पं. दीन दयाल उपाध्याय रेलवे स्टेशन...,भागीरथ कुंड तक पहुँचने के लिए पं. दीन दयाल उपा...
2,kund,नारद कुंड में रात्रि प्रवास की कोई व्यवस्था नह...,क्या नारद कुंड में रात्रि प्रवास की व्यवस्था है?,"नहीं, नारद कुंड के पास रात्रि प्रवास की व्यवस्..."
3,kund,नारद कुंड में रात्रि प्रवास की कोई व्यवस्था नह...,क्या नारद कुंड में रात्रि प्रवास की व्यवस्था क...,"हाँ, नारद कुंड में रात्रि प्रवास की व्यवस्था क..."
4,kund,नारद कुंड में रात्रि प्रवास की कोई व्यवस्था नह...,नारद कुंड में रात्रि प्रवास कहाँ करना होता है?,नारद कुंड में रात्रि प्रवास की व्यवस्था नहीं ह...


In [12]:
answers = []
for context, question in zip(train_df['Context'],train_df['Question']):
    answer = answer_question(context, question)
    answers.append(answer)

In [13]:
train_df['Extracted Answer'] = answers

In [14]:
train_df.head()

Unnamed: 0,Domain,Context,Question,Answer,Extracted Answer
0,kund,भागीरथ कुंड पं. दीन दयाल उपाध्याय रेलवे स्टेशन...,भागीरथ कुंड पं. दीन दयाल उपाध्याय रेलवे स्टेशन...,भागीरथ कुंड पं. दीन दयाल उपाध्याय रेलवे स्टेशन...,भागीरथ कुंड पं. दीन दयाल उपाध्याय रेलवे स्टेशन...
1,kund,भागीरथ कुंड पं. दीन दयाल उपाध्याय रेलवे स्टेशन...,भागीरथ कुंड पं. दीन दयाल उपाध्याय रेलवे स्टेशन...,भागीरथ कुंड तक पहुँचने के लिए पं. दीन दयाल उपा...,भागीरथ कुंड पं. दीन दयाल उपाध्याय रेलवे स्टेशन...
2,kund,नारद कुंड में रात्रि प्रवास की कोई व्यवस्था नह...,क्या नारद कुंड में रात्रि प्रवास की व्यवस्था है?,"नहीं, नारद कुंड के पास रात्रि प्रवास की व्यवस्...",नारद कुंड में रात्रि प्रवास की कोई व्यवस्था नह...
3,kund,नारद कुंड में रात्रि प्रवास की कोई व्यवस्था नह...,क्या नारद कुंड में रात्रि प्रवास की व्यवस्था क...,"हाँ, नारद कुंड में रात्रि प्रवास की व्यवस्था क...",नारद कुंड में रात्रि प्रवास की कोई व्यवस्था नह...
4,kund,नारद कुंड में रात्रि प्रवास की कोई व्यवस्था नह...,नारद कुंड में रात्रि प्रवास कहाँ करना होता है?,नारद कुंड में रात्रि प्रवास की व्यवस्था नहीं ह...,कुंड


In [15]:
# F1-Score

def calculate_f1_score(train_df):
    # Calculate TP, FP, FN
    tp = 0
    fp = 0
    fn = 0
    tn = 0

    for index, row in train_df.iterrows():
        answer = row["Answer"]
        extracted_answer = row["Extracted Answer"]

        if answer == extracted_answer:
            tp += 1
        else:
            fp += 1
            fn += 1

    # Calculate precision, recall, f1 score
    precision = tp / (tp + fp) if tp + fp > 0 else 0
    recall = tp / (tp + fn) if tp + fn > 0 else 0
    f1_score = 2 * (precision * recall) / (precision + recall) if precision + recall > 0 else 0

    return precision, recall, f1_score

precision, recall, f1_score = calculate_f1_score(train_df)

print("Precision:", precision)
print("Recall:", recall)
print("F1 Score:", f1_score)

Precision: 7.638252367858234e-05
Recall: 7.638252367858234e-05
F1 Score: 7.638252367858234e-05


In [16]:
import numpy as np
def calculate_f1_score_token_level(train_df):
    # Calculate F1 score at token level
    f1_scores = []

    for index, row in train_df.iterrows():
        if row["Answer"] == None or row["Extracted Answer"] == None:
            f1_scores.append(0)
            continue
                    
        answer = set(row["Answer"].split())
        extracted_answer = set(row["Extracted Answer"].split())

        tp = len(answer & extracted_answer)
        fp = len(extracted_answer - answer)
        fn = len(answer - extracted_answer)

        precision = tp / (tp + fp) if tp + fp > 0 else 0
        recall = tp / (tp + fn) if tp + fn > 0 else 0
        f1 = 2 * (precision * recall) / (precision + recall) if precision + recall > 0 else 0

        f1_scores.append(f1)

    return np.mean(f1_scores)

f1_score = calculate_f1_score_token_level(train_df)

print("F1 Score:", f1_score)

F1 Score: 0.5558945695203378


In [17]:
import nltk
from nltk.translate.bleu_score import sentence_bleu
from nltk.tokenize import word_tokenize
from rouge_score import rouge_scorer

In [18]:
# Download required NLTK data
nltk.download('punkt')

[nltk_data] Downloading package punkt to
[nltk_data]     C:\Users\Ankur\AppData\Roaming\nltk_data...
[nltk_data]   Package punkt is already up-to-date!


True

In [19]:
# BLEU SCORE

def calculate_bleu_score(candidate, reference):
    # Tokenize the sentences
    candidate_tokens = word_tokenize(candidate)
    reference_tokens = [word_tokenize(reference)]

    # Calculate the BLEU score
    bleu_score = sentence_bleu(reference_tokens, candidate_tokens)

    return bleu_score

def calculate_bleu_score_overall(train_df):
    # Calculate BLEU score 
    bleu_scores = []

    for index, row in train_df.iterrows():
        
        answer = row["Answer"]
        extracted_answer = row["Extracted Answer"]
        # print(answer, extracted_answer)
        if extracted_answer == None:
            continue
        bleu_scores.append(calculate_bleu_score(answer, extracted_answer))
    
    return np.mean(bleu_scores)

bleu_score = calculate_bleu_score_overall(train_df)

print("BLEU Score:", bleu_score)

The hypothesis contains 0 counts of 2-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 3-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()
The hypothesis contains 0 counts of 4-gram overlaps.
Therefore the BLEU score evaluates to 0, independently of
how many N-gram overlaps of lower order it contains.
Consider using lower n-gram order or use SmoothingFunction()


BLEU Score: 0.37607410261247876


In [20]:
# ROUGE-L Score

# !pip install nltk rouge_score

In [21]:
# ROUGE-L Score

def calculate_rouge_l_score(candidate, reference):
    # Initialize the ROUGE scorer
    scorer = rouge_scorer.RougeScorer(['rougeL'], use_stemmer=True)

    # Calculate the ROUGE-L score
    scores = scorer.score(candidate, reference)

    return scores['rougeL'].fmeasure

def calculate_rouge_l_score_overall(train_df):
    # Calculate ROUGE-L score 
    rouge_l_scores = []

    for index, row in train_df.iterrows():
        
        answer = row["Answer"]
        extracted_answer = row["Extracted Answer"]
        # print(answer, extracted_answer)
        if extracted_answer == None:
            continue
        rouge_l_scores.append(calculate_rouge_l_score(answer, extracted_answer))
    
    return np.mean(rouge_l_scores)

rouge_l_score = calculate_rouge_l_score_overall(train_df)

print("ROUGE-L Score:", rouge_l_score)

ROUGE-L Score: 0.22864284636635954


In [22]:
# Define the candidate and reference texts
candidate_text = "मणिकर्णिका चक्र पुष्करणीय कुंड बनारस रेलवे स्टेशन से 9.2 किलोमीटर दूर है।"
reference_text = "मणिकर्णिका चक्र पुष्करणीय कुंड बनारस रेलवे स्टेशन से लगभग 9.2 किलोमीटर दूर है।"

# Calculate the BLEU score and ROUGE-L score
bleu_score = calculate_bleu_score(candidate_text, reference_text)
rouge_l_score = calculate_rouge_l_score(candidate_text, reference_text)

print(f"BLEU Score: {bleu_score}")
print(f"ROUGE-L Score: {rouge_l_score}")

BLEU Score: 0.7677331684336531
ROUGE-L Score: 1.0
