In [None]:
!pip install spacy
!pip install indic-nlp-library
!pip install deep-translator


Collecting indic-nlp-library
  Downloading indic_nlp_library-0.92-py3-none-any.whl.metadata (5.7 kB)
Collecting sphinx-argparse (from indic-nlp-library)
  Downloading sphinx_argparse-0.5.2-py3-none-any.whl.metadata (3.7 kB)
Collecting sphinx-rtd-theme (from indic-nlp-library)
  Downloading sphinx_rtd_theme-3.0.2-py2.py3-none-any.whl.metadata (4.4 kB)
Collecting morfessor (from indic-nlp-library)
  Downloading Morfessor-2.0.6-py3-none-any.whl.metadata (628 bytes)
Collecting sphinxcontrib-jquery<5,>=4 (from sphinx-rtd-theme->indic-nlp-library)
  Downloading sphinxcontrib_jquery-4.1-py2.py3-none-any.whl.metadata (2.6 kB)
Downloading indic_nlp_library-0.92-py3-none-any.whl (40 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m40.3/40.3 kB[0m [31m1.4 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading Morfessor-2.0.6-py3-none-any.whl (35 kB)
Downloading sphinx_argparse-0.5.2-py3-none-any.whl (12 kB)
Downloading sphinx_rtd_theme-3.0.2-py2.py3-none-any.whl (7.7 MB)
[2K   [90m━

In [None]:
def load_grammar_rules(file_path):
    """
    Load grammar rules from a text file in the format:
    incorrect: <text> correct: <text>

    Args:
        file_path (str): Path to the grammar_rule.text file.
    Returns:
        dict: A dictionary of incorrect-to-correct mappings.
    """
    rules = {}
    with open(file_path, 'r', encoding='utf-8') as file:
        for line in file:
            if line.startswith("incorrect:") and "correct:" in line:
                parts = line.strip().split(" correct:")
                incorrect = parts[0].replace("incorrect:", "").strip()
                correct = parts[1].strip()
                rules[incorrect] = correct
    return rules


def correct_grammar(sentence, grammar_rules):
    """
    Correct grammar in a Sinhala sentence based on rules.

    Args:
        sentence (str): The input Sinhala sentence.
        grammar_rules (dict): A dictionary of incorrect-to-correct mappings.
    Returns:
        str: Corrected sentence or a message if no correction is needed.
    """
    corrections = []

    # Match sentence against grammar rules
    for incorrect, correct in grammar_rules.items():
        if incorrect in sentence:
            corrections.append((incorrect, correct))

    if corrections:
        result = f"Sentence: '{sentence}'\n"
        for incorrect, correct in corrections:
            result += f" - Suggestion: Replace '{incorrect}' with '{correct}'\n"
        return result.strip()
    return f"Sentence: '{sentence}' -> No grammar errors detected"


# Example usage
def main():
    file_path = "/content/grammar_dataset.txt"

    # Load rules
    grammar_rules = load_grammar_rules(file_path)

    # Sentences for testing
    test_sentences = [
        "ඔවුන් යනවා.",
        "මම පොතක් මිලදී ගත්තා.",
        "ඔහු ඉක්මනින් ගමනක් කළා.",
        "අපි පාසල් යනවා.",
        "මම ගෙදර යමි.",
        "අපි පාසල් යමු.",
    ]

    for sentence in test_sentences:
        print(correct_grammar(sentence, grammar_rules))


if __name__ == "__main__":
    main()


Sentence: 'ඔවුන් යනවා.'
 - Suggestion: Replace 'ඔවුන් යනවා.' with 'ඔවුන් යති.'
Sentence: 'මම පොතක් මිලදී ගත්තා.'
 - Suggestion: Replace 'මම පොතක් මිලදී ගත්තා.' with 'මම පොතක් මිලදී ගත්තෙමි.'
Sentence: 'ඔහු ඉක්මනින් ගමනක් කළා.'
 - Suggestion: Replace 'ඔහු ඉක්මනින් ගමනක් කළා.' with 'ඔහු ඉක්මනින් ගමන් කලේය.'
Sentence: 'අපි පාසල් යනවා.'
 - Suggestion: Replace 'අපි පාසල් යනවා.' with 'අපි පාසල් යමු.'
Sentence: 'මම ගෙදර යමි.' -> No grammar errors detected
Sentence: 'අපි පාසල් යමු.' -> No grammar errors detected


In [None]:
def evaluate_grammar_checker(grammar_rules, test_data):
    """
    Evaluate the grammar checker by comparing its output to the expected results.

    Args:
        grammar_rules (dict): Dictionary of incorrect-to-correct mappings.
        test_data (list): List of tuples (input_sentence, expected_output).

    Returns:
        dict: A dictionary with accuracy metrics and detailed results.
    """
    total = len(test_data)
    correct_count = 0
    incorrect_count = 0
    detailed_results = []

    for input_sentence, expected_output in test_data:
        # Get the actual output from the grammar checker
        actual_output = correct_grammar(input_sentence, grammar_rules)

        # Check if the actual output matches the expected output
        if actual_output.strip() == expected_output.strip():
            correct_count += 1
            detailed_results.append((input_sentence, expected_output, actual_output, "Correct"))
        else:
            incorrect_count += 1
            detailed_results.append((input_sentence, expected_output, actual_output, "Incorrect"))

    accuracy = (correct_count / total) * 100

    return {
        "accuracy": accuracy,
        "total": total,
        "correct": correct_count,
        "incorrect": incorrect_count,
        "details": detailed_results,
    }


# Example usage
def main():
    file_path = "/content/grammar_dataset.txt"

    # Load grammar rules
    grammar_rules = load_grammar_rules(file_path)

    # Test data: (input_sentence, expected_output)
    test_data = [
        (
            "ඔවුන් යනවා.",
            "Sentence: 'ඔවුන් යනවා.'\n - Suggestion: Replace 'ඔවුන් යනවා.' with 'ඔවුන් යති.'",
        ),
        (
            "මම මම බත් කමු.",
            "Sentence: 'මම මම බත් කමු.'\n - Suggestion: Replace 'මම බත් කමු.' with 'මම බත් කමි..",
        ),
        (
            "ඔහු ඉක්මනින් ගමනක් කළා.",
            "Sentence: 'ඔහු ඉක්මනින් ගමනක් කළා.'\n - Suggestion: Replace 'ඔහු ඉක්මනින් ගමනක් කළා.' with 'ඔහු ඉක්මනින් ගමන් කලේය.'",
        ),
        (
            "අපි පාසල් යනවා.",
            "Sentence: 'අපි පාසල් යනවා.'\n - Suggestion: Replace 'අපි පාසල් යනවා.' with 'අපි පාසල් යමු.'",
        ),
        (
            "මම ගෙදර යමි.",
            "Sentence: 'මම ගෙදර යමි.' -> No grammar errors detected",
        ),
        (
            "අපි පාසල් යමු.",
            "Sentence: 'අපි පාසල් යමු.' -> No grammar errors detected",
        ),
    ]

    # Evaluate grammar checker
    results = evaluate_grammar_checker(grammar_rules, test_data)

    # Print accuracy
    print(f"Accuracy: {results['accuracy']}%")
    print(f"Total Sentences: {results['total']}")
    print(f"Correctly Matched: {results['correct']}")
    print(f"Incorrectly Matched: {results['incorrect']}\n")

    # Detailed results
    print("Detailed Results:")
    for original, expected, actual, status in results["details"]:
        print(f"Original: {original}")
        print(f"Expected Output: {expected}")
        print(f"Actual Output: {actual}")
        print(f"Status: {status}")
        print("-" * 50)


if __name__ == "__main__":
    main()


Accuracy: 83.33333333333334%
Total Sentences: 6
Correctly Matched: 5
Incorrectly Matched: 1

Detailed Results:
Original: ඔවුන් යනවා.
Expected Output: Sentence: 'ඔවුන් යනවා.'
 - Suggestion: Replace 'ඔවුන් යනවා.' with 'ඔවුන් යති.'
Actual Output: Sentence: 'ඔවුන් යනවා.'
 - Suggestion: Replace 'ඔවුන් යනවා.' with 'ඔවුන් යති.'
Status: Correct
--------------------------------------------------
Original: මම මම බත් කමු.
Expected Output: Sentence: 'මම මම බත් කමු.'
 - Suggestion: Replace 'මම බත් කමු.' with 'මම බත් කමි..
Actual Output: Sentence: 'මම මම බත් කමු.' -> No grammar errors detected
Status: Incorrect
--------------------------------------------------
Original: ඔහු ඉක්මනින් ගමනක් කළා.
Expected Output: Sentence: 'ඔහු ඉක්මනින් ගමනක් කළා.'
 - Suggestion: Replace 'ඔහු ඉක්මනින් ගමනක් කළා.' with 'ඔහු ඉක්මනින් ගමන් කලේය.'
Actual Output: Sentence: 'ඔහු ඉක්මනින් ගමනක් කළා.'
 - Suggestion: Replace 'ඔහු ඉක්මනින් ගමනක් කළා.' with 'ඔහු ඉක්මනින් ගමන් කලේය.'
Status: Correct
------------------------------