<a href="https://colab.research.google.com/github/Thishanth11/AI_Grammar_checker/blob/main/Grammer_checker_Rule_based_2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
!pip install indic-nlp-library pyspellchecker

from indicnlp.tokenize import indic_tokenize
from spellchecker import SpellChecker

# Tokenizer for Tamil text
def tokenize_tamil_text(text):
    return list(indic_tokenize.trivial_tokenize(text, lang='ta'))

# Function to detect and correct Word Order Issues
def check_word_order(sentence):
    words = tokenize_tamil_text(sentence)
    if "நான்" in words and words.index("நான்") > words.index("புத்தகம்"):
        corrected = " ".join(["நான்", "புத்தகம்", "வாங்கினேன்."])
        return corrected
    return sentence

Collecting indic-nlp-library
  Downloading indic_nlp_library-0.92-py3-none-any.whl.metadata (5.7 kB)
Collecting pyspellchecker
  Downloading pyspellchecker-0.8.2-py3-none-any.whl.metadata (9.4 kB)
Collecting sphinx-argparse (from indic-nlp-library)
  Downloading sphinx_argparse-0.5.2-py3-none-any.whl.metadata (3.7 kB)
Collecting sphinx-rtd-theme (from indic-nlp-library)
  Downloading sphinx_rtd_theme-3.0.2-py2.py3-none-any.whl.metadata (4.4 kB)
Collecting morfessor (from indic-nlp-library)
  Downloading Morfessor-2.0.6-py3-none-any.whl.metadata (628 bytes)
Collecting sphinxcontrib-jquery<5,>=4 (from sphinx-rtd-theme->indic-nlp-library)
  Downloading sphinxcontrib_jquery-4.1-py2.py3-none-any.whl.metadata (2.6 kB)
Downloading indic_nlp_library-0.92-py3-none-any.whl (40 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m40.3/40.3 kB[0m [31m2.9 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading pyspellchecker-0.8.2-py3-none-any.whl (7.1 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━

In [2]:
# Function to check and correct Subject-Verb Agreement Errors
def check_subject_verb_agreement(sentence):
    corrections = {
        "அவன் பள்ளி போகிறார்கள்": "அவன் பள்ளி போகிறான்",
        "அவள் பள்ளி போகிறான்": "அவள் பள்ளி போகிறாள்",
        "அவர்கள் பள்ளி போகிறான்": "அவர்கள் பள்ளி போகிறார்கள்"
    }
    return corrections.get(sentence, sentence)


In [9]:
# Combined grammar checker
def grammar_checker(sentence):
    step_1 = check_word_order(sentence)
    step_2 = check_subject_verb_agreement(step_1)
    return step_2

# Spell checker for Tamil
spell = SpellChecker(language=None)
spell.word_frequency.load_words(['நான்', 'புத்தகம்', 'வாங்கினேன்', 'அவன்', 'போகிறான்', 'பார்த்து', 'வாங்கினேன', 'அவள்', 'போகிறார்கள்']) # Added potentially misspelled words to the dictionary

def check_spelling(sentence):
    words = tokenize_tamil_text(sentence)
    corrected_words = [spell.correction(word) or word for word in words]
    return " ".join(corrected_words)

In [10]:
# Full pipeline for user input
def evaluate_sentence(sentence):
    # Step 1: Correct spelling
    spell_corrected = check_spelling(sentence)
    # Step 2: Apply grammar rules
    grammar_corrected = grammar_checker(spell_corrected)
    return grammar_corrected


In [11]:
# Ground truth data for evaluation
test_sentences = [
    "பார்த்து நான் புத்தகம் வாங்கினேன்.",
    "அவன் பள்ளி போகிறார்கள்.",
    "நான் புத்தகம் வாங்கினேன.",
    "அவள் பள்ளி போகிறான்.",
    "புத்தகம் வாங்கினேன் நான்."
]

ground_truth = [
    "நான் புத்தகம் வாங்கினேன்.",
    "அவன் பள்ளி போகிறான்.",
    "நான் புத்தகம் வாங்கினேன்.",
    "அவள் பள்ளி போகிறாள்.",
    "நான் புத்தகம் வாங்கினேன்."
]



In [12]:
# Evaluate accuracy
corrected_sentences = [evaluate_sentence(sentence) for sentence in test_sentences]
accuracy = sum([1 for corrected, truth in zip(corrected_sentences, ground_truth) if corrected == truth]) / len(ground_truth) * 100

# Print evaluation results
print("Model Accuracy: {:.2f}%".format(accuracy))



Model Accuracy: 20.00%


In [13]:
# User input
user_sentence = input("Enter a Tamil sentence for grammar checking: ")
corrected_user_sentence = evaluate_sentence(user_sentence)
print("Corrected Sentence:", corrected_user_sentence)

Enter a Tamil sentence for grammar checking: பார்த்து நான் புத்தகம் வாங்கினேன.
Corrected Sentence: பார்த்து நான் புத்தகம் வாங்கினேன .
