In [3]:
# Import the necessary library to use the drive object
from google.colab import drive

# Mount Google Drive
drive.mount('/content/drive')

Mounted at /content/drive


In [7]:
# Install necessary libraries
!pip install spellchecker



In [10]:
!pip install pyspellchecker # Install the correct spellchecker library

# Import libraries
from spellchecker import SpellChecker # Import the SpellChecker class from pyspellchecker
from google.colab import drive



Collecting pyspellchecker
  Downloading pyspellchecker-0.8.2-py3-none-any.whl.metadata (9.4 kB)
Downloading pyspellchecker-0.8.2-py3-none-any.whl (7.1 MB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m7.1/7.1 MB[0m [31m37.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pyspellchecker
Successfully installed pyspellchecker-0.8.2


In [14]:

# Define the SpellChecker class
def correct_text(test_sentence, correct_words):
    """Corrects the given text using a custom dictionary of correct words."""
    # Initialize the SpellChecker with correct words
    spell_checker = SpellChecker()
    spell_checker.word_frequency.load_words(correct_words)

    # Correct the input sentence and track changes
    words = test_sentence.split()
    corrected_words = []
    corrected_items = []  # To store words that were corrected

    for word in words:
        corrected_word = spell_checker.correction(word)
        corrected_words.append(corrected_word)
        if corrected_word != word:
            corrected_items.append((word, corrected_word))

    corrected_text = " ".join(corrected_words)
    return corrected_text, corrected_items

# Load the correct dataset
correct_dataset_file = "/content/drive/MyDrive/spell checker/dataset.txt"
with open(correct_dataset_file, 'r', encoding='utf-8') as file:
    correct_sentences = [line.strip() for line in file]
    correct_words = set(word for sentence in correct_sentences for word in sentence.split())

# Define a list of incorrect sentences for testing
wrong_sentences = [
    "மழை பெய்யும் காலத்தில் பசுமையான இயற்கை சூழலில மநிதர்கள் மகிழ்ச்சியுடன் இயற்கையின் அழகை ரசிகின்றனர்.",
    "சூரியன் ஒளி தளர்வதால மாலை நேரத்தில கோபுரங்களின் மேல அழகாக வானவில தோன்றி பரந்த மகிழ்சியை ஏற்படுத்திகிறது.",
    "பனிக்கட்டிகள் உருகி சூழலை ஈரமாக்கிகின்றன.",
    "வானத்தில் ஒளிரும் நட்சத்திரங்கள், பறக்கும் வெளி மேகங்கள், அவற்றின் கீழ அமைதியாக நடக்கும் மநிதர்கள் எல்லாம் மநதை கவர்கின்றன.",
    "கதிரவன் உதிக்கும் காலையில் பறவைகள் குரலுடன் வானத்த தோய்க்கும், இயற்கையின் அழகு ஒவ்வொரு மநதையும் மகிழ்ச்சியுட நிரப்பிகிறது."
]

# Compare and correct sentences
for idx, wrong_sentence in enumerate(wrong_sentences):
    print(f"\n--- Sentence {idx+1} ---")
    print(f"Given Sentence: {wrong_sentence}")

    # Correct the wrong sentence and get the corrected words
    corrected_sentence, corrected_items = correct_text(wrong_sentence, correct_words)

    # Print the corrected sentence
    print(f"Corrected Sentence: {corrected_sentence}")

    # Print the words that were corrected
    if corrected_items:
        print("Corrected Words:")
        for original, corrected in corrected_items:
            print(f"  - {original} -> {corrected}")
    else:
        print("No corrections needed.")



--- Sentence 1 ---
Given Sentence: மழை பெய்யும் காலத்தில் பசுமையான இயற்கை சூழலில மநிதர்கள் மகிழ்ச்சியுடன் இயற்கையின் அழகை ரசிகின்றனர்.
Corrected Sentence: மழை பெய்யும் காலத்தில் பசுமையான இயற்கை சூழலில் மனிதர்கள் மகிழ்ச்சியுடன் இயற்கையின் அழகை ரசிக்கின்றனர்.
Corrected Words:
  - சூழலில -> சூழலில்
  - மநிதர்கள் -> மனிதர்கள்
  - ரசிகின்றனர். -> ரசிக்கின்றனர்.

--- Sentence 2 ---
Given Sentence: சூரியன் ஒளி தளர்வதால மாலை நேரத்தில கோபுரங்களின் மேல அழகாக வானவில தோன்றி பரந்த மகிழ்சியை ஏற்படுத்திகிறது.
Corrected Sentence: சூரியன் ஒளி தளர்வதால் மாலை நேரத்தில் கோபுரங்களின் மேல் அழகாக வானவில் தோன்றி பரந்த மகிழ்ச்சியை ஏற்படுத்துகிறது
Corrected Words:
  - தளர்வதால -> தளர்வதால்
  - நேரத்தில -> நேரத்தில்
  - மேல -> மேல்
  - வானவில -> வானவில்
  - மகிழ்சியை -> மகிழ்ச்சியை
  - ஏற்படுத்திகிறது. -> ஏற்படுத்துகிறது

--- Sentence 3 ---
Given Sentence: பனிக்கட்டிகள் உருகி சூழலை ஈரமாக்கிகின்றன.
Corrected Sentence: பனிக்கட்டிகள் உருகி சூழலை ஈரமாக்குகின்றன
Corrected Words:
  - ஈரமாக்கிகின்றன. -> ஈரமாக்குகின்றன