Skip to content

தமிழ் யாப்பை ஆராய/அறிய மென்பொருள்

Notifications You must be signed in to change notification settings

jamadagni/yaappu

Repository files navigation

பாவை

தமிழ் பாக்களை யாப்பிலக்கணப்படி அறிய/இயற்ற உதவும்பொருட்டு உருவாக்கப்பட்ட மென்பொருள் யாப்பு என்ற பெயர் கொண்ட நூலகம் (library) மற்றும் பாவை என்ற செயலி.

பாவை தாங்கள் உள்ளிட உள்ளிட அசைகளை அலகிட்டு சீர்களின் முதல்/ஈற்றுச் சீர்களையும் அவற்றினிடையே ஏற்படும் தளைகளையும் காட்டுகிறது.

நிறுவுதல்

முன்னேற்பாடுகள்

  1. தங்கள் கணினியில் முதலில் Python 3 நிறுவப்பட்டிருக்க வேண்டும். தங்கள் அமைதளத்திற்கான (platform) உரிய முறையில் அதனைப் பதிவிறக்கம் செய்து நிறுவ அதற்கான வலைப்பக்கத்திற்குச் செல்லவும்.
  2. அடுத்து PyQt 5 நிறுவப்பட்டிருக்க வேண்டும். அதனைப் பதிவிறக்கம் செய்து நிறுவ அதற்கான வலைப்பக்கத்திற்குச் செல்லவும்.

பதிவிறக்கம்

  1. மேலே காணப்படும் Clone or Download என்பதனைச் சொடுக்கவும்.
  2. Download ZIP என்ற தேர்வினைச் சொடுக்கவும்.
  3. பதிவிறக்கம் செய்ய இடம் கேட்கையில் தங்களுக்கு விருப்பமான இடத்தைக் கொடுங்கள்.
  4. தங்களது கோப்பு நிர்வாகி (file manager) செயலிக்குச் சென்று இந்த ZIP கோப்பினை விரிவாக்கம் (extract) செய்துகொள்ளுங்கள். தனி பெட்டியில் (folder) செய்துகொள்வது நல்லது.

பயன்பாடு

செயல்படுத்துவது

௸ பெட்டியில் காணப்படும் பாவை.py என்ற கோப்பைத் (இருமுறை சொடுக்குவது போன்ற) தங்கள் அமைதளத்திற்கு உரிய முறைப்படி செயல்படுத்தவும்.

உள்ளீட்டு விதிமுறைகள்

  1. உள்ளீட்டில் இருக்கும் (எண்கள் முதலிய) தமிழ் அல்லாத எழுத்துக்கள் கருதப்படமாட்டா.
  2. ஒரு வரியில் ஒரு அடியை (மட்டுமே முழுதாக) உள்ளிட வேண்டும்.
  3. சீர்களை இடைவெளியிட்டு பிரிக்க வேண்டும்.
  4. தமிழ் எழுத்து அல்லாத எந்த சின்னங்களும் ஒரு சீர் நடுவில் இருக்கலாகாது. தொடர்ந்த தமிழ் எழுத்துக்களே சீர் என்று கொள்ளத்தகும். மலர்-மிசை என்று உள்ளிடக்கூடாது. சீர் பிரிந்துவிடும். மலர்மிசை (1) ஏகினான் என்று (ஏதேனும் காரணம் பற்றி) சீர்களுக்கு இடையே இருக்கலாம். தவறில்லை.
  5. புரிந்துகொள்வதற்கு ஏதுவாக சிலர் சொல் சொல்லாகப் பிரித்து எழுதுவர். அது சீர்பிரிப்பதற்கு சரிவராது. காட்டாக -
மலர்மிசை ஏகினான் மாணடி சேர்ந்தார்
நிலமிசை நீடு வாழ்வார்

என்று உள்ளிட்டால் நீ·டு நேர்·நேர், அடுத்து வாழ்·வார் நேர்·நேர் என்பதாக வெண்பாவிற்கு ஒவ்வாத நேரொன்றிய ஆசிரியத்தளை வருவதாகக் காட்டும். நீடுவாழ் வார் என்றே சரியாகச் சீர்பிரித்து உள்ளிடவேண்டும். 6. சீரின் இறுதியில் உள்ள உகரம் குற்றியலுகரம் என்று கொள்ளப்படும். ஆகவே வருஞ்சீரின் தொடக்கத்தில் உயிரெழுத்து இருந்தால் இது தள்ளப்படும். (இதனால் புதிதாக பா இயற்றும் பலர் குற்றியலுகரத்தை நீக்காது அலகிடுவது என்ற தவறு தவிர்க்கப்படுகிறது.) 7. ௸ இயல்பால் சீரின் இறுதியில் உள்ள உகரம் மாறாக முற்றியலுகரம் ஆயின் வருஞ்சீரின் தொடக்கத்தில் புணர்ச்சி விதிகளின்படி வகரம் சேர்த்து உள்ளிடவேண்டும். காட்டாக - என்குரு ஆன என்பது தவறாக தே·மா தே·மா என்று கொள்ளப்படும். ஆகவே என்குரு வான என்று உள்ளிடவேண்டும்.

காண்பதைப் புரிந்துகொள்வது

பாவையில் அசை, சீர், தளைகள் அலகிடப்படுவது

௸ திரைவருடலை நோக்கவும். விளக்கம் கீழ்கண்டவாறு.

  1. இடதுபுறம் உள்ளீட்டுப்பெட்டியில் முதல் திருக்குறளை உள்ளிட்டுள்ளோம்.

    1. அங்கேயே வண்ண வேற்றுமையால் அசைகள் பிரித்துக் காட்டப்பட்டுள்ளன.

    2. நேரசைகள் வலிய எழுத்தில் காட்டப்பட்டுள்ளன.

    3. அடியில் 16க்கும் மேற்பட்ட சீர்களோ சீரில் 4க்கும் மேற்பட்ட அசைகளோ உள்ளிடப்பட்டால் இலக்கணப்படி தவறாகையால் அதிகமானது சிவப்பு நிறத்தில் குறிக்கப்படும்.

  2. வலதுபுறம் அடி ஆய்வுப்பெட்டியில் ஒவ்வொரு அடியின் நீளப்பெயரும் அதனில் உள்ள தளைகளும் காட்டப்பட்டுள்ளன. அதில் -

  3. முதலடி நான்கு சீர்கள் கொண்டதாகையால் அளவடி என்ற அதன் பெயர் முதலில் கொடுக்கப்பட்டது.

  4. முதற்சீர் அகர என்பதில் அக என்பது நிரை, என்பது நேர். இச்சீரின் வாய்ப்பாடு புளி·மா.

    1. இதில் "…" என்ற சின்னத்திற்குப் பிறகு ஈற்றசைப்பெயரான மா என்பது மட்டுமே அடுத்த சீருடன் தளை அமைப்பதால் அது மட்டுமே சுருக்கம் கருதி காட்டப்பட்டது.
  5. அடுத்த சீர் முதல என்பதில் மீண்டும் முத·ல என்பதாக நிரை·நேர் என்று அசைகள். வாய்ப்பாடு அதே புளி·மா.

    1. முந்தைய சீரின் ஈற்றசை மா என்பதாலும் இச்சீரின் முதலசை நிரை என்பதாலும் இயற்சீர் வெண்டளை அமைந்தது. இதுவே {இ வெ} என்று காட்டப்பட்டது.

    2. அடுத்து இச்சீரின் முதலசை தளையமைக்க பயன்பட்டதால் கொடுக்கப்பட்டது.

    3. பிறகு முன்புபோல் "…" என்ற சின்னத்திற்குப் பிறகு ஈற்றசைப்பெயர் கொடுக்கப்பட்டது.

  6. பிறவும் அன்ன.

  7. பாடலின் இறுதிச்சீரின் முதலசை மட்டுமே முந்தைய சீருடன் தளை அமைப்பதால் அது மட்டுமே கொடுக்கப்பட்டது.

தளைகளின் சுருக்கமான பெயர்களைக் கீழ்கண்டவாறு கையாண்டுள்ளோம்.

தளைப்பெயர் சுருக்கம்
இயற்சீர் வெண்டளை இ வெ
வெண்சீர் வெண்டளை வெ வெ
நேரொன்றிய ஆசிரியத்தளை நே ஆ
நிரையொன்றிய ஆசிரியத்தளை நி ஆ
கலித்தளை
ஒன்றிய வஞ்சித்தளை ஒய வ
ஒன்றா வஞ்சித்தளை ஒறா வ

மற்ற வசதிகள்

  1. ஏற்புடைய தளைகள் என்பதனை அழுத்தி, குறிப்பிட்ட பா-வகைக்கு ஏற்ப நாம் குறிப்பிட்ட தளைகள் மட்டுமே ஏற்புடையவை என்று தேர்வு செய்யலாம். மற்றவை அடி ஆய்வுப்பெட்டியில் சிவப்பு நிறத்தில் குறிக்கப்படுப.

  2. தங்களது மேசை வண்ணத்திட்டத்திற்கேற்ப பாவை-யின் வண்ணத்திட்டத்தையும் வெண்மை அல்லது கறுமை என்று அமைத்துக்கொள்ளலாம்.

  3. ௸ இரண்டும் அடுத்த முறை பாவை செயல்படுத்தப்படும்பொழுது நினைவில் கொள்ளப்படுப.

இதர குறிப்புகள்

இந்த மென்பொருள் மலைப்பாம்பு (Python ☺) மொழியில் எழுதப்பட்டது. இதில் பயன்படுத்தப்பட்ட பிறர் கையாண்டுள்ள மொழிசார் மட்டும் நூலக சுட்டுப்பெயர்களைத் (language and library identifiers) தவிர்த்து நாம் கையாண்ட அனைத்து சொற்களும் தமிழிலேயே உள்ளன என்பது குறிப்பிடத்தக்கது. தமிழ் ஒருங்குறியின் உதவியால் தமிழ் ஒருங்குறியில் உள்ளிடப்பட்டதை இயற்கை மொழி செயலாக்கம் (Natural Language Processing) செய்யவியலுவதை இங்கு காணலாம்.

திறன் வரையறைகள்

  1. தற்சமயம் பாவை பாவின் வகைகளை அறிய முற்படுவதில்லை.
  2. மொழி முதலைத் தவிர்த்த ஐகாரம் குறுகும். ஆனால் மொழியை அலகிடுவது அத்துணை எளிதில்லை என்பதால் வகையுளி இருக்காது என்று கருதி சீர்முதலைத் தவிர்த்த ஐகாரத்தைக் குறுகியதாகக் கருதுகிறோம்.
  3. ஒரு வரியின் இறுதியில் குற்றியலுகரம் இருந்து அடுத்த வரியின் தொடக்கத்தில் உயிரெழுத்து வந்தால் வண்ணம் தீட்டுகையில் குற்றியலுகரம் நீக்கப்படாமல் இருக்கலாம். ஆனால் அடி ஆய்வு செய்கையில் அவசியம் நீக்கப்படும். காட்டாக -
அன்போடு இயைந்த வழக்கென்ப ஆருயிர்க்கு
என்போடு இயைந்த தொடர்பு

என்ற குறளை தட்டச்சால் உள்ளிட்டு பார்க்க. (நகலிட்டு ஒட்டினால் ஒரே நேரத்தில் உள்ளிடப்படுவதால் குற்றியலுகரம் வண்ணத் தீட்டிலும் நீக்கப்படுகிறது.)

மேலும் சீர்செய்ய

  1. முதன்முறையாக யாப்பிலக்கணத்தில் இந்த அளவுக்கு ஈடுபட்டுள்ளேன். எனது புரிதலில்/செயல்படுத்துதலில் தவறுகள் இருக்கலாம்.

  2. துறைசார் ஆங்கிலச்சொற்களைத் தமிழ்ப்படுத்துவதிலும் எனக்கு அனுபவம் குறைவு. இந்த README, மென்பொருளின் மூலம் முதலியவற்றில் அவ்விஷயத்தில் தவறுதல் இருக்கலாம்.

இரு விஷயத்திலும் பொறுமையுடனும் ஆதாரத்துடனும் சுட்டிக்காட்டித் திருத்திக் கொடுக்கும்படி வேண்டுகிறேன். இந்த வலைப்பக்கத்திற்குச் சென்று "New issue" என்பதனை அழுத்தி அத்தகைய திருத்தங்கள்/பின்னூட்டத்தை வெளியிடலாம்.

About

தமிழ் யாப்பை ஆராய/அறிய மென்பொருள்

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages