Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

සංයෝග ශ යන්න? #61

Closed
JanakaCB opened this issue Jun 1, 2021 · 22 comments
Closed

සංයෝග ශ යන්න? #61

JanakaCB opened this issue Jun 1, 2021 · 22 comments
Assignees

Comments

@JanakaCB
Copy link

JanakaCB commented Jun 1, 2021

Screenshot 2021-05-31 113654
(Page XIV, නාමමාලා හෙවත් නාම වරනැගිල්ල by වස්කඩුවේ සුභූති හිමි in 1876 CE)

Screenshot 2021-05-31 141420
(Page XVI, නාමමාලා හෙවත් නාම වරනැගිල්ල by වස්කඩුවේ සුභූති හිමි in 1876 CE)

@JanakaCB JanakaCB self-assigned this Jun 1, 2021
@JanakaCB
Copy link
Author

JanakaCB commented Jun 1, 2021

@bgliyanage This seems as a sangngaka version of thaluja sha (සඤ්ඤක ශ). Is this a valid character..? Should we add this to the next release?

@bgliyanage
Copy link

ජනක, මේ අකුර ගැන අපි තව දුරටත් අධ්‍යයනය කරන්න වෙයි. මොකද මෙතැන භාෂාවිද්‍යාත්මක ගැටලුවක් සහ අක්ෂරවිද්‍යාත්මක ගැටලුවක් තියෙනවා. මා එය මෙසේ සරලව පැහැදිලි කරන්නම්.
පාලි සහ සංස්කෘත පද සිංහලයෙන් ලිවීමේදී තමා බැඳි අකුරු භාවිත කරන්නේ. මේ භාෂා දෙකේම සඤ්ඤක අකුරු නැහැ. අප අද ව්‍යවහාරයේ භාවිත කරන සඤ්ඤක අකුරු වන ඟ ඦ ඬ ඳ ඹ යන අකුරු පහ පාලි සංස්කෘතවලදී භාවිත කරන්නේ බැඳි අකුරු දෙකක් නියෝජනය කරන්න. අපි සකස් කරගත් වාක්කොශයට අනුව ඒවා ග්‍රහණාක්ෂර පහක්. ඒ බැඳි අකුරු පහ පිළිවෙළින් ඞ්ග ඤ්ජ ණ්ඩ න්ද සහ ම්බ යන ග්‍රහාණාක්ෂර. සංස්කෘත භාෂාවේ බින්දුව කියා අක්ෂරයක් නැහැ. සංස්කෘතයේදී බින්දුව කියන්නේ ම් හෝ න් යන අකුරු දෙකින් එකකට සිදු කරන ආදේශයක්. මේ ආදේශය සමහර තැන්වල විකල්පයෙන් සිදු කළ හැකියි. උදා. ලෙස සඞ්ඝ යන පදය සංඝ යනුවෙන් ලීවැහැකි. මේ දෙකම නිවැරදියි. හැබැයි සංස්කෘතයේදී මෙවැනි තැනක බින්දුව උච්චාරණය කරන්න බැහැ. ( ඒත් ලංකාවේ අය එහෙම කරනවා). ඒ කියන්නේ ලියන්නේ සංඝ කියා ලීවත් උච්චාරණය සඞ්ඝ කියාම විය යුතුයි. තවත් සමහර තැන් තියෙනවා බින්දුව අනිවාර්යයෙන් ආදේශ කළ යුතුයි. උදා ලෙස ස ෂ ශ සහ හ යන අකුරු ඉදිරියෙන්. හන්ස කියන පදය අපි අනිවාර්යයෙන් ලියන්නේ හංස යනුවෙන්. වම්ශ යන්නත් වංශ යනුවෙන් ලියන්නේ ඒ නිසා. මේ වගේ අනිවාර්යයෙන් ආදේශ වන තැනක බින්දුව උච්චාරණය කළ හැකියි. සාරාංශයක් වශයෙන් කියනවා නම් මෙහෙමයි. ස ෂ ශ හ යන අකුරු හතර ඉදිරියෙන් යෙදිය හැකි නාසික අක්ෂර දෙක නම් න් සහ ම් යන දෙක පමණයි. ඒවාත් අනිවාර්යයෙන් බින්දුවක් ආදේශ කර ලියන්න ඕනේ.
දැන් මං අක්ෂරවිද්‍යාත්මක ගැටලුව පැහැදිලි කරන්නම්. අපි ග්‍රහණාක්ෂරයක් ලිවීමේදී අකුරකට ඉදිරියෙන් හොඬක් යොදන්නේ වෙනත් අකුරක් එතැන සැඟවී ඇති බව පෙන්වන සංකේතයක් විදිහටයි. ද්‍ව වගේ තැනකදීත් ණ්‍ඩ වගේ තැනකදීත් වෙන්නේ එයයි. ඒත් වංශය කියන තැන අනිවාර්යයෙන් ලියැවෙන්නේ බින්දුව. අනෙක ඒක සංස්කෘත පදයක්. ඉතිං ඒ බින්දුව අපේ පුස්කොළ පොත්වලත් අනෙක් හැමතැනකමත් බින්දුව ලෙසම ලීවා මිසක එය හොඬයක් යොදා කෙටි කරන්න උත්සාහ කළ බව පේන්නේ නැහැ. මේ නිසා මේ පොතේ කතුවරයා ගෙන එන මේ සංකේතය එක්තරා ආකාරයක පෞද්ගලික ලක්ෂණයක් බවයි මට පේන්නේ. මේ නිසා, මේ ගැන තවදුරටත් හොයන්නේ නැතිව අප ක්‍රියාත්මක නොවිය යුතුයි.

@JanakaCB
Copy link
Author

ස්තූතියි. ඔබ කී සම්පූර්ණ විස්තරය අභය ලිබ්රේ රුවකුරට අදාලව සාරාංශගත කරන්නට උත්සාහ ගන්නේනම්:

භාෂා විද්‍යාත්මකව; තාලුජ ශ යන්නට පෙර බින්දුවක් යෙදෙන විට එම බින්දුව මුලුමනින්ම ශබ්දනගා කියවිය යුතුයි. සඤ්ඤක අක්ෂරවල මෙන් බින්දුවෙන් බාගයක් පමණක් හැඬවිය නොහැකියි. එනිසා මෙහි ඉහත පින්තූරවල පෙන්වා ඇති 'වංශය' යන වචනය හා අනුබද්ධව සකස් කරගෙන ඇති වදන් දෙක උච්චාරණය කළයුතු නිවැරදි ආකාරය ඒ වදන් මුද්‍රණය කිරීම සඳහා යොදා ඇති අක්ෂර අනුපිළිවෙල විසින් නිවැරදිව නියෝජනය නොවේ.

අක්ෂර විද්‍යාත්මකව; ද්‍ව, ද්‍ධ, සහ ට්‍ඨ යන අක්ෂර වලත් සඤ්ඤක අක්ෂරවලත් ඉදිරිපසින් ඇති 'හොඬය' වැනි කොටසින් නිරූපණය වන්නේ එම හොඬය විසින් හඟවන යම්කිසි සම්පූර්ණ අක්ෂරයක් එම ස්ථානයට එකතුවී තිබෙන බවයි. එහෙත් මෙහි ඇති 'වංශය' යන වදනට අදාලව 'ශ' අක්ෂරයට හොඬයක් ‌යොදා ඇතත් එසේ සම්පූර්ණ අක්ෂරයක එකතුවීමක් සිදුවී නැත.

ඒ අනුව ඉහත පින්තූරවල පෙනෙන 'ශාසනවංශයෙහි' සහ 'මහාවංශයෙන්' ආදී ලෙසින් උච්චාරණය කළයුතු වදන්වල නිවැරදි භාවිතය ඒ වදන්වල අක්ෂර අනුපිළිවෙලෙහි නැත.

රුවකුරු නිමැවුම්කරුවන් ලෙස අප විසින් භාෂා විද්‍යාත්මකවත් අක්ෂර විද්‍යාත්මකවත් නොපැවතිය හැකි දෝෂ සහගත අක්ෂර භාවිතයට හඳුන්වාදීම නොකළ යුතුයි. ඒ අනුව 'සඤ්ඤක ශ යන්න' ලෙස වරදවා වටහාගැනුනු මෙම අක්ෂරය වලංගු අක්ෂරයක් නොවන බවත් අභය ලිබ්රේ රුවකුරට එකතුකිරීමට අනවශ්‍ය බවත් පැහැදිලියි.

@ravincaldera
Copy link

ඔබ දෙපලගේ අදහස් පිළිබඳ ස්තූතියි. මගේ අදහස් තුනක් සටහන් කර තබන්නට කැමැත්තෙමි.

  1. පුරාණ පොතපත ඩිජිටල්කරණය සඳහා සඤ්ඤක ශ අවශ්‍ය වෙයි. අවම වශයෙන් නාමමාලා හෙවත් නාමවරනැගිල්ල යන පොත ඩිජිටල්කරණය සඳහා මෙම අකුරක අවශ්‍යතාවය ඇත. මේ පිළිබඳ සලකා බැලීම ද වැදගත් වෙයි.
  2. මෙම පොතෙහි මුද්‍රණය සඳහා ම නව අකුරක් රාජ්‍ය මුද්‍රණාලයෙන් නිර්මාණය වීම ම "පෞද්ගලික අභිලාශයක්" නිසා නොව, වස්කඩුවේ සුභූති තෙරුණුවන්ගේ විශාරදත්වය පිළිබඳ යම් ගෞරවයක් ඇතිව කරන ලද ව්‍යයාමයක්යයි මට සිතේ.
  3. සංචරණ සීමා නිසා මැනවින් අදහස් දැක්වීමට මා ළඟ දැනට විමර්ශනය සඳහා පුරාණ සිංහල පොතපත නොමැති නිසා මා අනුමාන කරන්නේ මෙම අකුර නිර්මාණය වන්නට ඇක්තේ “ඞ” + “ශ” එකතු වී තැනුනු අකුරක් ලෙසින් ය. ඒ හෙයින් “ශාසනවංශය” යන්න “ශාසනවඞශය” ලෙසින් ද, “මහාවංශය” යන්න “මහාවඞශය” ලෙසින් ලියවීම සංයෝජනයක්දැයි සැක සහිතය
    මෙම කරුණු මත සඤ්ඤක “ශ” යන්නක අවශ්‍යතාවයක් හා අප විසින් සපයා දිය යුතු බවක් ඩිජිටල් අකුරුවල ඇතියි මම හඟිමි. ඒ අනුව මාගේ නිර්මාණ අකුරුවල සඤ්ඤක ශ යන්නක් මගේ අකුරු නිර්මාණයන්ට සපයා දීමට උත්සහ ගෙන ඇත.

Akuru

@ravincaldera
Copy link

කෙසේ වෙතත් "වම්ශ" යන්න "වංශ" යනුවෙන් යෙඳුණු බවට මම එකඟ වෙමි. මාගේ රචනාව නිසා වටහා ගැනීමේ දෝෂයක් ඇති වූයේ නම් සමාවනු මැනවි.

@pathumego
Copy link
Member

pathumego commented Jun 11, 2021

පුරාණ පොතපත ඩිජිටල්කරණය සඳහා සඤ්ඤක ශ අවශ්‍ය වෙයි. අවම වශයෙන් නාමමාලා හෙවත් නාමවරනැගිල්ල යන පොත ඩිජිටල්කරණය සඳහා මෙම අකුරක අවශ්‍යතාවය ඇත. මේ පිළිබඳ සලකා බැලීම ද වැදගත් වෙයි.
මෙම පොතෙහි මුද්‍රණය සඳහා ම නව අකුරක් රාජ්‍ය මුද්‍රණාලයෙන් නිර්මාණය වීම ම "පෞද්ගලික අභිලාශයක්" නිසා නොව, වස්කඩුවේ සුභූති තෙරුණුවන්ගේ විශාරදත්වය පිළිබඳ යම් ගෞරවයක් ඇතිව කරන ලද ව්‍යයාමයක්යයි මට සිතේ.

@ravincaldera සම්පූර්ණයෙන් එකඟ වෙනවා.

ඔබ යෝජනා කරන කේතනය (encoding) OpenType සිංහල සම්මතයට අනුකුල නොවන යෙදුමක්. මොකද සම්මතයට අනුව ග්‍රහණක්ෂර සඳහා අනුමත ක්‍රමය <0DCA al-lakuna, 200D ZWJ > හරහා බන්ධනය ඇති කිරීමයි. භාෂා විද්‍යාත්මක සහ අක්ෂර විද්‍යාත්මක කරුණු සලකා බැලීමෙන් පසු අපි එකම විදියකට මේ අකුර කේතනය කිරීමට පහසුව සලසන එක හොඳයි කියල මම හිතන්නේ. මෙතනදී අපට සියලු රුවකුරු වලට එක ලෙස වැඩකරන ක්‍රමයක් හඳුනා ගැනීම වැදගත් බව මගේ අදහස. අපි මේ ගැන සාකච්චාවක් කරමු.

@ravincaldera
Copy link

බොහොම ස්තූතියි. මෙය වැදගත් කථිකාවක්...අනෙකුත් බැදී අකුරු ගැනත් (බ්‍බ හා ච්ච සංයෝග අකුරු ගැනත්) කල්පනා කරන්නේ නම් මැනවී.

@pathumego
Copy link
Member

රුවකුරු නිමැවුම්කරුවන් ලෙස අප විසින් භාෂා විද්‍යාත්මකවත් අක්ෂර විද්‍යාත්මකවත් නොපැවතිය හැකි දෝෂ සහගත අක්ෂර භාවිතයට හඳුන්වාදීම නොකළ යුතුයි. ඒ අනුව 'සඤ්ඤක ශ යන්න' ලෙස වරදවා වටහාගැනුනු මෙම අක්ෂරය වලංගු අක්ෂරයක් නොවන බවත් අභය ලිබ්රේ රුවකුරට එකතුකිරීමට අනවශ්‍ය බවත් පැහැදිලියි.

මේකට මම එකඟ වෙන්නේ නැහැ. මුලින්ම ‘භාෂා විද්‍යාත්මකව සහ අක්ෂර විද්‍යාත්මකව නිවැරදි ලෙස ලිවීමට පුරුදු කිරීම’ කියන්නේ කොහොමටත් රුවකුරු නිර්මාණ ශිල්පියාගේ වගකීමේ සීමාවෙන් එහා දෙයක් කියන එකට අපි එකඟයි නේ.

රුවකුරු නිර්මාණ ශිල්පීන් විදිහට ‘භාෂා විද්‍යාත්මකව සහ අක්ෂර විද්‍යාත්මකව නිවැරදි ලෙස ලිවීමට පහසුකම් සැලසීම’ නොවෙයි රුවකුරු නිර්මාණ ශිල්පියාගේ වගකීම. රුවකුරු නිර්මාණ ශිල්පීන් විදිහට අපේ කාර්ය ඩිජිටල් අවකාශයේ—සහ මුද්‍රිත අවකාශයේ— සිංහල ලේඛන විධිය (Sinhala writing system) භාවිතයට; ලිවීමට (writing), කේතනයට (encoding) සහ ඉදිරිපත් කිරීමට (representating) අවශ්‍ය පහසුකම් සලසා දීමයි. මේ ලිවීම ‘යාන්ත්‍රික ලිවීමක්’. මෙතනදී විවිධ ආකාරයේ combinations පෙන්වීමට අපිට සිදු වෙනවා. උදාහරණයක් විදිහට අපිට ඕනේ වෙනවා “භාෂා විද්‍යාත්මකව සහ අක්ෂර විද්‍යාත්මකව වැරදි මෙන්න” කියල යම්කිසි තැනක ලියල පෙන්වන්න. එහෙම නැත්නම් “වචනයක් ලියන වැරදි ක්‍රමය සහ නිවැරදි ක්‍රමය” පෙන්වන්න සිද්ද වෙනවා. එතකොට මොකද කරන්නේ?

රුවකුරක glyph set එක (එකිනෙකට වෙනස් අකුරු-රූප සමුදාය) තීරණය කළ යුත්තේ ඒ ඒ රුවකුරේ අරමුණ—මොකටද, භාවිත කරන්නේ කවුද? මොන විදිහටද? කියන කාරණා—උඩ පදනම් වෙලා. ඒකට අපි font design breif එකක් කියනවා. අභය ලිබ්‍රේ කියන්නේ සිංහල පොත්පත ලිවීමට භාවිත වන ප්‍රමුඛ සිංහල රුවකුර.
අභය ලිබ්‍රේ හි අරමුණ සිංහල ලේඛන විධිය සම්පූර්ණයෙන් භාවිත කිරීමට—සහ එය භාවිත වන සියලු භාෂා ලිවීමට—අවැසි ලෙස පහසුකම් සැලසීමයි. ඒ මත පදනම් වෙලා තමයි අපි තීරණ ගන්න ඕනේ. එක්වරක් හෝ බොහොම කලාතුරකින් දකින්න ලැබෙන අකුරු-රූපයක් (letterform) වෙනුවෙන් කාලය සහ ශ්‍රමය වැයකිරීම තේරුමක් නැහැ. කාලය සහ ශ්‍රමය විතරක් නොවෙයි, ෆොන්ට් එකේ file size එක ලොකු තේරුමක් නැතිව ලොකු වෙනවා ඒකෙන්. ඒවා තමයි නිර්ණායක විය යුත්තේ.

ඒත් පුරාණ පොතපත ඩිජිටල්කරණය කියන එක මෙතනදී විශේෂයෙන් සලකා බැලිය යුතු දෙයක්. නිතර දකින්න ලැබෙන සංයෝග අකුරු අපි දැනට එකතු කරලා තියෙනව. එක පොතක පමණක් දකින්න ලැබෙන යම් අකුරු-රූපයක් තියෙනවා නම් එතැනදී ඒ ව්‍යාපෘතියේ අවශ්‍යතා වලට අනුකූලව විශේෂයෙන් යම් සංස්කරණයක් කරගන්න පුළුවන්.

මේ ‘සඤ්ඤක ශ යන්න‘ එකතු කිරීම ගැන තීරණය ගන්න ඕනේ අදාළ අකුරු-රූපය කොතරම් දුරට භාවිත වෙනවද? (පුරාණ පොතපතේ සහ සමකාලීන භාවිතය කියන දෙකම මත) සහ කොතරම් කාලයක් සහ ශ්‍රමයක් යොදවන්න වෙනවද? කියන කාරණා මත පදනම්ව. ඒ වගේම මතක තියාගන්න ඕනේ සාමාන්‍යෙන් භාෂා විද්‍යාත්මකව සහ අක්ෂර විද්‍යාත්මකව වැරදි අකුරු-රූපය වල භාවිතය විරල බවත්. මේ සියලු කාරණා අනුව අපි බලමු මේ අකුරු-රූපය තවත් තැන්වල, පොත්වල, තවත් කතෘවරුන් විසින්, සහ තවත් මුද්‍රණාල වල භාවිත වෙලා තියෙනවද කියල. ඒ මත පදනම්ව තීරණය ගනිමු. කාලයක්, ශ්‍රමය සහ file size කියන නිර්ණායක අභය ලිබ්‍රේ අරමුණු මත පදනම්ව නොසලකා හරිමු.

@ranganakuruwita
Copy link

මේක සඤ්ඤක ශ නෙවේ. මේක සංයෝගාෂරයක්.

ච, ජ, ධ වගේ තව අකුරුවලට මේක භාවිත වෙනවා
වෙනවා
හොඳ උදාහරණයක් "සිඬාලේප" කියන වචනය. මේකෙ තියෙන්නෙ සඤ්ඤක ධ නෙවෙයි.

කුරුණෑගල විස්තරය සංස්කරණයේදී මට ලැබුණු එවන් යෙදීම්ව්වවල ෆොටෝ ඇති. අවශ්‍ය නම් මේවා පුස්කොළ පොතේ යෙදී තිබුණ්ව් හැඩය කොහොමද කියලා ෆොටෝ ලබාදෙන්න පුළුවන්.

@pathumego pathumego changed the title සඤ්ඤක ශ යන්න ? සංයෝග ශ යන්න? Jun 13, 2021
@pathumego
Copy link
Member

@ranganakuruwita බොහොම ස්තුතියි! ෆොටෝ ටිකක් මෙතන අප්ලෝඩ් කරන්න පුළුවන් ද?

@ranganakuruwita
Copy link

ranganakuruwita commented Jun 13, 2021 via email

@pathumego
Copy link
Member

අලුත් comment එකක් Drag කරල මෙතන්ට drop කරන්න

@pathumego pathumego self-assigned this Jun 13, 2021
@JanakaCB
Copy link
Author

මෙම සංවාදයෙහි ප්‍රතිඵලයක් ලෙස කරන ලද සොයාබැලීම් වලට අනුව සංයෝග ශයන්න නැමැති අක්ෂරයක් පැරණි පුස්කොළ පොත්වලත් මුල්කාලීන සිංහල මුද්‍රිත ලේඛන වලත් තිබෙන බව තහවුරු විය. ඒ අතරින් අභය ලිබ්රේ රුවකුරට එම අක්ෂරය එකතුකිරීමේ කටයුත්ත සඳහා ප්‍රමාණවත් මූලාශ්‍රයක් ලෙස 1891 වසරේ ප්‍රකාශයට පත්වූ ඒබ්‍රහම් මෙන්ඩිස් ගුණසේකර මහතාගේ "A Comprehensive Grammar of Sinhalese Language" ග්‍රන්ථයේ 15 පිටුවේ ඇති මෙම සඳහන සැළකිය හැකිය.

අතිරේක වශයෙන් යමක් සඳහන් කරන්නේ නම්, මේ සම්බන්ධයෙන් උනන්දු වූ අය විසින් ‌Facebook කණ්ඩායම්වල පළකරන ලද සමහර තොරතුරු මෙම GitHub සංවාද අවකාශයට එක් නොවීම සහ ඒ හේතුවෙන් පසුකාලීනව ‌මේ සම්බන්ධව උනන්දු වන අයෙකුට එම කරුණු සොයාගැනීමට ඇතිවිය හැකි දුෂ්කරතා ගැන කණගාටු වනබවත් කිව යුතුය.

Screenshot 2021-06-15 194644

@ravincaldera
Copy link

ලිබ්රේ රුවකුරෙහි නිර්මාපකයන් වශයෙන් ඔබ සියලුදෙනගේ වෑයම මම අකිශයින් ම අගය කරමි. අකුරුවලට පෙම් බඳින්නන් සේ ඔබ ඉතා විරල සිංහල අකුරු ජීවමාන කිරීමේ යෙදීම ගැන මාගේ ආචාර ය. මෙම ගැටලුව (issue) වසා දැමීමට පෙර, මෙම අකුර පිළිබඳ පැහැදිලි අවබෝධයක් ඇති කර ගැනීම තකා ද, වාර්තා කොට තැබිය යුතු නිසාවෙන් ද අනෙකුත් පුස්කොළ පිටපත්හි ආදර්ශනයන් ද සපයන්නේ නම් මැනවී. දෙවනුව, මේ සඳහා යොදා ගත හැකි කේතයන් කවරේදැයි පැහැදිලි කර ගැනීමක් කළ හැක්කේ නම් ඉතාමත් අගනේ ය.

Sanyoja Sha

උක්ත කේත අතුරින් කවරක් යොදා ගත හැකිදැයි සාකච්ඡාවක් කළ යුතු අතර, එකී සංයෝජනය අමුතූ ම විකෘතියක් සේ මට පෙනේ. ඔබ කණ්ඩායමේ තීරණය පිළිබඳ අපට ද දන්වන්නේ නම් අපගේ රුවකුරු නිර්මාණයන්ට ඇතිලත් කර ගැනීමේ හැකියාව ඇත්තේ ය. අභය ලිබ්රේ රුවකුර මා සිතන්නේ සිංහල අකුරුවල "ප්‍රධාන මූලාශ්‍රය" (Parent Source) ලෙස ඇතුලත් කළ හැකි සියලු ම විරල හා පරණ පොත් ඩිජිටල්කරණය තකා වැදගත් වන අක්ෂර හැකියාව ලබා දෙන්නේ නම් මැනවි. එවිට රුවකුරු ඉතිහාසයේ ඔබ සියලුදෙනා නොමැකෙන දායාදයක් (දැනටමත් කර ඇති මුත්) කළ ඉවට ඉතිහාසයේ මතකය තුළ පවතිනු ඇත.

@ravincaldera
Copy link

Sanyoja Sha

@pathumego
Copy link
Member

මෙතන මේ සම්බන්ධව තවත් සාකච්ඡාවක් සිදු වුණා.

@pathumego
Copy link
Member

නාවුල්ලේ ධම්මානන්ද හාමුදුරුවන්ගේ මධ්‍යම ලංකා පුරාවෘත්ත කෘතියට ඇතුළත් කරලා තිබෙන 'දඹුළු පදවි සන්නස' කියන ලේඛනය සඤ්ඤක ශයන්නක් ගැන සඳහන් වෙනවා.

190739762_161367145970601_6111712207105894950_n

@pathumego
Copy link
Member

විත්ති පොතක්. දෙවැනි රාජසිංහ කාලේ ලියැවිල තියෙන්නෙ. පිටපත 1909
198735970_10218615770249759_258099759571167812_n

@JanakaCB
Copy link
Author

අකුරු නිර්මාණකරුවකුගේ භූමිකාව පිළිබඳව ඔබ විසින් මෙහි මතුකළ අදහස් සමුදාය ඉතා වැදගත්. එය සංවාදයට බඳුන්විය යුතු, අප විසින් ඇතිකළයුතු ආකාරයේ සංවාදයක්මයි. එහෙයින් ඒ පිළිබඳව මගේ අදහස් කිහිපයක් මෙහි දක්වා තබමි.

රුවකුරු නිර්මාණ ශිල්පියෙකුගේ කාර්යභාරය මුලුමනින්ම රැඳී ඇත්තේ අකුරු හැඩතලත් එම අකුරු හැඩතලවල භාවිතයත් යම්කිසි තෝරාගත් අරමුණක් උදෙසා කාර්යක්ෂම ලෙස සිදුකරන්නේ කෙසේද යන්න මතයි. එහෙයින් රුවකුරු නිර්මාණ ශිල්පියෙකු තම ශිල්පය තුලදී ව්‍යාකරණ හෝ භාෂා ප්‍රයෝග පිළිබඳව වගකීම් සහගත වියයුතු නැහැ. එනමුත් තමා විසින් නිමවන හැඩතල වලට රූපමය භාෂාව තුල හිමිවන සංකේතීය වටිනාකම පිළිබඳවත් ඒ ඇසුරෙහි කාලාන්තරයක් තිස්සේ ගොඩනැඟුණු අස්පෘෂ්‍ය වටිනාකම පිළිබඳවත් එම වටිනාකම් නොනසා පවත්වාගැනීම ගැනත් ඔහු සවිඥානික විය යුතුයි. ඒ සවිඥානික බව නැතිව භාෂාවේ සංකේතවල අඩංගු විවිධත්වය සහ ගුණ සමුදාය විනාශවන පරිදි කටයුතු කළොත් යම් මතු දිනෙක 'රුවකුරු නිර්මාණය කරන්නට භාෂාවක් නොපැවතීම' යන්න කෙසේ වේදැයි සිතාබැලීම වැදගත් වනු ඇති.

ඒ අනුව, බැලූ බැල්මටම ‘භාෂා විද්‍යාත්මකව සහ අක්ෂර විද්‍යාත්මකව නිවැරදි ලෙස ලිවීමට පුරුදු කිරීම’ යන්න රුවකුරු නිර්මාණ ශිල්පියාගේ වගකීමේ සීමාවෙන් ඔබ්බෙහි ඇති දෙයක් සේ පෙනුනත් එය එසේ නොවන බවත් රුවකුරු නිර්මාණ ශිල්පියා අවම වශයෙන් පාර්ශ්විකව හෝ ඒ වගකීමෙන් බැඳී ඇති බවත් පැහැදිලි වනු ඇති.

ඉහත කරුණ ඔබ විසින් කියා ඇති "උදාහරණයක් විදිහට අපිට ඕනේ වෙනවා 'භාෂා විද්‍යාත්මකව සහ අක්ෂර විද්‍යාත්මකව වැරදි මෙන්න' කියල යම්කිසි තැනක ලියල පෙන්වන්න. එහෙම නැත්නම් 'වචනයක් ලියන වැරදි ක්‍රමය සහ නිවැරදි ක්‍රමය' පෙන්වන්න සිද්ද වෙනවා. එතකොට මොකද කරන්නේ?" යන්න ඇසුරින්ම විමසා බලමු.

වචනයක් ලියන වැරදි ක්‍රම දහස් ගණනක් අතර හරි ක්‍රම තියෙන්නෙ එකයි. එවැනි විටෙක එම වැරදි අවස්ථා සියල්ල පෙන්වාදීම සඳහා පමණක්ම රුවකුරකට වැරදි අකුරු දහස් ගණනක් එක්කිරීම හොඳ තීරණයක් නොවෙයි. උදාහරණයක් ලෙස ක්‍ෂ ක්‍ව ආදී ග්‍රහණාක්ෂර ලෙසින් ක්ඛ ක්ග ක්ඝ ක්ඞ ආදී අකුරු සංයෝග කිරීමේදී ග්‍රහණ හැඩතල නොමැති බව පෙන්වන්නට ඒ වැරදි glyph සියල්ලක්ම රුවකුරකට ඇතුලත්කර තිබිය යුතුද? එසේම කිසිදාක එකට නොයෙදෙන ඉස්පිලි පාපිලි අල්කිරීම් සියල්ල සහිත ක්‍රේීා වැනි හැඩතලවලට glyphs හැදිය යුතුද?

වැඩිදුරටත් කියන්නේ නම්, අඩුම ගානෙ අපි මුර්ධජ ළ අකුරට පාපිල්ල දාපු glyph එකවත් font එකකට එකතු කරන්නෙ නැහැනෙ. ඉතින් අපි දැනටමත් වැඩ කරන්නෙ භාෂා විද්‍යාත්මකව සහ අක්ෂර විද්‍යාත්මකව නිවැරදි ලෙස ලිවීමට පුරුදු කිරීම කියන රාමුව ඇතුලෙ ඉඳගෙනම තමයි. හැබැයි අපි ඒ ගැන aware නැහැ, මොකද ඒක ඒ තරමටම සාමාන්‍යකරණය වෙලා. ඉතින් ඔබම කියා ඇති පරිදි අකුරු හැඩතල සංයෝජනයන්හි තිබියහැකි සියලු අවස්ථා සළකා ඒවාට ඉඩදීමේදී නොයෙක් වැරදි glyphs එක්කිරීමෙන් සිදුවන්නේ ෆොන්ට් එකේ file size එක කිසිම තේරුමක් නැතිව ලොකු වීම පමණයි. අපි අත්වැරදීමකින්වත් එවැනි වැරදි යෙදීම් රුවකුරකට එක්කිරීම ගැන සළකා බලන්නේ නැහැ.

මීළඟට, වචනයක් ලියන වැරදි ක්‍රමය සහ නිවැරදි ක්‍රමය පෙන්වන්න සිදුවෙන අවස්ථාව සළකා බලමු. එවැනි අවස්ථාවක් සඳහා ඉඩ ලබාදීම වෙනුවෙන් file size එක ලොකු කරගන්නෙ නැතිව අවස්ථාවට සුදුසු පරිදි අතින් ඇඳපු රූපයක්, ග්‍රැෆික් නිර්මාණකරණ මෘදුකාංගයක් ඇසුරෙන් සකස්කරගත් image එකක්, Windows private character editor + Character Map භාවිතයෙන් එකතුකරන හැඩතලයක්, හෝ අදාල කොටස ASCII ක්‍රමයෙන් type කරගෙන භාවිත කරන්නට යෝජනා කළ හැකියි.

රුවකුරක කේතනය හා සබැඳිව මීට අදාල පසුබිම වටහාගැනීම උදෙසා මෙම සබැඳියේ ඇති සංවාදය හොඳ case study එකක්. ( https://groups.google.com/g/sinhala-unicode/c/MQ8_jLgT1fs/m/SVWhMsw_v-sJ) එහි කියැවෙන පරිදි 'ඖෂධ' යන්න ලිවීමේ වැරදි ආකාරයක් වන 'ෙඖෂධ' ලිවීමේදී කොම්බුව සහ ඔයන්න එක ළඟින් සිටින සේ පෙනෙන පරිදි ලිවීම යුනිකේත වලින් කළ නොහැකි නිසා වැරදි වචනය ලියන්නට යන කෙනෙකුගේ විමර්ෂණශීලී බව අවදිවී එම වැරදි වචනය ලිවීමෙන් වැළකීමට පෙළඹීමේ ඉඩකඩ කේතනයේ සාධනීය ලක්ෂණයක් ලෙස නොගත යුතුද.., නැතහොත් එම වැරදි භාවිතය සිදුකළ හැකිවනසේ කේතනය සංශෝධනය කළ යුතුද?

අනෙක, ඕනෑම කෙනෙකුට විවාදයකින් තොරව එකඟවිය හැකි පරිදි අභය ලිබ්රේ රුවකුර යනු දැනට ඇති අනෙක් කිසිඳු සිංහල රුවකුරකට වඩා සිංහල (පාලි සහ සංස්කෘත සඳහා අවශ්‍ය පහසුකම්ද සහිතව) භාවිතය සඳහා සුවිශේෂීකරණය කරන ලද්දක්. අභය ලිබ්රේහි නව සංස්කරණය නිකුත්වීමෙන් පසුව එය තවදුරටත් තහවුරු වනු ඇති. එනයින් ලොව පුරා සිටින සිංහල රුවකුරු නිර්මාණ ශිල්පීන් තම නිර්මාණ කටයුතු සඳහා අභය ලිබ්රේ රුවකුරේ අන්තර්ගතය කෙසේදැයි විමසා බැලීම නොවැලැක්විය හැකියි. එහිදී අපවිසින් අනෙකුත් නිර්මාණයන්ට ආදර්ශවත් වියහැකි අන්තර්ගතයක් සහිත නිමැවුමක් නිපැයීම පිළිබඳ අදහස නියෝජනය කළයුතුයි.

දැන් මේ ඉහත කී අදහස් සංයෝග ශ සම්බන්ධ කරුණට අදාලව ඒකරාශී කරගන්නට උත්සාහ කරමු.

මෙම ගැටළුව පිළිබඳව බර්ට්‍රම් ලියනගේ මහතා සමඟ කරන ලද සාකච්ඡාවකදී එතුමා විසින් පවසන්නට යෙදුණේ යම් තැනෙක භාෂා විද්‍යාත්මකවත් අක්ෂර විද්‍යාත්මකවත් නොපැවතිය හැකි දෝෂ සහගත අක්ෂර භාවිතයක් හමු වන්නට යෙදුණත් එය ව්‍යවහාරය තුල තහවුරු වූවක් බවට ප්‍රමාණවත් සාධක තිබේනම් එවැන්නක් සඳහා ඉඩදීමෙහි යම් සාධාරණත්වයක් ඇති බවයි.

එම අදහස පසෙකින් තැබුවත් මෙම සංයෝග ශ අක්ෂරය එවක භාවිතයේ පැවති බව අපට දැනටමත් තහවුරු වී අවසන්. එහෙයින් සංයෝග ශ අභය ලිබ්රේ රුවකුරට එක්කළ යුතුයි.

මෙවැනි දුර්ලභ අක්ෂර තවදුරටත් හමුවුවහොත් ඒවා අභය ලිබ්රේ රුවකුරට එක්කරගන්නවාද නැද්ද යන්න විමසා බැලියහැකි සාධකයක් හෙවත් නිර්ණායකයක් සකස්කරගැනීමත් මේ අවස්ථාවේ වැදගත්වනු ඇති. එනිසා ඒ පිළිබඳ යෝජනාවක් ලෙස: දැනට අප දන්නා කරුණු අනුව සාධාරණ නිගමනයක් සේ ගතහැකි අදහසක් බව පෙනෙන්නේ එම අක්ෂරය ඒ ඒ යුගයේ රාජ්‍ය මුද්‍රණාලයේ භාවිත වූ අක්ෂර මාලාවෙහි අන්තර්ගත වන්නේද නැද්ද යන්න විමසා බැලීම සුදුසු වන බවයි. එමඟින් පෞද්ගලික උවමනාවන් විසින් පොළඹවනු ලදුව අක්ෂර මාලාවට එක්කරන ලද යම් යම් සංකේත අභය ලිබ්රේට එක්වීම වැළැක්විය හැකිවනු ඇති අතරම භාවිතයේ තිබෙන බවට නිල පිළිගැනීම ලත් අක්ෂර සඳහා ඉඩදෙන්නටද හැකිවනු ඇති.

ඉහත කරුණු හැර ඔබ විසින් font design brief එකකට අදාලව කටයුතු කළයුතු ආකාරය ගැන කියාඇති අදහස් වලට එකඟවන බවද සඳහන් කළ යුතුය.

@JanakaCB
Copy link
Author

සංයෝග ශ යන්න encode කිරීම ගැන...

මේක මින්පෙර නොයෙදුණු සුවිශේෂී යෙදීමක්. එනිසා පෙර පැවති සකස්කිරීම් සහ encoding පිළිබඳ රටාවන්ට අනුව මේ අක්ෂරය යොදන්න තැනක් නැහැ. එහෙම වෙන්න හේතුව නම් මේ අක්ෂරය පෙර පැවති රටාවන්ගෙන් බැහැර වූ, අනෙක් සියලු අක්ෂර විසින් අනුගමනය කරන රටාවෙන් බැහැර වූ අක්ෂරයක් වීමයි.

වෙනත් වචනවලින් කියන්නේ නම්, සංයෝග ශ අක්ෂරය ඉතිහාසයේ යම් කලෙක සිංහල ලිවීම සඳහා භාවිතා වුණාට ඒක standard එකෙන් එළියෙ තියෙන 'වැරදි' අකුරක්. ඒ නිසා දැනට නිවැරදිව සහතර්කාණුකූලව encode කර ඇති අනෙක් අක්ෂර සමඟ මෙය එක පෙළට තබන්නට යෑමෙන් මෙය encode කරගන්න විසඳුමක් ලැබෙන්නෙ නැහැ. අප කළයුත්තේ දැනට ඇති standard එකෙන් පිටට ගොස් (මෙවැනි තවත් අක්ෂර අනාගත විමර්ෂණ වලදී හමුවුවහොත් ඒවාටත් යෙදිය හැකි බවට අනුමාන කළහැකි තර්කණයක් ඔස්සේ) encoding methodology එක තුල භාවිතයට ගතහැකි නව තාර්කික පිහිටුමක් සඳහා එකඟවීමයි. ඉන්පසුව අවශ්‍යනම් එම නව පිහිටුම සිංහල සඳහා වන සම්මතයට එක්කරගැනීම සඳහා නව යෝජනාවක් ඉදිරිපත් කළ හැකියි.

ඒ අනුව දැනට සිංහල සඳහා සම්මත භාවිතය තුල යොදා නොගැනුනත් මේ අක්ෂරය යතුරු පුවරුවෙන් ඇතුලත් කිරීම සඳහා සුදුසු තාර්කික පිහිටුමක් බව පෙනෙන්නේ "අනුස්වාරයට පසුව zwjට පසුව තාලුජ ශ" යොදන string එක සඳහා සංයෝග ශ replace කිරීමයි.

ං, zwj, ශ -> සංයෝග ශ

(zwj ටයිප් කිරීම සඳහා විජේසේකර යතුරු පුවරුවේ AltGr+j යෙදීම දැනටමත් assign කර තිබේ. එතකොට ටයිප් කිරීමෙදි මේ අකුර ටයිප් කරන්න සාමාන්‍ය ක්‍රමයෙන් පරිබාහිරව AltGr+j හරහා යන්න වෙනව කියන එකත් එක විදිහක indicator එකක් මේකෙ අසාමාන්‍ය බව හඟවන. (ඒ අසාමාන්‍යතා දුෂ්කරතා ඔක්කොම මේ case එකේදි advantages, මොකද මේක වැරදි නිසා සාමාන්‍ය එදිනෙදා භාවිතයට එන්නෙ නැති එක තමයි හොඳ. හැබැයි‌ උනන්දු කෙනෙකුට ගන්න ඒක එතන තියෙනවා.))

වැඩිදුරටත්, encoding එකේදි මේ අකුර හරි විදිහට පෙන්නන්න බැරිවීමම මේ අකුරෙ standard නැති වැරදි ගතිය මතුකරල දෙනව. හරියට encode කරන්න පුලුවන් නම් මේ අකුර වැරදි අකුරක් වෙන්නෙත් නෑනෙ. එනයින් ඉහත බර්ට්‍රම් මහතා ඉදිරිපත්කළ තර්කයේ වලංගුබව නැවත ආකාරයකින් තහවුරු වන බවත් පෙනෙනවා.

ඉතින් මේ අකුර 'අතාර්කික එහෙත් භාවිතයේ යෙදුණු' වගේ category එකකට තමයි ගැලපෙන්නෙ. තව අපි අකුරෙ වැරදි බව නොසලකා ඒක preserve කරන එකත් යම් විදිහකින් වැදගත් වේවි, මොකද ඒක සිංහල භාවිතයෙ එක් archaic form එකක් විදිහට survive වෙන්න රැකවරණය දීම අභය ලිබ්රේ ගේ අරමුණු වලට විරුද්ධව නොයන නිසා.

@pathumego
Copy link
Member

After deliberation and discussions it is clear that සංයෝග ශ (compound Sha) is a stylistic alternate and dose not warrant to encode as a ligated conjunct (like discussed in #52) So we decided to encode this ligature as a stylistic alternate under ss03 named Sinhala archaic ligatures` We will use the ss03 space to encode any other archaic ligatures or forms.

Here is a visual sample.
Screenshot 2021-06-28 at 11 47 52

@pathumego
Copy link
Member

cc @ravincaldera Please go ahead and use this scheme in your fonts as well.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

5 participants