ஒருங்குறியைப் (unicode) பரிந்துரைக்கும் ஒரு சில கணிஞர்கள்,
தமிழ் எழுத்தின் அகர உயிர்மெய்யை ஒரு பகுதியாகவும்,
கால், கொக்கி, கொம்பு போன்ற உயிர்மெய்க் குறியீடுகளை இன்னொரு பகுதியாகவும் வைத்து,
மிச்சமிருக்கும் உயிர்மெய் எழுத்துக்களை எல்லாம் உடைத்து,
"பாரு, பாரு, கூர்ந்து பாரு, பயாஸ் கோப்புலெ தெரியுது பாரு" என்று கூவியழைத்து,
"தமிழ்க் கணிமையின் எதிர்காலமே இதுதான்;
ஒருங்குறியை விட்டால் தமிழுக்கு ஒருங்கிடமே இல்லை" என்று பம்மாத்தும் செய்து,
புதிய புதிய இலக்கணங்களைச் சொல்லி,
"தமிழ் எழுத்து ஓர் அசையெழுத்தல்ல, அபுகிடா வகை மொழியெழுத்து"
என்று ஊரில் இல்லாத புதிய கண்டுபிடிப்பையும் முன்கொணர்ந்து,
சப்பைக் கட்டுக் கட்டுகிறார்கள். "மற்ற இந்திய மொழி எழுத்துக்களும், தென்கிழக்கு ஆசிய மொழி எழுத்துக்களும் கூட அபுகிடா வகை எழுத்துக்களே" என்பதும் இவர்களின் துணிபு. abugida என்பது வேறொன்றுமில்லை aleph, beth, gamel, del என்ற ஈப்ரு எழுத்துப் பெயர்களையும், அவற்றின் வழி எழுந்த alpha, beta, gamma, delta என்ற கிரேக்க எழுத்துப் பெயர்களையும் சேர்த்து a-bu-gi-da என்ற பெயரை இப்பொழுது உருவாக்கியிருக்கிறார்கள். (இதே போலத்தான் alpha - beta என்ற சொற்களை வைத்து alphabet என்ற அகரவரிசைப் பெயரை முன்பு மொழியியலில் உருவாக்கினார்கள்.)
இந்த அபுகிடா எழுத்துக்களுக்கு என்று ஒரு சில வரையறைகளையும் இவர்கள் சொல்லுகிறார்கள்; இவர்கள் கூற்றின் படி அகர உயிர்மெய்கள் தான் தமிழ் போன்ற மொழி எழுத்துக்களுக்கு முகன்மையானவையாம்; தனி மெய்கள் எல்லாம் இவற்றின் வழியே வந்தவையாம்; மெய்யெழுத்துக்களில் எப்பொழுதுமே உள்ளார்ந்த அகரம் இருப்பது தான் இயற்கையாம்; அவற்றிற்குப் புள்ளி வைத்துக் குத்தினால் (literally they say, if you kill) உயிர்போன பிணங்களாய்த் தனி மெய்கள் வந்துவிடுமாம்; ஒவ்வோர் உயிர் எழுத்திற்கும் இரண்டு வரிவடிவங்கள் உண்டாம்; ஒன்று நேரிய (direct vowels) வடிவாம்; இன்னொன்று நேரிலா (indirect vowels) வடிவாம். நேரிலா உயிர் வடிவையும், அகர உயிர்மெய்யையும் அருகருகில் வைத்தால் உயிர்மெய் எழுத்துக்கள் உருவாகி வந்துவிடுமாம் - இப்படி ஒரு பொதியீடு அற்ற கட்டுமானத்தை ஆகாயத்தில் எழுப்பி, ஒரு மொழியில் ஒலியெழும் முறைக்கும் உரு எழும் முறைக்கும் தொடர்பே கிடையாது என்பதாய், "கணித்திரையில் எழுத்துக்களைக் காட்டுவது ஒன்றே குறியேற்றங்களின் குறிக்கோள்" என்னுமாப் போல, ஒரு பொருந்தாத் தேற்றைக் (theory) கொண்டு வந்து, அந்தத் தேற்றுக்கு அணைவாகத் தவறான வகையில் தொல்காப்பியத்தையும் எடுகோளாய்க் (reference) காட்டிக் கொண்டு, "தொல்காப்பியத்தைப் பின்பற்றித்தான் ஒருங்குறியேற்றம் இருக்கிறது" என்று முழுப் பூசனியைச் சோற்றில் மறைத்துச் சொல்லி, நம்மையெல்லாம் ஏமாற்றி வருகிறார்கள்.
அப்படியெனில் "இது நாள் வரை பள்ளிகளில் படித்த கூற்றுகள் தப்பா?" என்று நாம் எல்லாம் திகைத்துப் போய் நிற்கிறோம். முற்றிலும் முரணான ஒன்றைச் சொல்லி நம்மை முட்டாளாக்கி வரும் இவர்களுக்கு மறுப்புக் கூறும் முகமாகத் தான் "தமிழெழுத்து என்பது மெய் - உயிர் என்பதை அடிப்படையாகக் கொண்ட ஓர் அசையெழுத்தே; அது அபுகிடா அல்ல" என்று கூற இந்தத் தொல்காப்பியத் தொடரைத் தொடங்கினேன். என் நிலையை விளக்கும் முகமாக அசைநிலை எழுத்திற்கும் அபுகிடா எழுத்திற்கும் உள்ள வேறுபாடுகளை ஆங்காங்கே இந்தத் தொடரில் கூறியிருக்கிறேன். தொல்காப்பியம் - எழுத்ததிகாரம் - நூன் மரபு பற்றிய இந்தத் தொடரில் இது தான் நிறைவாகும் கடைசிப் பகுதி.
இனிப் 14- ஆம் நூற்பாவிற்குப் போவோம்.
14. தெரியும் காலை
உட்பெறு புள்ளி உருவாகும்மே
"ஆராயும் இடத்து, மகரமானது பகர வடிவின் உள்ளே புள்ளி பெற்று உருவம் காட்டும்" என்ற பொருளைக் காட்டி, மகரத்தின் உருவத்தை இந்த நூற்பா சொல்லுகிறது. குறித்துக் கவனிக்க வேண்டியது: உட்பெறு புள்ளி என்ற சொல்லாட்சி. பகரத்தின் உள்ளே பெறும் இந்தப் புள்ளி மகரத்தை உருவாக்கும் என்று தொல்காப்பியர் சொல்லுகிறார். [தவிர மகர மெய்யை எழுதும்போது, தொல்காப்பிய முறையில் இன்னொரு புள்ளி, புறத்தில் பெறும் புள்ளியாய் அமையும்.]
மற்ற மெய்யெழுத்துக்களுக்கெல்லாம் உருவத்தை வரையறுக்காது, மகரத்திற்கு மட்டும் தொல்காப்பியர் இங்கே உருவம் காட்டியது தமிழியின் விதப்பைக் காட்டத் தான் என்று புரிந்து கொள்ள வேண்டும். மகரமானது தமிழிக்கும் பெருமிக்கும் இடையே உருவத்தில் சற்று வேறு பட்டது. பெருமியில் இந்த மகரத்தை x என்று காட்டி, கீழே ஒரு வளைவு கொண்டு சேர்த்திருப்பார்கள். தமிழியிலோ ப என்று பழைய எழுத்தைப் போட்டு கீழே உள்ளது போல் அதன் வலது கையில் ஒரு குறுக்குக் கோடோ , அல்லது இருகையும் சேர்த்தாற் போல ஒரு குறுக்குக் கோடோ போட்டுக் காட்டுவார்கள். (பார்க்க: கீழே உள்ள படம்.) பகரத்துள் உட்பெறு புள்ளி போட்டு மகரத்தைக் காட்டும் தொல்காப்பிய எழுத்து நிலையை கல்வெட்டின் வழி காண முடியவில்லை. ஆனால், தமிழியில் வரும் அந்தக் குறுக்குக் கோடு புள்ளியின் நீட்சியாக இருக்க முடியும் என்ற பட்டுமையை (possibility) நாம் உணருகிறோம்.
அடுத்த இரண்டு நூற்பாக்களும், மேலே சொன்ன 6வது எழுத்து முறையை அழுத்தமாக ஒத்துப் போகின்றன.
15. மெய்யின் இயற்கை புள்ளியோடு நிலையல்
16. எகர ஒகரத்து இயற்கையும் அற்றே.
"புள்ளியோடு இருப்பது தான் மெய்களுக்கான இயற்கை; எகர ஒகரங்களின் இயற்கையும் அவ்வாறே" என்று சொல்லும் போது நாவலந்தீவில் விரவிக் கிடந்த 3-வது எழுத்து முறையை முற்றிலும் மறுதலித்து, மெய்க்கும் அகர உயிர்மெய்க்கும் வேறுபாடு காட்டும் முகத்தான், 6 வது எழுத்து முறையை இங்கே தொல்காப்பியர் பரிந்துரை செய்கிறார் என்பது புரியும். மற்ற இடங்களில் எல்லாம் "என்மனார் புலவர்" என்று தொல்காப்பியர் சொல்லும் போது நெடுநாள் புழக்கம் இருந்திருக்கலாம் என்று உணர்ந்து கொள்ளுகிறோம். ஆனால், 14-17ம் நூற்பாக்களில் "என்மனார் புலவர்" என்று உணர்த்தாத காரணத்தால், தொல்காப்பியர் காலத்திற்கு அண்மையில் தான் இந்த மாற்றங்கள் ஏற்பட்டிருக்க வேண்டும் என்றும் ஊகிக்கிறோம்.
எகர, ஒகரங்களுக்கு புள்ளி காட்டியதும், பெருகதத்தில் இருந்து தமிழை வேறுபடுத்திக் காட்டத்தான் என்று புரிந்து கொள்ள வேண்டும். தமிழில் பல சொற்கள் எகர, ஏகாரத்தில் இருவிதமாய்த் தொடங்கினாலும், எல்லா இடத்திலும் ஒரே விதப் பொருளைத் தருவதில்லை; (காட்டாக எது, ஏது என்று சொல்லும் போது ஒரே பொருள் வரும், ஆனால் எல், ஏல் என்னும் போது ஒரே பொருள் தராமல், வேறு பொருள்கள் தரும். ஆகத் தமிழில் குறிலுக்கும் நெடிலுக்கும் இடையே உள்ள விதப்பைக் காட்ட வேண்டிய அவ்வயம் (அவசியம் = கட்டாயம்) எப்பொழுதும் உண்டு. மொத்தத்தில், இந்த 16-ம் நூற்பாவின் மூலம் தமிழி என்ற எழுத்து முறை பெருமியில் இருந்து முழுதாக விதப்பிக் காட்டப் படுகிறது.
அடுத்த 17- ஆம் நூற்பா என்பது பெரிதும் முகன்மையானதும், பலராலும் தவறாகப் புரிந்து கொள்ளப் பட்டதும் ஆகும்.
புள்ளி இல்லா எல்லா மெய்யும்
உருவு உருவாகி அகரமோடு உயிர்த்தலும்
ஏனை உயிரொடு உருவு திரிந்து உயிர்த்தலும்
ஆய் ஈர் இயல உயிர்த்த வாறே.
இந்த நூற்பாவைப் படிக்கும் போது,
"எல்லா மெய்யும் புள்ளி இல்லா
உருவு உருவாகி அகரமோடு உயிர்த்தலும்,
உருவு திரிந்து ஏனை உயிரொடு உயிர்த்தலும்
ஆய் ஈர் இயல உயிர்த்த வாறே "
என்று சேர்த்துப் பொருளைப் புரிந்து கொள்ள வேண்டும்.
இதற்கு முந்திய நூற்பாக்களில் புள்ளியுள்ள எல்லா மெய்களையும் தொல்காப்பிய நாடகக்காரர் நமக்கு அறிமுகப் படுத்தியிருக்கிறார். இப்பொழுது இந்த நூற்பாவில், "எல்லா மெய்களில் இருந்து புள்ளியை இல்லாது ஆக்கினால் வரும் உருவை, அப்படி ஏற்படும் போது, அகரமோடு உயிர்த்து ஒலிக்க வேண்டும்" என்று சொல்லுகிறார். கூடவே "உருவு திரிந்து வரும் போது ஏனை உயிர்களோடு உயிர்த்து ஒலிக்க வேண்டும்" என்று சொல்லுகிறார். "இப்படி உயிர்மெய்களை உயிர்த்து ஒலிக்கின்ற வழி இரண்டு வகையானது" என்று சொல்லி முடிக்கிறார்.
ஆழ்ந்து ஓர்ந்து பார்த்தால், இந்த நூற்பாவில் கருத்தா(subject)வாய் வருவது "மெய்யெழுத்துக்களே" என்று புரியும். [ஒரு வாக்கியத்தில் சொல்லப்படும் வினையைச் செய்கிறவர் கருத்தா என்பது தமிழ் இலக்கண நெறி. "நான் பாடம் படித்தேன்" என்ற வாக்கியத்தில் படித்தல் என்பது வினை; நான் என்பது கருத்தா; பாடம் என்பது செயப்படு பொருள் (object)] "மெய்யெழுத்துக்களில் புள்ளியில்லாமல் போனால் உருவு திரியாது; அந்த நிலையில் அகரத்தோடு உயிர்த்து ஒலிக்க வேண்டும்; மாறாக மெய்யெழுத்துக்களின் உருவு திரியும் பொழுது, ஏனை உயிர்களோடு உயிர்த்து ஒலிக்க வேண்டும்" என்று சொல்லிய காரணத்தால் மெய்யிலிருந்துதான் மற்ற உயிர்மெய்களுக்கு தொல்காப்பியர் அடையாளம் காட்டுகிறார் என்ற உண்மை தெள்ளத் தெளிவாகப் புரிகிறது.
"அகர உயிர்மெய்க்குப் புள்ளியைப் போடு; மெய்யெழுத்துக் கிடைக்கும்; அகர உயிர்மெய்க்கு மற்ற குறியீடுகளைச் சேர்; அதனால் மற்ற உயிர்மெய்கள் கிடைக்கும்" என்று தொல்காப்பியர் இங்கு சொல்லவே இல்லை. ஏனென்றால், தொல்காப்பியரைப் பொறுத்தவரை மெய்யெழுத்துக்கள் என்பவை தாம் (கணக்கு-maths, ஏரணம்-logic போன்றவற்றில் சொல்லுவது போல) "முன்னவை - primitives" ஆக இருக்கத் தகுந்தவை. தொல்காப்பியர் மட்டுமல்ல, எல்லாத் தமிழ் இலக்கணங்களிலும் மெய்யெழுத்துக்கள் என்பவை தாம் முன்னவையாகவே சொல்லப் பட்டிருக்கின்றன. ஒவ்வொரு தமிழ்ப் பாடவகுப்புக்களிலும் கால காலமாய் எழுத்தைச் சொல்லிக் கொடுக்கும் போது, மெய்யெழுத்துக்களின் முன்னமை தாம் தேவையான அளவு மாணாக்கருக்கு அழுத்தமாய்ச் சொல்லப் பட்டிருக்கிறது. தமிழுக்குப் புது இலக்கணம் படைக்க விழையும் இந்த ஒருங்குறிக் காரர்கள் தான் அகர உயிர்மெய்களை முன்னவை ஆக்கி, வரலாற்றுப் பிழையை உருவாக்குகின்றனர். மொத்தத்தில் தமிழ் இலக்கணம் இவர்களால் குப்புறத் தள்ளப்படுகிறது.
மெய்களைத் தொல்காப்பியர் முன்னவை ஆக்கியதில் ஒரு மெய்யியற் (philosophy) கூறும் கூட உள்ளே இருக்கிறது. இந்த மெய்யியலின் படி, "மெய்கள் என்பவை, தானே தனித்து இயங்கா உடலைப் போன்றவை. அந்த மெய்களும் பலவிதம் தான். மெய்யெழுத்துக்களை உயிர்களின் துணை கொண்டு ஒலிக்கச் செய்தலே அவற்றை இயங்க வைப்பது என்று சொல்லப் படும். ஒவ்வொரு உடலுக்குள்ளும் வெவ்வேறு உயிர்கள் போக முடியும். காட்டாக ஆகார உயிர் போனால், க், ங், ..... ன் என்னும் மெய்கள் கா, ஙா, .....னா என்று ஒலித்து இயங்கும். இது போல வெவ்வேறு உயிர்கள் போய், நீ, து, பூ, மெ, ரே என்று வெவ்வேறு விதமாய் மெய்களை ஒலித்துக் காட்டும்.
இந்த நிலையில் க என்று சொல்லும் போதே அந்த உடலுக்குள் ஓர் உயிர் உள்ளே போய்விட்டது என்றும், இனி அதே மெய்க்குள் இன்னொரு உயிர் போக முடியாது என்பதால், அகர உயிர்மெய்க்கு சட்டையும் குப்பாயமும் (coat) போட்டு இன்னொரு உயிராகக் காட்டிச் சொல்லுவது முட்டாள் தனமானது என்றும் புரிந்து கொள்ளவேண்டும். உடல்/உயிர் ஒப்புமை என்பது எழுத்து, ஒலி என்ற இரண்டு வகையானும் ஒத்திசைவு (consistency) கொண்டது. எனவே மெய்யோடு குறியீடுகள் சேர்ந்து பல்வேறு உயிர்மெய்களைக் காட்டுகிறோம் என்பது தான் அறிவியல்/மெய்யியலின் பாற்பட்ட உண்மையாகும்.
இனி உருவு திரிந்து உயிர்த்தல் என்பதற்கு,
----------------------------------
மேலும் கீழும் விலங்கு பெறுவன விலங்கு பெற்று உயிர்த்தலும், கோடு பெறுவன கோடுபெற்று உயிர்த்தலும், புள்ள்பெறுவன புள்ளி பெற்று உயிர்த்தலும், புள்ளியும் கோடும் உடன்பெற்று உயிர்த்தலும் எனக் கொள்க
--------------------------------
என்று இளம்பூரணர் தன் உரையில் சொல்லுவார். அதாவது இளம்பூரணர் காலத்தில் கி, கீ என்பதில் இருக்கும் ஒட்டுக்கீற்றை மேல்விலங்கு என்று சொல்லுவதும், கு, கூ என்றவற்றில் இன்றைய உருவம் பெறாமல் கீழ்விலங்காகவே இருந்ததும், கோடு என்பது கொம்பாகாமல் இருந்ததும், பக்கவாட்டுப் புள்ளி என்பது (மேற்புள்ளி இன்றையப் பொருளையே கொடுத்தது.) காலாகாது இருந்ததும் நம்மால் அறிந்து கொள்ள முடிகிறது. இதே நூற்பாவிற்கு, இன்னும் ஒரு இருநூறு ஆண்டு கழித்து நச்சினார்க்கினியர் உரையில், இப்படி வருகிறது.
-------------------------
'உருவு திரிந்து உயிர்த்தலாவது' மேலுங் கீழும் விலங்கு பெற்றும், கோடு பெற்றும், புள்ளிபெற்றும், புள்ளியும் கோடும் உடன் பெற்றும் உயிர்த்தலாம்.
கி, கீ முதலியன மேல்விலங்கு பெற்றன. கு, கூ முதலியன கீழ்விலங்கு பெற்றன. கெ, கே முதலியன கோடு பெற்றன. கா, ஙா முதலியன புள்ளி பெற்றன. அருகே பெற்ற புள்ளியை இக்காலத்தார் காலாக எழுதினார். மகரம் உட்பெறு புள்ளியை வளைத்து எழுதினார். கொ, கோ, ஙொ, ஙோ முதலியன புள்ளியும் கோடும் உடன்பெற்றன.
----------------------
மேலே சொன்னதின் படி, கால் என்ற பெயரும், உருவும் இளம்பூரணருக்கும், நச்சினார்க்கினியருக்கும் இடைப்பட்ட காலத்தில் தோன்றிய கதையை உணரலாம். இன்று பார்க்கிற இரட்டைக் கொம்பு அன்று இல்லை. கொ என்பதில் கல்வெட்டுக்களின் படி மேலே ஒரு புள்ளியும் பக்கப் புள்ளியும் இருந்தது, பின்னால் அது மேல்புள்ளியும் பக்கத்தில் ஒரு காலுமாய் மாறிப் போயிற்று. (மேற்புள்ளி போய், ஒற்றைக் கொம்பு இன்று பார்க்கும் இரட்டைக் கொம்பாக மாற, ஒரு 350 ஆண்டுகள் கழிந்து, வீரமா முனிவர் வரவேண்டும்.)
காலத்தால் இன்னும் அருகே வந்த போது (1500 --> 1850) கோடு என்ற சொல் கொம்பு என்ற இன்னொரு சொல்லாய் மாறியது. (கோடு என்பது இந்தக் காலத்தில் வளைவுப் பொருளில் பழகுவது அருகிப் போயிற்று. இந்தப் புழக்கம் குறைந்ததே கோட்டிற்கு மாறாய் கொம்பு என்ற சொல் ஏற்பட்டதற்குக் காரணம்.) அதே போல விலங்கு என்ற சொல்லும் வளைவு என்ற பொருளை இன்று சட்டென்று பலருக்கும் சுட்டுவதில்லை. சொற்பொருட் தொகுதியை இன்றையத் தமிழர் தொலைத்த காரணத்தால் கொக்கி என்று பழகுகிறார்கள். பள்ளிகளிலும் அப்படியே சொல்லிக் கொடுக்கிறார்கள்.
இனிப் பதினெட்டாம் நூற்பாவையும், அதற்கு இளம்பூரணர் உரையையும் பார்ப்போம்.
---------------------------
18. மெய்யின் வழியது உயிர்தோன்று நிலையே
இஃது, உயிர்மெய்யுள் உயிரும் மெய்யும் நிற்குமாறு உணர்த்துதல் நுதலிற்று.
உயிர் - உயிர்கள், மெய்யின் வழியது - மெய்களின் பின்னவாம், தோன்றும்நிலை - தோன்றும் நிலைமைக் கண் என்ற வாறு.
'தோன்று நிலை' என்றதனான், உயிர்மெய்களைப் பிரிக்குமிடத்தும், கூட்டுமிடத்தும், அவ்வாறே முன்னும் பின்னும் ஆதலைக் கொள்க. மெய்யும் உயிரும் முன்னும் பின்னும் பெற நிற்கும் என்றமையான், அக்கூட்டம் பாலும் நீரும் போல உடன் கலந்தன்றி, விரல்நுனிகள் தலைப்பெய்தாற் போல வேறுநின்று கலந்தனவல்ல என்பது பெறுதும்.
-----------------------------------------------------
அதாவது, மெய்யின் வழியது உயிர் தோன்று நிலை என்றதால் உயிர்மெய்யில் முதலில் நிற்பது மெய்யொலியும், பின்னால் தோன்றுவது உயிரொலி என்றும் விளங்கும். உயிர்மெய்க்கான கூட்டுப் பெயரைக் கூட மெய்ப்பெயரை முதலிற் சொல்லி உயிர்ப்பெயரைப் பின்னே சொல்லுதல் சரி என்றே விளங்கும். அதாவது ககர அகரம், ககர ஆகாரம், ககர உகரம். இதற்கு எடுத்துக் காட்டாய் தொல்காப்பியம் எழுத்ததிகாரம், இளம்பூரணம், தமிழ்மண் பதிப்பக வெளியீட்டில் (2, சிங்காரவேலர் தெரு, தியாகராயர் நகர், சென்னை - 600 017 தொ.பே. 2433 9030) பக்கம் 34ல், புலவர் இரா. இளங்குமரன் "பகர உகரம்" என்று சொல்லுவார். (இந்தத் தொகுப்பை பதிப்பித்தவர்கள்: பண்டித வித்துவான் தி.வே. கோபாலையர், முனைவர் ந. அரணமுறுவல்).
மேலே வரும் இளம்பூரணர் உரையில் அவர் காட்டிய இரண்டு உவமைகள் ஆழ்ந்து உணர வேண்டியவை. "உயிர்மெய் எழுத்துக்கள் என்பவை அடுத்தடுத்து நிற்கும் இரண்டு விரல்களைப் போல என்று கொள்ளாதீர்கள் அப்பா, அவை பாலுள் கலந்த நீரைப் போல" என்று ஓர் அருமையான உவமையை அவர் காட்டியிருப்பார்.
ஒருங்குறிக்காரர்களோ அடுத்தடுத்து நிற்கும் விரல்களைப் போலத்தான் உயிர்மெய் குறியேற்றங்களைச் செய்திருக்கிறார்கள். ஒருங்குறியின் படி ஒவ்வொரு உயிர்மெய்யும் (ஏன் தனி மெய்யும் கூட) இரண்டு குறிப்புள்ளிகளின் (code points) தொகுதி (அதாவது இரண்டு விரல்களைப் போலக் கொள்ளப் பட்டுப் பின் ஏதோ ஒரு பிணைப்பின் மூலம் அந்தத் தொகுதியை ஒரு கட்டாகப் (bundle) பிணைத்து வைத்திருப்பார்கள். காட்டாக, கெ என்பதைக் கொம்பு மற்றும் க என்பதன் தொகுதியாகக் கொண்டு இந்த இரு குறிப்புள்ளிகளையும் ஒரு கட்டாகக் கணுத்திக் (to connect) கொண்டு இருப்பார்கள். [இரண்டு விரல்களையும் நூல் போட்டுக் கட்டுவது போல இதை புரிந்து கொள்ளலாம்.] ஒரு ஆவணத்தின் நெடுகிலும், இது போன்ற இரண்டு குறிப்புள்ளிகள், (சில இடங்களில் மூன்று குறிப்புள்ளிகள் கூட) ஒரு கட்டாகக் காட்சியளிக்கும்; அதாவது தமிழ் ஆவணம் என்பது குறிப்புள்ளிக் கட்டுகளால் (bundles of code points) பெரிதும் ஆனதாய் தோற்றமளிக்கும். தமிழ் ஆவணத்தின் கொண்மை (capacity) கூடிப்போவது இது போன்ற குறிப்புள்ளிக் கட்டுகளால் தான்.
தவிர முன்னே சொன்னது போல் பாலில் இருந்து நீரைப் பிரிக்க முடியாது என்பது போன்ற உவமையை ஒழுங்காகப் புரிந்திருந்தால், ஒவ்வொரு உயிர்மெய்க்கும் தனிக் குறிப்புள்ளி கொடுப்பது தான் தொல்கப்பியத்தின் அடியூற்றாக, இளம்பூரணர் பரிந்துரைப்பதாகக் கொள்ளமுடியும்.
ஆனால், நாம் சொல்லுவதைக் கேட்பதற்கு யார் அணியமாய் இருக்கிறார்கள்? எங்கு பார்த்தாலும், தாராளவாதமும், உலகமயமாக்கலும் கூடிப்போய், வெளிநாட்டுக் கும்பணிகளின் கைப்பிடிக்குள் சிக்கிக் கொண்டு புதுக் குடியேற்ற அடிமையாக (neo colonial underlings) அல்லவா, இந்த நாவலந்தீவும், தமிழ்கூறும் நல்லுலகமும் ஆகிக் கொண்டிருக்கிறது? இந்த நிலையில் தொல்காப்பியமாவது, ஒன்றாவது? "தூக்கிக் குப்பையில் கடாசு; ஒருங்குறி என்ற சோதியில் கலந்துவிடுங்கள்" என்றே இடைவிடாது உபதேசம் இங்கு நடந்து கொண்டிருக்கிறது.
ஒருங்குறிக்கு எதிர்வினையாக எழுந்த அனைத்து எழுத்துக் குறியேற்றம் (All Character Encoding - ACE) [இதை Tamil New Encoding - TANE என்றும் Tamil All Character Encoding - TACE என்றும் இப்பொழுது சொல்லுகிறார்கள்] கூட நம்மவரின் சோம்பற் தனத்தால், உரிய காலத்தில் செயத் தக்க செய்யாமையினால், சவலைப் பிள்ளையாகத் தொய்ந்து கிடக்கிறது.
"கண்ணிரண்டும் விற்றுச் சித்திரம் வாங்கினால் கைகொட்டிச் சிரியாரோ?" என்ற கூற்றோடு இந்தத் தொடரை நான் முடித்துக் கொள்ளுகிறேன். பொறுமையுடன் இதுகாறும் படித்த அன்பர்களுக்கு நன்றி.
அன்புடன்,
இராம.கி.
11 comments:
iraamaki aiyaa... (using public computer, so in English, sorry!)
I read the entire series of these articles with patience. An excellent work! I cannot imagine the hardwork that has gone into this. Appreciate your energy in constantly arguing for correcting the injustice done to TA in Unicode.
More than the Unicode consortium (what do they know about Tamil?) the blame should lie on the ISCII, GOI organizations that exhibited such carelessness and had the arrogance (may be it is a strong word) to (mis-)represent Tamil's case. I see in the newsgroups that we are constantly being asked to work with INFITT et.al. May be the lack of unified voice among us is also a big reason that it has not gained traction.
I am watching the ACE/TANE attempts also eagerly, but not sure what is happening and I presume people like you are also not entirely happy with what is going on (based on your previous posts here).
Then again, we have the 'stability policy' which is constantly put forward by the consortium! I am all for stability as long as things were done right in the first place.
Some argue that it is late, but may be it is better late than never!
Transliterating between Indian languages was such an artificial need that ISCII started out with which could be the base cause of this problem.
Strong arguments put forward by you here with such support from experts, inscriptions and grammer would clearly distinguish between these Indian(ized) languages.
orumukamaana thEsiyam thamizukkuth thantha parisu ithu thaan! :-(
All said, I am confused about the course of action. TANE residing out of the BMP is not going to help. Will it be better to reserve space in the PUA exclusively for Tamil? I don't know.
I request you to post here as and when you can regarding these. Thank you.
Once again, excellent work!
அனைத்து தமிழ் எழுத்துக்களுக்கும் ஒரு ஒருங்குறி இடம் தேவை என்ற உங்கள் கருத்தை நிறுவியிருக்கின்றீர்கள். இதை ஏன் சிலர் தவிர்க்க முனைகின்றார்கள், அல்லது முதலிலேயே ஏன் இந்த முறையை ஏற்படுத்தவில்லை என்பதில்தான் எனக்கு தெளிவில்லை.
காலுக்கு தகுந்த செருப்பு என்பதற்கு பதிலா செருப்புக்கு தகுந்த மாதிரி காலை செதுக்கிக்க வேண்டும் இல்லாவிடில் நமக்கு செருப்பே கிடைக்காது என்று ஒருங்குறிகாரர்கள் கூறுவதை நன்றாக விளக்கியுள்ளீர்கள்.
நம் மொழியின் தன்மை குறித்து நாம் தான் சொல்ல வேண்டும் ஒருங்குறிகாரர்களுக்கு என்ன தெரியும்?
ஒருங்குறி அமைப்பிடம் நம் மொழியின் தன்மையை கூறி நமக்கு அதிக இடங்களை வாங்குவதில் இவர்களுக்கு என்ன சிக்கல் என்று புரியவில்லை.
ஐயா, வனக்கம்.
அருமையானதொரு தொடர்.
ஏரணம் இல்லா ஒருங்குறி ஆதரவு
என்பது ஒரு வித சலிப்பையே தருகிறது.
ஒருங்குறிப் பிரியர்களிடம் மாற்றுக் கருத்துக்கள்
இருப்பது தவறில்லை. ஆனால், அது ஏரணம்
இல்லாமல், மொழியியல், நுட்பியல் இரண்டிற்கும்
பொருந்தாத நிலையில் இருக்கும்போது
ஒருங்குறிப் பிரியர்களின் வாதங்கள் வெற்று
வாதங்களாகவே இருக்கின்றன. இது கணித்தமிழ் வளர்ச்சிக்குப் பெரும் தடையாகும்.
ஒருங்குறி ஆதரவாளர்களையும் தங்கள்
கட்டுரை மாற்றி சரியான முறைக்கு
அவர்களின் குரல்களையும் பெற இக்கட்டுரை
வழிகோலும் என்று நம்புகிறேன்.
அன்புடன்
நாக.இளங்கோவன்
Dear Selvaraj,
Thank you for reading this series patiently. Many in the blogospehere may not show that kind of intensity. This issue of encoding also does not get much of attention that it deserves. Most are quite happy to see their writing in a computer screen through internet.
Many do not seem to demand further requirements of language computing. Even the folks in the language software/IT field don't seem to be interested; they don't ponder about the problems faced especially when we transport Tamil language documents across platforms. [As long as we handle Microsoft platforms, the present unicode may work; the moment we transcend the platforms, incompatibilities creep in; the need to keep vowelized consonants as combined categories is the core issue.]
The problem started from ISCII coding created by CDAC and it continued due to the laziness, lethargy and political infighting of Tamils vis-a-vis TSCII/TAB. With two major political parties of the state in near enmity, each one wanted to score political milege, while they never had the courage to confront the Central Govt on this matter; perhaps with the new minister from Tamil Nadu, this may change.
Even though there were representation in the Unicode Consortium by the Govt. of india and Govt. of TN, they were not effective. The need for acknowledging explicitly the Vowelized consonants was never put forth to the Unicode consortium strongly. [Argument about stability policy by the Unicode Consortium is just to forstall any changes proposed by the respective language speakers.]
Often enough, the representative from TN did not even attended the Unicode meetings, because of the peculiar Indian problems of who would foot the travel bills. Enough said about our bureaucracy.
During all these tardiness, the valuble real estate in the Unicode encoding space got nearly filled. Now we are talking about PUA and not BMP because of all these delays. At the same time, unusual problems require unusual solutions; hence the asking of space in PUA and legitimizing the same. The Unicode Consortium may strongly resist this attempt.
As for the TANE attempts, let us wait for the final recommendation report of the committee constituted by GoTN. You may access various comments / view points expressed in the yahoo group tune_rfc.
Your sttement "orumukamaana thEsiyam thamizukkuth thantha parisu ithu thaan! :-(" may be quite valid. But then, if we say so explicitly, there are hundreds of people who will jump on us.
However I intend to carry on expressing my reservations on unicode in as many forum as possible.
With regards,
iraamaki
அன்பிற்குரிய நற்கீரன்,
நம்முடைய கையாலாகத தன்மையால்
(இந்திய அரசு, தமிழக அரசு ஆகியவற்றின் தடுமாற்ற நிலை,
ஈழம் அமையாத சூழ்நிலையில் சிங்கள அரசைச் சார்ந்திருக்கும் நிலை,
சிங்கப்பூர், மலேசிய அரசுகள் இந்திய, தமிழ்க அரசுகளின் முன்முனைப்பையே பின்பற்றும் நிலை
- இன்னபிற காரணங்களால்)
இந்தச் சிக்கல் நீளுகிறது. அரசியல் அதிகாரம் ஒன்றுதான் இதைச் சரிசெய்து, ஒருங்குறிச் சேர்த்தியத்தை வழிக்குக் கொண்டுவரமுடியும். அது நடக்குமா என்பது குதிரைக் கொம்பே!
நம்மைப் போன்றவர்கள் திருப்பித் திருப்பிச் சொல்லிக் கொண்டு இருக்க வேண்டியது தான் நாம் செய்யக் கூடியது.
அன்பிற்குரிய நயனன்,
உங்கள் கருத்திற்கு நன்றி.
இப்போதைய இளைய அமைச்சராவது அரசியல் அதிகாரத்தைப் பயன்படுத்தி எல்லோரையும் வழிக்குக் கொண்டுவந்து இந்தச் சிக்கலைச் சரிசெய்வார் என்று ஆவலுடன் எதிர்பார்க்கிறோம்.
அன்புடன்,
இராம.கி.
அன்பிற்குரிய குறும்பன்,
உங்கள் பெயரையும் மேலே சேர்த்திருக்க வேண்டும். தவறியதற்கு மன்னியுங்கள்.
அன்புடன்,
இராம.கி.
ஆறு கோடிக்கு மேல் தமிழகத்தில் தமிழன் வாழ்ந்தாலும் அவன் சிந்தும் வியர்வைத் துளியில் ஒரு தமிழ்க் கணி உருவாக்க முடியாதவர்களாகத் தமிழர்கள் நிற்கின்றனர். தமிழ்நாட்டில் கணி கற்றவன் எல்லாம் பனிபெய்யுற நாட்டுக்குப்போய் தங்கள் தொனியைக் குறைத்து சனிபிடிச்சவன்போல் தமிழ்மேல் பரிவே காட்டுகிறார்கள் இல்லை.
தமிழகத்தைச் சேர்ந்தவர்தானே இந்திய உள்ளுரும நுட்பியல் துறையில் பெரும் பதவி வகிக்கின்றார். அவரால் அதைச் செய்யமுடியாதா!
அய்யா இராமகி உங்களைப் போன்றவர்கள் முனைந்தால்தான் தமிழர்களுக்கு நல்ல கணி கிடைக்கும். தமிழில் உள்ள கணி வல்லுநர்கள் இலாபகரமற்ற செயலென்று தமிழைக் கணியில் வளர்க்க முன்வரமாட்டார்கள். அவர்களை ஈர்க்க வேண்டிய கடமை தமிழக அரசுக்கு உள்ளது.
இராமகி அய்யா உங்களால் முடிந்தால் யாராவது ஐந்தாறுபேரை ஒன்றிணைந்து உங்கள் அறிவுக்கூர்மையைப் பயன்படுத்தி தமிழ்க் கணிமாற்றங்களை உண்டுபண்ணுங்கள். அதற்கான நிதியுதவியை நம்மில் பலர் செய்வார்கள். ஒருக்காவாது முயன்றுதான் பாருங்களேன்.
இல்லையென்றால் எது எவ்வாறு இருக்க வேண்டுமென்ற வகையில் தெளிவான தமிழ்க் கணி சம்பந்தமான பதிவுகளை முன்வையுங்க்ள. அவற்றை நம் கண்களிலும் மனதிலும் வைத்துக் கனவாக்குவோம்.
அன்புசால் நண்பர் இராம.கி அவர்களுக்குக்
கனிவான கைகுவிப்பு!
இனிய நல் வாழ்த்துகள்.
தங்கள் பதிப்புகள் சிலவற்றைக் கண்டிருந்தாலும்
தங்கள் வலை (வளவு)ப்பூவை
அடியேனுக்கு அறிமுகப் படுத்தியவர்
என்னருமை நண்பர் நாகரத்தினக் கிருட்டிணா -('நீலக்கடல்' ஆசிரியர்)அவர்கள்தாம்.
தங்கள் படைப்புகளை வெறுமனே அருமை என்று சொல்லிச் செல்வதில் பொருள் இல்லை!
அவை -ஆணித்தரமான கருத்துகளை, ஆணித்தரமாக அறிவிப்பவை!
அறிவும் உள்ளீட்டுச் செறிவும் நிறைந்தவை!
பாவாணர் வழி நின்று தனித்தமிழில் எழுதும் தங்கள் திறனும் அத்தமிழில் தாங்கள் உணர்த்தும் கருத்தகளின் உரனும் பாராட்டுக்குரியன.
'தொல்காப்பியமும் குறியேற்றங்களும் -7'
என்ற கட்டுரையை மிகவும் சுவைத்துப் படித்தேன். குறிப்பாக, இளம்பூரணர் குறிப்பிடும் உவமை வழி நின்று
"ஒவ்வொரு உயிர்மெய்க்கும் தனிக் குறிப்புள்ளி கொடுப்பது தான் தொல்காப்பியத்தின் அடியூற்றாக, இளம்பூரணர் பரிந்துரைப்பதாகக் கொள்ளமுடியும் " என்று முடிவுரை தருவது மிக மிக நன்று.
பொருத்தமான முடிவு இதுவே என்பதைத் தொல்காப்பியத்தையும் இளம்பூரணரையும்
கற்றுத்துறை போனவர்கள் மட்டுமே ஒப்புக்கொள்வர்.
இற்றைக் கணி வல்லுநர்க்கு ஆழ்ந்த தமிழிலக்கண அறிவு இல்லை,
தமிழிலக்கணம் மட்டுமே நன்கறிந்த புலவர்க்கோ கணிப்பொறி ஞானம் அறவே இல்லை! இரு வகைப் புலமையும் பெரிதும் பெற்ற தங்களைப் போன்றோர் வெகு குறைவே! இந்த இடைவெளி குறைந்தாலொழிய, சிக்கல் தீர வழியில்லை!
அது வரை ஆலையில்லா ஊருக்கு இலுப்பம் பூ, ச(ர்)க்கரைதான்!
தங்கள் ஏனைய முதலாறு பகுதிகளையும் படிக்க ஆவல். தேடிப்பார்ப்பேன் -கிடைகவில்லை என்றால் தங்களை நாடி வருவேன். தாங்கள் தான் எளியேனுக்கு அனுப்பி உதவ வேண்டும்.
அடுத்து, அடியேன் படித்தது தங்களின் 'தமிழென்னும் கேள்வி'!
கேள்வியா அது! தமிழை நம்மவர்க்குக் கொண்டு சேர்க்கத் தாங்கள் நடத்திய வேள்வி அல்லவா!
தமிழனுக்குத் தமிழனாய்ப் பிறந்த பிள்ளைக்குத் தமிழ் தெரியவில்லை என்ற அவக்கேடு தமிழகத்தில்தான் மலிந்து வருகிறது.
வெளிநாடுகளில் வாழும் தமிழர்களாகிய நாங்கள் இந்த இழிநிலை நமக்கு ஒருக்காலும் வரக் கூடாது என்று எங்கள் பிள்ளைகளுக்கு, இளைய சமுதாயத்துக்கு நம் மொழி அறிவைப் புகட்டி வருகிறோம். அதே சமயம் தமிழ் பற்றிய அக்கரை இல்லாப் பெரியவவர்களுக்கும் தமிழறிவும் கொளுத்தி வருகிறோம்.
எனவேதான், தங்கள் கருத்தோடு
"இந்தக் கணி யுகத்திலும் தமிழ் தலை நிமிர்ந்து நிற்க முடியும்" இசைகிறோம்!
நிற்க வைக்கக் கை கோர்ப்போம் வாருங்கள்!
அன்பன்
பெஞ்சமின் லெபோ (பிரான்சு)
வணக்கம். தங்கள் தொல்காப்பிய வரிசையை படித்தேன்.
நான் தமிழில் text to speech மென்பொருள் உருவாக்கும் நண்பர் ஒருவருக்கு உதவ விழைகிறேன். இவர் தமிழர் அல்ல. இந்தியர், பல இந்திய மொழிகளுக்கும் பொதுவாக இவர் உருவாக்கியுள்ள கருவியில் சில குறைபாடுகள் தெரிகின்றன. ஓரெழுத்துக்கு ஒரே பலுக்கல் என்ற வகையில் உருவாக்கியுள்ளார். மெய்ம்மயக்கம் அறவே இல்லை. இந்தி, தெலுங்கு, போன்ற மொழிகளுக்கு இவை பயன்பட்டாலும், தமிழுக்கு பயன் படா. இதனால் பல வலைச்சரங்களிலும் தொல்காப்பியம் குறித்த செய்திகளை படித்து வருகிறேன். இம்முயற்சியில் நான் புரிந்துகொண்டது என்னவென்றால், தமிழ் படித்தவர்களும், ஆர்வம் மிகுந்தவர்களும் கூட அவ்வளவு எளிதாக இது போன்ற முயற்சிகளுக்கு உதவ முடியாமல் போகலாம் என்பதே.
நண்பர் நான் குறிப்பிட்ட குறைகள் இப்போதைய அணுகுமுறையில் சீர் செய்வதற்கில்லை என்பதை உணர்ந்து ஒத்தி வைத்திருக்கிரார். திரும்ப வருவாரா என்பது தெரியாது. ஆயினும், இடைக்காலத்தில் நானும் audio signal processing பற்றிய அறிவு பெற்றுவருகிறேன். நான் ஒய்வு பெற்ற பொறியியலாளன். என் முயற்சி வெற்றி பெறுமோ பெறாதோ, முயன்றுகொண்டிருப்பது ஒன்றே என் கடன். ஒரு prototype ஆகவேனும் இந்த TTS மென்பொருளை உருவாக்க விழைகிறேன்.
ஒலியன்கள் உருவாக்குவது ஒரு பகுதி. ஒருங்குறி தொகுப்பை பு ரிந்து கொண்டு ஒலியன்களை வரிசைப்படுத்துதல் மற்றொரு பகுதி. இவ்விரண்டையும் கடந்து வாக்கியங்கள் இயற்கையாக ஒலித்தல் மூன்றாவது. கேள்வி, வியப்பு, போன்ற intonation கூட்டுவது நான்காவது.
நான் இப்போது சிந்தித்து வருவது ஒலியன்களை உருவாக்குவது பற்றியது. தொல்காப்பியத்தில் உள்ள நூல்மரபு மூலம் மெய்ம்மயக்கம் பற்றி அறிந்தேன். தொல்காப்பியத்தை தொடர்ந்து படிக்கவிருக்கிறேன். இந்த நிலையில் உங்களிடம் நான் கோரும் உதவி, தமிழை ஒலிக்கும் முறை குறித்த மற்ற இலக்கண விதிகள் பற்றிய நல்ல விளக்கம் உள்ள சுட்டிகள். உதவ முடியுமா? நான் பின்னூட்டமாக பதிவு செய்யும் இந்த blog 2006 ல் எழுதப்பட்டுள்ளது. இருந்தாலும் இந்த பின்னூட்டம் உங்கள் பார்வைக்கு வரும் என நம்புகிறேன்.
நன்றி.
சிக்கல்கள்
(1) முதலாவது முதன்மைச் சிக்கல்: அடாமிக் (பிரிக்க இயலாத) எழுத்துக்கு மட்டுமே குறியிடம் ஒதுக்கும் கொள்கை.
(2) இரண்டாவது முதன்மைச் சிக்கல்: யூடிஎப்-16 (UTF-16) உள்ள சிக்கல்
(3) யூடிஎப்-8 (UTF-8) அதிக குறியாக்க நினைவகம் தேவை.
(4) நான்காவது சிக்கல்: இஸ்க்கி (ISCII) ஐ 10 பிட் குறியாக்க அலகாக மேம்படுத்தி அனைத்து எழுத்து குறியாக்கம் இல்லாமை.
தீர்வுகள்
(1) பிரிக்க இயலாத (அடாமிக் -Atomic) எழுத்துக்கு மட்டும் குறியிடம் ஒதுக்கும் நடைமுறையை கைவிட வேண்டும்.
(2) யூடிஎப்-16 (UTF-16)-ஐ இனி பயன்படுத்த இயலாதபடி தடை செய்து நிறுத்திட (deprecate) வேண்டும்.
(3) யூடிஎப்-10 (UTF-10)-ஐ அறிமுகம் செய்ய வேண்டும்.
(4) தேவை எனில், இஸ்க்கியை (ISCII) 10 பிட் அலகிற்கு மேம்படுத் வேண்டும்.
பிரிக்க இயலாக (அடாமிக் - Atomic) எழுத்துக்கு மட்டும் குறியிடம் என்பதைக் கைவிட்டால், வழக்கில் உள்ள தமிழ் முதலிய மொழிகளில் விடுபட்ட உயிர்மெய் போன்ற எழுத்துகளுக்கு குறியிடம் ஒதுக்கிட வழிவகை ஏற்படும். அனைத்து எழுத்து குறியாக்கம் பெற்று ஆங்கிலம் போன்று கணியத்திறன் இருக்கும்.
யூடிஎப்-16 (UTF-16)ஐ தடை செய்தால் தற்போது முடக்கப்பட்டுள்ள, ஐஈஈஈ (IEEE) உருவாக்கிய தளங்கள் அனைத்தும் மீண்டும் புத்துயிர் பெற்று பிஎம்பீ (BMP) போன்று முழு பயன்பாட்டிற்கு வரும்.
யூடிஎப்-10 (UTF-10)ஐ அறிமுகம் செய்தால் குறியாக்க நினைவகம் சிக்கனமாக இருக்கும்.
தேவை எனில், இஸ்க்கியை 10 பிட் குறியாக்க டெக்லட் (Declet) அலகாக மேம்படுத்தி பயன்பாட்டிற்கு கொண்டுவந்த பிறகு ஒருங்குறி ஒன்றியத்தை அணுகி அனைத்து எழுத்துகளுக்கும் குறியிடம் பெற்று அனைத்து எழுத்து குறியாக்கத்திற்கு இந்திய அரசு வழிவகை செய்ய வேண்டும்.
மேற்காணும் சிக்கல்களுக்கான தீர்வுகளை மத்திய மாநில அரசுகள் ஒருங்குறி ஒன்றியத்துடன் இணைந்து செயல்படுத்தினால் தமிழ் முதலிய இந்திய மொழிகள் மட்டுமல்லாமல் சிஜேகே (CJK) போன்ற உலக மொழிகளும் ஆங்கிலம் போன்று கணித்திறன் பெறுவதுடன் குறியாக்க நினைவகமும் சிக்கனமாக இருக்க வழிவகை ஏற்படும். உலகம் இன்னும் பல மடங்கு வேகத்துடன் முன்னேறும் வாய்ப்பு உண்டாகும்.
Post a Comment