Sunday, July 12, 2020

தமிழும் ஒருங்குறியும் - 1

இலங்கையின் ”தமிழ் அறிதநுட்பியல் உலகாயம்” (Tami Information Technology International) என்ற நிறுவனம் Zoom வழி நடத்திய இணைய வழி உரையாடலில் நேற்று நான் உரையளித்தேன், இங்கே அதைப் பிரித்து 3 பகுதிகளாய்த் தருகிறேன். இது முதற்பகுதி. தமிழ்க் கணிமையில் ஆர்வமுள்ளோர் படியுங்கள். நிகழ்ச்சியை ஒருங்கிணைத்த இலங்கை நண்பர்களுக்கும் குறிப்பாக நண்பர் சி.சரவணபவானந்தனுக்கு என் நன்றி. தமிழ்கூறும் நல்லுலகம் இந்நிலை அறிந்துகொள்ளட்டும்.
--------------------------------------------------

கூடியிருக்கும் அனைவருக்கும் வணக்கம். பேசுபொருள் பெரிது. குறுகிய நேரத்தில் எவ்வளவு முடியுமோ? தெரியவில்லை. சில குறிப்புகள் மட்டும் தருகிறேன். என் வலைத்தளத்தில்  உள்ளவற்றை அங்கு சென்று படியுங்கள் இனித் தலைப்பிற்கு வருவோம். 

அலுவங்களில் தட்டச்சி (typewriter) பார்த்திருப்பீர்களே? ஒரு பொத்தானை அழுத்தின், இணைக்கம்பி எழுந்து சுத்தியலில் வடித்த எழுத்தை, மைப்பட்டை வழி, தாளில் தட்டும்  வெவ்வேறு பொத்தான்கள் வெவ்வேறு எழுத்துகள். 1960-70 களில் தொலைவரி (telex), தொலையச்சி (teleprinter) வந்தன, ஓரூரில் தட்டச்சிப் (typewriter) பொத்தான்களைத் தட்டினால், இன்னோரூரில் அச்சு ஆகும். இக்கருவி செய்ய Bell labs பெரிதும் முயன்றது. American National Standards Institute or ANSI உம் சேர்ந்துகொண்டது. முடிவில்  1960 அகுதோபரில் IEEE ஆதரவில் தொலைவரிக் குறிகளாலான (telegraph code) 128 = 2^7 characters (code points) கொண்ட American Standard Code for Information Interchange-ASCII வெளிவந்தது.   

52 இலத்தின் எழுத்துகள், 43 பொது எழுத்துக் (common script) குறியீடுகள்,  33 ASCII special characters ஆக மொத்தம் 2^7 = 128.  ஆங்கில மொழி வெளிப்படுத்த ASCII வகை செய்தது. பிரஞ்சு, இசுப்பானியம், இத்தாலியம், செருமன், தேனிசு, டச்சு போல் மேற்கிரோப்பிய மொழிகளுக்காக,  Extended ASCII (256 characters) எழுந்தது.  அடுத்து, செமிட்டிக், இந்திக், சீனம் போல் பல எழுத்துகள் வெளியிட ஒருங்குறிச் சேர்த்தியம் உருவானது. இது  ஒரு non-profit corporation devoted to developing, maintaining, and promoting software internationalization standards and data which specifies the representation of text in all modern software products and standards.

இதில் வாக்கிடும் உறுப்பினர், computer software and hardware companies with an interest in text-processing standards. Full members: Adobe, Apple, Facebook, Google, Huawei, IBM, Microsoft போன்றோர். Institutional members: GOBD, GOI, GoTN, U.of Cal, Berkeley; அடுத்து வாக்கிட உரிமையிலா, பரிந்துரை செய்வோர்.: Associate members: Amazon, Oracle, Twitter, போன்றோர். Laison members: INFITT, University of Colombo School of Computing - Language Technology Research Laboratory; Individual Lifetime member: Alumni: ordinary members.

ஒருங்குறிச் சேர்த்தியம் தொடங்கையில் அடித்தளப் பன்மொழிப் பலகையில் ( Basic Multilingual Plane-BMP) 2^16 = 65,536 குறியீடுகள் இருந்தன. சுழிப் பலகை ( Plane 0) போல்  ஒரு பலகைக்கு 65,536 குறியீடுகள் மேனி 11,14,112 குறியீடுகள் கொள்ளும்படி 17 பலகைகளுண்டு. version 13.0 இன் படி, 12.91% இடமளித்தாகி விட்டது. இதுவரை  154 முகன எழுத்துவரிசைகளும், வரலாற்று எழுத்துகளும்,  பல்வேறு பொளித்(symbol)தொகுதிகளுமாக 1,43,859 குறியீடுகள் இடம் பெற்றன.

தமிழெழுத்திற்கு வருவோம்.  தொல்லியலின் படி தெற்காசியாவின் ஆகப் பழ எழுத்து தமிழியே. ( பொருந்தல், கொடுமணல், கீழடி வழி இதன்  காலம் கி.மு. 500/ 600. இதற்கு நெருங்கி, தமிழி/பெருமி கலந்து அநுராதபுரத்தில் பாகத எழுத்து உண்டு. அசோகரெழுத்து இதன்பின்னரே எழுந்தது.) பழ எழுத்துகளில் 6 வகையுண்டு.


இவற்றை ”தொல்காப்பியமும் குறியேற்றங்களும்” தொடர் 6 ஆம் பகுதியில்  (http://valavu.blogspot.com/2006/11/6.html) ஒரு படத்தொகுதியால் விளக்கினேன் இதன் 5-ஆம் பகுதியில் (http://valavu.blogspot.com/2006/11/5.html)  பழம் எழுத்து முறைகளைச் சொன்னேன். இவை அடுத்தடுத்து வந்தவை  எனச் சிலரும், சமகாலமென வேறு சிலருங் கூறுவர். ’அடுத்தடுத்து’ என்பதை வைத்துத் தொல்காப்பியக் காலத்தை இறக்குவாருமுண்டு. முடிவிலா உரையாடலுள் போக வேண்டாம்.  தமிழ், பாகதம் என 2 மொழிகள் ஊடுறுவியதால் கல்வெட்டுகளைப் படிப்பதில் உள்ள சிக்கல்களை, நேரங் கருதிப் பேசத் தவிர்க்கிறேன்.

இதற்கு 3 தீர்வுகள் உருவாகின.  முதல் தீர்வு பட்டிப்போரலு தீர்வு. என்ன காரணமோ, இது வளராது போனது. பிந்தியது வடபுல முறை, தமிழ் தவிர்த்த இந்திய மொழிகள் (சிங்களமும் இதில் சேர்ந்ததே) வடபுல முறை கொண்டன. 3 ஆவது தமிழி.  இது புரியா மேலையர் தமிழையும் அபுகிடா என்பார். தமிழி அசையெழுத்து முறை சார்ந்தது. உயிரும், மெய்யும் இதில் முகன்மை. மெய்ப்புள்ளியை நீக்கினால் அகரமேறிய மெய் கிடைக்கும்.. புள்ளி நீக்கி வேறு உயிர்க் குறியீடுகளைச் சேர்த்தால் வேறு மெய்கள் கிடைக்கும். இதையே தொல்காப்பியம் சொல்கிறது. இந்நூற்பாவைத் தவறாகப் புரிந்தவர் மிகுதி.

அபுசட் என்பது வெறும் மெய்கள் கொண்டது. தனி உயிர் எழுத்துகள் கிடையா. மெய்யெழுத்துகளில் மேலும் கீழும் பக்கவாட்டிலும் உயிர்மெய்க் குறியீடுகள் இட்டு உயிரொலி காட்டுவர். அபுகிடாவில் உயிரும் அகரமேறிய மெய்யும் முகன்மை. ஒன்றின் கீழ் இன்னொன்றாய் 2 ”க” இட்டிருப்பர். மேல் ”க” மெய் ஆகவும் கீழ்க் ”க” உயிர்மெய்யாகவும் கொள்வர். ஒரே வடிவத்திற்கு 2 மதிப்பு (value) கொண்டு இடம் பொறுத்து மதிப்பு மாறும். இதில் அகரம் ஏறிய மெய்யை மெய் என்பார். அடிப்படையில் இந்த வடபுல எழுத்து 2 பரிமானங் கொண்டது. மொழியியலின்படி 5 எழுத்துகள் கூட ஒன்றின்கீழ் தொங்கலாம். எழுத்துகள் கட்டித் தொங்குவதால் கந்தெழுத்து என்றார். கந்தம் grandham ஆனது. தேவநகரியும் அப்படியே. தாளில்/ கணித்திரையில் வெளிப்படும் இக்கால ஆவணங்களுக்கு 2 பரிமானம் சிக்கல் தருவதால் அடுக்கு எழுத்துகளை விட்டு, (நம் மெய்களுக்குச் சமமாய்) half consonant களை இப்போது உருவாக்குகிறார். (உழவன் எக்ஷ்பிரஸ் என்ற தொடரிக்கு இருவுள் நிலையத்தார் half consonant இட்டுக் காட்டியிருப்பார்.)   

தமிழை அபுகிடாவாக்குவது அடையாளச் சிக்கல் (identity crisis). பெண்ணை ஆணென்றோ, ஆணைப் பெண்ணென்றோ சொல்லி வளர்ப்பதை ஒக்கும். இப்போதும் அப்படி நடக்கிறது  விளக்க நேரம் பிடிக்குமென்பதால் நகர்கிறேன். 

அன்புடன்,
இராம.கி.   

No comments: