Friday, April 04, 2014

தமிழி - உரோமன் எழுத்துப்பெயர்ப்பு - 2

இக்கருத்தரங்கில் தமிழ்ப் பின்னங்கள், குறியீடுகளை ஒருங்குறியிற் சேர்ப்பது கருதி, தமிழ்ப் பெயர்களை ஒரே வகை உரோமன் எழுத்தில் [அதாவது உயர் கட்டெழுத்தையும் (upper case  letters), தாழ் கட்டெழுத்தையும் (lower case letters) கலக்காது அந்தந்த தனிக் கட்டெழுத்தில்] எப்படிக் குறிப்பதென்ற கேள்வியெழுந்திருக்கிறது. அதை முடிவு செய்வதற்காக

1.Prof. M. Ponnavaikko, Vice Chancellor, S.R.M. University.
2.Prof. V. Jayadevan, Chief Editor, Madras University Tamil Lexicon Revision Project.
3.Prof. Murugaiyan, Professor (Retd.), Annamalai University.
4.Thiru. Ma. Poongundran, Editor, Directorate of Tamil Etymological Dictionary.
5.Dr. M. Kannan, Editor, Directorate of Tamil Etymological Dictionary  (Addl. member).
6.Dr. Shriramana Sharma, Research scholar with special interest in technological support for old Indic writing system, Author of Unicode proposal L2/13-047 the standing proposal to
encode Tamil fractions and symbols in Unicode.
7.Thiru. Mani M. Manivannan, Chair, Tamil Unicode Working Group, INFITT.

அடங்கிய குழுவொன்றைக் கருத்தரங்கின் முடிவில் ஏற்படுத்தியிருக்கிறார். இக்குழு இது வரை கூடியதா, தன் தேர்வு முடிவை எடுத்ததா, அரசிற்குப் பரிந்துரை அளித்ததா என்பதெலாம் எனக்குத் தெரியாது. நான் தமிழறிஞனும் இல்லை; கணிஞனுமில்லை. கொஞ்சமே தமிழறிந்த பொறிஞன். [”கணிஞனும், தமிழறிஞனும் இல்லெனில் தமிழ்க்கணிமை பற்றிப்பேச உனக்கென்ன அருகதை?” என்று யாராவது அன்றே கேட்டிருந்தால் இப்புற்றுக்குள் கை வைத்திருக்கமாட்டேன். “கரை வேட்டியோ, கதர் வேட்டியோ போடாதவன் தமிழரிடை அரசியல் பேச அருகதை இல்லாதவன்” என்று சொல்வது போல் இருக்கிறது.] ஆர்வ மிகுதியால் 16 ஆண்டுகள் தமிழ்க் கணிமை பற்றிப் பேசிவிட்டேன். என்னைப் பொறுத்துக் கொண்ட தமிழர் உலகிற்கு நன்றி.

(அதேநேரம் தமிழெழுத்து, ஒலிகளின் நுட்பம் பற்றி மேலோடத் தெரிந்தவர் எல்லாம் தமிழ் ஒருங்குறியுனுட் புகுந்து ”அதை மாற்று, இதை நுழை, அதை வைத்தே தீர வேண்டும்” என்று ஒருங்குறிச் சேர்த்தியத்திடம் முன்னீடு கொடுத்துத் தாம் வேண்டும் மாற்றங்களை அடையுங் கால முரணைப் பற்றி  எண்ணாது இருக்க முடியவில்லை. 10 கோடிப் பேரின் செய்யாமையிடையே, ஒரு தனி மாந்தன் தன் தனிப்பட்ட தாக்கத்தால் தான்தோன்றித் தனமாய்ச் செய்துவிடும் அச்ச விளைவுகளும் இதில் இருக்கின்றன. தனிமாந்தரின் தான்தோன்றிச் செயல்களுக்கு முன் தமிழக அரசோ, இந்திய நடுவண் அரசோ தடுமாறித் தான் போகின்றன. மேலே கூறிய கருத்தரங்கம் நடந்ததற்கே ஒரு தனி மாந்தரின் முன்னீடு தான் கரணியமாகும்.

செய்தக்க அல்ல செயக்கெடும் செய்தக்க
செய்யாமை யானுங் கெடும்

என்று சொன்ன குறளை நினைத்துக்கொள்ள வேண்டும் போலும்.)
எழுத்துப் பெயர்ப்பு விதயத்தில் எனக்குத் தென்பட்டதை ஓரிடத்திற் பதிவு செய்வோம். படிப்பவர் படிக்கட்டும். எழுத்துப் பெயர்ப்புக் குழுவினர் என் ஓர்மைகளை வேண்டின் ஒருவேளை கருதட்டும் என எழுத முற்படுகிறேன். விளக்கங் கேட்டு அவர் எனைப் பணித்தால் இயன்றது செய்ய அணியமாய் உள்ளேன். (அக்கருத்தரங்கிற்கும் அணில் போல உதவத்தான் செய்தேன்.)

எழுத்துப் பெயர்ப்பு என்பது (transliteration) கேட்பொலிப் பெயர்ப்பினும் (transcription) வேறுபட்டது. எழுத்துப் பெயர்ப்பின் ஊற்றுக்கொத்து (source set) என்பது தமிழெழுத்துக்கள் அனைத்தும்  அடங்கியதாகும். அதன் எயினக் கொத்து (target set) என்பது, உரோமனெழுத்துக்கள் அடங்கியதாகும். இரு கொத்துக்களிலும் இருக்கும் எழுத்துக்கள் வெறும் வடிவங்களல்ல, அவை ஒலிகளையும் குறிக்கின்றன. எழுத்தெனும் வகைப்பாட்டின் ஆழமான தொல்காப்பியப் பொருளை இங்கு நாம் புரிந்துகொள்ள வேண்டும்.

வட இந்தியப் பெருமி (Brahmi) வழிப்பட்ட நாகரியெழுத்தை வைத்து அதே அடைப் பலகையிற் (template) தமிழெழுத்தைச் சில கணிஞர் இடைப்பரட்டி விளங்கஞ் சொல்வது நம்மை முன்செலுத்தாது. [மைக்ரொசாவ்ட்டின் பாஷா இந்தியா என்றதொரு வலைத்தளம் அப்படியொரு பணியைச் செய்து கொண்டு இருந்தது. தமிழெழுத்து பெருமியெழுத்தைப் போல அபுகிடா (abugida) வகை என்றங்கு முறையற்றுச் சொல்லிக்கொண்டிருந்தார்]. [இன்னுஞ் சிலரோ பெருமியிலிருந்து தமிழி உருவாக்கப்பட்டதென அவக்கரப்பட்டு முழு ஆய்வும் இல்லாது சொல்கிறார். இதுவரை கிடைத்த கல்வெட்டுச் சான்றுகளின் படி பெருமிக்கும் காலத்தால் முந்திக் (கி.மு.490) தமிழிக் கல்வெட்டுக் கிடைத்துள்ளது. தமிழியிலிருந்து பெருமி ஏன் தோன்றியிருக்கக் கூடாதென்று பல்வேறு ஆய்வாளரும் எண்ணிப் பார்க்கத் தவறுகிறார். இரண்டிற்கும் அடிப்படையில் வேறுபாடு இருப்பதை உணராமலும், இப்படி ஒரு ‘குதருக்கம்’ நடப்பது தெரியாமலேயும் தமிழறிஞரும் உருப்படியான கணிஞரும் தம் கருத்துச் சொல்லாது விலகியிருக்கிறார்.]

(தமிழெழுத்தைத் தமிழி என்றே நான் இப்போதெல்லாங் குறித்து வருகிறேன். தமிழி என்பது பெருமிக்கும் முந்தையது. தனிப்பட்டது என அண்மைத் தொல்லியல், கல்வெட்டு ஆய்வுகள் சொல்லிவருகின்றன. இனிமேலும் திரு ஐராவதம் மகாதேவனைப் பின்பற்றித் தமிழ்-பிராமி என்று தமிழர் குறிப்பது சரியல்ல. பெருமியென்பது அகரமேறிய மெய்யெழுத்தை அடிப்படையாகக் கொண்டது. தமிழியென்பது அகரமேறாத் தனிமெய்யை அடிப்படையாகக் கொண்டது. இரண்டும் வெவ்வேறானவை)

ஒருங்குறியேற்றம் நடந்தபோது இத் தப்பைச் சிலர் செய்யாதிருந்திருப்பின் தமிழுக்கு நன்மை கிடைத்திருக்கும். ஒருங்குறியில் 128 அறைகளுக்குள் தமிழெழுத்துச் சிறைப்பட்டு இருந்திருக்காது. அந்நேரம் தமிழறிஞரும், பெரும்பாலான கணிஞரும் சேர்ந்து தூங்கிவிட்டார். தூங்காதவரும் தமக்குள் கட்சி கட்டி TAB/TAM/TSCII என்று உள்ளூர்ச் சண்டை போட்டுக் கொண்டிருந்தார். பல்வேறு உள்ளூர்ச் சண்டை போடுவதிற்றான் தமிழர்கள் 2500 ஆண்டுகளைக் கழித்திருக்கிறோமே? தமிழர் என்றைக்குத்தான் ஒன்றுபட்டிருக்கிறோம்? அரசியலார் மட்டும் இதில் மாறுவாரா, என்ன? 1985 அளவில் தமிழறிஞர், கணிஞர் என யாருமே தமிழ்க் கணிமை பற்றித் தமிழக அரசைத் தட்டி யெழுப்ப வில்லை. நல்ல வாய்ப்பை நழுவவிட்டோம்.

இத் தூக்கத்திற்கு நடுவில் நடுவணரசின் CDAC நிறுவனம் தனக்குத் தோன்றியது போல் ISCII அடைப்பலகையை ஒருங்குறிச் சேர்த்தியத்திற்கு அப்படியே முன்மாதிரியாக அனுப்பியது. இப்படி 128 இடங்களிற் தமிழ் சிறைப்பட்டதால் எல்லாக் கணினி வெளியீட்டுச் சாதனங்களிலும் (output devices) ஒரு rendering engine இன்றித் தமிழாவணங்களை இப்பொழுதுங் காட்சிப் படுத்த முடிவதில்லை. தமிழைக் காட்சிப் படுத்தும் கணிகள் இந்த வேலையைச் செய்த பின் தான் குறியீடுகளை வெளியீட்டுச் சாதனங்களுக்கு அனுப்பின. மேலைமொழிக் கணிமைகளின் எளிமைக்கு முன்னால் கால காலத்திற்கும் தமிழ்க் கணிமையிற் சுற்றிவந்து மூக்கைத் தொடும் நிலைக்கு நாம் ஆட்பட்டுள்ளோம். இப்பொழுது தன் நிலையுறுதிப் பொள்ளிகையைக் (stability policy) காரணங் காட்டி ஒருங்குறிச் சேர்த்தியம் ”128 அறைகளுக்கு மேலில்லை” என அடம்பிடிக்கிறது. அதை மறுத்து வாதமிட நமக்கு ஆற்றல் இல்லை. 800 பவுண்டுக் கொரில்லாவிற்கு முன் நாமெல்லாம் எந்த மூலை? எனவே 128 இடங்களிற் சிறைப்பட்டபடியே தமிழ்க் கணினி நிரல்களுக்குள் நாம் இன்று வேலைசெய்ய வேண்டியிருக்கிறது.

[தமிழ் ஒருங்குறியில் மொழிச்செலுத்தம் (language processing) என்பது உயிர், மெய், உயிர்மெய் எழுத்துக்களை வைத்து நடப்பதில்லை. இக்கட்டுரையைப் படிப்பவர் சற்று மூச்சைச் சீர்படுத்தி நானென்ன சொல்கிறேனென உணர்ந்து படிக்கவேண்டுகிறேன். உயிரெழுத்துக்கள், அகர உயிர்மெய், சில குறியீடுகள் என்று இன்னுங் கீழ்மட்டத்தில் மொழிச்செலுத்தம் நடந்து, முடிவில் நாம் படிக்கும் வகையில் உயிர், அகர உயிர்மெய், குறியீடுகளை வெளியீட்டுச் சாதனங்களில் ஒன்றோடொன்று பொருத்தி ஒட்டிவைக்கவேண்டும். அப்போது தான் தமிழெழுத்தின் தோற்றப் பொலிவிருக்கும். இப் பொருத்தும் நிரலே rendering engine எனப்படுகிறது. எந்தெந்த நிரலிகளின் முடிவில் பொருத்தும் இயந்திரம் சரியாக வேலை செய்யவில்லையோ, அங்கெல்லாம் தமிழெழுத்தின் தோற்றம் கோணல் மாணலாய் வெளிப்படும். இன்றைக்கும் அங்குமிங்குமாய் தமிழெழுத்துக்கள் சிலபோது குதறப்பட்டு இணையத்தில் இளிச்சவாய்த் தோற்றங் காட்டி அமைவது இயல்பாய்ப் போனது. ஒரு வெருவி (virus) தமிழ் நிரலிக்குள் உள் நுழைந்தால் போதும், தமிழெழுத்து இளித்து விடும். எத்தனை ஆவணங்களை இது போல் பார்த்துவிட்டோம்?]

இந்த எழுத்துப் பெயர்ப்பிலும் அதேவகைப் பிழையைச் செய்துவிடக் கூடாது. தமிழுக்காகப் பணிசெய்யும் கணிஞரும், தமிழறிஞரும் ஒன்றுசேர்ந்து வேலை செய்யவேண்டும்..

பொதுவாகத் தமிழியெழுத்தின் ஒலி அவ்வெழுத்தின் வடிவம், குறிப்பிட்ட எழுத்து,சொல்லில் வருமிடம் ஆகியவற்றைப் பொறுத்தது.

Sound of a Tamili letter = Function of (the shape of the letter, place of its occurrence in a word).

அதே பொழுது,

Sound of a Brahmi letter = Function of (the shape of the letter).

எனவே தமிழியெழுத்தின் ஒலிப்பு முறை ’ஒன்றிலிருந்து பல’ என்ற உறவு முறையைக் (one to many correspondence) கொண்டது. பெருமியெழுத்தின் ஒலிப்பு முறை ’ஒன்றிலிருந்து ஒன்று’ என்ற உறவுமுறை (one to one correspondence) கொண்டது. உரோமன் எழுத்தும் ஒன்றிலிருந்து பல உறவு முறை கொண்டது.  
தமிழியும் உரோமன் எழுத்தும் ஆன இரண்டு கொத்துகளும் ஒன்றிற்கொன்று எண்ணிக்கையளவில் மதிக்கத் தக்கனவா எனில் இல்லை. 12 உயிர்களோடு, 1 ஆயுதவெழுத்து, 6*2 வல்லின மெய்யொலிகள், ககரத்திற்கும் சகரத்திற்கும் சிறப்பான உயிரிடை (intervocalic) மெய்யொலிகள், 6 மெல்லின மெய் யொலிகள், 6 இடையின மெய்யொலிகள் என்ற 39 தமிழ் எழுத்துக்களோடு, (நாம் விரும்பினாலும், விரும்பாவிட்டாலும் ஏதோவொரு காலகட்டத்திற் சேர்ந்து கொண்ட) 6 கிரந்த எழுத்துக்களும் சேர்த்து 45க்குத் தகுந்தாற் போல் இணைக்குறிகளை நாம் பரிந்துரைக்கவேண்டும். உரோமன் எழுத்திலோ, F, W தவிர்த்து 24 வடிவங்கள் / ஒலிகளே உள்ளன. ஆக இரண்டு கொத்துக்களும் ஆங்கிலத்திற் சொல்வதுபோல் தத்தம் அளவிற் பொருந்தாதவை (incommensurate). 45 is not equaled to 24. இப் பொருந்தாமை முரணைச் சரிபண்ண, மூன்றுவித ஓர்மைகள் உண்டு.

1. உரோமனெழுத்தில் உயர்கட்டெழுத்தையும் (upper case letters), தாழ்கட்டெழுத்தையும் (lower case letters) கலந்து எழுதுவது. [இக் கலப்பினால் எயினக்கொத்து 48 என வந்துசேரும். ஆனால் இப்படிக் கலந்தெழுதக் கூடாthu என ஒருங்குறிச் சேர்த்தியஞ் சொல்லுகிறது. மாறாக அந்தந்த தனிக் கட்டெழுத்திலே குறிக்கவேண்டும் என வலிதாகக் குறித்திருக்கிறார். எனவே இந்த ஓர்மையை நாம் செயற்படுத்த முடியாது.]

2. அடுத்து, ஏதோவொரு கட்டெழுத்தையும், (1, 2,....9,0) என்ற எண்களையும் உரோமன் குறியீடுகளையும் கலந்தெழுதலாம் என்பது இரண்டாவது ஓர்மை [ஒரு தமிழாவணத்தில் பொருண்மை கருதி எண்களும் எழுத்துக்களும் சேர்ந்து பயிலலாம் என்பதால் எண்களை வெறும் ஒட்டுக்குறிகளாக்குவது இல்லை என்றாகிப் போகிறது.]

3. உரோமனெழுத்தோடு ஆளங்குறிகளை (diacritic marks) ஒட்டிவைத்து எழுதுவது. [இதைப் பல மேலை மொழிகளே பயனாக்கி வருகின்றன. இதைத் தவிர்க்க வேண்டும் என்று சில கணிஞர் சொல்லுவது ஏனென்று எனக்குப் புரியவில்லை. இத்தனைக்கும் சில மேலை மொழிகளே இப்படியொட்டி தம் ஒலிகளுக்கு வடிவங் காட்டிவருகின்றன. தமிழுக்காக உரோமன் எழுத்தில் இதைச் செய்தாலென்ன?] 

எழுத்துப் பெயர்ப்பு பற்றி ஆங்கில ஆட்சி நெடுகிலும் பல்வேறு முயற்சிகள் நடந்துள்ளன. அவற்றின் உச்சகட்டம் எல்லோரும் பெரிதும் புழங்கிய சென்னைப் பல்கலைக்கழகச் சொற்களஞ்சிய எழுத்துப் பெயர்ப்பாகும். இம் முறையில் மாக்கோடு, அடிக்கோடு, மேற்புள்ளி, கீழ்ப்புள்ளி, அலை என 5 ஆளங்குறிகளைப் (diacritic marks) பயன்படுத்துவர். சிறப்பாக, ஆ, ஈ, ஊ, ஏ ஓ ஆகிய எழுத்துக்களைக் குறிக்கக் குறில் வடிவங்களைப் போட்டு அவற்றின் மேலே மாக்கோடு (macron) போடுவார். Transliteration, transcription மாற்றஞ் செய்ய விழைவோர் சென்னைப் பல்கலைக்கழக எழுத்துப்பெயர்ப்பை விளங்கி கொள்ளவேண்டும். அந்த எழுத்துப்பெயர்ப்பில்,

ஃ என்பதற்கு k என்று போட்டு அதன்கீழ் அடிக்கோடு (underbar) போடுவார். [இதற்கு மாறாய் q என்றும் போடலாம். கணிஞர் முத்து நெடுமாறனின் அஞ்சல் விசைப்பலகையில் அப்படித்தான் செய்கிறோம்.)

ற் என்பதற்கு r என்று போட்டு அதன்கீழ் அடிக்கோடு போடுவார்

ன் என்பதற்கு n என்று போட்டு அதன்கீழ் அடிக்கோடு போடுவார்.

ழ் என்பதற்கு l என்று போட்டு அதன்கீழ் அடிக்கோடு போடுவார்

ங் என்பதற்கு n என்று போட்டு அதன்மேல் புள்ளி போடுவார்.

ட் என்பதற்கு t என்று போட்டு அதன்கீழ் புள்ளி போடுவார்

ண் என்பதற்கு n என்று போட்டு அதன்கீழ் புள்ளி போடுவார்

ள் என்பதற்கு l என்று போட்டு அதன்கீழ் புள்ளி போடுவார்

ஷ் என்பதற்கு s என்று போட்டு அதன்கீழ் புள்ளி போடுவார்

ஞ் என்பதற்கு n என்று போட்டு அதன்மேல் அலையைக் (tilde) போடுவார்

அ   ஆ இ    ஈ   உ    ஊ   எ  ஏ    ஐ  ஒ   ஓ  ஔ   ஃ
a       ā     i      ī     u       ū     e    ē     ai    o     ō     au        ḵ
க்   ங்  ச்   ஞ்   ட்  ண்   த்   ந்   ப்   ம் 
k     ṅ    c     ñ     ṭ      ṇ       t    n    p    m
ய்   ர்  ல்   வ்   ழ்  ள்
y     r     l      v      ḻ     ḷ
ஜ்   ஸ்   ஷ்   ஹ்  க்ஷ்   ஶ
j        s       ṣ        h      kṣ     ஶ

சென்னைப் பல்கலைக்கழகத்தின் உரோமன் எழுத்துப்பெயர்ப்பு கிட்டத்தட்ட 70 ஆண்டுகளாகப் பயன்பட்டுவருகிறது. [NHM font converter இல் இந்த ஆளங்குறி முறை (diacritic method) செயற்படுத்தப் பட்டிருக்கிறது.] இதில் 5 ஆளங்குறிகளைப் பயன்படுத்துவது சிலருக்குத் தயக்கத்தைக் கொடுக்கலாம். தமிழாவணங்கள் ஆளங்குறி நிறைந்ததாய்க் “கொசகொச” என்று ஆகிவிடுமோ என்று ஐயுறலாம். இந்த ஆளங்குறிகளைக் குறைக்கலாமா எனில், ஓரளவு முடியும்.

காட்டாக, நெடில் உயிர்களை உரோமனெழுத்தில் இரண்டாக எழுதியோ, ஒன்றோடு இன்னொன்றை அடுத்தடுத்துப் போட்டோ எழுதிவிடலாம். அதன் மூலம் உயிர்க்குறில் வடிவங்களின் மேல் மாக்கோடு போடுவதைத் தவிர்க்கலாம். உயிரிடை (intervocalic) வல்லினக் ககரம், சகரம், தந்நகரம், இடையின ரகரம், இடையின லகரம் ஆகியவற்றிற்கு ஓர் அலைக்குறியும், டகரம், அதிர் டகரம், டண்ணகரம், ளகரம் ஆகியவற்றிற்கு ஒரு கனக்குறியும் (grave) இட்டால் இரண்டே ஆளங்குறிகளை வைத்து இப்போதுள்ள சிக்கலைச் சரிசெய்து விடலாம். இரண்டு ஆளங்குறிகளை வைப்பதில் ஒரு வாய்ப்பும் இருக்கிறது.

எல்லாக் கணி விசைப்பலகைகளிலும் 1,2, 3.. என்ற எண்வரிசைப் பொத்தான்களுக்கு முன்னால் இருக்கும் பொத்தானில் இரு ஆளங்குறிகளைக் கொண்டவொரு பொத்தான் ஏற்கனவே இருக்கிறது. அதைவைத்து நாளையே தமிழாவணங்களை உரோமனெழுத்தில் உருவாக்கிவிடமுடியும். எந்த நிரலியின் துணையுமின்றி இதை எல்லாக் கணிகளிலும் உடனே செய்ய முடியும்.

இந்த 2 ஆளங்குறிகளும் தமிழுக்குப் பொருந்துவது போற் பொருண்மையும் இருக்கிறது. டகரம், அதிர் டகரம், டண்ணகரம், ளகரம் போன்றவற்றைச் சற்று கனமாகவே ஒலிக்கவேண்டி உள்ளது. எனவே கனக்குறி அவற்றிற்கு இடுவது மெத்தச் சரி. அதேபோல, அலைக்குறி எழுத்துக்களைச் சற்று நெகிழ்ந்தே  ஒலிக்க வேண்டியுள்ளது. அடிப்படையில் அலைதலென்பது ஒருவகை ஒலி நெகிழ்தலே.

என் பரிந்துரையைக் கீழே குறித்துள்ளேன். இதனால் எத்தமிழாவணத்தையும் இன்றுள்ள நிரலிகளை வைத்தே சரியான முறையில் உரோமன் எழுத்தில் எழுத்துப்பெயர்ப்பு செய்யலாம். எந்தக் குறையும் வாராது. (தமிழ்ப் பின்னக் குறியீடுகளை உரோமன் எழுத்தில் இந்த ஆளங்குறிகளைச் சேர்த்து எழுதி விட முடியும்.) எக் குழப்பமும் ஏற்படாது.

அ        A           a                                 க்         K          k           ய்         Y         y
ஆ      AA          aa         intervocalic க்          K~       k~          ர்          R~      r~
இ         I            i                    voiced க்          G         g           ல்         L~      l~
ஈ         II            ii                                ங்         NG       ng        வ்         V       v
உ        U            u                                ச்          C         c           ழ்          L        l
ஊ       UU         uu        intervocalic ச்         C~        c~         ள்         L`       l’
எ         E             e                 voiced   ச்          J          j
ஏ         EE           ee                             ஞ்         NJ        nj         ற்          R        r
ஐ        AI           ai                                ட்          T`         t`          ன்         N       n
ஒ        O            o                 voiced    ட்         D`        d`
ஓ        OO         oo                             ண்        N`        n`
ஔ    AU          au                             த்          T          t           ஜ்         J         j
                                              voiced    த்         D           d          ஷ்       SH      sh
ஃ          Q            q                                ந்         N~        n~        ஸ்       S         s
                                                              ப்         P            p          ஹ்      H        h
                                             voiced     ப்         B            b          க்ஷ்      X        x
                                                              ம்        M           m         ஶ         Z         z
    
Unused Roman letters                 F,W       f, w

நான் பரிந்துரைத்த இந்த எழுத்துப் பெயர்ப்பில் ஒரு பெரிய அச்சமும் எனக்கு இருக்கிறது. தமிழெழுத்துக்கு மாற்றாக இந்த ஆளங்குறி சேர்ந்த உரோமன் எழுத்து ஒரேயடியாய்ப் பயனாகிவிடக் கூடாது. அப்படியானால் , “உள்ளதும் போச்சுதடா, தொள்ளைக் காதா” என்று ஆகிவிடும். அலைபேசி கொண்டு, குறுஞ்செய்தி (SMS) அனுப்பி (enna machchi, eppatikkiiree?), இணையத்தின் மூலம் கீசிக்கொண்டு (twitter) அரட்டையடிக்கும் எதிர்கால இளைய தலைமுறை, தமிழின் எழுத்தை முற்றும் போக்கடித்துவிடலாம். அது நடக்கக் கூடாது.

இளையரிற் பலருக்கும் அடியோடு தமிழெழுத்துத் தெரிவதில்லை. (உங்களுக்குத் தெரியுமா? கர்நாடக சங்கீதம் கற்றுக்கொள்ளும் இளஞ்சிறார் தம் கீர்த்தனைகளையும், பாடல்களையும் உரோமனெழுத்தில் எழுதி வைத்துப் பாடம் படிக்கிறார். தமிழ்ப் பாட்டும் சங்கத, தெலுங்குக் கீர்த்தனைகளும் அப்படித் தான் இளந்தலைமுறைக்குப் போகின்றன.) பெருங்கணி நிறுவனங்களும், சேவை தருவோரும் தம் வணிக நலன் கருதி தம் கருவிகளும், சேவைகளிலும் தமிழெழுத்து அளிப்பை (supply) வேண்டும் என்றே குறைத்துத் தருகிறார். கன்னாப் பின்னாவென்று தமிழுக்கு உரோமன் எழுத்துப் புழக்கம் இளைஞரிடையே கூடிக்கொண்டிருக்கிறது. பெரியவர் ஆகிய நாமோ தேமே என்று விழித்துக் கொண்டிருக்கிறோம். தமிழார்வலர் விழித்தெழாவிட்டால் தமிழெழுத்து மறையுங் காலம் வெகு தொலைவில் இல்லை. பழைய குடியேற்றத்தில் நாட்டாதிக்கம், இனவாதிக்கம், மொழி யாதிக்கம் என நடந்தது பற்றிக் கேள்விப்பட்டிருக்கிறோம். புதிய குடியேற்றத்தில் இப்பொழுது எழுத்தாதிக்கம் என்பது புதிய பரிமானம். அவ்வளவு தான். ஓர்ந்து பாருங்கள்.

அன்புடன்,
இராம.கி.  

Thursday, April 03, 2014

தமிழி - உரோமன் எழுத்துப்பெயர்ப்பு - 1

ஒருங்குறியிற் தமிழ் - தேவைகளும், தீர்வுகளும் (Tamil in Unicode - requirements and solutions) என்ற கருத்தரங்கு 2014 மார்ச்சு 5 இல் தமிழிணையக் கல்விக் கழகத்தில் நடந்தது. அப்போது சென்னையில் நான் இல்லாததால் என்னாற் கலந்துகொள்ள இயலவில்லை. அதுபற்றித் தமிழிணையக் கல்விக்கழக நெறியாளரிடம் முன்னரே தெரிவித்திருந்தேன். 

அக் கருத்தரங்கில்

தமிழ்ப் பின்னங்கள், குறியீடுகள் - பெயரிடலும் கீற்றுகளும் [Tamil Fractions and Symbols - Naming and Glyphs]
தமிழ் அனைத்தெழுத்துக் குறியேற்றம் [Tamil All Character Encoding (TACE-16)]
ஓரிந்தியா / ஓரெழுத்து முன்னீடு [One India/One Script Proposal]
தமிழக அரசின் நடவடிக்கைகளில் குறியேற்றச் செந்தரங்களையும் விசைப்பலகைச் செந்தரங்களையும் வலியுறுத்தல் [Enforcement of Encoding & Keyboard Standards in Government]
முகனக் கருவிகளிற் தமிழ் [Tamil in Modern Devices]

என்ற உட்தலைப்புக்களில் கணிவல்லுநரும் தமிழார்வலரும், தமிழறிஞரும், மொழியியலாளரும் உரையாடியிருக்கிறார். இத்தலைப்புக்களில் ஒரு சிலவற்றின் மீது என் தனிப் பார்வைகளை பல்வேறு மடற்குழுக்கள், மாநாடுகள், கருத்தரங்குகளிலும், என் வலைப்பதிவிலும் ஏற்கனவே வெளிப்படுத்தியிருக்கிறேன். இக்கட்டுரையில் மேலேயுள்ள முதல் உட்தலைப்பிற்கான பெரிய பின்னூட்டு அடியில் வருகிறது. மற்ற இரண்டாம், மூன்றாம், நாலாம், ஐந்தாம் உட்தலைப்புக்களுக்கான சுருக்கமான எதிர்வினைகளும் உடனேயே வருகின்றன. 

தமிழ் ஒருங்குறியின் அடிப்படைச் சிக்கலை பெரிதும் அறிந்த காரணத்தால், தமிழ் அனைத்தெழுத்துக் குறியேற்றத்திற்கு (TACE) ஆதரவாகவே எப்பொழுதும் நான் பேசிவந்திருக்கிறேன். என் வலைப்பதிவில் அதை யொட்டிய குறிப்புகள் பல கட்டுரைகளிற் கிடக்கின்றன. பல்வேறு தமிழ்க்கணிமைச் சிக்கல்களுக்கு அனைத்தெழுத்துக் குறியேற்றம் ஒரு வலுவான தீர்வாகும். விருப்பு வெறுப்பில்லாது, ஆழ்ந்த ஓர்மையிற் தமிழ்நலங் காணுமெவர்க்கும் இது புரியும். அனைத்தெழுத்துக் குறியேற்றத்தை விரிந்து புழங்கினால், தமிழாவணங்களைக் கணிமூலம் உருவாக்குவதில் வல்லாட்சி செய்யும் ஒருங்குறிச் சேர்த்தியமும் நம் கருத்தைக் கனிவோடு நோக்க வேண்டிய நிலை வந்துசேரும்.

(ஒருங்குறிச் சேர்த்தியம் என்பது, வெவ்வேறு மொழியாரின் நலம்பேணும் அமைப்பென்று நொதுமலார் கருதமுடியாது. அடிப்படையில் உரோமன் எழுத்துச் சார்ந்த மேலை நிறுவனங்களுக்கு முன்னுரிமை கொடுத்து, அவர் வணிகம் பெருக்கி, மேலையெழுத்து அல்லாதவற்றைக் காலகாலத்திற்கும் திறன்-நேர்த்தியற்றதாக்கி, மொழிக்கணிமையில் அவை பின்னிற்கும்படி செய்யுமொரு பெருங்கணி வணிகக் கூட்டமைப்பாகவே அது இதுகாறுஞ் செயற்பட்டிருக்கிறது. ’உலகமயமாக்கல்’ எப்படியின்று புதியகுடியேற்றக் கொள்கையின் மறுபெயரோ, அதுபோல ஒருங்குறிச் சேர்த்தியம் உரோமன் எழுத்தை அடிப்படையாகக் கொண்ட மேலைமொழிகளின் வல்லாட்சி பேணும் அமைப்பேயாகும். ஒருங்குறிச் சேர்த்தியமும் உலகமயமாக்கலின் ஒரு கூறு தான்.) 

அனைத்தெழுத்துக் குறியேற்றம் பற்றி ஆணைபோட்ட தமிழக அரசு (இப்பொழுது அவ்வாணையை ஏறெடுத்துப் பாராதிருக்கும் தன் போக்கை மாற்றி) வருங்காலத்திற் தமிழ்மூலம் நடக்க வேண்டிய மின்னாளுமைத் தேவை கருதி விழித்துக்கொண்டால் நல்லது. இன்னும் எத்தனை பத்தாண்டுகளுக்கு முற்றூட்டாளருக்கு அடங்கி, புதுக்குடியேற்ற நாடாக நம் மாநிலத்தை இயக்கி, ஆங்கிலத்தைக் கட்டி மாரடிக்கப் போகிறோமோ? தெரியவில்லை.  (நிலா, நிலா, ஓடிவா, நில்லாமல் ஓடிவா, மலைமேலே ஏறிவா, மல்லிகைப்பூ கொண்டுவா - எனும்) 10 கோடித்தமிழரின் தாய்மொழியை அடியோடு அகற்றி (Ba,ba black sheep, have you any wool? Yes sir, yes sir, 3 bags full" எனும்) ஆங்கிலத்திற்கு மாற்றும் வரையிலா? தமிழரின் அடையாளம் தமிழ்மொழி இல்லையா?

ஓரிந்தியா / ஓரெழுத்து எனும் முன்னீடு இந்தியாவின் தேசியமொழிகளைக் குலைக்கும் முயற்சியாகும். உலகிற் 10 கோடிப்பேர் பேசும் தமிழ் மொழியை அழிக்க இதைக் காட்டிலும் ஒரு
முயற்சி தேவையில்லை. தமிழர் இதற்கு ஒருப்படவே கூடாது. இன்னோரெழுத்தை தமிழுக்குப் பரிந்துரைப்பது எப்படித் தவறோ, அதே போலத் தமிழெழுத்தை அடிப்படையாக்கி மற்ற தேசிய மொழிகளுக்குப் பரிந்துரைப்பதும் தவறு தான். மக்களாட்சி நாட்டில் அவரவர் எழுத்து அவரவருக்குயர்வே. அவற்றைப் போற்றி வளர்க்க வேண்டுமே தவிர, குலைத்தழிக்கக் கூடாது. இந்தியா என்பது பல்வேறு தேசிய இனங்கள் கூடிவாழும் கூட்டமைப்பு. இது ஒரே தேசிய இனம் வாழும் ஒற்றையாட்சி நாடல்ல.

அடுத்த புலனம் தமிழக அரசின் நடைமுறை பற்றியது சற்று விரிவாகவே பேசுகிறேன். தமிழக அரசே அரசாணை மூலம் ஏற்றுக்கொண்ட ஒருங்குறி, அனைத்தெழுத்துக் குறியேற்றம் (TACE) ஆகிய செந்தரங்களையும் Tamil 99 போன்ற விசைப்பலகைச் செந்தரங்களையும் புழங்காது ”வானவில்” போன்ற தனியார் குறியேற்றங்களையும், தந்தம் உகப்பில் வெவ்வேறு விசைப் பலகைகளையும் தொடர்ந்து அரசலுவங்களிற் புழங்குவது தமிழக அரசின் மின்னாளுகைக்கு உறுதுணையாகாது. அரசின் பல்வேறு அமைச்சுகளிலும், துறைகளிலும்   

அங்கிங் கெனாதபடி எங்கும் ப்ரகாசமாய்
           ஆனந்தப் பூர்த்தியாகி
    அருளோடு நிறைந்ததெது தன்னருள் வெளிக்குளே
          அகிலாண்ட கோடியெல்லாந்
தங்கும் படிக்கிச்சை வைத்துயிர்க் குயிராய்த்
           தழைத்ததெது மனவாக்கினில்
    தட்டாமல் நின்றதெது சமயகோ டிகளெலாந்
          தந்தெய்வம் எந்தெய்வமென்
றெங்குந் தொடர்ந்தெதிர் வழக்கிடவும் நின்றதெது
         எங்கணும் பெருவழக்காய்
   யாதினும் வல்லவொரு சித்தாகி இன்பமாய்
        என்றைக்கு முள்ள தெதுஅது
கங்குல்பக லறநின்ற எல்லையுள தெதுஅது
        கருத்திற் கிசைந்ததுவே
   கண்டன வெலாமோன வுருவெளிய தாகவுங்
        கருதிஅஞ் சலிசெய்குவாம்.     1.

என்று வியந்து அஞ்சலி செய்யும் நிலைக்கு “இதுவொரு கடவுளோ?” என்று மயங்கும் வகையில் “வானவில்” குறியேற்றத்தின் ஆட்சி கொடி கட்டிப் பறக்கிறது. தமிழக அரசின் அரசாணை அதனாலேயே பின்பற்றப்படாது ஏற்கனவே அரசாண்ட / இப்பொழுது அரசாளும் இருபெரும் திராவிடக் கட்சிகளும் தாம் ”வானவில்லை” வாழ வைக்கிறார். மற்றெந்த அரசியற் கட்சியருங் கூட மோனத்திற் பேசாதிருக்கிறார். அரசின் அதிகாரிகளும் ”பூனைக்கு யார் மணிகட்டுவது?” என்று ஒருவர் முகத்தை இன்னொருவர் பார்த்திருக்கிறார். ஆர்வலரும், அறிஞரும் அதிர்ந்து போய்க் கிடக்கிறார். கணித்தமிழ்ச் சங்கம், உத்தமம், கணித்தமிழ்ப் பேரவையென இருக்கும் வல்லுநர் குழுமங்களும் செய்ய வேண்டுவது புரியாது கைபிசைந்து நிற்கின்றன.

இதற்கு இடையில் அரசின் தட்டச்சர், கீழ்நிலை எழுத்தர் ஆகியோரிடையே. வானவிற் “கலாச்சாரம்” நாளொரு மேனியும் பொழுதொரு வண்ணமுமாய் வளர்கிறது. இதுவொரு பக்கம் களையாய்ப் படர, இன்னொரு பக்கமோ தமிழக அரசின் உயரிடங்களில் ஆங்கிலமே அலுவல் மொழியாகத் தொடர்கிறது. ஆங்கில ஆவணங்களையே தமிழக அரசு இன்றும் அடிப்படை ஆவணங்களாய்க் கொள்கிறது. இந்நாடு சுதந்திரம் பெற்றதெல்லாம் 67 ஆண்டுகளுக்குப் பின் வெறுங்கதை தான் போலும். நம் மனங்களைக் கட்டிப் போட்டு அடிமையாக்கிய ஆங்கிலன் கைகொட்டிச் சிரிக்கிறான். தமிழருக்காகத் தமிழரால் நடத்தப்பெறும் தமிழக அரசிற்குள் தமிழ்மொழி உப்பிற்குச் சப்பாணியாய் உழல்கிறது.

இதிற் சோகமான மெய்மை என்னவெனில், நடைமுறையில் வானவிற் புழக்கம் தமிழக அரசினுள் அழியாது, தமிழ்க்கணிமைக்குச் சற்றும் எதிர் காலம் இல்லை. வெறும் வாய்ப்பேச்சிற்கும், இணையத்தில் வெட்டி யரட்டைக்கு மட்டுமே தமிழ்க்கணிமை பயன்பட்டுவிடுமோ என்று தோன்றுகிறது. ஒருங்குறியும், அனைத்தெழுத்துக் குறியேற்றமும் தமிழக அரசினுள் பரவலாகப் புழங்கினாற்றானே, மின்னாளுகை, மின்கல்வி, மின்வாணிகம், மின்நூலகம் என பல்வேறு புலங்கள் பற்றிப் பேசமுடியும்? எல்லாவிடத்தும் வானவில்லே உறை கொண்டு கோலோச்சினால் அப்புறம் என்ன விளங்குஞ் சொல்லுங்கள்? நான் சொல்லுவது பலருக்கும் கசப்பாக இருக்கலாம். ஆனால் நஞ்சை நஞ்சென்று சொல்லாது வேறென்னென்று சொல்லமுடியும்? 

அரசிற்குள் தமிழ்மொழி அடிப்படை மொழியாகவன்றி அலங்கார அரசியல் மொழியாகவே இருக்கிறது. அதற்கு வானவில் போன்ற தனியார் குறியேற்றம் பெரிதும் உறுதுணையாகிறது. அரசு அலுவத்தில் தமிழிற் தொடர்பு ஆடுகிறவன் தமிழ்ப் பித்தந் தலைக்கேறியவனாகவே கருதப்படுகிறான். தமிழக அரசுத்துறைகளின் வலைத்தளங்களும் ஒருங்குறி அல்லது அனைத்தெழுத்துக் குறியேற்றத்திற்கு இன்னும் மாறவேயில்லை. மொத்தத்தில் அரசினுள் வானவில்லின் வல்லாட்சி கட்டாயம் போக வேண்டும். இதுபற்றி 4,5 ஆண்டுகளாய் எல்லா வாய்ப்புக்களிலும் சொல்லி வந்திருக்கிறேன். (இம் mandate பற்றி அரசாணை வந்தவுடனே பேசாது, இவ்வளவு நாள் அமைதிகாத்த தமிழிணையக் கல்விக்கழகம், இப்போதாவது பொதுவுரையாடலிற் பேசுகிறதே, அந்தளவிற்கு அது வரவேற்கத்தக்கது தான். ஏதோ கண்கெட்ட பின் “சூரிய நமஸ்காரம்” செய்கிறார் என்றெண்ணிக் கொள்வோம். ஆனால் இவ்விதயம் இவர்கள் மட்டும் பேசுவதல்ல.) தமிழார்வலர் எல்லோரும் பேரியக்கமாய் கூடிப் பேசி, தமிழின் இருப்பையே போக்கடிக்கும் நிலையை மாற்றவேண்டும்.

[இதில் இன்னொரு வருத்தத்தையுஞ் சொல்லவேண்டும். தமிழ்க்கணிமையை ஒட்டிப் பொறிஞரும், தமிழறிஞரும் பெரும்பாலும் முரணிக்கொண்டு தனித்து நிற்கிறாரோவென்ற ஐயம் எனக்குக் கொஞ்ச நாளாய் ஏற்பட்டிருக்கிறது. எல்லாம் அவரவர்க்குக் கூடிப்போன அகப்பாடாகவே (ego) இருக்கிறது. இவரைக் கேட்டால் அவர் மேற் குற்றஞ் சொல்கிறார். அவரைக் கேட்டால் இவர் மேற் குற்றஞ் சொல்கிறார். இவர் கூட்டுங் கூட்டத்தை அவர் குறைசொல்வதும், அவர் கூட்டுங் கூட்டத்தை இவர் குறைசொல்வதும், மொத்தத்திற் தமிழ்க்கணிமைக்கு நல்லதல்லவென்று என்னைப் போன்றோர் சொல்லிக்கொண்டேயிருக்கிறோம். ஆனால் சங்கூதுவது கேட்காத செவியாளராய் இருந்தால் என்ன சொல்வது?]

தமிழகத்தில் விற்கும் எல்லா முகன மின்னணுக் கருவிகளிலும் (modern devices) தமிழ் வலுவாண்மை (Tamil enabled) கட்டாயம் இருக்கவேண்டும். அப்படி யில்லாக் கருவிகள் தமிழகத்தில் விற்கப்படக் கூடாது. மீறி விற்றால் அவற்றின் விற்பனை வரி கூட்டப்படவேண்டும். இப்படியொரு கட்டாயத்தை ஒரு மக்களாட்சி மாநிலம் உறுதியாகச் செய்யமுடியும். தமிழருக்கு நல்லது செய்வோமென்ற வாக்குறுதியில் ஆட்சிக்கு வந்து தமிழுக்கு முதன்மை கொடுக்காவிடில் எப்படி? இங்கு அரிதாரம் பூசி அலங்காரங் காட்டும் வேடிக்கை நாடகமா நடத்துகிறோம்? அதே போல சில்லறை/பெரு வணிகத்தில் பெறுதிச் சீட்டுகள் (receipts), விளக்க அறிக்கைகள் (reports), விற்பனைப் பொருள்களோடு வரும் விளக்கப் பொத்தகங்கள் (hand books), கையேடுகள் (hand-outs) போன்றவை தமிழிலேயே இருக்கவேண்டும். அன்றி, ஆங்கிலத்தில் மட்டுமே அவையிருந்தால், அதிக விற்பனை வரி போடுவதாய்த் தமிழக அரசு ஆணையிடவேண்டும்.

தமிழகப் பல்கலைக் கழகங்களில் பொறியியல், மருத்துவம், முதுநிலைப் படிப்பு (Masters' degree) போன்றவற்றின் இறுதியில் மாணவர் சமர்ப்பிக்கும் புறத்திட்டு அறிக்கைகளில் (project reports) 5 பக்கத் தமிழ்ச்சுருக்கந் தருவது கட்டாயமாக வேண்டும். தாம் படித்த படிப்பைத் தமிழில் விளக்கத் தெரியாதோர்க்குத் தமிழகப் பல்கலைக்கழகங்கள் பட்டமளிக்கக் கூடாது. இதை நெறிப்படுத்தாத பேராசிரியர் தமிழருக்குத் தேவையில்லை. தமிழ் நாட்டு வணிகம், கல்வி, ஆட்சி, நீதி ஆகிய பல்வேறு துறைகளில் “தமிழ் சோறு போடும்” என்ற நிலை இல்லாவிட்டால் தமிழ் இங்கு வாழவே வாழாது, தமிழரும் கண்டுபிடிப்பாளர் ஆகமாட்டார், தமிழர் பொருளாதாரமும் உயராதென எல்லாவிடத்தும் சொல்லிவந்திருக்கிறேன்.

இப்போதையக் கட்டுரை கருத்தரங்கிற் பேசப்பட்ட முதற் புலனம் பற்றியது. இதுவொரு சிறு புலனந் தான். இருந்தாலுஞ் சொல்லவேண்டியிருக்கிறது.

(ஓர் இடைவிலகல். ’ஒருங்குறி’யினுள் இன்னொரு குகரத்தை உள்நுழைத்து ஒருங்குகுறியென்று சிலர் இப்போதெல்லாஞ் சொல்லத் தலைப்படுகிறார். ஆழ ஆய்ந்தால் இன்னொரு குகரம் இடைபுகத் தேவையில்லை. ஒருங்குறியின் சொற்பிறப்பு பற்றி ’வளவு’ வலைப்பதிவில் எழுதியுள்ளேன். தமிழிலக்கணப்படி ’ஒருங்குறி’ என்பது சரியான சொல்லாக்கங் தான். மொழியின் சொற்பிறப்பு மொழிச் சட்டாம்பிள்ளைகளின் கையிலில்லை.)

அன்புடன்,
இராம.கி.