"எழுத்துச் சீர்குலைப்பாளர் தமிழக அரசியலாரிடம் தங்களுக்கு இருக்கும் அணுக்கத்தைப் பயன்படுத்தி உலகத் தமிழ்ச் செம்மொழி மாநாட்டின் முடிவில் எழுத்துச் சீர்குலைப்பிற்கு ஆதரவாக ஓர் அரசாணை கொண்டுவர முயல்கிறார்" என்று 10, 11 மாதங்களுக்கு முன் அரசல் புரசலாகச் செய்தி வெளிப்பட்டது. இது தெரிந்தவுடனேயே ”இதை நடக்க விட்டுவிடக் கூடாது, பலரையும் ஒருங்கு சேர்த்து நம்மால் முடிந்தவரை, பரவலாய் எதிர் வாதங்களைத் தொடுக்க வேண்டும், அதேபொழுது எழுத்துக்காப்பு வாதங்கள் ‘அவர் சொன்னார், இவர் சொன்னார்’ என்று வெறும் மேற்கோள் காட்டுவதாய் மட்டுமே அமையக்கூடாது. மாறாக, யாராலும் அளக்கக் கூடிய எண்ணக (measurable and quantitative) முறையில், அடிப்படை ஏரணங்களோடு (with basic logic), அமையவேண்டும்” என்று எங்களிற் சிலர் எண்ணினோம். எண்ணக முறை வாதங்களை எழுப்பும் பொறுப்பைச் சொவ்வறையாளர் (software specialist) திரு. நாக. இளங்கோவன் ஏற்றுக் கொண்டார். ”இகர, ஈகார, உகர, ஊகார உயிர்மெய்களான 72 எழுத்துக்களை மாற்றுவதால் எத்தனை விழுக்காட்டுத் தமிழ்ச் சொற்கள் தம் உருவை மாற்றிக் கொள்ளும்?” என்று அளவிடும் வகையில் நிரல் எழுத முன்வந்து, அந்தப் பணியைச் சிறப்பாகவே செய்தார். அதன் விளைவாக எழுத்துக் குலைப்புச் செய்கையின் முழுப் பரிமானம் பலருக்கும் புரிந்தது. [நாக.இளங்கோவனின் அலசல் அண்மையில் நடந்த செம்மொழி மாநாட்டில் மொழியியற் புலத்தில் கட்டுரையாகப் படிக்கப் பட்டது.] அதை விளக்குமுன் இவ்விடத்தில் ஒன்றைச் சொல்லவேண்டும்.
நாம் பேசும்மொழியிற் பொருள் பொதிந்த அடிக்கூறு சொல்லெனும் அளவை தான். சொற்களைப் புரிவதிற் தடுமாறினால் ஒரு புலனம் பற்றிய பொருட்புரிதல் இல்லாது போகும். சொற்கள் புரிவதற்கு எழுத்துக்கள் வசப் படவேண்டும். வீச்செழுத்துக்களில் இருந்து அச்செழுத்துக்களுக்கு வந்து சேர்ந்த 400 ஆண்டுகளிற் தான் நம்முடைய எழுத்துக்கள் பெரிதும் நிலை பெற்றிருக்கின்றன. There is no more change of shapes. இந்த எழுத்துக்களை இப்போது வலிந்து திருத்துவது என்பது ”பரமபத” விளையாட்டில் பெரிய பாம்பு கடித்து இரண்டாம் கட்டத்திற்குத் திரும்பப் போவது போன்றதாகும். இப்படி எத்தனை முறை இரண்டாம் கட்டத்திற்குப் போவது? மீண்டும் தொடக்கக் கட்டத்தில் இருந்து பொத்தகங்களைத் திரும்ப அச்சடித்து எல்லா வேலைகளையும் திரும்பச் செய்து நம்மைப் பின் தள்ளுவதற்கே இது போன்ற சீர்குலைப்பு வேலைகள் பயன்படும். தமிழிற் செய்வதற்கு எத்தனையோ வேலைகள் உள்ளன. அவற்றைச் செய்யாமல், எழுத்துத் திருத்தம் செய்ய முற்படுவது, வெட்டிவேலையேயாகும். எது உடையவில்லையோ, அதை உடைத்து ஒட்டாதீரென ஆங்கிலத்தில் சொலவடை உண்டு. குழப்பமில்லாத எழுத்தை உடைத்து ஒட்டவைக்க முயல்வதும் அப்படி ஒரு நிலை தான். நம் உடம்பிற்குக் காய்ச்சல் இல்லாத போது காய்ச்சல் மருந்து சாப்பிடுவோமோ?
”எழுத்துக்களைத் திருத்துவதால் ஓர் ஆவணத்தில் எத்தனை சொற்களின் தோற்றம் மாறும்?” என்று கணக்கிடுவது ”எத்தனை இடங்களில் பொருளைப் புரிந்துகொள்ளத் தடுமாறுகிறோம், சோர்வடைகிறோம்” என்று கணித்து உரைப்பதாகும். சொற்பொருள் புரிவதிற் தடுமாறவைக்கும் ஆவணங்களால் நாம் சலிப்படைந்து அவற்றைப் படிக்காமலே போய்விடுவோம். ஒரு பழைய ஆவணத்தைச் சீர்குலைப்பு எழுத்தில் வெளியிட்டுப் படிக்கவைத்தால் எத்தனை இடங்களில் நாம் படிக்க இடர்ப்படுகிறோமோ, அத்தனை முறை “இந்த ஆவணத்தை ஏன் படித்துத் தொலைக்கவேண்டும்?” என்ற எரிச்சல் நம்முள் மேலெழுந்து, அதன் விளைவாய் ஆவணத்தைக் கீழே போட்டு வேறு வேலை பார்க்கப் போய்விடுவோம். இது மாந்த இயல்பு. எல்லாம் நமக்குள் இருக்கும் பழக்கத் தோய்வே காரணம்.
இகர, ஈகார, உகர, ஊகார உயிர்மெய்களைத் திருத்துவதால் கிட்டத்தட்ட 80% தமிழ்ச்சொற்கள் தம் தோற்றத்தில் மாறும் என்று திரு. நாக. இளங்கோவன் தம் ஆய்வின் முடிவிற் கண்டறிந்தார். [அதாவது தமிழ்ச்சொற்களில் 80% சொற்கள் இகர, ஈகார, உகர, ஊகார உயிர்மெய்கள் பயிலாது எழுவதில்லை.] அதைப் பற்றிய விளக்கத்தை அவர் கட்டுரையிற் காணலாம். அதற்கு முன் இயல்பான தமிழெழுத்துப் பரம்பல் (natural distribution of Tamil letters) பற்றிய செய்திகளை இங்கு பார்ப்போம். மேலே சொல்வது போல் சொல்லைக் கணக்கிற் கொள்ளாமல் வெறுமே எழுத்துப் பரம்பலை மட்டும் பார்ப்பது இன்னொருவகை அலசலாகும் அதை எனக்குத் தெரிந்து கி.பி.2000-த்தில் கல்பாக்கம் சு. சீனிவாசனும், அவருக்கு முன் 1990 களின் பிற்பாதியில் தகுதரக் (TSCII) குறியீட்டினரும் பார்த்திருந்தார். எழுத்துக்கள் அடங்கிய சொற்களாகப் பார்ப்பது (நாக. இளங்கோவன் கொடுத்த புள்ளிவிவரம்) இதனின்று வேறுபட்டது. இரு வகை அலசல்களுக்கும் தமிழிற் தேவைகள் உண்டு. ஒன்று இன்னொன்றிற்கு ஒளிகூட்டும். இக் கட்டுரையில் எழுத்துப் பரம்பலின் வெவ்வேறு பரிமானங்கள் குறித்துப் பார்க்கப் போகிறோம்.
கல்பாக்கம் சு.சீனிவாசன் தமிழிணையம் 2000-த்தில், வேறொரு புலனத்தில், “அஸ்கி மற்றும் யுனிக்கோடு தமிழ்க் குறிமுறைகளின் சார்புச் செயல்திறன் மதிப்பீடு” என்ற கட்டுரையில் தமிழ் உரையில் புழங்கும் எழுத்துக்களின் பரம்பலைக் (TAMIL LETTER DISTRIBUTION) குறித்திருந்தார். அதன்படி
நேர்ச்சிப் பெருவெண் %
(frequency of occurance)
அனைத்து உயிரெழுத்துக்கள் 7.35
அனைத்து மெய்யெழுத்துக்கள் 29.45
அகர உயிர்மெய் எழுத்துக்கள் 21.13
இகர, ஈகார உயிர்மெய் எழுத்துக்கள் 11.47
உகர, ஊகார உயிர்மெய் எழுத்துக்கள் 12.93
ஆகார, எகர, ஏகார, ஐகார உயிர்மெய் எழுத்துக்கள் 14.97
ஒகர, ஓகார, ஔகார உயிர்மெய் எழுத்துக்கள் 2.69
என்று எழுத்துப் பரம்பல் அமையும். இப்புள்ளிவிவரம் சொற்களைக் கருதாமல் வெறுமே எழுத்துக்களை மட்டும் பார்ப்பதாகும். இந்த விவரத்தில் ஆகாரம் பற்றிய புள்ளிவிவரத்தை அகரத்தோடும், ஐகார, ஔகார பற்றிய புள்ளிவிவரங்களைத் தனித்தும் கொடுத்திருந்தால் அவதானிப்பதற்கு நன்றாக இருந்திருக்கும். ஆனால் திரு. சீனிவாசன் அப்படித் தரவில்லை. இணையத்தில் இருந்து கிட்டத்தட்ட 4 இலக்கம் எழுத்துக்கள் அடங்கிய பல்வேறு ஆவணங்களை தம் ஆய்விற்கெனக் கீழிறக்கி அவற்றை வகை பிரித்து எண்ணிப்பார்த்துக் கணக்குப் போட்டு இந்தப் புள்ளிவிவரத்தை உருவாக்கியிருந்தார். இந்த விவரத்தின் சிறப்பு இற்றைத் தமிழின் எந்த ஆவணத்திலும் நிரவலாய்க் (average) கிடைக்கக் கூடிய தமிழெழுத்துப் பரம்பலைத் தெரிவிப்பதாகும்.
இதே போன்றதொரு புள்ளி விவரத்தை தகுதரக் குறியீட்டை (TSCII) உருவாக்கும் போது முனைவர் கல்யாண சுந்தரமும் ஓர் ஆவணத்தின் வழி வெளியிட்டிருந்தார். (முத்து நெடுமாறனும், மணிவண்ணனும் அந்த ஆவணத்திற் பங்களித்தார் என்றே எண்ணுகிறேன். சரியாக நினைவில்லை.) பத்துப் பதினைந்து ஆண்டுகளிற் பழகிய என் பல்வேறு கணிகளில் ஏதோவொன்றில் அந்த ஆவணத்தின் படி (copy) சிக்கி, என்னால் மேலும் படியெடுத்துத்தர இயலாதிருக்கிறது. அந்த ஆவணம் வரலாற்றுக் காரணமாய்க் காக்கப் படவேண்டிய ஒன்று. உத்தமம் ஆவணக் காப்பகத்தில் திரு. கல்யாணசுந்தரம் அதைச் சேமித்து வைக்கலாம். அவர் அதை மீண்டும் வெளியிட்டால் நல்லது. நானறிந்து தமிழெழுத்துப் பரம்பலை அறிவியல் வழியில் முதன்முதலாய் அளந்து சொல்லிய ஆவணம் அதுவேயாகும். திரு. கல்யாணசுந்தரம் அளித்த புள்ளிவிவரத்திற்கும் சீனிவாசன் அளித்த புள்ளி விவரத்திற்கும் பெரிதாய் வேறுபாடு கிடையாது. வேண்டுமானால், ஒருசில பதின்மப் புள்ளிகள் வேறுபட்டிருக்கலாம்.
இந்தப் பரம்பலில் இருந்து பெறப்படும் ஒரு சில முடிவுகள் நமக்குச் சற்று அதிர்ச்சியையும், வியப்பையும் கொடுக்கக் கூடியவை.
தமிழெழுத்து என்பது அரிச்சுவடி என்னும் எழுத்தசை வகையைச் சேர்ந்தது (alpha-syllabary, அதாவது எழுத்துக்களும் அசைகளும் சேர்ந்தது தமிழ் எழுத்தாகும்) என்று நாமெல்லோரும் அறிவோம். அரிச்சுவடியை அபுகிடா (abugida) வகை என்று ஒரு சில மேல்நாட்டார் அரைகுறைப் புரிதலிற் சொல்வார். அது தவறு. ”அரிச்சுவடியும் அபுகிடாவும் முற்றிலும் வெவ்வேறானவை, அதேபோல அரிச்சுவடியும் அல்வபெட் (alphabet) என்னும் அகரவரிசையும் வெவ்வேறானவை, இன்னுஞ் சொன்னால் அரிச்சுவடியும் மெய்யெழுத்து, அதை உயிர்மெய்யாக்கத் துணைக்குறியீடு என்றியங்கும் அபுசட் (abujad) என்பதும் கூட வெவ்வேறானவை” என்ற கருத்தை அண்மையிற் செம்மொழி மாநாட்டில் பேரா. செல்வக் குமார் மிகத் தெளிவாகத் தெரிவித்திருந்தார்.
அரிச்சுவடி என்ற கலைச்சொல்லை அகரம் என்ற தமிழ்ச்சொல்லின் திரிவான அக்கரம்>அக்ஷரம் என்ற வடநாட்டுக் கலைச்சொல்லால் திரு. மணிவண்ணன் TACE 16 RFC document இல் கையாளுவார். அரிச்சுவடி என்ற தமிழ்க் கலைச்சொல்லும் அக்ஷரம் என்ற வடநாட்டுக் கலைச்சொல்லும் ஒன்றிற்கொன்று அப்படியே இணையானவை. மேல்நாட்டுக்காரர் புரிந்து கொள்ளுதற்காக அக்ஷரம் என்ற வடநாட்டுக் கலைச்சொல்லைப் பயன் படுத்துவதில் எனக்கொன்றும் மாறுபாடு இல்லை. தமிழில் அரிச்சுவடி என்ற கலைச்சொல்லையே நாம் பயன்படுத்துவோம் [அந்தக் காலத்தில் 50, 60 ஆண்டுகளுக்கு முன்னாற் கூட, நாட்டுப் புறங்களில் திண்ணப் பள்ளிக் கூடத்தில் அரிசிப் பரப்பில் எழுதித் தான் தமிழ்ப்பிள்ளைகளின் எழுத்துப் பயிற்சி (அக்க்ஷர அப்பியாசம்) தொடங்கும். அரி(சி)யில் (அரிசி என்பது வெறும் நெல்லரிசியைக் குறிக்கவில்லை. எல்லாக் கூலங்களின் அரிசியைக் குறித்தது.) எழுதத் தொடங்கும் எழுத்து வகை என்பதால் அரிச்சுவடி என்ற பெயர் ஏற்பட்டது.]
அரிச்சுவடி என்பது அடிப்படை எழுத்துக்களையும், அவற்றின் பெருக்கெழுத்துக்களையும் (product characters) உறுப்பாய்க் கொண்டது. அதாவது எழுத்தசை என்பதை ஒரு கொத்து (set) என்றால் உயிரெழுத்து என்பது அதனுள் ஓர் உட்கொத்து (subset). (அதன் எண்ணிக்கை 12) மெய்யெழுத்து என்பது இன்னோர் உட்கொத்து.(அதன் எண்ணிக்கை 18. இதனுள் ஜ்,ஷ்,ஸ்,ஹ் என்ற நாலு கிரந்த எழுத்துச் சேர்த்தால் எண்ணிக்கை 22 ஆகும். அண்மையில் 3,4 ஆண்டுகளுக்குள் முன் ஒருங்குறிக்குள் சேர்த்த இன்னொரு z ஒலிச் சகரம் ( 0bb6 in unicode) ஒரு முட்டாள்தனமான கூத்து. தமிழ்ப் பள்ளிக்கூடங்களில் யாருக்குஞ் சொல்லிக் கொடுக்காத, ஒரு சில விதப்பான, விரல்விட்டு எண்ணக் கூடிய, பயனாளர் மட்டுமே பயனாக்கும் எழுத்து அதுவாகும். இதுபோல அதிநுணுக்கச் சிறுபான்மையாளர் பயன்படுத்தும் எழுத்துக்களை எல்லாம் தமிழ் அரிச்சுவடியில் சேர்க்கத் தொடங்கினால், அப்புறம் தமிழெழுத்து என்பது எல்லையில்லாது போய்விடும். One has to put a full stop to these kinds of unwanted additions. க்ஷ் என்பது மெய்க்கூட்டு. மெய்க்கூட்டைத் தவிர்க்கும் தமிழில் அதைக் கணக்கில் சேர்த்ததும் தவறு தான். ஸ்ரீ என்பது ஒற்றைக் கூட்டெழுத்து.)
உயிர், மெய் ஆகிய இரண்டின் பெருக்கமாய் 12*18 = 216 எழுத்துக்களாய் (அல்லது கிரந்தம் சேர்த்தால் 12*22 = 264 எழுத்துக்களாய்) அமையும் உயிர் மெய்கள் இன்னோர் உட்கொத்து. இவை போக நாலாவது உட்கொத்து தொல்காப்பியரின் படி குற்றியலுகரம், குற்றியலிகரம், ஆய்தம் ஆகிய மூன்று உறுப்பினர் அடங்கியதாகும். ஆனால் இற்றைத் தமிழில் இது ஒரே உறுப்பினர் அடங்கிய உட்கொத்தாய் ஆகிவிட்டது. எல்லா உட்கொத்து உறுப்புகளையும் கூட்டிப் பார்த்தால், தமிழெழுத்து வரிசை மொத்தம் 247 எழுத்துக்கள் (கிரந்தம் சேர்த்தால் 12+22+12*22+1 = 300 எழுத்துக்கள்) கொண்டதாகும். இவற்றின் அடிப்படையில் எந்த ஆவணத்திலும், இயல்பாக ஏதேனும் ஓர்
உயிரெழுத்துத் தோன்றுதற்கான பெருதகை (probability) = 12/247 = 0.048583 (கிரந்தம் சேர்த்தால் 0.04.)
இதே போல பெய்யெழுத்துப் பெருதகை = 18/247 = 0.0728745 (0.06)
அகர, ஆகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
இகர, ஈகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
உகர, ஊகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
எகர, ஏகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
ஐகார உயிர்மெய்ப் பெர்தகை = 18/247 = 0.0728745 (0.06)
ஒகர, ஓகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
ஔகார உயிர்மெய்ப் பெருதகை = 18/247 = 0.0728745(0.06)
இப் பெருதகைகளைக் கணக்கிடும் போது ஓரெழுத்தின் நேர்ச்சி (occurrence) இன்னோர் எழுத்தின் நேர்ச்சியைப் பாதிக்காது என்றும் இரண்டும் ஒன்றிற்கொன்று பந்துறாதவை (independant; பந்தம் = dependency) என்றும் நாம் கருதிக் கொள்ளுகிறோம் (hypothesize). ஆழ்ந்து ஓர்ந்து பார்த்தால் அத்தகைய கருத்து தமிழைப் பொறுத்தவரை உண்மையில்லை தான். எழுத்துக்களின் நேர்ச்சி பல சொற்களில் ஒன்றையொன்று சார்ந்திருப்பதைப் பலவிடத்தும் உணரமுடியும். காட்டாக, பங்து என்ற சொல் தமிழில் அமையவே அமையாது. அது பந்து என்றிருக்கலாம், அல்லது பங்கு என்றிருக்கலாம். ’ங்’ஙும், ’து’வும் எங்கும் சேரமுடியாத எழுத்துக்கள். இது போன்ற கட்டியப் பெருதகைகளைக் (conditional probablities) கணக்கிடுவது இன்றைய நிலையிற் கடினம் என்பதால், மேலே சொல்லும் முடிவு ஒருபக்கச் சாய்வாக இருக்கலாம் எனினும் எழுத்துக்களின் நேர்ச்சி ஒன்றிற்கொன்று பந்துறாதவை என்றே இவ்வாய்வில் கருதிக் கொள்கிறோம்.
இனி இத்தேற்றப் பெருதகையையும் (theoretical probability) மேலே சீனிவாசன் 4 இலக்கம் தமிழெழுத்துக்கள் கொண்ட ஆவணங்களை இறக்கிக் கணக்கெடுத்த இயல் நேர்ச்சியையும் ஒப்பிட்டுப் பார்த்தால், ஒரு புதிய செய்தி விளங்கும். இற்றைத் தமிழில் உயிரெழுத்துக்களும், மெய்யெழுத்துக்களும், அகர, ஆகார உயிர்மெய்களும் (ஆகார உயிர்மெய் நேர்ச்சியைச் சீனிவாசன் எகர, ஏகாரத்தோடு சேர்த்து விட்டார், எனவே குத்து மதிப்பாக 7 அல்லது 8 விழுக்காட்டை நாம் அகர உயிர்மெய் நேர்ச்சியோடு சேர்க்கலாம். அதற்குக் காரணம் இருக்கிறது கீழே பார்ப்போம்.) எதிர்பார்க்கப்படும் பெருதகையைக் (expected probability) காட்டிலும் இருமடங்கு அதிகமாக நேர்ச்சியுறுகின்றன. அதேபொழுது இகர, ஈகாரங்களும் உகர, ஊகாரங்களும் கிட்டத்தட்ட நிரவலாக எதிர்பார்த்த பெருதகையை ஒட்டியே நேர்ச்சி கொள்ளுகின்றன. எகர, ஏகார, ஐகார, ஒகர, ஓகார, ஔகாரங்களும் எதிர்பார்க்கப் பட்ட பெருதகைக்கும் மிகக் குறைவாகவே நேர்ச்சி கொள்கின்றன. [உயிரெழுத்து அதிகம் நேர்ச்சி கொள்ளுவது இக்காலப் பழக்கமாய் இருக்கலாம். பெரும்பாலும் புணர்ச்சி பிரித்து எழுதும் இக்காலக் காரணத்தால் உயிரெழுத்துக்கள் இயல் பெருதகையைக் காட்டிலும் அதிகமாகத் தோற்றங் கொள்ளலாம்.]
விவரித்துச் சொன்னால், தமிழ் அரிச்சுவடியில் 247 அசையெழுத்துக்கள் இருந்தாலும் நாம் நடைமுறையில் 12+18+36 = 66 எழுத்துக்களையே மிக அதிகமாகப் பயன்படுத்துகிறோம். இது ஒரு வியப்பான அவதானிப்பு. கிட்டத்தட்ட மூன்றில் இரண்டு பங்கு எந்தத் தமிழாவணத்திலும் இந்த 66 எழுத்துக்களே பயன்கொள்ளுகின்றன. Even though Tamil Script is alpha-syllabary, it uses its alphabets and the akara, aakaara syllables more for articulation compared to other syllables. This is remarkable and it perhaps characterizes the Tamil language. தமிழின் இயல்பு இது தான் போலும். இந்த இயல்பை காலந்தோறும் எழுந்த ஆவணங்களின் வழி ஆய்வு செய்வது பல்வேறு ஆய்வு முடிவுகளை நமக்கு உணர்த்தலாம். அதற்காக மற்ற அசைகளைத் தூக்கியெறிந்து விடலாமா என்றால் இல்லை யென்றே சொல்லவேண்டும். ஓர் தமிழிசை விருந்தில் ”ஆ, அ .......என்று ஆலத்தி (ஆலாபனை) மட்டும் சொல்லிப் போக முடியாதே? நம்மை அறியாமல் மூச்சை நிறுத்தி (மூச்சு நிறுத்தும் இடங்கள் எல்லாம் மெய் வந்தே தீரும்) பின் மாற்றும் போது மற்ற அசைகளைச் சொல்லும் கட்டாயத்திற்கு ஆளாகிறோம் அல்லவா?
மற்ற அசையெழுத்துக்கள் என்ன வகையில் தமிழ் மொழியாளுகையில் பயன்படுகின்றன என்று ஆய்ந்து சொல்லவேண்டும். அதற்குப் பல்வேறு காலகட்டங்களில் உருவாகிய இலக்கியங்களின், ஆவணங்களின் பல்வேறு கைச்சாத்துக்களை (signatures) அடையாளங் காணுவது நலம் பயக்கும்.
அன்புடன்,
இராம.கி.
நாம் பேசும்மொழியிற் பொருள் பொதிந்த அடிக்கூறு சொல்லெனும் அளவை தான். சொற்களைப் புரிவதிற் தடுமாறினால் ஒரு புலனம் பற்றிய பொருட்புரிதல் இல்லாது போகும். சொற்கள் புரிவதற்கு எழுத்துக்கள் வசப் படவேண்டும். வீச்செழுத்துக்களில் இருந்து அச்செழுத்துக்களுக்கு வந்து சேர்ந்த 400 ஆண்டுகளிற் தான் நம்முடைய எழுத்துக்கள் பெரிதும் நிலை பெற்றிருக்கின்றன. There is no more change of shapes. இந்த எழுத்துக்களை இப்போது வலிந்து திருத்துவது என்பது ”பரமபத” விளையாட்டில் பெரிய பாம்பு கடித்து இரண்டாம் கட்டத்திற்குத் திரும்பப் போவது போன்றதாகும். இப்படி எத்தனை முறை இரண்டாம் கட்டத்திற்குப் போவது? மீண்டும் தொடக்கக் கட்டத்தில் இருந்து பொத்தகங்களைத் திரும்ப அச்சடித்து எல்லா வேலைகளையும் திரும்பச் செய்து நம்மைப் பின் தள்ளுவதற்கே இது போன்ற சீர்குலைப்பு வேலைகள் பயன்படும். தமிழிற் செய்வதற்கு எத்தனையோ வேலைகள் உள்ளன. அவற்றைச் செய்யாமல், எழுத்துத் திருத்தம் செய்ய முற்படுவது, வெட்டிவேலையேயாகும். எது உடையவில்லையோ, அதை உடைத்து ஒட்டாதீரென ஆங்கிலத்தில் சொலவடை உண்டு. குழப்பமில்லாத எழுத்தை உடைத்து ஒட்டவைக்க முயல்வதும் அப்படி ஒரு நிலை தான். நம் உடம்பிற்குக் காய்ச்சல் இல்லாத போது காய்ச்சல் மருந்து சாப்பிடுவோமோ?
”எழுத்துக்களைத் திருத்துவதால் ஓர் ஆவணத்தில் எத்தனை சொற்களின் தோற்றம் மாறும்?” என்று கணக்கிடுவது ”எத்தனை இடங்களில் பொருளைப் புரிந்துகொள்ளத் தடுமாறுகிறோம், சோர்வடைகிறோம்” என்று கணித்து உரைப்பதாகும். சொற்பொருள் புரிவதிற் தடுமாறவைக்கும் ஆவணங்களால் நாம் சலிப்படைந்து அவற்றைப் படிக்காமலே போய்விடுவோம். ஒரு பழைய ஆவணத்தைச் சீர்குலைப்பு எழுத்தில் வெளியிட்டுப் படிக்கவைத்தால் எத்தனை இடங்களில் நாம் படிக்க இடர்ப்படுகிறோமோ, அத்தனை முறை “இந்த ஆவணத்தை ஏன் படித்துத் தொலைக்கவேண்டும்?” என்ற எரிச்சல் நம்முள் மேலெழுந்து, அதன் விளைவாய் ஆவணத்தைக் கீழே போட்டு வேறு வேலை பார்க்கப் போய்விடுவோம். இது மாந்த இயல்பு. எல்லாம் நமக்குள் இருக்கும் பழக்கத் தோய்வே காரணம்.
இகர, ஈகார, உகர, ஊகார உயிர்மெய்களைத் திருத்துவதால் கிட்டத்தட்ட 80% தமிழ்ச்சொற்கள் தம் தோற்றத்தில் மாறும் என்று திரு. நாக. இளங்கோவன் தம் ஆய்வின் முடிவிற் கண்டறிந்தார். [அதாவது தமிழ்ச்சொற்களில் 80% சொற்கள் இகர, ஈகார, உகர, ஊகார உயிர்மெய்கள் பயிலாது எழுவதில்லை.] அதைப் பற்றிய விளக்கத்தை அவர் கட்டுரையிற் காணலாம். அதற்கு முன் இயல்பான தமிழெழுத்துப் பரம்பல் (natural distribution of Tamil letters) பற்றிய செய்திகளை இங்கு பார்ப்போம். மேலே சொல்வது போல் சொல்லைக் கணக்கிற் கொள்ளாமல் வெறுமே எழுத்துப் பரம்பலை மட்டும் பார்ப்பது இன்னொருவகை அலசலாகும் அதை எனக்குத் தெரிந்து கி.பி.2000-த்தில் கல்பாக்கம் சு. சீனிவாசனும், அவருக்கு முன் 1990 களின் பிற்பாதியில் தகுதரக் (TSCII) குறியீட்டினரும் பார்த்திருந்தார். எழுத்துக்கள் அடங்கிய சொற்களாகப் பார்ப்பது (நாக. இளங்கோவன் கொடுத்த புள்ளிவிவரம்) இதனின்று வேறுபட்டது. இரு வகை அலசல்களுக்கும் தமிழிற் தேவைகள் உண்டு. ஒன்று இன்னொன்றிற்கு ஒளிகூட்டும். இக் கட்டுரையில் எழுத்துப் பரம்பலின் வெவ்வேறு பரிமானங்கள் குறித்துப் பார்க்கப் போகிறோம்.
கல்பாக்கம் சு.சீனிவாசன் தமிழிணையம் 2000-த்தில், வேறொரு புலனத்தில், “அஸ்கி மற்றும் யுனிக்கோடு தமிழ்க் குறிமுறைகளின் சார்புச் செயல்திறன் மதிப்பீடு” என்ற கட்டுரையில் தமிழ் உரையில் புழங்கும் எழுத்துக்களின் பரம்பலைக் (TAMIL LETTER DISTRIBUTION) குறித்திருந்தார். அதன்படி
நேர்ச்சிப் பெருவெண் %
(frequency of occurance)
அனைத்து உயிரெழுத்துக்கள் 7.35
அனைத்து மெய்யெழுத்துக்கள் 29.45
அகர உயிர்மெய் எழுத்துக்கள் 21.13
இகர, ஈகார உயிர்மெய் எழுத்துக்கள் 11.47
உகர, ஊகார உயிர்மெய் எழுத்துக்கள் 12.93
ஆகார, எகர, ஏகார, ஐகார உயிர்மெய் எழுத்துக்கள் 14.97
ஒகர, ஓகார, ஔகார உயிர்மெய் எழுத்துக்கள் 2.69
என்று எழுத்துப் பரம்பல் அமையும். இப்புள்ளிவிவரம் சொற்களைக் கருதாமல் வெறுமே எழுத்துக்களை மட்டும் பார்ப்பதாகும். இந்த விவரத்தில் ஆகாரம் பற்றிய புள்ளிவிவரத்தை அகரத்தோடும், ஐகார, ஔகார பற்றிய புள்ளிவிவரங்களைத் தனித்தும் கொடுத்திருந்தால் அவதானிப்பதற்கு நன்றாக இருந்திருக்கும். ஆனால் திரு. சீனிவாசன் அப்படித் தரவில்லை. இணையத்தில் இருந்து கிட்டத்தட்ட 4 இலக்கம் எழுத்துக்கள் அடங்கிய பல்வேறு ஆவணங்களை தம் ஆய்விற்கெனக் கீழிறக்கி அவற்றை வகை பிரித்து எண்ணிப்பார்த்துக் கணக்குப் போட்டு இந்தப் புள்ளிவிவரத்தை உருவாக்கியிருந்தார். இந்த விவரத்தின் சிறப்பு இற்றைத் தமிழின் எந்த ஆவணத்திலும் நிரவலாய்க் (average) கிடைக்கக் கூடிய தமிழெழுத்துப் பரம்பலைத் தெரிவிப்பதாகும்.
இதே போன்றதொரு புள்ளி விவரத்தை தகுதரக் குறியீட்டை (TSCII) உருவாக்கும் போது முனைவர் கல்யாண சுந்தரமும் ஓர் ஆவணத்தின் வழி வெளியிட்டிருந்தார். (முத்து நெடுமாறனும், மணிவண்ணனும் அந்த ஆவணத்திற் பங்களித்தார் என்றே எண்ணுகிறேன். சரியாக நினைவில்லை.) பத்துப் பதினைந்து ஆண்டுகளிற் பழகிய என் பல்வேறு கணிகளில் ஏதோவொன்றில் அந்த ஆவணத்தின் படி (copy) சிக்கி, என்னால் மேலும் படியெடுத்துத்தர இயலாதிருக்கிறது. அந்த ஆவணம் வரலாற்றுக் காரணமாய்க் காக்கப் படவேண்டிய ஒன்று. உத்தமம் ஆவணக் காப்பகத்தில் திரு. கல்யாணசுந்தரம் அதைச் சேமித்து வைக்கலாம். அவர் அதை மீண்டும் வெளியிட்டால் நல்லது. நானறிந்து தமிழெழுத்துப் பரம்பலை அறிவியல் வழியில் முதன்முதலாய் அளந்து சொல்லிய ஆவணம் அதுவேயாகும். திரு. கல்யாணசுந்தரம் அளித்த புள்ளிவிவரத்திற்கும் சீனிவாசன் அளித்த புள்ளி விவரத்திற்கும் பெரிதாய் வேறுபாடு கிடையாது. வேண்டுமானால், ஒருசில பதின்மப் புள்ளிகள் வேறுபட்டிருக்கலாம்.
இந்தப் பரம்பலில் இருந்து பெறப்படும் ஒரு சில முடிவுகள் நமக்குச் சற்று அதிர்ச்சியையும், வியப்பையும் கொடுக்கக் கூடியவை.
தமிழெழுத்து என்பது அரிச்சுவடி என்னும் எழுத்தசை வகையைச் சேர்ந்தது (alpha-syllabary, அதாவது எழுத்துக்களும் அசைகளும் சேர்ந்தது தமிழ் எழுத்தாகும்) என்று நாமெல்லோரும் அறிவோம். அரிச்சுவடியை அபுகிடா (abugida) வகை என்று ஒரு சில மேல்நாட்டார் அரைகுறைப் புரிதலிற் சொல்வார். அது தவறு. ”அரிச்சுவடியும் அபுகிடாவும் முற்றிலும் வெவ்வேறானவை, அதேபோல அரிச்சுவடியும் அல்வபெட் (alphabet) என்னும் அகரவரிசையும் வெவ்வேறானவை, இன்னுஞ் சொன்னால் அரிச்சுவடியும் மெய்யெழுத்து, அதை உயிர்மெய்யாக்கத் துணைக்குறியீடு என்றியங்கும் அபுசட் (abujad) என்பதும் கூட வெவ்வேறானவை” என்ற கருத்தை அண்மையிற் செம்மொழி மாநாட்டில் பேரா. செல்வக் குமார் மிகத் தெளிவாகத் தெரிவித்திருந்தார்.
அரிச்சுவடி என்ற கலைச்சொல்லை அகரம் என்ற தமிழ்ச்சொல்லின் திரிவான அக்கரம்>அக்ஷரம் என்ற வடநாட்டுக் கலைச்சொல்லால் திரு. மணிவண்ணன் TACE 16 RFC document இல் கையாளுவார். அரிச்சுவடி என்ற தமிழ்க் கலைச்சொல்லும் அக்ஷரம் என்ற வடநாட்டுக் கலைச்சொல்லும் ஒன்றிற்கொன்று அப்படியே இணையானவை. மேல்நாட்டுக்காரர் புரிந்து கொள்ளுதற்காக அக்ஷரம் என்ற வடநாட்டுக் கலைச்சொல்லைப் பயன் படுத்துவதில் எனக்கொன்றும் மாறுபாடு இல்லை. தமிழில் அரிச்சுவடி என்ற கலைச்சொல்லையே நாம் பயன்படுத்துவோம் [அந்தக் காலத்தில் 50, 60 ஆண்டுகளுக்கு முன்னாற் கூட, நாட்டுப் புறங்களில் திண்ணப் பள்ளிக் கூடத்தில் அரிசிப் பரப்பில் எழுதித் தான் தமிழ்ப்பிள்ளைகளின் எழுத்துப் பயிற்சி (அக்க்ஷர அப்பியாசம்) தொடங்கும். அரி(சி)யில் (அரிசி என்பது வெறும் நெல்லரிசியைக் குறிக்கவில்லை. எல்லாக் கூலங்களின் அரிசியைக் குறித்தது.) எழுதத் தொடங்கும் எழுத்து வகை என்பதால் அரிச்சுவடி என்ற பெயர் ஏற்பட்டது.]
அரிச்சுவடி என்பது அடிப்படை எழுத்துக்களையும், அவற்றின் பெருக்கெழுத்துக்களையும் (product characters) உறுப்பாய்க் கொண்டது. அதாவது எழுத்தசை என்பதை ஒரு கொத்து (set) என்றால் உயிரெழுத்து என்பது அதனுள் ஓர் உட்கொத்து (subset). (அதன் எண்ணிக்கை 12) மெய்யெழுத்து என்பது இன்னோர் உட்கொத்து.(அதன் எண்ணிக்கை 18. இதனுள் ஜ்,ஷ்,ஸ்,ஹ் என்ற நாலு கிரந்த எழுத்துச் சேர்த்தால் எண்ணிக்கை 22 ஆகும். அண்மையில் 3,4 ஆண்டுகளுக்குள் முன் ஒருங்குறிக்குள் சேர்த்த இன்னொரு z ஒலிச் சகரம் ( 0bb6 in unicode) ஒரு முட்டாள்தனமான கூத்து. தமிழ்ப் பள்ளிக்கூடங்களில் யாருக்குஞ் சொல்லிக் கொடுக்காத, ஒரு சில விதப்பான, விரல்விட்டு எண்ணக் கூடிய, பயனாளர் மட்டுமே பயனாக்கும் எழுத்து அதுவாகும். இதுபோல அதிநுணுக்கச் சிறுபான்மையாளர் பயன்படுத்தும் எழுத்துக்களை எல்லாம் தமிழ் அரிச்சுவடியில் சேர்க்கத் தொடங்கினால், அப்புறம் தமிழெழுத்து என்பது எல்லையில்லாது போய்விடும். One has to put a full stop to these kinds of unwanted additions. க்ஷ் என்பது மெய்க்கூட்டு. மெய்க்கூட்டைத் தவிர்க்கும் தமிழில் அதைக் கணக்கில் சேர்த்ததும் தவறு தான். ஸ்ரீ என்பது ஒற்றைக் கூட்டெழுத்து.)
உயிர், மெய் ஆகிய இரண்டின் பெருக்கமாய் 12*18 = 216 எழுத்துக்களாய் (அல்லது கிரந்தம் சேர்த்தால் 12*22 = 264 எழுத்துக்களாய்) அமையும் உயிர் மெய்கள் இன்னோர் உட்கொத்து. இவை போக நாலாவது உட்கொத்து தொல்காப்பியரின் படி குற்றியலுகரம், குற்றியலிகரம், ஆய்தம் ஆகிய மூன்று உறுப்பினர் அடங்கியதாகும். ஆனால் இற்றைத் தமிழில் இது ஒரே உறுப்பினர் அடங்கிய உட்கொத்தாய் ஆகிவிட்டது. எல்லா உட்கொத்து உறுப்புகளையும் கூட்டிப் பார்த்தால், தமிழெழுத்து வரிசை மொத்தம் 247 எழுத்துக்கள் (கிரந்தம் சேர்த்தால் 12+22+12*22+1 = 300 எழுத்துக்கள்) கொண்டதாகும். இவற்றின் அடிப்படையில் எந்த ஆவணத்திலும், இயல்பாக ஏதேனும் ஓர்
உயிரெழுத்துத் தோன்றுதற்கான பெருதகை (probability) = 12/247 = 0.048583 (கிரந்தம் சேர்த்தால் 0.04.)
இதே போல பெய்யெழுத்துப் பெருதகை = 18/247 = 0.0728745 (0.06)
அகர, ஆகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
இகர, ஈகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
உகர, ஊகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
எகர, ஏகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
ஐகார உயிர்மெய்ப் பெர்தகை = 18/247 = 0.0728745 (0.06)
ஒகர, ஓகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
ஔகார உயிர்மெய்ப் பெருதகை = 18/247 = 0.0728745(0.06)
இப் பெருதகைகளைக் கணக்கிடும் போது ஓரெழுத்தின் நேர்ச்சி (occurrence) இன்னோர் எழுத்தின் நேர்ச்சியைப் பாதிக்காது என்றும் இரண்டும் ஒன்றிற்கொன்று பந்துறாதவை (independant; பந்தம் = dependency) என்றும் நாம் கருதிக் கொள்ளுகிறோம் (hypothesize). ஆழ்ந்து ஓர்ந்து பார்த்தால் அத்தகைய கருத்து தமிழைப் பொறுத்தவரை உண்மையில்லை தான். எழுத்துக்களின் நேர்ச்சி பல சொற்களில் ஒன்றையொன்று சார்ந்திருப்பதைப் பலவிடத்தும் உணரமுடியும். காட்டாக, பங்து என்ற சொல் தமிழில் அமையவே அமையாது. அது பந்து என்றிருக்கலாம், அல்லது பங்கு என்றிருக்கலாம். ’ங்’ஙும், ’து’வும் எங்கும் சேரமுடியாத எழுத்துக்கள். இது போன்ற கட்டியப் பெருதகைகளைக் (conditional probablities) கணக்கிடுவது இன்றைய நிலையிற் கடினம் என்பதால், மேலே சொல்லும் முடிவு ஒருபக்கச் சாய்வாக இருக்கலாம் எனினும் எழுத்துக்களின் நேர்ச்சி ஒன்றிற்கொன்று பந்துறாதவை என்றே இவ்வாய்வில் கருதிக் கொள்கிறோம்.
இனி இத்தேற்றப் பெருதகையையும் (theoretical probability) மேலே சீனிவாசன் 4 இலக்கம் தமிழெழுத்துக்கள் கொண்ட ஆவணங்களை இறக்கிக் கணக்கெடுத்த இயல் நேர்ச்சியையும் ஒப்பிட்டுப் பார்த்தால், ஒரு புதிய செய்தி விளங்கும். இற்றைத் தமிழில் உயிரெழுத்துக்களும், மெய்யெழுத்துக்களும், அகர, ஆகார உயிர்மெய்களும் (ஆகார உயிர்மெய் நேர்ச்சியைச் சீனிவாசன் எகர, ஏகாரத்தோடு சேர்த்து விட்டார், எனவே குத்து மதிப்பாக 7 அல்லது 8 விழுக்காட்டை நாம் அகர உயிர்மெய் நேர்ச்சியோடு சேர்க்கலாம். அதற்குக் காரணம் இருக்கிறது கீழே பார்ப்போம்.) எதிர்பார்க்கப்படும் பெருதகையைக் (expected probability) காட்டிலும் இருமடங்கு அதிகமாக நேர்ச்சியுறுகின்றன. அதேபொழுது இகர, ஈகாரங்களும் உகர, ஊகாரங்களும் கிட்டத்தட்ட நிரவலாக எதிர்பார்த்த பெருதகையை ஒட்டியே நேர்ச்சி கொள்ளுகின்றன. எகர, ஏகார, ஐகார, ஒகர, ஓகார, ஔகாரங்களும் எதிர்பார்க்கப் பட்ட பெருதகைக்கும் மிகக் குறைவாகவே நேர்ச்சி கொள்கின்றன. [உயிரெழுத்து அதிகம் நேர்ச்சி கொள்ளுவது இக்காலப் பழக்கமாய் இருக்கலாம். பெரும்பாலும் புணர்ச்சி பிரித்து எழுதும் இக்காலக் காரணத்தால் உயிரெழுத்துக்கள் இயல் பெருதகையைக் காட்டிலும் அதிகமாகத் தோற்றங் கொள்ளலாம்.]
விவரித்துச் சொன்னால், தமிழ் அரிச்சுவடியில் 247 அசையெழுத்துக்கள் இருந்தாலும் நாம் நடைமுறையில் 12+18+36 = 66 எழுத்துக்களையே மிக அதிகமாகப் பயன்படுத்துகிறோம். இது ஒரு வியப்பான அவதானிப்பு. கிட்டத்தட்ட மூன்றில் இரண்டு பங்கு எந்தத் தமிழாவணத்திலும் இந்த 66 எழுத்துக்களே பயன்கொள்ளுகின்றன. Even though Tamil Script is alpha-syllabary, it uses its alphabets and the akara, aakaara syllables more for articulation compared to other syllables. This is remarkable and it perhaps characterizes the Tamil language. தமிழின் இயல்பு இது தான் போலும். இந்த இயல்பை காலந்தோறும் எழுந்த ஆவணங்களின் வழி ஆய்வு செய்வது பல்வேறு ஆய்வு முடிவுகளை நமக்கு உணர்த்தலாம். அதற்காக மற்ற அசைகளைத் தூக்கியெறிந்து விடலாமா என்றால் இல்லை யென்றே சொல்லவேண்டும். ஓர் தமிழிசை விருந்தில் ”ஆ, அ .......என்று ஆலத்தி (ஆலாபனை) மட்டும் சொல்லிப் போக முடியாதே? நம்மை அறியாமல் மூச்சை நிறுத்தி (மூச்சு நிறுத்தும் இடங்கள் எல்லாம் மெய் வந்தே தீரும்) பின் மாற்றும் போது மற்ற அசைகளைச் சொல்லும் கட்டாயத்திற்கு ஆளாகிறோம் அல்லவா?
மற்ற அசையெழுத்துக்கள் என்ன வகையில் தமிழ் மொழியாளுகையில் பயன்படுகின்றன என்று ஆய்ந்து சொல்லவேண்டும். அதற்குப் பல்வேறு காலகட்டங்களில் உருவாகிய இலக்கியங்களின், ஆவணங்களின் பல்வேறு கைச்சாத்துக்களை (signatures) அடையாளங் காணுவது நலம் பயக்கும்.
அன்புடன்,
இராம.கி.
12 comments:
//அரி(சி)யில் எழுதத் தொடங்கும் எழுத்துவகை என்பதால் அரிச்சுவடி என்ற பெயர் ஏற்பட்டது.] //
இது கொஞ்சம் ஐயமாகத்தான் இருக்கு, அரிசு உணவு பரவலான உணவாக இருந்ததாகத் தெரியவில்லை, கம்பு, கேள்வரகு, மக்காச் சோளம் பற்றி சங்க இலக்கியங்களில் வரும் அளவுக்கு அரிசி பற்றி வருதாக நான் அறிந்தவரையில் தெரியவில்லை. சோறு என்பதை அரிசி சோறு என்று சொல்ல முடியாது, சோளச்சோறு, கம்பச் சோறு அனைத்தையுமே சோறு என்று தான் சொல்லுவார்கள். அரிசி உணவு மேல்தட்டு உணவு என்பதாகத்தான் சென்ற நூற்றாண்டின் துவக்கம் வரையில் இருந்தது.
அரி(சி)சுவடி > அரிச்சுவடி என்பதைவிட (வெட்டிய)அரிந்த ஓலைச் சுவடியில் எழுதிய என்பது அரிச்சுவடியாக சுருங்கி இருக்க வாய்ப்புகள் இருப்பதாக நான் கருதுகிறேன். அறி+சுவடி (தெரிந்துகொள் சுவடி) > அரிச்சுவடி என்றும் கூட இருக்கலாம்.
//க்ஷ் என்பது மெய்க்கூட்டு. மெய்க்கூட்டைத் தவிர்க்கும் தமிழில் அதைக் கணக்கில் சேர்த்ததும் தவறுதான்//
:)
லை, லை எல்லாம் சரியாக மாற்றியவர்கள் க்ஷ் - இதை ஏன் விட்டுவைத்தார்கள். க் ஷ ன்னே தனித் தனியாக எழுதும் படி அமைத்திருக்கலாம். ஓம் கூட கூட்டெழுத்தாக ஆஸ்கி பட்டியலில் இருக்கிறது, அதைச் சமயக் குறியீடாக கொள்லலாம். மேற்படிக்கான குறி( ஒரு மாதிரியான ஷெ), திங்கள் (மாதம் - மீ) குறிகளெல்லாம் இருக்கிறதான்னு தெரியல, ஆனால் தற்போது யாரும் பயன்படுத்துவதில்லை
//அரிசு உணவு பரவலான உணவாக இருந்ததாகத் தெரியவில்லை, கம்பு, கேள்வரகு, மக்காச் சோளம் பற்றி சங்க இலக்கியங்களில் வரும் அளவுக்கு அரிசி பற்றி வருதாக நான் அறிந்தவரையில் தெரியவில்லை.//
சமைக்காத தானியங்களை என் பாட்டனார்/பாட்டியார் வரகரிசி, சாமையரிசி, திணையரிசி என்றே கூறியதாக நினைவு. நீங்கள் சொல்லுவது நெல்லரிசி ஆக இருக்கலாம்.
உங்கள் பதிவுகளை jeejix.com இல் பதிவு செய்யுங்களேன், அரசியல் , சினிமான்னு ஆறுவகை இருக்கு
ஒவ்வொரு வாரமும் ஒவ்வொரு வகையில் அதிகம் பார்க்கப்பட்ட பதிவுக்கு jeejix பணம் குடுக்குதாம்.
ஆயிரக்கணக்கா என் ஆர் ஐ இருக்காங்கப்பா அந்த சைட்ல.
நீங்க அந்த சைட்ல பதிவு செய்தீங்கன்னா மறக்காம என்னோட ஈமெயில் (sweathasanjana அட் ஜிமெயில் )
ஐடிய அறிமுகபடுதினவங்க அப்படின்னு அவங்க ஈமெயில் ஐடிக்கு அனுப்புங்க. புண்ணியமா போகட்டும்
:)
ஐயா
வல்லின எழுத்துக்களின் வரிவடிவங்கள்
மற்ற எல்லா இந்திய மொழிகளிலும் வல்லின எழுத்துக்களான க, ச, ட, த, ப என்பவற்றிர்கு நான்கு வரிவடிவங்களும் ஒலி வடிவங்களும் உள்ளன. தமிழில் இவை ஒவ்வொன்றிற்கும் ஒவ்வொரு வரிவடிவம் தான் உள்ளது. ஆனால் அவற்றின் ஒலிகள் இடத்திற்கு இடம் வேறுபடுகின்றன.
நான் அறிந்தவரை கீழ்க்குறிப்பட்ட வேறுபாடுகள் உள்ளன.
1 மொழிமுதலில்: க்,த்,ப் பன்னிரண்டு உயிரெழுத்துக்களோடும் கூடி மொழிக்கு முன் வரும். இவை க, த, ப, , ka, ta, pa என்று ஒலிக்கின்றன. (எ.டு) கதவு, தமிழ், பன்றி.
ச் என்னும் மெய் அ, ஐ, ஔ தவிர மற்ற ஒன்பது உயிரெழுத்துக்களோடும் கூடி மொழிக்கு முன் வரும். தற்காலத்தே
இது பெரும்பாலும் ஸ (sa) என்றே ஒலிக்கிறது. இலங்கையிலும்
கேரளத்திலும் இது ச (ca) என்று தான் பேசப்படுகிறதா?
மொழிக்கு இடையில்/கடையில் :
1. க, ட, த ப என்பன ga, Da, da , ba என்று ஒலிக்கின்றன. (எ.டு) மகன்/மதகு, படம்,/ ஆடு, கதவு/இது, (’ப’ விற்கு எடுத்துக்காட்டுகள்
கிடைக்கவில்லை). ’க’ ga விற்கும் ha விற்கும் இடைப்பட்ட ஒலியோடு வழக்கிலுள்ளது. (எ,டு) மகன் (magan, mahan). ச என்பது ஸ என்று தான் பேசப்படுகிறது. (எ.டு) பசியோடு, இசை ( not as paciyODu, icai)
2 தம்மைச்சார்ந்த மெல்லின மெய்யெழ்த்துக்களுக்குப்
பின்னால் வரும் போதும் இவை ga, ja, Da, da,ba என்று ஒலிக்கின்றன. (எ,டு) இங்கு, மஞ்சள். உண்டு, இந்த, கம்பம்.
’ன்’க்குப் பின் வரும் ‘ப’ வும் ba என்றே ஒலிக்கிறது (எ.டு) அன்பு.
‘ற’ விற்கு அதனைச் சார்ந்த மெல்லின மெய்யெழுத்து இல்லை. ’ற’ ’ன்’ ’ஐ’ யைத் தொடர்ந்து வரும். இன்று என்பது indru என்று ஒலிக்கிறது. இதற்கு என்ன விதி?
3 இவை இரண்டாக வரும் போது அழுத்தம் பெறுகின்றன. (எ.டு) அக்கா, பச்சை, மட்டை, அத்தை, அப்பா.ஆனால் மற்ற மொழிகளில் உள்ள kha, cha, Tha, tha, pha என்பவற்றுள் உள்ள அத்தனை அழுத்தம் (aspirated) தமிழில் இல்லை.
காற்று என்பதில் கூடுதலாக ட வந்து காட்று என்று ஒலிக்கிறது.
தொல்காப்பியம் பிறப்பியலில் இவ்வொலி வேறுபாடுகள் காணப்படவில்லை. அக்காலத்தே இவ்வேறுபாடுகள் இருக்கவில்லையா அவ்வாறெனின் எக்காலத்தே இவை தோன்றின.
பின் காலத்தே எழுதப்பட்ட இலக்கண நூல்களில் வ்ல்லின எழுத்துக்களின் ஒலி வேறுபாடுகள் பற்றிய விதிகள் உள்ளனவா?
**----1. க, ட, த ப என்பன ga, Da, da , ba என்று ஒலிக்கின்றன. (எ.டு) மகன்/மதகு, படம்,/ ஆடு, கதவு/இது, (’ப’ விற்கு எடுத்துக்காட்டுகள்
கிடைக்கவில்லை).--**
சர்ப்பம், கற்பகம், சொற்பம், ஆபரணம், குப்பம், அப்பம், தட்பம், வெப்பம் உப்பளம், அப்பளம்(அப்படம், பப்படம்), சப்பட்டை, கபடி, கபடம்(கள்ளங் கபடம்), மோப்பம்
ஐயா
நான் கூறவந்த எடுத்துக்காட்டுக்கள் உயிர் மெய்யெழுத்தின் பின் வரும் வல்லின அகர உயிர்மெய். ’ப’. இது ba என்று ஒலிக்கிறதா என்பது என் ஐயம். நீங்கள் கொடுத்துள்ள எடுத்துக் காட்டுகளில் பகர உயிர்மெய் மற்றொரு மெய்யெழுத்தின் பின்னோ ‘ப்’ ன் பின்னோ வருகிறது.
வருகின்றது.
நீங்கள் கொடுத்தவற்றுள் ஐந்து சொற்கள் வடமொழியிலிருந்து வந்தவை.
ஐயா, நீங்கள் கூறுவதுபோல் உயிர்மெய்யெழுத்தின் பின் வரும் வல்லின அகர மெய்யெழுத்து நான் மேலே தந்த காட்டுக்களில் உள்ள கபடம், கபடி ஆகியவற்றில் 'ப' 'ba'ஆக ஒலிக்கின்றது. அதேபோல் சபதம், சபலம் ஆகிய சொற்களிலும் அங்கனம் ஒலிப்பதாகவே தோன்றுகிறது.
கபடம், கபடி, சபதம், சபலம் போன்று 'சுலபம்' என்ற சொல்லிலும் 'ப' வல்லின அகரம் 'ba' போன்றே சற்று ஒலிக்கின்றது.
எனது முந்தைய முன்னிகையில் கூறப்பட்ட காட்டுக்களில் உள்ள சொற்கள் யாவும் தமிழ் என்பதே எனது முடிவு. சர்ப்பம் வடமொழி என்றும் கூறுவர் உளர். அதேபோல் கபடி தமிழல்ல, சடுகுடுதான் தமிழ் என்று சொல்பவர்களும் உள்ளனர். தமிழ் பேச்சுவழக்கில் உள்ள ஏராளமான சொற்கள் இன்றுவரை தொகுக்கப்படவில்லை என்பதே உண்மை. அப்படி தொகுத்துப் பாவனையில் கொண்டுவரப்பட்டால் வேற்றுமொழிச் சொற்களுக்கு, குறிப்பாக அறிவியல் சார்ந்த ஆங்கில சொற்களுக்கு எமது பேச்சில் தேவையே இருக்காது என்பது இன்னொரு உண்மை.
சர்ப்பம் போன்று மெய்யெழுத்து அடுத்தடுத்து வரும் சொல் கர்ப்பம், இது இன்று பேச்சுவழக்கில் உள்ளதன்றோ? சர்ப்பம் போன்ற இன்னொரு சொல் கூர்ப்பு. கூர்ப்பு என்றால் செவ்வளர்ச்சி(Evolution). இப்படி பல சொற்கள் எமக்கு தெரியாமல் உள்ளன. சர்சர், சரசர என்பவை தமிழ் இரட்டைக்கிளவி ஒலிப்பாகும், இதற்கும் சர்ப்பம் என்ற சொல்லிற்கும் தொடர்பிருக்கலாம் என்பது எனது ஐயப்பாடு.
நீங்கள் கூறும் 'ka,'gha' 'pa,'ba' போன்ற ஒலிவேற்றுமைகள் வட்டார வழக்கில் மாறுபட்டுப்போகும். எழுத்துக்களின் உச்சரிப்பு வெவ்வேறு கிராமங்களிலும் நகரங்களிலும் வேறுபட்டே உள்ளது. காட்டாக, நீங்கள் கூறும் காற்று என்பதை அறுத்துறுத்து 'காற்று' என்று 'ட்று' உச்சரிப்பின்றி 'ற்று' உச்சரிப்புடன் இலங்கைத் தமிழர்கள் கதைப்பார்கள்.
சேர, சோழ, பாண்டிய மூவேந்தர் காலத்திற்கு முன்னரும்(சங்ககாலத்திற்கு முற்பட்ட சோழ, பாண்டிய பேரரசுகள் காலத்திலும்) பின்னருமாக வேறுபட்ட சொற்களும், உச்சரிப்பும், திரிபுகளும் தமிழில் இருந்துள்ளன. எழுத்துவடிவம்கூட ஒவ்வொரு இடங்களிலும் மாறுபட்டு இருந்துள்ளது. இவற்றை நாம் உணரத் தவறுகிறோம்.
கதிரவனுக்கு வைக்கும் மலர் கமலம் என்ற சொல்லானதும் க(ண்) + போ(னவன்) கபோ+தி என்று உருப்பெற்றதுபோலவும் தமிழ் சொற்களின் தோற்றம் தமிழர்களால் சரியாக இனங்காணப்படவில்லை. அதற்கு மாறாக தங்களின் மொழிமேலும், தங்களது அறிவியல், வரலாற்று உண்மைகளிலும் ஏன் தமது வீரத்திலும் தமிழர்களிற்கு சந்தேகம் ஏற்பட்டுள்ளது மிகவும் து'ர்ப்'பாக்கியமான விடயமாகும்.
நன்றி
ஐயா,
வல்லின எழுத்துக்களின் ஒலி வரி வடிவங்களைப் பற்றிய என் ஐயத்தினை விரிவாகக் கூற விழைகிறேன்.
வல்லின எழுத்துக்கள் சொல்லின் இடத்திற்குக் தக்கவாறு ஒலி வேறுபாடுகள் பெறுகின்றன. பெரும்பாலன மக்கள் நான் குறிப்பிட்டவாறு இவற்றை ஒலிக்கிறார்கள். சிலர் தமிழில் ga, ja, Da,da, ba enRa இருக்கவேயில்லை என்று சாதிகிறார்கல். அவ்வாறெனின் ஆடு என்பதை ATu என்று தான் கூறினார்களா/ இந்த ஒலியியல் (phonics/phonetics/phonology) நான் அறிந்தவரை தொல்காப்பியத்திலோ மற்ற எந்தத் தமிழ் இலக்கணப் புத்தகத்திலோ இல்லை. தமிழ் ஆசிரியர்களும் இதைக் கற்றுத்தருவதில்லை. பிறப்பியலும் புணரியலும் உள்ள தொல்காப்பியத்தில் ஏன் ஒலியியல் இல்ல. ஏனெனில் ஒலியைச் செவி வழியாகத்தான் அறிய இயலும். கற்றலின் கேட்டல் நன்று. நான் என் வட இந்திய நண்பர்களுக்குத் தமிழ் கற்பிக்க முனைந்தபோது இவ்வொலி வேறுபாடுகள் பற்றி ஆழ்ந்து சிந்திக்க நேர்ந்தது. ஏனெனில் அவர்கள் தங்கள் மொழிகளிலே நான்கு வரிவடிவங்கள் உள்ளனவே தமிழில் ஒரே எழுத்தை எவ்வாறு மூன்று விதமாக ஒலிப்பது என்ற கேள்வியை எழுப்பினர். (எ,டு) ka,kha, ga,gha. தமிழ் நாட்டிலேயே பிறந்து வளர்ந்தவர்களுக்கு இது பிரச்சினையே அல்ல. ஏனெனில் பள்ளிக்குச் செல்லும் முன்பே பேசப்பழகிவிடுகிறோம். நான் அறிந்தவரை வழக்கிலுள்ள ஒலிகளைக் கொடுத்துள்ளேன்.
கா.__ அவர்களே, தாங்கள் கூறிய, உயிர்மெய்க்குப்பின் சொல்லின் இடையில் வரும் பகர எடுத்துக்காட்டுகளில், கபடம், கபடி, சபதம், சபலம் என்பவை தமிழ்ச் சொற்களா? தவிற சவில் தொடங்கும் சில சொற்களையும் கொடுத்துள்ளீர்.தொல்காப்பியத்தில் மொழியியல் 28, 29 ஐக் காண்க.
க,த ந ப ம எனும் ஆவைந்து எழுத்தும் எல்லா உயிரொடும் செல்லுமார் முதலே
சகரக் கிளவியு மவற்றோ ரேற்றே அ,ஐ,ஔ வெனு மூன்றலங்கடையே.
தமிழில் ச, சை, சௌ என்பன மொழிக்கு முதலில் வாரா. திருக்குறளில் சமன், சலம் எனும் சொற்கள் காணக்கிடைக்கின்றன. இவை வடசொற்கள்.
ப மற்ற உயிர்களோடு சேர்ந்து சொல்லின் இடையில் ba. bA,bi,bI,bu, bU, bE, bE, bai, bo, BO, bau என்று ஒலிக்கின்றனவா. ம் ஐத் தொடர்ந்து இவ்வாறு ஒலிக்கின்றன.
ச தற்காலத்தே ஸ (sa) என்றே பெரும்பாலும் ஒலிக்கிறது. இதனை வல்லினம் என்று கூறுவது சரியா?
//நான் என் வட இந்திய நண்பர்களுக்குத் தமிழ் கற்பிக்க முனைந்தபோது இவ்வொலி வேறுபாடுகள் பற்றி ஆழ்ந்து சிந்திக்க நேர்ந்தது. ஏனெனில் அவர்கள் தங்கள் மொழிகளிலே நான்கு வரிவடிவங்கள் உள்ளனவே தமிழில் ஒரே எழுத்தை எவ்வாறு மூன்று விதமாக ஒலிப்பது என்ற கேள்வியை எழுப்பினர்.//
ஐயா,
நீங்கள் எந்த வடமொழியைக் கூறுகிறீர்கள் எனத் தெரியவில்லை, இருந்தாலும் நாங்கள் பிற மொழிகளை உச்சரிக்க கிரந்தம் பாவிப்பதுபோல் வடநாட்டவரும் அவர்தம் மொழியில் பிற மொழிகளை உச்சரிக்க சில எழுத்துக்களைக் கையாள்கின்றனர். காட்டாக இந்தியில் பின்வரும் ஒலியுடைய எழுத்துக்கள் பிறமொழிகளிலிருந்து கடன்வாங்கிய சொற்களை எழுதப் பாவிக்கப்படுகின்றன.
"qa, ga, za, fa, ra"
வடமொழிகளில் தமிழில் உள்ள எல்லா உயிர்மெய்யும் உள்ளதாகத் தெரியவில்லையே ஐயா, அந்தக் குறையை அவர்கள் நீக்கப் போகிறார்களா?
தமிழ் மொழியில் ஒரே எழுத்து மூன்று அல்லது மூன்றிற்கு மேற்பட்ட ஒலி வடிவங்களாக ஒலிப்பது தமிழின் தனித்தன்மை. அதற்காக நாங்கள் உலகில் உள்ள எல்லா மொழிகளையும் தமிழில் எழுதி ஒலிக்கும் வண்ணம் புதிய எழுத்துக்களை தோற்றுவித்தால் தமிழ்தான் நலிவுபெறும்.
//கா.__ அவர்களே, தாங்கள் கூறிய, உயிர்மெய்க்குப்பின் சொல்லின் இடையில் வரும் பகர எடுத்துக்காட்டுகளில், கபடம், கபடி, சபதம், சபலம் என்பவை தமிழ்ச் சொற்களா? தவிற சவில் தொடங்கும் சில சொற்களையும் கொடுத்துள்ளீர்.தொல்காப்பியத்தில் மொழியியல் 28, 29 ஐக் காண்க.
க,த ந ப ம எனும் ஆவைந்து எழுத்தும் எல்லா உயிரொடும் செல்லுமார் முதலே
சகரக் கிளவியு மவற்றோ ரேற்றே அ,ஐ,ஔ வெனு மூன்றலங்கடையே.//
சங்கரன், சங்காரம், சங்கு, சக்கரம், சனி, சந்திரன், சந்தனம், சலம், சபை, சதிர்(சதிராட்டம்), சப்பரம், சகடை, சமயம், சந்தி, சம்பு, சம்பளம்(சம்பு + அளம்), சவர், சறுக்கல், சரிவு, சரி, சதி, சத்தி(வாந்தி), சக்தி(பலம்), சட்டை, சக்கரை, சல்லடை, சஞ்சலம், சமர், சலங்கை, சங்கிலி, சங்கம், சள்ளை, சதை(தசை), சப்பு, சளி, சலதோசம், சன்னல், சன்னி, சக்கை, சயானம், சலரோகம்(நீரிழிவு), சமையல், சதுரங்கம், சமர்க்களம், சமுத்திரம், சதுப்பு(சதுப்பு நிலம்)... ஐயா இவை எல்லாமா வடமொழி சொற்கள்?
++++++++-------[
(தமிழ் இணையப் பல்கலைத் தளம்)] ...அதுபோலவே சகரம் என்ற மெய் அ, ஐ, ஒள ஆகிய மூன்று உயிர்களுடன் சேர்ந்து சொல்லின் முதலில் வருவதில்லை என்கிறார் தொல்காப்பியர்.
சகரக் கிளவியும் அவற்று ஓரற்றே
அ, ஐ, ஒள எனும் மூன்று அலங்கடையே
(தொல்.எழுத்து.62)
ச- சை- சௌ- போன்று மொழிமுதலில் வருவது கிடையாது. ஆனால் சாளரம், சிலை, சுரும்பு போன்ற சொற்களில் ஏனைய உயிர்களுடன் சேர்ந்து மொழிமுதலில் சகரம் வருகிறது.
தொல்காப்பியத்தை அடுத்துத் தோன்றிய சங்க இலக்கியத்தில் சகரமெய் அகர உயிரோடு சேர்ந்து பல சொற்களிலும், ஐகார உயிரோடு சேர்ந்து ஒரு சொல்லிலும் மொழி முதலில் வரும் நிலையைக் காணலாம்.
சகடம் (நற்றிணை. 4:9)
சடை (புறநானூறு. 166:1)
சண்பகம் (கலித்தொகை. 150:21)
சையம் (பரிபாடல். 11:14) --------+++++
ஐயா
”நீங்கள் எந்த வடமொழியைக் கூறுகிறீர்கள் எனத் தெரியவில்லை,” என்று கேட்டுள்ளீர்.
எல்லா இந்திய மொழிகளிலும் (மற்ற மூன்று திராவிட மொழிகள் உட்பட) க,ச,ட,த,ப என்பவற்றிற்கு நந்நான்கு ஒலி/வரி வடிவங்கள் உள்ளன.
உதாரணமாக தெலுங்கு3, ஹிந்தி3, பெ3ங்கா3லி ஆகியவற்றில் இவ்வரிவடிவங்களைக் கீழே கொடுத்துள்ளேன்.
Telugu - క,ఖ,గ,ఘ
Hindi - क,ख,ग,घ
BengAli- ক,খ,গ,ঘ
தெலுங்கில் ச வைச் சார்ந்து ஆறு எழுத்துக்கள் உள்ளன.
தவிர ஸ,(sa- स), ஸ1 (Sa-श), ஷ (ष) என்ற எழுத்துக்களும் உள்ளன. இவை வல்லினம் அல்லவாதலால் இவற்றைப் பற்றி தற்பொழுது நாம் பேசவேண்டாம். என்னுடைய ஒரே கேள்வி யாதெனில் எந்த தமிழ் இலக்கண நூலில் வல்லின எழுத்துக்களின் ஒலி வேறுபாடுகள் பற்றிய விதிகள் உள்ளன என்பது தான். இவ்வாறு இல்லாததால் தான் சிலர் கருதுவது என்னவெனில் தமிழில் க3 போன்ற ஒலிகள் பிற்காலத்தே வந்தன என்பது.
இது சரியெனில் முதல் குறளை
akara mutala ezuttellAm Ati pakavan
mutaRRE ulaku
என்று படிக்க வேண்டுமா. ( enRu paTikka vENTumA)
நீங்கள் கூறிய ‘ச’ வில் தொடங்கும் சொற்கள் எல்லாமே தமிழுக்குத் தொல்காப்பியக் காலத்திற்குப்பின் வந்தவை என்று தான் எண்ணுகிறேன். பெரும்பாலானோர் இவற்றை ஸ (sa) என்று தான் ஒலிக்கின்றனர். ஸ தமிழில் இல்லை. நான் ஏற்கனவே கூறியபடி திருக்குறளில் ‘ச’வில் தொடங்கும் இரண்டே சொற்களைக் கண்டேன். அவையும் வடசொற்கள்.
நன்றி
கோவிந்தசாமி
31.7.2010
ஐயா
”நீங்கள் எந்த வடமொழியைக் கூறுகிறீர்கள் எனத் தெரியவில்லை,” என்று கேட்டுள்ளீர்.
எல்லா இந்திய மொழிகளிலும் (மற்ற மூன்று திராவிட மொழிகள் உட்பட) க,ச,ட,த,ப என்பவற்றிற்கு நந்நான்கு ஒலி/வரி வடிவங்கள் உள்ளன.
உதாரணமாக தெலுங்கு3, ஹிந்தி3, பெ3ங்கா3லி ஆகியவற்றில் இவ்வரிவடிவங்களைக் கீழே கொடுத்துள்ளேன்.
Telugu - క,ఖ,గ,ఘ
Hindi - क,ख,ग,घ
BengAli- ক,খ,গ,ঘ
தெலுங்கில் ச வைச் சார்ந்து ஆறு எழுத்துக்கள் உள்ளன.
தவிர ஸ,(sa- स), ஸ1 (Sa-श), ஷ (ष) என்ற எழுத்துக்களும் உள்ளன. இவை வல்லினம் அல்லவாதலால் இவற்றைப் பற்றி தற்பொழுது நாம் பேசவேண்டாம். என்னுடைய ஒரே கேள்வி யாதெனில் எந்த தமிழ் இலக்கண நூலில் வல்லின எழுத்துக்களின் ஒலி வேறுபாடுகள் பற்றிய விதிகள் உள்ளன என்பது தான். இவ்வாறு இல்லாததால் தான் சிலர் கருதுவது என்னவெனில் தமிழில் க3 போன்ற ஒலிகள் பிற்காலத்தே வந்தன என்பது.
இது சரியெனில் முதல் குறளை
akara mutala ezuttellAm Ati pakavan
mutaRRE ulaku
என்று படிக்க வேண்டுமா. ( enRu paTikka vENTumA)
நீங்கள் கூறிய ‘ச’ வில் தொடங்கும் சொற்கள் எல்லாமே தமிழுக்குத் தொல்காப்பியக் காலத்திற்குப்பின் வந்தவை என்று தான் எண்ணுகிறேன். பெரும்பாலானோர் இவற்றை ஸ (sa) என்று தான் ஒலிக்கின்றனர். ஸ தமிழில் இல்லை. நான் ஏற்கனவே கூறியபடி திருக்குறளில் ‘ச’வில் தொடங்கும் இரண்டே சொற்களைக் கண்டேன். அவையும் வடசொற்கள்.
நன்றி
கோவிந்தசாமி
31.7.2010
Post a Comment