Sunday, July 12, 2020

தமிழும் ஒருங்குறியும் - 3

இலங்கையின் ”தமிழ் அறிதநுட்பியல் உலகாயம்” (Tami Information Technology International) என்ற நிறுவனம் Zoom வழி நடத்திய இணைய வழி உரையாடலில் நேற்று நான் உரையளித்தேன், இங்கே அதைப் பிரித்து 3 பகுதிகளாய்த் தருகிறேன். இது மூன்றாம் பகுதி. தமிழ்க் கணிமையில் ஆர்வமுள்ளோர் படியுங்கள். நிகழ்ச்சியை ஒருங்கிணைத்த இலங்கை நண்பர்களுக்கும் குறிப்பாக நண்பர் சி.சரவணபவானந்தனுக்கு என் நன்றி. தமிழ்கூறும் நல்லுலகம் இந்நிலை அறிந்துகொள்ளட்டும்.
--------------------------------------

இனித் தமிழ்க் கட்டை தொடர்பாய் நடந்த  மாற்றங்களைப் பார்ப்போம். முதல் மாற்றமாய், 2003 இல் sha எழுத்தை நுழைக்கச் சொல்லி உத்தமம் ஒரு முன்னீடு கொடுத்தது.  இன்றுவரை அவ்வெழுத்தை தமிழ்பேசும் எந் நாட்டிலும் யாருங் கற்றுக் கொடுக்கவில்லை. ஏதோ சில மணிப்பவள நூல்களில் அச்சாகியுள்ளது என்று சொல்லி இம்முன்னீடு எழுந்தது. இம் மூன்னீட்டை உத்தமத்தின் பொது உறுப்பினர் யாரும் கவனிக்கவில்லை, மாற்று யோசனை சொல்லவுமில்லை. பொதுமக்களுக்கும் தெரியாது. ஆனாலும் இவ்வெழுத்து தமிழ்க்கட்டைக்குள் குறியேறிவிட்டது. (discuss printed salvation here.)

”sha” (0BB6) விற்கு மாறாய் ”ச”, ”ஷ” என்றடித்து அடிக்குறிப்பில் ”இங்கே ச, ஷ, எழுத்துக்களைப் பயில்கிறோம், ஊற்றாவணத்தில் இப்படி இருந்தது” என்று ஶ படம் போடாது, தேவையற்றுக் குறியேற்றி, என்ன சொல்ல? விந்தை உலகம். முன்னீட்டாளர் கல்வெட்டு நூல்களே படித்ததில்லை போலும். இதே எழுத்து அங்கும் கிரந்தப் பகுதியிலுண்டு. text இல் ஷ எழுதி அடிக் குறிப்பில் ஶ படம் போட்டிருப்பார். அவருக்குத் தெரிந்த தீர்வு உத்தமத்திற்குத் தெரியவில்லை..

SMP இல் போகவேண்டியதை BMP க்குக் கொணர்ந்து,  கந்தர கோளம் பண்ணி, இப்போதென்ன நடக்கிறது தெரியுமோ? ”எழுத்து இருக்கிறதா? பயன்படுத்து” என நாளொரு மேனியாய் பொழுதொரு வண்ணமாய்  ஶ வின் பயன்பாடு கூடிப்போகிறது. கூகுள் கணக்குப்படி இன்று 24,40,000 தடவை பயனாகிறது. தவறான குறியேற்றம் கொடூர மாற்றத்தை ஒரு மொழிக்குக் கொணரும். historical எனக் கொணர்ந்து முடிவில் நடப்புக்கு இவ்வெழுத்து வந்தது நமக்கு ஒரு பாடம். 

இரண்டாம் மாற்றம் 2006 இல் நடந்தது. இதற்கும் உத்தமமே தொடக்கம். ”தமிழ் ஓம்” வேண்டும் என்று இம் முன்னீடு எழுந்தது. வழக்கம்போல் யாருங் கண்டு கொள்ள வில்லை. அரிதில் பயன்படும் குறியீடு BMP இலா? என்ன கொடுமை, சரவணா? SMP இல் இருக்கவேண்டியதைக் costly real estate ஆன BMP இல் உட்கார வைத்துக் கந்தர கோளம் பண்ணினார். இது போன்று பலவும் நடந்துள்ளன.

அடுத்தது நீட்டிக்கப் பட்ட தமிழ் ( extended Tamil). தமிழெழுத்துக்களைக் கொண்டு சங்கதம் எழுதும்படித் தமிழ்க்கட்டையில்  க2, க3, க4 ....... என மேற்குறி (superscript) முறையில் 26 சங்கத எழுத்துக்களை நுழைக்கச் சொல்லி சூலை 2010 இல் ஒரு முன்னீடு எழுந்தது.  மலேசியாவிலிருந்து முத்தெழிலன் நெடுமாறன், அமெரிக்காவிலிருந்து இராதாகிருஷ்ணன் ஆகியோர், ”சாத்தாரமாய் இருக்கும் superscript, subscript வைத்தே இதைச் செய்யலாமே? இதற்கு எதற்கு தனியாகக் குறிப்புள்ளிகள்?” - என்று கேள்வி கேட்டார். இதற்கப்புறம் இம்முயற்சி நின்றது.

எனிலும் கிரந்த முயற்சி நிற்கவில்லை. தமிழ்க் கல்வெட்டுகளின் orthographic principle அறியாதவர் தூண்டுதலால் இந்திய அரசை நகர்த்தி அகுதோபர் 2010 இல் கிரந்தக் கட்டைக்குள் 7 தமிழ்ச் சிறப்புக் குறியீடுகளைச் சேர்க்கும்படி ஒரு முன்னீடு போனது. கிரந்தம் என்பது தமிழகத்தில் எழுந்த நம் எழுத்துத் தான். ஆனால் அது சங்கதம் எழுதப் பிறந்த எழுத்து. அதற்குள் தமிழெழுதும் தேவை யென்ன? தமிழகத்தில் அரசியலெதிர்ப்பு வலுத்தது. அரசியலார் உள் நுழைந்தார் நவ 2010 இல் முதல்வர் கலைஞரே ”ஒருங்குறிச் சேர்த்தியத்திற்கு மடல் எழுதி ஆலோசனைக் குழு ஒன்று இதை ஆய்வு செய்யவேண்டும் அதுவரை நிறுத்தி வையுங்கள்” என்றார்.  சனவரி 2011 இல் உத்தமம் ஒருங்குறிச் சேர்த்தியத்திற்கு மடலெழுதியது. “கிரந்தக் கட்டைக்குள் 7 குறிகளை நுழைப்பதில் உள்ள சிக்கல்களை” நீதிபதி மோகன் தலைமையிலான ஆலோசனைக் குழுவிற்குப் பல ஆர்வலரும் விரிவாய்க் கூறினார். ஆலோசனைக் குழு தீவிரமாய் உரையாடித் தன் பரிந்துரையைத் தமிழக அரசிடம் சொன்னது. தமிழக அரசு, இந்திய அரசை வேண்டிக் கொண்டது. இப் பரிந்துரையின் பேரில், மே 2010 இல் இந்திய அரசே தன் முன்னீட்டைத் திரும்பப் பெற்றுக்கொண்டது.



அடுத்தது பின்ன, சின்னங்களுக்கான குறியேற்றம். சூலை 2012 இல் இம் முன்னீடு திரு இரமண சர்மாவிடமிருந்து போனது. ஆர்வலரான அவர் தனக்குக் கிடைத்த விவரங்களைக் கொண்டே வைத்தார். எல்லா மறு பார்வைக்கும் அவர் அணியமாகவே இருந்தார். இக்குறியேற்றம் இற்றைத் தமிழுக்குத் தேவை இல்லை தான். ஆயினும் வரலாற்று வரிதியான முன்னீடு. நம் இலக்கியங்களை ஏற்கனவே ஒருங்குறி உதவியில் மின்னேற்றியது போல் 60000/70000 தமிழ்க் கல்வெட்டுக்களையும் மின்னேறுவது கட்டாயம் ஓர் ஆய்வுத் தேவை. அதற்குப் பின்ன, சின்னக் குறியிடு தேவை. அவ்வகையில் திரு.சர்மாவைப் பாராட்ட வேண்டும். ஆனால், இதைச் சரியாகச் செய்ய யாரோடு கலந்தாய வேண்டும் என உள்ளதல்லவா? கல்வெட்டியலார், வரலாற்றாளர், தமிழறிஞர் ஆகியோர் அல்லவா இதில் முகன்மை? அவரை விடுத்து 4 IT enthusiasts தம்முள் கலந்தாடிச் செய்தால் சரி வருமா? “இதனை இதனால் இவன் முடிக்கும் என்று ஆய்ந்து. அதனை அவன்கண் விடல்” என்று தானே வள்ளுவன் சொன்னான்?


துறை வல்லுநரைக் கலக்காது செய்தது தவறென்று சொல்லி, கூட்டத்திற்கு ஏற்பாடு செய்ய உத்தமத்தில் வலியுறுத்தியும் அதைச் செய்யாது, நாள்கடத்தி spelling, பெயர் வேறுபாடு, transliteration என்று திசை திருப்பி 2 ஆண்டுகளை கடத்தியது கண்டு மனங்குன்றி, சில தனி ஆர்வலர் (குறிப்பாக, ஆல்பர்ட் பெர்னாண்டோ, இர.வாசுதேவன், இரா. சுகுமாரன், நாக. இளங்கோவனோடு அடியேன்) முயன்று ஏராள முயற்சிகள் எடுத்து, அழுத்தங்கள் கொடுத்து, தமிழக அரசின் வழியாக 2014 இல் ஓர் ஆலோசனைக் கூட்டத்திற்கு ஏற்பாடு செய்தோம். 2015 சூலையில் ஒருங்குறிச் சேர்த்தியத்திடம் தமிழக அரசு மறுப்புக் கொடுத்து, பின் இந்திய அரசும் நம்மோடு சேர்ந்து மறுப்புக் கொடுத்தது.

இதன்பின், துறைவல்லுநர் சார்ந்த ஆலோசனைக் குழு ஏற்படுத்தி, 2 ஆண்டு அலைச்சலில் கல்வெட்டு ஆவணங்களுக்குள் புகுந்து ஒவ்வொரு குறியீடாய்ச் சரிபார்த்து, தேவையான estempageகளைப் படியெடுத்தால், முன்னீட்டின் 55 குறியீடுகளில் 33 பிழையிருப்பது புரிந்தது. திரு. இரமண சர்மாவை அழைத்துச் சொன்ன போது, அவரும் எம்முடன் கூடவந்து இப்பணியில் மகிழ்வோடு கலந்து கொண்டார். எல்லோருமாய்ச் சேர்ந்து 51 குறியீடுகளை இறுதி செய்து, 2017 இல் தமிழக அரசின் வழி,  Finalized proposal to encode Tamil fractions and symbols கொடுத்தோம். இதன் வழி, 51 குறியீடுகள் SMP இல் ஏற்றப்பட்டன. .துறை வல்லுநருடன் சேர்ந்து எளிதில் முடிந்திருக்க் கூடியதை  ஒற்றுமையின்றி இனி இழுத்தடிக்கக் கூடாது என்பதே இதில் நாம் கற்ற பாடம்.

இதன்பின், வெவ்வேறு ஒருங்குறி விதயங்களைச் சரிவரச் செய்யும் முகத்தான், தமிழக அரசே ஆண்டிற்கு 12000/14000 வெள்ளிகள் கொடுத்து 2015 சூலையில் ஒருங்குறிச் சேர்த்தியத்தில் இணை உறுப்பினர் (Institutional Voting Member) ஆனது.

இதற்கடுத்து 2015 அகுதோபரில் மார்ட்டின் ஹோஸ்கென் என்பார் படகருக்காக நுக்தா முன்னீட்டைக் கொடுத்தார். வல்லின எழுத்துகளுக்கு அதிரொலி தரும் வகையில் ஒரு அடிப்புள்ளி (underdot) கேட்டிருந்தார். ”இந்த அடிப்புள்ளியை இப்போதுள்ள பொது அடிப்புள்ளி வைத்தே பெறலாமே? ஏன் தனிக் குறிப்புள்ளி?” என்று கேட்டு சனவரி 2016 இல் மறுப்பு மடல் ஒன்றைத் திரு. நாக. இளங்கோவனும் நானும் எழுதினோம். தமிழக அரசின் சார்பாக தமிழ் இணையக் கல்விக் கழகம் இதை ஏற்றுக் கொண்டது.

அடுத்து மார்ச்சு 2017  இல் அன்சுமான் பாண்டே என்பார் வட்டெழுத்திற்காக preliminary proposal கொடுத்தார். கல்வெட்டியலாரைக் கலந்ததில் ”வடிவத்திலும் கருத்தீட்டிலும்” பல பிழைகள் இருந்தது கண்டு, ”முன்னீட்டை” நிறுத்தி வைக்கச் சொல்லி தமிழ் இணையக் கல்விக் கழகத்திடமிருந்து மடல் சென்றது. இதற்கான மறு முன்னீடு த.இ.க.வில் நிபுணர்களக் கொண்டு இப்போது நடக்கிறது. கூடிய விரைவில் இம் முன்னீடு செல்லும்.   

அண்மையில்   ஏப்ரல் 2020 இல் தமிழ் ற, ழ வைத் தெலுங்குக் கட்டையில் நுழைக்க முயற்சி நடந்தது. ஏற்கனவே றகரத்திற்கும் ழகரத்திற்கும் ஆன தெலுங்குக் குறியிடுண்டு. தவிர, தமிழ்க் குறியீடுகளை நுழைக்காமலே தமிழ் எழுத்தை தெலுங்கு உயிர்மெய்க் குறியீடுகளுடன்  சேர்த்து ஆவணம் படைக்க முடியும். ”பின் ஏன் இக்குறியேற்றம்? வெறுமே Script extension இல் சேர்த்தால் பற்றாதா?” என மறுகேள்வி கேட்டு சூன் 2020 இல் தமிழ்நாட்டரசு அனுப்பியது.

மேலே நான்சொன்ன இத்தனை முயற்சிகளையும் பார்த்தால், தமிழ்க் கட்டைக்குள் உள்ள வெற்றிடங்களை நிரப்பி வட இந்திய மொழிகள் போல் தமிழை ஆக்க எவ்வளவு முயற்சிகள் நடக்கின்றன என்பது உங்களுக்கு விளங்கும். இதுபோல், 7 சிறப்புத் தமிழெழுத்துகளை வேறு எழுத்து வரிசையுள் கொண்டுபோகவும் முயற்சிகள் நடக்கின்றன, இனியும் நடக்கும். superset கருத்தீடு அவ்வளவு பெரியது. விடாது முயல்வர். தொடர்ந்து தடுக்கவேண்டும்.

ஆனால் வெறும் கூச்சலால் அல்ல. போராட்டத்தால் அல்ல. ஆழ்ந்த சிந்தனையால், இடைவிடாத ஊக்கத்தால், கூர்த்த மதியால் இதைச் செய்ய வேண்டும். நாம் மற்ற மொழியினருக்கு எதிரிகள் அல்லர் நம் மொழியை, நம் எழுத்தைப் பாதுகாக்கிறோம். அவ்வளவு தான். தமிழக அரசு, (எந்தக் கட்சி ஆண்டாலும் சரி) நமக்கு உதவியாகவே உள்ளது. இந்திய அரசும் நம்மைத் தடை செய்யவில்லை. அதன் TDIL = Technology Development for Indian Languages நிறுவனம் நாம் கேட்கும் உதவிகளைச் செய்ய என்றும் அணியமாகவே உள்ளது. ஆர்வலர்கள் தாம் முன்வர வேண்டும்.

அகவை கூடிய முதியோரே இனியும் ஒருங்குறி வேலையைச் செய்து கொண்டிருக்க முடியாது. இளைஞர், நடுவயதினர் எனப் பலரும் முன்வர வேண்டும். தமிழ்க்கணிமையில் நான் குறைந்த ஆட்களையே காண்கிறேன். விரல் விட்டு எண்ணலாம் போலும். வெறுமே அரட்டை அடிக்க முகநூல் பக்கம் வருவோரே அதிகமிருக்கிறார்.  உருப்படியான பணிசெய்ய ஆட்களைக்  காணோம். செய்ய வேண்டிய பணிகள் நம்முன் மிகுந்துள்ளன.

1. வட்டெழுத்து வேலையை முடிக்கவேண்டும்.
2. கிரந்தத்திற்குத் தனிக்கட்டை வந்துவிட்டதால், ஒரே ஆவணத்தில் input driver மூலம் 2 எழுத்துக்களையும் கையாளலாம். எனவே ஶ, ஷ, ஸ, ஹ ஆகியவற்றை மதிப்பிழக்கச் (deprecate) செய்யவேண்டும். நுட்பியல் பார்வையில் நாம் கேட்பது ஞாயமானது. பெரும்பாலும் சேர்த்தியம் ஒப்புக்கொள்ளும்..
3. அளபெடைக்கான joiner குறியீடு வாங்க வேண்டும்.
4. குற்றியலுகரம், குற்றியலிகரத்திற்கான சந்திர பிந்து வாங்கவேண்டும். (குமரி மாவட்ட வழக்கம்.)
5. இன்னும் விட்டுப்போன பின்ன, சின்னங்களைத் தேடி அவற்றை SMP இல் குறியேற்ற வேண்டும்.
6. இசைக்குறிகள் , தாளக்குறிகள், வேறு கலைக் குறிகள் - SMP.
7. Translieration/ Transcription க்கான முயற்சிகள். இதைக் குறியேற்றத்தில் செய்யாது வேறு வழிகள் உண்டா என்று பார்க்கவேண்டும். (Discuss)

நம் இலங்கை நண்பர்களுக்கு,  உங்களுடைய நாட்டில் University of Colombo School of Computing - Language Technology Research Laboratory ஒரு laison member ஆய் உள்ளது. அவர்களோடு  தொடர்பு கொள்க. நீங்களும் laison member ஆக வழி தேடுங்கள். மேலே சொன்ன 7 வேலைகளில் நீங்களும் சிலவற்றைச் செய்யலாம்.

இரு நாட்டின் ஆர்வலர்க்குப் பொதுவாய்ச் சொல்வது ஒருங்குறிச் சேர்த்தியச் செய்திகளை வாரத்திற்கு ஒருமுறை பாருங்கள். அவர் ஆவணங்களைப்  படியுங்கள்  அவர் document register ஐத் தொடர்ந்து அவதானியுங்கள். தெலுங்கு, கன்னடம், மலையாளம், சிங்களம் போன்ற மொழிகளில் என்ன நடக்கிறது என்று கவனங் கொள்ளுங்கள். மற்ற Brahmi derived scripts மேலும் ஒரு மேலோட்டப் பார்வை இருக்கட்டும். எங்கிருந்து எது வரும் என்று சொல்வது கடினம்.

அன்புடன்,
இராம.கி.         .     


3 comments:

Rathanaswami said...

அடேங்கப்பா. இவ்வளவு இருக்குங்களா! விழிப்புணர்வு பெற்றேன்.

Anonymous said...

ஐயா, அளபெடைக்கான joiner குறியீடு என்றால் என்ன?

Anonymous said...

ஐயா, சந்திர பிந்து என்றால் என்ன?