Tuesday, March 29, 2005

ஒருங்குறி - இன்னுமொரு பார்வை

வரவேற்பிற்கு நன்றி. வதந்தி எழுப்பியாவது தாங்கள் நினைப்பதை முடித்துக் கொள்ளலாம் என்று சிலர் பார்க்கிறார்கள். ஒருங்குறி பற்றி ஏகப்பட்டது மடற்குழுக்களில் பேசியாகி விட்டது.

தமிழுக்கு என்று தனியிடம் கொடுத்திருப்பது தவிர இன்றைய ஒருங்குறியில் (அதாவது பழைய ISCII -யில்; ISCII க்கும், ஒருங்குறியில் உள்ள தமிழ்க் குறியேற்றத்திற்கும் வேறுபாடு கிடையாது, கிடையாது, கிடையாது. விவரம் தெரிந்தவர்கள் இதை அறிவார்கள்.) கீற்றுக்களின் (glyphs) அடிப்படையில் எழுந்த ISCII -யின் குறையைப் போக்குவதற்குத் தான் கீற்றுக்களின் அடிப்படையில் ஆன இன்னொரு குறியேற்றமான TSCII வந்தது. TSCII அந்த வகையில் கொஞ்ச நாட்களுக்கான இடைமுகம் தான்.

நாம் இறுதியில் கீற்றுக்களை விட்டெறிந்து முழுக் கீற்றெழுத்துக்களுக்கு (full characters) போகவேண்டும் என்ற கருத்து முகமையானது தான். ஆனால், இந்தக் கருத்தை உயர்த்திப் பிடித்த ஒருங்குறிச் சேர்த்தியம் இந்திய மொழிகளுக்கு என்ன செய்தது? "படிப்பது இராமாயணம்; இடிப்பது பெருமாள் கோயில்" என்றபடி மீண்டும் கீற்றுக்களின் அடிப்படையான குறையுள்ள ISCII யை இந்திய மொழிகளுக்காகத் தான் வைத்திருந்த பொந்துகளில் இட்டு அல்லவா நிரப்பியது? அதுவா முன்னேற்றம்? அது பின்னேற்றமல்லவா?

கீற்றுக்கள் எல்லாம் தமிழில் கீற்றெழுத்துக்கள் அல்ல. அவற்றிற்கு எனத் தமிழ் இலக்கணத்தில் தனியாய் ஒரு சிறப்பும் கிடையாது. அவை பற்றித் தொல்காப்பியமும் பேசாது, நன்னூலும் பேசாது. ஏன், எந்த இலக்கண நூலும் பேசாது. அதுதான் உண்மை; ஏனென்றால், அவை அந்தந்த உயிர்களை உணர்த்திக் காட்டும் பகரிகள் (substitutes). அவையும் அவற்றோடு தொடர்புடைய உயிர்களும் ஒரே உள்ளுருமத்தைத் (information) தான் காட்டுகின்றன. இந்த அடிப்படை மொழி உண்மையைக் கூடப் புரிந்து கொள்ளாமல் ஒரே உள்ளுருமத்திற்கு இரண்டு பொந்துகள் கொடுத்து முழுக் கீற்றெழுத்துக் குறியேற்றம் செய்ய வந்துவிட்டார்கள். (You cannot give two slots for the same content.)

அடுத்து வெவ்வேறு வகை எழுத்துகளுக்கு ஒருங்குறி என்று ஏற்படுத்தினால், வரிசைப்படுத்தும் நிரலி ஒன்றாக இருக்க வேண்டும். ஓவ்வொரு பாத்திக்கும் (partition) ஓவ்வொரு நிரலி எழுதக்கூடது. ஒருங்குறி என்று சொல்லிவிட்டு, உரோமன் எழுத்திற்கு ஒரு வரிசைப்படுத்தும் நிரலி, தமிழுக்கு இன்னொன்று, கொரியனுக்கு இன்னொன்று என்றால் இது ஒருங்குறியே இல்லை. வெறும் ஒட்டுக்குறி. வெறுமே பசை போட்டு ஒட்டிச் சேர்த்திருக்கும் குறி. அல்லது ஒன்றாகப் போட்டுக் கட்டி வைத்திருக்கும் புளிமூட்டைச் சாக்கு. (You should not resort to different sorting programmes for different scripts. Every script should be sorted by the same simple programme utilizing the address number of the slots.)

நான் எடுத்தடுத்துச் சொல்லிக் கொண்டே போகலாம், நண்பரே! என்னுடைய புரிதலில், present unicode arrangement as for as Indic Languages are concerned is atrocious.

"ஆனால், நமக்கென்று தனியிடம் கொடுத்திருக்கிறார்களே? உலாவியில் கண்டுபிடிக்க முடிகிறதே? ......" இப்படிச் சொல்லிச் சொல்லியே நம்மவர்கள் மகிழ்ச்சிப் பட்டுப் போகிறார்கள். இந்த ஒரு சிறப்பு இவர்கள் கண்ணை மறைத்துவிடுகிறது. அவர்களிடம் மற்ற சிக்கல்களைப் பற்றியே பேசமுடிவதில்லை.

பன்னாட்டுச் சொவ்வறை (software) நிறுவனங்களின் பாடு கொண்டாட்டம் தான். கல்லறை வரை காசொலி கேட்டுக் கொண்டே இருக்கும். ஏனென்றால், the road to hell is paved with good intentions.

அன்புடன்,
இராம.கி.

In TSCII

ÅçÅüÀ¢üÌ ¿ýÈ¢. Å¾ó¾¢ ±ØôÀ¢Â¡ÅÐ ¾¡í¸û ¿¢¨ÉôÀ¨¾ ÓÊòÐì ¦¸¡ûÇÄ¡õ ±ýÚ º¢Ä÷ À¡÷츢ȡ÷¸û. ´ÕíÌÈ¢ ÀüÈ¢ ²¸ôÀð¼Ð Á¼üÌØì¸Ç¢ø §Àº¢Â¡¸¢ Å¢ð¼Ð.

¾Á¢ØìÌ ±ýÚ ¾É¢Â¢¼õ ¦¸¡Îò¾¢ÕôÀÐ ¾Å¢Ã þý¨È ´ÕíÌȢ¢ø («¾¡ÅÐ À¨Æ ISCII -¢ø; ISCII ìÌõ, ´ÕíÌȢ¢ø ¯ûÇ ¾Á¢úì ÌÈ¢§ÂüÈò¾¢üÌõ §ÅÚÀ¡Î ¸¢¨¼Â¡Ð, ¸¢¨¼Â¡Ð, ¸¢¨¼Â¡Ð. Å¢ÅÃõ ¦¾Ã¢ó¾Å÷¸û þ¨¾ «È¢Å¡÷¸û.) ¸£üÚì¸Ç¢ý (glyphs) «ÊôÀ¨¼Â¢ø ±Øó¾ ISCII -¢ý ̨ȨÂô §À¡ìÌžüÌò ¾¡ý ¸£üÚì¸Ç¢ý «ÊôÀ¨¼Â¢ø ¬É þý¦É¡Õ ÌÈ¢§ÂüÈÁ¡É TSCII Åó¾Ð. TSCII «ó¾ Ũ¸Â¢ø ¦¸¡ïº ¿¡ð¸Ùì¸¡É þ¨¼Ó¸õ ¾¡ý.

¿¡õ þÚ¾¢Â¢ø ¸£üÚì¸¨Ç Å¢ð¦¼È¢óÐ ÓØì ¸£ü¦ÈØòÐì¸ÙìÌ (full characters) §À¡¸§ÅñÎõ ±ýÈ ¸ÕòÐ Ó¸¨Á¡ÉÐ ¾¡ý. ¬É¡ø, þó¾ì ¸Õò¨¾ ¯Â÷ò¾¢ô À¢Êò¾ ´ÕíÌÈ¢î §º÷ò¾¢Âõ þó¾¢Â ¦Á¡Æ¢¸ÙìÌ ±ýÉ ¦ºö¾Ð? "ÀÊôÀÐ þáÁ¡Â½õ; þÊôÀÐ ¦ÀÕÁ¡û §¸¡Â¢ø" ±ýÈÀÊ Á£ñÎõ ¸£üÚì¸Ç¢ý «ÊôÀ¨¼Â¡É ̨ÈÔûÇ ISCII ¨Â þó¾¢Â ¦Á¡Æ¢¸Ù측¸ò ¾¡ý ¨Åò¾¢Õó¾ ¦À¡óиǢø þðÎ «øÄÅ¡ ¿¢ÃôÀ¢ÂÐ? «ÐÅ¡ Óý§ÉüÈõ? «Ð À¢ý§ÉüÈÁøÄÅ¡?

¡, ¢, £, ¤, ¥, ¦, §, ¨, ª §À¡ýÈ ¸£üÚì¸û ±øÄ¡õ ¾Á¢Æ¢ø ¸£ü¦ÈØòÐì¸§Ç «øÄ. «ÅüÈ¢üÌ ±Éò ¾Á¢ú þÄ츽ò¾¢ø ¾É¢Â¡ö ´Õ º¢ÈôÒõ ¸¢¨¼Â¡Ð. «¨Å ÀüÈ¢ò ¦¾¡ø¸¡ôÀ¢ÂÓõ §Àº¡Ð, ¿ýëÖõ §Àº¡Ð. ²ý, ±ó¾ þÄ츽 áÖõ §Àº¡Ð. «Ð¾¡ý ¯ñ¨Á; ²¦ÉýÈ¡ø, «¨Å «ó¾ó¾ ¯Â¢÷¸¨Ç ¯½÷ò¾¢ì ¸¡ðÎõ À¸Ã¢¸û (substitutes). «¨ÅÔõ «Åü§È¡Î ¦¾¡¼÷Ò¨¼Â ¯Â¢÷¸Ùõ ´§Ã ¯ûÙÕÁò¨¾ò (information) ¾¡ý ¸¡ðθ¢ýÈÉ. þó¾ «ÊôÀ¨¼ ¦Á¡Æ¢ ¯ñ¨Á¨Âì ܼô ÒâóÐ ¦¸¡ûÇ¡Áø ´§Ã ¯ûÙÕÁò¾¢üÌ þÃñÎ ¦À¡óиû ¦¸¡ÎòÐ ÓØì ¸£ü¦ÈØòÐì ÌÈ¢§ÂüÈõ ¦ºö ÅóÐÅ¢ð¼¡÷¸û. (You cannot give two slots for the same content.)

«ÎòÐ ¦Åù§ÅÚ Å¨¸ ±ØòиÙìÌ ´ÕíÌÈ¢ ±ýÚ ²üÀÎò¾¢É¡ø, Å⨺ôÀÎòÐõ ¿¢ÃÄ¢ ´ýÈ¡¸ þÕì¸ §ÅñÎõ. µù¦Å¡Õ À¡ò¾¢ìÌõ (partition) µù¦Å¡Õ ¿¢ÃÄ¢ ±Ø¾ìܼÐ. ´ÕíÌÈ¢ ±ýÚ ¦º¡øĢŢðÎ, ¯§Ã¡Áý ±Øò¾¢üÌ ´Õ Å⨺ôÀÎòÐõ ¿¢ÃÄ¢, ¾Á¢ØìÌ þý¦É¡ýÚ, ¦¸¡Ã¢ÂÛìÌ þý¦É¡ýÚ ±ýÈ¡ø þÐ ´ÕíÌÈ¢§Â þø¨Ä. ¦ÅÚõ ´ðÎìÌÈ¢. ¦ÅÚ§Á À¨º §À¡ðÎ ´ðÊî §º÷ò¾¢ÕìÌõ ÌÈ¢. «øÄÐ ´ýÈ¡¸ô §À¡ðÎì ¸ðÊ ¨Åò¾¢ÕìÌõ ÒÇ¢Âãð¨¼î º¡ìÌ. (You should not resort to different sorting programmes for different scripts. Every script should be sorted by the same simple programme utilizing the address number of the slots.)

¿¡ý ±Îò¾ÎòÐî ¦º¡øÄ¢ì ¦¸¡ñ§¼ §À¡¸Ä¡õ, ¿ñÀ§Ã! ±ýÛ¨¼Â Òâ¾Ä¢ø, present unicode arrangement as for as Indic Languages are concerned is atrocious.

"¬É¡ø, ¿Á즸ýÚ ¾É¢Â¢¼õ ¦¸¡Îò¾¢Õ츢ȡ÷¸§Ç? ¯Ä¡Å¢Â¢ø ¸ñÎÀ¢Êì¸ Óʸ¢È§¾? ......" þôÀÊî ¦º¡øÄ¢î ¦º¡øÄ¢§Â ¿õÁÅ÷¸û Á¸¢úô ÀðÎô §À¡¸¢È¡÷¸û. þó¾ ´Õ º¢ÈôÒ þÅ÷¸û ¸ñ¨½ Á¨ÈòÐŢθ¢ÈÐ. «Å÷¸Ç¢¼õ ÁüÈ º¢ì¸ø¸¨Çô ÀüÈ¢§Â §ÀºÓÊž¢ø¨Ä.

ÀýÉ¡ðÎî ¦º¡ùÅ¨È (software) ¿¢ÚÅÉí¸Ç¢ý À¡Î ¦¸¡ñ¼¡ð¼õ ¾¡ý. ¸øÄ¨È Å¨Ã ¸¡¦º¡Ä¢ §¸ðÎì ¦¸¡ñ§¼ þÕìÌõ. ²¦ÉýÈ¡ø, the road to hell is paved with good intentions.

«ýÒ¼ý,
þáÁ.¸¢.

3 comments:

icarus prakash said...

அன்பின் அய்யா...

ஒருங்குறிப் பிரச்சனை இருக்கட்டும். சென்ற முறை தமிழக- பர்மிய வரலாறு பற்றி எடுத்துக்காட்டாக சொன்ன போல, இம்முறையும் ஏதாவது சுவையாக மாட்டும் என்று வந்து பார்த்து ஏமாந்தேன். குறிப்பாக நகரத்தார் சமூகம், பர்மாவில் வணிகத்தில் கோலோச்சியது பற்றி அங்குமிங்குமாக சிலவற்றைப் படித்திருக்கிறேன். இது பற்றி நீங்கள் இணையத்தில் எங்காவது எழுதியதுண்டா? உண்டெனில் இணைப்பு கிடைக்குமா?

இராதாகிருஷ்ணன் said...

கிடைத்ததே போதும் என்ற பரம திருப்தி கொண்டுவிட்டோம். :(
மத்திய, மாநில அரசுகள் ஒருங்குறிச் சேர்த்தியத்தில் உறுப்பினர்களாக உள்ளனர் என்று படித்ததாக நினைவு. முதலில் பூசாரி வரம் கொடுக்க வேண்டுமே? என்றைக்கு விடியுமோ?

முகுந்த் said...

அன்பின் ஐயா,
குறைகளை(அதாவது உங்க பார்வையில்...) எல்லாம் எடுத்து விடறீங்க சரி, உங்களின் தீர்வையும் சொன்னால் அதை செயல்படுத்து நினைப்பவர்களுக்கு உதவியா இருக்க வாய்ப்பு உள்ளது.

இருந்தாலும் ஒரு விசயத்துக்கு உங்களைப் பாராட்டியே ஆகனும்.
நீங்களும் யுனிகோடுக்கு மாறிட்டீங்களே!!! வாழ்த்துக்கள்!!! வாழ்த்துக்கள்!!!