Sunday, April 17, 2005

முகுந்தும் ஒருங்குறி பற்றிய என் முந்தைய இடுகையும்.

அண்மையில் நண்பர் தமிழா முகுந்த் என்னுடைய முந்தைய "ஒருங்குறி - இன்னொமொரு பார்வை" என்ற இடுகையில்,

"குறைகளை(அதாவது உங்க பார்வையில்...) எல்லாம் எடுத்து விடறீங்க சரி, உங்களின் தீர்வையும் சொன்னால் அதை செயல்படுத்து நினைப்பவர்களுக்கு உதவியா இருக்க வாய்ப்பு உள்ளது.
இருந்தாலும் ஒரு விசயத்துக்கு உங்களைப் பாராட்டியே ஆகனும்.
நீங்களும் யுனிகோடுக்கு மாறிட்டீங்களே!!! வாழ்த்துக்கள்!!! வாழ்த்துக்கள்!!!"

என்று ஒரு பின்னூட்டு எழுதியிருந்தார். முகுந்த் ஒரு துடிப்புள்ள நண்பர். நமக்கெல்லாம் e-கலப்பையும், தமிழா உலவியும் செய்து கொடுத்தவர். அவருக்குத் தமிழ்கூறும் நல்லுலகம் நன்றி சொல்ல வேண்டும். நானும் அதில் சேர்ந்து கொள்ளுகிறேன். ஆனால் ஒருங்குறி பற்றி அவரோடு கடுமையாக நான் வேறுபடுகிறேன். ஒருங்குறி பற்றிய உரையாட்டு ஒருமுறை தமிழ் உலகம் மடற்குழுவில் வெளிவந்து விட்டது. இங்கு மீண்டும் அந்த உரையாட்டு எழுகிறது. அவருக்கு மறுமொழி எழுதுவதை இன்னொரு இடுகையாகவே இங்கு தருகிறேன்.

அன்பிற்குரிய முகுந்த்,

இதற்கு முந்திய "பர்மா - தகுதரம் - ஒருங்குறி" என்ற பதிவில் நான் ஒருங்குறியில் என் இடுகைகளைத் தருவதற்கான காரணத்தை அழுத்தந் திருத்தமாகச் சொல்லியிருக்கிறேன்.

"இது தகுதரத்தில் உள்ளது. எனக்கு ஒன்றும் ஒருங்குறி ஆகாதது அல்ல. அதில் உள்ள குறைகளைப் பலகாலம் சொல்லிவருகிறவன் என்ற முறையில் அதைக் குறைந்து புழங்குகிறேன். அவ்வளவுதான். என் வலைப்பதிவில் நான் இன்னும் ஒருங்குறிக்கு மாறவில்லை என்று சிலர் சொல்லிவருகிறார்கள். ஒருங்குறி பயனாக்குவோர் படிப்பதற்காக, ஒருங்குறியிலும் அதைப் பதிவு செய்கிறேன்."

இது புரியவில்லையா? எனக்குத் தேவை புரிதல். வெறும் வறட்டுத் தனம் அல்ல. இங்கு வலைப்பதிவில் குறைகள் தெரிந்தோ தெரியாமலோ பலரும் ஒருங்குறியில் புழங்குகிறார்கள். ஒருவேளை நான் மட்டும் தகுதரம் புழங்குகிறேனோ என்று கூட எனக்குத் தோன்றுவது உண்டு. (கொஞ்ச காலம் பெயரிலி வைத்துக் கொண்டிருந்தார். பின் அவர் இப்பொழுது ஒருங்குறியில் மட்டுமே இடுகிறார்.) நான் சொல்லுவது மற்றவருக்கும் போய்ச் சேர வேண்டும் என்பதற்காக ஒருங்குறியில் என் இடுகையை மாற்றித் தருகிறேன். அவ்வளவு தான். நாளைக்கு நான் சொல்லுவது இன்னொருவருக்கு "தும்பக்டு" குறியேற்றத்தில் தான் சேரமுடியும் என்றால், அது என்னால் முடியுமெனில், அந்தக் குறியேற்றத்தில் சொல்ல நான் தயங்க மாட்டேன். இத்தனைக்கும் TSCII வருவதற்கு முன்னால் ISCII -ல் 96ல் இருந்து 99 வரும் வரை ஒரு 3 ஆண்டுகள் புழங்கிக் கொண்டிருந்தவன் தான். என்ன இது ஒருங்குறி? வெறும் ISCII குறி.

"இதிலென்ன நீங்களும் உஜாலாவுக்கு மாறிவிட்டீர்களா?" என்ற தொனி. தேவையில்லை, நண்பரே!

நான் குறை மட்டுமே சொல்லிக் கொண்டிருக்கிறேன் என்று சொல்லுகிறீர்கள். முதலில் நோயிருக்கிறது என்று ஒத்துக் கொள்ளவே நீங்கள் மறுக்கும் போது, இப்பொழுது வந்து மாற்றுச் சொல்லுங்கள் என்றால் அது என்ன பொருள் என்று விளங்கவில்லை.

ஒருங்குறி பற்றிய என் பார்வை நீங்கள் முற்றிலும் அறிந்ததே. அதைக் கேட்டுப் புரிந்து கொள்ளத்தான் நீங்கள் மறுக்கிறீர்கள். பந்தை ஆடுவதற்கு மாறாகப் பந்தாளியை ஆடுவது ஒன்றும் தமிழருக்குப் புதிதில்லை. "நீங்கள் யார் எங்களுக்குச் சொல்வது? இதையெல்லாம் எங்களைப் போன்ற சொவ்வறையாளர்கள் (software persons) பார்த்துக் கொள்ளுவார்கள். நீங்கள் பயன்படுத்தினால் போதும்" என்று தொனிக்க முன்னால் மடற்குழுவில் பின்னூட்டுக் கொடுத்த பின்னால், இப்பொழுது வந்து மாற்றுச் சொல்லுங்கள் என்றால் அது என்ன பொருள் என்று விளங்கவில்லை.

ஒருங்குறிச் சேர்த்தியம் "அஃகான் முதல எழுத்தெல்லாம் ஆதி பகவன் முதற்றே உலகு" என்று குறளை மாற்றி எழுதச் சொல்லுகிறதோ என்று ஐயுற்ற போது, ASCII ல் @ என்ற குறியிடு இருப்பது போல் ஃ என்பது தமிழ் ஒருங்குறியில் உள்ள எழுத்து வரிசையில் முன்னால் இருக்கிறது என்று எங்களுக்கு தமிழ் எழுத்து வரிசையின் புதிய இலக்கணம் சொல்லிக் கொடுத்த பின்னால், (@ யும் ஃ கும் ஒன்றே போன்றவையா? என்ன ஒரு புரிதல்? தமிழ் எக்கேடோ கெட்டுப் போகட்டும்.) இப்பொழுது வந்து மாற்றுச் சொல்லுங்கள் என்றால் அது என்ன பொருள் என்று விளங்கவில்லை.

இந்த ISCII குறியேற்றத்தில் உள்ள குறை தமிழைக் கணியில் கொண்டுவரப் பாடுபட்ட எல்லோருக்கும் தெரியும். (அதை ஒருங்குறி ஒருங்குறி என்று ஊரெல்லாம் புதுப்பெயர் சொல்லி உருவேற்றிக் கொண்டிருப்பதில் பொருளில்லை. ஒருங்குறி என்பது வெறும் ISCII கீற்றுக் குறியேற்றம் தான் என்பதைக் கூட நீங்கள் நேரடியாக ஒப்புக் கொண்டதில்லை.) TSCII, TAB, ISCII ஆகிய குறியேற்றங்களின் அடிப்படை, கீற்றுக்களே (glyphs) தவிர எழுத்துக்கள் அல்ல. (The fundamental basis of TSCII, TAB, and ISCII is glyphs and not characters.) கீற்றுக்களின் அடிப்படையில் பார்த்தால் TSCII என்பது ISCII யைக் காட்டிலும் சிறந்த குறியேற்றம். (Comparing on that glyph basis, TSCII was a better encoding than ISCII for Tamil) நாம் இப்போது போயிருக்கும் குடியேற்றம் மாற்றுக் குறைந்ததே. மீண்டும் மீண்டும் நமக்குத் தனியிடம் கிடைத்திருக்கிறது, கூகுள் போன்ற உலாவிகளில் துழாவலாம், எந்நாளும் எங்கும் கிடைக்கும், தமிழ் ஏற்றம் அடைந்துவிட்டது என்று கூக்குரலிட்டு, முரசறைந்து கொண்டு இருக்கும் உங்களைப் போன்றவர்கள், "அந்தத் தனியிடத்தில் எதைக் கொண்டுபோய்க் குடிவைத்திருக்கிறோம்?" என்பதைச் சொல்ல மாட்டேன் என்கிறீர்கள்.

இன்றைக்கு இந்திய மொழிகளுக்காக இருக்கும் ஒருங்குறி என்பது ஒரு Character encoding என்று பயனர்களாகிய எங்கள் காதுகளில் எத்தனை நாள் பூச்சுற்றுவீர்கள்? இந்தப் பூசுற்றலைப் பற்றித்தான் "ஒருங்குறி இன்னும் ஒரு பார்வை" என்ற என் இடுகையில் கூறியிருந்தேன். "ஒருங்குறி ஆவணங்களில் நாங்கள் ஒலியையே, character -யையே முகன்மையாய் எடுத்திருக்கிறோம்" என்று ஒருங்குறிச் சேர்த்தியம் சொல்லுவது ஓர் இராமாயணம். பின்னால் பெருமாள் கோயிலை இடிப்பது கணக்காய் இந்திய மொழிகளைப் பொறுத்த வகையில் கீற்றுகளை மட்டுமே எடுத்து ஒருங்குறிக்குள் குடியேற்றி வைத்திருக்கிறார்கள் என்று சொன்னேன். [அவர்களைக் குறை கூறி ஒன்றுமில்லை என்று சிலபோது எனக்குத் தோன்றுகிறது. CDAC தூக்கிக் கொடுத்தது; இவர்கள் குடிவைத்தார்கள். எய்தவன் இருக்க அம்பை நோவது ஏன்? ஆனால், இந்தச் செயலுக்கு TSCII உருவாக்கர்களும் ஆமாம் சாமி போட்டது தான் என் சினத்தை உச்ச கட்டத்திற்குக் கொண்டுபோனது. யார் யாரை ஏமாற்றினார்கள்? என்னைப் போன்றவர்களை முட்டாளாக்கினார்களே? ஏன்? தமிழில் இப்படி ஒரு போலி ஒருங்குறி 2000 களில் வரவேண்டாமே? ISCII யை ஒப்புக் கொள்வதானால் அது 1985 -ல் வந்திருக்கலாமே? இதற்கு மாற்றாக நம்முன்னே வந்த பெரியவாச்சான் பிள்ளைகள் பேருரை கொடுத்து TSCII என்று புதுவழியில் நம்மை ஆற்றுப் படுத்தி நாமும் அதில் போய், நடுவழியில் நம்மை நட்டாற்றில் விடவேண்டாமே? எங்கு பார்த்தாலும் ஒரே வணிக நோக்கு. இதிலுமா?]

நீங்கள் கேட்பதற்காக என்னுடைய அடிப்படைக் கேள்விகளை முன்னே வைக்கிறேன்.

ஒருங்குறி என்பது 2^16 இடங்களைக் கொண்ட ஒரு தரவுத் தொகுதி என்றால் அதிலுள்ள எழுத்துக்கள் (characters) எல்லாமும் ஓர் ஆவணத்தில் சேர்ந்து வரலாம் என்று பொருள். (நான் ஆங்கிலமும், அரபியும், சயாமும், தமிழும், சப்பானியமும் கலந்து ஓர் ஆவணம் உருவாக்கலாம். அதற்கு இந்த ஒருங்குறி உதவ வேண்டும். அப்படி உதவவில்லையென்றால் அது ஒருங்குறியில்லை.) இந்த 2^16 character களை வரிசைப் படுத்த வேண்டும் என்றால் ஒரே பொதுவான நிரல் தான் பயன்படுத்த வேண்டும். 1-இலிருந்து 128 பொந்திற்கு ஒரு நிரல், 256ல் இருந்து 384க்கு இன்னொரு நிரல், 1024 ல் இருந்து 1152க்கு இன்னொரு நிரல் என்று போய்க் கொண்டிருக்கக் கூடாது. ஒவ்வொரு பகுதிக்கும் (ஏன் பத்திக்கும், அல்லது வாக்கியத்திற்கும்) ஒவ்வொரு நிரல் என்றால் அது அவிழக் கூடிய முடிச்சுப் போட்ட, patchwork என்று பெயர்.

ஓர் கலப்பு ஆவணத்தில் "தமிழ் எழுத்து எத்தனை வந்திருக்கிறது, ஆங்கிலம் எவ்வளவு வந்திருக்கிறது, சயாம் எழுத்து எவ்வளவு வந்திருக்கிறது, சப்பானிய எழுத்து எவ்வளவு வந்திருக்கிறது?" என்று கண்டுபிடிக்க ஓர் ஆணை கொடுத்து ஒரு நிரலால் கண்டுபிடித்தால் ஒருங்குறி என்பதில் பொருள் இருக்கிறது. அதை விடுத்து நாலுதடவை நாலு நிரல்கள் வைத்துக் கந்தரகோளமாய்க் கண்டுபிடித்தால் அது என்ன ஒருங்குறி? ஓர் ஆவணத்தில் வரிசைப்படுத்தல், தேடுதல் என்ற சிறிய வேலைகளைச் செய்ய (உருபியல் அலசல் - morphological analysis - செய்ய அல்ல.) நான்கு நிரல்கள் அடுத்தடுத்து வேலை செய்வது சரியாக இருக்குமா? அப்படி இருந்தால் அதைப்போய் ஒருங்குறி என்று சொல்லுவது முட்டாள் தனம் இல்லையா? இதற்கு மாறாக, இப்பொழுது இருக்கும் எண்மடைக் (eight bit) குறியீட்டையே அடுத்தடுத்துப் போட்டு நான் நாலு நிரல்களை வைத்துச் செய்துவிட்டுப் போகலாமே?

பல்வேறு வரிஎழுத்துக்களை (இதை மொழி, மொழி என்று சொல்லித் தவறாக உணர்ந்து கொள்ளுகிறோம். குறியேற்றத்தில் வருவது வரியெழுத்துக்கள். காட்டாக ASCII என்பதில் ஆங்கிலம் அங்கே குறியேற்றப் படவில்லை. உரோமன் எழுத்து குறியேற்றப் படுகிறது. அதே போல TSCII-ல் தமிழ் எழுத்து குறியேற்றப் படுகிறது. தமிழ்மொழி அல்ல.) ஒரே பட்டியலில் வெவ்வேறு எழுத்துக்களைப் பாத்தி பாத்தியாய்க் குறியேற்றும் போது அந்தந்தப் பாத்திகளில் அந்தந்த மொழிகளின் இயல்வரிசைப் படி அடுக்க வேண்டும். அதை விடுத்து, ஊரான் மொழி எழுத்துக்காக என் மொழி எழுத்தைச் சிதைத்து வரிசை மாற்றி விசிறி எறிவதை நான் எப்படி ஒப்புக் கொள்ளமுடியும்? நீ யாரைய்யா எங்கள் வரிசையை மாற்ற? என் மொழியில் ஃ என்ற எழுத்து முன்னால் வராது, அகரம் தான் முன்னால் வரும். இதே போல இந்த எழுத்துக்கென ஓர் ஒப்புக் கொண்ட வரிசை இருக்கிறது. என் மொழியின் எழுத்து வரிசையைக் கலைத்துக் குதற ஒருங்குறிச் சேர்த்தியம் யார்?

என் மொழியில் இல்லாத ஒலிகளை எல்லாம் உள்ளே கொண்டுவந்து அதற்கு இடம் கொடுக்க வேண்டிய தேவை என்ன? இப்பொழுது சில தமிழர்களே உத்தமம் உதவியுடன் z என்ற ஒலிக்கு நிகரான கிரந்த எழுத்தை தமிழ் ஒருங்குறிப் பக்கத்தில் சேர்க்க முன்னீடு கொடுக்கிறார்களே? இதற்கு எல்லாம் என்ன அருத்தம்? யார் இவர்களுக்கு அதிகாரம் கொடுத்தது?

தமிழ் எழுத்து என்பது ஓர் அசையெழுத்து வகை (அதாவது நெடுங்கணக்கு). மேலை எழுத்துக்கள் அகரவரிசை எழுத்துக்கள் (அதாவது குறுங்கணக்கு). இது போகப் புணர்ச்சி என்பது இந்திய மொழிகளில், குறிப்பாகத் தமிழில், மிக முக்கியம். இப்பொழுது உள்ள, கீற்றை அடிப்படையாகக் கொண்ட, ISCII -ல் (அதே போல TSCII, TAB போன்றவற்றில்) இலக்கண விதிகளைக் கொண்டுவராமல் இந்தப் புணர்ச்சியைக் கையாள முடியாது.

இதே போலத் தேடுதல் (searching) என்பது உரோமன் எழுத்தில் ASCII குறியீட்டில் வெறும் எண் முகவரி ஒப்பீடு (number address comparison). கொடுத்திருக்கும் எழுத்துக்களின் எண் முகவரியும், ஆவணத்தில் அருகருகே வரும் எழுத்துக்களின் எண் முகவரியும் ஒன்று போல் இருந்தால் தேடப் பட்ட வார்த்தை கிடைத்துவிடும். ஆனால் இன்றைக்கு இருக்கும் ISCII குறியேற்றத்தில் (வேறு ஒன்றுமில்லை உங்களின் பெத்தப் பெரிய ஒருங்குறி தான்) இலக்கண விதிகளை உள்ளிடாமல் இதைச் செய்யமுடியாது. தவிர தமிழுக்கென்று தனி நிரல் எழுத வேண்டும். சரியான ஒருங்குறியில் இலக்கண விதிகளைக் கொண்டுவராமலே புணர்ச்சியைக் கையாள வேண்டும். தமிழுக்கென்று தனி நிரல் எழுதாமலே செய்ய வேண்டும். சரியான வகையில் எழுத்துக்களை உள்ளிட்டிருந்தால் ஆங்கிலம் போலவே தமிழிலும் வெறும் எண் முகவரி ஒப்பீட்டில் செய்ய முடியும். இப்படி எண் முகவரி ஒப்பீடு செய்வதே எளிதானதும் பொருளுள்ளதும் ஆகும். அதைவிடுத்து எல்லோரும் வரிவரியாக ஒவ்வொரு மொழிக்கும் நிரல்கள் எழுதிக் கொண்டு இருந்தால் எப்படி? சரியாகச் சொன்னால், ஆங்கிலத்திற்குப் பயன்படும் தேட்டு நிரலே (searching programme), வரிசை நிரலே (sorting programme) தமிழுக்கும் பயன்படவேண்டும். உண்மையான ஒருங்குறியாய் இருந்தால் தமிழுக்கு என்று புதிதாக தேட்டு நிரலும், வரிசை நிரலும் எழுதிக் கொண்டு இருக்கக் கூடாது. எல்லா ஒருங்குறிக் குறியேற்றத்திற்கும் ஒரே தேட்டு நிரல், ஒரே வரிசை நிரல் தான் இருக்க வேண்டும்.

இந்த அடிப்படை இல்லாத இன்றைய ஒருங்குறியை மாற்ற முடியாது. உயிர்மெய் எழுத்துக்களைத் தெரிந்து கொண்டு, தேவைப் பட்டபோது அந்த உயிர்மெய்களில் இருந்து உயிரையும், மெய்யையும் தனியே புணர்ச்சி பிரித்து எடுக்கக் கூடிய குறியேற்றம் தான், அதன் வழி எண் முகவரி கண்டு தேட, வரிசைப் படுத்த வாய்ப்பாக இருக்கும் குறியேற்றம் தான், நமக்கு உகந்தது. அந்தக் குறியேற்றத்தின் அடிப்படை புணர்ச்சியாக இருக்க வேண்டும். அதை ஒப்புக் கொள்ளாத, அல்லது விலகிப் போகும் உப்புக்குச் சப்பாணியான குறியேற்றத்தை வைத்துக்கொண்டால், ஏதொன்றையும் நாம் மூக்கைச் சுற்றி வளைத்தே தொடுவோம்.

என்னுடைய கருத்தில் இன்றைய ஒருங்குறி என்பது முதற் கோணல்; அது முற்றிலும் கோணலில் தான் நம்மைக் கொண்டு செல்லும். இந்தக் கோணலைச் சரிசெய்ய புத்திசாலித் தனமான நிரல்களை நம் சொவ்வறையாளர்கள் எழுதவேண்டும். அப்படிச் செய்வதால், மைக்ரோசாவ்ட் போன்ற சொவ்வறை நிறுவனங்களுக்கும், உலகெங்கும் பரந்து கிடக்கும் தமிழ்ச் சொவ்வறையாளருக்கும் வேண்டுமானால் நிறைய வேலை கிடைக்கும். சின்னச் சின்ன செயலுக்கெல்லாம் பெரிய சொவ்வறைகளை எழுதிக் கொண்டு இருப்பார்கள். எங்களைப் போன்ற பயனாளர்கள், ஒவ்வொரு விருத்திக்கும் காசு செலவழித்துக் கொண்டு இருப்பார்கள்.

Y2K நினைவிருக்கிறதா? யாரோ ஒருவர் அந்தக் காலத்தில் சரியான அடிப்படை கொள்ளாததால், எல்லாக் கணிகளையும் சரி செய்யவேண்டும் என்று கோடிகோடியாகச் செலவளித்தார்கள். ஏகப்பட்ட சொவ்வறையாளர்களுக்குப் பணம் கிடைத்தது. இப்படித்தான் இன்றைய இந்திய மொழிகளுக்கான ஒருங்குறி இருக்கிறது. அது இந்திய எழுத்துக்களுக்காக அடவு (design) செய்யப் பட்டது அல்ல. அது அகரவரிசை எழுத்துக்களை அடிப்படையாகக் கொண்டு நம்மை அவர்களுக்கு இணங்க மாற்றி வளைக்கிறது. நாமும் அடிமைத் தனத்தோடு வளைந்து கொடுக்கிறோம். மெது மெதுவாக சூட்டை ஏற்றி தன்னால் தவ்வக் கூட முடியாதபடி ஆக்கி, தன்னைக் கொலை செய்யப் பார்க்கிறார்கள் என்று கூடப் புரிந்து கொள்ளாது, மகிழ்ச்சிப் படும் தவளைகள் நாம்.

என்ன செய்ய வேண்டும் என்று என்னைக் கேட்டீர்களல்லவா? உங்களைப் போன்ற இளைஞர்களைத் திரட்டுங்கள். உத்தமத்தைப் போட்டு உலுக்குங்கள். தமிழக அரசை, இந்திய அரசை உலுக்குங்கள். ஒருங்குறிச் சேர்த்தியத்தைப் போட்டு உலுக்குங்கள். "இப்பொழுது உள்ள குறியேற்ற அடிப்படை தவறு. இந்தத் தவறான அடிப்படையையே கடைப்பிடித்தால் அப்புறம் எல்லாவற்றையும் சரிசெய்து கொண்டே இருக்க வேண்டியது தான். நம் ஆவணங்கள் எல்லாம் மேலை ஆவணங்களைக் காட்டிலும் இரண்டுமடங்கு மூன்று மடங்கு பெருகிப் போகும். எனவே வேறு அடிப்படைக்குப் போக வேண்டும்" என்று வலியுறுத்துங்கள்.

அன்பிற்குரிய முகுந்த், இதை எல்லாம் நான் தமிழ் உலகம் மடற்குழுவில் வெகு நாட்கள் பேசியாகிவிட்டது. இதுவரை நான் கேட்ட கேள்விகளுக்கு மோனமும், கேலியும் தான் மறுமொழி. நீங்கள் தான் இந்தப் போலி ஒருங்குறியில் மாற்றமே தேவையில்லை என்று சொல்லிவிட்டீர்களே? அப்புறம் என்னைக் கேட்டால்?

இன்றைய ஒருங்குறியில் ஏதும் செய்யமுடியாது என்பதல்ல? வரிசைப் படுத்துவீர்கள், தேடுவீர்கள், ஆனால் எல்லாமே அந்தந்த மொழிக்கு விதப்பாக (language specific). அடவுப் பொறிஞனாகிய நான் அதை செருப்பிற்கேத்த வகையில் காலை வெட்டுவது என்று புரிந்து கொள்ளுகிறேன். என்னைக் கேட்டால் இந்தச் செருப்பைத் தூக்கி எறிந்து என் காலுக்கேற்ற (என் மொழிக்கேற்ற) செருப்பை அடவு செய்வேன்.

அப்புறம், நான் சொவ்வறையாளன் இல்லை. வெறும் பயனன். மொழியறிவு ஏதோ கொஞ்சம் இருப்பதாக எண்ணிக் கொண்டிருப்பவன். இந்த முறையும் நீ யார் என்று கேட்டுவிடாதீர்கள். மேற்கொண்டு சொல்ல என்ன இருக்கிறது? நான் நிரம்பவும் பேசிவிட்டேன்.

அன்புடன்,
இராம.கி.
In TSCII:

ÓÌóÐõ ´ÕíÌÈ¢ ÀüȢ ±ý Óó¨¾Â þΨ¸Ôõ.

«ñ¨Á¢ø ¿ñÀ÷ ¾Á¢Æ¡ ÓÌóò ±ýÛ¨¼Â Óó¨¾Â "´ÕíÌÈ¢ - þý¦É¡¦Á¡Õ À¡÷¨Å" ±ýÈ þΨ¸Â¢ø,

"̨ȸ¨Ç(«¾¡ÅÐ ¯í¸ À¡÷¨Å¢ø...) ±øÄ¡õ ±ÎòРŢ¼È£í¸ ºÃ¢, ¯í¸Ç¢ý ¾£÷¨ÅÔõ ¦º¡ýÉ¡ø «¨¾ ¦ºÂøÀÎòÐ ¿¢¨ÉôÀÅ÷¸ÙìÌ ¯¾Å¢Â¡ þÕì¸ Å¡öôÒ ¯ûÇÐ.
þÕó¾¡Öõ ´Õ Å¢ºÂòÐìÌ ¯í¸¨Çô À¡Ã¡ðʧ ¬¸Ûõ.
¿£í¸Ùõ ÔÉ¢§¸¡ÎìÌ Á¡È¢ðËí¸§Ç!!! Å¡úòÐì¸û!!! Å¡úòÐì¸û!!!"

±ýÚ ´Õ À¢ýëðÎ ±Ø¾¢Â¢Õó¾¡÷. ÓÌóò ´Õ ÐÊôÒûÇ ¿ñÀ÷. ¿Á즸øÄ¡õ e-¸Äô¨ÀÔõ, ¾Á¢Æ¡ ¯ÄÅ¢Ôõ ¦ºöÐ ¦¸¡Îò¾Å÷. «ÅÕìÌò ¾Á¢úÜÚõ ¿øÖĸõ ¿ýÈ¢ ¦º¡øÄ §ÅñÎõ. ¿¡Ûõ «¾¢ø §º÷óÐ §¸¡ûÙ¸¢§Èý. ¬É¡ø ´ÕíÌÈ¢ ÀüÈ¢ «Å§Ã¡Î ¸Î¨Á¡¸ ¿¡ý §ÅÚÀθ¢§Èý. ´ÕíÌÈ¢ ÀüȢ ¯¨Ã¡ðÎ ´ÕÓ¨È ¾Á¢ú ¯Ä¸õ Á¼üÌØÅ¢ø ¦ÅÇ¢ÅóРŢð¼Ð. þíÌ Á£ñÎõ «ó¾ ¯¨Ã¡ðÎ ±Ø¸¢ÈÐ. «ÅÕìÌ ÁÚ¦Á¡Æ¢ ±ØÐŨ¾ þý¦É¡Õ þΨ¸Â¡¸§Å þíÌ ¾Õ¸¢§Èý.

«ýÀ¢üÌâ ÓÌóò,

þ¾üÌ Óó¾¢Â "À÷Á¡ - ¾Ì¾Ãõ - ´ÕíÌÈ¢" ±ýÈ À¾¢Å¢ø ¿¡ý ´ÕíÌȢ¢ø ±ý þΨ¸¸¨Çò ¾Õžü¸¡É ¸¡Ã½ò¨¾ «Øò¾ó ¾¢Õò¾Á¡¸î ¦º¡øĢ¢Õ츢§Èý.

"þÐ ¾Ì¾Ãò¾¢ø ¯ûÇÐ. ±ÉìÌ ´ýÚõ ´ÕíÌÈ¢ ¬¸¡¾Ð «øÄ. «¾¢ø ¯ûÇ Ì¨È¸¨Çô Àĸ¡Äõ ¦º¡øÄ¢ÅÕ¸¢ÈÅý ±ýÈ Ó¨È¢ø «¨¾ì ̨ÈóÐ ÒÆí̸¢§Èý. «ùÅÇ×¾¡ý. ±ý ŨÄôÀ¾¢Å¢ø ¿¡ý þýÛõ ´ÕíÌÈ¢ìÌ Á¡ÈÅ¢ø¨Ä ±ýÚ º¢Ä÷ ¦º¡øÄ¢ÅÕ¸¢È¡÷¸û. ´ÕíÌÈ¢ ÀÂÉ¡ì̧š÷ ÀÊôÀ¾ü¸¡¸, ´ÕíÌȢ¢Öõ «¨¾ô À¾¢× ¦ºö¸¢§Èý."

þÐ ÒâÂÅ¢ø¨Ä¡? ±ÉìÌò §¾¨Å Òâ¾ø. ¦ÅÚõ ÅÈðÎò ¾Éõ «øÄ. þíÌ Å¨ÄôÀ¾¢Å¢ø ̨ȸû ¦¾Ã¢ó§¾¡ ¦¾Ã¢Â¡Á§Ä¡ ÀÄÕõ ´ÕíÌȢ¢ø ÒÆí̸¢È¡÷¸û. ´Õ§Å¨Ç ¿¡ý ÁðÎõ ¾Ì¾Ãõ ÒÆí̸¢§È§É¡ ±ýÚ Ü¼ ±ÉìÌò §¾¡ýÚÅÐ ¯ñÎ. (¦¸¡ïº ¸¡Äõ ¦ÀÂâĢ ¨ÅòÐì ¦¸¡ñÊÕó¾¡÷. À¢ý «Å÷ þô¦À¡ØÐ ´ÕíÌȢ¢ø ÁðΧÁ þθ¢È¡÷.) ¿¡ý ¦º¡øÖÅÐ ÁüÈÅÕìÌõ §À¡öî §ºÃ §ÅñÎõ ±ýÀ¾ü¸¡¸ ´ÕíÌȢ¢ø ±ý þΨ¸¨Â Á¡üÈ¢ò ¾Õ¸¢§Èý. «ùÅÇ× ¾¡ý. ¿¡¨ÇìÌ ¿¡ý ¦º¡øÖÅÐ þý¦É¡ÕÅÕìÌ "ÐõÀìÎ" ÌÈ¢§ÂüÈò¾¢ø ¾¡ý §ºÃÓÊÔõ ±ýÈ¡ø, «Ð ±ýÉ¡ø ÓÊÔ¦ÁÉ¢ø, «ó¾ì ÌÈ¢§ÂüÈò¾¢ø ¦º¡øÄ ¿¡ý ¾Âí¸ Á¡ð§¼ý. þò¾¨ÉìÌõ TSCII ÅÕžüÌ ÓýÉ¡ø ISCII -ø 96ø þÕóÐ 99 ÅÕõ Ũà ´Õ 3 ¬ñθû ÒÆí¸¢ì ¦¸¡ñÊÕó¾Åý ¾¡ý. ±ýÉ þÐ ´ÕíÌÈ¢? ¦ÅÚõ ISCII ÌÈ¢.

"þ¾¢¦ÄýÉ ¿£í¸Ùõ ¯ƒ¡Ä¡×ìÌ Á¡È¢Å¢ðË÷¸Ç¡?" ±ýÈ ¦¾¡É¢. §¾¨Å¢ø¨Ä, ¿ñÀ§Ã!

¿¡ý Ì¨È ÁðΧÁ ¦º¡øÄ¢ì ¦¸¡ñÊÕ츢§Èý ±ýÚ ¦º¡øÖ¸¢È£÷¸û. ӾĢø §¿¡Â¢Õ츢ÈÐ ±ýÚ ´òÐì ¦¸¡ûǧŠ¿£í¸û ÁÚìÌõ §À¡Ð, þô¦À¡ØÐ ÅóÐ Á¡üÚî ¦º¡øÖí¸û ±ýÈ¡ø «Ð ±ýÉ ¦À¡Õû ±ýÚ Å¢Çí¸Å¢ø¨Ä.

´ÕíÌÈ¢ ÀüȢ ±ý À¡÷¨Å ¿£í¸û ÓüÈ¢Öõ «È¢ó¾§¾. «¨¾ì §¸ðÎô ÒâóÐ ¦¸¡ûÇò¾¡ý ¿£í¸û ÁÚ츢ȣ÷¸û. Àó¨¾ ¬ÎžüÌ Á¡È¡¸ô Àó¾¡Ç¢¨Â ¬ÎÅÐ ´ýÚõ ¾Á¢ÆÕìÌô Ò¾¢¾¢ø¨Ä. "¿£í¸û ¡÷ ±í¸ÙìÌî ¦º¡øÅÐ? þ¨¾¦ÂøÄ¡õ ±í¸¨Çô §À¡ýÈ ¦º¡ùŨÈ¡Ç÷¸û (software persons) À¡÷òÐì ¦¸¡ûÙÅ¡÷¸û. ¿£í¸û ÀÂýÀÎò¾¢É¡ø §À¡Ðõ" ±ýÚ ¦¾¡É¢ì¸ ÓýÉ¡ø Á¼üÌØÅ¢ø À¢ýëðÎì ¦¸¡Îò¾ À¢ýÉ¡ø, þô¦À¡ØÐ ÅóÐ Á¡üÚî ¦º¡øÖí¸û ±ýÈ¡ø «Ð ±ýÉ ¦À¡Õû ±ýÚ Å¢Çí¸Å¢ø¨Ä.

´ÕíÌÈ¢î §º÷ò¾¢Âõ "«·¸¡ý Ó¾Ä ±Øò¦¾øÄ¡õ ¬¾¢ À¸Åý Ó¾ü§È ¯ÄÌ" ±ýÚ Ì鬂 Á¡üÈ¢ ±Ø¾î ¦º¡øÖ¸¢È§¾¡ ±ýÚ ³ÔüÈ §À¡Ð, ASCII ø @ ±ýÈ ÌȢ¢ΠþÕôÀÐ §À¡ø · ±ýÀÐ ¾Á¢ú ´ÕíÌȢ¢ø ¯ûÇ ±ØòÐ Å⨺¢ø ÓýÉ¡ø þÕ츢ÈÐ ±ýÚ ±í¸ÙìÌ ¾Á¢ú ±ØòÐ Å⨺¢ý Ò¾¢Â þÄ츽õ ¦º¡øÄ¢ì ¦¸¡Îò¾ À¢ýÉ¡ø, (@ Ôõ · Ìõ ´ý§È §À¡ýȨÅ¡? ±ýÉ ´Õ Òâ¾ø? ¾Á¢ú ±ì§¸§¼¡ ¦¸ðÎô §À¡¸ðÎõ.) þô¦À¡ØÐ ÅóÐ Á¡üÚî ¦º¡øÖí¸û ±ýÈ¡ø «Ð ±ýÉ ¦À¡Õû ±ýÚ Å¢Çí¸Å¢ø¨Ä.

þó¾ ISCII ÌÈ¢§ÂüÈò¾¢ø ¯ûÇ Ì¨È ¾Á¢¨Æì ¸½¢Â¢ø ¦¸¡ñÎÅÃô À¡ÎÀð¼ ±ø§Ä¡ÕìÌõ ¦¾Ã¢Ôõ. («¨¾ ´ÕíÌÈ¢ ´ÕíÌÈ¢ ±ýÚ °¦ÃøÄ¡õ ÒÐô¦ÀÂ÷ ¦º¡øÄ¢ ¯Õ§ÅüÈ¢ì ¦¸¡ñÊÕôÀ¾¢ø ¦À¡ÕÇ¢ø¨Ä. ´ÕíÌÈ¢ ±ýÀÐ ¦ÅÚõ ISCII ¸£üÚì ÌÈ¢§ÂüÈõ ¾¡ý ±ýÀ¨¾ì ܼ ¿£í¸û §¿ÃÊ¡¸ ´ôÒì ¦¸¡ñ¼¾¢ø¨Ä.) TSCII, TAB, ISCII ¬¸¢Â ÌÈ¢§ÂüÈí¸Ç¢ý «ÊôÀ¨¼, ¸£üÚì¸§Ç (glyphs) ¾Å¢Ã ±ØòÐì¸û «øÄ. (The fundamental basis of TSCII, TAB, and ISCII is glyphs and not characters.) ¸£üÚì¸Ç¢ý «ÊôÀ¨¼Â¢ø À¡÷ò¾¡ø TSCII ±ýÀÐ ISCII ¨Âì ¸¡ðÊÖõ º¢Èó¾ ÌÈ¢§ÂüÈõ. (Comparing on that glyph basis, TSCII was a better encoding than ISCII for Tamil) ¿¡õ þô§À¡Ð §À¡Â¢ÕìÌõ ÌʧÂüÈõ Á¡üÚì ̨È󾧾. Á£ñÎõ Á£ñÎõ ¿ÁìÌò ¾É¢Â¢¼õ ¸¢¨¼ò¾¢Õ츢ÈÐ, ÜÌû §À¡ýÈ ¯Ä¡Å¢¸Ç¢ø ÐÆ¡ÅÄ¡õ, ±ó¿¡Ùõ ±íÌõ ¸¢¨¼ìÌõ, ¾Á¢ú ²üÈõ «¨¼óÐÅ¢ð¼Ð ±ýÚ ÜìÌÃÄ¢ðÎ, Óú¨ÈóÐ ¦¸¡ñÎ þÕìÌõ ¯í¸¨Çô §À¡ýÈÅ÷¸û, "«ó¾ò ¾É¢Â¢¼ò¾¢ø ±¨¾ì ¦¸¡ñΧÀ¡öì ÌʨÅò¾¢Õ츢§È¡õ?" ±ýÀ¨¾î ¦º¡øÄ Á¡ð§¼ý ±ý¸¢È£÷¸û.

þý¨ÈìÌ þó¾¢Â ¦Á¡Æ¢¸Ù측¸ þÕìÌõ ´ÕíÌÈ¢ ±ýÀÐ ´Õ Character encoding ±ýÚ ÀÂÉ÷¸Ç¡¸¢Â ±í¸û ¸¡Ð¸Ç¢ø ±ò¾¨É ¿¡û âîÍüÚÅ£÷¸û? þó¾ô âÍüȨÄô ÀüÈ¢ò¾¡ý "´ÕíÌÈ¢ þýÛõ ´Õ À¡÷¨Å" ±ýÈ ±ý þΨ¸Â¢ø ÜȢ¢Õó§¾ý. "´ÕíÌÈ¢ ¬Å½í¸Ç¢ø ¿¡í¸û ´Ä¢¨Â§Â, character -¨Â§Â Ó¸ý¨Á¡ö ±Îò¾¢Õ츢§È¡õ" ±ýÚ ´ÕíÌÈ¢î §º÷ò¾¢Âõ ¦º¡øÖÅÐ µ÷ þáÁ¡Â½õ. À¢ýÉ¡ø ¦ÀÕÁ¡û §¸¡Â¢¨Ä þÊôÀÐ ¸½ì¸¡ö þó¾¢Â ¦Á¡Æ¢¸¨Çô ¦À¡Úò¾ Ũ¸Â¢ø ¸£üÚ¸¨Ç ÁðΧÁ ±ÎòÐ ´ÕíÌÈ¢ìÌû ÌʧÂüÈ¢ ¨Åò¾¢Õ츢ȡ÷¸û ±ýÚ ¦º¡ý§Éý. [«Å÷¸¨Çì Ì¨È ÜÈ¢ ´ýÚÁ¢ø¨Ä ±ýÚ º¢Ä§À¡Ð ±ÉìÌò §¾¡ýÚ¸¢ÈÐ. CDAC àì¸¢ì ¦¸¡Îò¾Ð; þÅ÷¸û ÌʨÅò¾¡÷¸û. ±ö¾Åý þÕì¸ «õ¨À §¿¡ÅÐ ²ý? ¬É¡ø, þó¾î ¦ºÂÖìÌ TSCII ¯ÕÅ¡ì¸÷¸Ùõ ¬Á¡õ º¡Á¢ §À¡ð¼Ð ¾¡ý ±ý º¢Éò¨¾ ¯îº ¸ð¼ò¾¢üÌì ¦¸¡ñΧÀ¡ÉÐ. ¡÷ ¡¨Ã ²Á¡üȢɡ÷¸û? ±ý¨Éô §À¡ýÈÅ÷¸¨Ç Óð¼¡Ç¡ì¸¢É¡÷¸§Ç? ²ý? ¾Á¢Æ¢ø þôÀÊ ´Õ §À¡Ä¢ ´ÕíÌÈ¢ 2000 ¸Ç¢ø ÅçÅñ¼¡§Á? ISCII ¨Â ´ôÒì ¦¸¡ûž¡É¡ø «Ð 1985 -ø Åó¾¢Õì¸Ä¡§Á? þ¾üÌ Á¡üÈ¡¸ ¿õÓý§É Åó¾ ¦Àâšý À¢û¨Ç¸û §Àըà ¦¸¡ÎòÐ TSCII ±ýÚ ÒÐÅƢ¢ø ¿õ¨Á ¬üÚô ÀÎò¾¢ ¿¡Óõ «¾¢ø §À¡ö, ¿ÎÅƢ¢ø ¿õ¨Á ¿ð¼¡üÈ¢ø Å¢¼§Åñ¼¡§Á? ±íÌ À¡÷ò¾¡Öõ ´§Ã Ž¢¸ §¿¡ìÌ. þ¾¢ÖÁ¡?]

¿£í¸û §¸ðÀ¾ü¸¡¸ ±ýÛ¨¼Â «ÊôÀ¨¼ì §¸ûÅ¢¸¨Ç Óý§É ¨Å츢§Èý.

´ÕíÌÈ¢ ±ýÀÐ 2^16 þ¼í¸¨Çì ¦¸¡ñ¼ ´Õ ¾Ã×ò ¦¾¡Ì¾¢ ±ýÈ¡ø «¾¢ÖûÇ ±ØòÐì¸û (characters) ±øÄ¡Óõ µ÷ ¬Å½ò¾¢ø §º÷óÐ ÅÃÄ¡õ ±ýÚ ¦À¡Õû. (¿¡ý ¬í¸¢ÄÓõ, «ÃÀ¢Ôõ, ºÂ¡Óõ, ¾Á¢Øõ, ºôÀ¡É¢ÂÓõ ¸ÄóÐ µ÷ ¬Å½õ ¯ÕÅ¡ì¸Ä¡õ. «¾üÌ þó¾ ´ÕíÌÈ¢ ¯¾Å §ÅñÎõ. «ôÀÊ ¯¾ÅÅ¢ø¨Ä¦ÂýÈ¡ø «Ð ´ÕíÌȢ¢ø¨Ä.) þó¾ 2^16 character ¸¨Ç Å⨺ô ÀÎò¾ §ÅñÎõ ±ýÈ¡ø ´§Ã ¦À¡ÐÅ¡É ¿¢Ãø ¾¡ý ÀÂýÀÎò¾ §ÅñÎõ. 1-þÄ¢ÕóÐ 128 ¦À¡ó¾¢üÌ ´Õ ¿¢Ãø, 256ø þÕóÐ 384ìÌ þý¦É¡Õ ¿¢Ãø, 1024 ø þÕóÐ 1152ìÌ þý¦É¡Õ ¿¢Ãø ±ýÚ §À¡öì ¦¸¡ñÊÕì¸ì ܼ¡Ð. ´ù¦Å¡Õ À̾¢ìÌõ (²ý Àò¾¢ìÌõ, «øÄРš츢Âò¾¢üÌõ) ´ù¦Å¡Õ ¿¢Ãø ±ýÈ¡ø «Ð «Å¢Æì ÜÊ ÓÊîÍô §À¡ð¼, patchwork ±ýÚ ¦ÀÂ÷.

µ÷ ¸ÄôÒ ¬Å½ò¾¢ø "¾Á¢ú ±ØòÐ ±ò¾¨É Åó¾¢Õ츢ÈÐ, ¬í¸¢Äõ ±ùÅÇ× Åó¾¢Õ츢ÈÐ, ºÂ¡õ ±ØòÐ ±ùÅÇ× Åó¾¢Õ츢ÈÐ, ºôÀ¡É¢Â ±ØòÐ ±ùÅÇ× Åó¾¢Õ츢ÈÐ?" ±ýÚ ¸ñÎÀ¢Êì¸ µ÷ ¬¨½ ¦¸¡ÎòÐ ´Õ ¿¢ÃÄ¡ø ¸ñÎÀ¢Êò¾¡ø ´ÕíÌÈ¢ ±ýÀ¾¢ø ¦À¡Õû þÕ츢ÈÐ. «¨¾ Å¢ÎòÐ ¿¡Ö¾¼¨Å ¿¡Ö ¿¢Ãø¸û ¨ÅòÐì ¸ó¾Ã§¸¡ÇÁ¡öì ¸ñÎÀ¢Êò¾¡ø «Ð ±ýÉ ´ÕíÌÈ¢? µ÷ ¬Å½ò¾¢ø Å⨺ôÀÎò¾ø, §¾Î¾ø ±ýÈ º¢È¢Â §Å¨Ä¸¨Çî ¦ºö (¯ÕÀ¢Âø «Äºø - morphological analysis - ¦ºö «øÄ.) ¿¡ýÌ ¿¢Ãø¸û «Îò¾ÎòÐ §Å¨Ä ¦ºöÅÐ ºÃ¢Â¡¸ þÕìÌÁ¡? «ôÀÊ þÕó¾¡ø «¨¾ô§À¡ö ´ÕíÌÈ¢ ±ýÚ ¦º¡øÖÅÐ Óð¼¡û ¾Éõ þø¨Ä¡? þ¾üÌ Á¡È¡¸, þô¦À¡ØÐ þÕìÌõ ±ñÁ¨¼ì (eight bit) ÌȢ£𨼧 «Îò¾ÎòÐô §À¡ðÎ ¿¡ý ¿¡Ö ¿¢Ãø¸¨Ç ¨ÅòÐî ¦ºöÐÅ¢ðÎô §À¡¸Ä¡§Á?

Àø§ÅÚ Åâ±ØòÐì¸¨Ç (þ¨¾ ¦Á¡Æ¢, ¦Á¡Æ¢ ±ýÚ ¦º¡øÄ¢ò ¾ÅÈ¡¸ ¯½÷óÐ ¦¸¡ûÙ¸¢§È¡õ. ÌÈ¢§ÂüÈò¾¢ø ÅÕÅÐ Åâ¦ÂØòÐì¸û. ¸¡ð¼¡¸ ASCII ±ýÀ¾¢ø ¬í¸¢Äõ «í§¸ ÌÈ¢§ÂüÈô À¼Å¢ø¨Ä. ¯§Ã¡Áý ±ØòÐ ÌÈ¢§ÂüÈô Àθ¢ÈÐ. «§¾ §À¡Ä TSCII-ø ¾Á¢ú ±ØòÐ ÌÈ¢§ÂüÈô Àθ¢ÈÐ. ¾Á¢ú¦Á¡Æ¢ «øÄ.) ´§Ã ÀðÊÂÄ¢ø ¦Åù§ÅÚ ±ØòÐ츨Çô À¡ò¾¢ À¡¾¢Â¡öì ÌÈ¢§ÂüÚõ §À¡Ð «ó¾ó¾ô À¡ò¾¢¸Ç¢ø «ó¾ó¾ ¦Á¡Æ¢¸Ç¢ý þÂøÅ⨺ô ÀÊ «Îì¸ §ÅñÎõ. «¨¾ Å¢ÎòÐ, °Ã¡ý ¦Á¡Æ¢ ±ØòÐ측¸ ±ý ¦Á¡Æ¢ ±Øò¨¾î º¢¨¾òÐ Å⨺ Á¡üÈ¢ Å¢º¢È¢ ±È¢Å¨¾ ¿¡ý ±ôÀÊ ´ôÒì ¦¸¡ûÇÓÊÔõ? ¿£ ¡¨Ãö¡ Å⨺¨Â Á¡üÈ? ±ý ¦Á¡Æ¢Â¢ø · ±ýÈ ±ØòÐ ÓýÉ¡ø ÅáÐ, «¸Ãõ ¾¡ý ÓýÉ¡ø ÅÕõ. þ§¾ §À¡Ä þó¾ ±ØòÐì¦¸É µ÷ ´ôÒì ¦¸¡ñ¼ Å⨺ þÕ츢ÈÐ. ±ý ¦Á¡Æ¢Â¢ý ±ØòÐ Å⨺¨Âì ¸¨ÄòÐì Ì¾È ´ÕíÌÈ¢î §º÷ò¾¢Âõ ¡÷?

±ý ¦Á¡Æ¢Â¢ø þøÄ¡¾ ´Ä¢¸¨Ç ±øÄ¡õ ¯û§Ç ¦¸¡ñÎÅóÐ «¾üÌ þ¼õ ¦¸¡Îì¸ §ÅñÊ §¾¨Å ±ýÉ? þô¦À¡ØÐ º¢Ä ¾Á¢Æ÷¸§Ç ¯ò¾Áõ ¯¾Å¢Ô¼ý z ±ýÈ ´Ä¢ìÌ ¿¢¸Ã¡É ¸¢Ãó¾ ±Øò¨¾ ¾Á¢ú ´ÕíÌÈ¢ô Àì¸ò¾¢ø §º÷ì¸ ÓýɣΠ¦¸¡Î츢ȡ÷¸§Ç? þ¾üÌ ±øÄ¡õ ±ýÉ «Õò¾õ? ¡÷ þÅ÷¸ÙìÌ «¾¢¸¡Ãõ ¦¸¡Îò¾Ð?

¾Á¢ú ±ØòÐ ±ýÀÐ µ÷ «¨º¦ÂØòРŨ¸ («¾¡ÅÐ ¦¿Îí¸½ìÌ). §Á¨Ä ±ØòÐì¸û «¸ÃÅ⨺ ±ØòÐì¸û («¾¡ÅÐ ÌÚí¸½ìÌ). þÐ §À¡¸ô Ò½÷ ±ýÀÐ þó¾¢Â ¦Á¡Æ¢¸Ç¢ø, ÌÈ¢ôÀ¡¸ò ¾Á¢Æ¢ø, Á¢¸ Ó츢Âõ. þô¦À¡ØÐ ¯ûÇ, ¸£ü¨È «ÊôÀ¨¼Â¡¸ì ¦¸¡ñ¼, ISCII -ø («§¾ §À¡Ä TSCII, TAB §À¡ýÈÅüÈ¢ø) þÄ츽 Å¢¾¢¸¨Çì ¦¸¡ñÎÅáÁø þó¾ô Ò½÷¨Âì ¨¸Â¡Ç ÓÊ¡Ð.

þ§¾ §À¡Äò §¾Î¾ø (searching) ±ýÀÐ ¯§Ã¡Áý ±Øò¾¢ø ASCII ÌȢ£ðÊø ¦ÅÚõ ±ñ Ó¸Åâ ´ôÀ£Î (number address comparison). ¦¸¡Îò¾¢ÕìÌõ ±ØòÐì¸Ç¢ý ±ñ Ó¸ÅâÔõ, ¬Å½ò¾¢ø «Õ¸Õ§¸ ÅÕõ ±ØòÐì¸Ç¢ý ±ñ Ó¸ÅâÔõ ´ýÚ §À¡ø þÕó¾¡øõ §¾¼ô Àð¼ Å¡÷ò¨¾ ¸¢¨¼òÐÅ¢Îõ. ¬É¡ø þý¨ÈìÌ þÕìÌõ ISCII ÌÈ¢§ÂüÈò¾¢ø (§ÅÚ ´ýÚÁ¢ø¨Ä ¯í¸Ç¢ý ¦Àò¾ô ¦Àâ ´ÕíÌÈ¢ ¾¡ý) þÄ츽 Å¢¾¢¸¨Ç ¯ûÇ¢¼¡Áø þ¨¾î ¦ºöÂÓÊ¡Ð. ¾Å¢Ã ¾Á¢Ø즸ýÚ ¾É¢ ¿¢Ãø ±Ø¾ §ÅñÎõ. ºÃ¢Â¡É ´ÕíÌȢ¢ø þÄ츽 Å¢¾¢¸¨Çì ¦¸¡ñÎÅáÁ§Ä Ò½÷¨Âì ¨¸Â¡Ç §ÅñÎõ. ¾Á¢Ø즸ýÚ ¾É¢ ¿¢Ãø ±Ø¾¡Á§Ä ¦ºö §ÅñÎõ. ºÃ¢Â¡É Ũ¸Â¢ø ±ØòÐì¸¨Ç ¯ûÇ¢ðÊÕó¾¡ø ¬í¸¢Äõ §À¡Ä§Å ¾Á¢Æ¢Öõ ¦ÅÚõ ±ñ Ó¸Åâ ´ôÀ£ðÊø ¦ºö ÓÊÔõ. þôÀÊ ±ñ Ó¸Åâ ´ôÀ£Î ¦ºöŧ¾ ±Ç¢¾¡ÉÐõ ¦À¡ÕÙûÇÐõ ¬Ìõ. «¨¾Å¢ÎòÐ ±ø§Ä¡Õõ ÅâÅ⡸ ´ù¦Å¡Õ ¦Á¡Æ¢ìÌõ ¿¢Ãø¸û ±Ø¾¢ì ¦¸¡ñÎ þÕó¾¡ø ±ôÀÊ? ºÃ¢Â¡¸î ¦º¡ýÉ¡ø, ¬í¸¢Äò¾¢üÌô ÀÂýÀÎõ §¾ðÎ ¿¢Ã§Ä (searching programme), Å⨺ ¿¢Ã§Ä (sorting programme) ¾Á¢ØìÌõ ÀÂýÀ¼§ÅñÎõ. ¯ñ¨ÁÂ¡É ´ÕíÌȢ¡ö þÕó¾¡ø ¾Á¢ØìÌ ±ýÚ Ò¾¢¾¡¸ §¾ðÎ ¿¢ÃÖõ, Å⨺ ¿¢ÃÖõ ±Ø¾¢ì ¦¸¡ñÎ þÕì¸ì ܼ¡Ð. ±øÄ¡ ´ÕíÌÈ¢ì ÌÈ¢§ÂüÈò¾¢üÌõ ´§Ã §¾ðÎ ¿¢Ãø, ´§Ã Å⨺ ¿¢Ãø ¾¡ý þÕì¸ §ÅñÎõ.

þó¾ «ÊôÀ¨¼ þøÄ¡¾ þý¨È ´ÕíÌÈ¢¨Â Á¡üÈ ÓÊ¡Ð. ¯Â¢÷¦Áö ±ØòÐ츨Çò ¦¾Ã¢óÐ ¦¸¡ñÎ, §¾¨Åô Àð¼§À¡Ð «ó¾ ¯Â¢÷¦Áö¸Ç¢ø þÕóÐ ¯Â¢¨ÃÔõ, ¦Áö¨ÂÔõ ¾É¢§Â Ò½÷ À¢Ã¢òÐ ±Îì¸ì ÜÊ ÌÈ¢§ÂüÈõ ¾¡ý, «¾ý ÅÆ¢ ±ñ Ó¸Åâ ¸ñÎ §¾¼, Å⨺ô ÀÎò¾ Å¡öôÀ¡¸ þÕìÌõ ÌÈ¢§ÂüÈõ ¾¡ý, ¿ÁìÌ ¯¸ó¾Ð. «ó¾ì ÌÈ¢§ÂüÈò¾¢ý «ÊôÀ¨¼ Ò½÷¡¸ þÕì¸ §ÅñÎõ. «¨¾ ´ôÒì ¦¸¡ûÇ¡¾, «øÄРŢĸ¢ô §À¡Ìõ ¯ôÒìÌî ºôÀ¡½¢Â¡É ÌÈ¢§ÂüÈò¨¾ ¨ÅòÐ즸¡ñ¼¡ø, ²¦¾¡ý¨ÈÔõ ¿¡õ ã쨸î ÍüÈ¢ ŨÇò§¾ ¦¾¡Î§Å¡õ.

±ýÛ¨¼Â ¸Õò¾¢ø þý¨È ´ÕíÌÈ¢ ±ýÀÐ Ó¾ü §¸¡½ø; «Ð ÓüÈ¢Öõ §¸¡½Ä¢ø ¾¡ý ¿õ¨Áì ¦¸¡ñÎ ¦ºøÖõ. þó¾ì §¸¡½¨Äî ºÃ¢¦ºö Òò¾¢º¡Ä¢ò ¾ÉÁ¡É ¿¢Ãø¸¨Ç ¿õ ¦º¡ùŨÈ¡Ç÷¸û ±Ø¾§ÅñÎõ. «ôÀÊî ¦ºöž¡ø, ¨Áì§Ã¡º¡ùð §À¡ýÈ ¦º¡ùÅ¨È ¿¢ÚÅÉí¸ÙìÌõ, ¯Ä¦¸íÌõ ÀÃóÐ ¸¢¼ìÌõ ¾Á¢úî ¦º¡ùŨÈ¡ÇÕìÌõ §ÅñÎÁ¡É¡ø ¿¢¨È §Å¨Ä ¸¢¨¼ìÌõ. º¢ýÉî º¢ýÉ ¦ºÂÖ즸øÄ¡õ ¦Àâ ¦º¡ùŨȸ¨Ç ±Ø¾¢ì ¦¸¡ñÎ þÕôÀ¡÷¸û. ±í¸¨Çô §À¡ýÈ ÀÂÉ¡Ç÷¸û, ´ù¦Å¡Õ Å¢Õò¾¢ìÌõ ¸¡Í ¦ºÄÅÆ¢òÐì ¦¸¡ñÎ þÕôÀ¡÷¸û.

Y2K ¿¢¨ÉÅ¢Õ츢Ⱦ¡? ¡§Ã¡ ´ÕÅ÷ «ó¾ì ¸¡Äò¾¢ø ºÃ¢Â¡É «ÊôÀ¨¼ ¦¸¡ûÇ¡¾¾¡ø, ±øÄ¡ì ¸½¢¸¨ÇÔõ ºÃ¢ ¦ºö§ÅñÎõ ±ýÚ §¸¡Ê§¸¡Ê¡¸î ¦ºÄÅÇ¢ò¾¡÷¸û. ²¸ôÀð¼ ¦º¡ùŨÈ¡Ç÷¸ÙìÌô À½õ ¸¢¨¼ò¾Ð. þôÀÊò¾¡ý þý¨È þó¾¢Â ¦Á¡Æ¢¸Ùì¸¡É ´ÕíÌÈ¢ þÕ츢ÈÐ. «Ð þó¾¢Â ±ØòÐì¸Ù측¸ «¼× (design) ¦ºöÂô Àð¼Ð «øÄ. «Ð «¸ÃÅ⨺ ±ØòÐì¸¨Ç «ÊôÀ¨¼Â¡¸ì ¦¸¡ñÎ ¿õ¨Á «Å÷¸ÙìÌ þ½í¸ Á¡üÈ¢ ŨÇ츢ÈÐ. ¿¡Óõ «Ê¨Áò ¾Éò§¾¡Î ŨÇóÐ ¦¸¡Î츢§È¡õ. ¦ÁÐ ¦ÁÐÅ¡¸ Ý𨼠²üÈ¢ ¾ýÉ¡ø ¾ùÅì ܼ ÓÊ¡¾ÀÊ ¬ì¸¢, ¾ý¨Éì ¦¸¡¨Ä ¦ºöÂô À¡÷츢ȡ÷¸û ±ýÚ Ü¼ô ÒâóÐ ¦¸¡ûÇ¡Ð, Á¸¢úô ÀÎõ ¾Å¨Ç¸û ¿¡õ.

±ýÉ ¦ºö §ÅñÎõ ±ýÚ ±ý¨Éì §¸ðË÷¸ÇøÄÅ¡? ¯í¸¨Çô §À¡ýÈ þ¨Ç»÷¸¨Çò ¾¢ÃðÎí¸û. ¯ò¾Áò¨¾ô §À¡ðÎ ¯ÖìÌí¸û. ¾Á¢Æ¸ «Ã¨º, þó¾¢Â «Ã¨º ¯ÖìÌí¸û. ´ÕíÌÈ¢î §º÷ò¾¢Âò¨¾ô §À¡ðÎ ¯ÖìÌí¸û. "þô¦À¡ØÐ ¯ûÇ ÌÈ¢§ÂüÈ «ÊôÀ¨¼ ¾ÅÚ. þó¾ò ¾ÅÈ¡É «ÊôÀ¨¼¨Â§Â ¸¨¼ôÀ¢Êò¾¡ø «ôÒÈõ ±øÄ¡Åü¨ÈÔõ ºÃ¢¦ºöÐ ¦¸¡ñ§¼ þÕì¸ §ÅñÊÂÐ ¾¡ý. ¿õ ¬Å½í¸û ±øÄ¡õ §Á¨Ä ¬Å½í¸¨Çì ¸¡ðÊÖõ þÃñÎÁ¼íÌ ãýÚ Á¼íÌ ¦ÀÕ¸¢ô §À¡Ìõ. ±É§Å §ÅÚ «ÊôÀ¨¼ìÌô §À¡¸ §ÅñÎõ" ±ýÚ ÅÄ¢ÔÚòÐí¸û.

«ýÀ¢üÌâ ÓÌóò, þ¨¾ ±øÄ¡õ ¿¡ý ¾Á¢ú ¯Ä¸õ Á¼üÌØÅ¢ø ¦ÅÌ ¿¡ð¸û §Àº¢Â¡¸¢Å¢ð¼Ð. þÐŨà ¿¡ý §¸ð¼ §¸ûÅ¢¸ÙìÌ §Á¡ÉÓõ, §¸Ä¢Ôõ ¾¡ý ÁÚ¦Á¡Æ¢. ¿£í¸û ¾¡ý þó¾ô §À¡Ä¢ ´ÕíÌȢ¢ø Á¡üȧÁ §¾¨Å¢ø¨Ä ±ýÚ ¦º¡øĢŢðË÷¸§Ç? «ôÒÈõ ±ý¨Éì §¸ð¼¡ø?

þý¨È ´ÕíÌȢ¢ø ²Ðõ ¦ºöÂÓÊ¡Р±ýÀ¾øÄ? Å⨺ô ÀÎòÐÅ£÷¸û, §¾ÎÅ£÷¸û, ¬É¡ø ±øÄ¡§Á «ó¾ó¾ ¦Á¡Æ¢ìÌ Å¢¾ôÀ¡¸ (language specific). «¼×ô ¦À¡È¢»É¡¸¢Â ¿¡ý «¨¾ ¦ºÕôÀ¢ü§¸ò¾ Ũ¸Â¢ø ¸¡¨Ä ¦ÅðÎÅÐ ±ýÚ ÒâóÐ ¦¸¡ûÙ¸¢§Èý. ±ý¨Éì §¸ð¼¡ø þó¾î ¦ºÕô¨Àò à츢 ±È¢óÐ ±ý ¸¡Ö째üÈ (±ý ¦Á¡Æ¢ì§¸üÈ) ¦ºÕô¨À «¼× ¦ºö§Åý.

«ôÒÈõ, ¿¡ý ¦º¡ùŨÈ¡Çý þø¨Ä. ¦ÅÚõ ÀÂÉý. ¦Á¡Æ¢ÂÈ¢× ²§¾¡ ¦¸¡ïºõ þÕôÀ¾¡¸ ±ñ½¢ì ¦¸¡ñÊÕôÀÅý. þó¾ Ó¨ÈÔõ ¿£ ¡÷ ±ýÚ §¸ðÎÅ¢¼¡¾£÷¸û. §Áü¦¸¡ñÎ ¦º¡øÄ ±ýÉ þÕ츢ÈÐ? ¿¡ý ¿¢ÃõÀ×õ §Àº¢Å¢ð§¼ý.

«ýÒ¼ý,
þáÁ.¸¢.

1 comment:

Anonymous said...

Now again another Pandora's box. D.Maran has released a set of free fonts for Tamil (as if this is first time..!) - but they are neither Unicode nor TSCII but TAB and TAM version of tamil fonts. So all govt and other private institutions will use TAB and TAM while bloggers use Unicode and email group members use TSCII. Way to go..!

Rajesh. K