Monday, July 13, 2020

machine and related words

ஒருமுறை machine learning என்பதை எப்படித் தமிழிற் சொல்வது? - என்று கேட்டார், அதைச் சொல்ல நினைக்கும் போது, machine, engine, hickey, gadget, equipment, apparatus, tool, device, facility, இன்னும் சில கருவிகள் பற்றிச் சொல்லவேண்டும் என்று எண்ணினேன்.

முதலில்  machine, engine பார்ப்போம். இவை எல்லாவற்றையும் பொறியெனச் சொல்லும் பழக்கம் நம்மில் நிறையப் பேருக்கு உள்ளது. அது சரியில்லை. Engine is a driver. machine can be either a driver (ஓட்டி) or a driven one (ஓடி). It justs converts one form into another. இருவளை (two wheeler), விலங்கிழுப்புச் சகடம், பல்வேறு வையங்கள் (wagons) ஆகியவற்றை வண்டியென்ற பொதுப்பெயர் கொண்டு அழைக்கிறோம். ஒவ்வொரு வண்டியிலும் ”ஓட்டி, ஓடி” என 2 பாகங்களுண்டு.

1. சகட்டில் (car) கன்னெயைக் காற்றில் எரித்து புகையுண்டாக்கி அதை உலக்கை-உருளைப் (piston-cylinder) பிணைப்பிற்குள் அனுப்பி அமைவது எந்திரம் (engine) என்னும் ஓட்டி அல்லது துரவு (drive).

2. சட்டகையும் (chassis) சக்கரங்களுஞ் (wheels) சேர்ந்தது ஓடி (driven machine).

ஓட்டியையும் ஓடியையும் கவைக்கும் முறை சகட்டிலும் இருவளையிலும் வேறுபடும். விலங்குச் சகடத்தில் ஓட்டி என்பது மாடு/குதிரையெனும் விலங்கைக் குறிக்கும். ஓடி என்பது  சட்டகையையும், சங்கரங்களையும் சேர்த்துக் குறிக்கும்..

காட்டாய், தெறுமப் புயவு மின்னாக்கி (thermal power generation) அல்லது அனல் மின் நிலையத்தில் உயரழுத்த நீராவி ஒரு சுழலியைச் (turbine) சுற்றுகிறது. அந்தச் சுழலியோடு ஒரு மின்னாக்கி இணைக்கப் பட்டு அலைமின்சாரத்தை (alternating current) உருவாக்குகிறது. இதில் சுழலி என்பது engine. மின்னாக்கி என்பது ஒரு electrical generating machine. இதேபோல் புனல்மின் நிலையத்தில் நீர்ச்சுழலி என்பது driver. மின்னாக்கி என்பது driven machine. தமிழில் எ(ல்)ந்திரம்> எந்திரமென்பது எற்றுதல் (= தள்ளுதல்) தொடர்பாய் எழுந்த சொல். இதற்கு இயக்குதற் பொருள் வரும்படி இய(ல்)ந்திரம் என்றுஞ் சொல்வர். எல்லுதல்/இயலுதல் என்ற இரு செயல்களுமே ஒரு machine ஐ, இன்னொரு machine இயக்குவது குறித்தது.. காட்டாக நாம் பயன்கொள்ளும் சீரூந்து என்பது 4 பேரோ, 8 பேரோ செல்லும் ஒரு சகடம் (car) ஆகும். இது வெறுமே ஒரு machine அல்ல. இதனுள் 2 machine கள் உள்ளன.  4 சக்கரமிருக்கும் சகடத்தை (machine 1) சகடத்தின் எந்திரம் என்னும் 2 ஆம் machine இயக்குகிறது.

அப்படியெனில் machine ஐ எப்படித் தமிழில் சொல்வது? இதற்கான விடை யெளிது. ஆனாற் கவனம் வேண்டும். திரும்பத் திரும்ப ஒரே வேலையைச் சீராகச் செய்யவும், தன்னால் இயலாத பெரு வேலைகளை தன் சிந்தனையால், கருவிகள்/கட்டுப்பாடுகளாற் செய்யவுமே மாந்தன் machine ஐக் கண்டுபிடித்தான். இதில் முகன்மையானது அச்செடுத்தது போல் ஒப்பிட்டு மீளச் செய்யும் வேலையின் நேர்த்தி.

மா என்ற ஓரெழுத்து ஒரு மொழிக்கு அளவு, ஒப்பீடு, அதிகம், வலி ஆகியவை பொருட்பாடுகளாகும். .ஆங்கிலத்தில் machine ஐ, ”1540s, "structure of any kind," from Middle French machine "device, contrivance," from Latin machina "machine, engine, military machine; device, trick; instrument" (source also of Spanish maquina, Italian macchina), from Greek makhana, Doric variant of Attic mekhane "device," from PIE *magh-ana- "that which enables," from root *magh- "to be able, have power." என்று குறிப்பிடுவார்.

இந்த வரையறையில் முகன்மை ”மா” என்பதே. தமிழில் அன்னுதல் என்பது போலுதல் பொருள் கொள்ளும்.. மா+அன்னுதல் என்ற சொற்கள் புணரும் போது உடம்படுமெய்யாக யகரம், வகரம் பெரும்பாலும் பயன்படும் ஓரோ வழி ககரமும் சிலபோது பயன்படலாம். இங்கே அதைப் பெய்து மா+க்+ அ(ன்)னுதல் = மாக(ன்)னுதல் என்ற கூட்டுச்சொல்லை உருவாக்கலாம் ”ஒன்றைப் போல் இன்னொன்றைச் செய்துகொண்டிருந்தலை அது குறிக்கும். வலி, அதிகம் என்ற பொருளும் இதனுளுண்டு. ஒரு machine இப்படித் தானே இயங்குகிறது? machine = மாகனை அல்லது மாகனம். நான் சில காலமாய் மாகனத்தைப் பயின்று வருகிறேன். பலரும் இதைக் கேள்வி கேட்கிறார். என் விடை சிறியது. ”கருவி என்பது நம்மிடம் பலகாலம் இருந்தது. 200/250 ஆண்டுகளிற்றான் machine எனும் பெருங்கருவியை அறிந்தோம். machine ஐக் குறிக்கக் கருவியம் என்பதைக் காட்டிலும் மாகனம் எனக்குப் பொருந்துவதாய்த் தோன்றுகிறது.

பொறி என்றசொல் எந்திரத்திற்கு ஒரு மாற்றே (குறிப்பாக உள்ளக எரிப்பு இயந்திரத்திற்கு - internal combustion engine - அதுவொரு மாற்று.) அதன் பொருளை நீட்டி மாகனத்திற்கு இணையாகப் பயில்வதற்கு நான் தயங்குவேன். (இந்தத் தெளிவுகள் எனக்கு வர நெடுங்காலம் பிடித்தது. என்னுடைய பழைய ஆக்கங்களில் எந்திரம், பொறி என்ற சொற்களின் பயன்பாட்டில் சற்று குழப்பம் இருந்திருக்கிறது, இப்பொழுது 4,5 ஆண்டுகளாய் இந்தக் குழப்பத்தைத் தவிர்க்கிறேன்.) என் பரிந்துரை machine learning = மாகனப் பயிற்றுவிப்பு. (மாகனம் பயில்கிறது. நாம் பயிற்றுவிக்கிறோம்.)

அடுத்தது hickey யும் gadget உம்.

hickey (n.) = "any small gadget," 1909, American English, of unknown origin. என்றே ஆங்கிலச் சொற்பிறப்பியல் அகரமுதலி சொல்லும். *gadget  என்பதற்கு, 1886, gadjet (but said to date back to 1850s), sailors' slang word for any small mechanical thing or part of a ship for which they lacked, or forgot, a name; perhaps from Fr. ga^chette "catchpiece of a mechanism, " dim. of ga^che "staple of a lock." என்று சொல்வர். staple of the lock என்பதைக் கொக்கி என்றே தமிழில் சொல்கிறோம்; பூட்டைத்திறந்து காட்டி, "சாவியை இப்படிப்போட்டுத் திறந்தா, இந்தக் கொக்கி இக் காடைக்குள்ளே விழணும்பா" என்று சொல்லுகிறோம் இல்லையா? கொக்கும், கொடுக்கும் ஒன்றுதான். "வளைந்த பொருத்து" என்று பொருள்.

கொடுக்காப்புளிப் பழம் சாப்பிட்டிருக்கிறீர்களோ? வளைந்து சுருண்டு கிடக்கும் பழம் கொடுக்காப்புளி. சற்றே மெலிந்த புளிப்புடன், சுவையாக இருக்கும் பழம். இற்றை நகர்ப்புறத் தமிழர் சற்றும் அறியாப் பழம். நாட்டுப் புறங்களிலுங் கூட இப்போது அழிந்துகொண்டிருக்கும் பழம். [தமிழ்நாட்டின் வளத்தில் இன்னும் ஒன்றாய் இது அழிந்து கொண்டிருக்கிறது.] அதில் வரும் கொடுக்கு என்ற முன்னொட்டு வளைந்த நீட்டத்தைக் குறிக்கும். வாலிற்குக் கூட கொடுக்கென்ற பொருளுண்டு. கொ(டு)க்கின் சிறியது கொ(டு)க்கட்டை ஆகும். மேலைமொழிகளில் get என வருவது போல் கட்டை என்ற சொல் நம் மொழியில் சிறியதைக் குறிக்கும் பின்னொட்டாய் அமையமுடியும்.

கொக்கட்டை என்பதைச் சொல்வதற்குப் பெரிதாய்த் தோன்றினால், அல்லது தயங்கினால், கொக்கை என்றே கூட gadget -யைச் சொல்லலாம். கொக்கை - catchpiece of a mechanism என்று சொல்ல முடியும். hickey ஐயும் அப்படி அழைக்கும் போது gadget ஐக் கொக்கட்டை என்றே அழைக்கலாம். இன்னுஞ் சில தொடர்புள்ள சொற்களுண்டு. எல்லாவற்றையும் கருவி என்றே ஒரேயடியாய் அழைப்பது நம்மில் பலருக்குள்ள சோம்பல் என்றுதான் தோன்றுகிறது. (எனக்கும் அது இருந்தது. இப்போது அது தவறு என்று உணர்ந்ததால் துல்லியங் கட்ட வேறு சொற்களைக் கீழே பரிந்துரைக்கிறேன்.

Equipment இது இருவகையாய் ஆனது. ஒன்று பொருள் தாங்குவது. இன்னொன்று செயல் செய்வதற்கானது. முதல்வகையைச் செய்கலன் என்றும், இரண்டாம் வகையை ஏந்தம் என்றுஞ் சொல்லலாம். முதல்வகை வேதியாலைகளிலும், இரண்டாம் வகை மாகனவியல், மின்னியல் போன்ற மற்ற மானுறுத்தல் (Manufacture = மானுறுத்தி) ஆலைகளில் பயன்படும்.

அடுத்தது apparatus (n.) "a collection of tools, utensils, etc. adapted as a means to some end," 1620s, from Latin apparatus "tools, implements, equipment; preparation, a preparing," noun of state from past participle stem of apparare "prepare," from ad "to" (see ad-) + parare "make ready" (from PIE root *pere- (1) "to produce, procure"). ஒரு பொருளைப் பண்ணுவதற்குப் பயன்படுவதால் இதைப் பண்ணம் எனலாம்.

அடுத்தது tool இதன் அடிப்படை tawlen என்ற பழஞ் செருமானியத்தில் உருவாகியது. taw (v.) ”to prepare" (leather), from Old English tawian "prepare, make ready, make; cultivate," also "harass, insult, outrage" to do, make," from Proto-Germanic *tawōjanan (source also of Old Frisian tawa, Old Saxon toian, Middle Dutch tauwen, Dutch touwen, Old High German zouwen "to prepare," Old High German zawen "to succeed," Gothic taujan "to make, prepare"), from Proto-Germanic root *taw- "to make, manufacture" (compare tool (n.)). தமிழில் ஒன்றைத் தக்கதாகுவதற்கு தகைத்தல் என்ற தன்வினையுண்டு. இன்னொன்றைத் தக்கதாக்க தகைவித்தல் என்ற பிறவினைச்சொல் உண்டு. இதில் விளையும் பெயர்ச்சொல்லான தகைவி tool க்குச் சரிவரும்.

அடுத்தது device ஒரு பொருளைச் செய்வதற்காக விதப்பாய்ச் செய்யப்பட்ட கருவி = device. Facility = ஏந்து (ஏல்தல் வினையில் கிளர்ந்த சொல் இது ஏல/இயலச் செய்வது)

Machine = மாகனை மாகுதல் என்பது மாத்தல்= பருக்குதல் என்றவினையில் கிளர்ந்த சொல்.. மாகு = பெரியது. மாகனை = பெரியதாய்ச் செய்ய உதவும் அலகு.

Unit = அலகு
Arrangement = அடங்கல், அடங்கு (ஒரு கூடைக்குள்/கட்டகத்துள் விதவிதமாய் ஒழுங்கு செய்வது)
Means of production = புதுக்க ஏது
Workshop = பட்டறை
Drive = துரவி (ஒன்றைத் துரத்துவது துரவி)
Vessel = கலன், ஏனம்
Utility = ஊடுழை
widget = இடுக்கை
Function = பந்தம்

அன்புடன்,
இராம.கி.

சொத்தாவணங்கள்

ஒரு சமயம்,   தி இந்து (தமிழ்) இதழில் “சொந்த வீடு” எனும்பகுதி 2ஆம் பக்கத்தில் ”சொத்து ஆவணங்களில் புழங்கும் சொற்கள்” என்ற கட்டுரை வெளிவந்தது. அது ஓவியா அர்ஜுன் என்பார் எழுதியது. அதிலுள்ள சொற்கள் சில தமிழாகவும், சில வேற்றுமொழிச் சொற்களாகவும் இருந்தன. அவற்றைக் கீழே கொடுத்துள்ளேன். விளக்கம் அவருடையது. பிறைக் கோட்டினுள் என் தமிழாக்கத்தையும் சொல்தொடர்பான சில குறிப்புகளையும் கொடுத்துள்ளேன். இச்சொற்கள் பல்லவர், முற்காலப் பாண்டியர், பெருஞ்சோழர், பிற்காலப்பாண்டியர், விசயநகரப் பேரரசு, சுல்தான்கள் அரசு, கிழக்கிந்தியக் கும்பணி வழியே ஆங்கிலேய அரசிற்கு வந்து இற்றை இந்திய அரசமைப்பின் கீழ் புழங்குகின்றன. வெவ்வேறு வரலாற்றுக்காலத் தாக்கம் இச்சொற்களுக்குள் உண்டு. .

பட்டா: ஒரு நிலம் யார் பெயரில் உள்ளதென்பதைக் குறிக்கும் வகையில் வருவாய்த்துறை அளிக்கும் ஆவணம். (இச்சொல் தமிழே. நில உரிமையாளருக்குக் கொடுக்கப்படும் ஆவணம் பட்டா.. இதன் படி வருவாய்த்துறையில் இருக்கும்.)

சிட்டா: குறிப்பிட்ட நிலத்தின் பரப்பளவு, அதன் பயன்பாடு, யாருடைய கட்டுப்பாட்டிலுள்ளது என்பது தொடர்பான விவரங்களடங்கிய வருவாய்த் துறை ஆவணம் (இதுவும் தமிழே. சிட்டையிலிருந்து உருவாகியது சிட்டா ஆகும். சிட்டை என்பது தமிழ்க்கணக்கு ஆவணங்களில் ஒன்றான முதற்குறிப்பு. சிட்டா என்பது வருவாய்த்துறை ஆவணம். நில உரிமையாளருக்கு இதன் படியைக் கொடுப்பர்.)

அடங்கல்: நிலத்தின் பரப்பு, பயன்பாடு, கிராமத்தின் மொத்த நிலத்தில் இது எந்தப்பகுதியிலுள்ளது என்ற விவரங்கள் அடங்கிய வருவாய்த்துறை ஆவணம். (கிராமம் என்பது கம்மம்/காமம் எனும் தமிழ்ச் சொல்லின் சங்கத வடிவம். காமமென்ற சொல் பாகதத்திலுமுண்டு. இலங்கையில் பரவலானது. தமிழில் காமம் அரிதே பயிலும். ஊரென்பதே நம்மூரில் பெரிதும் புழங்கும். அடங்கலென்ற சொல் தமிழே. சிட்டை விவரங்களே ஊர்ப்பார்வையில் எல்லா நிலங்களுஞ் சேர்த்து அடக்கிக் காட்டப்படும். அடங்கலென்பது வருவாய்த் துறை ஆவணம். இதன் படியை நில உரிமையாளரிடம் கொடுக்கமாட்டார். அரசிடம் மட்டுமேயிருக்கும்.)

புல எண்: நில அளவை எண்

கிராம தானம்: கிராமத்தின் பொதுப்பயன். (’காமதானம்’ என்று சொன்னால், இற்றை நிலையில் தவறான பொருளுணர்த்தும். எனவே ஊர்க்கொடை என்று சொல்லலாம். தானம் தமிழே. ’தந்தது’ என்று பொருள்படும். காமக்காவற் பொருளில் ஒருகாலத்தில் ’காம ஆட்சி’ பயன்பட்டது. புத்த காஞ்சியின் காவல் தெய்வம் தாரா தேவியே காம ஆட்சியாவாள். இன்று இவளைக் காமாட்சி என்றாக்கிக் காமக்கண்ணி எனப் புரிந்து அம்மனாக்கி விட்டார்.)

தேவதானம்: கோவில் பயன்பாட்டுக்காகக் குறிப்பிட்ட நிலத்தைத் தானமாய் அளித்தல். [இது தெய்வத்தானம். பெருமானருக்குக் (ப்ராமணருக்கு) கொடுத்தது பெருமத்தானம் (ப்ரமதானம்). இன்றைக்கு மங்கலம் என முடியும் ஊர்களில் பெரும்பாலானவை ஒரு காலத்தில் சதுர்வேதி மங்கலங்களே. பெருமானர் அல்லாதாருக்குக் கொடுத்த ஊர்கள் நெல்லூர்>நல்லூரென முடியும். சென்னை வேளச்சேரி ஒரு காலத்துச் சதுர்வேதி மங்கலம். சென்னை அண்ணாநகருக்கு அருகிலுள்ள திருமங்கலமும் அப்படியே. இற்றைச் சோழிங்கநல்லூர் ஒருகாலத்து நெல்லூர்.

அற்றுவிகம் (ஆசிவிகம்), செயினம், புத்தம் போன்ற வேத மறுப்பு சமயங்களைச் சேர்ந்த பள்ளிகளுக்குக் கொடுக்கப்பட்டவை பள்ளிச் சந்தம் எனப்பட்டன. பற்றி (பக்தி) இயக்கத்தின் விளைவாய், வேத மறுப்புச் சமயங்கள் நம்மூரில் குறைந்தபோது அவ்வாலயங்கள் பலவும் சில சிவ, விண்ணவக் கோயில்களாய் மாற்றப்பட்டன. அன்றேல், பள்ளிச்சந்த நிலங்கள் சிவ, விண்ணவக் கோயில்களுக்கு மாற்றியெழுதப் பட்டன. இன்றோ கோயில்களைச் சுற்றியுள்ள இது போன்ற நிலங்கள் பல்வேறு ஊர்ப் பெரியவர்களால் கவர்ந்துகொள்ளப் பட்டுள்ளன. பெரும்பாலானவற்றை அடையாளங் காண்பது சிக்கல்.]

கிராம நத்தம் ஒவ்வொரு கிராமத்திலும் குடியிருப்புப் பயன்பாட்டுகாக ஒதுக்கப்பட்டநிலம். (ஊர்நத்தம் நல்ல தமிழ்ச்சொல். public பயன்பாடின்றி private புழக்கத்திற்கு மட்டுமானது நத்தம். private க்குச் சொல்லைத் தேடி இன்று பலர் அலைகிறார். என்னைக் கேட்டால் நத்தம் பொருத்தமாய் அமையும். தயக்கமின்றிப் பயன்படுத்தலாம்.)

இனாம்தார்: பொதுநோக்கத்துக்காகத் தனது நிலத்தை இலவசமாய் அளித்தவரைக் குறிக்கப் பயன்படுத்துஞ் சொல். (நத்த நிலத்தை இலவயமாய் ஊர்க்கொடைக்குக் கொடுத்தவர். கொடையாளர்.)

விஸ்தீரணம்: நிலத்தின் பரப்பளவு எல்லைகளைக் குறிப்பது. [பலகோணப் பரப்பின் அளவும், பக்கநிலங்கள் யாருக்குச் சொந்தமென்பதும் இச் சொல்லின் பொருள். வியல்தல் = விரிதல்; வியம் = extent. வியத்தீரணம் என்பது சரியான தமிழாக்கம்.]

ஷரத்து: பிரிவு (பிரிவையே வைத்துக்கொள்ளலாம்.)

இலாகா: துறை (துறையையே வைத்துக்கொள்ளலாம்.)

கிரயம்: நிலத்தை ஒருவருக்கு விற்பனை செய்வதை ஆவணப்படுத்தல் (கிறுவுதல், கீறல் என்பவை கல்வெட்டில் பதித்தலைக் குறிக்கும்.. அக் காலத்தில் இது கிறயம் எனப்பட்டது. இன்றுங் கூடச் சிலர் அப்படி எழுதுவார். பொத்தகம் புத்தகமானது போல் மீத்திருத்தமாய் இது கிரயமாகிப் போனது. நல்ல சொல் கிடைக்க வல்லினம் பயன்படுத்தினாற் போதும்.)

இறங்குரிமை: வாரிசுரிமை. (ஒருவரின் வழி வருகிறவர் வாரிசு. நல்ல தமிழே.)

வில்லங்கச் சான்று: ஒரு நிலத்தை ஒருவருக்கு விற்பனை செய்த அதன் உரிமையாளர் அதனை மறைத்து விட்டு, அதே நிலத்தை வேறு ஒருவருக்கு விற்பனை செய்வது மோசடி. இந்த விவரத்தை அறிந்துகொள்ள உதவும் பதிவுத்துறை ஆவணம். (பல்வேறு மோசடிகளை இந்த வில்லாங்கச் சான்றே வெளிக் கொணரும். இப்பொழுது இச்சான்றுகளிலும் மோசடி நடக்கிறது.)   .     .                         
குத்தகை: ஒரு நிலத்தைப் பயன்படுத்தும் உரிமையைச் சில நிபந்தனைகளுடன் அளிப்பது அல்லது பெறுவது.

தாய்ப்பத்திரம்: ஒரு குறிப்பிட்ட நிலம் இப்போதைய உரிமையாளருக்கு முன்னர் யாரிடம் இருந்ததென்பதை அறிய உதவும் முந்தையப் பரிவர்த்தனை ஆவணங்கள். (பத்திரம் = ஏடு, ஆவணம். பரிவர்த்தனை = பரிவட்டனை. வட்டுதல் = கொடுத்து வாங்குதல். cycle of exchange.)

ஏற்றது ஆற்றுதல் = குறித்தவகை பொறுப்பை நிறைவேற்றுவதற்கு உறுதி அளித்தல்.


அனுபவ பாத்தியதை: நிலத்தைப் பயன்படுத்திக் கொள்ளும் உரிமை (அனுபவ பாத்தியதை = நுகர்ச்சிப் பங்கு.)

சுவாதீனம் ஒப்படைப்பு: நிலத்தின் மீதான உரிமையை ஒப்படைத்தல் (சுவாதீனம் = தன்னுமை.)

ஐமாபந்தி = வருவாய்த் தீர்வாயம் (இத் தமிழ்ச்சொல்லையே பயன்படுத்தலாம்.)

நன்செய் நிலம்: அதிகப்பாசன வசதி கொண்ட நிலம் (வசதி = ஏந்து)

புன்செய் நிலம்: பாசனத்தேவைக்கு மழையை நம்பியுள்ள நிலம்

நல்ல தமிழச்சொல்லைப் பயன்படுத்தினால் பதிவு அலுவங்களில் ஏற்பார்களா என்பது கேள்விக்குறி. தமிழ் நாட்டில் தமிழ் அப்படித்தான் இப்போது உள்ளது. ”நல்ல தமிழா? வீசை என்ன விலை?” - என்று கேட்கும் நிலையில் தமிழர் பலரும் உள்ளார். இருந்தாலும் முயல்வோம்.

அன்புடன்,
இராம.கி.     

சிகிச்சையும் வைத்தியமும்

"சிகிச்சையும் வைத்தியமும் தமிழ்ச்சொற்களா?" என்ற கேள்வி ஒருமுறை எழுந்தது. இவை இரண்டும் இருபிறப்பிச் சொற்கள். இவற்றின் வேர் தமிழில் இருந்து பின் வடமொழியில் பழகியிருக்கின்றன. முதலில் சிகிச்சையைப் பார்ப்போம்.

சுல்>சொல் என்பது ஒளியை, மலர்ச்சியைக் குறிக்கும் வேர்ச்சொல். 2006 இல் கொன்றையும் பொன்னுமென்ற தொடரை எழுதினேன். அதன் நாலாம்பகுதியில் [http://valavu.blogspot.in/2006/01/4.html] இவ்வகைச் சொற்கள் வரும். சுல்லில் எழுந்த இருபிறப்பிகள் சுல்>சுல்+த்+த்+அம்= சு(ல்)த்தம்> சுத்தம் என்பதும் சுல்+க்+அம்= சு(ல்)கம்>சுகம் என்பதுமாகும். சுத்தm என்பது தூய்மைப்பொருள் கொள்ளும். சுகம் என்பது நலப்பொருள் கொள்ளும். இரண்டுசொற்களுமே வடமொழியில் புழங்கியவை, ஆனால் தமிழ்வேர் கொண்டவை. சொக்கம்>சொகம்>சுகம் = பொலிவோடு மலர்ச்சியோடு இருக்கும் தன்மை; ”சுகமா இருக்கீங்களா?” என்றால் சோர்வில்லாமல் முகத்தில் ஒளிவிடுவதுபோல் இருக்கிறோமா என்று பொருள். health என்பதற்கு நாம் அச்சொல்லையே புழங்குகிறோம். மேலையர் ”கொழிதா இருக்கீங்களா?” என்று கேட்பார் கொழுது>கொழிது = health = செழிப்பு, நலம், சுகம்.

வித்தை என்பது தொடக்க காலத்தில் வில் வித்தையையே குறித்தது. விலங்கின் அருகே போகாது தொலைவில் இருந்தே அம்புவிட்டு விலங்கை விழுத்தாட்டுவது விலங்காண்டி மாந்தனுக்குப் பெருங்கலையாகத் தெரிந்தது. வில்+த்+தை = வி(ல்)த்தை> வித்தை. பின்னால் இதுபோல எல்லாவித அருங்கலை, அறிவுகள், படிப்புகள், எல்லாங் கற்றவர் வித்தைக் காரன் ஆனர். வித்தை விச்சையென்று பேச்சுவழக்கிற் சொல்லப்படும். சுகவிச்சை என்பது நோய்வாய்ப்பட்டவனை, காயப்பட்டவனைச் சுகப் படுத்தும் கலை. சுகவிச்சை>சிகிச்சை (cikitsaa) ஆயிற்று.

தமிழில் சாயுங்காலம் என்பதை ஒரு சாரார் ”சாய்கிறச்சே” என்று சொல்லி பெயர்ச்சொல் போலவே ஆளுவர். அது இன்னுந் திரிந்து சாய்கிரட்சை> சாயரட்சை>சாயரக்ஷை என்று சங்கத வண்ணம் கொள்ளும். இதுபோல் பல சொற்கள் வடப்பூச்சு பெற்றுள்ளன. நாமும் அவற்றில் மயங்கி அவற்றைச் சங்கதச் சொல்லென்றே சொல்வோம். சுகவிச்சை>சிகிச்சையான கதை இப்படித் தான். எந்தச் சங்கத அகரமுதலியிலும் இதற்கு வேர் கிடையாது. ஆனால் பாகதம், சங்கதத்தில் இது நன்றாகவே புழங்கும். (சாமவிதான பிராமணா, மனுநீதி, யஜ்னவல்க்கீயம், மகாபாரதம் போன்றவற்றில் இது பயன்பட்டிருக்கிறது.) இத்தகைய சொற்களை இரு பிறப்பிகள் என்போம். தோற்றம் இங்கிருக்கும் ஆனால் புழக்கம் அங்கிருக்கும். (நடுச்செண்டர் என்கிறோமே, அதுவும் ஒருவகை இருபிறப்பி தான். பாதி தமிழ், பாதி ஆங்கிலம். புழக்கம் மட்டுமிங்கே. இது போன்ற சொற்களும் பேச்சுத்தமிழில் நிறையவுண்டு.) சிகிச்சையைச் சிலர் “ஸ்பஷ்டமாய்” ஒலிக்கவேண்டும் என்றெண்ணிச் சிகிழ்ச்சை என்பார். குமரிமாவட்டத்தில் இது அதிகம்.

அடுத்தது வைத்தியம். வித்தை போல வில்லில் கிளைத்த இன்னொரு சொல்லுண்டு.. வெளிப்பாட்டுப் பொருளில் அது வரும். செடியில் வெளிப் பட்டுக் காய்ந்து உலர்ந்து விழுந்த பூ ”வீ” எனப்படும். காய்க்குள், பழத்துள் வெளிப்படுவது வில்+த்+து = வித்து. வித்துக்கு விதை என்றும் பெயருண்டு. வித்தை மீண்டும் மண்ணிலிட்டால் (வித்திட்டால் என்றுஞ் சொல்வோம்) செடி, தளிர் போன்றவை வெளிப்படும். வெளிப்படுவதை முளைத்தல் என்றுஞ் சொல்வோம். வித்து என்பது அடிப்படையில் விதையை மட்டுமின்றி மரஞ் செடி போன்றவற்றையும் உணர்த்தும். (அறிவு தொடர்பான வடமொழிச் சொற்கள் இந்த வெளிப்பாட்டுப் பொருளிலேயே வரும். ஆனால் அவர்கள் காட்டும் வேர் பொருந்திவராது. தமிழ்வேரே சரியாகப் பொருந்தும்.)

முல் என்றாலும் வெளிப்படுவது, தோன்றுவது என்று பொருள்கொள்ளலாம். முல்>முள்>முளை என்றும் அச்சொல் திரியும்.முல்>மூல்>மூலிகை என்பது மண்ணிலிருந்து வெளிப்படும் மரஞ்செடிகொடிகள். பல்வேறு மூலிகைகளையே அன்று மருந்தாய்க் கொண்டார். மூலிகை> முலிகைக்கும் ஆங்கில medicine க்கும் தொடர்புண்டு. அதேபோல் முல்> முலுந்து>முருந்து> மருந்து என்பதும் மூலிகையோடு தொடர்புடையது தான். மருந்து கொடுப்பவன் மருத்துவன் ஆவது போல் வித்து கொடுப்பவன் வித்துவன்/வித்தியன் ஆவான். ”வித்தியன்” ”வைத்தியனாக” வடக்கே பலுக்கப்படும். இதுவும் ஓர் இருபிறப்பி. நான் தொடர்ச்சியாகச் சொல்வது இங்கிருந்து அங்கு போயிருக்கிறது. அங்கிருந்து இங்கு வந்திருக்கிறது. இரண்டையும் மறுப்பவன் நானில்லை. ”இந்தையிரோப்பியம் தனி, தமிழியம் தனி” என்று சொல்லி ”தமிழியம் இந்தையிரோப்பியத்திடம் கடன் வாங்கியது, ஒன்றும் தரவில்லை” என்பவரே இதை மறுக்கிறார்.
       
சும்மா பாவாணரைத் திட்டுவதற்கு மாறாகப் பாவாணரையும், அவர்வழி வந்தோரையும் ஆழ்ந்து படித்தால் நான் சொல்லும் மொழிக்குடும்பு உறவு புரியும். இல்லையென்றால் எல்லாமே தலைகீழாகத் தான் தென்படும். ஊதுகிற சங்கை ஊதிவிட்டேன். காதை மூடிக்கொள்கிறவருக்கு நான் ஒன்றுஞ் சொல்லமுடியாது.

வித்துவம் (= மருத்துவம்) என்ற சொல்லின் பொருள்பற்றிச் சிலர் ஐயுறுகிறார். எல்லோருக்கும் தெரிந்த பெயர்பெற்றதொரு சிவநெறிக் கோயிலையும், இன்னொரு விண்ணெறிக் கோயிலையும் அவற்றின் ஊர், இறைவன் பெயர்களையும் வேர்ச்சொல் வழி புரிந்துகொண்டால் ஐயம்வராது. வைத்தீஸ்வரன்கோயிலென இன்று சங்கதம் ஊடாகச் சொல்லப்படும் ஊரின் பழம்பெயர் புள்ளிரிக்கு வேளூர். இதைப் புள்ளிருக்குவேளூர் என்று திரித்துப் புள் (சடாயு)+ இருக்கு (வேதம்)+ வேள் (முருகன்)+ ஊர் (சூரியன்) என்று பிரித்து ஒருகதையைப் பொருந்தப் புகல்ந்து சங்கதத் திருப்பம் நடக்கும். அவ்வூர் இறைவர் பெயர்களுக்கும் இதற்கும் பொருத்தமே இருக்காது. எல்லாம் மூதிகக் கதைகளாய்ச் சொல்லப்படும். இதுபோன்ற மூதிகங்கள் நம்மூரில் பலகோயில்களில் சங்கதத் தாக்கத்தால் சொல்லப்படும். அவற்றை எல்லாம் உண்மையென எண்ணி நாமும் தடுமாறிப் போவோம். இப்பெயர்த் திரிப்பு தேவார மூவர் காலத்திற்கு முன்பே நடந்திருக்கலாம்.

இதற்கு மாறாய் புண்ணின் வேர்ச்சொல் புள்ளாவதால் (புள்ளப்பட்டது புண்) புண்ணாகவே பொருள்கொள்ளலாம். இரித்தல்= நீக்குதல், விலக்குதல்; எனவே புள்ளிரிக்குதல் புண்ணைக் குணப் படுத்தல். என்று பொருளாகும் புள்ளிரிக்கு வேள் என்பவர் புண்ணைக் குணப்படுத்தும் வேள். எனவே பண்டுவர். வினை தீர்த்தான் என்ற இன்னொரு பெயரும் இங்கு இறைவருக்கு உண்டு. உடலுக்கு வந்த வினை தீர்ப்பவர். இன்றும் வினையென்ற சொல்லுக்கு நோய், வலி, கெடுதல் பொருள்கள் கொள்ளப்படுகின்றன. வினைதீர்த்தானென்பது பண்டுவருக்கு இன்னொரு பெயர். நினைவு கொள்ளுங்கள். தானாக ஏற்படும் புண், அறுவையால் ஏற்படும் புண் என இரண்டையும் குணப்படுத்துபவர் பண்டுவராவார். வித்தென்பது முன் சொன்னபடி மூலிகை மருந்து. வித்துவர்= மூலிகை மருத்துவர். வித்தீசர்= மருந்து தரும் ஈசர். வித்தீசரை வித்தீஸ்வர்> வைத்தீஸ்வரெனச் சங்கதத்தில் பலுக்குவார். மீண்டுமதைக் கடன்வாங்கி ’அன்’ ஈற்றைச் சேர்ப்போம். இறைவன் பெயர் வைத்தீஸ்வரனாகும். வினைதீர்த்தான், வித்தீசனோடு புள்ளிரிக்கு வேள் என்பதும் ஏரணத்திற்குப் பொருந்திவரும். எந்த மூதிகத்தையும் நாம் உள்ளே கொண்டு வரவில்லை. மருத்துவரும், பண்டுவரும் ஒரே ஆளாவதுண்டு. இக்காலப் பட்டமும் Medicino Bachelor and Bachelor of Surgery (MBBS) என்றே அமையும்.

இனி விண்ணெறிக் கோயிலுக்கு வருவோம். திருவித்துவகோடு என்பது கேரளத்தில் பட்டம்பியிலிருந்து ஒரு மைல் தொலைவில், பாரதப்புழைக் கரையிலுள்ள ஊர். இதைக் குலசேகர ஆழ்வார் விற்றுவக் கோடென்பார். இங்குள்ள கோயில் 108 தலங்களில் ஒன்றாகும். பெருமாள் பெயர் உய்யவந்த பெருமாள். உய்தல்= உயிர்வாழ்தல். நோய்ப்பட்ட பற்றியாளர் (பக்தியாளர்) சுகமாகி உய்வதற்கு, வந்த பெருமாளென்ற பொருள். நாலாயிரப்பனுவலின் 691 ஆம் பாசுரத்தில், பெருமாள் திருமொழியில்,

வாளால் அறுத்துச் சுடினும் மருத்துவன்பால்
மாளாத காதல்நோ யாளன்போல் மாயத்தால்
மீளத் துயர்தரினும் விற்றுவக்கோட். டம்மா,நீ
ஆளா வுளதருளே பார்ப்பன் அடியேனே

என்ற பாட்டு வரும். ”என்னதான் வலிதரும் அளவிற்கு வாளாலறுத்துச் சுட்டாலும், மருத்துவனிடமிருந்து விலகாத நோயாளன் போல், என்னதான் நீ துன்பந் தந்தாலும் வித்துக்கோட்டு அம்மானே, உன் அருளை விட்டு விலகுவேனோ?” என்பார் ஆழ்வார். பத்துப் பாசுரங்களும் வலி, துன்பம், துயரம் ஆகியவற்றைச் சொல்லி அவற்றிலிருந்து உய்யவந்த பெருமாளை வாழ்த்தும். வித்துவன் என்பது நல்ல தமிழென்று பெருமாள் திருமொழியைப் படித்தாவது புரிந்துகொள்ளலாம்.     

இனி ஆயுள்வேதத்தில் வரும் வேதத்தை 4 வேதங்களோடு தொடர்புறுத்துவதும் தவறே. வித்தம் என்ற சொல்லே இங்கு பேச்சுவழக்கில் வேதமாயிற்று. வித்தம் = மருந்து நூல். வித்தம் தெரிந்தவன் வித்தன். ஆயுள்வித்தன் = ஆயுளுக்கான மருந்து தருகிறவன். சங்கதத்திலும் வைத்தியனென்ற சொல்லுக்கு புலமையாளன், மருத்துவன் என்ற பொருளுண்டு. வேதம் என்ற சொல் வைதீகம் என்று கூட்டுச்சொற்களில் திரியும். சங்கதத்தை மேடாகப் பார்த்துத் தமிழைப் பள்ளமாய்க் கருதுவோர்க்கு இது புரிவது கடினம். எல்லாவற்றையும் வேதமென்பது ஒருவித ஓரப்பார்வையே.

இன்னும் ஓரிiரு செய்திகள் சொல்ல மறந்தேன். பண்டுவம் என்பது பண்ணுதல் என்னும் கைவேலையையொட்டிப் பிறந்தது. மேலை மொழிகளிலும் surgery என்பது கைவேலையை ஒட்டியே பிறந்தது. [surgery (n.) c. 1300, sirgirie, "medical treatment of an operative nature, such as cutting-operations, setting of fractures, etc.," from Old French surgerie, surgeure, contraction of serurgerie, from Late Latin chirurgia "surgery," from Greek kheirourgia, from kheirourgos "working or done by hand," from kheir "hand" (from PIE root *ghes- "the hand") + ergon "work" (from PIE root *werg- "to do"). இதில் வரும் kheir "hand" என்ற கிரேக்கச்சொல் நம் “கையைப்” போல உள்ளதைப் பார்த்து வியக்காதிருக்க முடியாது. தமிழிய மொழிகளுக்கும் இந்தையிரோப்பியத்திற்கும் உறவுண்டெனச் சொன்னால் கவனித்துப் பார்க்கத்தான் இங்கு ஆட்களில்லை. ”கண்ணைமூடிப் பாதை கடந்து விடுவோம்” என்பவருக்கு மேற்கொண்டு என்னசொல்ல?]

எப்படி வித்துவம் வித்தியமாகியதோ  அதுபோற் பண்டுவம் பண்டிதமாகும். சங்கதத்தில் நுழைந்த வித்தியம் வைத்தியமாகி வித்தை தெரிந்தவன் என்றும், மருத்துவனென்றும் எப்படிக் குறித்ததோ, அதே போல் பண்டிதன் என்பது புலவனையும் பண்டுவனையும் சேர்த்தே குறிக்கும். வித்துவானென்ற சொல் ஒருகாலத்தில் தமிழ்புலவர்க்குப் பட்டமாயிருந்தது. அதை ”வட மொழிச் சொல்” எனத் தவறாய் முடிவுகட்டிப் பல தமிழ் ஆர்வலரும் ”புலவர்” என்று பெயர் மாற்றச் சொன்னார். அதுவும் மாறியது. வித்துவான் என்பதை வித்துவன் என்றே வைத்திருக்கலாம். கருணாமிர்த சாகரம் எழுதிய மு. ஆபிரகாம் பண்டிதர், தாழ்த்தப் பட்டோரால் இன்று மீண்டும் கண்டெடுத்துப் போற்றப்படும் அயோத்திதாசப் பண்டிதர் போன்றோர் பண்டிதரென அழைக்கப்பட்டது அவரின் புலமையாலா, மருத்துவப் பின்புலத்தாலா என்பது எனக்குத் தெரியாது. ஆனால் ஆய்வு செய்யவேண்டிய புலம் அது. ”பண்டுவம்/ பண்டிதம் மட்டுமே தமிழ், வித்துவம்/வித்தியம் தமிழில்லை” என்று சிலர் கூற முயல்வது எனக்கு முரணாய்த் தெரிகிறது. வெறும் நம்பிக்கையின் பேரில் ”ஒன்றைத் தமிழில்லை” என்று சொல்ல இப்படி அணியமாவது விந்தையிலும் விந்தை. இதிற் சான்றுகள் வேறு கேட்கிறார். குமுகாயத்தைப் பார்த்தாலே போதுமே? கைப்புண்ணிற்குக் கண்ணாடி எதற்கு?

அன்புடன்,
இராம.கி.   



ஒலிவி (phone)

ஒருமுறை  head phone, ear phone க்கான சொற்களை ஒரு நண்பர் கேட்டிருந்தார்.  அதுவரை யாருந்தொடா ஒலிச்சொல் பற்றிக் கேட்டிருந்தார். நம்மூருக்கு telephone வந்து ஏறத்தாழ 70/80 ஆண்டுகளாகின. அப்போது நடந்த விந்தையைக் கருவிவழிப் புரியாது பேசும்/கேட்கும் வினை வழியே நம்மில் பலரும் புரிந்துகொண்டார். தமிழ்ச்சொல் ஆக்கையில், பேச்சை மட்டுங் கருதிக் கொண்டு, கேட்பதை மறந்து தொலைபேசியென்றே  நாம் சொல்லத் தொடங்கினோம். அதைக் கருவி நோக்கிற் சொல்லவில்லை.

கருவி நுட்பம் அப்போது பலருக்குந் தெரியாது, நுட்பந் தெரிந்தவரும் டெலிபோன் என ஆங்கிலம் பேசிச் சென்றார். தமிழில் இதைச் சொல்ல, நுட்பியல் வளர, கருவிகளை இங்கு செய்ய, அப்போது யாரும் எண்ணியதில்லை. அது பொருளியல் வளர்ச்சி, நுட்பியற் கல்வி அறியாக் காலம். எனவே ’தொலைபேசி’ என்ற பயன்பாட்டுச்சொல்லே பெரிதும் பரவியது. இப்போது நுட்பியற் கல்வியைத் தமிழில் வளர்க்க வேண்டும் எனில், சண்டித்தனஞ் செய்யும் இவை போன்ற கணிசமான, தவறான, சொல்லாக்கங்களை மறுபார்வை செய்ய வேண்டும். (ஆனால் கேட்பதற்குத் தான் ஆட்கள் இல்லை. இராம.கி. வேண்டாத வேலை செய்வதாய்ப் பலரும் எண்ணிக்கொள்கிறார். இன்னும் ஆழமான சொற்கள் நம்மிடம் இல்லாததால் தான் head phone க்கும், ear phone க்கும் நாம் இப்போது அல்லாடுகிறோம். என்னைக் கேட்டால் ஏற்கனவே பழகிவிட்டதென்று சொல்லித் தொலை பேசியை மேலும் தொடருவதில் பயனில்லை. (வழக்கம் போல் என் பரிந்துரை இவ்வம்பலத்தில் எடுபடாது. இருப்பினும் முயல்கிறேன்.)

ஆங்கிலத்தில் phone-ற்கு ஒலியென்றே பெயர். ஆங்கிலத்தில். "elementary sound of a spoken language," 1866, from Greek phone "sound, voice," from PIE root *bha- (2) "to speak, tell, say." என்பார். *bha- (2) "to speak, tell, say." என்ற இந்தையிரோப்பிய வேரில் கிளைத்ததாய்க் கூறுவதை நான் ஏற்றுக்கொள்ளேன். கேட்பதையும் ஆங்கிலத்தில் phone என்று தானே சொல்கிறார்?. பேச்சில் மட்டும் வரையறை இனங் காட்டுவது ஒருபக்கச் சார்பாய் எனக்குத் தெரிகிறது. ஒலியென்பது ஒல்லுங் குறிப்பில் எழுந்தது. ஒல்லல்= ஒசையெழுப்பல். ஓல்>ஒலி= ஓசை. பேசினாலும் ஓசையே, கேட்டாலும் ஓசையே. ஒலி என்பது இரண்டிற்கும் பொதுவானது. நம் ஒலிக்கும் இந்தையிரோப்பிய phone க்கும் தொடர்பு உள்ளதென்றே நான் கருதுவேன். அதையிங்கு வாதாடக் கூடாது. வேறிடத்திற் செய்யவேண்டும். இப்போதைக்கு phone-க்கு ஒலியென்று தமிழில் சொல்கிறோம் என்பது  போதும்.

இற்றை அறிவியலில் அதிர்ச்சி, அலையென்றே ஒலி புரிந்து கொள்ளப் படுகிறது. ஒலிவழி பயன்படுத்தும் சில சொற்களை

phoneme (ஒலியன்),
phonetics (ஒலியெழுகை),
phonics (ஒலிகை),
phonogram (ஒலிக்கிறுவம்),
phonograph (ஒலிக்கிறுவி),
phonolite (ஒலிக்கல்),
phonology (ஒலியியல்),
phonophobia (ஒலிப்பயம்),
phony (வெற்றொலி)

என்று ஒலி வழியே சொல்லலாம். அப்படிச் சொல்வதால் ஒரு குழப்பமும் வராது. இணையான தமிழ்ச் சொற்களைப் பிறைக்குறிக்குள் கொடுத்துள்ளேன். இந்தப் பார்வையில் telephone இல் என்ன நடக்கிறதென்று பார்ப்போம். நாம் பேசுகிறோம். telephone க்குள் ஏதோவொரு உறுப்பு அதிர்கிறது. அந்த அதிர்ச்சி மின்காந்த அலையாக மாற்றப் படுகிறது. பின் நேரடியாகவோ, அன்றேல் வானலையாகவோ அனுப்பப்பட்டு, இன்னொரு பக்கக் கருவியால் வாங்கப்பட்டு மீண்டும் அதிர்ச்சி/ஒலியென மாற்றப் படுகிறது. காதில் ஒலியையுணர்கிறோம். அதாவது நம் ஒலி- அதிர்ச்சி- மின்காந்த/வானலை- அதிர்ச்சி- ஒலி என மாற்றம் பெறுகிறது. நாம் ஒலிக்கிறோம். நம் ஒலியைக் கருவி வாங்கி, இன்னொரு பக்கம் ஒலிவிக்கிறது. எனவே ஒலிக்கவும் ஒலிவிக்கவுஞ் செய்யும் கருவியை ஒலிவி என்றே பொதுவாய்ச் சொல்லலாம். அப்பொழுது மாந்தப்பார்வையில் அன்றி கருவிப்பார்வையில் சொல்லமையும். கேட்கவும் சொல்லவும் சிறிய சொல்.

இனிக் கருவி சார்ந்த சில சொற்களை மட்டும் இங்கு குறித்துள்ளேன். (சில முன்னொட்டுச் சொற்களுக்கு விளக்கஞ் சொல்லவில்லை. அவற்றை விவரங் கேட்டால் சொல்கிறேன்.)

cellphone = சில்லொலிவி;
dictaphone = சொற்றொலிவி;
earphone = காதொலிவி;
electrocardiophone = மின்வழிக் குருதயவொலிவி;
electroencephalophone = மின்வழிக் கவாலவொலிவி;
electrophone = மின்னொலிவி;
encephalophone = கவாலவொலிவி;
gramophone = கிறுவவொலிவி;
handphone = கையொலிவி;
headphone = தலையொலிவி;
holophone = முழுதொலிவி;
kaleidophone = கலைதொலிவி;
linguaphone = மொழியொலிவி;
megaphone = மாகொலிவி;
microphone = நூகொலிவி;
payphone = பணவொலிவி;
picturephone = படவொலிவி;
radiophone = வானலையொலிவி;
saxophone = சாக்சோவொலிவி;
smartphone = சூடிகையொலிவி;
speakerphone = பேச்சொலிவி;
spectrophone = காட்சியொலிவி;
streophone = திசையொலிவி;
telephone = தொலையொலிவி;
videophone = விழியவொலிவி

இதில் கருவி சாராத, -phone என முடியும் வேறு சொற்களைக் குறிக்கவில்லை. இரண்டையும் பொருள்பார்த்துப் புரிந்து அவற்றில் வருவது ஒலியா, ஒலிவியா என்று குறிக்கவேண்டும்.

“தம்பி, அந்த காதொலிவியை எடு; பாட்டைக் கேட்கலாம்.”
”என்னோட சில்லொலிவியை யாரெடுத்தா?  நான் வச்ச இடத்திலே இல்லையே?”
”இந்தத் தொலையொலிவி ரொம்ப நாளா வேலைசெய்யலே? பழுது பார்க்கோணும்.”
:இந்தக் காலத்துலெ, சில்லொலிவி விழியவொலியாயும் இருக்கு”
”அந்தத் திசையொலிவியோடே வெள்ளத்தை (volume) இவ்வளவு கூட்டணுமா? தெரு முழுக்கக் காது கிழிஞ்சிடும்”

இப்படி இயல்பாய்ப் பலவற்றை நல்ல தமிழில் சொல்லலாம். மனம் இருந்தால், வழியுண்டு.

அன்புடன்,
இராம.கி.


.

Sunday, July 12, 2020

தமிழும் ஒருங்குறியும் - 3

இலங்கையின் ”தமிழ் அறிதநுட்பியல் உலகாயம்” (Tami Information Technology International) என்ற நிறுவனம் Zoom வழி நடத்திய இணைய வழி உரையாடலில் நேற்று நான் உரையளித்தேன், இங்கே அதைப் பிரித்து 3 பகுதிகளாய்த் தருகிறேன். இது மூன்றாம் பகுதி. தமிழ்க் கணிமையில் ஆர்வமுள்ளோர் படியுங்கள். நிகழ்ச்சியை ஒருங்கிணைத்த இலங்கை நண்பர்களுக்கும் குறிப்பாக நண்பர் சி.சரவணபவானந்தனுக்கு என் நன்றி. தமிழ்கூறும் நல்லுலகம் இந்நிலை அறிந்துகொள்ளட்டும்.
--------------------------------------

இனித் தமிழ்க் கட்டை தொடர்பாய் நடந்த  மாற்றங்களைப் பார்ப்போம். முதல் மாற்றமாய், 2003 இல் sha எழுத்தை நுழைக்கச் சொல்லி உத்தமம் ஒரு முன்னீடு கொடுத்தது.  இன்றுவரை அவ்வெழுத்தை தமிழ்பேசும் எந் நாட்டிலும் யாருங் கற்றுக் கொடுக்கவில்லை. ஏதோசில மணிப்பவள நூல்களில் அச்சாகியுள்ளது என்று சொல்லி இம்முன்னீடு எழுந்தது. இம் மூன்னீட்டை உத்தமத்தின் பொது உறுப்பினர் யாரும் கவனிக்கவில்லை, மாற்று யோசனை சொல்லவுமில்லை. பொதுமக்களுக்கும் தெரியாது. ஆனாலும் இவ்வெழுத்து தமிழ்க்கட்டைக்குள் குறியேறிவிட்டது. (discuss printed salvation here.)

”sha” (0BB6) விற்கு மாறாய் ”ச”, ”ஷ” என்றடித்து அடிக்குறிப்பில் ”இங்கே ச, ஷ, எழுத்துக்களைப் பயில்கிறோம், ஊற்றாவணத்தில் இப்படி இருந்தது” என்று ஶ படம் போடாது, தேவையற்றுக் குறியேற்றி, என்ன சொல்ல? விந்தை உலகம். முன்னீட்டாளர் கல்வெட்டு நூல்களே படித்ததில்லை போலும். இதே எழுத்து அங்கும் கிரந்தப் பகுதியிலுண்டு. text இல் ஷ எழுதி அடிக் குறிப்பில் ஶ படம் போட்டிருப்பார். அவருக்குத் தெரிந்த தீர்வு உத்தமத்திற்குத் தெரியவில்லை..

SMP இல் போகவேண்டியதை BMP க்குக் கொணர்ந்து,  கந்தர கோளம் பண்ணி, இப்போதென்ன நடக்கிறது தெரியுமோ? ”எழுத்து இருக்கிறதா? பயன்படுத்து” என நாளொரு மேனியாய் பொழுதொரு வண்ணமாய்  ஶ வின் பயன்பாடு கூடிப்போகிறது. கூகுள் கணக்குப்படி இன்று 24,40,000 தடவை பயனாகிறது. தவறான குறியேற்றம் கொடூர மாற்றம் மொழிக்குக் கொணரும். historical எனக் கொணர்ந்து முடிவில் நடப்புக்கு இவ்வெழுத்து வந்தது நமக்கு ஒரு பாடம். 

இரண்டாம் மாற்றம் 2006 இல் நடந்தது. இதற்கும் உத்தமமே தொடக்கம். ”தமிழ் ஓம்” வேண்டும் என்று இம் முன்னீடு எழுந்தது. வழக்கம்போல் யாருங் கண்டு கொள்ள வில்லை. அரிதில் பயன்படும் குறியீடு BMP இலா? என்ன கொடுமை, சரவணா? SMP இல் இருக்கவேண்டியதைக் costly real estate ஆன BMP இல் உட்கார வைத்துக் கந்தர கோளம். இது போன்று பலவும் நடந்துள்ளன.

அடுத்தது நீட்டிக்கப் பட்ட தமிழ் ( extended Tamil). தமிழெழுத்துக்களைக் கொண்டு சங்கதம் எழுதும்படித் தமிழ்க்கட்டையில்  க2, க3, க4 ....... என மேற்குறி (superscript) முறையில் 26 சங்கத எழுத்துக்களை நுழைக்கச் சொல்லி சூலை 2010 இல் முன்னீடு எழுந்தது.  மலேசியாவிலிருந்து முத்தெழிலன் நெடுமாறன், அமெரிக்காவிலிருந்து இராதாகிருஷ்ணன் ஆகியோர், ”சாத்தாரமாய் இருக்கும் superscript, subscript வைத்தே இதைச் செய்யலாமே? இதற்கு எதற்கு தனியாகக் குறிப்புள்ளிகள்?” - என்று கேள்வி கேட்டார். இதற்கப்புறம் இம்முயற்சி நின்றது.

எனிலும் கிரந்த முயற்சி நிற்கவில்லை. தமிழ்க் கல்வெட்டுகளின் orthographic principle அறியாதவர் தூண்டுதலால் இந்திய அரசை நகர்த்தி அகுதோபர் 2010 இல் கிரந்தக் கட்டைக்குள் 7 தமிழ்ச் சிறப்புக் குறியீடுகளைச் சேர்க்கும்படி முன்னீடு போனது. கிரந்தம் என்பது தமிழகத்தில் எழுந்த நம் எழுத்துத் தான். ஆனால் அது சங்கதம் எழுதப் பிறந்த எழுத்து. அதற்குள் தமிழெழுதும் தேவை யென்ன? தமிழகத்தில் அரசியலெதிர்ப்பு வலுத்தது. அரசியலார் உள் நுழைந்தார் நவ 2010 இல் முதல்வர் கலைஞரே ”ஒருங்குறிச் சேர்த்தியத்திற்கு மடல் எழுதி ஆலோசனைக் குழு ஒன்று இதை ஆய்வு செய்யவேண்டும் அதுவரை நிறுத்தி வையுங்கள்” என்றார்.  சனவரி 2011 இல் உத்தமம் ஒருங்குறிச் சேர்த்தியத்திற்கு மடலெழுதியது. “கிரந்தக் கட்டைக்குள் 7 குறிகளை நுழைப்பதில் உள்ள சிக்கல்களை” நீதிபதி மோகன் தலைமையிலான ஆலோசனைக் குழுவிற்குப் பல ஆர்வலரும் விரிவாய்க் கூறினார். ஆலோசனைக் குழு தீவிரமாய் உரையாடித் தன் பரிந்துரையைத் தமிழக அரசிடம் சொன்னது. தமிழக அரசு, இந்திய அரசை வேண்டிக் கொண்டது. இப் பரிந்துரையின் பேரில், மே 2010 இல் இந்திய அரசே தன் முன்னீட்டைத் திரும்பப் பெற்றுக்கொண்டது.



அடுத்தது பின்ன, சின்னங்களுக்கான குறியேற்றம். சூலை 2012 இல் இம் முன்னீடு திரு இரமண சர்மாவிடமிருந்து போனது. ஆர்வலரான அவர் தனக்குக் கிடைத்த விவரங்களைக் கொண்டே வைத்தார். எல்லா மறு பார்வைக்கும் அவர் அணியமாகவே இருந்தார். இக்குறியேற்றம் இற்றைத் தமிழுக்குத் தேவை இல்லைதான். ஆயினும் வரலாற்று வரிதியான முன்னீடு. நம் இலக்கியங்களை ஏற்கனவே ஒருங்குறி உதவியில் மின்னேற்றியது போல் 60000/70000 தமிழ்க் கல்வெட்டுக்களையும் மின்னேறுவது கட்டாயம் ஓர் ஆய்வுத் தேவை. அதற்குப் பின்ன, சின்னக் குறியிடு தேவை. அவ்வகையில் திரு.சர்மாவைப் பாராட்ட வேண்டும். ஆனால், இதைச் சரியாகச் செய்ய யாரோடு கலந்தாய வேண்டும் என உள்ளதல்லவா? கல்வெட்டியலார், வரலாற்றாளர், தமிழறிஞர் ஆகியோர் அல்லவா இதில் முகன்மை? அவரைவிடுத்து 4 IT enthusiasts தம்முள் கலந்தாடிச் செய்தால் சரி வருமா? “இதனை இதனால் இவன் முடிக்கும் என்று ஆய்ந்து. அதனை அவன்கண் விடல்” என்று தானே வள்ளுவன் சொன்னான்?


துறை வல்லுநரைக் கலக்காது செய்தது தவறென்று சொல்லி, கூட்டத்திற்கு ஏற்பாடு செய்ய உத்தமத்தில் வலியுறுத்தியும் அதைச் செய்யாது, நாள்கடத்தி spelling, பெயர் வேறுபாடு, transliteration என்று திசை திருப்பி 2 ஆண்டுகளை கடத்தியது கண்டு மனங்குன்றி, சில தனி ஆர்வலர் (குறிப்பாக, ஆல்பர்ட் பெர்னாண்டோ, இர.வாசுதேவன், இரா. சுகுமாரன், நாக. இளங்கோவனோடு அடியேன்) முயன்று ஏராளம் முயற்சிகள் எடுத்து, அழுத்தங்கள் கொடுத்து, தமிழக அரசின் வழியாக 2014 இல் ஓர் ஆலோசனைக் கூட்டத்திற்கு ஏற்பாடு செய்தோம். 2015 சூலையில் ஒருங்குறிச் சேர்த்தியத்திடம் தமிழக அரசு மறுப்புக் கொடுத்து, பின் இந்திய அரசும் நம்மோடு சேர்ந்து மறுப்புக் கொடுத்தது.

இதன்பின், துறைவல்லுநர் சார்ந்த ஆலோசனைக் குழு ஏற்படுத்தி, 2 ஆண்டு அலைச்சலில் கல்வெட்டு ஆவணங்களுக்குள் புகுந்து ஒவ்வொரு குறியீடாய்ச் சரிபார்த்து, தேவையான estempageகளைப் படியெடுத்தால், முன்னீட்டின் 55 குறியீடுகளில் 33 பிழையிருப்பது புரிந்தது. திரு. இரமண சர்மாவை அழைத்துச் சொன்னபோது, அவரும் எம்முடன் கூடவந்து இப்பணியில் மகிழ்வோடு கலந்து கொண்டார். எல்லோருமாய்ச் சேர்ந்து 51 குறியீடுகளை இறுதிசெய்து, 2017 இல் தமிழக அரசின் வழி,  Finalized proposal to encode Tamil fractions and symbols கொடுத்தோம். இதன்வழி, 51 குறியீடுகள் SMP இல் ஏற்றப்பட்டன. .துறை வல்லுநருடன் சேர்ந்து எளிதில் முடிந்திருக்க் கூடியதை  ஒற்றுமையின்றி இனி இழுத்தடிக்கக் கூடாது என்பதே இதில் நாம் கற்ற பாடம்.

இதன்பின், வெவ்வேறு ஒருங்குறி விதயங்களைச் சரிவரச் செய்யும் முகத்தான், தமிழக அரசே ஆண்டிற்கு 12000/14000 வெள்ளிகள் கொடுத்து 2015 சூலையில் ஒருங்குறிச் சேர்த்தியத்தில் இணை உறுப்பினர் (Institutional Voting Member) ஆனது.

இதற்கடுத்து 2015 அகுதோபரில் மார்ட்டின் ஹோஸ்கென் என்பார் படகருக்காக நுக்தா முன்னீட்டைக் கொடுத்தார். வல்லின எழுத்துகளுக்கு அதிரொலி தரும் வகையில் ஒரு அடிப்புள்ளி (underdot) கேட்டிருந்தார். ”இந்த அடிப்புள்ளியை இப்போதுள்ள பொது அடிப்புள்ளி வைத்தே பெறலாமே? ஏன் தனிக் குறிப்புள்ளி?” என்று கேட்டு சனவரி 2016 இல் மறுப்பு மடல் ஒன்றைத் திரு. நாக. இளங்கோவனும் நானும் எழுதினோம். தமிழக அரசின் சார்பாக தமிழ் இணையக் கல்விக் கழகம் இதை ஏற்றுக் கொண்டது.

அடுத்து மார்ச்சு 2017  இல் அன்சுமான் பாண்டே என்பார் வட்டெழுத்திற்காக preliminary proposal கொடுத்தார். கல்வெட்டியலாரைக் கலந்ததில் ”வடிவத்திலும் கருத்தீட்டிலும்” பிழைகள் இருந்தது கண்டு, ”முன்னீட்டை” நிறுத்திவைக்கச் சொல்லி தமிழ் இணையக் கல்விக் கழகத்திடமிருந்து மடல் சென்றது. இதற்கான மறு முன்னீடு த.இ.க.வில் நிபுணர்களக் கொண்டு இப்போது நடக்கிறது. கூடிய விரைவில் இம் முன்னீடு செல்லும்.   

அண்மையில்   ஏப்ரல் 2020 இல் தமிழ் ற, ழ வைத் தெலுங்குக் கட்டையில் நுழைக்க முயற்சி நடந்தது. ஏற்கனவே றகரத்திற்கும் ழகரத்திற்கும் ஆன தெலுங்குக் குறியிடுண்டு. தவிர, தமிழ்க் குறியீடுகளை நுழைக்காமலே தமிழ் எழுத்தை தெலுங்கு உயிர்மெய்க் குறியீடுகளுடன்  சேர்த்து ஆவணம் படைக்க முடியும். ”பின் ஏன் இக்குறியேற்றம்? வெறுமே Script extension இல் சேர்த்தால் பற்றாதா?” என மறுகேள்வி கேட்டு சூன் 2020 இல் தமிழ்நாட்டரசு அனுப்பியது.

மேலே நான்சொன்ன இத்தனை முயற்சிகளையும் பார்த்தால், தமிழ்க் கட்டைக்குள் உள்ள வெற்றிடங்களை நிரப்பி வட இந்திய மொழிகள் போல் தமிழை ஆக்க எவ்வளவு முயற்சிகள் நடக்கின்றன என்பது உங்களுக்கு விளங்கும். இதுபோல், 7 சிறப்புத் தமிழெழுத்துகளை வேறு எழுத்து வரிசையுள் கொண்டுபோகவும் முயற்சிகள் நடக்கின்றன, இனியும் நடக்கும். superset கருத்தீடு அவ்வளவு பெரியது. விடாது முயல்வர். தொடர்ந்து தடுக்கவேண்டும்.

ஆனால் வெறும் கூச்சலால் அல்ல. போராட்டத்தால் அல்ல. ஆழ்ந்த சிந்தனையால், இடைவிடாத ஊக்கத்தால், கூர்த்த மதியால் இதைச் செய்ய வேண்டும். நாம் மற்ற மொழியினருக்கு எதிரிகள் அல்லர் நம் மொழியை, நம் எழுத்தைப் பாதுகாக்கிறோம். அவ்வளவுதான். தமிழக அரசு, (எந்தக் கட்சி ஆண்டாலும் சரி) நமக்கு உதவியாகவே உள்ளது. இந்திய அரசும் நம்மைத் தடை செய்யவில்லை. அதன் TDIL = Technology Development for Indian Languages நிறுவனம் நாம் கேட்கும் உதவிகளைச் செய்ய என்றும் அணியமாகவே உள்ளது. ஆர்வலர்கள் தாம் முன்வர வேண்டும்.

அகவைகூடிய முதியோரே இனியும் ஒருங்குறி வேலையைச் செய்து கொண்டிருக்க முடியாது. இளைஞர், நடுவயதினர் எனப் பலரும் முன்வர வேண்டும். தமிழ்க்கணிமையில் நான் குறைந்த ஆட்களையே காண்கிறேன். விரல் விட்டு எண்ணலாம் போலும். வெறுமே அரட்டை அடிக்க முகநூல் பக்கம் வருவோரே அதிகமிருக்கிறார்.  உருப்படியான பணிசெய்ய ஆட்களைக்  காணோம். செய்ய வேண்டிய பணிகள் நம்முன் மிகுந்துள்ளன.

1. வட்டெழுத்து வேலை முடிக்கவேண்டும்.
2. கிரந்தத்திற்குத் தனிக்கட்டை வந்துவிட்டதால், ஒரே ஆவணத்தில் input driver மூலம் 2 எழுத்துக்களையும் கையாளலாம். எனவே ஶ, ஷ, ஸ, ஹ ஆகியவற்றை மதிப்பிழக்கச் (deprecate) செய்யவேண்டும். நுட்பியல் பார்வையில் நாம் கேட்பது ஞாயமானது. பெரும்பாலும் சேர்த்தியம் ஒப்புக்கொள்ளும்..
3. அளபெடைக்கான joiner குறியீடு வாங்க வேண்டும்.
4. குற்றியலுகரம், குற்றியலிகரத்திற்கான சந்திர பிந்து வாங்கவேண்டும். (குமரி மாவட்ட வழக்கம்.)
5. இன்னும் விட்டுப்போன பின்ன, சின்னங்களைத் தேடி அவற்றை SMP இல் குறியேற்ற வேண்டும்.
6. இசைக்குறிகள் , தாளக்குறிகள், வேறு கலைக் குறிகள் - SMP.
7. Translieration/ Transcription க்கான முயற்சிகள். இதைக் குறியேற்றத்தில் செய்யாது வேறு வழிகள் உண்டா என்று பார்க்கவேண்டும். (Discuss)

நம் இலங்கை நண்பர்களுக்கு,  உங்களுடைய நாட்டில் University of Colombo School of Computing - Language Technology Research Laboratory ஒரு laison member ஆய் உள்ளது. அவர்களோடு  தொடர்பு கொள்க. நீங்களும் laison member ஆக வழி தேடுங்கள். மேலே சொன்ன 7 வேலைகளில் நீங்களும் சிலவற்றைச் செய்யலாம்.

இரு நாட்டின் ஆர்வலர்க்குப் பொதுவாய்ச் சொல்வது ஒருங்குறிச் சேர்த்தியச் செய்திகளை வாரத்திற்கு ஒருமுறை பாருங்கள். அவர் ஆவணங்களைப்  படியுங்கள்  அவர் document register ஐத் தொடர்ந்து அவதானியுங்கள். தெலுங்கு, கன்னடம், மலையாளம், சிங்களம் போன்ற மொழிகளில் என்ன நடக்கிறது என்று கவனங் கொள்ளுங்கள். மற்ற Brahmi derived scripts மேலும் ஒரு மேலோட்டப் பார்வை இருக்கட்டும். எங்கிருந்து எது வரும் என்று சொல்வது கடினம்.

அன்புடன்,
இராம.கி.         .     


தமிழும் ஒருங்குறியும் - 2

இலங்கையின் ”தமிழ் அறிதநுட்பியல் உலகாயம்” (Tami Information Technology International) என்ற நிறுவனம் Zoom வழி நடத்திய இணைய வழி உரையாடலில் நேற்று நான் உரையளித்தேன், இங்கே அதைப் பிரித்து 3 பகுதிகளாய்த் தருகிறேன். இது இரண்டாம் பகுதி. தமிழ்க் கணிமையில் ஆர்வமுள்ளோர் படியுங்கள். நிகழ்ச்சியை ஒருங்கிணைத்த இலங்கை நண்பர்களுக்கும் குறிப்பாக நண்பர் சி.சரவணபவானந்தனுக்கு என் நன்றி. தமிழ்கூறும் நல்லுலகம் இந்நிலை அறிந்துகொள்ளட்டும்.

-----------------------------------------
இனி வரலாற்றுள் போவோம். 1983 இல் GOI இன் DOE துறை, Centre for Development of Advanced Computing (CDAC) இன் மூலம் Indian Script Code for Information Interchange (ISCII) குறியீட்டை உருவாக்கினார். இது 1986-88 இல் ஆய்விற்கு உட்பட்டு, 1991 இல், Bureau of Indian Standards, ISCII ஐ ஏற்றுக் கொண்டது,  இச் செந்தர ஆவணம் ( ISCII document) BIS அலுவங்களில் IS13194:1991 என்று கேட்டால் கிடைக்கும்.

இதேபோது 1983 இல் ஈழப் போராட்டம் பெரிதானது. தமிழ்ப் போராளிகளுக்கும் இலங்கை அரசிற்கும் சண்டைகள் வலுத்தன. பல தமிழ்க் குடும்பங்கள்  இடம் பெயர்ந்தன. அப்பா ஓரிடம், அம்மா ஓரிடம், பிள்ளைகள் வேறிடம் எனச் சிதறின. அழிவைச் சந்திக்கையில், துன்பம் தாண்டிவர, பல்வேறு முயற்சிகள்  மேற்கொள்வார் தானே?  தேவைகளுக்குத் தீர்வும் எழும். இங்கு, மின்னஞ்சல் தேவை எழுந்தது. ஈழத்தமிழரோடு சேர்ந்து உலகத்தமிழர் TSCII எனும் தீர்வு கண்டார். ISCII இன் பார்வைக்கு மாறாய் இது உருவானது. 2007 இல் IANA வில் பதியப்பட்டது. இப்படிப் பதிவான ஒரே இந்திய எழுத்துச் செந்தரம் இதுவே.

இனி ISCII க்கு வருவோம். வட எழுத்துகளில் ஒரு வடிவம் ஓரொலி என்பது அடிப்படை. தமிழெழுத்திலோ ஓரெழுத்து பல ஒலிகள். 1 ககரம், 3 ஒலிகள். எவ்வொலி எங்கு வருமென விதிகள் உண்டு. விதிகள் பழகாது,  சங்கத மூளைச் சலவையால் குழம்புவாரும் நம்மிலுண்டு. தேவநகரியை அடிப்படையாக்கி, அதிலில்லா மற்ற எழுத்துக்கள் (காட்டாகத் தமிழின் எ, ஒ, ஒன்றைக் கொம்பு, ஒற்றைக் கொம்புக் கால்,  ற, ன, ழ) ஆகியவற்றையும் சேர்த்து  ஒரு superset உருவாக்கி ISCII யைக் குறியேற்றம் செய்தார். அதாவது ஒரே அடைப்பலகையில் (template) எங்கெலாம் தமிழெழுத்து இல்லையோ, அங்கெலாம் வெற்றிடம். ஒருங்குறிப்படம். ISCII இதன் அடிப்படை).  எனவே வருக்க எழுத்துக்களை வெற்றிடங்களில் நிரப்பி, வடபுல மொழிகள் போல் ஆக்கத் தொடர்முயற்சிகள் நடந்தன, நடக்கின்றன. இனியும் நடக்கும்.

இரண்டுமே 8 மடைக் குறியேற்றமாயினும், ISCIIக்கும் TSCII க்கும் அடிப்படை அடவு வேறாகும். 1991 இல் உருவான ISCII 12 ஆண்டுகள் பயன்பாட்டிற்கே வராது, சிலரின் மேசைப்பேழைகளில் தூங்கியது. TSCII யோ மின்னஞ்சல்களில், இணையத்தில், அச்சாவணங்களில் புகுந்து விளையாடத் தொடங்கியது. இதைச் செந்தரமாய்க் கொள்ளாது,  சிச்சிறு மாற்றங்கள் செய்து 1000 தமிழ் அடவுகள் தமிழ்கூறும் நல்லுலகில் எழத்தொடங்கின. ஈழத்தமிழரிடை  பெரிதும் புழங்கிய பாமினியும் அதிலொன்று. யாரும் எதையும் ஒப்பிச் செந்தரத்திற்கு வரவில்லை. (இதுவே தமிழரின் சிக்கல். எப்போதும் ஒற்றுமை குறைவு, ”இன்னொரு தமிழன் சொல்லி நானென்ன கேட்பது?” எனும் அகங்காரம், 1997-2010 வரை வெவ்வேறு இணையப் பக்கங்கள் படிக்க, வெவ்வேறு குறியேற்றங்கள் தேவைப்பட்டன.

அந்தவகையில் தான் ஒருங்குறியை நெடுநாள் மறுத்து அதன் போதாமையைச் சொன்ன என்போன்றோர் ஒருங்குறிக்குக் குரல்கொடுக்க முன்வர வேண்டியது ஆயிற்று. ஒருங்குறிக்கு வந்தாலாவது ஓராயிரம் தமிழ் தொலையுமே? வேறு உருப்படியான வேலை செய்யலாமே? You see, progress is always in the art of possible.
   
இந்நிலையில்  ஒருங்குறிச் சேர்த்தியம், GOI ஐத் தொடர்புகொண்டது.  8 மடைக் குறியேற்றமான ISCIIயை CDAC அப்படியே அனுப்பிவைத்தது. எந்தப் புது அடவும் செய்யாது 1991 இல் ISCII அடிப்படையில் ஒருங்குறிச் சேர்த்தியம் 16 மடைக் குறியேற்றம் உருவாக்கி வெள்ளோட்டம் விட்டது. 10 ஆண்டுகள் இந்தியாவில் இருந்து யாரும் இதற்கு மாற்றங்கள் பரிந்துரைக்கவில்லை. தமிழகத்திலும் தூங்கினோம். TSCII Vs TAB/TAM சண்டையே நமக்குப் பெரிதாகத் தெரிந்தது.  அப்போதே விழித்திருந்தால், அனைத்தெழுத்துக் குறியேற்றத்திற்கு (TACE) வழி செய்திருக்கலாம்.  இப்போது கடினம். We are struck with 128 code point Unicode block.

TACE பற்றிச் சிறிது சொல்லி, ஒருங்குறிக்கு வருகிறேன். ”முதலெழுத்துகளைக் குறியேற்றவேண்டுமா? அசையெழுத்துகளைக் குறியேற்ற வேண்டுமா?” என்பது ஆழமான சிக்கல். ஒருங்குறி செய்வது முதலெழுத்துக்கும் கீழே. அதாவது  உயிர், அகரமேறிய மெய், உயிர்மெய்க் குறியீடுகளைக் கணிக்குள் அனுப்பி rendering engine ஆல் உயிர்க்குறியீடுகளை ஒட்டித் திரையில் காட்டுவோம். இதைச் செய்வதில் சில கும்பணிகள் தவிரப் பல கும்பணிகள் தொடக்கத்தில் குழம்பின. நாம் சரியாக அடித்தனுப்பினும், பெறுபவர் பக்கம் எழுத்துக்கள் உடைந்து தெரியும். இப்போது 2,3 ஆண்டுகளாய் எழுத்துகள் உடைவதில்லை.

1991 இல் நாம் தூங்காது முயன்று, 247+87 = 334 குறிப்புள்ளிகள் கிட்டியிருந்தால், உயிர், மெய், உயிர் மெய் எல்லாவற்றிற்கும் இடம் வந்திருக்கும். rendering engine பணியுங் குறைந்திருக்கும். ஓர் எழுத்துக்கு 2 byte தேவைப்பட்டிருக்காது. 1 byte ஏ போதும். ”I will come tomorrow” என்பதற்காகும் செலவு போல் 2 மடங்கு “நான் நாளை வருவேன்” என்பதற்குக் கொடுக்கிறோம். எண்ணிப் பாருங்கள். எழுத்து விரவிய ஒவ்வோர் ஆவணத்துக்கும், எவ்வளவு காசு கொடுத்திருப்போம்?  Airtel ஓ, Jio வோ, வேறெதோ கும்பணிகளோ, தரவுகளின் பருமன் பொறுத்தே காசு வாங்குகின்றன. இதுபோக இன்னும் சில எளிமைகளை இழந்தோம். ஒலியியல் அலசல், உருபனியல் அலசல், search and replace, indexing எனப் பலவும் கடுமையாகின. மொத்தத்தில் சோம்பேறித் தனத்தால், தமிழ்க் குறியேற்றம் காலகாலத்திற்கும்  2 ஆம் நிலைக்கு வந்தது. இனி மாற்ற முடியாது. நாம் TACE பெறமுடியாது போனது பேரிழப்பு.  உள்ளூர்ச் சண்டை போடுவதில் மூழ்கிய நாம் உலகத்தேவை மறந்தோம். தேவையின் ஞாயத்தை பின்னால் உணர்ந்த ஒருங்குறிச் சேர்த்தியம், ”ஏன் முன்பே 1990 களில் வரவில்லை? இப்போது BMP இல் இடமில்லை. நீங்கள் தூங்கினீர்களா?” என்று கேட்டது.

இங்கே ஒருங்குறிச் சேர்த்தியம் பற்றி ஒன்று சொல்லவேண்டும். வணிக நோக்கில் எழுந்த நிறுவனமாகினும் செலுத்த அடிப்படையில் (process based) இயங்கும் நிறுவனம். அதற்கெனச் சட்ட திட்டங்கள் உள்ளன. அவற்றை மீறி தான்தோன்றியாய் எதுவும் செய்வதில்லை. அது பரிந்துரை நிறுவனம் மட்டுமே. ISO தான் செந்தரங்களுக்கு ஒப்புதல் தருகிறது. அதை அடைய 7,8 படிநிலைகள் உள்ளன. எந்த இடத்திலும் மறுப்புச் சொல்வோர் புகுந்து சொல்லலாம். மறுப்புச் சொல்வோருக்கு முழு மதிப்புண்டு. தனி மாந்தர், நுட்ப அடிப்படையில் மறுப்புக் கொடுத்தால் ஏற்றுக்கொள்கிறார். வெறுமே உணர்ச்சி வயமாய் எதிர்ப்பவரை மட்டுமே அவர் கண்டு கொள்வதில்லை.

அதே போது மேற்சொன்ன நிறைகளோடு, குறைகளும் உண்டு. Any Tom, Dick and Harry can give a proposal. தொடர்பே இல்லாத எதைப் பற்றி வேண்டுமானாலும் கொடுக்கலாம். அச்சாதாரம் இருந்தால் போதும். ஆங்கிலத்தில் சொன்னால் printed salvation. இது நம்மூரில் பெரும் வசதி. கீழே விளக்குகிறேன்.     

2009 இல் அரசாணை இட்ட தமிழ்நாட்டரசும் கூட ஒருங்குறி, TACE ஐக் கண்டு கொள்ளவில்லை. இன்னும் வானவில் எனும் தனியார் குறியேற்றம் அரசு அலுவங்களில் கோலோச்சுகிறது. பாதி அலுவங்களில் ஒருங்குறி புழங்குமா? தெரியாது. TACE இல் எல்லா அரசாவணங்களும் சேமிக்கவேண்டும் என்றார். சேமித்தது போல் தெரியவில்லை.  ”நீங்கள் சேமித்த கணிசமான பக்கங்களைக் காண்பியுங்கள், உங்கள் TACE இற்கு வகைசெய்வோம்” என்றார் ஒருங்குறிச் சேர்த்தியத்தார். நாம் ஒரு பணியும் செய்யவில்லை. தமிழக அரசோ இன்னும் நீதிமன்றங்களில் ”English documents are the legal documents” என்கிறது. தமிழ் நமக்கு உப்புக்குச் சப்பாணி. ”தமில் வால்க” கூப்பாடு போட மட்டுமே அது உள்ளது. தமிழின்றித் தமிழ்நாட்டில் வாழ்ந்துவிடலாம். நம்மூரில் விற்கும் எந்த electronic கருவியும் Tamil enabled ஆகவில்லை. பெறுதிச் சீட்டுகள் (receipts) தமிழிலில்லை. பட்ட ஏட்டுச் சுருக்கங்கள் தமிழ் மொழிபெயர்ப்பிலில்லை. வட்டாட்சியர் அலுவங்களில்  தமிழில் பேசினால், “தள்ளி உட்காரு” என்கிறார். தமிழுக்கே மதிப்பில்லை எனில், அப்புறம் ஒருங்குறி பற்றிப் பேசிப் பலனென்ன?   

ஆனாலும் ”தமிழும் ஒருங்குறியும்” பற்றிப் பேசவேண்டும். சௌராட்டிரா, படகா மொழிகளுக்கும், இந்தியா, இலங்கை, சிங்கப்பூர். மலேசியா நாடுகளுக்கும் தமிழ் ஒருங்குறிக் கட்டம் பயன்படுகிறது,  இதில் U+0B80 முதல் U+0BFF வரை 128 குறியீடுகள் கொள்ளும். சில குறிப்புள்ளிகள் இன்னும் வெற்றாய் உள்ளன https://en.wikipedia.org/wiki/Tamil_(Unicode_block) என்ற கட்டுரையைப் படியுங்கள்.

அன்புடன்,

இராம.கி.

தமிழும் ஒருங்குறியும் - 1

இலங்கையின் ”தமிழ் அறிதநுட்பியல் உலகாயம்” (Tami Information Technology International) என்ற நிறுவனம் Zoom வழி நடத்திய இணைய வழி உரையாடலில் நேற்று நான் உரையளித்தேன், இங்கே அதைப் பிரித்து 3 பகுதிகளாய்த் தருகிறேன். இது முதற்பகுதி. தமிழ்க் கணிமையில் ஆர்வமுள்ளோர் படியுங்கள். நிகழ்ச்சியை ஒருங்கிணைத்த இலங்கை நண்பர்களுக்கும் குறிப்பாக நண்பர் சி.சரவணபவானந்தனுக்கு என் நன்றி. தமிழ்கூறும் நல்லுலகம் இந்நிலை அறிந்துகொள்ளட்டும்.
--------------------------------------------------

கூடியிருக்கும் அனைவருக்கும் வணக்கம். பேசுபொருள் பெரிது. குறுகிய நேரத்தில் எவ்வளவு முடியுமோ? தெரியவில்லை. சில குறிப்புகள் மட்டும் தருகிறேன். என் வலைத்தளத்தில்  உள்ளவற்றை அங்கு சென்று படியுங்கள் இனித் தலைப்பிற்கு வருவோம். 

அலுவங்களில் தட்டச்சி (typewriter) பார்த்திருப்பீர்களே? ஒரு பொத்தானை அழுத்தின், இணைக்கம்பி எழுந்து சுத்தியலில் வடித்த எழுத்தை, மைப்பட்டை வழி, தாளில் தட்டும்  வெவ்வேறு பொத்தான்கள் வெவ்வேறு எழுத்துகள். 1960-70 களில் தொலைவரி (telex), தொலையச்சி (teleprinter) வந்தன, ஓரூரில் தட்டச்சிப் (typewriter) பொத்தான்களைத் தட்டினால், இன்னோரூரில் அச்சு ஆகும். இக்கருவி செய்ய Bell labs பெரிதும் முயன்றது. American National Standards Institute or ANSI உம் சேர்ந்துகொண்டது. முடிவில்  1960 அகுதோபரில் IEEE ஆதரவில் தொலைவரிக் குறிகளாலான (telegraph code) 128 = 2^7 characters (code points) கொண்ட American Standard Code for Information Interchange-ASCII வெளிவந்தது.   

52 இலத்தின் எழுத்துகள், 43 பொது எழுத்துக் (common script) குறியீடுகள்,  33 ASCII special characters ஆக மொத்தம் 2^7 = 128.  ஆங்கில மொழி வெளிப்படுத்த ASCII வகை செய்தது. பிரஞ்சு, இசுப்பானியம், இத்தாலியம், செருமன், தேனிசு, டச்சு போல் மேற்கிரோப்பிய மொழிகளுக்காக,  Extended ASCII (256 characters) எழுந்தது.  அடுத்து, செமிட்டிக், இந்திக், சீனம் போல் பல எழுத்துகள் வெளியிட ஒருங்குறிச் சேர்த்தியம் உருவானது. இது  ஒரு non-profit corporation devoted to developing, maintaining, and promoting software internationalization standards and data which specifies the representation of text in all modern software products and standards.

இதில் வாக்கிடும் உறுப்பினர், computer software and hardware companies with an interest in text-processing standards. Full members: Adobe, Apple, Facebook, Google, Huawei, IBM, Microsoft போன்றோர். Institutional members: GOBD, GOI, GoTN, U.of Cal, Berkeley; அடுத்து வாக்கிட உரிமையிலா, பரிந்துரை செய்வோர்.: Associate members: Amazon, Oracle, Twitter, போன்றோர். Laison members: INFITT, University of Colombo School of Computing - Language Technology Research Laboratory; Individual Lifetime member: Alumni: ordinary members.

ஒருங்குறிச் சேர்த்தியம் தொடங்கையில் அடித்தளப் பன்மொழிப் பலகையில் ( Basic Multilingual Plane-BMP) 2^16 = 65,536 குறியீடுகள் இருந்தன. சுழிப் பலகை ( Plane 0) போல்  ஒரு பலகைக்கு 65,536 குறியீடுகள் மேனி 11,14,112 குறியீடுகள் கொள்ளும்படி 17 பலகைகளுண்டு. version 13.0 இன் படி, 12.91% இடமளித்தாகி விட்டது. இதுவரை  154 முகன எழுத்துவரிசைகளும், வரலாற்று எழுத்துகளும்,  பல்வேறு பொளித்(symbol)தொகுதிகளுமாக 1,43,859 குறியீடுகள் இடம் பெற்றன.

தமிழெழுத்திற்கு வருவோம்.  தொல்லியலின் படி தெற்காசியாவின் ஆகப் பழ எழுத்து தமிழியே. ( பொருந்தல், கொடுமணல், கீழடி வழி இதன்  காலம் கி.மு. 500/ 600. இதற்கு நெருங்கி, தமிழி/பெருமி கலந்து அநுராதபுரத்தில் பாகத எழுத்து உண்டு. அசோகரெழுத்து இதன்பின்னரே.) பழ எழுத்துகளில் 6 வகையுண்டு.


இவற்றை ”தொல்காப்பியமும் குறியேற்றங்களும்” தொடர் 6 ஆம் பகுதியில்  (http://valavu.blogspot.com/2006/11/6.html) ஒரு படத்தொகுதியால் விளக்கினேன் இதன் 5-ஆம் பகுதியில் (http://valavu.blogspot.com/2006/11/5.html)  பழம் எழுத்து முறைகளைச் சொன்னேன். இவை அடுத்தடுத்து வந்தவை  எனச் சிலரும், சமகாலமென வேறுசிலருங் கூறுவர். ’அடுத்தடுத்து’ என்பதை வைத்துத் தொல்காப்பியக் காலத்தை இறக்குவாருமுண்டு. முடிவிலா உரையாடலுள் போகவேண்டாம்.  தமிழ், பாகதம் என 2 மொழிகள் ஊடுறுவியதால் கல்வெட்டுகளைப் படிப்பதில் உள்ள சிக்கல்களை, நேரங்கருதிப் பேசத் தவிர்க்கிறேன்.

இதற்கு 3 தீர்வுகள் உருவாகின.  முதல் தீர்வு பட்டிப்போரலு தீர்வு. என்ன காரணமோ, வளராது போனது. பிந்தியது வடபுல முறை, தமிழ் தவிர்த்த இந்திய மொழிகள் (சிங்களமும் இதில் சேர்ந்ததே) வடபுல முறை கொண்டன. 3 ஆவது தமிழி.  இது புரியா மேலையர் தமிழையும் அபுகிடா என்பார். தமிழி அசையெழுத்து முறை சார்ந்தது. உயிரும், மெய்யும் இதில் முகன்மை. மெய்ப்புள்ளியை நீக்கினால் அகரமேறிய மெய் கிடைக்கும்.. புள்ளி நீக்கி வேறு உயிர்க் குறியீடுகளைச் சேர்த்தால் வேறு மெய்கள் கிடைக்கும். இதையே தொல்காப்பியம் சொல்கிறது. இந்நூற்பாவைத் தவறாகப் புரிந்தவர் மிகுதி.

அபுசட் என்பது வெறும் மெய்கள் கொண்டது. தனி உயிர் எழுத்துகள் கிடையா. மெய்யெழுத்துகளில் மேலும் கீழும் பக்கவாட்டிலும் உயிர்மெய்க் குறியீடுகள் இட்டு உயிரொலி காட்டுவர். அபுகிடாவில் உயிரும் அகரமேறிய மெய்யும் முகன்மை. ஒன்றின் கீழ் இன்னொன்றாய் 2 க இட்டிருப்பர். மேல் க மெய் ஆகவும் கீழ்க் க உயிர்மெய்யாகவும் கொள்வர். ஒரே வடிவத்திற்கு 2 மதிப்பு (value) கொண்டு இடம் பொறுத்து மதிப்பு மாறும். இதில் அகரம் ஏறிய மெய்யை மெய் என்பார். அடிப்படையில் 2 பரிமானங் கொண்டது. மொழியியலின்படி 5 எழுத்துகள் கூட ஒன்றின்கீழ் தொங்கலாம். எழுத்துகள் கட்டித் தொங்குவதால் கந்தெழுத்து என்றார். கந்தம் grandham ஆனது. தேவநகரியும் அப்படியே. தாளில்/ கணித்திரையில் வெளிப்படும் இக்கால ஆவணங்களுக்கு 2 பரிமானம் சிக்கல் தருவதால் அடுக்கு எழுத்துகளை விட்டு, (நம் மெய்களுக்குச் சமமாய்) half consonant களை இப்போது உருவாக்குகிறார். (உழவன் எக்ஷ்பிரஸ்)   

தமிழை அபுகிடாவாக்குவது அடையாளச் சிக்கல் (identity crisis). பெண்ணை ஆணென்றோ, ஆணைப் பெண்ணென்றோ சொல்லி வளர்ப்பதை ஒக்கும். இப்போதும் அப்படி நடக்கிறது  விளக்க நேரம் பிடிக்குமென்பதால் நகர்கிறேன். 

அன்புடன்,
இராம.கி.