Monday, October 01, 2018

அடிப்படை மொழியியற் சொற்கள்

இக்கால மொழியியலில் பழகும் scanning tokens, lexicology, syntactics, sematics ஆகியவற்றிறோடு தொடர்புடைய தமிழ்ச்சொற்கள் பற்றி நண்பர் சுந்தர் இலட்சுமணன் கேட்டிருந்தார். அதற்கான என் முயற்சிகள் கீழே. 

Tokeniser:

[O.E. tacen "sign, symbol, evidence" (related to tæcan "show, explain, teach"), from P.Gmc. *taiknan (cf. O.S. tekan, O.N. teikn "zodiac sign, omen, token," O.Fris., M.Du. teken, Du. teken, O.H.G. zeihhan, Ger. zeichen, Goth. taikn "sign, token"), from PIE base *deik- "to show" (see teach). Meaning "coin-like piece of stamped metal" is first recorded 1598. The adj. meaning "nominal" is from 1915, from the noun. In integration sense, first recorded 1960; tokenism is first recorded 1962. Original sense of "evidence" is retained in by the same token (1463), originally "introducing a corroborating evidence."]

token  என்பதை அடையாளமென்றே தமிழில் சொல்லுகிறார். ஆளம்= ஆளைக் குறிக்கும் குறியீடு. அந்த ஆள் அதிகாரம் உடையவர். அவருடைய இலச்சினை, அல்லது முத்திரையை ஆளம் என்ற சொல் குறிப்பிடுகிறது. குறியீட்டை அடைத்தது அடையாளம். ஆளத்தின் ஒருபொருட் சொல்லாகப் பொறிப்பு, இலச்சினை, முத்திரை என்ற சொற்களும் பயில்கின்றன. ஒவ்வொன்றும் ஒவ்வொர் விதப்பில் பயன்படுத்தக் கூடியவை. இலத்திக் காட்டுதல்> இலச்சிக் காட்டுதல் என்றவினையின் மூலம் ”இலச்சினை” எழுந்தது. (இது தமிழ்தான். சங்கதத்தில் பயில்வதாலேயே சங்கதம் ஆகிவிடாது.) இலத்திக் காட்டுவதை இலக்கித்தல் என்றும் சொல்லலாம். ”இலக்கு” என்ற பெயர்ச்சொல் சிவகங்கை மாவட்டத்தில் ”குறிப்பிட்ட இடம்” என்ற பொருளைக்கொண்டு பயிலும். அதன் வழி இலகை என்ற சொல்லை logo - விற்கு இணையாக ஏற்கனவே நான் பரிந்துரைத்திருக்கிறேன். இங்கே கொடுக்கப்பட்ட சரத்தைப் (string) பிரித்து, இலத்திக் காட்டுவதால் Tokeniser -இற்கு இலத்தி என்றும் token என்பதற்கு இலதை என்றுஞ் சொல்லலாம். அடையாளப்பொருள் தொடர்ந்து இருக்கும். இலதை என்பது ஏற்கனவே மொழியியலிற் பழகும் உருபு/உருபனினும் சற்று பொதுப்படையானது.

scanner:

எங்கள்பக்கம் கண்ணுத் துணிகளில் (துணியை நெய்யும்போது ஊடையும் (weft) பாவையும் (warp) சற்று கலக்கக்கலக்க வைத்து தொடர்ச்சியாகக் கண்கள் (துளைகள்) அமையும்படி நெய்யப்பட்ட துணி கண்ணுத் துணியாகும்.) விதம் விதமான வண்ணநூல்களைக் கொண்டு பல்வேறு நுணுக்கமான படங்கள், ஓவியங்கள் போன்றவற்றைத் துணியிற் பின்னுவார். ஒவ்வொரு கண்ணிலும் படத்தின் கூறு இருக்கும். ஒவ்வொரு படமும் நூற்றுக்கணக்கான / ஆயிரக் கணக்கான படக்கூறுகளாய்ப் (pixels) பிரிக்கப்படலாம். இக்கூறுகளின் மொத்த விளைவைச் சற்றுதொலைவில் வைத்துப்பார்த்தால் முழுப்படமும் தென்படும். இத்தகைய பின்னல்வேலையை கண்ணித்தல் (கண்களைக் கணக்குப்பண்ணி, நூல்மாற்றிப் பின்னுதல்) என்றுசொல்வார். அக் கண்ணித்தல் வேலையைத்தான் நாம் பயன்படுத்தும் electronic scanner செய்கிறது. நான் அச்சியோடு (printer) சேர்ந்திருக்கும் கண்ணிப்புக் கருவியை கண்ணி என்றே சொல்கிறேன். இங்கும் ஒவ்வொரு இலதையாக ஒரு சொல்லிற்குள் தேடும்போது (scanning tokens) என்பதையும் கண்ணி என்ற சொல்லாற் குறிக்கலாம். . 

lexical analyser:  lexical என்பதைச் சொல்லென்ற முன்னொட்டு வைத்தே, பலரும் சொல்கிறார். தஞ்சைப் பல்கலைக்கழக அருங்கலைச்சொல் அகரமுதலியிலும் அப்ப்டித்தான் இருக்கிறது. [அந்த அகரமுதலியைப் பல்கலைக்கழக அனுமதிவாங்கி wiktionary தளத்தில் ஏற்றமுடியுமா என்று யாராவது பார்த்தால் நல்லது.] எனக்கென்னவோ சொன்மை என்றசொல்லாற் சொன்னால் இன்னுஞ் சரியான பெயரடையாய் (adjective) இருக்குமோ என்று படுகிறது.

lexical analyser = சொன்மை அலசி 
lexical = சொன்மை
lexical units = சொன்மை அலகுகள்
lexicographer = சொன்மைக் கிறுவாளர்/ சொன்மை வரைவாளர்
lexicography = சொன்மைக் கிறுவியல்/ சொன்மை வரைவியல்
lexicology = சொன்மையியல்
lexicon = சொன்மைக் களஞ்சியம் [c.1600, "a dictionary," from Mod.L., from Gk. lexikon (biblion) "word (book)," from neut. of lexikos "pertaining to words," from lexis "word," from legein "say" (sஎன்பதைee lecture). Used originally of dictionaries of Gk., Syriac, Hebrew and Arabic, since these usually were in Latin and in Mod.L. lexicon, not dictionarius, was the preferred word. The modern sense of "vocabulary proper to some sphere of activity" (1640s) is a figurative extension.]

அடுத்தது syntactics. இதைச் சொற்றொடரியல் அல்லது தொடரியல் என்றே எல்லோரும் குறிப்பிடுகிறார். (தஞ்சை அகரமுதலியும் தொடரியலென்றே சொல்கிறது.) [1605, from Fr. syntaxe, from L.L. syntaxis, from Gk. syntaxis "a putting together or in order, arrangement, syntax," from stem of syntassein "put in order," from syn- "together" + tassein "arrange"] என்று சொல்லப்படுவதால் ஒழுகு= order என்ற கருத்தும் உள்வரவேண்டுமென்று கருதித் தொடரொழுகியலென்ற சொல்லை நான் பரிந்துரைக்கிறேன்.

syntactical = தொடரொழுகியல்
syntax = தொடரொழுகு
syntactical analyser / parser = தொடரொழுகியல் /பகுப்பி

கடைசி semantic: [1894, from Fr. sémantique, applied by Michel Bréal (1883) to the psychology of language, from Gk. semantikos "significant," from semainein "to show, signify, indicate by a sign," from sema "sign" (Doric sama)]. semantics: ["science of meaning in language," 1893, from Fr. sémantique (1883); see semantic (also see -ics). Replaced semasiology (1847), from Ger. Semasiologie (1829), from Gk. semasia "signification, meaning."]

பலரும் பொருண்மையியல் என்று குறிக்கிறார்கள். [தஞ்சை அகரமுதலியும்.] நான் பொருண்மை என்றசொல்லை matter இக்குப் புழங்குவதால், meaning ஐப் பொருட்பாடென்றே என் ஆக்கங்களிற் குறித்து வருகிறேன். சிலபோது குழப்பம் வாரா இடங்களில் பொருளென்றும் சொல்லியிருக்கிறேன். நம் நடையில் matter, meaning ஆகிய இரண்டிற்கும் இடையே வேறுபாடு காட்ட வேண்டும் என்பது என் விழைவு. இங்கே semantics வெறும் பொருட்பாட்டை மட்டும் குறிப்பதில்லை. தொல்காப்பியர் சொல்லும் ”சொன்மை, பொருண்மை” ஆகிய இரண்டோடு தொனியையும் சேர்த்துச் சொல்கிறது. ஒரே சொல்லை, அல்லது சொற்றொடரைச் சொல்லும் தொனியில் ஏதேனும் வேறு குறிப்பும் தரலாம். இவை எல்லாமும் சேர்ந்தது semantics என்பதால் பொருட் குறிப்பு என்றே நான் பரிந்துரைக்கிறேன்.

semantic analyser = பொருட்குறிப்பு அலசி
semantic deviation = பொருட்குறிப்பு வேற்றம்
semantics = பொருட்குறிப்பியல்
semanticist = பொருட்குறிப்பாளர்
sememe = பொருட்குறி
seminar = பொருளுரை
seminarist = பொருளுரையாளர்

நான் மேலே சொன்னவை எவ்வளவு தொலைவு ஆங்கிலச் சொற்களுக்கும் பொருந்துமென்பதை நீங்களே முடிவுசெய்யுங்கள்.

அன்புடன்,
இராம.கி.

No comments: