Rajendran Sankaravelayuthan | Tamil University, Thanjavur, India (original) (raw)
Papers by Rajendran Sankaravelayuthan
Deccan College Postgraduate and Research Institute, Pune (Deemed to be a University), 2022
This monograph investigates semantic change and semantic extension of verbs in Tamil. The semanti... more This monograph investigates semantic change and semantic extension of verbs in Tamil. The semantic change and semantic extensions of meaning of verbs are studied from the perspectives of cognitive semantics and generative lexicon. The monograph is organized into six chapters. They are briefly described below.
There are a few earlier researches in Tamil on lexical semantics and semantic change. By chance they are the research works undertaken by Rajendran. “Syntax and semantics of Tamil verbs” is the PhD research work of Rajendran (1978). This work followed the principles of Nida (1975a) expounded in his book entitled “Componential analysis of meaning: an introduction to semantic structures”. This work has great relevance to the present research work as Rajendran has classified verbs into certain semantic domains and subdomains based on the principles of componential analysis propounded by Nida (1975a). He has also classified verbs into certain number of semantic domains based on the number and types of arguments taken by the verbs. He has identified the semantic features of verbs to distinguish one verb from the other and also identified common semantic features which can be ascribed to the verbs which belong to a particular semantic domain. The polysemy of each verb is identified and classified based on the semantic parameters. Another important work on lexical semantics by Rajendran is his post-doctoral work on “Semantics of Tamil vocabulary”. These works have been culminated into two books entitled “taRkaalat tamiz coRkaLanjciyam (Thesaurus for modern Tamil)” which has been written in Tamil and published by Tamil university in 2001 (Rajendran 2001) and ‘tamiz min coRkaLanjciyam (Tamil electronic thesaurus)” written in collaboration with Baskaran and published by Tamil University in 2006 (Rajendran 2006). He has published a book on lexical semantics entitled “coRkaL: vaazvum varalaaRum (Words: Life and History)" written in collaboration with Sakthivel. His research papers entitled “Verbs of ‘seeing’ in Tamil’ (Rajendran 1982), “Coming and Going in Tamil” (Rajendran 1983), “Semantic Structure of Directional verbs of movement in Tamil”, (Rajendran 2002), “Syntax and semantics of Verbs of Transfer in Tamil” (Rajendran 2002), “Creating generative lexicon from dictionaries” (Rajendran 2003), “Building generative lexicon from MRDs in Tamil” (Rajendran 2010), “Grammaticalization verbs in Tamil” (Rajendran 2018) and “Cognitive extensions of meaning in verbs of movement in Tamil” (Rajendran 2019), (Ontology of Tamil Vocabulary" (Rajendran and Anitha 2019), "WordNet and its dimesions" (Rajendran 2021) have direct or indirect bearing on the present research work. Some of unpublished research manuals uploaded in the websites academia.edu and Research Gate which can be said to be directly or indirectly concerned with the present research work are “tamiz peyarc coRkaLin aakkamuRai akaraati” (Generative lexicon for Tamil nouns)” and “tamiz vinaicoRkaLin aakkamuRai akaraati (Generative lexicon for Tamil)”.
The present work has its starting point in “Syntax and semantics of Tamil verbs (Rajendran 1978). The verbs of Tamil have been collected and classified based on the principles of componential analysis meaning propounded by Nida (1975). Also the polysemy of the verbs is explained based on the principles explained by Nida in the same book. Attempts have been made to classify the meanings that can be given under particular verbs. The synonymy is explained based on the senses rather than by words. Such classification explained the semantic extension of verbs which can be attributed to various principles such as metaphorical extension, metonymical extension, and analogical extension and so on.
The aim of this research is to find out the magnitude and dimension semantic change and semantic extension of meanings of verbs and to find out the general principles on these processes of dynamics of meaning. The units of meaning can include words, phrases and grammatical units. For example, the verbs in Tamil such as vaa ‘come’, poo ‘go’ have been grammaticalized to function as auxiliary verbs denoting some aspectual meaning (Rajendran 2019). Two theories have been going to be explored to explain the sematic change and sematic extension of verbs: one is cognitive theory of meaning and another is the theory propounded by Pushtejovsky (1995) in his generative lexicon.
Explaining the semantic extension or semantic change of meaning of verbs is undertaken in two ways: one is to classify the verbs into certain semantic domains based on their distinctive semantic features and then explain the polysemy in the members of each domain (Rajendran 1979, 2020); and another is to explain how verbs belonging to a domain move to another domain by cognitive principles of semantic extension.
Dictionaries list words as entries and give different meanings based on their usage and thus function as word information resources. Dictionaries list different meanings of a verb under an entry and try to convince the users that each is a separate meaning by explanation and giving the examples to support their conviction. Thesaurus on the other hand, classifies the words into semantic domains and subdomains and gives word under each domain or subheading. WordNet is a combination of thesaurus and dictionaries. In WordNet, words are grouped into synsets (synonymous sets) and the synonyms are linked by semantic and lexical relations, thus forming a network of words or concepts (each meaning denoted by a word is a concept).
The problem with a dictionary is that in its efforts to account for the different uses of a lexical item or word, it goes on increasing the list of meaning under each word entry. This will cause not only the increase in the size of the dictionary but also the increase in number of volumes of the dictionary. A verb expands its usage quite wider than a noun. The expansion of numbers of senses under each nouns is comparatively less when compared to verbs. The polysemy found in verbs leads to ambiguity which is a serious issue in machine translation. The polysemy found in verbs and the expansion of dictionaries disproportionately due to polysemy needs to be accounted by different means. The expansion of meaning in terms of different senses can be assumed or predicted or expected to some extent. This predictable expansion of meaning can be explained or put into rules. But the senses assigned to a verb undergo unpredictable mutations which cannot be easily explained. In order to account for the dynamic process of polysemy mainly due to semantic change or meaning expansion, especially in verbs, it is felt that the polysemy needs to be addressed seriously.
The endless list of meanings found in the entries of verbs in a dictionary led to the present study. It is felt that the semantic change or meaning extension need to be explained properly for the verbs to lessen the burden in lexicon. Practically speaking, there is no principal difference between semantic extension and sematic change.
Tamil verbs expand its range of application of meaning or usage of meaning in predictable terms as well as unpredictable terms. For the native speakers of Tamil such expansion of range of application of meaning may not appear strange. But a non-native speaker such extension of change of meaning may appear strange and it may be difficult for them to understand the meaning of a lexical item in unaccustomed contexts.
The expansion or change of meaning of a lexical item will be explicitly revealed if we compare the early dictionaries of Tamil (Tamil Lexicon of Madras University) with the present one (Creas’s Modern Tamil Dictionary). It is presumed here in this research that the meaning expansion or change are somewhat predicable and can be explained by cognitive principles or principles of generative lexicon. It is a well-known fact that meaning of a lexical item expands or changes metaphorically, metonymically and analogically. This leads the moving of lexical items belonging to a domain into another domain. This movement is due to the acquiring of new semantic features which are shared with the entity’s new place of existence. It is hoped that this can be explained by general principles of semantic expansion or change.
Papers in Linguistics Volume 1, International School of Dravidian Linguistics, Thiruvananthapuram , 2023
Causativization in Tamil is mainly of two types, causativization by morphological process such as... more Causativization in Tamil is mainly of two types, causativization by morphological process such as addition of suffixes and phonological changes in the stem and causativization by auxiliary verbs (periphrastic causativization). The auxiliary verb cey ‘do’, vai1 ‘put’, aTi ‘beat’, taTTu ‘beat’, viTu ‘leave, pooTu ‘put’ vai2 compound with the infinitive form of a main verb to express causation. The verbs cey, vai1, aTi and taTTu express strong causation and the verbs viTu, pooTu and vai2 express week causation. Usually, the periphrastic causativiation denote a general causative situation where as their counter part by morphological process denote a specific causative situation.
Deccan College Bicentenary Souvenir , 2021
The term complementation is used in the analysis of grammatical function, to refer to a major con... more The term complementation is used in the analysis of grammatical function, to refer to a major constituent of sentence or clause structure, traditionally associated with ‘completing’ the action specified by the verb. In its broadest sense, complement therefore is a very general notion, subsuming all obligatory features of the predicate other than the verb, e.g. objects (e.g. He kicked the ball) and adverbial (e.g. He is in the garden). In some approaches, the complement is given a more restricted definition, e.g. to refer only to the ‘completing’ function of structures following the verb to be (or similar verbs) – in such an analysis, He kicked the doctor would be subject-verb-object; whereas He is a doctor would be subject-verb-complement. A further distinction is sometimes made between complements of the subject and those and those of the object, as in He is a doctor (subject complement) and He called me a fool (object complement). Complement clauses of various kinds are recognized, this notion sometimes being interpreted as any kind of subordinate clause, sometimes as only one type of subordinate clause (e.g. a clause following be, such as That is what I said). However, the domain of complementation remains an unclear area in linguistic analysis, and there are several unresolved issues, e.g. whether the participles in phrasal verbs (e.g. come in) should be subsumed under this heading. In generative grammar, a complement is a sister constituent of zero-level category. Categories other than the verb are also sometimes said to take complements, e.g. in a student of physics, of physics is said to be the complement of student. In x-bar syntax, the term is used in opposition to adjunct (cf. a student with long hair).
Sivakumar (1980) who has discussed elaborately about complementation in Tamil has taken up only sentences or clauses embedded in other sentence or clause as complements. This process can be called as sentential complementation, which is different form word complementation in which simple noun phrases, adjective phrases and adverbials are considered as complements (cf. Quirk et al). Complementation can be distinguished from relativization, coordination and subordination.
மொழி என்பதற்கு மொழி அறிஞர்கள் பலவிதமான வரையறை விளக்கம் தருவர். மொழி என்பது ஒரு கருத்துப்பரிமாற்றக... more மொழி என்பதற்கு மொழி அறிஞர்கள் பலவிதமான வரையறை விளக்கம் தருவர். மொழி என்பது ஒரு கருத்துப்பரிமாற்றக் கருவியாகும். காற்று ஊடகத்தில் மொழி ஒலி வடிவிலும் எழுது பரப்புகளில் மொழி எழுத்து வடிவிலும் மெய்ப்படுத்தம் பெறுகின்றது. மொழி ஒரு கருத்துப்பரிமாற்றக் குறியீடாகப் பிற கருத்துப்பரிமாற்றக் குறியீடுகளிலிருந்து வேறுபடும். மொழிக்கென்று தனிப் பண்புகள் இருக்கின்றன. மொழியியை அறியியல் அடிப்படையில் படிப்பது அல்லது ஆய்வதுதான் மொழியியல். மொழியியலை ஒலியனியல், உருபனியல், தொடரியல், பொருண்மையியல் எனப் பிரிக்கலாம். மேலும் வரலாற்று அடிப்டையிலான மொழி ஆய்வை வரலாற்று மொழியியல் என்றும் மொழிகளின் மாற்று வகைகளின் அல்லது மொழிக் கிளைகளின் ஆய்வை (பெரும்பாலும் இட அடிப்படையிலான வேறுபாடு குறித்த ஆய்வை) கிளைமொழியியல் என்றும் கூறுவர். மொழியியல் பயன்பாட்டு அடிப்படையில் சமூகமொழியியல், உளமொழியியல், கணினி மொழியியல் என பல்வேறு கிளைகளாகப் பிரித்து ஆயப்படும்.
This is the byproduct of my study on word order typology and transfer grammar for English and Tam... more This is the byproduct of my study on word order typology and transfer grammar for English and Tamil machine translation (Rajendran & Gajeshwari 2019, Rajendran & Kumaresan 2020). Relative clause is a noun-modifying construction resulting in this generation of a higher level noun phrase. Being one of the most productive syntactic processes in natural languages, relative clause has attracted both intensive and extensive work by scholars over a long span of the history of linguistics. In the words of Stockwell (1977: 163), ‘Relative clauses are one of the most extensively studied and best understood of the syntactic structures found in natural languages.’ The Relative Clause Festival celebrated by the Chicago Linguistic Society in 1972 and the wide range of data and in-depth analyses reported there about relative clauses of different languages of the world (see Peranteau et al., 1972) have in a way revealed the importance of this structure in the study of language and linguistic theory. In the context of discussing the suitability of relative clause structure in studying universal grammar, Bach (1974) has mentioned three factors in its favor, which are as follows:
(i) It is relatively easy to identify relative clauses cross linguistically and they are constructions in which some form of dependent sentence is used to specify more closely the interpretation of head nominal expression;
(ii) The kinds of relative clauses encountered in the languages of the world seem to be quite limited and closely related to general characteristics of language in terms of Greenberg’s typology of basic word-order; and
(iii) With apparently very few exceptions every language exhibits such structures.
These important factors make relative clause structure suitable for a theoretical contrastive study, based on word order typology.
International Journal of Dravidian Linguistics (IJDL) volume 51 no 2 June, 2022
The meaning extension of verbs is unavoidable as there are only a limited number of verbs by mean... more The meaning extension of verbs is unavoidable as there are only a limited number of verbs by means of which we need to express innumerable number of verbal concepts. The verbal extensions can be captured by context in which the collocations find a vital part. This paper attempts to investigate the semantic or meaning extensions of verbs by cognitive principles. Cognitive semantics offered us cognitive principles to explain the verbal extensions of meaning. Neagu (2013) analyses the meanings of perception verbs in English, Romanian and French, starting from one important tenet of cognitive linguistics. Sweetser (1990) analyses the semantic extensions of perception verbs in Indo-European languages, from a cognitive and diachronic viewpoint. Ibarretxe-Antuñano (1999), another cognitive linguist, discusses the polysemy of perception verbs synchronically from a typological point of view. Taking into account all these research works on verbs of perception, the semantic extension of verbs of perception in Tamil is carried out here.
International Journal of Dravidian Linguistics (IJDL) volume 49 no 2 June, 2020
Grammaticalization has been defined as "the change whereby lexical items and constructions come i... more Grammaticalization has been defined as "the change whereby lexical items and constructions come in certain linguistic contexts to serve grammatical functions, and, once grammaticalized, continue to develop new grammatical functions" (Hopper & Traugott 2003:1). Simply said, grammaticalization is the process in which a lexical word or a word cluster loses some or all of its lexical meaning and starts to fulfil a more grammatical function. Where grammaticalization takes place, nouns and verbs which carry certain lexical meaning develop over time into grammatical items such as auxiliaries, case markers, inflections, and sentence connectives. Grammaticalization of verbs in Tamil occurs in all the grammatical categories. Verbs in Tamil are grammaticalized into auxiliary verbs, verbalizers, adjectivalizers, adverbilalizers, complementizer and prepositions.
Key words: grammaticalization, auxiliary verb, verbalizer, adjectivalizer, adverbilalizer\, complementizer, preposition
Grammaticalization has been defined as "the change whereby lexical items and constructions come i... more Grammaticalization has been defined as "the change whereby lexical items and constructions come in certain linguistic contexts to serve grammatical functions, and, once grammaticalized, continue to develop new grammatical functions" (Hopper & Traugott 2003:1). Simply said, grammaticalization is the process in which a lexical word or a word cluster loses some or all of its lexical meaning and starts to fulfil some grammatical function. Where grammaticalization takes place, nouns and verbs which carry certain lexical meaning develop over a period of time into grammatical items such as auxiliaries, case markers, inflections, and sentence connectives. Verbs in Tamil are grammaticalized into auxiliary verbs, verbalizers, adjectivalizers, adverbializers, complementizers and prepositions.
International Journal of Dravidian Linguistics (IJDL)Volume 48 no 2 , 2019
Polysemy is very well pronounced in verbs than in nouns in Tamil. So accounting of polysemy in ve... more Polysemy is very well pronounced in verbs than in nouns in Tamil. So accounting of polysemy in verbs becomes very crucial. Certain verbs are more polysemous than certain other verbs. For example Kriyaavain taRkaalta tamiz akaraati ‘Crea’s Modern Tamil dictionary’ (2008) lists 54 senses for the verb pooTu ‘put’; 27 senses for the verb poo ‘go’; 3 senses for the verb paTu ‘lie down’. The verbs show physical as well as metaphorical extensions of meaning. Some of the meaning extensions are predictable and some are not predictable. The predictable meaning extensions are easy to deal with; but the unpredictable ones are difficult to handle. There are different types of mechanisms of meaning extensions. Though one can note down certain universal tendencies in the meaning extension of verbs, many meaning extensions are ad hoc and beyond explainable cognition. The meaning extensions can be approached as result of productive mechanism form the point of view of the theory of generative lexicon propounded by Pustejovsky (1995). It can also be approached as a result of cognitive mechanism. Both have their own pros and cons. An alternative way of handling polysemy among verbs is proposed in this paper. The semantic extension of verb is viewed as a continuous process and the senses listed in a dictionary are considered as reference points in the meaning space of the verb. We try to capture these reference points by means of context clustering using corpus.
Keywords: cognitive extension, cognitive extension of meaning, semantic extension, polysemy, generative lexicon, typology of meaning extension, mechanism of meaning extension,
Translation as part of the communicative ELT classroom approach is still a controversial area and... more Translation as part of the communicative ELT classroom approach is still a controversial area and one that provokes strong opinions. Translation was the basis of language teaching for a very long time, and then rejected as new methodologies started to appear. It was a key element of the Grammar Translation Method, which was derived from the classical method of teaching Greek and Latin. This was not a positive learning experience for many: as well as learners memorizing huge lists of rules and vocabulary, this method involved them translating whole literary or historic texts word for word.
Computational analysis of nominal verbal complexes involves two processes: 1. The analysis of nom... more Computational analysis of nominal verbal complexes involves two processes: 1. The analysis of nominal and verbal complex into minimal meaningful units and assigning semantic features to each unit. 1. The generation of the nominal and verbal complex out of the same meaningful units. Let us make an assumption that the building of nominal and verbal complexes is the concatenation of morphemes and bound words. Clearly the simplest way to build such a model would be to assume that the allowability of a particular morpheme or a bound word in a given context depends only upon the morpheme that precedes it. Take the word ceytuviTTeen, whose morphological structure is cey+tu + viT+T+een. The combination of cey which is a verb and tu which an adverbial marker forms the first chunk of the verbal complex and the combination of viT which is a secondary verb, T which is a past tense marker and een which is a person-number-marker forms the second chunk of the word. Both of the chunks (V1 and V2) make a verbal complex. Finites state Automata One can easily model such a system with a finite-state machine (finite-state automaton or finite-state transition network) of the kind familiar from formal language theory. More formally, a finite automation is defined by the following five parameters: Q: a finite set of N states q0, q1...,qN : a finite input alphabet of symbols q0: the start state F: the set of final states, F Q (q,i): the transition function or transition matrix between states. Given a state q Q and an input symbol i , (q,i) returns a new state q' Q. is thus a relation from Q to Q; A set of rewrite rules, or grammar, can be thought of not only as an intentional definition of the units of a language, but also as the description of an abstract machine which is able to accept (or generate) just those strings which belong to the language. These machines are called (abstract) automata, and the complexity of their potential behaviour is directly determined by the internal complexity of the rules of the grammar to which they correspond. All such machines may be characterized in terms
Translation Today, 2004
Historical novel is a novel that has as its setting a period of history and that attempts to conv... more Historical novel is a novel that has as its setting a period of history and that attempts to convey the spirit, manners, and social conditions of a past age with realistic detail and fidelity (which is in some cases only apparent fidelity) to historical fact. The work may deal with actual historical personages, or it may contain a mixture of fictional and historical characters. The historical novel Ponniyin Selvan taken for our analysis is a mixture of fictional and historical characters. The events are also both historical and fictional. Translating such a historical novel is a challenge for the translator. Arguably, the barriers to translation of the historical novel from Tamil to English are even higher since the challenges are many which include taking the readers not only to a new language situation but also to a period in the past. Before resorting to translation, the translator has to be sure that the novel to be translated meets the exacting standards of native English readers of historical fiction. The translator Indra Neelameggham who translated the first part of Ponniyin Selvan has done her job with meticulous care. The translated version can be taken as a model to those who resort to translation of historical novels. The strategies adopted by Indra Neelameggham to make her venture palatable to English readers are highly commendable. So it is worth attempting to learn lessons from her translated work.
It is difficult to interpret the meaning of a lexical item without context. Word net lists differ... more It is difficult to interpret the meaning of a lexical item without context. Word net lists different senses of a word and pro-vide definition and usage example for each sense. But like any sense enumera-tive lexicon it also does not provide any mechanism for the novel usage of a word. The polysemy found in verbs and adjec-tives convincingly tell us that we have to augment wordnet with context. Such me-chanism will help us to condense senses listed under a word and allow us to interp-ret the senses of a word creatively or ge-neratively.
This paper presents the Part Of Speech tagger and Chunker for Tamil using Machine learning techni... more This paper presents the Part Of Speech tagger and Chunker for Tamil using Machine learning techniques. Part Of Speech tagging and chunking are the fundamental processing steps for any language processing task. Part of speech (POS) tagging is the process of labeling automatic annotation of syntactic categories for each word in a corpus. Chunking is the task of identifying and segmenting the text into syntactically correlated word groups. These are done by the machine learning techniques, where the linguistical knowledge is automatically extracted from the annotated corpus. We have developed our own tagset for annotating the corpus, which is used for training and testing the POS tagger generator and the chunker. The present tagset consists of thirty-two tags for POS and nine tags for chunking. A corpus size of two hundred and twenty five thousand words was used for training and testing the accuracy of the POS tagger and Chunker. We found that SVM based machine learning tool affords the most encouraging result for Tamil POS tagger (95.64%) and chunker (95.82%).
இங்கு வினையடிகளை அதன் அசையமைப்புச்சாத்தியம் அடிப்படையில் ஆய்வு மேற்கொள்ளப்பட்டுள்ளது. வினைகளை அசை... more இங்கு வினையடிகளை அதன் அசையமைப்புச்சாத்தியம் அடிப்படையில் ஆய்வு மேற்கொள்ளப்பட்டுள்ளது. வினைகளை அசைகள் அடிப்படையில் இரு பகுதிகளாகப் பகுக்கப்பட்டு, முதல் பகுதியில் வரும் அசைகளின் அல்லது எழுத்தக்களின் சாத்தியங்களின் அடிப்படையில் வினையடிகள் இங்கு ஆயப்பட்டுள்ளன. தமிழில் 12 உயிர்களும் ஏழு மெய்களும் (க், ச், த், ந், ப், ம், வ்) வினைச்சொற்களின் முதலில் வரும் (ஞ், ய், வினைச்சொற்களின் முதலசையில் வாரா.) இவற்றின் அடிப்படையில் 12 உயிர்களும் 84 உயிர்மெய்களும் வினையின் முதலில் வரவல்லன. இருப்பினும் வு, வூ, வொ, வோ என்பன மொழி முதலில் வாரா. இவற்றைக் கழித்து கீழே பட்டியலிடப்பட்டள்ள 92 (12+84=96-4= 92) எழுத்துக்கள் அல்லது அசைகள் வினையின் முதலெழுத்துகளாக அல்லது முதலசைகளாக வர வல்லன:
அ ஆ இ ஈ உ ஊ எ ஏ ஐ ஒ ஓ ஓள
க கா கி கீ கு கூ கெ கை கொ கோ கெள
ச சா சி சீ சு சூ செ சே சை சோ சௌ
த தா தி தீ து தூ தெ தே தை தொ தோ தெள
ந நா நீ நூ நெ நே நை நொ நோ நெள
ப பா பி பீ பு பு பெ பே பை பொ போ பெள
ம மா மி மீ மு மு மெ மே மை மொ மோ மெள
வ வா வி வீ வெ வே வை வெள
ஒரு குறிப்பிட்ட ஈற்றின் முன் வரவியலும் முன்னசைகளின் அடிப்படையில் 92 வினையடிகள் சாத்தியமாகும். இங்கு வினையடிகளின் இறுதியசையை அல்லது எழுத்தை நிர்ணயித்துக்கொண்டு, அதனுடன் சொல் முதலில் வரவியலும் அசைகளின் அடிப்படையில் சாத்தியமான வினையடிகளும் உண்மையாக வரும் வினையடிகளும் கண்டுபிடிக்கப்பட்டுள்ளன. இது வினையடிகளின் மீட்டுருவாக்கத்திற்கும் வழக்கிழந்த வினைகளை அறிந்துகொள்வதற்கும் உதவும்.
வினையடிகளின் அமைப்பும் ஆக்கமும் விளக்கப்படும். இங்கு தனிநிலை அடிகள், கூட்டுநிலை அடிகளுக்கு எதிரா... more வினையடிகளின் அமைப்பும் ஆக்கமும் விளக்கப்படும். இங்கு தனிநிலை அடிகள், கூட்டுநிலை அடிகளுக்கு எதிராகக் கருத்தில் கொள்ளப்பட்டு தனிநிலை வினைகளின் அமைப்பும் ஆக்கமும் மட்டுமே கருத்தில் கொள்ளப்பட்டுள்ளன. தனிநிலை அடி என்பதை வருணனை நிலையில் எந்த வினையாக்க உருபனின் இடையீடுமின்றி காலம், வினைநோக்கு மற்றும் வினையாற்றுவகை ஒட்டுகளால் நேரடியாகத் திரிபுறுவனவாகும் என்று வரையறை செய்யலாம். பொரும்பாலான தனிநிலை அடிகள் திராவிட மொழி மூலம் சார்ந்தவையாகும். ஒரு வேர் கூறை சொல்லின் பிற கூறிலிருந்து பிரிக்கும் எல்லை சொற்களை ஒன்றுடன் ஒன்று ஒப்பிட்டு வேர், ஆக்ககூறு எனப்பிரிக்கப்படும். திர் என்பதைப் பொதுவான வினைவேர் கூறாகவும் இ, உகு, அள், உம்பு என்பதனை மாறுபடும் வினையடியாக்கக் கூறுகளாகவும் பிரித்தெடுக்கலாம். இதுபோல் அடு, அடை, அடுக்கு, அடக்கு, அடங்கு என்ற வினையடிகளில் அட் என்பதை பொதுவான கூறாகப் பிரித்தெடுக்கலாம். உ, ஐ, அக்கு, அங்கு என்பன வேறுபடும் வினையடியாக்கக் கூறுகளாகும். எனவே இடப்பெயர்ப்பு அடிப்படையிலும் சரிநிகர் வேறுபாடுகள் அடிப்படையிலும் நாம் வினை வேர்களின் எல்லைகளை நிறுவ இயலும். இது வருணனை மொழியியலில் உருபன் எல்லைகளைக் காட்டுவதற்குச் சமமானது. புள்ளியியல் அடிப்படையில் பார்த்தால் நாம் நிறுவும் பின்னொட்டுக்கள் வேர்களை விட எண்ணிக்கையில் மிகக் குறைவானதாக உள்ளன. இவ்வியலில் தமிழ் வினையடிகள் மேற்சொன்ன செயல்பாட்டு அடிப்படையில் வினை வேர்களாகவும் ஆக்க ஒட்டுகளாகவும் பிரித்து ஆயப்பட்டு ஆய்வின் முடிவுகள் இங்கு விளக்கப்பட்டுள்ளன. ஒரே மொழியில் பலகாலகட்டங்களில் அல்லது பலவிடங்களில் வரும் ஒப்பிடத் தகுந்த வினைச் சொற்களை ஒப்பிட்டு வேர்களையும் வடிவாக்க ஒட்டுக்களையும் பெறுவது அகமீட்டுருவாக்கம் (internal reconstruction) என்றும் சகோதர மொழிகளில் வரும் ஒப்பிடத் தகுந்த சொற்களுடன் ஒப்பிட்டு ஆய்வது புறமீட்டுருவாக்கம் (comparative reconstruction) என்றும் வரலாற்று மொழியியல் ஆய்வில் கூறப்படும். இங்கு தமிழிலக்கியங்களில் வரும் வினைச்சொற்கள் ஒப்பிடப்பட்டு அகமீட்டுருவாக்கம் அடிப்படையில் ஆயப்பட்டுள்ளன.
இங்கு வினையடிகளை அதன் அசையமைப்புச்சாத்தியம் அடிப்படையில் ஆய்வு மேற்கொள்ளப்பட்டுள்ளது. வினைகளை அசை... more இங்கு வினையடிகளை அதன் அசையமைப்புச்சாத்தியம் அடிப்படையில் ஆய்வு மேற்கொள்ளப்பட்டுள்ளது. வினைகளை அசைகள் அடிப்படையில் இரு பகுதிகளாகப் பகுக்கப்பட்டு, முதல் பகுதியில் வரும் அசைகளின் அல்லது எழுத்தக்களின் சாத்தியங்களின் அடிப்படையில் வினையடிகள் இங்கு ஆயப்பட்டுள்ளன. தமிழில் 12 உயிர்களும் ஏழு மெய்களும் (க், ச், த், ந், ப், ம், வ்) வினைச்சொற்களின் முதலில் வரும் (ஞ், ய், வினைச்சொற்களின் முதலசையில் வாரா.) இவற்றின் அடிப்படையில் 12 உயிர்களும் 84 உயிர்மெய்களும் வினையின் முதலில் வரவல்லன. இருப்பினும் வு, வூ, வொ, வோ என்பன மொழி முதலில் வாரா. இவற்றைக் கழித்து கீழே பட்டியலிடப்பட்டள்ள 92 (12+84=96-4= 92) எழுத்துக்கள் அல்லது அசைகள் வினையின் முதலெழுத்துகளாக அல்லது முதலசைகளாக வர வல்லன:
அ ஆ இ ஈ உ ஊ எ ஏ ஐ ஒ ஓ ஓள
க கா கி கீ கு கூ கெ கை கொ கோ கெள
ச சா சி சீ சு சூ செ சே சை சோ சௌ
த தா தி தீ து தூ தெ தே தை தொ தோ தெள
ந நா நீ நூ நெ நே நை நொ நோ நெள
ப பா பி பீ பு பு பெ பே பை பொ போ பெள
ம மா மி மீ மு மு மெ மே மை மொ மோ மெள
வ வா வி வீ வெ வே வை வெள
ஒரு குறிப்பிட்ட ஈற்றின் முன் வரவியலும் முன்னசைகளின் அடிப்படையில் 92 வினையடிகள் சாத்தியமாகும். இங்கு வினையடிகளின் இறுதியசையை அல்லது எழுத்தை நிர்ணயித்துக்கொண்டு, அதனுடன் சொல் முதலில் வரவியலும் அசைகளின் அடிப்படையில் சாத்தியமான வினையடிகளும் உண்மையாக வரும் வினையடிகளும் கண்டுபிடிக்கப்பட்டுள்ளன. இது வினையடிகளின் மீட்டுருவாக்கத்திற்கும் வழக்கிழந்த வினைகளை அறிந்துகொள்வதற்கும் உதவும்.
இக்கட்டுரை “தமிழ் வினையடிகளின் வரலாற்று மொழியியல் ஆய்வு (A Historical Linguistic Analysis of Tami... more இக்கட்டுரை “தமிழ் வினையடிகளின் வரலாற்று மொழியியல் ஆய்வு (A Historical Linguistic Analysis of Tamil verbal Bases)” என்ற செம்மொழி நிறுவன நிதி நல்கையில் மேற்கொள்ளப்பட்ட ஆய்வுத்திட்டத்திற்கு 2008-இல் சமர்ப்பிக்கப்பட்ட ஆய்வேட்டின் (இராசேந்திரன், 2008) ஒரு இயலாக அமைகின்றது.
வினை என்பது பொதுவாக ஒரு வாக்கியத்தில் ஒரு செயலையோ நிலையையோ வெளிப்படுத்துவதற்காக பயனிலையில் வரும் முக்கியமான அங்கமாகும். இது காலம், வினைநோக்கு, வினையாற்றுவகை, வினைப்பாடு இவற்றிகாகத் திரிபுறும். வினைகள் மரபிலக்கணத்தராலும் தற்கால இலக்கணதாராலும் வகைப்படுத்தப்பட்டுள்ளன. வினையடிகளின் பாகுபாட்டைப் பின்வரும் தலைப்பில் விளக்கலாம்:
1. தெரிநிலை வினை-குறிப்பு வினைப் பாகுபாடு
2. தன்வினை-பிறவினைப் பாகுபாடு
3. செயப்படுபொருள் குன்றாவினை-குன்றியவினைப் பாகுபாடு
4. வினைத்திரிபுசார் பாகுபாடு
5. சீரற்ற-சீரான வினைப் பாகுபாடு
வினை அடிகளை அவற்றின் உருபனியல் மற்றும் உருபொலியனியல் நடத்தை அடிப்படையில் பாகுபாடு செய்வது வினைகளின் திரிபுகளையும் ஆக்கங்களையும் அறிந்துகொள்ள பயனுள்ளதாக அமையும். இதன் அடிப்படையில் வினை அடிகள் பின்வருமாறு பாகுபாடு செய்யப்பட்டு விளக்கப்பட்டன: தெரிநிலை வினை-குறிப்பு வினைப் பாகுபாடு, தன்வினை-பிறவினைப் பாகுபாடு, செயப்படுபொருள் குன்றாவினை-குன்றியவினைப் பாகுபாடு, வினைத்திரிபுசார் பாகுபாடு, சீரற்ற-சீரான வினைப் பாகுபாடு. பலவேறு அறிஞர்கள் வினைத்திரிபு அடிப்படையில் தமிழ் வினைகளைப் பகுத்துள்ளமை பற்றி விரிவாகக் கூறப்பட்டது. சீரற்ற-சீரான வினைப்பாகு பாடு அடிப்படையிலும் வினைகளைப் பகுப்பது விளக்கப்பட்டு ஒட்டு மொத்தமான வினைப்பாகுபாடு இறுதியில் தரப்பட்டுள்ளது.
Deccan College Postgraduate and Research Institute, Pune (Deemed to be a University), 2022
This monograph investigates semantic change and semantic extension of verbs in Tamil. The semanti... more This monograph investigates semantic change and semantic extension of verbs in Tamil. The semantic change and semantic extensions of meaning of verbs are studied from the perspectives of cognitive semantics and generative lexicon. The monograph is organized into six chapters. They are briefly described below.
There are a few earlier researches in Tamil on lexical semantics and semantic change. By chance they are the research works undertaken by Rajendran. “Syntax and semantics of Tamil verbs” is the PhD research work of Rajendran (1978). This work followed the principles of Nida (1975a) expounded in his book entitled “Componential analysis of meaning: an introduction to semantic structures”. This work has great relevance to the present research work as Rajendran has classified verbs into certain semantic domains and subdomains based on the principles of componential analysis propounded by Nida (1975a). He has also classified verbs into certain number of semantic domains based on the number and types of arguments taken by the verbs. He has identified the semantic features of verbs to distinguish one verb from the other and also identified common semantic features which can be ascribed to the verbs which belong to a particular semantic domain. The polysemy of each verb is identified and classified based on the semantic parameters. Another important work on lexical semantics by Rajendran is his post-doctoral work on “Semantics of Tamil vocabulary”. These works have been culminated into two books entitled “taRkaalat tamiz coRkaLanjciyam (Thesaurus for modern Tamil)” which has been written in Tamil and published by Tamil university in 2001 (Rajendran 2001) and ‘tamiz min coRkaLanjciyam (Tamil electronic thesaurus)” written in collaboration with Baskaran and published by Tamil University in 2006 (Rajendran 2006). He has published a book on lexical semantics entitled “coRkaL: vaazvum varalaaRum (Words: Life and History)" written in collaboration with Sakthivel. His research papers entitled “Verbs of ‘seeing’ in Tamil’ (Rajendran 1982), “Coming and Going in Tamil” (Rajendran 1983), “Semantic Structure of Directional verbs of movement in Tamil”, (Rajendran 2002), “Syntax and semantics of Verbs of Transfer in Tamil” (Rajendran 2002), “Creating generative lexicon from dictionaries” (Rajendran 2003), “Building generative lexicon from MRDs in Tamil” (Rajendran 2010), “Grammaticalization verbs in Tamil” (Rajendran 2018) and “Cognitive extensions of meaning in verbs of movement in Tamil” (Rajendran 2019), (Ontology of Tamil Vocabulary" (Rajendran and Anitha 2019), "WordNet and its dimesions" (Rajendran 2021) have direct or indirect bearing on the present research work. Some of unpublished research manuals uploaded in the websites academia.edu and Research Gate which can be said to be directly or indirectly concerned with the present research work are “tamiz peyarc coRkaLin aakkamuRai akaraati” (Generative lexicon for Tamil nouns)” and “tamiz vinaicoRkaLin aakkamuRai akaraati (Generative lexicon for Tamil)”.
The present work has its starting point in “Syntax and semantics of Tamil verbs (Rajendran 1978). The verbs of Tamil have been collected and classified based on the principles of componential analysis meaning propounded by Nida (1975). Also the polysemy of the verbs is explained based on the principles explained by Nida in the same book. Attempts have been made to classify the meanings that can be given under particular verbs. The synonymy is explained based on the senses rather than by words. Such classification explained the semantic extension of verbs which can be attributed to various principles such as metaphorical extension, metonymical extension, and analogical extension and so on.
The aim of this research is to find out the magnitude and dimension semantic change and semantic extension of meanings of verbs and to find out the general principles on these processes of dynamics of meaning. The units of meaning can include words, phrases and grammatical units. For example, the verbs in Tamil such as vaa ‘come’, poo ‘go’ have been grammaticalized to function as auxiliary verbs denoting some aspectual meaning (Rajendran 2019). Two theories have been going to be explored to explain the sematic change and sematic extension of verbs: one is cognitive theory of meaning and another is the theory propounded by Pushtejovsky (1995) in his generative lexicon.
Explaining the semantic extension or semantic change of meaning of verbs is undertaken in two ways: one is to classify the verbs into certain semantic domains based on their distinctive semantic features and then explain the polysemy in the members of each domain (Rajendran 1979, 2020); and another is to explain how verbs belonging to a domain move to another domain by cognitive principles of semantic extension.
Dictionaries list words as entries and give different meanings based on their usage and thus function as word information resources. Dictionaries list different meanings of a verb under an entry and try to convince the users that each is a separate meaning by explanation and giving the examples to support their conviction. Thesaurus on the other hand, classifies the words into semantic domains and subdomains and gives word under each domain or subheading. WordNet is a combination of thesaurus and dictionaries. In WordNet, words are grouped into synsets (synonymous sets) and the synonyms are linked by semantic and lexical relations, thus forming a network of words or concepts (each meaning denoted by a word is a concept).
The problem with a dictionary is that in its efforts to account for the different uses of a lexical item or word, it goes on increasing the list of meaning under each word entry. This will cause not only the increase in the size of the dictionary but also the increase in number of volumes of the dictionary. A verb expands its usage quite wider than a noun. The expansion of numbers of senses under each nouns is comparatively less when compared to verbs. The polysemy found in verbs leads to ambiguity which is a serious issue in machine translation. The polysemy found in verbs and the expansion of dictionaries disproportionately due to polysemy needs to be accounted by different means. The expansion of meaning in terms of different senses can be assumed or predicted or expected to some extent. This predictable expansion of meaning can be explained or put into rules. But the senses assigned to a verb undergo unpredictable mutations which cannot be easily explained. In order to account for the dynamic process of polysemy mainly due to semantic change or meaning expansion, especially in verbs, it is felt that the polysemy needs to be addressed seriously.
The endless list of meanings found in the entries of verbs in a dictionary led to the present study. It is felt that the semantic change or meaning extension need to be explained properly for the verbs to lessen the burden in lexicon. Practically speaking, there is no principal difference between semantic extension and sematic change.
Tamil verbs expand its range of application of meaning or usage of meaning in predictable terms as well as unpredictable terms. For the native speakers of Tamil such expansion of range of application of meaning may not appear strange. But a non-native speaker such extension of change of meaning may appear strange and it may be difficult for them to understand the meaning of a lexical item in unaccustomed contexts.
The expansion or change of meaning of a lexical item will be explicitly revealed if we compare the early dictionaries of Tamil (Tamil Lexicon of Madras University) with the present one (Creas’s Modern Tamil Dictionary). It is presumed here in this research that the meaning expansion or change are somewhat predicable and can be explained by cognitive principles or principles of generative lexicon. It is a well-known fact that meaning of a lexical item expands or changes metaphorically, metonymically and analogically. This leads the moving of lexical items belonging to a domain into another domain. This movement is due to the acquiring of new semantic features which are shared with the entity’s new place of existence. It is hoped that this can be explained by general principles of semantic expansion or change.
Papers in Linguistics Volume 1, International School of Dravidian Linguistics, Thiruvananthapuram , 2023
Causativization in Tamil is mainly of two types, causativization by morphological process such as... more Causativization in Tamil is mainly of two types, causativization by morphological process such as addition of suffixes and phonological changes in the stem and causativization by auxiliary verbs (periphrastic causativization). The auxiliary verb cey ‘do’, vai1 ‘put’, aTi ‘beat’, taTTu ‘beat’, viTu ‘leave, pooTu ‘put’ vai2 compound with the infinitive form of a main verb to express causation. The verbs cey, vai1, aTi and taTTu express strong causation and the verbs viTu, pooTu and vai2 express week causation. Usually, the periphrastic causativiation denote a general causative situation where as their counter part by morphological process denote a specific causative situation.
Deccan College Bicentenary Souvenir , 2021
The term complementation is used in the analysis of grammatical function, to refer to a major con... more The term complementation is used in the analysis of grammatical function, to refer to a major constituent of sentence or clause structure, traditionally associated with ‘completing’ the action specified by the verb. In its broadest sense, complement therefore is a very general notion, subsuming all obligatory features of the predicate other than the verb, e.g. objects (e.g. He kicked the ball) and adverbial (e.g. He is in the garden). In some approaches, the complement is given a more restricted definition, e.g. to refer only to the ‘completing’ function of structures following the verb to be (or similar verbs) – in such an analysis, He kicked the doctor would be subject-verb-object; whereas He is a doctor would be subject-verb-complement. A further distinction is sometimes made between complements of the subject and those and those of the object, as in He is a doctor (subject complement) and He called me a fool (object complement). Complement clauses of various kinds are recognized, this notion sometimes being interpreted as any kind of subordinate clause, sometimes as only one type of subordinate clause (e.g. a clause following be, such as That is what I said). However, the domain of complementation remains an unclear area in linguistic analysis, and there are several unresolved issues, e.g. whether the participles in phrasal verbs (e.g. come in) should be subsumed under this heading. In generative grammar, a complement is a sister constituent of zero-level category. Categories other than the verb are also sometimes said to take complements, e.g. in a student of physics, of physics is said to be the complement of student. In x-bar syntax, the term is used in opposition to adjunct (cf. a student with long hair).
Sivakumar (1980) who has discussed elaborately about complementation in Tamil has taken up only sentences or clauses embedded in other sentence or clause as complements. This process can be called as sentential complementation, which is different form word complementation in which simple noun phrases, adjective phrases and adverbials are considered as complements (cf. Quirk et al). Complementation can be distinguished from relativization, coordination and subordination.
மொழி என்பதற்கு மொழி அறிஞர்கள் பலவிதமான வரையறை விளக்கம் தருவர். மொழி என்பது ஒரு கருத்துப்பரிமாற்றக... more மொழி என்பதற்கு மொழி அறிஞர்கள் பலவிதமான வரையறை விளக்கம் தருவர். மொழி என்பது ஒரு கருத்துப்பரிமாற்றக் கருவியாகும். காற்று ஊடகத்தில் மொழி ஒலி வடிவிலும் எழுது பரப்புகளில் மொழி எழுத்து வடிவிலும் மெய்ப்படுத்தம் பெறுகின்றது. மொழி ஒரு கருத்துப்பரிமாற்றக் குறியீடாகப் பிற கருத்துப்பரிமாற்றக் குறியீடுகளிலிருந்து வேறுபடும். மொழிக்கென்று தனிப் பண்புகள் இருக்கின்றன. மொழியியை அறியியல் அடிப்படையில் படிப்பது அல்லது ஆய்வதுதான் மொழியியல். மொழியியலை ஒலியனியல், உருபனியல், தொடரியல், பொருண்மையியல் எனப் பிரிக்கலாம். மேலும் வரலாற்று அடிப்டையிலான மொழி ஆய்வை வரலாற்று மொழியியல் என்றும் மொழிகளின் மாற்று வகைகளின் அல்லது மொழிக் கிளைகளின் ஆய்வை (பெரும்பாலும் இட அடிப்படையிலான வேறுபாடு குறித்த ஆய்வை) கிளைமொழியியல் என்றும் கூறுவர். மொழியியல் பயன்பாட்டு அடிப்படையில் சமூகமொழியியல், உளமொழியியல், கணினி மொழியியல் என பல்வேறு கிளைகளாகப் பிரித்து ஆயப்படும்.
This is the byproduct of my study on word order typology and transfer grammar for English and Tam... more This is the byproduct of my study on word order typology and transfer grammar for English and Tamil machine translation (Rajendran & Gajeshwari 2019, Rajendran & Kumaresan 2020). Relative clause is a noun-modifying construction resulting in this generation of a higher level noun phrase. Being one of the most productive syntactic processes in natural languages, relative clause has attracted both intensive and extensive work by scholars over a long span of the history of linguistics. In the words of Stockwell (1977: 163), ‘Relative clauses are one of the most extensively studied and best understood of the syntactic structures found in natural languages.’ The Relative Clause Festival celebrated by the Chicago Linguistic Society in 1972 and the wide range of data and in-depth analyses reported there about relative clauses of different languages of the world (see Peranteau et al., 1972) have in a way revealed the importance of this structure in the study of language and linguistic theory. In the context of discussing the suitability of relative clause structure in studying universal grammar, Bach (1974) has mentioned three factors in its favor, which are as follows:
(i) It is relatively easy to identify relative clauses cross linguistically and they are constructions in which some form of dependent sentence is used to specify more closely the interpretation of head nominal expression;
(ii) The kinds of relative clauses encountered in the languages of the world seem to be quite limited and closely related to general characteristics of language in terms of Greenberg’s typology of basic word-order; and
(iii) With apparently very few exceptions every language exhibits such structures.
These important factors make relative clause structure suitable for a theoretical contrastive study, based on word order typology.
International Journal of Dravidian Linguistics (IJDL) volume 51 no 2 June, 2022
The meaning extension of verbs is unavoidable as there are only a limited number of verbs by mean... more The meaning extension of verbs is unavoidable as there are only a limited number of verbs by means of which we need to express innumerable number of verbal concepts. The verbal extensions can be captured by context in which the collocations find a vital part. This paper attempts to investigate the semantic or meaning extensions of verbs by cognitive principles. Cognitive semantics offered us cognitive principles to explain the verbal extensions of meaning. Neagu (2013) analyses the meanings of perception verbs in English, Romanian and French, starting from one important tenet of cognitive linguistics. Sweetser (1990) analyses the semantic extensions of perception verbs in Indo-European languages, from a cognitive and diachronic viewpoint. Ibarretxe-Antuñano (1999), another cognitive linguist, discusses the polysemy of perception verbs synchronically from a typological point of view. Taking into account all these research works on verbs of perception, the semantic extension of verbs of perception in Tamil is carried out here.
International Journal of Dravidian Linguistics (IJDL) volume 49 no 2 June, 2020
Grammaticalization has been defined as "the change whereby lexical items and constructions come i... more Grammaticalization has been defined as "the change whereby lexical items and constructions come in certain linguistic contexts to serve grammatical functions, and, once grammaticalized, continue to develop new grammatical functions" (Hopper & Traugott 2003:1). Simply said, grammaticalization is the process in which a lexical word or a word cluster loses some or all of its lexical meaning and starts to fulfil a more grammatical function. Where grammaticalization takes place, nouns and verbs which carry certain lexical meaning develop over time into grammatical items such as auxiliaries, case markers, inflections, and sentence connectives. Grammaticalization of verbs in Tamil occurs in all the grammatical categories. Verbs in Tamil are grammaticalized into auxiliary verbs, verbalizers, adjectivalizers, adverbilalizers, complementizer and prepositions.
Key words: grammaticalization, auxiliary verb, verbalizer, adjectivalizer, adverbilalizer\, complementizer, preposition
Grammaticalization has been defined as "the change whereby lexical items and constructions come i... more Grammaticalization has been defined as "the change whereby lexical items and constructions come in certain linguistic contexts to serve grammatical functions, and, once grammaticalized, continue to develop new grammatical functions" (Hopper & Traugott 2003:1). Simply said, grammaticalization is the process in which a lexical word or a word cluster loses some or all of its lexical meaning and starts to fulfil some grammatical function. Where grammaticalization takes place, nouns and verbs which carry certain lexical meaning develop over a period of time into grammatical items such as auxiliaries, case markers, inflections, and sentence connectives. Verbs in Tamil are grammaticalized into auxiliary verbs, verbalizers, adjectivalizers, adverbializers, complementizers and prepositions.
International Journal of Dravidian Linguistics (IJDL)Volume 48 no 2 , 2019
Polysemy is very well pronounced in verbs than in nouns in Tamil. So accounting of polysemy in ve... more Polysemy is very well pronounced in verbs than in nouns in Tamil. So accounting of polysemy in verbs becomes very crucial. Certain verbs are more polysemous than certain other verbs. For example Kriyaavain taRkaalta tamiz akaraati ‘Crea’s Modern Tamil dictionary’ (2008) lists 54 senses for the verb pooTu ‘put’; 27 senses for the verb poo ‘go’; 3 senses for the verb paTu ‘lie down’. The verbs show physical as well as metaphorical extensions of meaning. Some of the meaning extensions are predictable and some are not predictable. The predictable meaning extensions are easy to deal with; but the unpredictable ones are difficult to handle. There are different types of mechanisms of meaning extensions. Though one can note down certain universal tendencies in the meaning extension of verbs, many meaning extensions are ad hoc and beyond explainable cognition. The meaning extensions can be approached as result of productive mechanism form the point of view of the theory of generative lexicon propounded by Pustejovsky (1995). It can also be approached as a result of cognitive mechanism. Both have their own pros and cons. An alternative way of handling polysemy among verbs is proposed in this paper. The semantic extension of verb is viewed as a continuous process and the senses listed in a dictionary are considered as reference points in the meaning space of the verb. We try to capture these reference points by means of context clustering using corpus.
Keywords: cognitive extension, cognitive extension of meaning, semantic extension, polysemy, generative lexicon, typology of meaning extension, mechanism of meaning extension,
Translation as part of the communicative ELT classroom approach is still a controversial area and... more Translation as part of the communicative ELT classroom approach is still a controversial area and one that provokes strong opinions. Translation was the basis of language teaching for a very long time, and then rejected as new methodologies started to appear. It was a key element of the Grammar Translation Method, which was derived from the classical method of teaching Greek and Latin. This was not a positive learning experience for many: as well as learners memorizing huge lists of rules and vocabulary, this method involved them translating whole literary or historic texts word for word.
Computational analysis of nominal verbal complexes involves two processes: 1. The analysis of nom... more Computational analysis of nominal verbal complexes involves two processes: 1. The analysis of nominal and verbal complex into minimal meaningful units and assigning semantic features to each unit. 1. The generation of the nominal and verbal complex out of the same meaningful units. Let us make an assumption that the building of nominal and verbal complexes is the concatenation of morphemes and bound words. Clearly the simplest way to build such a model would be to assume that the allowability of a particular morpheme or a bound word in a given context depends only upon the morpheme that precedes it. Take the word ceytuviTTeen, whose morphological structure is cey+tu + viT+T+een. The combination of cey which is a verb and tu which an adverbial marker forms the first chunk of the verbal complex and the combination of viT which is a secondary verb, T which is a past tense marker and een which is a person-number-marker forms the second chunk of the word. Both of the chunks (V1 and V2) make a verbal complex. Finites state Automata One can easily model such a system with a finite-state machine (finite-state automaton or finite-state transition network) of the kind familiar from formal language theory. More formally, a finite automation is defined by the following five parameters: Q: a finite set of N states q0, q1...,qN : a finite input alphabet of symbols q0: the start state F: the set of final states, F Q (q,i): the transition function or transition matrix between states. Given a state q Q and an input symbol i , (q,i) returns a new state q' Q. is thus a relation from Q to Q; A set of rewrite rules, or grammar, can be thought of not only as an intentional definition of the units of a language, but also as the description of an abstract machine which is able to accept (or generate) just those strings which belong to the language. These machines are called (abstract) automata, and the complexity of their potential behaviour is directly determined by the internal complexity of the rules of the grammar to which they correspond. All such machines may be characterized in terms
Translation Today, 2004
Historical novel is a novel that has as its setting a period of history and that attempts to conv... more Historical novel is a novel that has as its setting a period of history and that attempts to convey the spirit, manners, and social conditions of a past age with realistic detail and fidelity (which is in some cases only apparent fidelity) to historical fact. The work may deal with actual historical personages, or it may contain a mixture of fictional and historical characters. The historical novel Ponniyin Selvan taken for our analysis is a mixture of fictional and historical characters. The events are also both historical and fictional. Translating such a historical novel is a challenge for the translator. Arguably, the barriers to translation of the historical novel from Tamil to English are even higher since the challenges are many which include taking the readers not only to a new language situation but also to a period in the past. Before resorting to translation, the translator has to be sure that the novel to be translated meets the exacting standards of native English readers of historical fiction. The translator Indra Neelameggham who translated the first part of Ponniyin Selvan has done her job with meticulous care. The translated version can be taken as a model to those who resort to translation of historical novels. The strategies adopted by Indra Neelameggham to make her venture palatable to English readers are highly commendable. So it is worth attempting to learn lessons from her translated work.
It is difficult to interpret the meaning of a lexical item without context. Word net lists differ... more It is difficult to interpret the meaning of a lexical item without context. Word net lists different senses of a word and pro-vide definition and usage example for each sense. But like any sense enumera-tive lexicon it also does not provide any mechanism for the novel usage of a word. The polysemy found in verbs and adjec-tives convincingly tell us that we have to augment wordnet with context. Such me-chanism will help us to condense senses listed under a word and allow us to interp-ret the senses of a word creatively or ge-neratively.
This paper presents the Part Of Speech tagger and Chunker for Tamil using Machine learning techni... more This paper presents the Part Of Speech tagger and Chunker for Tamil using Machine learning techniques. Part Of Speech tagging and chunking are the fundamental processing steps for any language processing task. Part of speech (POS) tagging is the process of labeling automatic annotation of syntactic categories for each word in a corpus. Chunking is the task of identifying and segmenting the text into syntactically correlated word groups. These are done by the machine learning techniques, where the linguistical knowledge is automatically extracted from the annotated corpus. We have developed our own tagset for annotating the corpus, which is used for training and testing the POS tagger generator and the chunker. The present tagset consists of thirty-two tags for POS and nine tags for chunking. A corpus size of two hundred and twenty five thousand words was used for training and testing the accuracy of the POS tagger and Chunker. We found that SVM based machine learning tool affords the most encouraging result for Tamil POS tagger (95.64%) and chunker (95.82%).
இங்கு வினையடிகளை அதன் அசையமைப்புச்சாத்தியம் அடிப்படையில் ஆய்வு மேற்கொள்ளப்பட்டுள்ளது. வினைகளை அசை... more இங்கு வினையடிகளை அதன் அசையமைப்புச்சாத்தியம் அடிப்படையில் ஆய்வு மேற்கொள்ளப்பட்டுள்ளது. வினைகளை அசைகள் அடிப்படையில் இரு பகுதிகளாகப் பகுக்கப்பட்டு, முதல் பகுதியில் வரும் அசைகளின் அல்லது எழுத்தக்களின் சாத்தியங்களின் அடிப்படையில் வினையடிகள் இங்கு ஆயப்பட்டுள்ளன. தமிழில் 12 உயிர்களும் ஏழு மெய்களும் (க், ச், த், ந், ப், ம், வ்) வினைச்சொற்களின் முதலில் வரும் (ஞ், ய், வினைச்சொற்களின் முதலசையில் வாரா.) இவற்றின் அடிப்படையில் 12 உயிர்களும் 84 உயிர்மெய்களும் வினையின் முதலில் வரவல்லன. இருப்பினும் வு, வூ, வொ, வோ என்பன மொழி முதலில் வாரா. இவற்றைக் கழித்து கீழே பட்டியலிடப்பட்டள்ள 92 (12+84=96-4= 92) எழுத்துக்கள் அல்லது அசைகள் வினையின் முதலெழுத்துகளாக அல்லது முதலசைகளாக வர வல்லன:
அ ஆ இ ஈ உ ஊ எ ஏ ஐ ஒ ஓ ஓள
க கா கி கீ கு கூ கெ கை கொ கோ கெள
ச சா சி சீ சு சூ செ சே சை சோ சௌ
த தா தி தீ து தூ தெ தே தை தொ தோ தெள
ந நா நீ நூ நெ நே நை நொ நோ நெள
ப பா பி பீ பு பு பெ பே பை பொ போ பெள
ம மா மி மீ மு மு மெ மே மை மொ மோ மெள
வ வா வி வீ வெ வே வை வெள
ஒரு குறிப்பிட்ட ஈற்றின் முன் வரவியலும் முன்னசைகளின் அடிப்படையில் 92 வினையடிகள் சாத்தியமாகும். இங்கு வினையடிகளின் இறுதியசையை அல்லது எழுத்தை நிர்ணயித்துக்கொண்டு, அதனுடன் சொல் முதலில் வரவியலும் அசைகளின் அடிப்படையில் சாத்தியமான வினையடிகளும் உண்மையாக வரும் வினையடிகளும் கண்டுபிடிக்கப்பட்டுள்ளன. இது வினையடிகளின் மீட்டுருவாக்கத்திற்கும் வழக்கிழந்த வினைகளை அறிந்துகொள்வதற்கும் உதவும்.
வினையடிகளின் அமைப்பும் ஆக்கமும் விளக்கப்படும். இங்கு தனிநிலை அடிகள், கூட்டுநிலை அடிகளுக்கு எதிரா... more வினையடிகளின் அமைப்பும் ஆக்கமும் விளக்கப்படும். இங்கு தனிநிலை அடிகள், கூட்டுநிலை அடிகளுக்கு எதிராகக் கருத்தில் கொள்ளப்பட்டு தனிநிலை வினைகளின் அமைப்பும் ஆக்கமும் மட்டுமே கருத்தில் கொள்ளப்பட்டுள்ளன. தனிநிலை அடி என்பதை வருணனை நிலையில் எந்த வினையாக்க உருபனின் இடையீடுமின்றி காலம், வினைநோக்கு மற்றும் வினையாற்றுவகை ஒட்டுகளால் நேரடியாகத் திரிபுறுவனவாகும் என்று வரையறை செய்யலாம். பொரும்பாலான தனிநிலை அடிகள் திராவிட மொழி மூலம் சார்ந்தவையாகும். ஒரு வேர் கூறை சொல்லின் பிற கூறிலிருந்து பிரிக்கும் எல்லை சொற்களை ஒன்றுடன் ஒன்று ஒப்பிட்டு வேர், ஆக்ககூறு எனப்பிரிக்கப்படும். திர் என்பதைப் பொதுவான வினைவேர் கூறாகவும் இ, உகு, அள், உம்பு என்பதனை மாறுபடும் வினையடியாக்கக் கூறுகளாகவும் பிரித்தெடுக்கலாம். இதுபோல் அடு, அடை, அடுக்கு, அடக்கு, அடங்கு என்ற வினையடிகளில் அட் என்பதை பொதுவான கூறாகப் பிரித்தெடுக்கலாம். உ, ஐ, அக்கு, அங்கு என்பன வேறுபடும் வினையடியாக்கக் கூறுகளாகும். எனவே இடப்பெயர்ப்பு அடிப்படையிலும் சரிநிகர் வேறுபாடுகள் அடிப்படையிலும் நாம் வினை வேர்களின் எல்லைகளை நிறுவ இயலும். இது வருணனை மொழியியலில் உருபன் எல்லைகளைக் காட்டுவதற்குச் சமமானது. புள்ளியியல் அடிப்படையில் பார்த்தால் நாம் நிறுவும் பின்னொட்டுக்கள் வேர்களை விட எண்ணிக்கையில் மிகக் குறைவானதாக உள்ளன. இவ்வியலில் தமிழ் வினையடிகள் மேற்சொன்ன செயல்பாட்டு அடிப்படையில் வினை வேர்களாகவும் ஆக்க ஒட்டுகளாகவும் பிரித்து ஆயப்பட்டு ஆய்வின் முடிவுகள் இங்கு விளக்கப்பட்டுள்ளன. ஒரே மொழியில் பலகாலகட்டங்களில் அல்லது பலவிடங்களில் வரும் ஒப்பிடத் தகுந்த வினைச் சொற்களை ஒப்பிட்டு வேர்களையும் வடிவாக்க ஒட்டுக்களையும் பெறுவது அகமீட்டுருவாக்கம் (internal reconstruction) என்றும் சகோதர மொழிகளில் வரும் ஒப்பிடத் தகுந்த சொற்களுடன் ஒப்பிட்டு ஆய்வது புறமீட்டுருவாக்கம் (comparative reconstruction) என்றும் வரலாற்று மொழியியல் ஆய்வில் கூறப்படும். இங்கு தமிழிலக்கியங்களில் வரும் வினைச்சொற்கள் ஒப்பிடப்பட்டு அகமீட்டுருவாக்கம் அடிப்படையில் ஆயப்பட்டுள்ளன.
இங்கு வினையடிகளை அதன் அசையமைப்புச்சாத்தியம் அடிப்படையில் ஆய்வு மேற்கொள்ளப்பட்டுள்ளது. வினைகளை அசை... more இங்கு வினையடிகளை அதன் அசையமைப்புச்சாத்தியம் அடிப்படையில் ஆய்வு மேற்கொள்ளப்பட்டுள்ளது. வினைகளை அசைகள் அடிப்படையில் இரு பகுதிகளாகப் பகுக்கப்பட்டு, முதல் பகுதியில் வரும் அசைகளின் அல்லது எழுத்தக்களின் சாத்தியங்களின் அடிப்படையில் வினையடிகள் இங்கு ஆயப்பட்டுள்ளன. தமிழில் 12 உயிர்களும் ஏழு மெய்களும் (க், ச், த், ந், ப், ம், வ்) வினைச்சொற்களின் முதலில் வரும் (ஞ், ய், வினைச்சொற்களின் முதலசையில் வாரா.) இவற்றின் அடிப்படையில் 12 உயிர்களும் 84 உயிர்மெய்களும் வினையின் முதலில் வரவல்லன. இருப்பினும் வு, வூ, வொ, வோ என்பன மொழி முதலில் வாரா. இவற்றைக் கழித்து கீழே பட்டியலிடப்பட்டள்ள 92 (12+84=96-4= 92) எழுத்துக்கள் அல்லது அசைகள் வினையின் முதலெழுத்துகளாக அல்லது முதலசைகளாக வர வல்லன:
அ ஆ இ ஈ உ ஊ எ ஏ ஐ ஒ ஓ ஓள
க கா கி கீ கு கூ கெ கை கொ கோ கெள
ச சா சி சீ சு சூ செ சே சை சோ சௌ
த தா தி தீ து தூ தெ தே தை தொ தோ தெள
ந நா நீ நூ நெ நே நை நொ நோ நெள
ப பா பி பீ பு பு பெ பே பை பொ போ பெள
ம மா மி மீ மு மு மெ மே மை மொ மோ மெள
வ வா வி வீ வெ வே வை வெள
ஒரு குறிப்பிட்ட ஈற்றின் முன் வரவியலும் முன்னசைகளின் அடிப்படையில் 92 வினையடிகள் சாத்தியமாகும். இங்கு வினையடிகளின் இறுதியசையை அல்லது எழுத்தை நிர்ணயித்துக்கொண்டு, அதனுடன் சொல் முதலில் வரவியலும் அசைகளின் அடிப்படையில் சாத்தியமான வினையடிகளும் உண்மையாக வரும் வினையடிகளும் கண்டுபிடிக்கப்பட்டுள்ளன. இது வினையடிகளின் மீட்டுருவாக்கத்திற்கும் வழக்கிழந்த வினைகளை அறிந்துகொள்வதற்கும் உதவும்.
இக்கட்டுரை “தமிழ் வினையடிகளின் வரலாற்று மொழியியல் ஆய்வு (A Historical Linguistic Analysis of Tami... more இக்கட்டுரை “தமிழ் வினையடிகளின் வரலாற்று மொழியியல் ஆய்வு (A Historical Linguistic Analysis of Tamil verbal Bases)” என்ற செம்மொழி நிறுவன நிதி நல்கையில் மேற்கொள்ளப்பட்ட ஆய்வுத்திட்டத்திற்கு 2008-இல் சமர்ப்பிக்கப்பட்ட ஆய்வேட்டின் (இராசேந்திரன், 2008) ஒரு இயலாக அமைகின்றது.
வினை என்பது பொதுவாக ஒரு வாக்கியத்தில் ஒரு செயலையோ நிலையையோ வெளிப்படுத்துவதற்காக பயனிலையில் வரும் முக்கியமான அங்கமாகும். இது காலம், வினைநோக்கு, வினையாற்றுவகை, வினைப்பாடு இவற்றிகாகத் திரிபுறும். வினைகள் மரபிலக்கணத்தராலும் தற்கால இலக்கணதாராலும் வகைப்படுத்தப்பட்டுள்ளன. வினையடிகளின் பாகுபாட்டைப் பின்வரும் தலைப்பில் விளக்கலாம்:
1. தெரிநிலை வினை-குறிப்பு வினைப் பாகுபாடு
2. தன்வினை-பிறவினைப் பாகுபாடு
3. செயப்படுபொருள் குன்றாவினை-குன்றியவினைப் பாகுபாடு
4. வினைத்திரிபுசார் பாகுபாடு
5. சீரற்ற-சீரான வினைப் பாகுபாடு
வினை அடிகளை அவற்றின் உருபனியல் மற்றும் உருபொலியனியல் நடத்தை அடிப்படையில் பாகுபாடு செய்வது வினைகளின் திரிபுகளையும் ஆக்கங்களையும் அறிந்துகொள்ள பயனுள்ளதாக அமையும். இதன் அடிப்படையில் வினை அடிகள் பின்வருமாறு பாகுபாடு செய்யப்பட்டு விளக்கப்பட்டன: தெரிநிலை வினை-குறிப்பு வினைப் பாகுபாடு, தன்வினை-பிறவினைப் பாகுபாடு, செயப்படுபொருள் குன்றாவினை-குன்றியவினைப் பாகுபாடு, வினைத்திரிபுசார் பாகுபாடு, சீரற்ற-சீரான வினைப் பாகுபாடு. பலவேறு அறிஞர்கள் வினைத்திரிபு அடிப்படையில் தமிழ் வினைகளைப் பகுத்துள்ளமை பற்றி விரிவாகக் கூறப்பட்டது. சீரற்ற-சீரான வினைப்பாகு பாடு அடிப்படையிலும் வினைகளைப் பகுப்பது விளக்கப்பட்டு ஒட்டு மொத்தமான வினைப்பாகுபாடு இறுதியில் தரப்பட்டுள்ளது.
Sarasavi Publishers, Sri Lanka
Headings Chapter 1: Introduction to Translation Chapter 2: Lexical Gaps and and untranslatability... more Headings
Chapter 1: Introduction to Translation
Chapter 2: Lexical Gaps and and untranslatability in translation
Chapter 3: Using untranslatability as a literary device
Chapter 4: Word order in translation
Chapter 5: Translation in Language Teaching
Chapter 6: Evaluation of Translation skill among school students
Chapter 7: Translation of Poetry
Chapter 8: Translation of Bharathidasan’s works
Chapter 9: Evaluation of Translation of Bharathidasan’s poems
Chapter 10: Translation of history text
Chapter 11: Translation of Historical novel
Chapter 12: Translation of Classical text
Chapter 13: Translation of Science
Chapter 14: Machine Translation
Chapter 15: Translation in India
Chapter 16: Translation in Sri Lanka
Sarasavi Publishers, Sri Lanka
Interest in language has not recently developed. It goes back centuries from now. The oldest gram... more Interest in language has not recently developed. It goes back centuries from now. The oldest grammar we know, the one written by Panini in 300 B.C., analyses the speech sounds of Sanskrit and its grammatical structure. The phenomenon of language has puzzled and attracted people's minds in many different ways. It may not be possible to explore all of them here. Interest in the numerous languages of the world has led to the scientific study of linguistic phenomena, particularly in their morphological aspects. This has given rise to two main types of classification - a structural type, based on the relative degree of synthesis of the words and how various parts of a word are attached to it, and a genetic type of classification. The genetic classification is based on comparative studies about phonetic and structural changes. Through a careful study of phonetic changes and changes in vocabulary, a theoretical reconstruction may be made of the original language
from which the present existing languages have stemmed, or
(since the interest in the origin of languages has faded) of the
distribution of languages and dialects. These studies may also
prove a valuable aid in studying the patterns of population
changes. Such studies necessitate thorough investigation of the phonetic or sound elements and the phonemes or
functionally significant units that make up a language pattern.
Apart from this scientific use, the study of speech sounds has its
practical application in the field of language teaching.
The sociological emphasis is divulged on the language as
it is a part of a social system. Language may be regarded not only
as a tool but as social action calling forth counter-action. The
psychologists have studied language from a different angle. Their
contribution lies in the psychology of communication. Generally
this field ranges from the mechanical aspects (phonetics,
perception of speech) to the socio-psychological patterns of
communication and barriers to communication, learning habits,
and distortion of testimony or of rumor.
For many the study of language means the only key to
the world of literature. They struggle valiantly to master speech
sounds, grammatical rules, idioms, and vocabulary, but their
ultimate aim is to enjoy the literary efforts of others or to express
themselves in that way.
The various aspects of language are all interrelated.
Therefore the special approaches should not be seen as separate
fields of study, but rather as a specific emphasis.
Deccan College Post-graduate and Research Institute, Pune (Deemed to-be University), 2021
This monograph investigates semantic change and semantic extension of verbs in Tamil. The semanti... more This monograph investigates semantic change and semantic extension of verbs in Tamil. The semantic change and semantic extensions of meaning of verbs are studied from the perspectives of cognitive semantics and generative lexicon. The monograph is organized into six chapters. They are briefly described below.
There are a few earlier researches in Tamil on lexical semantics and semantic change. By chance they are the research works undertaken by Rajendran. “Syntax and semantics of Tamil verbs” is the PhD research work of Rajendran (1978). This work followed the principles of Nida (1975) expounded in his book entitled “Componential analysis of meaning: an introduction to semantic structures”. This work has great relevance to the present research work as Rajendran has classified verbs into certain semantic domains and subdomains based on the principles of componential analysis propounded by Nida (1975). He has also classified verbs into certain number of semantic domains based on the number and types of arguments taken by the verbs. He has identified the semantic features of verbs to distinguish one verb from the other and also identified common semantic features which can be ascribed to the verbs which belong to a particular semantic domain. The polysemy of each verb are identified and classified based on the semantic parameters. Another important work on lexical semantics by Rajendran is his post-doctoral work on “Semantics of Tamil vocabulary”. These works have been culminated into two book entitled “taRkaalat tamiz coRkaLanjciyam (Thesaurus for modern Tamil)” which has been written in Tamil and published by Tamil university in 2001 (Rajendran 2001) and ‘tamiz min coRkaLanjciyam (Tamil electronic thesaurus)” written in collaboration with Baskaran and published by Tamil University in 2006 (Rajendran 2006). He has published a book on lexical semantics entitled “coRkaL: vaazvum varalaaRum (Words: Life and History) written in collaboration with Sakthivel. His research papers entitled “Verbs of ‘seeing’ in Tamil’ (Rajendran 1982), “Coming and Going in Tamil” (Rajendran 1983), “Semantic Structure of Directional verbs of movement in Tamil”, (Rajendran 2002), “Syntax and semantics of Verbs of Transfer in Tamil” (Rajendran 2002), “Creating generative lexicon from dictionaries” (Rajendran 2003), “Building generative lexicon from MRDs in Tamil” (Rajendran 2010), “Grammaticalization verbs in Tamil” (Rajendran 2018) and “Cognitive extensions of meaning in verbs of movement in Tamil” (Rajendran 2019) have direct or indirect bearing on the present research work. Some of unpublished research manuals but uploaded in the websites academia.edu and Research Gate which can be said to be directly or indirectly concerned with the present research work are “tamiz colvalai (Tamil WordNet)”, “muulapporuNmaiyiyal aavyu” (Ontological structure for Tamil), “tamiz peyarc coRkaLin aakkamuRai akaraati” (Generative lexicon for Tamil nouns)” and “tamiz vinaicoRkaLin aakkamuRai akaraati (Generative lexicon for Tamil)”.
The present work has its starting point in “Syntax and semantics of Tamil verbs (Rajendran 1978). The verbs of Tamil have been collected and classified based on the principles of componential analysis meaning propounded by Nida (1975). Also the polysemy of the verbs is explained based on the principles explained by Nida in the same book. Attempts have been made to classify the meanings that can be given under particular verbs. The synonymy is explained based on the senses rather than by words. Such classification explained the semantic extension of verbs which can be attributed to various principles such as metaphorical extension, metonymical extension, and analogical extension and so on.
The aim of this research is to find out the reason for semantic change and semantic extension of meanings of verbs and classify the resultant polysemy so as to find out general principles on these processes of meaning difference. The units of meaning can include words, phrases and grammatical units. For example, the verbs in Tamil such as vaa ‘come’, poo ‘go’ have been grammaticalized to function as auxiliary verbs denoting some aspectual meaning (Rajendran 2019). Two theories have been going to be explored to explain the sematic change and sematic extension of verbs: one is cognitive theory of meaning and another is the theory propounded by Pushtejovsky (1995) in his generative lexicon.
Explaining the semantic extension or semantic change of meaning of verbs is undertaken in two ways: one is to classify the verbs into certain semantic domains based on distinctive semantic features and then explain the polysemy in the members of each domain (Rajendran 1979, 2020); and another is to explain how verbs belonging to a domain move to another domain by cognitive principles of semantic extension.
Dictionaries list words as entries and gives different meanings based on their usage and thus functions as word information resources. Dictionaries lists different meanings of a verb under an entry and try to convince the users that each is a separate meaning by explanation and giving the examples to support their conviction. Thesaurus on the other hand, classifies the words into semantic domains and subdomains and gives word under each domain or subheading. WordNet is a combination of thesaurus and dictionaries. In WordNet, words are grouped into synsets (synonymous sets) and the synonyms are linked by semantic and lexical relations, thus forming a network of words or concepts (each meaning denoted by a word is a concept).
The problem with a dictionary is that in its efforts to account for the different uses of a lexical item or word, it goes on increasing the list of meaning under each word entry. This will cause not only the increase in the size of the dictionary but also the increase in number of volumes of the dictionary. A verb expands its usage quite wider than a noun. The expansion of numbers of senses under each nouns is comparatively less when compared to verbs. The polysemy found in verbs leads to ambiguity which is a serious issue in machine translation. The polysemy found in verbs and the expansion of dictionaries disproportionately due to polysemy needs to be accounted by different means. The expansion of meaning in terms of different senses can be assumed or predicted or expected to some extent. This predictable expansion of meaning can be explained or put into rules. But the senses assigned to a verb undergo unpredictable mutations which cannot be easily explained. In order to account for the dynamic process of polysemy mainly due to semantic change or meaning expansion, especially in verbs, it is felt that the polysemy needs to be addressed seriously.
The endless list of meanings found in the entries of verbs in a dictionary led to the present study. It is felt that the semantic change or meaning extension need to be explained properly for the verbs to lessen the burden in lexicon. Practically speaking there is no principal difference between semantic extension and sematic change.
Tamil verbs expand its range application of meaning or usage of meaning in predictable terms as well as unpredictable terms. For the native speakers of Tamil such expansion of range or application of meaning may not appear strange. But a non-native speaker such extension of change of meaning may appear strange and it may be difficult for them to understand the meaning of a lexical item in unaccustomed contexts.
The expansion or change of meaning of a lexical item will be explicitly revealed if we compare the early dictionaries of Tamil (Tamil Lexicon of Madras University) with the present one (Creas’s Modern Tamil Dictionary). It is presumed here in this research that the meaning expansion or change are somewhat predicable and can be explained by cognitive principles or principles of generative lexicon. It is a well-known fact that meaning of a lexical item expands or changes metaphorically, metonymically and by analogy. This leads the moving of lexical items belonging to domain into another domain. This movement is due to the acquiring of new semantic features which are shared with the entity’s new place of existence. It is hoped that this can be explained by general principles of semantic expansion or change.
Morphology என்பது பொதுவாகப் பத்தொன்பதாவது நூற்றாண்டின் தொடக்கதில் உயிரியல் சூழலில் இதைப் புனைந்த ... more Morphology என்பது பொதுவாகப் பத்தொன்பதாவது நூற்றாண்டின் தொடக்கதில் உயிரியல் சூழலில் இதைப் புனைந்த ஜெர்மன் கவி, நாவலாசிரிர், நாடகாசிரியர், தத்துவவியலார் ஜோன் வொல்ஃப்காங் வொன் கொதெ (Johann Wolfgang von Gothe (1749-1832) என்பவருக்குச் சிறப்பீடாக அமையும். இதன் சொற்பிறப்பியல் கிரேக்க மொழியைச் சாரும்: Morph என்பதன் பொளுள் ‘வடிவம், உருவம்’ என்பதாகும்; Morphology/உருபனியல் என்பது வடிவத்தை அல்லது வடிவங்களைப் பற்றி படிப்பதாகும்/ஆய்வதாகும். உயிரியலில் Morphology/உருபனியல் என்பது உயிரினங்களின் வடிவத்தையும் அமைப்பையும் பற்றி படிப்பதாகும்/ஆய்வதாகும்’; புவியலில் இது நில வடிவங்களின் கட்டமைப்பு மற்றும் பரிமாண வளர்ச்சியைப் பற்றி படிப்பதாகும்/ஆய்வதாகும். மொழியியலில் Morphology/உருபனியல் என்பது சொல்லாக்கத்துடன் தொடர்புடைய உள ஒழுங்குமுறையைக் குறிப்பிடும். வேறுவிதமாகக் கூறினால் Morphology/உருபனியல் என்பது சொற்கள், அவற்றின் அக அமைப்பு மற்றும் அவை எவ்வாறு ஆக்கப்படுகின்றன என்பதை விளக்கும் மொழியியலின் ஒரு கிளையாகும்.
பின்வரும் பொருளடக்கத்தைக் கொண்டுள்ளது
1: அடிப்படைக் கருத்துக்கள்
உருபனியல்
சொல்லும் சொல்வடிவமும் சொல்லனும்
உருபன், உருபு, மாற்றுருபு
உருபனியல் ஆய்வு
பகுப்பாய்வும் கூட்டிணைப்பும்
பகுப்பாய்வுக் கொள்கைகள்
உருபனின் வகைகளும் வருகைமுறைகளும்
உருபனியல் கிளைகளும் மாதிரிகளும்
தமிழ் உருபனியல் அமைப்பு
பெயர்ச்சொற்களின் உருபனியல் அமைப்பு
வினைச்சொற்களின் உருபனியல் அமைப்பு
சொல்லாக்கம்
உருபொலியனியல்
சொல்வகுப்புகள்
Language in India www.languageinindia.com, 2023
இச்சிற்றேடு செம்மொழித் தமிழாய்யு மத்திய நிறுவனத்தில் "தமிழ் வினையடிகளின் வரலாற்று மொழியியல் ஆய்வு... more இச்சிற்றேடு செம்மொழித் தமிழாய்யு மத்திய நிறுவனத்தில் "தமிழ் வினையடிகளின் வரலாற்று மொழியியல் ஆய்வு (A Historical Linguistic Analysis of Tamilverbal Bases)" என்ற தலைப்பில் 2008-இல் சமர்ப்பிக்கப்பட்ட ஆய்வேட்டின் (இராசேந்திரன் 2008) ஒரு பகுதியாகும். இவ்வாய்வில் முதலில் வினை அடிகள் அவற்றின் உருனியல், உருபொலியனியல் பண்புக்கூறுகள் அடிப்படையில் வகைப்பாடு செய்யப்பட்டன. ஏற்கனவே செய்யப்பட்ட முயற்சிகள் பற்றி விளக்கமாகக் கூறுப்பட்டுள்ளன. இதைத் தொடர்ந்து வினை அடிகளின் சொல்சார் மாற்றம், பொருண்மையியல் மாற்றம், வடிவமாற்றம், உருபொலியனியல் மாற்றம், இலக்கண மாற்றம் என்பன குறித்து பழந்தமிழ் இலக்கியங்களில் காணப்படும் சான்றுகள் அடிப்படையில் விளக்கம் தரப்பட்டுள்ளன. இச்சிற்றேட்டிற்கு எடுத்துக்கொண்ட பகுதி பழந்தமிழில் காணப்படும் வினையடிகளுக்குத் திராவிடச் சொற்பிறப்பியல் அகராதியிலிருந்து நோக்கீட்டு எண்கள் தரும் நோக்கமாகத்தான் முதலில் கருதப்பட்டது. இதற்காகத்தான் திராவிடமொழிகளின் சொற்பிறப்பியல் அகராதி ஆயப்பட்டது. அவ்வாறு செய்கையில் ஒவ்வொரு நோக்கீட்டு எண்ணின் கீழும் தரப்பட்டுள்ள சொற்களும் அர்த்தங்களும் பல வரலாற்று மொழியியல் செய்திகளை வெளிப்படுத்தி நின்றன. எனவே திராவிடமொழிகளின் சொற்பிறப்பியல் அகராதியில் தரப்பட்டுள்ள சொற்களை அதில் தரப்பட்டுள்ள நோக்கீட்டு எண்கள் அடிப்படையில் தருவதோடு ஆய்வை நிறுத்திக்கொள்ள இயலாது என்று தோன்றியது. அவ்வகராதி வெளிப்படுத்தும் வரலாற்று மொழியியல் செய்திகளைத் தொகுத்துத் தர விரும்பி செய்திகள் திரட்டப் பட்டன. இது மிகப்பெரிய ஆய்வுக்கு வழிவகுக்கும் ஆய்வின் ஆழத்திற்குக் கொண்டு சென்று மூழ்கடித்துவிடம் என்று உணர்ந்தபோது அத்தகைய எண்ணம் கைவிடப்பட்டு திராவிட மொழிகளின் சொற்பிறப்பியல் அகராதியிலிருந்து ஒருசில நோக்கீட்டு எண்ணின் கீழ்வரும் தமிழ் வினையடிகளை மட்டும் எடுத்துக்கொண்டு வரலாற்று மொழியியல் நோக்கில் அவ்வினைகள் ஆயப்பட்டன. இந்த ஆய்வின் விளைவுகள் தான் இச்சிற்றேட்டின் இரண்டாம் இயலாகப் பரிமளித்துள்ளது. மூன்றாம் இயலில் திராவிடச் சொற்பிறப்பு அகராதியிலிருந்து கிடைத்த வினையடிகள் (தனிநிலை மற்றும் ஆக்க வினையடிகளை) திராவிடமொழிகளின் சொற்பிறப்பியல் அகராதியில் தரப்பட்டுள்ள நோக்கீட்டு எண்கள் அடிப்படையில் பட்டியலிட்டுள்ளன.
பரோ மற்றும் எமினோ (Burrow & Emeneau) என்போரால் உருவாக்கப்பட்ட திராவிட மொழிகளின் சொற்பிறப்பியல் அகராதியில் (Dravidian Etymological Dictionary - Revised (DEDR)) (இங்கு நமது தேவைக்காக திசொபி அகராதி எனச் சுருக்கித் தரப்பட்டூள்ளது.) காணப்படும் வினயைடிகள் யாவும் திரட்டப்பட்டு நோக்கீட்டு எண்ணுடன் இச்சிற்றேட்டில் தரப்பட்டுள்ளன. அவர்களது அகராதியைத் தழுவி அவற்றின் அர்த்தங்களும் அப்படியே தமிழாக்கம் செய்து தரப்பட்டுள்ளன. முதலில் ஒரு பின்னிணைப்பாகத் தரத்தான் இது திட்டமிடப்பட்டது. ஆனால் இவ்வகராதியில் காணப்படும் செய்திகள் வினையடிகளைப் பட்டியலிட்டால் மட்டும் போதாது ஆழ்ந்த வரலாற்று மொழியியல் ஆய்வுக்கு உட்படுத்த வேண்டும் என்ற எண்ணத்திற்குக் கொண்டுசென்றது. அரகாதியில் நோக்கீட்டு எண் ஒவ்வொன்றின் கீழும் சொற்கள் அவற்றின் அர்த்தங்களுடன் தரப்பட்டுள்ளன. ஒவ்வொரு நோக்கீட்டு எண்ணின் கீழும் அடக்கப்படும் சொற்கள், குறிப்பாக வினைசொற்களும் பெயர்ச்சொற்களும் அவற்றின் அர்த்தங்களுடன் நமக்கு தருவது பெரிய சொற்பிறப்பு அல்லது சொல்லாக்க வரலாறாகும். இது பரந்த வரலாற்று மொழியியல் ஆய்வுக்குரிய தரவாகும். வெறும் பட்டியல் அல்ல. எனவே இதை மனதில் கொண்டு 'திராவிடமொழிகளின் சொற்பிறப்பியல் அகராதியிலிருந்து கிடைக்கப்பெறும் தகவல் அடிப்படையில் சில வினைகளின் வரலாற்று மொழியியல் ஆய்வு' மற்றும் 'திராவிடமொழிகளின் சொற்பிறப்பியல் அகராதியிலிருந்து கிடைக்கப்பெறும் வினையடிகள்' என இரண்டாகப் பகுக்கபட்டு வரலாற்று மொழியியல் தகவல்கள் தரப்பட்டுள்ளன.
பழந்தமிழில் காணப்படும் வினையடிகளுக்குத் திராவிடச் சொற்பிறப்பியல் அகராதியிலிருந்து நோக்கீட்டு எண்க... more பழந்தமிழில் காணப்படும் வினையடிகளுக்குத் திராவிடச் சொற்பிறப்பியல் அகராதியிலிருந்து நோக்கீட்டு எண்கள் தரும் நோக்கத்திற்காகத்தான் நான் திராவிட சொற்பிறப்பியல் அகராதியை ஆயத்தொடங்கினேன். ஒவ்வொரு நோக்கீட்டு எண்ணின் கீழும் தரப்பட்டுள்ள சொற்களும் அர்த்தங்களும் பல வரலாற்று மொழியியல் செய்திகளை எனக்கு இயம்பின. எனவே திராவிடமொழிகளின் சொற்பிறப்பியல் அகராதியில் தரப்பட்டுள்ள சொற்களை அதில் தரப்பட்டுள்ள நோக்கீட்டு எண்கள் அடிப்படையில் தரவதோடு எனது ஆய்வை நிறுத்திக்கொள்ள நான் விரும்பவில்லை. அவ்வகராதி வெளிப்படுத்தும் வரலாற்று மொழியியல் செய்திகளைத் தொகுத்துத் தர விரும்பி நான் செய்திகளைத் திரட்டத் தொடங்கினேன். இது மிகப்பெரிய ஆய்வுக்கு வழிவகுக்கும் என்னை ஆய்வின் ஆழத்திற்குக் கொண்டு சென்று மூழ்கடித்துவிடம் என்று உணர்ந்தபோது அத்தகைய எண்ணத்தைக் கைவிட்டு திராவிட சொற்பிறப்பியல் அகராதியிலிருந்து ஒருசில நோக்கீட்டு எண்களின் கீழ்வரும் தமிழ் வினையடிகளை மட்டும் எடுத்துக்கொண்டு வரலாற்று மொழியியல் நோக்கில் எனக்குப் பட்ட சில செய்திகளை இச்சிற்றேட்டின் இரண்டாம் இயலில் விளக்கி உள்ளேன். மூன்றாம் இயலில் சொற்பிறப்பு அகராதியிலிருந்து எனக்குக் கிடைத்த வினையடிகளை (தனிநிலை மற்றும் ஆக்க வினையடிகளை) திராவிடமொழிகளின் சொற்பிறப்பியல் அகராதியில் தரப்பட்டுள்ள நோக்கீட்டு எண்கள் அடிப்படையில் பட்டியலிட்டுள்ளேன். இத்தகைய ஆய்வு எத்தகை விளைவுகளை வெளிப்படுத்தும் யாருக்குப் பயன்படும் என்று எனக்குத் தெரியவில்லை.
இச்சிற்றேடு செம்மொழித் தமிழாய்வு மைத்திய நிறுவனத்தில் "தமிழ் வினையடிகளின் வரலாற்று மொழியியல் ஆய்வு (A Historical Linguistic Analysis of Tamil verbal Bases)" என்ற தலைப்பில் மேற்கொள்ளப்பட்ட ஆய்வுத்திட்டதின் விளைவாக 2008-இல் என்னால் சமர்ப்பிக்கப்பட்ட ஆய்வேட்டின் ஒரு பகுதியாகும். இவ்வியலை விரிவுபடுத்தி வேண்டிய மாற்றங்கள் செய்து Language in India மூலம் இதை வெளியிடுகின்றேன். ஒட்டுமொத்தமான நூலும் செம்மொழித் தமிழாய்வு மத்திய நிறுவனத்தால் வெளியிடப்படும் எனக் காத்திருந்தேன். இதுவரை அது நிறைவேறாததால் தற்போதைய சிற்றேட்டை உங்கள் முன் சமர்ப்பிக்கின்றேன்.
Language in India www.languageinindia.com ISSN 1930-2940 Vol. 23:4 April 2023, 2023
வரலாற்று மொழியியலில், இலக்கணவயமாக்கம் (grammatization or grammaticization) என்பது மொழி மாற்றத்தின... more வரலாற்று மொழியியலில், இலக்கணவயமாக்கம் (grammatization or grammaticization) என்பது மொழி மாற்றத்தின் ஒரு செயல்முறையாகும்; இதன் மூலம் பெயர் மற்றும் வினைகளைக் குறிக்கும் சொற்கள் இலக்கணக் குறிப்பான்களாக (ஒட்டுக்கள், முன்னுருபுகள் பின்னுருபுகள், துணைவினைகள் போன்றவைகளாக) மாறும். இவ்வாறு இலக்கணவயமாக்கம் சொற்களுக்குப் புதிய இலக்கணச் செயல்பாடுகளை உருவாக்குகிறது. இலக்கணவயமாக்கத்திற்கு உட்பட்ட சொல் அதன் உள்ளடக்க அர்த்தத்தை முற்றிலுமாக இழந்து இலக்கணக் குறிப்பான்களாக மாறலாம் அல்லது இலக்கண செயல்பாடுகளுடன் அதன் உள்ளடக்க அர்த்தத்தையும் தக்க வைத்துக் கொள்ளலாம். இந்தச் செயல்முறையைப் புரிந்து கொள்ள, குறிப்பிட்ட சொற் பொருளைக் கொண்ட உள்ளடக்கச் சொற்களுக்கும் இலக்கணச் செயல்பாட்டைக் குறிக்கும் இலக்கணச்சொற்களுக்கும் வேறுபாடு பாராட்டவேண்டும்.
"இலக்கணமயமாக்கல்" என்ற கருத்து நீண்ட வரலாற்றைக் கொண்டுள்ளது. இந்த நிகழ்வு முதலில் Meillet (1912) (இரண்டாம் ஆதாரம் Coupe 2018) மூலம் முன்மொழியப்பட்டது. பின்னர் இது கிவோன் (Givón 1975, 1979), லெஹ்மன் (Lehmann 1985), ட்ராகோட் மற்றும் ஹெய்ன் (Traugott and Heine 1991) ஆகியோரால் மேலும் உருவாக்கப்பட்டது. இலக்கணமயமாக்கல் பற்றிய பல ஆராய்ச்சிகள் அறிஞர்களால் மேற்கொள்ளப்பட்டு அவை ஆவணங்களாக வெளியிடப்பட்டன (Bybee, Perkins, and Pagliuca, 1994; Heine, Claudi, and Hünnemeyer (1991a; Heine and Kuteva 2002, 2005; கூபின் (Coupe, 2018) 'தெற்காசியாவின் மொழிகளில் இலக்கணமயமாக்கல் செயல்முறைகள்' the (‘Grammaticalization processes in the languages of South Asia’) என்பது இலக்கணமயமாக்கலுக்கு இங்குச் சிறப்பாகக் குறிப்பிட வேண்டும். வினைச்சொற்களின் இலக்கணப்படுத்தல் இந்திய மொழிகளில் ஒரு உண்மையான பண்புக்கூறாகத் தோன்றுகிறது. இந்தோ-ஆரிய மொழிகளில் திராவிட மொழிகளின் செல்வாக்கு காரணமாக கூறப்பட்டது. இங்கு இடம் இல்லாததால் ஆரம்பகால வெளியீடுகள் பற்றிய விரிவான விவாதம் தவிர்க்கப்படுகிறது.
பழந்தமிழ் வினையடிகளின் இலக்கணமாற்றம் பற்றி விளக்கும் தற்போதைய இச்சிற்றேடு பழந்தமிழில் ஏற்பட்ட வரலாற்றுமொழியியல் மாற்றத்தை விளக்குகின்றது. இதை ஒரு கட்டுரையாகத்தான் கருதி எழுத எண்ணினேன், ஆனால் தகவல்கள் கட்டுக்கடங்காமல் ஒரு சிற்றேடாக மிளிர்ந்துள்ளது. தற்காலத் தமிழில் காணப்படும் இலக்கணவயமாக்கம் பற்றி "Grammaticalization of Verbs in Tamil" என்ற தலைப்பில் International Journal of Dravidian Linguistics என்ற இதழில் 2020-இலும் திராவிட மொழிகளில் காணப்படும் இலக்கணவயமாக்கம் பற்றி "Grammaticalization of Verbs in Dravidian Languages" என்ற தலைப்பில் Language in India என்ற மின் இதழில் 2019-இலும் கட்டுரைகளை வெளியிட்டுள்ளேன். அவற்றைத் தொடர்ந்து "பழந்தமிழில் வினையடிகளின் இலக்கணமாற்றம்" என்ற இந்தச் சிற்றேட்டை வெளியிடுகிறேன். இந்தச் சிற்றேடு "தமிழ் வினையடிகளின் வரலாற்று மொழியியல் ஆய்வு (A Historical Linguistic Analysis of Tamil verbal Bases)" என்ற செம்மொழித் தமிழாய்வு மத்திய நிறுவன நிதி நல்கையில் மேற்கொள்ளப்பட்ட ஆய்வுத்திட்டத்தின் விளைவாக 2008-இல் சமர்ப்பிக்கப்பட்ட ஆய்வேட்டில் ஒரு இயலாக அமைகின்றது. இவ்வியலை விரிவுபடுத்தி வேண்டிய மாற்றங்கள் செய்து Language in India மூலம் இதை வெளியிடுகின்றேன். ஒட்டுமொத்தமான நூலும் செம்மொழித் தமிழாய்வு மத்திய நிறுவனத்தால் வெளியிடப்படும் எனக் காத்திருந்தேன். இதுவரை அது நிறைவேறாததால் தற்போதைய சிற்றேட்டை உங்கள் முன் சமர்ப்பிக்கின்றேன்.
இராசேந்திரன் (Rajendran June, 2020) தற்காலத் தமிழ் அடிப்படையில் தமிழ் வினைகளின் இலக்கணமயமாக்கம் எ... more இராசேந்திரன் (Rajendran June, 2020) தற்காலத் தமிழ் அடிப்படையில் தமிழ் வினைகளின் இலக்கணமயமாக்கம் என்பது பற்றி விரிவாக ஆய்ந்து கட்டுரை ஒன்றை வெளியிட்டுள்ளார். இது தற்காலத்தமிழில் வினைகள் இலக்கணவயமாக்கப்பட்டுள்ளதைப் பற்றி விளக்குகின்றது. வாசு அரங்கநாதன் அவர்களும் (Vasu Renganathan January 2020) தமது கட்டுரையில் சங்கத் தமிழிலிருந்து தற்காலத் தமிழுக்கு ஏற்பட்ட இலக்கணவயமாக்கம் மற்றும் தற்காலத் தமிழில் பெயர்கள் மற்றும் வினைகளின் பரிமாண வளர்ச்சி பற்றி விளக்குகின்றார். தற்போதைய இச்சிற்றேடு தமிழ் வினையடிகளின் வரலாற்று மொழியியல் ஆய்வு (A Historical Linguistic Analysis of Tamil verbal Bases) என்ற செம்மொழி நிறுவன நிதி நல்கையில் மேற்கொள்ளப்பட்ட ஆய்வுத்திட்டத்திற்கு 2008-இல் சமர்ப்பிக்கப்பட்ட ஆய்வேட்டின் பகுதியாக அமைகின்றது. இலக்கணாமயமாக்கம் பற்றிய ஆய்வு பழந்தமிழில் ஏற்பட்ட வரலாற்மொழியியல் மாற்றத்தை விளக்குகின்றது.
ஹாக்கெட் கூறியபடி (Hocket 1958-414) இலக்கணமாற்றம் என்பது இலக்கண மையத்தில் ஏற்படும் மாற்றம் ஆகும். இவ்வாய்வு வினையடிகளுக்கு மட்டும் எல்லைப்படுத்தப்பட்டுள்ளதால் இங்கு விளக்கப்படும் இலக்கண மாற்றம் காலப் பின்னொட்டுகளுக்குள் அடக்கப்பட்டுள்ளது. இருப்பினும் இத்தலைப்பில் மற்றொரு வகை மாற்றத்தை உள்ளடக்கவியலும். இது வினையடியின் செயல்பாட்டில் ஏற்படும் மாற்றம் அதாவது சொல் நிலையிலிருந்து இலக்கண நிலைக்குச் செல்லும் மாற்றம் எடுத்துக் கொள்ளப்படுகிறது. இது இலக்கணவயமாக்கம் என்று அழைக்கப்படுகிறது. இது மூன்று முக்கிய வகைகளை உள்ளடக்கும். அவை கீழே தரப்பட்டுள்ளன.
(1) வினையாக்கிகளாக வினையடிகள்
எடுத்துக்காட்டாக காதல் உறு, காதல் கொள், காதல் செய், காதல் புரி என்பன காதல்+இ என்பதற்கு நிகராகும். இங்கு உரு, கொள், செய், புரி என்ற வினையடிகள் வினையாக்கிகளாகச் செயல்படுகின்றன. வினையடிகளை வினையாக்கிகளாக மாற்றும் இவ்வகையிலான மாற்றம் இங்கு உட்படுத்தப்பட்டுள்ளது.
(2) துணைவினைகளாக வினையடிகள்
மாட்டு (பதிற்றுப்பத்து 22-23) என்ற வினையடி தனிநிலை வினையாகப் பயன்படுத்தப்படுகிறது. ஆனால் இது பின்வரும் நேர்வுகளில் துணைவினையாகப் பயன்படுத்தப்படுகிறது.
அறிய மாட்டேன் (தேவாரம் 4-57-8-2)
கூற மாட்டேன் (தேவாரம் 4-57-7-2)
செய்ய மாட்டேன் (நாலாயிரத்திவ்யப்பிரபந்தம் 897-2)
சொல்ல மாட்டேன் (தேவாரம் 6-13-6-3)
தெரிய மாட்டேன் (தேவாரம் 6-35-5-2)
பாட மாட்டேன் (தேவாரம் 4-23-1-1)
பேச மாட்டேன் (தேவாரம் 4-57-4-1)
வாழ மாட்டேன் (தேவாரம் 4-52-1-4)
மேற்கூறப்பட்ட எல்லா நேர்வுகளிலும் மாட்டு என்பது எதிர்மறை வினை நோக்கை குறிக்கும் துணைவினையாகச் செயல்படுகிறது. இவ்வகையான முதன்மை வினை துணை வினையாகச் செயல்படுவது ஒரு மாற்றமாகக் கருதப்பட்டு இலக்கணவயமாக்கத்தின் மாற்றமாக உட்படுத்தப்பட்டுள்ளது.
(3) வினையடிகள் உவமை இடைச்சொல்லாக
கொள் என்ற வினையடி ‘பொருந்து’ என்ற அர்த்தம் பெறுகிறது (புறநானூறு 92-1) ஆனால் துடிகொள் நுண்ணிடை ‘உடுக்கைபோல மெலிந்த இடை’ (நாலாயிரத் திவ்வியப்பிரபந்தம் 960-1) என்ற சூழலில் கொள் என்ற வினையடி ஒரு உவமை இடைச்சொல்லாகச் செயல்படுகிறது. வினையடிகள் மட்டுமின்றி வினைகளின் வேறுபட்ட வடிவங்களான எச்சவடிவமும் பெயரெச்ச வடிவமும்; உவமை இடைச்சொல்லாகச் செயற்படுகிறது.
விரி மணி வியப்ப மேனி (சீவகசிந்தாமணி 625-4)
வேல் உள நோக்கினாள் (கம்பராமயணம் 1-17-60-2)
கல்லொடும் தொடர்ந்த நெஞ்சம் (கம்பராமயணம் 5-4-39-2)
துடி கொண்ட இடை (தேவாரம் 6-75-6-3)
அயில் தரும் கண் (கம்பராமயணம் 4-10-36-2)
மின் காட்டும் கொடி மருங்குல் (தேவாரம் 6-76-3-1)
வினையடிகளின் பொருண்மை மற்றும் செயல்பாடு இவற்றின் இழப்பு இங்கு முக்கியத்துவம் வாய்ந்ததாகும். வினையடி உவமை இடைச்சொல்லாக மாறும் இவ்வகையான மாற்றம் இவ்வகைப்பாட்டின் கீழ் விளக்கப்பட்டுள்ளது. இம்மூன்று நேர்வுகளிலும் வினையடிகள் பொருளிழந்து அவை கிட்டத்தட்ட ஒரு இலக்கணப் பின்னொட்டாக மாறியுள்ளதால் இதில் பொருண்மை மாற்றமும் உள்ளடங்கும்.
இச்சிற்றேடு பின்வருமாறு ஆறு இயல்களாக ஒழுங்கமைக்கப்பட்டுள்ளது;
1 முன்னுரை
2 வினைத்திரிபாக்கவகுப்பின் மாற்றம்
3 வினைகள் வினையாக்கிகளாக மாறுதல்
4 வினைகள் துணை வினைகளாக மாறுதல்
5 வினைகள் உவமை உருபுகளாக மாறுதல்
6. சுருக்கவுரை
ஆங்கிலத்தில் blog 'வலைப்பூ' என்பது "weblog" என்பதிலிருந்து வெட்டி எடுக்கப்பட்டதாகும். ஒரு வலைப்பத... more ஆங்கிலத்தில் blog 'வலைப்பூ' என்பது "weblog" என்பதிலிருந்து வெட்டி எடுக்கப்பட்டதாகும். ஒரு வலைப்பதிவு என்பது உலகளாவிய வலையில் (World Wide Web) தனித்துவமான, பெரும்பாலும் முறைசாரா நாட்குறிப்பு-பாணி உரை உள்ளீடுகளை (பதிவுகள்) உள்ளடக்கிய ஒரு விவாதம் அல்லது தகவல் வலைத்தளமாகும். இடுகைகள் (Posts) பொதுவாக தலைகீழ் காலவரிசைப்படி காட்டப்படும், இதனால் மிக சமீபத்திய இடுகை முதலில் வலைப்பக்கத்தின் மேலே தோன்றும். 2009 வரை வலைப்பதிவுகள் வழக்கமாக ஒரு தனி நபரின் படைப்பாக இருந்தன. எப்போதாவது ஒரு சிறிய குழுவின், மற்றும் பெரும்பாலும் ஒரு பொருள் அல்லது தலைப்பை உள்ளடக்கியது. 2010களில் "பன்முக படைப்பாளி/எழுத்தாளர் வலைப்பதிவுகள்" (multi-author blogs (MABs) வெளிவந்தன, இதில் பன்முக படைப்பாளிகளின்/எழுத்தாளர்களின் எழுத்துக்கள் இடம்பெற்றன; சில அவை சமயங்களில் தொழில்ரீதியாக திருத்தப்பட்டன. செய்தித்தாள்கள், பிற ஊடகங்கள், பல்கலைக்கழகங்கள், சிந்தனைத் தொட்டிகள் (think-tank), பரிந்துபேசும் குழுக்கள் மற்றும் இதே போன்ற நிறுவனங்களின் பன்முக படைப்பாளி/எழுத்தாளர் வலைப்பதிவுகள் வலைப்பதிவு போக்குவரத்தின் அளவு அதிகரிப்பதற்குக் காரணமாகின்றன. ட்விட்டர் மற்றும் பிற "மைக்ரோ பிளாக்கிங்" அமைப்புகளின் எழுச்சி செய்தி ஊடகங்களில் பன்முக படைப்பாளி/எழுத்தாளர் வலைப்பதிவுகள் மற்றும் ஒற்றை எழுத்தாளர் வலைப்பதிவுகளை ஒருங்கிணைக்க உதவுகிறது. வலைப்பதிவை ஒரு வினைச்சொல்லாகவும் பயன்படுத்தலாம், அதாவது வலைப்பதிவில் உள்ளடக்கத்தை பராமரிக்க அல்லது சேர்க்கலாம்.
ஒரு வலைத்தளம் என்பது வலைப்பக்கங்கள் (web pages) மற்றும் தொடர்புடைய உள்ளடக்கங்களின் தொகுப்பாகும், இது ஒரு பொதுவான பொருண்மைக்களப் (domain) பெயரால் அடையாளம் காணப்பட்டு குறைந்தது ஒரு வலை சேவையகத்தில் (web server) வெளியிடப்படுகிறது. குறிப்பிடத்தக்க எடுத்துக்காட்டுகள் wikipedia.org, google.com மற்றும் amazon.com.
பொதுவில் அணுகக்கூடிய அனைத்து வலைத்தளங்களும் கூட்டாக உலகளாவிய வலையை (World Wide Web) உருவாக்குகின்றன. ஒரு நிறுவனத்தின் ஊழியர்களுக்கான உள் வலைத்தளம் போன்ற ஒரு தனியார் வலையமைப்பில் மட்டுமே அணுகக்கூடிய தனியார் வலைத்தளங்களும் உள்ளன,
வலைத்தளங்கள் பொதுவாக செய்தி, கல்வி, வர்த்தகம், பொழுதுபோக்கு அல்லது சமூக வலைப்பின்னல் போன்ற ஒரு குறிப்பிட்ட தலைப்பு அல்லது நோக்கத்திற்காக அர்ப்பணிக்கப்படுகின்றன. வலைப்பக்கங்களுக்கிடையில் மீத்தொடுப்பு (Hyperlinking) தளத்தின் வழிசெலுத்தலை வழிநடத்துகிறது; இது பெரும்பாலும் முகப்புப் பக்கத்துடன் தொடங்குகிறது.
பயனர்கள் டெஸ்க்டாப்புகள், மடிக்கணினிகள், டேப்லெட்டுகள் மற்றும் ஸ்மார்ட்போன்கள் உள்ளிட்ட பல்வேறு சாதனங்களில் வலைத்தளங்களை அணுகலாம். இந்த சாதனங்களில் பயன்படுத்தப்படும் மென்பொருள் பயன்பாடு வலை உலாவி (web browser) என அழைக்கப்படுகிறது.
இந்நூல் பின்வரும் ஒன்பது இயல்களைக் கொண்டுளது; வலைப்பூ அல்லது வலைப்பதிவு வலைப்பூ அல்லது வலைப்பதிவு... more இந்நூல் பின்வரும் ஒன்பது இயல்களைக் கொண்டுளது;
வலைப்பூ அல்லது வலைப்பதிவு
வலைப்பூ அல்லது வலைப்பதிவு உருவாக்கம்
வலைதளம்
வலைதள உருவாக்கம்
வலைப்பூ மரற்றும் வலைதள வடிவமைப்பிற்குக் கிடைக்கப்பெறும் இலவச மற்றும் கட்டற்ற/திறந்த வளங்கள்
வலை தளம் மற்றும் வலைப்பூக்கள் மாதிரி வடிவமைப்பு
இணையப் பயன்பாட்டு மென்பொருட்கள்
இணையப் பயன்பாட்டு மென்பொருட்கள் உருவாக்கத்திற்கான திட்டமிடல்
கட்டற்ற இணைய தரம் (நியமம்) / கட்டற்ற இணைய மேடை - இணையப் பயன்பாட்டு மென்பொருட்கள் உருவாக்கத்திற்கான சவால்கள்
வாசிப்பு போன்ற மனிதச் செயல்பாடுகளில் இயந்திரத்தின் உதவி ஒரு பழைய கனவு. இருப்பினும், கடந்த ஐந்து த... more வாசிப்பு போன்ற மனிதச் செயல்பாடுகளில் இயந்திரத்தின் உதவி ஒரு பழைய கனவு. இருப்பினும், கடந்த ஐந்து தசாப்தங்களாக, இயந்திர வாசிப்பு (machine reading) கனவில் இருந்து நினைவுக்கு வந்துள்ளது. அமைப்பொழுங்கு அறிதல் (pattern recognition) மற்றும் செயற்கை நுண்ணறிவு (artificial intelligence) துறையில் தொழில் நுட்பத்தின் மிக வெற்றிகரமான பயன்பாடுகளில் ஒன்றாக எழுத்துணரி மாறிவிட்டது. எழுத்துணரியை உருவாக்குவதற்கான பல வணிக அமைப்புகள் பலவகையான பயன்பாடுகளுக்கு இருக்கின்றன; இருப்பினும் இயந்திரங்கள் இன்னும் மனித வாசிப்பு திறன்களுடன் போட்டியிட முடியவில்லை. எழுத்துணரி தானாக அடையாளம் காணும் செயல்படும் நுட்பங்களின் குடும்பத்திற்குச் சொந்தமானது.
ஒளிவழி எழுத்துணரி (Optical Character Recognition - OCR) என்பது எழுதப்பட்ட அல்லது அச்சடிகப்பட்ட எழுத்துக்களை கணினி உணரும்படி மாற்றும் ஒரு தொழில் நுட்பம் ஆகும். முதலில் ஆவணங்களை வருட வேண்டும் (scanning). இதற்கு நுட்பமான உணர்திறன் வாய்ந்த வருடி (scanner) தேவைப்படும். பின்னர் இதை மென்பொருள் மூலம் கணினிக்குப் புரியும்படி செய்யலாம். தமிழுக்கான ஒளி எழுத்துணரி உருவாக்கப்பட்டுப் பயன்பாட்டில் உள்ளது. ராமகிருஷ்ணன் மற்றும் பிறர் (Ramakrishnan 2000 Aparna and Ramakrishnan) தமிழில் ஒளி எழுத்துணரி உருவாக்குவது பற்றி விரிவாக விளக்குகின்றனர்.
ஒளிவழி எழுத்துணரி (Optical Character Recognition (OCR) என்பது ரியாலிட்டி உலகத்தையும் மெய்நிகர் சொல்லையும் இணைப்பதற்கான வழிகளில் ஒன்றாகும். முதல் ஒளிவழி எழுத்துணரி அமைப்பு 1920களின் பிற்பகுதியில் அறிமுகப்படுத்தப்பட்டது. ஒளிவழி எழுத்துணரியின் நோக்கம் படத்திலிருந்து உரையை அறிந்துகொள்வதாகும். இருப்பினும், நிறைய காரணிகளால் மிக உயர்ந்த துல்லியத்தை அடைவது மிகவும் சவாலானது. இந்தச் சிக்கலைச் சமாளிக்க கூகிள் கிளவுட் விஷன் ஏபிஐ ஒன்றில் கூகிள் எவ்வாறு தீர்வை உருவாக்குகிறது என்பது இங்கு அறிமுகப்படுத்தப்படுகிறது.
கூகிள் ஒளிவழி எழுத்துணரி என்பது கூகிள் வழங்கிய ஒரு பயன்பாடாகும், இதன் பயனர்கள் அதன் மேடையில் ஒளிவழி எழுத்துணரி தொழில்நுட்பத்தை அணுகலாம் மற்றும் அவற்றின் ஸ்கேன் செய்யப்பட்ட படங்கள் அல்லது PDF கோப்புகளை உரை திருத்தக்கூடிய கூகிள் செயல்பாடாக மாற்றலாம். விரும்பிய கோப்பு மாற்றப்பட்டதும், இறுதி தயாரிப்பு விரும்பியபடி பயன்படுத்தப்படலாம். இதைக் கூகுள் ஆவணத்தில் திருத்தலாம், மற்றவர்களுடன் பகிர்வதற்கான மின்னஞ்சல்களில் இணைக்கப்படலாம் அல்லது கூடுதல் பயன்பாட்டிற்கு பதிவிறக்கம் செய்யலாம்.
இன்றைய வேகமாக வளர்ந்து வரும் தொழில்நுட்பத்தில், டிஜிட்டல் உணர்தல் பரந்த பங்கைக் கொண்டுள்ளன; மேலும் ஒளிவழி எழுத்துணரி நுட்பங்களில் ஆராய்ச்சி செய்ய அதிக வாய்ப்பை வழங்குகின்றன. மற்ற மேற்கத்திய மொழி ஸ்கிரிப்டுகளுடன் ஒப்பிடும்போது தமிழ் கையால் எழுதப்பட்ட ஸ்கிரிப்டுகளின் உணர்தல் சிக்கலானது. இருப்பினும், பல ஆராய்ச்சியாளர்கள் ஆஃப்லைன் தமிழ் எழுத்து உணர்தலுகும் நிகழ்நேர தீர்வுகளை வழங்கியுள்ளனர். ஆஃப்லைன் தமிழ் கையால் எழுதப்பட்ட ஆவணங்கள் உணர்தல் இன்னும் ஆராய்ச்சியாளர்களுக்கு பல ஊக்கமளிக்கும் சவால்களை வழங்குகிறது. தற்போதைய ஆராய்ச்சி தமிழ் கையால் எழுதப்பட்ட ஆவணங்களை உணர்வதில் பல தீர்வுகளை வழங்குகிறது, ஆனால் நியாயமான துல்லியம் மற்றும் செயல்திறன் அடையப்படவில்லை. \ தமிழ் கையால் எழுதப்பட்ட எழுத்து உணர்தல் தொடர்பான பல்வேறு அணுகுமுறைகள் மற்றும் சவால்களை பகுப்பாய்வு செய்கிறது. டிஜிட்டல் உள்ளடக்கம் தோன்றியவுடன், உயர் செயல்திறன் கொண்ட ஒளிவழி எழுத்துணரி இயந்திரத்தின் வளர்ச்சிக்கான தேவை அவசியமாகிவிட்டது. ஒளிவழி எழுத்துணரி ஆராய்ச்சி பணிகள் பல ஆராய்ச்சியாளர்களால் மேற்கொள்ளப்பட்டுள்ளன, அவை உயர் செயல்திறன் கொண்ட ஒளிவழி எழுத்துணரி இயந்திரத்தை உருவாக்குவதை நோக்கமாகக் கொண்டுள்ளன. ஒரு ஒளிவழி எழுத்துணரிக்குப் பின்னால் உள்ள யோசனை என்னவென்றால், ஒரு ஆவணப் படத்தை பக்கத்தை வரி கூறுகளாகப் பிரிப்பதன் மூலமும், மேலும் சொற்களாகப் பிரிப்பதன் மூலமும் பின்னர் எழுத்துக்களாகப் பிரிப்பதன் மூலமும் அடையாளம் காணவும் பகுப்பாய்வு செய்யவும். சாத்தியமான எழுத்துக்களைக் கணிக்க இந்த எழுத்துக்கள் பட வடிவங்களுடன் ஒப்பிடப்படுகின்றன. எழுத்துக்களை உணர்வது அச்சிடப்பட்ட ஆவணங்களிலிருந்து அல்லது கையால் எழுதப்பட்ட ஆவணங்களிலிருந்து செய்யப்படலாம். கையால் எழுதப்பட்ட ஆவண உணர்தல் ஆஃப்லைனில் அல்லது ஆன்லைனில் செய்யப்படலாம். ஆன்லைனை விட ஆஃப்லைன் எழுத்து உணர்தல் மிகவும் சிக்கலானது. குறிப்பாக, தமிழ் கையால் எழுதப்பட்ட ஒளிவழி எழுத்துணரி மற்ற தொடர்புடைய படைப்புகளை விட மிகவும் சிக்கலானது. ஏனென்றால், தமிழ் எழுத்துக்களில் அதிக கோணங்களும் மாற்றிகளும் உள்ளன. கூடுதலாக, தமிழ் ஸ்கிரிப்டில் அதிக எண்ணிக்கையிலான எழுத்துத் தொகுப்புகள் உள்ளன. மொத்தம் 247 எழுத்துக்கள்; 216 கூட்டு எழுத்துக்கள், 18 மெய், 12 உயிரெழுத்துகள் மற்றும் ஒரு சிறப்பு எழுத்து ஆகியவற்றைக் கொண்டுள்ளது. அங்கீகார செயல்பாட்டின் போது எதிர்கொள்ளும் சவால்கள் எழுத்துக்களில் உள்ள வளைவுகள், கோடுகள் மற்றும் துளைகளின் எண்ணிக்கை, நெகிழ் எழுத்துக்கள், மாறுபட்ட எழுத்து நடைகள் போன்றவை. எழுத்துக்குறி உணர்தலில் ஈடுபடும் படிகள் முன் செயலாக்கம், பிரிவு, அம்சம் பிரித்தெடுத்தல் மற்றும் வகைப்பாடு ஆகியவற்றை உள்ளடக்கியது. புள்ளிவிவர, கட்டமைப்பு மற்றும் கலப்பின என்ற மூன்று வகையான அம்சங்களை அங்கு பகுப்பாய்வு செய்யலாம்இன்றைய வேகமாக வளர்ந்து வரும் தொழில்நுட்பத்தில், டிஜிட்டல் உணர்தல் பரந்த பங்கைக் கொண்டுள்ளன; மேலும் ஒளிவழி எழுத்துணரி நுட்பங்களில் ஆராய்ச்சி செய்ய அதிக வாய்ப்பை வழங்குகின்றன. மற்ற மேற்கத்திய மொழி ஸ்கிரிப்டுகளுடன் ஒப்பிடும்போது தமிழ் கையால் எழுதப்பட்ட ஸ்கிரிப்டுகளின் உணர்தல் சிக்கலானது. இருப்பினும், பல ஆராய்ச்சியாளர்கள் ஆஃப்லைன் தமிழ் எழுத்து உணர்தலுகும் நிகழ்நேர தீர்வுகளை வழங்கியுள்ளனர். ஆஃப்லைன் தமிழ் கையால் எழுதப்பட்ட ஆவணங்கள் உணர்தல் இன்னும் ஆராய்ச்சியாளர்களுக்கு பல ஊக்கமளிக்கும் சவால்களை வழங்குகிறது. தற்போதைய ஆராய்ச்சி தமிழ் கையால் எழுதப்பட்ட ஆவணங்களை உணர்வதில் பல தீர்வுகளை வழங்குகிறது, ஆனால் நியாயமான துல்லியம் மற்றும் செயல்திறன் அடையப்படவில்லை. \ தமிழ் கையால் எழுதப்பட்ட எழுத்து உணர்தல் தொடர்பான பல்வேறு அணுகுமுறைகள் மற்றும் சவால்களை பகுப்பாய்வு செய்கிறது. டிஜிட்டல் உள்ளடக்கம் தோன்றியவுடன், உயர் செயல்திறன் கொண்ட ஒளிவழி எழுத்துணரி இயந்திரத்தின் வளர்ச்சிக்கான தேவை அவசியமாகிவிட்டது. ஒளிவழி எழுத்துணரி ஆராய்ச்சி பணிகள் பல ஆராய்ச்சியாளர்களால் மேற்கொள்ளப்பட்டுள்ளன, அவை உயர் செயல்திறன் கொண்ட ஒளிவழி எழுத்துணரி இயந்திரத்தை உருவாக்குவதை நோக்கமாகக் கொண்டுள்ளன. ஒரு ஒளிவழி எழுத்துணரிக்குப் பின்னால் உள்ள யோசனை என்னவென்றால், ஒரு ஆவணப் படத்தை பக்கத்தை வரி கூறுகளாகப் பிரிப்பதன் மூலமும், மேலும் சொற்களாகப் பிரிப்பதன் மூலமும் பின்னர் எழுத்துக்களாகப் பிரிப்பதன் மூலமும் அடையாளம் காணவும் பகுப்பாய்வு செய்யவும். சாத்தியமான எழுத்துக்களைக் கணிக்க இந்த எழுத்துக்கள் பட வடிவங்களுடன் ஒப்பிடப்படுகின்றன. எழுத்துக்களை உணர்வது அச்சிடப்பட்ட ஆவணங்களிலிருந்து அல்லது கையால் எழுதப்பட்ட ஆவணங்களிலிருந்து செய்யப்படலாம். கையால் எழுதப்பட்ட ஆவண உணர்தல் ஆஃப்லைனில் அல்லது ஆன்லைனில் செய்யப்படலாம். ஆன்லைனை விட ஆஃப்லைன் எழுத்து உணர்தல் மிகவும் சிக்கலானது. குறிப்பாக, தமிழ் கையால் எழுதப்பட்ட ஒளிவழி எழுத்துணரி மற்ற தொடர்புடைய படைப்புகளை விட மிகவும் சிக்கலானது. ஏனென்றால், தமிழ் எழுத்துக்களில் அதிக கோணங்களும் மாற்றிகளும் உள்ளன. கூடுதலாக, தமிழ் ஸ்கிரிப்டில் அதிக எண்ணிக்கையிலான எழுத்துத் தொகுப்புகள் உள்ளன. மொத்தம் 247 எழுத்துக்கள்; 216 கூட்டு எழுத்துக்கள், 18 மெய், 12 உயிரெழுத்துகள் மற்றும் ஒரு சிறப்பு எழுத்து ஆகியவற்றைக் கொண்டுள்ளது. அங்கீகார செயல்பாட்டின் போது எதிர்கொள்ளும் சவால்கள் எழுத்துக்களில் உள்ள வளைவுகள், கோடுகள் மற்றும் துளைகளின் எண்ணிக்கை, நெகிழ் எழுத்துக்கள், மாறுபட்ட எழுத்து நடைகள் போன்றவை. எழுத்துக்குறி உணர்தலில் ஈடுபடும் படிகள் முன் செயலாக்கம், பிரிவு, அம்சம் பிரித்தெடுத்தல் மற்றும் வகைப்பாடு ஆகியவற்றை உள்ளடக்கியது. புள்ளிவிவர, கட்டமைப்பு மற்றும் கலப்பின என்ற மூன்று வகையான அம்சங்களை அங்கு பகுப்பாய்வு செய்யலாம்.
வாசிப்பு போன்ற மனிதச் செயல்பாடுகளில் இயந்திரத்தின் உதவி ஒரு பழைய கனவு. இருப்பினும், கடந்த ஐந்து த... more வாசிப்பு போன்ற மனிதச் செயல்பாடுகளில் இயந்திரத்தின் உதவி ஒரு பழைய கனவு. இருப்பினும், கடந்த ஐந்து தசாப்தங்களாக, இயந்திர வாசிப்பு (machine reading) கனவில் இருந்து நினைவுக்கு வந்துள்ளது. அமைப்பொழுங்கு அறிதல் (pattern recognition) மற்றும் செயற்கை நுண்ணறிவு (artificial intelligence) துறையில் தொழில் நுட்பத்தின் மிக வெற்றிகரமான பயன்பாடுகளில் ஒன்றாக எழுத்துணரி மாறிவிட்டது. எழுத்துணரியை உருவாக்குவதற்கான பல வணிக அமைப்புகள் பலவகையான பயன்பாடுகளுக்கு இருக்கின்றன; இருப்பினும் இயந்திரங்கள் இன்னும் மனித வாசிப்பு திறன்களுடன் போட்டியிட முடியவில்லை. எழுத்துணரி தானாக அடையாளம் காணும் செயல்படும் நுட்பங்களின் குடும்பத்திற்குச் சொந்தமானது.
எழுத்துணரி (OCR) ஒளிவழி எழுத்துணர்தல் (Optical Character Recognition) என்றும் அழைக்கப்படுகிறது. எழுத்தை வாசிப்பான் என்பது ஒரு முழுமையான ஒழுங்குமுறை ஆகும். அச்சிடப்பட்ட அல்லது கையால் எழுதப்பட்ட எண்ணெழுத்து படிவத்தை வருடுதல் (ஸ்கேன்) மூலம் மின்னணு வேகத்தில் எழுத்துக்களைப் படித்து அறியும். மிகச் சமீபத்தில், நுண்ணறிவு எழுத்து உணர்தல் (Intelligent Character Recognition (ICR) ஐ.சி.ஆர்) என்ற சொல் விளக்கும் செயல்முறையை விவரிக்க பயன்படுத்தப்பட்டது. படத் தரவு, குறிப்பாக எண்ணெழுத்து உரை, எழுத்துக்கள் படங்களைக் கொண்ட எழுத்துணரி படிவங்களின் செயல்பாடு ஸ்கேன்/வருடல் செய்யலாம் ஸ்கேனர் மற்றும் எழுத்துணரியின் உணர்தல் இயந்திரம் மூலம் கணினிப் படங்களை விளக்குகிறது மற்றும் கையால் எழுதப்பட்ட படங்களை திருப்புகிறது அல்லது அச்சிடப்பட்ட எழுத்துக்கள் ASCII தரவுகளில் (இயந்திரம் படிக்கக்கூடியவை எழுத்துக்கள்). எனவே, தரவை விரைவாகத் தானியக்கமாக்க எழுத்துணரி பயனர்களை அனுமதிக்கிறது படிவங்களிலிருந்து பிடிக்கவும், தரவைக் குறைக்க விசை அழுத்தங்களை அகற்றவும் நுழைவுச் செலவுகள் மற்றும் அதிக அளவு துல்லியத்தைப் பராமரிக்கின்ற படிவங்கள் செயலாக்கப் பயன்பாடுகளில் தேவை. எழுத்துணரியின் அம்சங்கள் தொழில்நுட்பம் ஒரு முழுமையான படிவ செயலாக்கத்தை வழங்குகிறது ஆவணங்கள் தீர்வு. வழக்கமாக, எழுத்துணரி ஒரு பயன்படுத்துகிறது மட்டு கட்டமைப்பு திறந்த, அளவிடக்கூடிய மற்றும் பணிப்பாய்வு கட்டுப்படுத்தப்படுகிறது. இதில் படிவங்கள் வரையறை, ஸ்கேனிங், படம் ஆகியவை அடங்கும் முன் செயலாக்கம் மற்றும் உணர் திறன்கள். அறிவுசார் எழுத்து அறிவான் (Intelligent Character Recognition (ICR/ஐ.சி.ஆர்) நுண்ணறிவு எழுத்து அங்கீகாரம் (ஐ.சி.ஆர்) என்றால் என்ன? கையால் எழுதப்பட்ட படங்களை மாற்றும் திறன் கொண்ட எழுத்துணரி அல்லது ASCII தரவுகளில் அச்சிடப்பட்ட எழுத்துக்கள் சில நேரங்களில் எழுத்துணரி ஆகும் ஐ.சி.ஆர் என அழைக்கப்படுகிறது. ஐ.சி.ஆரின் வித்தியாசம், எழுத்துணரி மற்றும் குறி உணரி (Optical Mark Reader (OMR) ஐ.சி.ஆர் மற்றும் ஓ.சி.ஆர் ஆகியவை இமேஜிங்கில் பயன்படுத்தப்படும் அங்கீகார இயந்திரங்கள்; OMR என்பது தரவு சேகரிப்பு தொழில்நுட்பமாகும். அங்கீகார இயந்திரம் தேவை. எனவே, அடிப்படையில் ஓ.எம்.ஆர் கையால் அச்சிடப்பட்ட அல்லது இயந்திரத்தால் அச்சிடப்பட்டதை அடையாளம் காண முடியாது எழுத்துக்கள். இருப்பினும், OCR தொழில்நுட்பத்தில், பதில் “டிக்” அல்லது “மார்க்” இல் உள்ள கேள்வி எழுத்துணரி என்றும் அழைக்கப்படுகிறது.
ஆன்லைன் மற்றும் ஆஃப்லைன் கையால் எழுதப்பட்ட மற்றும் தட்டச்சு செய்யப்பட்ட எழுத்துக்களுக்கான தமிழ் எழுத்துக்களுக்கான ஒளிவழி எழுட்துணரி (ஆப்டிகல் கேரக்டர் ரெக்னிகேஷன்) ஒழுங்குமுறைகளில் (சிஸ்டங்களில்) நடந்து வரும் ஆராய்ச்சியின் கண்ணோட்டத்தை அளிப்பதே நமது இலக்கு. பல்வேறு முறைகளின் செயல்திறன் பகுப்பாய்வு செய்யப்பட்டுள்ளது, இது ஒவ்வொரு முறையின் திறமையான காரணியின் படத்தை அளிக்கிறது.
Language in India www.languageinindia.com ISSN 1930-2940 Vol. 22:12 , December , 2022
சுருக்கம் பொருண்மையியல் பற்றிய எனது ஆய்வுகள் 1974 பூனாவிலுள்ள Deccan College Postgraduate and Re... more சுருக்கம்
பொருண்மையியல் பற்றிய எனது ஆய்வுகள் 1974 பூனாவிலுள்ள Deccan College Postgraduate and Resarch Institute-இல் தொடங்கப்பட்டு மூன்று பதின்ம ஆண்டுகளை எய்த உள்ளது. "Syntax and Semattics of Tamil verbs" எனது முனைவர் பட்ட ஆய்வேடு. "Semantic Structure of Tamil Vocabulary" எனது முதுமுனைவர் ஆய்வு. இவற்றைத் தொடர்ந்து "தற்காலத் தமிழ்ச் சொற்களஞ்சியம்", "கணித் தமிழ்ச் சொற்களஞ்சியம்", "Generative Lexicon for Tamil", "Word Net for Tamil", "தமிழ்ச் சொற்றொகையின் மூலப்பொருண்மையியல் ஆய்வு", "தமிழ்ப் பொருண்மையியல் அமைப்பு", "Onto-thesaurus for Tamil" என தமிழ்ப் பொருண்மையியல் தொடர்பான பல ஆய்வுகள் செய்து வெளியிட்டும் உள்ளேன. "An Introductory Course in Semantics" என்ற தலைப்பில் Language in India-வில் நான் மின்வடிவில் நான் வெளியிட்ட நூல் பெரும் வரவேற்பைப் பெற்றது. பல வெளிநாட்டினரின் பாராடுதலைப் பெற்றது. தமிழுக்கு இத்தகைய ஒரு நூல் தரவேண்டும் என்று எண்ணியிருந்தேன். என் உடல்நமின்மை அதை நோக்கிய என் பயணத்தைத் தடைசெய்தது. தமிழ்ப் பல்கலைகழகத்தில் பணியாற்றிய போது எனது மொழியியல் முதுகலைப்பட்ட மாணவர்களுக்காக "பொருண்மையில்" என்ற தலைப்பில் ஒரு நூல் எழுதி இருந்தேன். பத்து இயல்கள் மட்டும் உள்ள அதைப் பின்னர் academia.edu, Researchgate என்ற இணைய தளங்களில் பதிவேற்றம் செய்திருந்தேன். அதைப் பெரும் மாற்றங்கள் செய்து பதினெட்டு இயல்களாக "பொருண்மையியலும் பயன்வழியியலும்" என்ற தலைப்பில் இபோது Language in India என்ற மின் இதழ் மூலம் வெளியிடுகிறேன்.
குரூசின் "Lexical Semantics", "Semantics and Pragmatics" என்ற நூல்களைப் தழுவித்தான் இது எழுதப்பட்டுள்ளது. ஜான்லையான், நைடா, பாமர் போன்றோரின் பொருண்மையியல் நூல்களின் பாதிப்பையும் இதில் காணலாம்.
மொழியியல் பற்றிய ஆர்வம் தமிழ் நாட்டில் மங்கிவரும் இக்காலகட்டத்தில் இது தேவையற்ற ஒன்றாகத் தோன்றலாம். இருப்பினும் பொருண்மையியல் கோட்பாடுகள் என்னை எப்போதும் மகிழ்விக்கும். நான் பெற்ற அறிவு தமிழ் மாணவர்களுக்குப் போய்ச் சேரவேண்டும் என்ற எண்ணத்துடன் இதை வெளியிடுகிறேன்.
இந்நூல் பின்வருமாறு நான்கு பகுதிகளாகவும் பதினெட்டு இயல்களாகவும் பிரிக்கப்பட்டு பொருண்மையியல் மற்றும் பயன்வழியியல் பற்றி விளக்கப்பட்டுள்ளன.
பகுதி 1 அடிப்படைக் கருத்துகள்
இயல் 1:அறிமுகம்
இயல் 2.: தர்க்க விஷயங்கள்
இயல் 3: பாருண்மையின் வகைகளும் பரிமாணங்களும்
இயல் 4:கூட்டிணைப்பு
பகுதி 2 சொற்களும் அவற்றின் அர்த்தங்களும்
இயல் 5:சொற்பொருண்மையில் அறிமுகம்
இயல் 6: சொற்பொருண்மையின் சூழல் வேறுபாடு
இயல் 7: சொற்பொருள்களும் கருத்துருக்களும்
இயல் 8:உள்ளடங்குதல் மற்றும் ஒத்தல் இவற்றின் அடுக்குறவு அர்த்த உறவுகள்
இயல் 9: தள்ளிவைத்தல் மற்றும் எதிர்த்தல் இவற்றின் அடுக்குறவுகள்
இயல் 10 சொல் களங்கள்
இயல் 11 பொருண்மையின் நீட்சிகள்
இயல் 12 உறுப்பமைவு உறவுகள்
இயல் 13 சொற் சிதைவு
பகுதி 3 பொருண்மையியலும் இலக்கணமும்
இயல் 14 இலக்கணப் பொருண்மையியல்
பகுதி 4 பயன்வழியியல்
இயல் 15 குறிப்பும் சுட்டலும்
இயல் 16 பேச்சுச் செயல்கள்
இயல் 17 உட்குறிப்புகள்
இயல் 18 முடிவுரை
Language in India www.languageinindia.com ISSN 1930-2940 Vol. 21:3 March , 2021
The present monograph on "WordNet and its dimensions" written in Tamil aims to describe the lexic... more The present monograph on "WordNet and its dimensions" written in Tamil aims to describe the lexical sematic studies in Tamil that went on for the last four decades focusing mainly on WordNet which is an online lexical resource. The monograph has been divided into eighteen chapters including a chapter on 'Introduction' and 'Conclusion'. The details of the chapters are briefly discussed below:
Language in India www.languageinindia.com ISSN 1930-2940 Vol. 21:3 March , 2021
The present monograph on "WordNet and its dimensions" written in Tamil aims to describe the lexic... more The present monograph on "WordNet and its dimensions" written in Tamil aims to describe the lexical sematic studies in Tamil that went on for the last four decades focusing mainly on WordNet which is an online lexical resource. The monograph has been divided into eighteen chapters including a chapter on 'Introduction' and 'Conclusion'. The details of the chapters are briefly discussed below:
Language in India www.languageinindia.com ISSN 1930-2940 Vol. 20:1 , 2020
“Machin Translation - Yesterday, Today and Tomorrow” is a monograph written in Tamil to introduce... more “Machin Translation - Yesterday, Today and Tomorrow” is a monograph written in Tamil to introduce the deferent dimensions of machine translation to the Tamil readers. It has nine chapters including introduction and conclusion.
Chapter 1: Introduction
The introduction describes the aim and scope of machine translation. It discusses about the general characteristics of machine translation, lists the need for machine translation and introduces different types of machine translation, lists different types of grammatical formaiims used for machine translation as well as preliminary steps to machine translation.
Chapter 2: Mile stones in Machine Translation
This chapter discusses about the history of machine translation explained by Hutchins, Somers and others. Hutchins and Somers describes about the history of machine translation by diving the stages of MT development into four or five stages. The first stage covers the period from 1933 to 1956. The second stage covers the period from 1956 to 1966. Next comes the report of ALPAC which criticized the MT attempts and the futility of the efforts. The fourth stage covers the period from 1967 to 1976. This is followed by a description on translation tools and translators’ workstation. “Research since 1989” is described afterwards. Next mile stone is “operational and commercial system since 1990”. “MT on Internet” becomes the topic of next stage.
Chapter 3: Some Important Machine Translation Systems
This chapter discusses about the different types of MT systems built in world arena. The following MT systems have been discussed briefly: GAT:Georgetown automatic translation, CETA automatic translation center research, TAUM research in University of Montreal, ALP automatic language processing, SYSTRAN, LOGOS, SUSY, METEO, Weinder Communication Corporation, SPANAM, CULT: Chinese University Translator, ALPS automated language processing systems., MT development in Japan, Ariane (GETA), Eurotra, METAL, Rosetta and DLT.
Chapter 4: MT Research in India
This chapter discusses about the major attempts to build Machine transplantation systems in India. The MT systems such as Anusaraka, Anglabharati, Anubharati, Anglabharati II, Mantra MT system, Anuvadak MT system, MT system based on ULN, Matra MT system, English-Kannada MT system and Indian language to Indian Language machine translation systems have been described. This is followed by a description of Tamil oriented MT systems. Tamil-Rusian MT system, UNL based MT system for Tamil, Machine aide to translate Linguistics text books in English into Tamil and English-Tamil machine Translation system using statistical methods.
Chapter 5: Corpus Creation
This chapter talks about the corpora creation. The different corpora created for English language is discussed initially. This is followed by a description on Indian language corpora creation.
Chapter 6: POS Tagging
This chapter talks about the POS tagging of texts. The importance of POS tagging, creation of TAG sets, different types of TAG sets available at the international arena as well as in Indian language arena have been discussed.
Chapter 7: Syntactic Parsing
This chapter discusses about syntactic parsing. The different types of syntactic parsing and the attempts to parse Indian languages including Tamil have been dealt in this chapter.
Chapter 8: Conclusion
Language in India, 2019
========================================================================== Abstract The present m... more ========================================================================== Abstract The present monograph entitled "Computational Linguistics" written in Tamil deals mainly with four aspects: computational linguistics in general, the processing of language at different levelvels of analysis such as phonology, morphology, syntax and semantics, applications of computational linguistics and technological development of Tamil. This book is not written at a stretch by me. It is the outcome of my association with computational linguistics for the last twenty five years. So it may read like a compilation. The book is divided into 13 chapters. Chapter 1 Introduction: The introduction first introduces the topic of the book 'computational linguistics'. It just explains the importance of studying language though computer and their problems, the handling of language in computer, the tools for language study, the skills needed for linguists to involve themselves in computational linguistics, the skills needed for computer scientist to involve themselves in computational linguistics, natural language processing in Tamil, language technology and development of language technology. Chapter 2 Natural language Processing: Computer and language processing and the regular expressions and automata are discussed elaborately in this chapter. Chapter 3 Computational phonology: This chapter describes about four aspects of computational phonology: computer phonology in general, certain important information about acoustic phonetics, linguistics issues in text to speech mechanism and speech to text mechanism. Chapter 4 Computational morphology: This chapter describes about the computer analysis of morphology. It talks further about the computational modeling of morphology. This is followed by a brief description about morphology of Tamil. The attempts to develop morphological analyzer and morphological generator for Tamil. Chapter 5 Computational Syntax: This chapter talks about the computational analysis of sentences. Different grammatical formalisms for computational analysis of sentences have been introduced. Shallow parsing is also briefly explained. The aspects of POS tagging, chunking and parsing have been discussed. Chapter 6 Computational semantics: This chapter talks about linking computational syntax with computational semantics. It also takes about different aspect of computational lexical semantics. Chapter 7 Spell and grammar checking: This chapter is divided into two sections. The first section talks about the spell checking and the second section talks about grammar checking. In the first section on spell checking, the reasons for the spelling mistakes are discussed first. Then it elaborates on finding and classifying spelling mistakes. This is followed by a discussion on methods of correcting spelling mistakes such as Bayesian rules and Noisy channel models. In the second section on grammar checking, three types of methods are discussed: syntax-based checking, statistics-based checking and rule-based checking.
Language in India www.languageinindia.com ISSN 1930-2940 Vol. 19:10 October 2019, 2019
The onset of this monograph dates back to ten to fifteen years ago when I was teaching MA Applied... more The onset of this monograph dates back to ten to fifteen years ago when I was teaching MA Applied linguistics in Tamil University, Thanjavur. This write up which was rather class notes was written in Tamil as MA applied linguistics is/was introduced through Tamil medium in Tamil University. The lack of computational linguistics materials in Tamil made me to write notes of the concerned topic in Tamil. So far it was lying in my laptop. Prof. M.S. Thirumalai suggested me to publish it in book format in Language in India. So, I am doing it now. The book talks mainly about three important matters in computational linguistics: acoustic phonetics, text to speech processing and speech to text processing. The book is organized into eight chapters.
Chapter 1: Introduction
Chapter 2: Acoustic phonetics
Chapter 3: Articulatory and acoustic analysis of Tamil sounds
Chapter 4: Text to speech processing
Chapter 5: Text to speech processing in Tamil
Chapter 6: Speech to Text processing
Chapter 7: Speech to text processing in Tamil
Chapter 8: Conclusion
The major aim of the research work is to prepare a shallow parser for Malayalam to enable machine... more The major aim of the research work is to prepare a shallow parser for Malayalam to enable machine translation, especially between Malayalam and Tamil. A typical shallow parsing includes three processes: Parts of Speech (POS) Tagging, Chunking and establishing relationship between chunks. As Malayalam is an inflectionally rich language and most of the grammatical functions are realized by inflection, morphological parsing is taken as part of the shallow parsing. So the present shallow parser includes the following procedures: morphological parsing, POS tagging, chunking and establishing relationship among chunks. A part form shallow parsing a chapter is also included dealing about the ILILMT system in which the authors were involved in developing a birectional MT system between Malaylam and Tamil.
The book is organized into the following chapters:
1. Introduction
2. Natural Language Processing & Machine Translation
3. Shallow Parsing
4. Morphological Analysis
5. Parts Of Speech Tagging
6. Chunking
7. Shalllow parsing in Malayalam
8. ILMT Machine Translation system
9. Conclusion
In the introductory chapter just introduces the theme of the present work.
In the scond chapter a brief of introduction of Natural Language Processing (NLP), Computational Linguistics and Machine Translation has been given. The areas of application of natural language processing and machine translation have also been discussed. Various approaches to machine translation and their advantages and disadvantages are all also discussed. Major works that were carried out in the world and India in these fields have also been mentioned. Also a brief description of Malayalam Language, one of the Dravidian languages has been given.
The third chapter concentrates on shallow parsing. Here an introduction to shallow parsing has been given. Various techniques involved in parsing also found a place in this chapter. The different types of parsing along with the uses and the challenges towards parsing are also discussed. The shallow parser described here includes morphological analysis and parsing, parts of speech tagging and chunking for Malayalam.
The fourth chapter discusses morphological analysis. Different kindls of morphological models, morphological processes, morphological structures and morphotactics are discussed. The knowledge required to create a morphological analyzer has been explained. The paradism based approach which is used in this project and its advantage over other approaches have been explained.
The fith chapter focuses on Parts of Speech (POS) tagging. The issues and the principles in parts of speech tagging is elaborated uppon. A brief description of various models and their problems has been discussed along with the comparison of the models. The issues in the tagset design have been made. Also various types of tagsets for parts of speech tagging which have been currently used for annotating the corpora of Indian language have been discussed.
The sixth chapter concentrates on chunking. The problems and issues in chunking have been elaborated upon. Also the chunking algorithms and chunk tagsets which are presently used are described.
The seventh chapter is a special chapter taks about the shallow parsing in Malayalam furnishing examples.
The eighth chapte is on Indian Language to Indian Language Machine Translation System. It is a bidirectional system working on both dirctionsion of the language pairs. Here we have taken up only Malayalam-Tamil pair. The MT system will work on web pages or text material from books, magazines, newspaper etc, written in standard language.
The nineth chapter is conclusion
This work will be an asset to those students who are wiling to do works on NLP. The various models in this machine translation system can be used independently as well as integrated with various machine translation systems. This can be used by public. This works is mainly carried out for Malayalam and this can be extended towards various other Indian Languages with changes in the Linguistic data of respective languages. Presently the System works for General Purpose, Tourism and Health domains, this can also further extend towards various other domains like Sorts, Agriculture etc.
ஒலி இயக்கவியல் ஒலிகளின் ஒலி இயக்க அமைப்பை ஆராய்கிறது. இதைத் தவிர ஒலிகளைப் பேச்சு உறுப்புக்களால் உ... more ஒலி இயக்கவியல் ஒலிகளின் ஒலி இயக்க அமைப்பை ஆராய்கிறது. இதைத் தவிர ஒலிகளைப் பேச்சு உறுப்புக்களால் உருவாக்கும் முறை அடிப்படையிலும் கேட்கும் இயல்பு அடிப்படையிலும் கொண்டும் விளக்கலாம். ஒலியியக்கவியல் பேச்சொலியின் பெளதீக தன்மையை (physical properties) ஆராய்கின்றது. நாம் அன்றாடம் பல ஒலிகளைக் கேட்கின்றோம். இவற்றில் ஓர் ஒலியை மற்றொரு ஒலியிலிருந்து வேறாக நாம் கேட்டுணர்வதற்கு முக்கியக் காரணமாக அமைவது அதன் ஒலியியக்கக் கூறுகளாகும்.
ஒலியன்கள் வேறுபட்ட ஒலி உருபடுத்தங்களின் பொதுமையாக்கம் ஆகும். ஒலிகள் உயிரொலிகள், மெய்யொலிகள் என ஒலிப்பு அடிப்படையில் இரண்டு வகைப்படும். மெய்யொலிகள் அவற்றின் ஒலிப்பு அடிப்படையில் ஈரிதழ் ஒலி, பல்லொலி, இதழ்பல்லொலி, அண்பல் ஒலி, அண்ண ஒலி, நடு அண்ண ஒலி, கடை அண்ண ஒலி, தொண்டை ஒலி என வகைப்படுத்தப்படும். ஒலிப்பு முறை அடிப்படையில் வெடிப்பொலி, மூக்கொலி, உரசொலி, அடைப்பொலி, மருங்கொலி, நாவன்ன ஒலி, அரைஒலி என வகைப்படுத்தப்படும். ஒலிப்பிடங்களும், ஒலிப்புமுறைகளும் இணைந்து ஒலிகளை வேறுபட்ட ஒலிகளாகப் பாகுபடுத்தப்படும். உயிரொலிகள் அவற்றின் ஒலிப்பிடம் அடிப்படையில் முன் உயிரொலி, நடு உயிலொலி, பின் உயிரொலி என பிரிப்பர். அவை ஒலிக்கும் போது பேச்சுக்குழலில் ஏற்படும் வடிவ அடிப்படையில் மூடிய உயிரொலி, அரைமூடிய உயிரொலி, அரைதிறந்த, திறந்த ஒலி என பிரிப்பர். உதடுகளின் வடிவம் அடிப்படையில் குவி இதழ் உயிரொலி, குவியிலா இதழ் உயிரொலி என வகைப்படுத்துவர். இந்த மூன்று வகையான அளவீடுகளின் அடிப்படையில் உயிரொலிகள் வேறுபடுத்தப்படும். குரல்வளை ஒலிப்பு அடிப்படையில் ஒலிகள் குரலொலி, குரலிலா ஒலி என வகுக்கப்படும். மெய்யொலிகளும், உயிரொலிகளும் இணைந்து அசைகளை (syllables) உருவாக்கும். சொற்களை அசைகளாகப் பிரிப்பது “அசையாக்கம் “ (syllabification) என்று அழைக்கப்படும்.
ஒலிப்பியல் தொடர்பான பண்புக்கூறுகள் ஒலியியக்கவியலின் பண்புகூறுகளாகப் பிரதிபலிப்பதை நாம் காணலாம். பேச்சு உறுப்புகளின் அசைவுகளால் அவற்றைச் சுற்றியுள்ள காற்றணுக்கள் அதிர்வடைகின்றன. காற்றணுக்களின் அதிர்வுகள் அலைகளாய்ப் பரவும். இவ்வதிர்வை நிகழ்வெண்களாகக் கணக்கிட்டு அளந்துகொள்ளலாம். ஒலிகளின் பல்வேறு ஒலியியக்க அமைப்பை ஆராய ஸ்பெக்டோகிராஃப் (spectrograph) என்ற கருவியைப் பயன்படுத்தி மூலமாகத் தான் ஒலியியக்கவியல் அறிஞர்கள் ஒலிகளின் ஒலியியக்கக் கூறுகளை அறிகின்றனர். பேச்சொலிகளின் பண்பு நலன்களை ஒலியாராய்ச்சிக் கருவிகளின் மூலம் கண்டறிவதே ஒலி இயக்கவியலின் முக்கிய நோக்கமாகும். இவ்வொலியியக்கவியல் ஆய்வு இன்று பயன்பாட்டு அடிப்படையில் உரையிலிருந்து பேச்சாய்வு, பேச்சிலிருந்து உரை ஆய்வு என வளர்ந்துள்ளது.
ஒரு மொழிக்கு எழுத்துக்களும் அவற்றை உச்சரிப்பதற்கான ஒலிகளும் முக்கியம் ஆகும். ஒரு செய்தி எழுத்து வடிவமாக இருப்பதை அதன் வரி வடிவத்தில் உள்ளது என்கிறோம். ஒரு மொழியில் உள்ள எழுத்திற்கும் அதாவது வரி வடிவத்திற்கும் ஒலி அளவிற்கும் உள்ள தொடர்பினைக் கண்டறிய வேண்டும். அதேப் போல் எழுத்துக் கூட்டுகளும் (letter units) ஒலி அலகுகளுக்கும் (sound units) உள்ள தொடர்பினைக் கணித சூத்திரமாக வரையறை செய்ய வேண்டும். அதே போல் ஒலி அகராதியைக் கணிப்பொறிப்படுத்த வேண்டும். இங்கு எழுத்துக் கூட்டு என்பதை உருபன் (morphemes) என்று கூறுகிறோம். மேற்கண்டவாறு வரிவடிவமான உருபன்களுக்கும் ஒலிவரிவமாக ஒலியன்களுக்கும் இடையே உள்ள தொடர்புகளை வரையறுப்பதாலும் ஒலி அகராதியைக் கணிப்பொறிப் பயன்படுத்துவதாலும் பேச்சிலிருந்து எழுத்து வடிவ உரையை உருவாக்க இயலும். இவ்வாறு பேச்சிலிருந்து எழுத்து வடிவ உரையை உருவாக்கும் முறையே உரையிலிருந்து பேச்சு (text to speech) எனப்படும்.
இத்தகைய அமைப்பினை உருவாக்குவதற்கு கணிப்பொறி பொருட்கள் வடிவகைக்கப்படுகின்றன. இம்மென்பொருட்களைப் பயன்படுத்தி கணிப்பொறியில் ஒலிவாங்கி (mike) மூலம் பேசினால் பேச்சானது எழுத்து வடிவமாக மாற்றம் செய்யப்பட்டி உரை வடிவில் பெறலாம். இதற்கான ஆய்வுப் பணிகள் நடைபெற்று வருகின்றன ஆங்கிலத்தைப் பொறுத்தவரையில் இந்த ஆய்வுப் பணிகள் ஓரளவு வெற்றியும் பெற்றுள்ளன. இது போன்று பிற மொழிக்கான அமைப்புகள் உருவாக்குவதற்குக் கணிப்பொறி அறிவியாரும், மொழியியல் துறை நிபுணர்களும் இணைந்து பணியாற்றுகின்றனர்.
பேச்சு சொல் பேச்சின் சிறு அலகுகளால் ஆனது. இந்த ஒலி அடிப்படையிலான எழுதும் ஒழுங்குமுறையில் உள்ளுறையும் கருத்து ஒலியியக்கவியலின் எல்லாத் தற்கால கோட்பாடுகளையும் உள்ளடக்கும் கோட்பாடு ஆகும். பேச்சறிதல் மற்றும் பேச்சுருவாக்கத் தொழில்நுட்பத்தையும் கணினி ஒலியனியியல் (computational phonology) என்ற தொடர்புள்ள மொழியியலின் கிளையையும் அறிந்து கொண்டால் இந்த உரையிலிருந்து பேச்சு உருவாக்கத்தின் பின்னணி என்ன என்பதை அறிந்து கொள்ளலாம்.
தனியங்கு பேச்சறியும் முக்கிய செயல்பாடு ஒலியியக்க அலைவடிவத்தினை உள்ளீடாக ஏற்றுச் சொற்களின் கோர்வையை வெளியீடாக உற்பத்தி செய்வதாகும். உரையிலிருந்து பேச்சுருவாக்கம் என்ற செயல்பாடு உரைச் சொற்களின் கோர்வையை உள்ளீடாக ஏற்று அலைகளை வெளியீடாக பெறுவதாகும்.
The flow cart is useful for the computational processing of Malayalam Nominal and verbal forms.
This contains Flowchart of morph analyzer/generator for Tamil Nominal Complex (in Tamil)
It gives the Flowchart of morph analyzer/generator for Tamil Verbal complex (in roman)
It gives the Flowchart of morph analyzer/generator for Tamil verbal complex (in Tamil)
It gives the Flowchart of morph analyzer/generator for Tamil Nominal Complex (in roman)
தமிழ்ச் சொற்றொகையின் வகைப்பாட்டியல் இங்கு சுருக்கமாகப் பட்டியலிடப்பட்டுள்ளது.
'Semantic structure of Tamil vocabulary' (1998) was worked out by me as my postdoctoral research ... more 'Semantic structure of Tamil vocabulary' (1998) was worked out by me as my postdoctoral research work (Rajendran, 1982) by making use of the classification of vocabulary advocated by NIda (1975). Nida's classification is based on the principles of componential analysis propounded by him. Nida's (1975) work culminated into a thesaurus for Greek language for bible translation. I have followed the same schema when I converted 'Semantic structure of Tamil vocabulary' into Tamil Thesaurus (Rajendran, 2001). While attempting semantic structure of Tamil vocabulary. I realized that there are huge vacuums or lexical gaps in Tamil vocabulary. Many lexical domains have no vocabulary less vocabulary in Tamil. Say for example many domains of knowledge such as science, astronomy, law, etc do not have sufficient vocabulary in Tamil to portray them in a taxonomic fashion. While attempting to classify Tamil vocabulary based on lexical relations such as hyponymy and superordinate relation and part and whole relation I could not find superordinate terms for a number sets of lexical item which I feel like classifying under superordinate terms. Also while comparing lexical items found in Tamil with lexical item in English, I come across many vacuums as well as many mismatches between them. I would like to call these vacuums as well as the mismatches as lexical gaps. I would like to discuss in this section the lexical vacuum or lexical gaps. The study of lexical gaps can be approached from the point of view of lexical fields, as suggested by Lehrer (1974) and Cruse (1986) among others.
This article presents the working methodology of supervised Morpheme Extraction Task for Tamil la... more This article presents the working methodology of supervised Morpheme Extraction Task for Tamil language in Morpheme Extraction Task (MET) Task of FIRE-2014. In this attempt, Tamil Morphemes are extracted based on supervised machine learning algorithm, Support vector machines.
Ontology plays a vital part in knowledge representation. These-days e-learning packages are prepa... more Ontology plays a vital part in knowledge representation. These-days e-learning packages are prepared on the basis of the ontological structure which represents the knowledge to be designed. If we talk in simple terms, we can claim that taxonomical representation of text materials in text books are nothing but a sort of ontological representations. Taxonomy is a sort of hierarchical representation of texts based on topics, sub-topics, titles, subtitles, etc. Ontology has relations which links the above mentioned items. That way ontology goes a step further form the taxonomical representations. In a way, hierarchies, typologies, taxonomies, and ontologies are related and one depend on the other or one is an extension of the other. Here we are reminded of field semantics or sematic fields propounded by Trier and expanded by Lehrer. A semantic field is a 'group of words closely related in meaning, often subsumed under a general term. The examples are kinship terms, colour terms etc. The object of analysis of semantic field is to collect all the words that belong to a field and show the relationship of each of them to one another and to the general term. The taxonomy and ontology go further to take into their folds concepts beyond words. The purpose of this paper is to elaborate on how field semantics, hierarchies, typologies, taxonomies and ontologies help us to represent knowledge there by find ways to create e-learning packages for sake of learners who wants to access knowledge in a systematic fashion. Ontologies are a vast domain in lexical semantics and in artificial intelligence whose boundaries are somewhat fuzzy. Basically, ontology is a formal system that aims at representing for a given domain by means of basic elements, the different concepts and their related linguistic realizations. A large view of ontological knowledge can also include various forms of encyclopedic knowledge about the domain, and common-sense knowledge as well as rhetorical and metaphorical knowledge and expressions. Ontologies represent an important bridge between knowledge representation and computational lexical semantics. Ontologies are widely used as a formal device to represent the lexical content of words. Declarative representation of knowledge has long been acknowledged as a key building block of Al systems. A knowledge base (KB) with associated reasoning mechanisms can serve as a backbone for tasks such as query answering, learning and diagnosis. One of the key challenges in deploying knowledge representation (KR) systems is the cost and the complexity of building the knowledge base, especially in cases where it needs to cover a broad domain. Building a KB is highly labor intensive for several reasons. First, the acquisition of domain
Machine translation is the task of translating the text in source language to target language, au... more Machine translation is the task of translating the text in source language to target language, automatically. Machine translation can be considered as an area of applied research that draws ideas and techniques from linguistics, computer science, artificial intelligence, translation theory, and statistics. Even though machine translation was envisioned as a computer application in the 1950‘s and research has been made for 60 years, machine translation is still considered to be an open problem.
The demand for machine translation is growing rapidly. As multilingualism is considered to be a part of democracy, the European Union funds EuroMatrixPlus, a project to build machine translation system for all European language pairs, to automatically translate the documents to 23 official languages, which were being translated manually. Also as the United Nations is translating a large number of documents into several languages, the UN has created bilingual corpora for some language pairs like Chinese – English, Arabic–English which are among the largest bilingual corpora distributed through the Linguistic Data Consortium. In the World Wide Web, as around 20% of web pages and other resources are available in their national languages, machine translation can be used to translate these web pages and resources to the required language in order to understand the content in those pages and resources, thereby decreasing the effect of language as a barrier of communication.
In a linguistically diverged country like India, machine translation is an important and most appropriate technology for localization. Human translation in India can be found since the ancient times which are being evident from the various works of philosophy, arts, mythology, religion and science which have been translated among ancient and modern Indian languages. Also, numerous classic works of art, ancient, medieval and modern, have also been translated between European and Indian languages since the 18th century. As of now, human translation in India finds application mainly in the administration, media and education, and to a lesser extent, in business, arts and science and technology.
India has 22 constitutional languages, which were written in 10 different scripts. Hindi is the official language of the India. English is the language which is most widely used in the media, commerce, science and technology and education. Many of the states have their own regional language, which is either Hindi or one of the other constitutional languages. Only about 5% of the population speaks English.
In such a situation, there is a big market for translation between English and the various Indian languages. Currently, the translation is done manually. Use of automation is largely restricted to word processing. Two specific examples of high volume manual translation are -translation of news from English into local languages, translation of annual reports of government departments and public sector units among, English, Hindi and the local language. Many resources such as news, weather reports, books, etc., in English are being manually translated to Indian languages. Of these, News and weather reports from all around the world are translated from English to Indian languages by human translators more often. Human translation is slow and also consumes more time and cost compared to machine translation. It is clear from this that there is large market available for machine translation rather than human translation from English into Indian languages. The reason for choosing automatic machine translation rather than human translation is that machine translation is better, faster and cheaper than human translation.
Tamil, a Dravidian language spoken by around 72 million people is the official language of Tamil Nadu state government of India. Tamil in its eagerness to gather information from English resort to build English-Tamil machine translation systems. Many English-Tamil machine translation systems are getting built, but none could serve the ambitious need of Tamil. This work is intended pursue this work in a new perspective.
A unique definition for Multi Word Expression (MDE) is difficult to make. It can be strategically... more A unique definition for Multi Word Expression (MDE) is difficult to make. It can be strategically defined as a sequence of words which occur together expressing a cohesive or unified meaning. The following could be types of MWEs:
1. Compound verbs
2. Compound nouns
3. Compound adjectives
4. Compound adverbs
5. Compound postpositions
6. Other mixed combinations
நகர்ப்புற மற்றும் கிராமப்புற மாணவர்களின் மொழிச் சமூகமாக்கம் (Language socialization of urban and ... more நகர்ப்புற மற்றும் கிராமப்புற மாணவர்களின் மொழிச் சமூகமாக்கம்
(Language socialization of urban and rural students)
இராசேந்திரன் சங்கரவேலாயுதன்
சமூகமாக்கம் குறித்த ஆய்வானது மொழி, பண்பாடு, அரசியல் சூழல் போன்றவற்றை உள்ளடக்கும். இவ் ஆய்வேட்டில் குறிப்பாக மொழிசார்ந்த சமூகமாக்கம் (Language socialization) கவனக்குவிப்பு செய்யப்பட்டுள்ளது. ஒரு சமுதாயத்தின் முக்கிய அங்கமாகத் திகழ்வது மொழியேயாகும். ஒரு மொழி ஒரு குழந்தையை அது எச்சமுதாயத்தைச் சார்ந்தது என்பதை நிர்ணயிக்கும் முக்கியமான அளவுகோளாக விளங்குகிறது. தமிழ்ச் சமுதாயத்தில் பிறந்த ஒரு குழந்தையைத் தமிழ்ச் சமுதாயத்தில் வளரவிட்டால் அது தமிழ் மொழியைத்தான் பேசும். அதே குழந்தையை ஜெர்மன் நாட்டில் வளரவிட்டால் ஜெர்மானிய மொழியைத்தான் பேசும். எனவே, ஒவ்வொரு குழந்தையும் தான் வளருகின்ற சூழலுக்கு ஏற்ப தன்னை அச்சமுதாயத்தில் அடையாளப் படுத்துவதோடு மட்டுமல்லாமல் அச்சமுதாயத்தில் ஓர் பண்புமாதிரியாகவும் விளங்குகிறது. சமுதாயமும் அக்குழந்தையிடம் அச்சமுதாயத்தைச் சார்ந்த பண்புக்கூறுகள் வெளிபட்டால்தான் அக்குழந்தையைத் தன்னில் ஓர் அங்கமாக ஏற்றுக் கொள்கிறது. எவ்வாறு ஒரு குழந்தை தான்பிறந்த சமூகத்துடனும் பண்பாட்டுடனும் அரசியல் சூழலுடனும் மொழிச் சமுதாயத்துடனும் இணைந்து அதில் ஒரு அங்கமாக ஆவதற்கு வேண்டிய நடத்தைகளையும் நடத்தை வெளிப்பாடுகளையும் பெறுகின்றது என்பதுதான் அக்குழந்தையின் சமூகமாக்கமாகும்.
நகர்ப்புற மற்றும் கிராமப்புற மாணவர்களிடையே மொழிச் சமூகமாக்கத்தில் வேறுபாடு இருக்கிறதா? மொழிப்பேறில் இவ்வேறுபாடு எவ்வாறு பிரதிபலிக்கிறது? என்பதை ஆய்வதே இவ்வாய்வின் முதன்மையான நோக்கமாகும். இதற்கு அடிப்படையாக அமையும் சமூகமாக்கம் குறித்த கோட்பாடுகளையும் அதனடிப்படையில் செய்யப்பட்ட ஆய்வுகளையும் விளக்குவது இவ்வாய்வின் இரண்டாம் நோக்கமாக அமைகிறது. நகர்ப்புற மற்றும் கிராமப்புற மாணவர்களிடையே மொழிச் சமூகமாக்கத்தில் வேறுபாடுகள் காணப்படுகின்றன. இவ்வேறுபாடுகள் அவர்கள் மொழிப் பரிமாற்றத்திலும் அவர்களின் மொழித்திறனிலும் வெளிப்படுகின்றன.மொழிச் சமூகமாக்கத்தில் காணப்படும் வேறுபாடுகளுக்கு அவர்களுடைய வீட்டுச் சூழலும் பள்ளிச் சூழலும் காரணிகளாய் அமைகின்றன.மாணவர்களின் மொழிச் சமூகமாக்கத்தில் அவர்களின் பெற்றோருக்கும் ஆசிரியருக்கும் பங்களிப்பு உண்டு. சமூகமாக்கம் குறித்த பல்வேறு ஆய்வுகள் பல்வேறு கோட்பாடுகளின் அடிப்படையில் வெளிவந்துள்ளன. இவ்வாய்வுகளிலிருந்து தற்போதைய ஆய்வுக்குத் தேவையான நெறிமுறைகள் மட்டும் எடுத்தாளப் பட்டுள்ளன. குறிப்பாக பெர்ன்ஸ்டைன் (Bernstein 1966) என்பவரின் மொழிச் சமூகமாக்கம் குறித்த விளக்கங்கள் அல்லது கோட்பாடுகள் இவ்வாய்வுக்கு அடிப்படையான நெறிமுறையாகப் பயன்படுத்தப்பட்டுள்ளன.
மாணவர்களின் மொழிச் சமூகமாக்கத்தின் அடிப்படையில் அவர்களின் மொழித்திறனை அறியும் பொருட்டு நகர்ப்புற மற்றும் கிராமப்புற அரசுப் பள்ளிகளில் பயிலும் ஏழாம் வகுப்பு மாணவர்களிடமிருந்து தரவுகள் திரட்டப்பட்டுள்ளன. பேசுதல், கேட்டல், படித்தல், எழுதுதல் முதலிய மொழித்திறன்களை விளக்கும் தரவுகள் நேரடியான உற்றுநோக்கல் ((Observation) மூலமும் வினாநிரல் மற்றும் எழுத்துத் தேர்வுகள் மூலமும் (Questionnaire and Dictation) சேகரிக்கப்பட்டன. மாணவர்களின் வாசிப்புத் திறனை ஆய்வதற்காக ஒலிநாடாப்பதிவுக் கருவி (Tape recorder) மூலமும் தரவுகள் சேகரிக்கப்பட்டுள்ளன. இம்மாணவர்களின் மொழிச் சமூகமாக்ததிற்கு அவர்கள்தம் பெற்றோர் மற்ளும் ஆசிரியர்களின் பங்கு என்ன என்பதை அறிவதற்காக அவர்களுக்கும் தனித்தனியாக வினாநிரல் வழங்கப்பட்டு அதன் மூலமும் ஆய்வுக்குத் தேவையான தரவுகள் சேகரிக்கப்பட்டுள்ளன. இவ்வாய்வு ஏழு இயல்களாகப் பிரிக்கப்பட்டுள்ளது. முதல் பகுதி அறிமுகம் ஆகும். இதில் ஆய்வேட்டின் நோக்கம், பரிசோதனைக்கு எடுத்துக் கொண்ட கருதுகோள்கள், ஆய்வின் நெறிமுறை, ஆய்வுக்கான தரவு சேகரிப்பு மற்றும் ஆய்வுச்சுருக்கம் போன்றவை விளக்கப்பட்டுள்ளன. இரண்டாவது இயலில் “பெர்ன்ஸ்டைனின் கோட்பாடுகள்” விளக்கப்பட்டுள்ளன. மூன்றாவது இயலில் இவ்வாய்வுத் தொடர்பான சில முன்னாய்வுகளில் இடம்பெற்ற கருத்துக்கள் இடம்பெற்றுள்ளன. நான்காவது இயலில் நகர்ப்புற மாணவர்களின் மொழிச்சமூகமாக்கமும் ஐந்தாவது இயலில் கிராமப்புற மாணவர்களின் மொழிச்சமூகமாக்கமும் திரட்டப்பட்ட தரவுகளின் அடிப்படையில் விளக்கப்பட்டுள்ளன. ஆறாவது இயலில் இருசார் மாணவர்களின் மொழிச்சமூகமாக்கம் குறித்து விரிவாக ஆயப்பட்டு ஆய்வின் கண்டுபிடிப்புகள் வெளியிடப்பட்டுள்ளன. ஏழாவது பகுதி ஆய்வேட்டின் நிறைவுப் பகுதியாகும். இதில் ஆய்வுநோக்கங்களின் நிறைவு, பரிசோதனைக்கு எடுத்துக்கொண்ட கருதுகோள்களின் நிறைவு, இவ்வாய்விலிருந்து கண்டுபிடிக்கப்பட்ட புதிய கருத்துக்கள், பயன்பாடுகள் ஆகியன விவரிக்கப்பட்டுள்ளன.
தமிழ் உருபனியலும் தெ.பொ.மீ-யும் (TPM and Tamil morphology) இராஜேந்திரன் சங்கரவே... more தமிழ் உருபனியலும் தெ.பொ.மீ-யும்
(TPM and Tamil morphology)
இராஜேந்திரன் சங்கரவேலாயுதன்
rajushush@gmail.com
தெ.பொ.மீ. அண்மையில் இறுதியை எய்திய இருபதாம் நூற்றாண்டைச் சார்ந்தவர். இரண்டாயிரத்தில் கால் பதித்துள்ள நாம் முந்தைய நூற்றாண்டின் தொடக்கத்தில் பிறந்து தமிழ் மொழிக்கென்று தன் வாழ்வை அர்ப்பணித்து சாதனைகள் படைத்துள்ள தெபொமீ அவர்களின் மொழியியல் கருத்துக்களை நினைவுகூர்ந்து அவர் விட்டுச்சென்ற இடத்திலிருந்து ஆய்வை மேலும் தொடர முனைப்புகள் செய்ய வேண்டிய கடமை உணர்வில் உள்ளோம். உருபனியல் குறித்த அவர் கருத்துக்களை ஆய்ந்து மேலும் உருபனியல் ஆய்வு எவ்வாறு நடைபெற்று வருகிறது, எவ்வித ஆய்வுகள் மேலும் மேற்கொள்ள வேண்டும் என்பதை இங்கு ஆய உள்ளோம். உருபனியல் பற்றிய தெபொமீயின் கருத்துக்கள் ஆங்காங்கே அவர் எழுதிய கட்டுரைகளிலும் நூல்களிலும் சிதறிக்கிடக்கின்றன. இக்கருத்துக்கள் யாவற்றையும் ஒருங்கிணைத்து உருபனியல் பற்றி அவருக்கிருந்த கருத்துக்களை வெளிக்ககொணர்வது இக்கட்டுரையின் தலையாய நோக்கமாகின்றது.
சொற்றொகையும் சொற்களங்களும் Vocabulary and word fields ஒரு மொழியின் சொற்றொகை மனவெளியில் அங்கொன... more சொற்றொகையும் சொற்களங்களும்
Vocabulary and word fields
ஒரு மொழியின் சொற்றொகை மனவெளியில் அங்கொன்றுமிங்கொன்றுமாக முழுவதும் சிதறிக்கிடக்கும் சொற்களின் சேமிப்பு அல்ல. இது குறைந்தது பகுதி அமைப்பாக்கம் செய்யப்பட்டது மற்றும் பல மட்டங்களில் அமைப்பாக்கம் செய்யப்பட்டதாகும். சொற்றொகையின் அமைப்பாக்கத்தின் பல பாங்குகள் இருக்கின்றன. வெளிப்படையாக அமைப்பின் இரண்டு முக்கியமான வகைகளை வேறுபடுத்துவது நன்மைபயக்கும்: மொழியியல் அமைப்பு மற்றும் உளமொழியியல் அமைப்பு. புலனறி மொழியியல் சார்புள்ள யாரும் இவை சுதந்திரமானவை என்று கூற விரும்பமாட்டார்கள். சொற்களஞ்சியத்திலுள்ள மொழியியல் அமைப்புகள் மொழியில் அடிப்படையில் விரையறைவிளக்கம் செய்யப்பட்டுள்ளன நாம் இங்கு கருத்தில் கொள்வன பொருண்மை உறவுகளின் அடிப்படையில் பொருண்மையியல் விரையறைவிளக்கம் செய்யப்பட்டுள்ளன உளமொழியியல் அமைப்புகள் சோ;க்கைத் தொடர்பு[கள், தொடக்கத் தனிப்பண்புகள் மற்றும் பேச்சுச் தவறுகளின் அமைப்பொழுங்குகள் இவற்றின் அடிப்படையில் விரையறைவிளக்கம் செய்யப்பட்டுள்ளன. ஒரு பொருண்மை அமைப்பு மொழிப் பயன்பாட்டின் அமைப்பொழுங்குகளில் ஏதாவது ஒரு வழியில் பிரதிபலிக்கப்படும் மற்றும் இந்த அர்த்தத்தில் இது ‘உளவியல் அடிப்படையில் உண்மை’ ஆகும். ஆனால் ஆய்வின் குறிப்பிட்ட மற்றும் தனித்தன்மையான உளமொழியியல் உத்திகள் இதை இயைந்த அமைப்பாக வெளிப்படுத்தாது. இங்கு எடுக்கபட்டுள்ள நிலைமை இவ்விரு அணுகுமுறைகளும் துணைநிலையானதாகும் என்பதாகும்.
சொற்களஞ்சியத்திலுள்ள மொழியியல் அமைப்புகளுக்கு ஒலியனியல், இலக்கணவியல் அல்லது பொருண்மையில் அடிப்படை இருக்கும். இலக்கண அமைப்பாக்கத்தின் வெளிப்படையான எடுத்துக்காட்டுகள் சொல் வகுப்புகள் (தொடரியல் பண்புகள் அடிப்படையில் சொற்களை குழுமுதல்) மற்றும் சொல் குடும்பங்கள் (பொதுவான வோpலிருந்து ஆக்கப்பட்ட சொற்களின் குழுமங்கள்) ஆகும். நாம் இங்கு பொருண்மையியல் அடிப்படையில் வரையறை விளக்கம் செய்யப்பட்ட அமைப்புகள் மீது, குறிப்பாக அர்த்த உறவுகள் அல்லது அர்த்த உறவுகளின் குழுமங்கள் மீது கருத்து செலுத்துவோம். நாம் அடுக்குறவு அர்த்த உறவுகளில் அடிப்படையில் அமைந்தவற்றில் தொடங்குவோம்.
தமிழில் கூட்டுப்பெயராக்கம் (compound noun formation in Tamil) கூட்டுப்பெயராக்கம் பற்றிக் கூறும் ப... more தமிழில் கூட்டுப்பெயராக்கம் (compound noun formation in Tamil)
கூட்டுப்பெயராக்கம் பற்றிக் கூறும் போது தமிழில் மரபிலக்கணத்தார் இவற்றை எவ்வாறு அணுகுகின்றனர் என்பது பற்றி விரிவாகக் காண்பது முக்கியமானதாகும். கூட்டுப்பெயராக்கக் கோட்பாடு பற்றி ஒரு தீர்மானத்திற்கு வருவதற்கு இது ஏதுவாக அமையும். விஜயவேணுகோபால் தம் நூலின் பின்னிணைப்பு அட்டணையில் (Vijayavenugopal, G. 1979: 21 – 237) தொகை பற்றிய மரபிலக்கணங்கணத்தாரின் அணுகுமுறைகளைக் குறித்து விரிவாகப் பேசுகிறார்.
ஒரு மொழியின் சொற்கள் சொல்லியல் அடிப்படையிலும், தொடரியல் அடிப்படையிலும், வகைப்பாடு செய்யப்படலாம். ... more ஒரு மொழியின் சொற்கள் சொல்லியல் அடிப்படையிலும், தொடரியல் அடிப்படையிலும், வகைப்பாடு செய்யப்படலாம். சொற்கள் எந்த இலக்கணக் கூறுக்காகத் திரிபுறும் வாக்கியத்தில் எங்கு, எவ்வாறு இடம் பெறுகின்றன. அவற்றின் செயற்பாடுகள் யாவை என்பதன் அடிப்படையில் அவை ஒரு சொல் வகுப்பைச் சார்ந்தன என நிர்ணயிக்கலாம். ஆங்கிலத்தில் “Part of speech tag” என்றும்,இதன் படி சொற்களை எட்டு வகுப்புகளாகப் பிரிப்பர்.
1. பெயர் - Noun
2. பெயரடை - Adjective
3. மாற்றுப்பெயர் - Pronoun
4. வினை - Verb
5. வினையடை - Adverb
6. முன்னுருபு - Proposition
7. இணைப்புக்கிளவி - Conjunction
8. வியப்புச்சொல் - Interjection
தற்காலத் தமிழ் இலக்கணத்தை ஆங்கில இலக்கண கண்ணோட்டத்தோடு நோக்கும் இலக்கண நூல்களில் ஆங்கிலச் சொல்வகைப்பாட்டின் தாக்கத்தினைக் காணலாம். பழந்தமிழுக்காக எழுதப்பட்ட மரபிலக்கணங்களில் சொல் வகைகள் தற்காலத் தமிழுக்காக மாற்றியமைக்கப்பட வேண்டும் என மொழியியல் அறிஞர்கள் கருதுகின்றனர். இருப்பினும் தற்காலத் தமிழுக்கு எத்தனை சொல் வகுப்புகள் நிர்ணயிக்கப்பட வேண்டும் என்பதில் அவர்களிடையே ஒருமித்த கருத்து இல்லை.
A thesaurus in its widest contemporary sense is a classification of words by concepts, topics or ... more A thesaurus in its widest contemporary sense is a classification of words by concepts, topics or subjects.
It need not contain synonyms, and the fact that some items in a given class may be synonymous is coincidental.
A synonym dictionary, by contrast, deals with word groups, and does not constitute a conceptual classification system of the kind exemplified by Roget’s Thesaurus of English Words and Phrases (1853).
This is a crude definition: thesaurus frequently contain synonyms, and synymous dictionaries are often thesauric, if the groups in them are large and cross-referenced and reflect a wide interpretation.
PREPARATION OF ELECTRONIC THESARUS
Linguistic issues comprise of :
1. Hierarchical classification of lexical items based on at least four lexical relations: synonymy, hyponymy, compatibility, and incompatibility
2. Establishing semantic domains and sub domains based on distinguishing semantic or componential features
3. Selection of lexical items
4. Bringing out the network of relations existing between the lexical items which include co-occurrence and collocation
5. Arrangement of lexical items under terminal domains
6. Relating basic meaning with derivational meaning.
A paper thesaurus for Tamil 1988 based on the principles of componential analysis of meaning prop... more A paper thesaurus for Tamil 1988 based on the principles of componential analysis of meaning propounded by Nida (1975) and was published in 2001, nearly after a decade.
Following the paper thesaurus, an Electronic thesaurus for Tamil was attempted and a book on Tamil electronic thesaurus was published in 2006.
The preparation of wordNet for Tamil was undertaken (2001-2003) with the financial assistance from Tamil Virtual University (renamed now as Tamil virtual academy) and a crude version of it based on the ontology developed by me in my thesaurus was submitted to the institute in 2003.
After that, from 2009 onwards with the fund received from MHRD and Department of electronics and information Technology of Govt. of India the building of Dravidian wordNet is executed based on Hindi wordNet; nearly 3000 synsets (concepts) have been completed. Still we have to go a long way to achieve the desired target.
At present a team from CEN, Amrita University is involved in building onto-thesaurus for Tamil as a part of the project entitled “Computing Tools for Tamil Language teaching and learning”.
The project is funded by Tamil Virtual Academy, Chennai.
I owe a lot to Dr. Anandkumar and team in designing the onto-thesaurus.
தமிழில் சொல்லாக்கங்களில் மிகவும் பரவலானவை கூட்டாக்கமும் பின்னொட்டாக்கமும் ஆகும். பல புதிய சொற்கள்... more தமிழில் சொல்லாக்கங்களில் மிகவும் பரவலானவை கூட்டாக்கமும் பின்னொட்டாக்கமும் ஆகும். பல புதிய சொற்கள் கூட்டாக்கங்களால் பெறப்படுகின்றன. பெயர் + பெயர் கூட்டக்கங்கள் விளைவாககமாகும். புதிய வினைகள் பெயர்+ வினை(யாக்கி) என்ற கூட்டக்கத்தால் பெறப்படுகின்றன. பல நுண்மைப் பெயராக்கங்களுக்குப் வினையடிகள் காரணமாகின்றன.
The computer aided language learning is dealt here briefly in Tamil. The CALL has passed through ... more The computer aided language learning is dealt here briefly in Tamil. The CALL has passed through several stages. Three important stages can be specified as
Behaviorist CALL
Communicative CALL
Interactive CALL
All are briefed here for the sake of students.
The writer Kalki is known for writing historically based novels in Tamil. Some of them are Sivaka... more The writer Kalki is known for writing historically based novels in Tamil. Some of them are Sivakamiyin Sabadam, Partipan Kanavu, and Ponniyin Selvan. Kalki Krishnamurthy’s Ponniyin Selvan is a masterpiece that has enthralled generations of Tamil readers. Many authors have written phenomenal books in Tamil literature after Kalki Krishnamurthy, but Ponniyin Selvan remains the most popular, widely-read novel. It has just the right mixture of all things that makes an epic – political intrigue, conspiracy, betrayal, huge dollops of romance, infidelity, seduction, passion, alluring women, unrequited love, sacrifice and pure love. The Part first of Ponniyin Selvan is translated into English by Indra Neelameggham in 1990. Another English version of Kalki’s Ponniyin selvan has been rendered by H.Subhalakshmi Narayanan in 2016. The present study is based on Indra Neelamggham’s English version of Ponniyin Selvan. The paper is not intended to evaluate the translation but to understand the strategies adopted by the translator for the successful translation of the historic novel Ponniyin Selvan in Tamil into English.
A legendary piece of literature, Ponniyin Selvan ‘Ponni’s Beloved’ is Part One of five parts of the English translation of Kalki Krishnamurthy’s Tamil Classic ‘Ponniyin Selvan.’ It has as its protagonist Vandiya Devan a young soldier who belongs to the brave warrior race of Vanars. He is on a secret mission for the Crown Prince of the Chola Kingdom. What follows is an adventurous journey through the realms of the Chola Kingdom. Spiced with bits of gossip, fun- frolic and subtle romance, the story is actually that of deceit and dare. While we see that the thirst for power of a few, combined with the determination to wreak vengeance by some others, is ready to hit at the very foundation of a great empire, we also see the grit, determination and intelligence of one a woman, try match up to the conspiracies of the enemies in an attempt to thwart their mission and secure the future of the empire.
From the point of view standards of translation explained in the beginning an attempt has been made here to understand the strategies adopted by the translator to render the original in Tamil into English. We can guess that the translation is meant for non-native speakers especially for those who know English and not Tamil. The translator has to assume that the readers of the translation are not acquainted to the socio-cultural environment of the novel under consideration. The translator’s dictions should be understandable to the readers and at the same time should not mislead them. In spite of the stray instances of lacunae, we must say that the translator has successfully translated Ponniyin Selvan in Tamil into English. The strategies adopted by the translator are highly commendable. A translator can learn many things from the translation strategies adopted by Neelameggham.
சொற்பொருண்மை மயக்கநீக்கம்: கணினிசார்அணுகுமுறை சுருக்கம் மக்கள் பொருண்மை மயக்கம் காட்டுகின்றா... more சொற்பொருண்மை மயக்கநீக்கம்: கணினிசார்அணுகுமுறை
சுருக்கம்
மக்கள் பொருண்மை மயக்கம் காட்டுகின்றார்கள் என்று கூறுவது அவர்கள் எவ்வாறு மொழியைப் பயன்படுத்துகின்றனர் என்பதைக் குறிக்கும் என்றாலும், பொருண்மை மயக்கம் என்பது மொழி வெளிப்பாடுகளின் பண்பாகும். ஒரு சொல்லோ தொடரோ வாக்கியமோ ஒன்றிற்கும் மேற்பட்ட பொருண்மைகளைக் கொண்டிருந்தால் அவை பொருண்மை மயக்கம் கொண்டுள்ளன என்று பொருள்படும். வெளிப்படையாக இந்த வரையறை விளக்கம் எந்தப் பொருள்கள் அல்லது ஒரு வெளிப்பாடு ஒன்றைக் கொண்டிருக்கும் என்பது என்ன என்று கூறவில்லை. ஒரு குறிப்பிட்ட மொழிக்கு இந்தத் தகவல் இலக்கணத்தால் தரப்படும்; இது முறையாக வடிவங்களைப் பொருண்மைகளுடன் பொருத்தும் மற்றும் பொருண்மை மயக்கம் உள்ள வடிவங்களை ஒன்றிற்கும் மேற்பட்ட பொருண்மைகளுடன் பொருத்தும்.
சொற்பொருண்மை மயக்கம் தொடரிலும் வாக்கியத்திலும் பொருண்மை மயக்கத்தை உருவாக்கும். எடுத்துக்காட்டாக, கால் பகுதி. இருப்பினும் தொடரும் வாக்கியமும் சொற்பொருண்மை மயக்கம் உள்ள சொல் இல்லாவிடினும் பொருள் மயக்கம் தரலாம். எடுத்துக்காட்டாகப் பின்வரும் தொடர்களை எடுத்துக்கொள்ளவும்.
(1) வெள்ளை மருந்துக் குப்பி
(2) பழைய மாணவர் விடுதி
முதல் வாக்கியம் ‘மருந்துள்ள வெள்ளை நிறக் குப்பி’ என்றும் ‘வெள்ளை மருந்துள்ள குப்பி’ என்றும் பொருள் மயக்கம் காட்டும். இதுபோன்று இரண்டாவது வாக்கியமும் ‘பழைய மாணவர்கள் வசிக்கும் விடுதி’ என்றும் ‘மாணவர்கள் வசிக்கும் பழைய விடுதி’ என்றும் பொருள் மயக்கம் தரும். இத்தகைய பொருண்மை மயக்கம் அமைப்புப் பொருண்மை மயக்கம் எனப்படும்.
இருவகையான பொருண்மை மயக்கங்கள் முக்கியமாகப் பேசப்படுகின்றன. அவையாவன சொற்பொருண்மை மயக்கம் மற்றும் அமைப்புப் பொருண்மை மயக்கம். இக்கட்டுரையில் சொற்பொருண்மை மயக்கம் குறித்தே ஆய இருக்கின்றோம்.
PART I: KNOWLEDGE GRAPH Introduction Key characteristics Ontologies and formal semantics History ... more PART I: KNOWLEDGE GRAPH
Introduction
Key characteristics
Ontologies and formal semantics
History of knowledge graph
Definitions
Implementations
Using knowledge graph for reasoning over data
Ontology
Semantic net work
Conceptual graphs
PART II: VISUAL ONTO THESAURUS (VOT)
Ontology principle
Nida’s classification
Semantic Structure of vocabulary
Data base
VOTT user interface
Conclusion
A knowledge graph is a knowledge base that uses a graph-structured data model or topology to integrate data.
Knowledge graphs are often used to store interlinked descriptions of entities – objects, events, situations or abstract concepts – with free-form semantics.
A multilingual lexical database is created for Tamil which is extended to Malayalam.
XML is used for the creation of multilingual lexical database.
The database takes care of all kinds of lexical and semantic relation between words (only one sense is taken into account in each instance of a word).
The lexical items of one language will be related to another though lexical IDs.
The top to bottom approach makes building of the ontological structure of Dravidian vocabulary easier than building WordNet.
We can achieve the coverage quickly.
The present data base has to be converted to suit Knowledge graph.
Knowledge graphs help to incorporate all type of possible relation between words.
It will be turned into a knowledge representation by linking the lexical items with the Wikipedia.
The present VOT will be extended to all major Dravidian languages.
We are now working on VOT for Malayalam.
International Journal of Dravidian Linguistics Vol. 52 No. 2 June 2023, 2023
Tamil has a rich tradition of compiling dictionaries in various fields of knowledge apart from th... more Tamil has a rich tradition of compiling dictionaries in various fields of knowledge apart from the general dictionaries. Starting from nikhandu tradition Tamil underwent the development in lexicography by compiling innumerable number of dictionaries which include Madras University’s Tamil lexicon and Crea’s Dictionary of Modern Tamil. The Tamil lexicographic tradition reached its pinnacle by compiling various kinds of dictionaries on specialized fields which include the present one on “A dictionary of Tamil Agricultural vocabulary”.
Dictionaries are compiled for a language not only to give the meanings or definitions of the entry words but also to bring out the known words, unknown words, and disappearing words to people’s attention. There are many outcomes of this task. One of outcomes could be to reveal in which fields the language is rich in vocabulary and in which fields it is less rich. The present dictionary is a dictionary of occupational vocabulary dedicated to the field of paddy cultivation, which is an ancient industry. By understanding the occupation which includes the tools used in the occupation, the process of cultivation, the seasonal conditions suitable to the cultivation, it is possible to consciously know how today’s agriculturalists express this ancient occupation. The words provided by those who follow this traditional agricultural occupation were collected by a number of fieldworks. Many farmers were interviewed in selected villages across 31 districts of Tamil Nadu and their statements were recorded in audiotapes. Then they were transcribed and a corpus of agricultural usages was created. From the corpus the agricultural terms used by the farmers were collected. The agricultural terms provided by the farmers in connection with their profession are attested in the dictionary as such without any distortion of pronunciation or influence of the standard words.