Corpus et phraséologie : un catalogue de "prêt-à-parler"? (original) (raw)
Related papers
Phraséoculturologie : une sous-discipline moderne indispensable de la phraséologie
2022
développé le concept de « lexiculture », le rôle fondamental de la culture dans le lexique a été mis en évidence. Néanmoins, la culture liée aux unités phraséologiques (UP), qui « possèdent des propriétés bien particulières » (Polguère, 2016 : 257), « est toujours évoquée mais pas suffisamment analysée » (Mejri, 2018 : 12). Dans la situation actuelle où la phraséologie est devenue une discipline indépendante au sein de la linguistique, il est nécessaire d'évoquer l'importance d'éléments de la phraséoculturologie (méta-phraséoculture et phraséoculture appliquée) et d'en faire une nouvelle branche. En effet la phraséoculturologie est profondément ancrée tant dans la phraséologie théorique (métaphraséologie) qu'appliquée. Ainsi, clarifier le rôle important de la phraséoculture dans les UP permettra d'améliorer théoriquement et pratiquement les méthodes de phraséologie. La métaphraséoculture (l'étude de la phraséoculture) concerne quant à elle surtout l'étymologie des UP, et contribue aussi au développement de l'épistémologie de la phraséologie, en particulier sous l'angle de son interaction avec la phraséographie. La phraséoculture joue enfin également un rôle décisif dans l'acquisition des connaissances, l'enseignement et la traduction des UP. Ces derniers sont liés étroitement à la linguistique contrastive.
La phraséologie en langue, en dictionnaire et en TALN
2010
son jouet, aimer ses parents ou voir un tigre. Même la séquence casser sa pipe peut signifier 'casser sa pipe' ! Ce qui rend cette expression spéciale est la présence du sens imprévisible : 'mourir'. Une expression phraséologique, qui sera appelée dorénavant phrasème, est un syntagme phraséologisé, ou bien non libre. Il faut donc commencer par définir le syntagme libre. Syntagme libre Un syntagme est libre si et seulement si [= ssi] chacun de ses composants L i est sélectionné par le locuteur de façon non contrainte : strictement pour son sens, respectant les propriétés du L i choisi, mais indépendamment des autres composants. Corollaire : chacun de composants d'un syntagme libre peut être remplacé par n'importe quel synonyme sans affecter le sens du syntagme (en tenant compte, bien entendu, des propriétés particulières des synonymes substitués). Syntagme non libre 〈= phraséologisé〉 Un syntagme est non libre si et seulement si [= ssi] au moins un de ses composants est sélectionné de façon contrainte : en fonction des autres composants. Un syntagme non libre s'appelle phrasème. Corollaire : aucun composant d'un phrasème ne peut être remplacé par n'importe quel synonyme (même si quelques synonymes peuvent être admis : louper/manquer/rater le coche 'perdre une occasion de faire qqch de profitable'). Un phrasème viole donc la liberté de sélection (de ses composants). Cette violation peut survenir soit dans le passage entre la R(eprésentation)Concept(uelle) et la RSém(antique) d'une expression linguistique, soit dans le passage entre la RSém et l'expression elle-même. Dans le premier cas (où le locuteur choisit une RSém pour une RConcept de départ), on obtient des phrasèmes pragmatiques, ou pragmatèmes : dans une situation de communication langagière donnée, la sélection du sens pour exprimer la RConcept donnée est contrainte, de sorte qu'il faut utiliser un sens particulier et l'exprimer avec des moyens particuliers. Par exemple, soit le contenu informationnel 'l'auteur de ce texte fait ressortir ce fragment de la citation en cause', la situation d'énonciation étant la suivante : le locuteur veut mettre la remarque correspondante dans le texte imprimé. En français on écrit dans ce cas C'est moi qui souligne, en anglais Italics/Emphasis mine lit. 'Italique/Emphase à.moi' et en allemand, Hervorhebung des Autors lit. 'Rehaussement de l'auteur'. Par les gloses, on voit que les sens exprimés sont différents dans les
Les grands corpus du français moderne : des outils pour étudier le lexique diatopiquement marqué ?
SKY Journal of Linguistics , 2012
In modern French dialectology, the critical usage of text data for the appropriate description of diatopic (regional) elements of national or regional varieties of French-though crucial-is hardly commented in scientific discourse. The paper offers an overview on the main corpora that are, or could be used for the lexical study of diatopicisms in contemporary French in the northern part of the francophone world, whether it be traditional, mostly literary corpora, journalistic texts, recent web corpora, or 'oral' corpora. The author examines their suitability for identifying diatopicisms with their spatial distribution in a francophone perspective, presents current methods of text analysis, and points out various problems related in particular to text location, regional annotation, discourse genres and treated subjects, but also to formal compatibility, text size and practical access. The article therewith underlines the need, in a close future, of comparable data for the different varieties in the francophone world in order to enhance the description of diatopic variation in modern French.
Présentation : Vers une extension du domaine de la phraséologie
Langages, 2013
Distribution électronique Cairn.info pour Armand Colin / Dunod. © Armand Colin / Dunod. Tous droits réservés pour tous pays. La reproduction ou représentation de cet article, notamment par photocopie, n'est autorisée que dans les limites des conditions générales d'utilisation du site ou, le cas échéant, des conditions générales de la licence souscrite par votre établissement. Toute autre reproduction ou représentation, en tout ou partie, sous quelque forme et de quelque manière que ce soit, est interdite sauf accord préalable et écrit de l'éditeur, en dehors des cas prévus par la législation en vigueur en France. Il est précisé que son stockage dans une base de données est également interdit.
SHS Web of Conferences, 2014
Et, en effet, le succès de cette grammaire a été tout simplement fulgurant à l'époque. Mars se trompe cependant sur la date de première édition : 1744 (et non 1750) à Milan, chez Francesco Agnelli 1. Les réimpressions et rééditions sont innombrables (37, de la vie de l'auteur, 276, jusqu'en 1925 !) (Lillo 1991 : 121-163). Ces grammaires reprennent les sections présentes dans les autres manuels de l'époque pour l'enseignement du français, tels ceux de Giovanni Veneroni, Michel Feri de la Salle, Jean Charles Munier, etc.; ces sections sont l'« orthographe », la « prononciation », les « parties de l'oraison » (morphologie), le « vocabulaire domestique », les « dialogues familiers », des « lettres familières » et,
Traduire la phraséologie: réflexions méthodologiques et étude de cas
Rael Revista Electronica De Linguistica Aplicada, 2006
En linguistique espagnole, la première typologie proposée fut, dans les années 50 celle de Casares, puis, dix ans plus tard, celle de Coseriu (1967); en 1980, Zuluaga enrichit celle de Casares en se basant sur les recherches allemandes et soviétiques. Puis Gloria Corpas Pastor (1996), dans son Manual de Fraseología Española, propose un schéma qui combine le critère d'énoncé et celui de fixation en délimitant deux grands groupes d'unités phraséologiques. Dans le premier groupe, elle inclut les UFs qui ne constituent pas des actes de parole, c'est-à-dire, d'une part, les collocations que l'auteur définit comme des syntagmes complètement libres du point de vue du système de la langue, générés à partir de règles, mais qui présentent en même temps un certain degré de restriction combinatoire déterminé par leur usage 7. D'autre part, elle inclut dans ce groupe les locutions fixées dans la langue, qui équivalent à des syntagmes figés, constituant une unité sémantique et idiomatique. Les collocations recouvrent donc un concept plus ample que les locutions dans la mesure où, aux caractéristiques de solidarité lexicale, elles ajoutent celles de fixation dans la norme. Elles ne sont pas idiomatiques et leur signification est donc transparente. Certains auteurs font entrer dans la phraséologie les collocations, d'autres non. Casares (1992 [1950] : 170) définit la locution comme la "combinación estable de dos o más términos, que funciona como elemento oracional y cuyo sentido unitario consabido no se justifica, sin más, como una suma del significado normal de los componentes". La valeur expressive des locutions "signifiantes" ou "conceptuelles" réside dans les images qu'elles contiennent métaphoriques ou métonymiques. Delisle (1993: 385 et suiv.), quant à lui, introduit la notion de cliché qui appartient au domaine de la stylistique comme étant une expression ou pensée peu originale figée dans une formule banalisée par l'emploi trop fréquent qui en est fait. Quoique souvent connotés négativement, ils ont la vie dure et abondent dans la langue des parlementaires, dans celle de l'adminstration, dans les reportages de faits-divers et dans les conversations courantes. Le terme modismo ou idiotisme est souvent employé, au même titre que celui de locution signifiante (c'est-à-dire, douée de signification par opposition à la locution de connexion grammaticale comme « con tal que », « en pos de », etc.), comme appartenant en propre à une langue donnée et étant impossible à traduire littéralement dans une autre langue. Ils sont généralement issus de l'imagination populaire 8 .
TCOF-POS : un corpus libre de français parlé annoté en morphosyntaxe
Nancy cedex (2) INIST-CNRS, 2 allée de Brabois, 54500 Vandoeuvre-lès-Nancy (3) LIPN, Université Paris 13 & CNRS, 99 av. J.B. Clément, 93430 Villetaneuse (4) Alpage, RÉSUMÉ Nous présentons dans cet article un travail portant sur la création d'un corpus de français parlé spontané annoté en morphosyntaxe. Nous détaillons la méthodologie suivie afin d'assurer le contrôle de la qualité de la ressource finale. Ce corpus est d'ores et déjà librement diffusé pour la recherche et peut servir aussi bien de corpus d'apprentissage pour des logiciels que de base pour des descriptions linguistiques. Nous présentons également les résultats obtenus par deux étiqueteurs morphosyntaxiques entrainés sur ce corpus. ABSTRACT TCOF-POS : A Freely Available POS-Tagged Corpus of Spoken French This article details the creation of TCOF-POS, the first freely available corpus of spontaneous spoken French. We present here the methodology that was followed in order to obtain the best possible qual...