CONSTITUER UN CORPUS DE TEXTES DE SPECIALITE (original) (raw)
Related papers
REVIVOS: REalité VIrtuelle pour la construction de VOcabulaires Spécialisés
Cet article vise à établir une méthodologie permettant d'aider à la comparaison de classifications réalisées par différents experts sur un ensemble de termes identiques. Les termes spécifiques ont été extraits de façon automatique à partir d'un corpus spécialisé à l'aide d'un outil d'extraction de terminologie et ont été regroupés en classes, définies librement par chaque expert. Notre méthode s'appuie sur un environnement de visualisation en Réalité Virtuelle (RV) au sein duquel sont représentées les différentes classifications. L'objectif de ce travail est d'étudier comment une méthode de visualisation RV permet de faciliter l'émergence d'une classification consensus, en révélant visuellement les différences de points de vue et les points communs de plusieurs classifications.
Extraction de Contextes Riches en Connaissances en corpus spécialisés
2015
Les banques terminologiques et les dictionnaires sont des ressources précieuses qui facilitent l’accès aux connaissances des domaines spécialisés. Ces ressources sont souvent assez pauvres et ne proposent pas toujours pour un terme à illustrer des exemples permettant d’appréhender le sens et l’usage de ce terme. Dans ce contexte, nous proposons de mettre en œuvre la notion de Contextes Riches en Connaissances (CRC) pour extraire directement de corpus spécialisés des exemples de contextes illustrant son usage. Nous définissons un cadre unifié pour exploiter tout à la fois des patrons de connaissances et des collocations avec une qualité acceptable pour une révision humaine.
La structure compositionnellle des textes
Québec français, 1995
Du savoir sur la langue, fût-il inscrit dans la science, on ne peut attendre d'autre usage qu'une rationalisation de la pédagogie; si désintéressé que s'y veuille le chercheur, l'École est à ses basques et lui réclame des comptes.
Modes de construction du sens en corpus spécialisé
2000
This article aims to show that specialised corpus linguistics may be interpreted in terms of two factors: the context of production of the texts analysed and the aim of the analysis. Far from being part of a mere applied perspective, this kind of analysis can shed light on language phenomena which are impervious to a solely introspective approach. We present
Cr�ation d'un corpus annot� pour le traitement des descriptions d�finies
2005
L'évaluation et l'entraînement d'algorithmes pour le traitement automatique d'anaphores nécessitent le développement de corpus annotés. Dans cet article, nous proposons une méthodologie pour l'annotation des descriptions définies qui permet d'annoter environ 5 000 descriptions définies de façon consistante et utile pour les modules de résolution. Nous présentons ensuite les résultats de cette annotation et discutons de leurs implications pour la résolution automatique.
Logiciel d'aide à l'étiquetage morpho-syntaxique de textes de spécialité
La compréhension de textes de spécialité nécessite unétiquetage morpho-syntaxique de bonne qualité. Or, lorsque les textesétudiés sont issus de domaines spécifiques et peu usités, il est rare de disposer de dictionnaires et autres ressources lexicales fiables. Le logiciel que nous proposons permet d'utiliser unétiquetage réalisé par unétiqueteur généraliste, puis d'améliorer cetétiquetage en intégrant des connaissances d'experts du domaineétudié. Grâce au logiciel développé, il est relativement aisé pour un expert du domaine de détecter des erreurs d'étiquetage et de mettre en place des règles de ré-étiquetage. Ces règles peuventêtre obtenues de deux manières différentes : (1) soit en utilisant un langage de programmation permettant d'exprimer des règles complexes de ré-étiquetage, (2) soit par apprentissage automatique des règlesà partir d'exemples corrigés au moyen d'une interface dédiée. Cet apprentissage propose de nouvelles règlesà l'expert, acquises automatiquement.
2019
Le premier obstacle que rencontre tout essai de définition de la notion de texte réside dans l'extrême diversité et l'hétérogénéité des textes possibles : Quelle définition serait à la fois applicable et féconde pour embrasser des textes aussi différents qu'une tragédie de Racine, un article de journal sportif, un traité d'anatomie humaine ou de biochimie, un éditorial politique, un mémoire paru aux comptes rendus de l'Académie des sciences, un roman et une thèse d'histoire ? (Molino 1989 : 41