CONSTITUER UN CORPUS DE TEXTES DE SPECIALITE (original) (raw)

REVIVOS: REalité VIrtuelle pour la construction de VOcabulaires Spécialisés

Cet article vise à établir une méthodologie permettant d'aider à la comparaison de classifications réalisées par différents experts sur un ensemble de termes identiques. Les termes spécifiques ont été extraits de façon automatique à partir d'un corpus spécialisé à l'aide d'un outil d'extraction de terminologie et ont été regroupés en classes, définies librement par chaque expert. Notre méthode s'appuie sur un environnement de visualisation en Réalité Virtuelle (RV) au sein duquel sont représentées les différentes classifications. L'objectif de ce travail est d'étudier comment une méthode de visualisation RV permet de faciliter l'émergence d'une classification consensus, en révélant visuellement les différences de points de vue et les points communs de plusieurs classifications.

Extraction de Contextes Riches en Connaissances en corpus spécialisés

2015

Les banques terminologiques et les dictionnaires sont des ressources précieuses qui facilitent l’accès aux connaissances des domaines spécialisés. Ces ressources sont souvent assez pauvres et ne proposent pas toujours pour un terme à illustrer des exemples permettant d’appréhender le sens et l’usage de ce terme. Dans ce contexte, nous proposons de mettre en œuvre la notion de Contextes Riches en Connaissances (CRC) pour extraire directement de corpus spécialisés des exemples de contextes illustrant son usage. Nous définissons un cadre unifié pour exploiter tout à la fois des patrons de connaissances et des collocations avec une qualité acceptable pour une révision humaine.

La structure compositionnellle des textes

Québec français, 1995

Du savoir sur la langue, fût-il inscrit dans la science, on ne peut attendre d'autre usage qu'une rationalisation de la pédagogie; si désintéressé que s'y veuille le chercheur, l'École est à ses basques et lui réclame des comptes.

Modes de construction du sens en corpus spécialisé

2000

This article aims to show that specialised corpus linguistics may be interpreted in terms of two factors: the context of production of the texts analysed and the aim of the analysis. Far from being part of a mere applied perspective, this kind of analysis can shed light on language phenomena which are impervious to a solely introspective approach. We present

Cr�ation d'un corpus annot� pour le traitement des descriptions d�finies

2005

L'évaluation et l'entraînement d'algorithmes pour le traitement automatique d'anaphores nécessitent le développement de corpus annotés. Dans cet article, nous proposons une méthodologie pour l'annotation des descriptions définies qui permet d'annoter environ 5 000 descriptions définies de façon consistante et utile pour les modules de résolution. Nous présentons ensuite les résultats de cette annotation et discutons de leurs implications pour la résolution automatique.

Logiciel d'aide à l'étiquetage morpho-syntaxique de textes de spécialité

La compréhension de textes de spécialité nécessite unétiquetage morpho-syntaxique de bonne qualité. Or, lorsque les textesétudiés sont issus de domaines spécifiques et peu usités, il est rare de disposer de dictionnaires et autres ressources lexicales fiables. Le logiciel que nous proposons permet d'utiliser unétiquetage réalisé par unétiqueteur généraliste, puis d'améliorer cetétiquetage en intégrant des connaissances d'experts du domaineétudié. Grâce au logiciel développé, il est relativement aisé pour un expert du domaine de détecter des erreurs d'étiquetage et de mettre en place des règles de ré-étiquetage. Ces règles peuventêtre obtenues de deux manières différentes : (1) soit en utilisant un langage de programmation permettant d'exprimer des règles complexes de ré-étiquetage, (2) soit par apprentissage automatique des règlesà partir d'exemples corrigés au moyen d'une interface dédiée. Cet apprentissage propose de nouvelles règlesà l'expert, acquises automatiquement.

La notion de TEXTE

2019

Le premier obstacle que rencontre tout essai de définition de la notion de texte réside dans l'extrême diversité et l'hétérogénéité des textes possibles : Quelle définition serait à la fois applicable et féconde pour embrasser des textes aussi différents qu'une tragédie de Racine, un article de journal sportif, un traité d'anatomie humaine ou de biochimie, un éditorial politique, un mémoire paru aux comptes rendus de l'Académie des sciences, un roman et une thèse d'histoire ? (Molino 1989 : 41