Corpus spécialisé et ressource de spécialité: l'information forme le sens (original) (raw)
2006, Journées Scientifiques du CRTT: Corpus et …
Les Atlas sémantiques sont un modèle mathématique et statistique de représentation visuelle de la sémantique lexicale basé sur l'examen des relations entre les mots. Une application de ce modèle à des relations de proximité contextuelle dans un corpus a permis de montrer que le modèle était capable de dénoter le sens des unités lexicales tel qu'il est perçu par les rédacteurs du corpus. Nous nous appuyons sur ce constat pour proposer d'exploiter le modèle afin de construire automatiquement un dictionnaire spécialisé dans un domaine précis par l'analyse d'un corpus représentatif de ce domaine. Tout en conservant le modèle, nous modifions son application en faisant intervenir une analyse morphologique et syntaxique pour établir la réalité des unités lexicales ainsi que les liens entre elles, qui sont dès lors de nature syntaxique. Nous proposons également d'utiliser la ressource produite pour naviguer dans le corpus utilisé considéré comme une base d'information en suivant le sens plutôt que le mot. Enfin, nous proposons d'exploiter cette approche pour aider à la réalisation de dictionnaires plus classiques ou pour étudier la langue en diachronie.
Sign up for access to the world's latest research.
checkGet notified about relevant papers
checkSave papers to use in your research
checkJoin the discussion with peers
checkTrack your impact
Loading Preview
Sorry, preview is currently unavailable. You can download the paper by clicking the button above.