Une méthodologie de sémantique de corpus appliquée à des tâches de fouille d’opinion et d’analyse des sentiments : étude sur l’impact de marqueurs dialogiques et dialectiques dans l’expression de la subjectivité (original) (raw)
Related papers
2014
Cette contribution entend problématiser la question de l’élaboration des corpus en analyse des discours et de la communication publics. En lieu et place d’une discussion théorique du problème, je propose d’aborder la question d’une manière à la fois pratique (par la description relativement factuelle une expérience concrète) et réflexive (par la problématisation des étapes de constitution et donc des choix et contraintes que cette pratique implique. Le corpus et les données apparaîtront ainsi comme des construits que le chercheur élabore de manière à assurer leur rôle de transparence (leur capacité à rendre compte d’un « réel »). Il s’agira par conséquent de penser les dimensions (corpus projeté, corpus réalisé et corpus consolidé) et les étapes (principalement le recueil et la confection des données) impliquées par cette construction.
Sémantique textuelle et TAL : un exemple d'application à l'analyse des sentiments
2013
Notre objectif est de faire se rencontrer les pratiques courantes de Traitement Automatique des Langues (TAL) avec celles de la semantique textuelle outillee par la textometrie. Nous dressons un panorama de ces deux pratiques qui etablissent peu de liens alors qu'elles travaillent avec le meme materiau textuel. Afin de provoquer une rencontre, nous nous appuyons sur l'exemple d'une application d'analyse des sentiments. Comme c'est le cas pour beaucoup d'autres applications du domaine, nous utilisons les algorithmes d'apprentissage automatique mais les descripteurs choisis sont issus d'une analyse textometrique du corpus et structures suivant une grille de lecture inspiree de la semantique textuelle. Ainsi, nous mettons en evidence que les criteres axiologiques (thymiques) habituellement utilises dans l'analyse de sentiments ne contribuent que marginalement dans la classification. D'autres criteres (dialogiques et dialectiques), lies au deroule...
HEXAGONE Jurnal Pendidikan, Linguistik, Budaya dan Sastra Perancis
Cette recherche a pour but d’examiner les traits sémantiques de champ lexical des verbes de parole. La source de données de ce mémoire est les verbes de parole qui est originaire de site www.interalia.fr, par François DAVID en utilisant la théorie sémantique de Nida. Pour analyser les données l’auteur utilise le dictionnaire principal Le Petit Larousse, ensuite dans les dictionnaires soutien comme le dictionnaire du français AUZOU, et le dictionnaire Français-Indonésien par SOEMARGONO. La méthode qui est utilisée est la méthode descriptive qualitative. Le résultat de cette recherche montre que les verbes de parole aux deux emploies de parole pour la demande et la réponse dans les émotions exprimes neutre et violence se trouvent 46 verbes où se trouvent 1 verbe qui peuvent être utilisé dans ces deux emploies, c’est {‘menacer’}.
2008
This article discusses the results of a quantitative semantic analysis of pivotal terms (or keywords) in the domain of machining terminology in French. The investigation attempts to find out whether, and to what extent, pivotal lexical items in a technical domain are monosemous or polysemous. Since about 5 000 keywords are included in the semantic analysis, automation and quantification are required. Hence, we conducted a double quantitative analysis, including both the identification of pivotal lexical items and their semantic analysis, resulting in a statistical analysis of the quantitative data. In this article, we explain how to go from a qualitative semantic question to a quantitative semantic analysis and next to statistical analyses, in order to finally draw quantitative and linguistic conclusions.
Analyse quantitative et statistique de la sémantique dans un corpus technique
Cet article présente la méthodologie et les résultats d'une analyse sémantique quantitative d'environ 5000 spécificités dans le domaine technique des machines-outils pour l'usinage des métaux. Les spécificités seront identifiées avec la méthode des mots-clés (KeyWords Method). Ensuite, elles seront soumises à une analyse sémantique quantitative, à partir du recouvrement des cooccurrences des cooccurrences, permettant de déterminer le degré de monosémie des spécificités. Finalement, les données quantitatives de spécificité et de monosémie feront l'objet d'analyses de régression. Nous avançons l'hypothèse que les mots (les plus) spécifiques du corpus technique ne sont pas (les plus) monosémiques. Nous présenterons ici les résultats statistiques, ainsi qu'une interprétation linguistique. Le but de cette étude est donc de vérifier si et dans quelle mesure les spécificités du corpus technique sont monosémiques ou polysémiques et quels sont les facteurs déterminants.