Combining Textometric Analysis, Machine Learning and Vector Space Representation for Subjectivity Analysis (original) (raw)

Combiner analyses textométriques, apprentissage supervisé et représentation vectorielle pour l’analyse de la subjectivité

2016

Cet article presente le bilan de notre participation au Defi Fouille de Textes (DEFT 2015) pour les tâches 1 et 2. Il s’agit de classer un corpus de tweets selon leur polarite (tâche 1) et detecter les classes generiques (tâche 2.1) et specifiques (tâche 2.2) de ces derniers. Nous avons implemente deux systemes pour ce defi. La premiere methode repose sur la selection dans le corpus d’entrainement d’un ensemble de descripteurs semantiquement motives pour chaque tâche a partir d’une analyse textometrique, qui sont ensuite injectes dans un algorithme d’apprentissage automatique supervise, permettant le calcul de modeles sur ce meme corpus. La seconde methode s’appuie sur une representation vectorielle des mots apprise par utilisation de l’outil word2vec sur un corpus heterogene et volumineux, cette representation etant ensuite utilisee pour realiser un apprentissage automatique supervise, pour chaque tâche, sur les corpus de developpement. Un troisieme systeme a ete realise par combin...

Subjectivité

A. − Vx, LOG. ,,Qui appartient à quelque chose en tant que sujet d'attributs ou prédicats`` (Lal. 1968). Une chose en latin scolastique, était dite être affirmée d'une autre subjective si on l'en affirmait en tant qu'existant pour son propre compte, et au contraire objective, si on la considérait en tant que présentée à la conscience, en tant que connue (Lal.1968). B. − LINGUISTIQUE 1. Qui, dans la phrase active correspondant au syntagme nominal, serait le sujet du verbe (d'apr. Ling. 1972). Complément, génitif subjectif. Il est sans doute impossible de déterminer précisément, la génération de chacun de ces adjectifs, et d'affirmer positivement s'ils ont été formés d'un nom, en substituant seulement la forme adjective à la forme subjective (Destutt de Tr., Idéol. 2, 1803, p. 103). 2. Qui a rapport au sujet. Le subjonctif a une valeur subjective quand il contient l'expression d'un jugement que porte sur l'énoncé celui qui la formule (Mar.Lex.1933). C. − DR. Droits subjectifs. Droits ,,dont sont investis les individus en vue de la satisfaction de leurs intérêts`` (Lafon 1963). II. A. − 1. PHILOS. Qui est propre à un sujet déterminé, qui ne vaut que pour lui seul. Synon. individuel, personnel.Caractère subjectif de la connaissance; aspect subjectif de la culture; considérer la vérité comme subjective. On appelle, dans la philosophie allemande, idées subjectives celles qui naissent de la nature de notre intelligence et de ses facultés, et idées objectives toutes celles qui sont excitées par les sensations (Staël, Allemagne, t. 4, 1810, p. 123): Notre tâche consiste donc exactement à traiter du domaine de la sensation sans tenir aucun compte des notions d'« esprit », de « sujet » et de « subjectif », d'« objet » et d'« objectif », de « conscient » et d'« inconscient », de « lois mentales », supposées différentes essentiellement de lois physiques. Ruyer, Esq. philos. struct., 1930, p. 105. ♦ Empl. subst. masc. sing. à valeur de neutre. V. objectif B 1 ex. de Comte. − [Chez Comte; p. oppos. aux systèmes métaphys., à la connaissance positive] Synthèse subjective. En confirmant l'impossibilité de toute synthèse purement objective, cette appréciation n'altère aucunement la véritable synthèse subjective, résultée partout d'une ascension assez graduelle vers le type humain (Comte, Catéch. posit., 1852, p. 132). − [P. réf. à l'expr. de Schelling et p. oppos. à sa doctrine qu'il appelle idéalisme objectif] Idéalisme subjectif de Fichte. Système philosophique qui ramène l'existence à l'idée et qui considère le sujet moral comme absolu. L'Allemagne a suivi dans l'échelle continue des idées une progression descendante. 1. L'idéalisme subjectif de Kant et Fichte. L'examen du moi porté à ses dernières limites. 2. La philosophie de la nature, le retour à la réalité. Donc Kant est à un degré déjà assez arriéré (Vigny, Journal poète, 1847, p. 1253).

Subjectivity as an education and training resource

Recherche et formation, 2015

Laboratoire interdisciplinaire de recherche sur les transformations des pratiques éducatives et des pratiques sociales (LIRTES, EA 7313) > Elisa Cattaruzza Université de Neuchâtel (Suisse), Faculté des lettres et sciences humaines, Institut de psychologie et éducation Ce dossier s'inscrit dans la continuité du colloque des 3 et 4 octobre 2014 « Expérience et recueil de données : ressources théoriques et conditions méthodologiques » organisé par l'université de Neuchâtel et l'Antenne suisse explicitation (ASE). La légitimation de la subjectivité comme objet de recherche est une conquête progressive dans la communauté scientifique en sciences humaines et sociales (pour une revue cf. Vermersch, 2012). Il semble ainsi qu'elle ne soit plus considérée comme obstacle à la rationalité, mais au contraire comme objet de recherche pertinent et nécessaire pour comprendre l'activité humaine et notamment la conscience. En effet, s'intéresser à la subjectivité au sens générique de point de vue du sujet sur son activité, nécessite de mobiliser une théorie de la conscience. Un mouvement qui s'attache à pointer la nécessité de réintégrer les connaissances sur l'expérience subjective, a d'ailleurs été amorcé dans les sciences cognitives (

La subjectivité artificielle : Ébauche d'un projet de recherche

2007

Cette expression "subjectivité artificielle" est un pléonasme, s'il est exact que la subjectivité humaine ne peut être qu'artificielle (au sens d'acquise et non innée) ... Elle désignerait donc : 1. le programme subjectif prétendument "naturel", mais il se pourrait bien que la subjectivité humaine ne puisse être qu'artificielle : il n'y a pas de "nature humaine", seulement une "condition humaine" 2. tout logiciel de subjectivité artificielle écrit par des humains pour simuler la subjectivité humaine "naturelle", et en particulier les subjilectes ou lectes subjectifs. À ce propos, signalons que dès 1983, inspirés par le titre du livre de William Skyvington (Machina sapiens. Essai sur l'intelligence artificielle. Seuil, 1976), nous avons proposé l'expression "Machina subjectiva" pour désigner l'ensemble des projets tendant à construire cette subjectivité artificielle, et déposé à l'INPI le terme "subjiciel" pour désigner les logiciels de subjectivité artificielle.

Subjectivité et Sciences Humaines (Exposé au L.E.S.T., Aix-en-Provence)

Informatique et Sciences Humaines. Texte imprimé : acte du Séminaire ..., Aix, France, 1984 / Louis Bourrelly, Alain Guenoche. 239 pages., 1985

Cet exposé fait le 1er mars 1984 au L.E.S.T. d'Aix-en-Provence au nom de l'association Subjiciel, et paru dans les Actes du séminaire d'Informatique pour les Sciences de l'Homme et de la Société organisé par le L.I.S.H. (futur G.R.T.C), a une importance double : – C'est la première communication en public sur ce qui deviendra l'Analyse des Logiques Subjectives, qui n'avait alors pas reçu de nom ; – Et tout en reprenant des thèses formulées en 1981 dans Groupe, individu, sujet, il préfigure le texte beaucoup plus élaboré Métaphore et connaissance, écrit en 1990. ================== Mon exposé développera les points suivants : • d'abord quelques remarques sur la démarche des sciences humaines, surtout à propos de la notion de TOTALITÉ, • ensuite une interrogation sur ce que présuppose cette notion, • puis la manière dont nous rattachons la persistance de cette notion à ce que nous appelons IDENTIFICATION et FANTASME. • ceci nous conduira à présenter les hypothèses de travail de l'association SUBJICIEL, qui cherche leur confirmation ou leur réfutation dans des simulations utilisant l'informatique, • enfin nous parlerons des conséquences d'une éventuelle confirmation de ces hypothèses sur ce qu'on peut penser des raisonnements en sciences humaines et sur les critères de scientificité qu'on peut proposer à la fois pour celle-ci et pour les sciences exactes. (cet exposé a été préparé en collaboration avec Françoise Soublin)

La subjectivité artificielle : ébauche d'un programme de recherche

2016

Cette expression "subjectivite artificielle" est un pleonasme, s'il est exact que la subjectivite humaine ne peut etre qu'artificielle (au sens d'acquise et non innee)... Elle designerait donc : 1. le programme subjectif pretendument "naturel", mais il se pourrait bien que la subjectivite humaine ne puisse etre qu'artificielle : il n'y a pas de "nature humaine", seulement une "condition humaine" 2. tout logiciel de subjectivite artificielle ecrit par des humains pour simuler la subjectivite humaine "naturelle", et en particulier les subjilectes ou lectes subjectifs. A ce propos, signalons que des 1983, inspires par le titre du livre de William Skyvington ("Machina sapiens". Essai sur l'intelligence artificielle. Seuil, 1976), nous avons propose l'expression "Machina subjectiva" pour designer l'ensemble des projets tendant a construire cette subjectivite artificielle, et depose a l&#...

Sur l'application de méthodes textométriques à la construction de critères de classification en analyse des sentiments

2012

Depuis une dizaine d'années, le TAL s'intéresse à la subjectivité, notamment dans la perspective d'applications telles que la fouille d'opinion et l'analyse des sentiments. Or, la linguistique de corpus outillée par des méthodes textométriques a souvent abordé la question de la subjectivité dans les textes. Notre objectif est de montrer d'une part, ce que pourrait apporter à l'analyse des sentiments l'analyse textométrique et d'autre part, comment mutualiser les avantages d'une association entre celle-ci et une méthode de classi!cation automatique basée sur l'apprentissage supervisé. En nous appuyant sur un corpus de témoignages issus de forums de discussion, nous montrerons que la prise en compte de critères sélectionnés suivant une analyse textométrique permet d'obtenir des résultats de classi!cation satisfaisants par rapport à une vision purement lexicale. ABSTRACT__________________________________________________________________________________________________________ About the application of textometric methods for developing classi!cation criteria in Sentiment analysis Over the last ten years, NLP has contributed to applied research on subjectivity, especially in applications such as Opinion mining and Sentiment analysis. However, corpus linguistics and textometry have often addressed the issue of subjectivity in text. Our purpose is to show, !rst, what textometric analysis could bring to sentiment analysis, and second, the bene!ts of pooling linguistic/textometric analysis and automatic classi!cation methods based on supervised learning. By processing a corpus of posts from fora, we will show that the building of criteria from a textometric analysis could improve classi!cation results, compared to a purely lexical approach. MOTS-CLÉS : linguistique de corpus, textométrie, analyse de sentiments, classi!cation automatique supervisée.

Une méthodologie de sémantique de corpus appliquée à des tâches de fouille d’opinion et d’analyse des sentiments : étude sur l’impact de marqueurs dialogiques et dialectiques dans l’expression de la subjectivité

2015

Cet article entend dresser, dans un premier temps, un panorama critique des relations entre TAL et linguistique. Puis, il esquisse une discussion sur l’apport possible d’une sémantique de corpus dans un contexte applicatif en s’appuyant sur plusieurs expériences en fouille de textes subjectifs (analyse de sentiments et fouille d’opinions). Ces expériences se démarquent des approches traditionnelles fondées sur la recherche de marqueurs axiologiques explicites par l’utilisation de critères relevant des représentations des acteurs (composante dialogique) et des structures argumentatives et narratives des textes (composante dialectique). Nous souhaitons de cette façon mettre en lumière le bénéfice d’un dialogue méthodologique entre une théorie (la sémantique textuelle), des méthodes de linguistique de corpus orientées vers l’analyse du sens (la textométrie) et les usages actuels du TAL en termes d’algorithmiques (apprentissage automatique) mais aussi de méthodologie d’évaluation des ré...

Quatre approches pour l'analyse de données textuelles : lexicale, linguistique, cognitive, thématique

Actes de la XVIème Conférence Internationale de l’Association Internationale de Management Stratégique (AIMS), Montréal, Québec, 2007

Cette contribution est d'ordre méthodologique. L'Analyse de Données Textuelles (A.D.T.) regroupe aujourd'hui de nombreuses méthodes, et de nombreux outils, qui visent à découvrir l'information « essentielle » contenue dans un texte. En s'intéressant plus particulièrement à la demande des chercheurs en Management Stratégique, quatre exemples sont présentés, tous issus du même laboratoire de recherche, des différentes approches de l'A.D.T. De quoi parle-t-on? C'est le domaine de l'analyse lexicale. Comment en parle-ton ? Il s'agit alors d'analyse linguistique. Comment structurer une pensée ? C'est l'ambition de la cartographie cognitive. Et enfin comment interpréter un contenu ? Il s'agit de l'assistance à l'analyse thématique. Pour ces quatre approches (illustrées par les quatre outils Alceste, Tropes, Decision Explorer, NVivo) on discute des problèmes méthodologiques et théoriques posés : discours et représentation, langage et énonciation, structuration et communication, interprétation et abstraction…